Зачем стране свои большие языковые модели и как устроены отечественные конкуренты ChatGPT

В июне 2025 года председатель правительства России Михаил Мишустин провел в Сарове совещание по вопросам высокопроизводительных вычислений, искусственного интеллекта (ИИ) и обработки больших данных. Он подчеркнул, что развитие отечественных нейросетевых технологий, суперкомпьютеров и собственных компонентов — одно из ключевых условий достижения технологического суверенитета страны.

А на каком этапе сейчас в РФ находится этот процесс и чего ждать?

ИИ как элемент технологической независимости

В последние годы тема ИИ стала одной из центральных в мировой повестке. Особенно активно развивается направление больших языковых моделей (LLM), на которых основаны такие решения, как ChatGPT от OpenAI, Gemini от Google, Claude от Anthropic или DeepSeek от High-Flyer. Эти системы умеют анализировать текст, отвечать на вопросы, писать статьи и программный код, вести диалог с человеком на естественном языке. Появление подобных технологий существенно меняет самые разные сферы — от образования до государственного управления. А также оно повышает производительность труда, что критически важно с учетом дефицита кадров, который к 2030 году может увеличиться до 2 млн человек.

Россия, как и ряд других стран, делает ставку на развитие собственных языковых моделей. Вопрос здесь не только в научных амбициях или экономических выгодах, но и в обеспечении технологического суверенитета

Теме уделяется внимание на самом высоком уровне. Например, в декабре 2024 года президент России Владимир Путин принял участие в Международной конференции AI Journey, посвященной искусственному интеллекту.

Развитие собственных решений важно в том числе потому, что зависимость от зарубежных продуктов, особенно в стратегически чувствительных сферах, несет в себе риски — как с точки зрения кибербезопасности, так и в аспектах контроля над данными и доступности сервисов с учетом международной обстановки.

Поэтому сегодня в России одновременно развиваются сразу несколько проектов в области больших языковых моделей. Среди них выделяются GigaChat от Сбера, YandexGPT от Яндекса, а также Gen-T от Т-Банка и Cotype от МТС. Они различаются подходами к обучению и степенью самостоятельности разработки.

Собственные и адаптированные модели

Наиболее комплексный подход к разработке ИИ демонстрирует GigaChat от Сбера — эта модель полностью обучена внутри страны с нуля. Такой путь наиболее затратен: он требует масштабных вычислительных ресурсов, больших обучающих выборок на русском языке, сложных экспериментов по оптимизации архитектуры. Впрочем, именно подобный подход позволяет полнее учитывать специфику языка и национального контекста, что особенно важно при работе с официальными документами, юридическими и техническими текстами, а также при взаимодействии с государственными и корпоративными системами.

Часть других российских моделей базируется на глубокой адаптации уже существующих зарубежных разработок. Например, YandexGPT строится на основе китайской Qwen2.5 от Alibaba Group, но в процессе дообучения и модификации разработчики "Яндекса" переработали большую часть начальных параметров модели и наполнили ее обширными русскоязычными датасетами. Такой подход позволяет существенно сократить затраты на обучение, но требует глубокой экспертизы по интеграции и доработке исходных моделей под нужды русского языка и российских пользователей.

Сложнее всего адаптировать модели, если исходный датасет был преимущественно не русскоязычным. Здесь появляется риск ошибок из-за искажения смыслов ввиду "мировозрения" моделей — изложенные точки зрения на одни и те же события от российских, китайских и западных авторов могут различаться, что влияет на ход "рассуждения" нейросетей, — или недостаточной точности в узких профессиональных областях.

Именно поэтому участие в сборе и разметке собственных данных остается ключевым элементом развития российских LLM. В стране существует активное сообщество специалистов по обработке естественного языка (NLP), которое формирует качественные датасеты — такие как Saiga или GrandMaster Pro Max — с учетом национальной специфики.

Преимущества и ограничения

Если говорить о качественных показателях, то на русском языке отечественные модели демонстрируют результаты, сопоставимые с зарубежными системами. Особенно заметен прогресс в области технических и юридических текстов, где национальные модели обладают более релевантными знаниями. Также российские LLM лучше справляются с малыми языками народов России, что имеет значение при работе с локальными образовательными и административными системами.

Пока сохраняется тенденция, согласно которой стоимость использования отечественных LLM может быть выше, чем зарубежных аналогов. Это обстоятельство становится критичным при масштабировании решений, связанных с использованием больших языковых моделей — например, в системах клиентской поддержки, разработке чат-ботов или генерации значительного объема корпоративного текста. Вместе с тем применение зарубежных моделей несет ряд существенных рисков: утечка конфиденциальных данных, возможные технические сбои и зависимость от внешних факторов, таких как санкции или ограничения доступа. Поэтому компании, работающие в сфере финансов, промышленности или государственного управления, выбирают исключительно отечественные решения.

Проблему высокой стоимости российские разработчики пытаются решать через оптимизацию инфраструктуры и совершенствование моделей. Появляются облегченные версии LLM, которые быстрее работают и требуют меньше вычислительных ресурсов. Кроме того, важную роль играет интеграция: российские модели уже активно применяются внутри собственных экосистем. Так, GigaChat встроен в мобильные приложения и умные устройства Сбера, YandexGPT работает в Яндекс.Браузере, ТВ-приставках и умных колонках, а Gen-T используется в сервисах Т-Банка для автоматизации обработки документов и написания программного кода.

Экспортный потенциал

Отдельным направлением остается вопрос экспорта российских языковых моделей. Здесь перспективными считаются страны СНГ и постсоветского пространства, где востребованы решения, обученные на языках с ограниченными цифровыми ресурсами — казахском, узбекском и других.

Также российские LLM проходят тестирование на арабском и азиатских языках. Участие российских специалистов в международных коллаборациях — например, в проектах вроде Mistral Saba — показывает, что отечественная экспертиза в обработке языка востребована в мире.

Что нужно индустрии

Развитие больших языковых моделей — это сложный научно-технический процесс. Он требует вычислительных мощностей, современной облачной инфраструктуры и доступа к графическим процессорам (GPU). Критическую роль играют и подготовленные кадры: без сильных команд по машинному обучению, лингвистике, анализу данных невозможно создавать конкурентоспособные LLM, и в течение последних лет можно наблюдать активный рост количества профильных образовательных программ и инициатив в этом направлении.

Большое значение для дальнейшего развития отрасли имеют государственно-частные партнерства, участие вузов и исследовательских институтов, консолидация усилий бизнеса и науки. Сочетание экспертизы, ресурсов и образовательных программ позволит российской индустрии больших языковых моделей сохранять темп и расширять применение как внутри страны, так и на внешних рынках.

Отечественные компании продолжают уверенно осваивать рынок LLM. Учитывая потребность в собственных решениях для работы с языком, данными и знаниями, развитие российских нейросетевых моделей становится не только научной задачей, но и частью долгосрочной стратегии технологического суверенитета страны.

tass.ru

Как Вы оцените?

0

Оценка 0/5
1
2
3
4
5

ИИ как элемент технологической независимости

Собственные и адаптированные модели

Преимущества и ограничения

Экспортный потенциал

Что нужно индустрии

Как Вы оцените?

0

ПРОГОЛОСОВАЛИ: 0

Почитать ещё

Комментарии