В июне 2025 года
председатель правительства России Михаил Мишустин
А на каком этапе сейчас в РФ находится этот процесс и чего ждать?
ИИ как элемент технологической независимости
В последние годы тема
ИИ стала одной из центральных в мировой повестке. Особенно активно
развивается направление больших языковых моделей (LLM), на которых
основаны такие решения, как ChatGPT от OpenAI, Gemini от Google,
Claude от Anthropic или DeepSeek от High-Flyer. Эти системы умеют
анализировать текст, отвечать на вопросы, писать статьи и
программный код, вести диалог с человеком на естественном языке.
Появление подобных технологий существенно меняет самые разные сферы
— от образования до государственного управления. А также оно
повышает производительность труда, что критически важно с учетом
дефицита кадров, который к 2030 году
Россия, как и ряд других стран, делает ставку на развитие собственных языковых моделей. Вопрос здесь не только в научных амбициях или экономических выгодах, но и в обеспечении технологического суверенитета
Развитие собственных решений важно в том числе потому, что зависимость от зарубежных продуктов, особенно в стратегически чувствительных сферах, несет в себе риски — как с точки зрения кибербезопасности, так и в аспектах контроля над данными и доступности сервисов с учетом международной обстановки.
Поэтому сегодня в России одновременно развиваются сразу несколько проектов в области больших языковых моделей. Среди них выделяются GigaChat от Сбера, YandexGPT от Яндекса, а также Gen-T от Т-Банка и Cotype от МТС. Они различаются подходами к обучению и степенью самостоятельности разработки.
Собственные и адаптированные модели
Наиболее комплексный подход к разработке ИИ демонстрирует GigaChat от Сбера — эта модель полностью обучена внутри страны с нуля. Такой путь наиболее затратен: он требует масштабных вычислительных ресурсов, больших обучающих выборок на русском языке, сложных экспериментов по оптимизации архитектуры. Впрочем, именно подобный подход позволяет полнее учитывать специфику языка и национального контекста, что особенно важно при работе с официальными документами, юридическими и техническими текстами, а также при взаимодействии с государственными и корпоративными системами.
Часть других российских моделей базируется на глубокой адаптации уже существующих зарубежных разработок. Например, YandexGPT строится на основе китайской Qwen2.5 от Alibaba Group, но в процессе дообучения и модификации разработчики "Яндекса" переработали большую часть начальных параметров модели и наполнили ее обширными русскоязычными датасетами. Такой подход позволяет существенно сократить затраты на обучение, но требует глубокой экспертизы по интеграции и доработке исходных моделей под нужды русского языка и российских пользователей.
Сложнее всего адаптировать модели, если исходный датасет был преимущественно не русскоязычным. Здесь появляется риск ошибок из-за искажения смыслов ввиду "мировозрения" моделей — изложенные точки зрения на одни и те же события от российских, китайских и западных авторов могут различаться, что влияет на ход "рассуждения" нейросетей, — или недостаточной точности в узких профессиональных областях.
Именно поэтому участие в сборе и разметке собственных данных остается ключевым элементом развития российских LLM. В стране существует активное сообщество специалистов по обработке естественного языка (NLP), которое формирует качественные датасеты — такие как Saiga или GrandMaster Pro Max — с учетом национальной специфики.
Преимущества и ограничения
Если говорить о качественных показателях, то на русском языке отечественные модели демонстрируют результаты, сопоставимые с зарубежными системами. Особенно заметен прогресс в области технических и юридических текстов, где национальные модели обладают более релевантными знаниями. Также российские LLM лучше справляются с малыми языками народов России, что имеет значение при работе с локальными образовательными и административными системами.
Пока сохраняется тенденция, согласно которой стоимость использования отечественных LLM может быть выше, чем зарубежных аналогов. Это обстоятельство становится критичным при масштабировании решений, связанных с использованием больших языковых моделей — например, в системах клиентской поддержки, разработке чат-ботов или генерации значительного объема корпоративного текста. Вместе с тем применение зарубежных моделей несет ряд существенных рисков: утечка конфиденциальных данных, возможные технические сбои и зависимость от внешних факторов, таких как санкции или ограничения доступа. Поэтому компании, работающие в сфере финансов, промышленности или государственного управления, выбирают исключительно отечественные решения.
Проблему высокой стоимости российские разработчики пытаются решать через оптимизацию инфраструктуры и совершенствование моделей. Появляются облегченные версии LLM, которые быстрее работают и требуют меньше вычислительных ресурсов. Кроме того, важную роль играет интеграция: российские модели уже активно применяются внутри собственных экосистем. Так, GigaChat встроен в мобильные приложения и умные устройства Сбера, YandexGPT работает в Яндекс.Браузере, ТВ-приставках и умных колонках, а Gen-T используется в сервисах Т-Банка для автоматизации обработки документов и написания программного кода.
Экспортный потенциал
Отдельным направлением остается вопрос экспорта российских языковых моделей. Здесь перспективными считаются страны СНГ и постсоветского пространства, где востребованы решения, обученные на языках с ограниченными цифровыми ресурсами — казахском, узбекском и других.
Также российские LLM проходят тестирование на арабском и азиатских языках. Участие российских специалистов в международных коллаборациях — например, в проектах вроде Mistral Saba — показывает, что отечественная экспертиза в обработке языка востребована в мире.
Что нужно индустрии
Развитие больших языковых моделей — это сложный научно-технический процесс. Он требует вычислительных мощностей, современной облачной инфраструктуры и доступа к графическим процессорам (GPU). Критическую роль играют и подготовленные кадры: без сильных команд по машинному обучению, лингвистике, анализу данных невозможно создавать конкурентоспособные LLM, и в течение последних лет можно наблюдать активный рост количества профильных образовательных программ и инициатив в этом направлении.
Большое значение для дальнейшего развития отрасли имеют государственно-частные партнерства, участие вузов и исследовательских институтов, консолидация усилий бизнеса и науки. Сочетание экспертизы, ресурсов и образовательных программ позволит российской индустрии больших языковых моделей сохранять темп и расширять применение как внутри страны, так и на внешних рынках.
Отечественные компании продолжают уверенно осваивать рынок LLM. Учитывая потребность в собственных решениях для работы с языком, данными и знаниями, развитие российских нейросетевых моделей становится не только научной задачей, но и частью долгосрочной стратегии технологического суверенитета страны.
Комментарии