
Свой код и «наш» Винни-Пух: зачем Сберу суверенный ИИ
Сбербанк делает ставку на разработку собственных языковых моделей с нуля, чтобы избежать зависимости от зарубежных технологий и сохранить российский культурный контекст. Об этом в интервью РБК рассказал старший вице-президент банка Антон Фролов, подчеркнув, что полный контроль над этапом предобучения — единственный способ гарантировать устойчивость систем в условиях санкционных рисков.
Сбербанк делает ставку на разработку собственных языковых моделей с нуля, чтобы избежать зависимости от зарубежных технологий и сохранить российский культурный контекст. Об этом в интервью РБК рассказал старший вице-президент банка Антон Фролов, подчеркнув, что полный контроль над этапом предобучения — единственный способ гарантировать устойчивость систем в условиях санкционных рисков.
Разработка собственной архитектуры для нейросети GigaChat продиктована необходимостью контроля над самым ресурсоемким этапом — предобучением (pre-training). Как пояснил Антон Фролов, использование готовых открытых (open-source) моделей несет скрытые угрозы: при глубокой модификации под локальные задачи «фундаментальные знания» системы могут пострадать, а доступ к обновлениям западных библиотек может быть перекрыт в любой момент.Культурный код и дефицит данных
Несмотря на опору на российские реалии, при обучении моделей используются и англоязычные массивы данных. По мнению Фролова, отказ от глобальной информации был бы «выстрелом в ногу», однако приоритет при фильтрации и «взвешивании» контента отдается отечественным текстам. Это позволяет ИИ понимать локальные смыслы и избегать западных визуальных штампов — например, рисовать Винни-Пуха в стиле советской мультипликации, а не студии Disney.
Сейчас отрасль сталкивается с нехваткой качественных русскоязычных данных, но проблему решают за счет активной оцифровки архивов и библиотек. Чем больше будет инициатив по обогащению данных, тем быстрее нейросети избавятся от заимствованных культурных кодов, считают в компании.
Параллельно с технологическим развитием в России формируется правовая база. В марте Минцифры представило законопроект, вводящий понятия суверенных и национальных моделей ИИ. Согласно документу:
- разработчиками должны выступать российские граждане или юрлица;
- ключевые права на технологию должны принадлежать резидентам РФ;
- статус «доверенных» потребует проверки на безопасность со стороны ФСБ и ФСТЭК.


Комментарии (0)
Пока нет комментариев. Будьте первым!