Свой код и «наш» Винни-Пух: зачем Сберу суверенный ИИ
Инвестиции

Свой код и «наш» Винни-Пух: зачем Сберу суверенный ИИ

Редакция
24 мар, 10:37
0 0

Сбербанк делает ставку на разработку собственных языковых моделей с нуля, чтобы избежать зависимости от зарубежных технологий и сохранить российский культурный контекст. Об этом в интервью РБК рассказал старший вице-президент банка Антон Фролов, подчеркнув, что полный контроль над этапом предобучения — единственный способ гарантировать устойчивость систем в условиях санкционных рисков.

Сбербанк делает ставку на разработку собственных языковых моделей с нуля, чтобы избежать зависимости от зарубежных технологий и сохранить российский культурный контекст. Об этом в интервью РБК рассказал старший вице-президент банка Антон Фролов, подчеркнув, что полный контроль над этапом предобучения — единственный способ гарантировать устойчивость систем в условиях санкционных рисков.

Разработка собственной архитектуры для нейросети GigaChat продиктована необходимостью контроля над самым ресурсоемким этапом — предобучением (pre-training). Как пояснил Антон Фролов, использование готовых открытых (open-source) моделей несет скрытые угрозы: при глубокой модификации под локальные задачи «фундаментальные знания» системы могут пострадать, а доступ к обновлениям западных библиотек может быть перекрыт в любой момент.

Культурный код и дефицит данных

Несмотря на опору на российские реалии, при обучении моделей используются и англоязычные массивы данных. По мнению Фролова, отказ от глобальной информации был бы «выстрелом в ногу», однако приоритет при фильтрации и «взвешивании» контента отдается отечественным текстам. Это позволяет ИИ понимать локальные смыслы и избегать западных визуальных штампов — например, рисовать Винни-Пуха в стиле советской мультипликации, а не студии Disney.

Сейчас отрасль сталкивается с нехваткой качественных русскоязычных данных, но проблему решают за счет активной оцифровки архивов и библиотек. Чем больше будет инициатив по обогащению данных, тем быстрее нейросети избавятся от заимствованных культурных кодов, считают в компании.

Параллельно с технологическим развитием в России формируется правовая база. В марте Минцифры представило законопроект, вводящий понятия суверенных и национальных моделей ИИ. Согласно документу:

    • разработчиками должны выступать российские граждане или юрлица;
    • ключевые права на технологию должны принадлежать резидентам РФ;
  • статус «доверенных» потребует проверки на безопасность со стороны ФСБ и ФСТЭК.
Такие модели получат допуск к работе в госинформсистемах и на объектах критической инфраструктуры. Вопрос о том, будет ли «Сбер» официально претендовать на статус суверенной модели, топ-менеджмент банка пока не комментирует.
Поделиться

Комментарии (0)

Оставить комментарий

Пока нет комментариев. Будьте первым!