Сбер представил обновлённый GigaChat с поддержкой более 30 языков народов России и СНГ
Масштабное обновление нейросети GigaChat стало важным шагом в развитии языковых технологий на пространстве России и стран СНГ. Новая версия ИИ-модели значительно расширила свои возможности в области понимания и генерации текстов: теперь система способна работать более чем с 30 языками народов России и ближнего зарубежья, а общее количество поддерживаемых языков достигло 40. Это делает GigaChat одной из наиболее универсальных языковых моделей, ориентированных на многонациональную аудиторию.
Для достижения такого результата разработчики провели серьёзную работу по обучению нейросети. В проект были привлечены специалисты из региональных отделений Российской академии наук, а также носители различных языков. Их участие позволило не только собрать качественные обучающие данные, но и провести глубокую проверку корректности работы модели. Особое внимание уделялось грамматике, стилистике и естественности речи, что крайне важно при работе с языками, многие из которых имеют сложную структуру и богатую культурную специфику.
Среди языков, которые теперь лучше понимает GigaChat, — как широко распространённые, так и менее популярные, находящиеся под угрозой исчезновения. Это обновление открывает новые возможности для пользователей, ранее ограниченных в цифровом взаимодействии из-за языкового барьера. Теперь они могут общаться с ИИ-помощником на родном языке, получать ответы, создавать тексты и решать повседневные задачи без необходимости перехода на русский или английский язык.
Для развития языковой модели Сбер объединил усилия с различными партнёрами. В числе участников проекта — Дом народов России, команда интернет-энциклопедии «Рувики», региональные академии наук, университеты и специализированные фонды. Такое сотрудничество позволило собрать обширные и разнообразные наборы данных, отражающие реальные особенности использования языков в разных регионах.
Наборы данных для обучения формировались из множества источников: научных публикаций, образовательных материалов, медиаконтента и пользовательских текстов. Объём данных по каждому языку варьировался от сотен тысяч до миллионов документов. Это обеспечило достаточную глубину обучения даже для языков с ограниченным количеством доступных цифровых ресурсов. При этом ключевую роль сыграли носители языков, которые участвовали в тестировании и доработке модели, помогая адаптировать ответы под живую разговорную речь.
Одним из важных преимуществ обновлённого GigaChat стало то, что пользователю достаточно задать запрос на любом из поддерживаемых языков, и система автоматически подстроится под него. Это значительно упрощает взаимодействие с ИИ и делает его доступным для людей разных возрастов и уровней цифровой грамотности. В частности, представители народов России и стран СНГ могут использовать нейросеть для получения информации, обучения, создания контента и общения на родном языке.
В Сбере подчёркивают, что данное обновление не только расширяет технологические возможности, но и способствует сохранению языкового и культурного наследия. Поддержка национальных языков в цифровой среде играет важную роль в их развитии и популяризации, особенно среди молодёжи. Таким образом, GigaChat становится не просто инструментом, а частью более широкой инициативы по поддержке культурного разнообразия.
Разработчики также переработали алгоритмы обработки национальных языков. Благодаря этому нейросеть демонстрирует высокое качество ответов даже при ограниченных объёмах обучающих данных. Это особенно важно для редких языков, для которых сложно собрать большие корпуса текстов. Дополнительным преимуществом стало обучение модели как литературным, так и разговорным формам языка, что позволяет ей понимать различные стили общения — от официальных запросов до неформальной переписки.
Ранее Сбер уже представил обновлённую версию помощника на базе модели GigaChat Ultra. Среди ключевых улучшений — повышение скорости работы, расширение функциональности и способность запоминать данные о пользователе для более персонализированного взаимодействия. В сочетании с новым языковым обновлением это делает систему ещё более мощным и удобным инструментом для повседневного использования.
В целом обновление GigaChat демонстрирует стремление к созданию инклюзивных технологий, которые учитывают культурное и языковое разнообразие пользователей. Это важный шаг в развитии искусственного интеллекта, ориентированного не только на глобальные, но и на локальные потребности.
