Академия наук РТ и Сбер завершили важный этап работы по развитию технологий ИИ для национальных языков: ГигаЧат освоил татарский язык

13 апреля 2026 г., понедельник

В рамках проекта был сформирован масштабный и качественно выверенный корпус данных на татарском языке, включающий произведения литературы, публикации в прессе, учебные пособия, ресурсы Национального корпуса татарского языка «Туган тел» Института прикладной семиотики АН РТ, а также другие верифицированные открытые текстовые источники. Это позволило заметно повысить качество понимания и генерации текста на татарском языке.

Особую значимость проекту придаёт то, что первым результатом совместной работы по адаптации модели к языкам народов России стало обучение ГигаЧат татарскому языку. Для Республики Татарстан это не только технологическое достижение, но и важный шаг в сохранении, изучении и развитии татарского языка в условиях глобальной цифровизации.

Развитие этого направления ведётся в рамках стратегии по сохранению языкового многообразия народов России. Речь идёт не просто о технологической адаптации, а о создании условий для полноценного использования татарского языка в современных цифровых сервисах и интеллектуальных системах.

Новые возможности открываются для образования, науки, медиа и повседневной коммуникации: пользователи смогут обращаться к нейросети на татарском языке, а значит, использовать современные цифровые инструменты без утраты связи с родным языком и культурной традицией.

Проект формирует основу для дальнейшего расширения практик использования национальных языков в цифровой среде. В дальнейшем наработанный подход может быть масштабирован и на другие языки народов России.

ПОДПИСАТЬСЯ НА НОВОСТИ
Все материалы сайта доступны по лицензии:
Creative Commons Attribution 4.0 International