15.1 C
Саранск
Среда, 1 мая, 2024

Мордовские ученые разработали чат-бот для перевода с русского языка на эрзянский

Информация об этом появилась в личном блоге ректора Мордовского госуниверситета Дмитрия Глушко.

Первый сетевой эрзянский переводчик – результат плотного сотрудничества программистов и лингвистов по стратегическому проекту «Университет – центр социокультурного развития региона» федеральной программы «Приоритет 2030».

Как пояснил разработчик модели нового онлайн-переводчика, доцент кафедры фундаментальной информатики, директор лаборатории интеллектуального анализа данных МГУ им. Н. П. Огарёва Артём Андронов, модель нейронного машинного перевода (на основе архитектуры Transformer) создана для пары языков русский/эрзянский. К этой модели «прикручен» telegram-бот, который позволяет генерировать письменный перевод с русского на эрзянский язык.

Пока виртуальный словник, составленный на основе материалов, собранных филологами, студентами и преподавателями, а также энтузиастами, свободно владеющими эрзянской разговорной речью, содержит 100 тысяч пар параллельных предложений на эрзянском и русском языках, на подходе ещё около 50 тысяч пар.

Пока чат-бот действует в тестовом режиме для IT- специалистов и знатоков эрзянского языка, которые заняты в разработке нового сервиса и проверяют корректность компьютерного перевода. Но авторы модели обещают в ближайшую перспективу открыть бот-переводчик для широкой аудитории пользователей telegram.

Кроме письменного переводчика разработчики готовятся запустить аудиосервис: распознавание и синтез эрзянской речи.
А затем – аналогичную модель telegram-бота для мокшанского языка.

Как сообщает ректор Дмитрий Глушко, на создание параллельных корпусов мордовских языков – русско-эрзянского и русско-мокшанского МГУ им. Н. П. Огарева получил грант 8,5 млн. рублей.

Поделиться

Новости партнеров

Последние новости