Лингвисты хотят обучить переводчик Google марийскому языку

Лингвисты и активисты планируют добавить марийский язык в переводчик Google и улучшить работу «Яндекс.Переводчика».

Лингвисты и активисты планируют добавить марийский язык в переводчик Google и улучшить работу «Яндекс.Переводчика».

Специалист Марийского института языка, литературы и истории Андрей Чемышев рассказал, что сейчас в республике создается корпус параллельных текстов на марийском и русском языках.

Такая система будет содержать в себе 1 миллион предложений. Планируется, что данный корпус будут использовать для того, чтобы эффективно обучать программы машинного перевода.

«В Яндексе и в Google для идеального перевода англо-русская пара составляет миллион предложений. Тогда сервис работает довольно прилично. Если базу параллельных текстов мы догоним до этого показателя, то мы сможем создать собственный переводчик», — цитирует РИА SM-News слова лингвиста.

Кстати, на своей странице ВКонтакте Чемышев просит о помощи добровольцев для того, чтобы обрабатывать тексты.

Также МедиаПоток рассказывал, что мессенджер Telegram перевели на марийский язык.