В рамках проекта Common Voice пользователи записали 301 час речи на марийском языке.
Всего лингвистами было проверено 279 часов записанных фраз, а сейчас в марийскоязычном проекте участвуют 489 человек.
«Среди языков народов России марийский язык является первым, который прошёл отметку 300 часов», — рассказал «Кидшер» компьютерный лингвист Андрей Чемышев.
Отметим, что датасет будет использован программистами и учеными для создания виртуального голосового помощника iВика. Планируется, что он может появиться уже в первом квартале 2024 года.
Ранее МедиаПоток писал, что в Марий Эл изобретут умную колонку на марийской языке.