Пользователи сети в рамках проекта Common Voice записали 301 час речи на марийском языке. Языковыми активистами проверено 279 часов записанных фраз, сообщается на сайте проекта.
«Среди языков народов России марийский язык является первым, который прошёл отметку 300 часов», — рассказал «Кидшер» компьютерный лингвист Андрей Чемышев.
Сейчас в марийскоязычном проекте участвуют 489 пользователей.
Датасет будет использован разработчиками для создания виртуального голосового ассистента на марийском языке iВика. Его прототип может появится в первом квартале 2024 года.
Мари стикер