Аудиокорпус с образцами марийской речи создадут в Йошкар-Оле

Аудиокорпус с образцами марийской речи на основе сборника марийских народных сказок создадут в Йошкар-Оле. Работа ведётся в Марийском научно-исследовательском институте языка, литературы и истории им. В.М. Васильева.

Для создания аудиобазы используется сборник марийских народных сказок «Сорок одна небылица». Любой желающий может скачать файлы, которые необходимо озвучить, записать на цифровой диктофон или смартфон и выслать файлы на почтовый адрес организаторов проекта. Лингвисты надеятся, что к проекту присоединиться каждый представитель народа мари.

«Нам важны образцы речи любого человека: ребёнка, молодого человека, девушки, юноши, отцов, матерей, дедов и бабушек. Не играет роли как человек читает: бегло или выразительно, есть ли у него дефекты речи или нет», — говорит компьютерный лингвист Андрей Чемышев.

Отметим, что для аудиокорпус будет включать в себя две литературные нормы марийского языка: луговой и горный. Накопленная база в дальнейшем станет основой для создания системы распознавания речи и продуктов, использующих речевые технологии.

Кидшер