В Йошкар-Оле презентовали проект «Марийский язык и компьютерные технологии»

Как развивать «Яндекс.Переводчик» на марийском языке? Когда появится национальный корпус марийского языка? Новые языковые анализаторы и словарь марийских морфем. Эти и другие вопросы рассматривались в ходе презентации проекта «Марийский язык и компьютерные технологии».
Проект реализуется Марийским научно-исследовательским институтом языка, литературы и истории им. В.М. Васильева и Республиканским центром марийской культуры. Руководителем проекта является компьютерный лингвист Андрей Чемышев. В рабочую группу входят Геннадий Сабанцев, Василий Семёнов и Олег Сергеев
«Данный проект включён в план основных мероприятий, связанных подготовкой и празднованием столетия республики. Специалисты будут координировать деятельность педагогов, учёных, журналистов, программистов, авторских коллективов по созданию лингвистической базы языка, электронных систем по обучению марийскому языку», — сообщила собравшимся на презентации участникам заместитель директора Марийского научно-исследовательского института языка, литературы и истории Людмила Григорьева. Директор Республиканского центра марийской культуры, Наталья Пушкина, призвала собравшихся журналистов, филологов, неравнодушных людей присоединиться к данной работе.
На сегодняшний день лингвисты уже активно работают над различными проектами. Так, с 6 сентября на сервисе «Яндекс.Переводчик» начал действовать машинный перевод, который позволяет перевести слова и фразы с марийского и горномарийского языков на любой из 87 других языков, которые «знает» сервис, и, наоборот.
Руководство МарНИЯЛИ им. В.М. Васильева, предоставило компании «Яндекс» права на использование словарной базы 10-томного «Словаря марийского языка» (Марийское книжное издательство, 1990-2005). Андрей Чемышев вместе с группой сотрудников Центра марийской культуры собрал дополнительный корпус двуязычных русско-марийских текстов.
В настоящее время машинный переводчик с марийского языка находится в ß-версии. Работа по дальнейшей модернизации и улучшении работы сервиса продолжается. По мнению Андрея Чемышева, через год лингвисты доведут «Яндекс.Переводчик» до финального релиза.
Если сервис перевёл фразу некорректно, то вы можете предложить правильный вариант перевода, тем самым внесёте свой вклад в улучшение работы сервиса. Для этого справа необходимо нажать «карандаш», скорректировать переведённую фразу и нажать «Отправить». Модераторы рассмотрят вашу правку и, если перевод будет правильным, то внесут изменения в базу.
Отмечу, что «Яндекс.Переводчик» можно скачать на свой iOS или Android и пользоваться оффлайн, то есть без подключения к сети wi-fi или интернет.
На презентации говорили и о марийской операционной системе, локализации программного обеспечения на марийский язык, новом языковом анализаторе и словаре марийских морфем.
В следующем году компьютерные лингвисты будут работать по созданию национального корпуса марийского языка. В настоящее время, сотрудники Научно-образовательного центра при МарГУ «Марий йылме» («Марийский язык») сканируют книги, газеты и журналы.

Кидшер

  1. Arelatensis

    Так был же а может и есть проект по локализации Linux-Ubuntu на марийский язык (http://packages.ubuntu.com/ru/precise/language-pack-gnome-mhr). Тольк кажется он стагнировался, последняя поддерживая версия Ubuntu 14.04

    Ответить
  2. Анна

    Сай тӱҥалтыш! Пашада ушныжо!

    Ответить
    1. Кидшер

      Чынжымак сай да кӱлешан тӱҥалтыш.

      Ответить