Национальный корпус марийского языка планируется запустить в 2020 году

Национальный корпус марийского языка планируется запустить в 2020 году. Об этом сообщил сотрудник отдела языка Марийского научно-исследовательского института языка, литературы и истории им. В.М. Васильева Андрей Чемышев.

«Стоит задача к концу 2020 года собрать 20 миллионов словоупотреблений. У нас есть предложение в перспективе сделать не только морфологическую разметку, но и синтаксическую. Тогда можно будет анализировать как менялся синтаксис», — рассказал компьютерный лингвист.

К настоящему времени подготовлен корпус первого порядка в количестве 11 миллионов словоупотреблений, добавил языковед.

Работы по созданию Национального корпуса марийского языка ведут Марийский научно-исследовательский институт языка, литературы и истории им. В.М. Васильева совместно с Республиканским центром марийской культуры.

Следите за развитием событий в нашем Телеграм-канале

Кидшер