
Систему распознавания марийской речи создают в Марий Эл, сейчас она проходит апробацию. Об этом рассказали на заседании правительственной комиссии по государственным языкам республики, сообщает «Национальный акцент» со ссылкой на «Марийскую правду».
Система нужна для перевода речи в текст, а также создания голосовых помощников. Для этого был сформирован аудиокорпус с образцами марийской речи. В него вошли озвученные произведения как написанные на марийском языке, так и переведённые на него.
На сайте corp.marnii.ru размещен национальный корпус марийского языка, который включает в себя более 20 миллионов словоупотреблений. На базе языкового корпуса создаются монографические исследования, изданы «Словарь сравнений марийского языка» и «Словарь эпитетов марийского языка», начато составление «Словаря антонимов марийского языка». Набирает ход работа по созданию горномарийского подкорпуса Национального корпуса марийского языка.
В работе по цифровизации марийского языка принимают участие научные сотрудники, сотрудники Республиканского центра марийской культуры, студенты-практиканты МарГУ и ПГТУ, а также добровольцы-волонтёры, пишет «Национальный акцент».
MariUver