
В Тартуском университете прошла защита докторской диссертации Хеле-Андры Куулметс. Исследование подтвердило эффективность многоязычного трансферного обучения для развития нейросетей на малых языках. Автор работы подчеркивает, что ключевые выводы о качестве работы моделей были сделаны на базе финно-угорской группы, сообщает Novaator.
Исследование на базе финно-угорских языков
В рамках научной работы был создан уникальный массив данных для оценки четырех родственных языков. Исследователь сфокусировала внимание на эстонском, выруском, ливском и коми языках. Такой подход позволил протестировать модели в условиях острого дефицита цифровых данных. Для малых финно-угорских народов это открывает новые возможности создания качественных ИИ-помощников.
Эффективность обучения через английский язык
Эксперименты показали, что знания из богатого ресурсами английского языка успешно переносятся на финно-угорскую почву. Модели, обученные сначала на огромных массивах разных языков, справлялись с задачами лучше узкоспециализированных систем. Даже использование текстов с машинным переводом дало положительный результат для обучения. Это доказывает, что объем и разнообразие данных важнее их идеальной лингвистической точности.
Проблема понимания логических связей
Для проверки глубины «понимания» языка был разработан тест на выявление причинно-следственных связей. Исследование показало, что ИИ все еще испытывает трудности с логическими выводами, которые очевидны для человека. Например, связь между восходом солнца и появлением теней остается для алгоритмов сложной задачей. Работа Куулметс доказывает, что для развития эстонского ИИ важнее всего грамотное комбинирование уже существующих мировых ресурсов.
Doktoritöö: võõrkeeles koolitatud tehisaru oskab paremini ka eesti keelt
MariUver