• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Семинар МЛ ИССА "Методы и средства морфологической сегментации для систем автоматической обработки текстов"

Мероприятие завершено

В пятницу, 24 марта 2023 г. в 15:00 в рамках семинара "Математические модели информационных технологий" департамента анализа данных и искусственного интеллекта и МЛ "Интеллектуальных систем и структурного анализа" под руководством С.О. Кузнецова состоится семинар по теме "Методы и средства морфологической сегментации для систем автоматической обработки текстов". 

Докладчик: Сапин Александр Сергеевич, Московский государственный университет им. М.В. Ломоносова, Факультет Вычислительной Математики и Кибернетики, Кафедра Алгоритмических Языков.

Аннотация: Морфологический анализ является одним из важнейших этапов автоматической обработки текстов (АОТ). Помимо традиционных задач (лемматизация словоформ текста, определение их морфологических характеристик, разрешение омонимии), к морфологическому анализу относится задача морфологической сегментации (т.е. сегментации слов на составляющие морфы), также называемая морфемным разбором. Несмотря на востребованность в ряде приложений АОТ, эта задача исследована недостаточно. В докладе представлены результаты диссертационного исследования, в ходе которого разработаны три новых высокоточных метода морфемного разбора лемм (нормальных форм слов) русского языка на базе машинного обучения. Впервые рассматривается задача морфемного разбора словоформ текста, для решения которой предложены два нейросетевых метода. Оба метода показывают высокое качество решения, причем один из них позволяет одновременно определять для словоформ их морфологические характеристики и морфемный разбор. На основе разработанных методов реализована программная библиотека с открытым кодом, поддерживающая расширенный набор функций морфологического анализа русскоязычных текстов, выполняемых с высокой точностью и производительностью.

Yandex telemost