• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 109028, г. Москва, Покровский бульвар, д. 11, корпус S, комната S938 (станции метро "Чистые пруды" и "Курская").

Телефон: +7(495) 772-95-90 *27319

Руководство
Руководитель департамента Кузнецов Сергей Олегович
Заместитель руководителя департамента Громов Василий Александрович
Статья
Efficient indexing of peptides for database search using Tide

Acquaye F. L., Kertesz-Farkas A., Stafford Noble W.

Journal of Proteome Research. 2023. Vol. 22. No. 2. P. 577-584.

Статья
Language models for some extensions of the Lambek calculus

Kanovich M., Kuznetsov S., Scedrov A.

Information and Computation. 2022. Vol. 287.

Статья
Triclusters of Close Values for the Analysis of 3D Data

Egurnov D., Ignatov D. I.

Automation and Remote Control. 2022. Vol. 83. No. 6. P. 894-902.

Глава в книге
Triclustering in Big Data Setting

Egurnov D., Точилкин Д. С., Ignatov D. I.

In bk.: Complex Data Analytics with Formal Concept Analysis. Springer, 2022. P. 239-258.

Глава в книге
Ontology-Controlled Automated Cumulative Scaffolding for Personalized Adaptive Learning

Dudyrev F., Neznanov A., Anisimova K.

In bk.: Artificial Intelligence in Education. Posters and Late Breaking Results, Workshops and Tutorials, Industry and Innovation Tracks, Practitioners’ and Doctoral Consortium -23rd International Conference, AIED 2022, Durham, UK, July 27–31, 2022, Proceedings, Part II. Springer, 2022. P. 436-439.

Глава в книге
Modeling Generalization in Domain Taxonomies Using a Maximum Likelihood Criterion

Zhirayr Hayrapetyan, Nascimento S., Trevor F. et al.

In bk.: Information Systems and Technologies: WorldCIST 2022, Volume 2. Iss. 469. Springer, 2022. P. 141-147.

Защита кандидатской диссертации сотрудника лаборатории Дмитрия Ильвовского

5 июня 2017 года, на заседании диссертационного совета ФИЦ ИУ РАН под председательством академика РАН Ю.С. Попкова  состоялась защита кандидатской диссертации научного сотрудника Международной научно-учебной лаборатории интеллектуальных систем и структурного анализа, старшего преподавателя департамента анализа данных и искусственного интеллекта Дмитрия Алексеевича Ильвовского на тему "Методы и алгоритмы обработки текстовых данных на основе графовых дискурсивных моделей".
Дмитрий преподает автоматическую обработку текстов на нескольких факультетах НИУ ВШЭ, а также ведет факультатив «Анализ данных на платформе SAS» на Факультете компьютерных наук. Кандидатская диссертация непосредственно связана с этими дисциплинами: она посвящена анализу текстовых данных. Подробнее — в интервью с Дмитрием. 

Что можно найти и проанализировать в тексте?

В тексте можно найти очень много, просто пока что не все удается сделать автоматически. Самое главное — это смысл. Над его поиском бьются уже не первое десятилетие. Я пытаюсь выразить смысл текста с помощью его формальной структуры — графов, отражающих связи внутри текста. Находят эти связи, как правило, с помощью специальных средств — парсеров. Современные парсеры работают на принципах машинного обучения с добавлением экспертного знания. Найденные связи используют для прикладных задач, например, для информационного поиска. Я работаю с англоязычными текстами, но не оставляю надежды попробовать что-нибудь и для русского языка.

 Кто повлиял на Ваши научные интересы?

 На мои научные интересы очень сильно повлиял Борис Галицкий. Мы познакомились в Вышке на семинаре у Сергея Олеговича Кузнецова. В 2013 году я подключился к проекту Бориса, связанному с формальным представлением коротких текстов. Там как раз извлекались и использовались связи, о которых я упоминал. Идеи Бориса мне понравились и показались очень оригинальными, потихоньку я начал втягиваться и разбираться с происходящим. Проект продолжается до сих пор: мы ищем новые приложения для такой формализации смысла текста.

 Вы представляете свои работы на конференциях?

 Да, конечно, мы стараемся участвовать в крупных и просто интересных конференциях. Из последних можно упомянуть Европейскую конференцию по компьютерной лингвистике (EACL), Конференцию по компьютерной лингвистике (COLING) и, конечно, Ежегодный симпозиум компьютерных лингвистов — ACL. Это очень крупные события, в которых участвует по несколько тысяч человек.

 В чем главное достижение Вашей диссертации?

 Мне сложно выделить что-то особое: теорему Ферма не доказывал, геном не расшифровывал. Я применил к анализу текстов методы прикладной алгебры — речь о теории решеток замкнутых описаний. Звучит довольно страшно, но в действительности это богатый и математически компактный способ представления знаний. Я использовал некоторые идеи оттуда для представления структуры текстов.

Как развивается область анализа текстов, какие планы на будущее?

С 2013 года существенно повысилось качество извлечения некоторых связей из текста, в частности, дискурсивных связей. Это не наше достижение, но мы им воспользовались и научились проводить очень тонкое различие между текстами, написанными в разных стилях и жанрах.
Недавно мы начали заниматься аргументацией, то есть структурой убеждений и доводов. Стараемся понять, как она связана со смысловой структурой текста.