Адрес: 109028, г. Москва, Покровский бульвар, д. 11, корпус S, комната S938 (станции метро "Чистые пруды" и "Курская").
Телефон: +7(495) 772-95-90 *27319
Департамент анализа данных и искусственного интеллекта был создан в 2014 году на базе кафедры анализа данных и искусственного интеллекта. В его состав входят исследователи с мировым именем, активно участвующие в международных исследовательских проектах.
Vol. 2. Switzerland: Springer, 2025.
Domrin V. I., Malova H. V., V. Yu. Popov et al.
Cosmic Research. 2026. Vol. 64. No. 2. P. 238-252.
Humonen I., Golyadkin M., Rubanova V. et al.
In bk.: CHI EA '26: Proceedings of the Extended Abstracts of the 2026 CHI Conference on Human Factors in Computing Systems. NY: Association for Computing Machinery (ACM), 2026. P. 1-5.
Меньшиков И. А., Бернадотт А. К., Elvimov N. S.
Statistical mechanics. arXie. arXive, 2025
5 июня 2017 года, на заседании диссертационного совета ФИЦ ИУ РАН под председательством академика РАН Ю.С. Попкова состоялась защита кандидатской диссертации научного сотрудника Международной научно-учебной лаборатории интеллектуальных систем и структурного анализа, старшего преподавателя департамента анализа данных и искусственного интеллекта Дмитрия Алексеевича Ильвовского на тему "Методы и алгоритмы обработки текстовых данных на основе графовых дискурсивных моделей".
Дмитрий преподает автоматическую обработку текстов на нескольких факультетах НИУ ВШЭ, а также ведет факультатив «Анализ данных на платформе SAS» на Факультете компьютерных наук. Кандидатская диссертация непосредственно связана с этими дисциплинами: она посвящена анализу текстовых данных. Подробнее — в интервью с Дмитрием.
Что можно найти и проанализировать в тексте?
В тексте можно найти очень много, просто пока что не все удается сделать автоматически. Самое главное — это смысл. Над его поиском бьются уже не первое десятилетие. Я пытаюсь выразить смысл текста с помощью его формальной структуры — графов, отражающих связи внутри текста. Находят эти связи, как правило, с помощью специальных средств — парсеров. Современные парсеры работают на принципах машинного обучения с добавлением экспертного знания. Найденные связи используют для прикладных задач, например, для информационного поиска. Я работаю с англоязычными текстами, но не оставляю надежды попробовать что-нибудь и для русского языка.
Кто повлиял на Ваши научные интересы?
На мои научные интересы очень сильно повлиял Борис Галицкий. Мы познакомились в Вышке на семинаре у Сергея Олеговича Кузнецова. В 2013 году я подключился к проекту Бориса, связанному с формальным представлением коротких текстов. Там как раз извлекались и использовались связи, о которых я упоминал. Идеи Бориса мне понравились и показались очень оригинальными, потихоньку я начал втягиваться и разбираться с происходящим. Проект продолжается до сих пор: мы ищем новые приложения для такой формализации смысла текста.
Вы представляете свои работы на конференциях?
Да, конечно, мы стараемся участвовать в крупных и просто интересных конференциях. Из последних можно упомянуть Европейскую конференцию по компьютерной лингвистике (EACL), Конференцию по компьютерной лингвистике (COLING) и, конечно, Ежегодный симпозиум компьютерных лингвистов — ACL. Это очень крупные события, в которых участвует по несколько тысяч человек.
В чем главное достижение Вашей диссертации?
Мне сложно выделить что-то особое: теорему Ферма не доказывал, геном не расшифровывал. Я применил к анализу текстов методы прикладной алгебры — речь о теории решеток замкнутых описаний. Звучит довольно страшно, но в действительности это богатый и математически компактный способ представления знаний. Я использовал некоторые идеи оттуда для представления структуры текстов.
Как развивается область анализа текстов, какие планы на будущее?
С 2013 года существенно повысилось качество извлечения некоторых связей из текста, в частности, дискурсивных связей. Это не наше достижение, но мы им воспользовались и научились проводить очень тонкое различие между текстами, написанными в разных стилях и жанрах.
Недавно мы начали заниматься аргументацией, то есть структурой убеждений и доводов. Стараемся понять, как она связана со смысловой структурой текста.
Международная научно-учебная лаборатория интеллектуальных систем и структурного анализа: Младший научный сотрудник
Департамент анализа данных и искусственного интеллекта: руководитель департамента