Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.
Адрес: 109028, г. Москва, Покровский бульвар, д. 11, корпус S, комната S938 (станции метро "Чистые пруды" и "Курская").
Телефон: +7(495) 772-95-90 *27319
Департамент анализа данных и искусственного интеллекта был создан в 2014 году на базе кафедры анализа данных и искусственного интеллекта. В его состав входят исследователи с мировым именем, активно участвующие в международных исследовательских проектах.
Acquaye F. L., Kertesz-Farkas A., Stafford Noble W.
Journal of Proteome Research. 2023. Vol. 22. No. 2. P. 577-584.
Vasilii A. Gromov, Yury N. Beschastnov, Korney K. Tomashchuk.
PeerJ Computer Science. 2023. Vol. 9. No. .
Kanovich M., Kuznetsov S., Scedrov A.
Information and Computation. 2022. Vol. 287.
Egurnov D., Ignatov D. I.
Automation and Remote Control. 2022. Vol. 83. No. 6. P. 894-902.
Egurnov D., Точилкин Д. С., Ignatov D. I.
In bk.: Complex Data Analytics with Formal Concept Analysis. Springer, 2022. P. 239-258.
Dudyrev F., Neznanov A., Anisimova K.
In bk.: Artificial Intelligence in Education. Posters and Late Breaking Results, Workshops and Tutorials, Industry and Innovation Tracks, Practitioners’ and Doctoral Consortium -23rd International Conference, AIED 2022, Durham, UK, July 27–31, 2022, Proceedings, Part II. Springer, 2022. P. 436-439.
Zhirayr Hayrapetyan, Nascimento S., Trevor F. et al.
In bk.: Information Systems and Technologies: WorldCIST 2022, Volume 2. Iss. 469. Springer, 2022. P. 141-147.
Dudyrev E., Semenkov Ilia, Kuznetsov S. et al.
Plos One. 2022. Vol. 17. No. 10.
5 июня 2017 года, на заседании диссертационного совета ФИЦ ИУ РАН под председательством академика РАН Ю.С. Попкова состоялась защита кандидатской диссертации научного сотрудника Международной научно-учебной лаборатории интеллектуальных систем и структурного анализа, старшего преподавателя департамента анализа данных и искусственного интеллекта Дмитрия Алексеевича Ильвовского на тему "Методы и алгоритмы обработки текстовых данных на основе графовых дискурсивных моделей".
Дмитрий преподает автоматическую обработку текстов на нескольких факультетах НИУ ВШЭ, а также ведет факультатив «Анализ данных на платформе SAS» на Факультете компьютерных наук. Кандидатская диссертация непосредственно связана с этими дисциплинами: она посвящена анализу текстовых данных. Подробнее — в интервью с Дмитрием.
Что можно найти и проанализировать в тексте?
В тексте можно найти очень много, просто пока что не все удается сделать автоматически. Самое главное — это смысл. Над его поиском бьются уже не первое десятилетие. Я пытаюсь выразить смысл текста с помощью его формальной структуры — графов, отражающих связи внутри текста. Находят эти связи, как правило, с помощью специальных средств — парсеров. Современные парсеры работают на принципах машинного обучения с добавлением экспертного знания. Найденные связи используют для прикладных задач, например, для информационного поиска. Я работаю с англоязычными текстами, но не оставляю надежды попробовать что-нибудь и для русского языка.
Кто повлиял на Ваши научные интересы?
На мои научные интересы очень сильно повлиял Борис Галицкий. Мы познакомились в Вышке на семинаре у Сергея Олеговича Кузнецова. В 2013 году я подключился к проекту Бориса, связанному с формальным представлением коротких текстов. Там как раз извлекались и использовались связи, о которых я упоминал. Идеи Бориса мне понравились и показались очень оригинальными, потихоньку я начал втягиваться и разбираться с происходящим. Проект продолжается до сих пор: мы ищем новые приложения для такой формализации смысла текста.
Вы представляете свои работы на конференциях?
Да, конечно, мы стараемся участвовать в крупных и просто интересных конференциях. Из последних можно упомянуть Европейскую конференцию по компьютерной лингвистике (EACL), Конференцию по компьютерной лингвистике (COLING) и, конечно, Ежегодный симпозиум компьютерных лингвистов — ACL. Это очень крупные события, в которых участвует по несколько тысяч человек.
В чем главное достижение Вашей диссертации?
Мне сложно выделить что-то особое: теорему Ферма не доказывал, геном не расшифровывал. Я применил к анализу текстов методы прикладной алгебры — речь о теории решеток замкнутых описаний. Звучит довольно страшно, но в действительности это богатый и математически компактный способ представления знаний. Я использовал некоторые идеи оттуда для представления структуры текстов.
Как развивается область анализа текстов, какие планы на будущее?
С 2013 года существенно повысилось качество извлечения некоторых связей из текста, в частности, дискурсивных связей. Это не наше достижение, но мы им воспользовались и научились проводить очень тонкое различие между текстами, написанными в разных стилях и жанрах.
Недавно мы начали заниматься аргументацией, то есть структурой убеждений и доводов. Стараемся понять, как она связана со смысловой структурой текста.
Международная научно-учебная лаборатория интеллектуальных систем и структурного анализа: Младший научный сотрудник
Департамент анализа данных и искусственного интеллекта: руководитель департамента