• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Статья
Influence of the Normal Magnetic Component to Magnetotail Current Sheet Forma

Domrin V. I., Malova H. V., V. Yu. Popov et al.

Cosmic Research. 2026. Vol. 64. No. 2. P. 238-252.

Глава в книге
Human-in-the-Loop Egyptology: A System for Ancient Egyptian Text Study

Humonen I., Golyadkin M., Rubanova V. et al.

In bk.: CHI EA '26: Proceedings of the Extended Abstracts of the 2026 CHI Conference on Human Factors in Computing Systems. NY: Association for Computing Machinery (ACM), 2026. P. 1-5.

Препринт
Hessian-based lightweight neural network for brain vessel segmentation on a minimal training dataset

Меньшиков И. А., Бернадотт А. К., Elvimov N. S.

Statistical mechanics. arXie. arXive, 2025

Защита кандидатской диссертации сотрудника лаборатории Дмитрия Ильвовского

5 июня 2017 года, на заседании диссертационного совета ФИЦ ИУ РАН под председательством академика РАН Ю.С. Попкова  состоялась защита кандидатской диссертации научного сотрудника Международной научно-учебной лаборатории интеллектуальных систем и структурного анализа, старшего преподавателя департамента анализа данных и искусственного интеллекта Дмитрия Алексеевича Ильвовского на тему "Методы и алгоритмы обработки текстовых данных на основе графовых дискурсивных моделей".
Дмитрий преподает автоматическую обработку текстов на нескольких факультетах НИУ ВШЭ, а также ведет факультатив «Анализ данных на платформе SAS» на Факультете компьютерных наук. Кандидатская диссертация непосредственно связана с этими дисциплинами: она посвящена анализу текстовых данных. Подробнее — в интервью с Дмитрием. 

Что можно найти и проанализировать в тексте?

В тексте можно найти очень много, просто пока что не все удается сделать автоматически. Самое главное — это смысл. Над его поиском бьются уже не первое десятилетие. Я пытаюсь выразить смысл текста с помощью его формальной структуры — графов, отражающих связи внутри текста. Находят эти связи, как правило, с помощью специальных средств — парсеров. Современные парсеры работают на принципах машинного обучения с добавлением экспертного знания. Найденные связи используют для прикладных задач, например, для информационного поиска. Я работаю с англоязычными текстами, но не оставляю надежды попробовать что-нибудь и для русского языка.

 Кто повлиял на Ваши научные интересы?

 На мои научные интересы очень сильно повлиял Борис Галицкий. Мы познакомились в Вышке на семинаре у Сергея Олеговича Кузнецова. В 2013 году я подключился к проекту Бориса, связанному с формальным представлением коротких текстов. Там как раз извлекались и использовались связи, о которых я упоминал. Идеи Бориса мне понравились и показались очень оригинальными, потихоньку я начал втягиваться и разбираться с происходящим. Проект продолжается до сих пор: мы ищем новые приложения для такой формализации смысла текста.

 Вы представляете свои работы на конференциях?

 Да, конечно, мы стараемся участвовать в крупных и просто интересных конференциях. Из последних можно упомянуть Европейскую конференцию по компьютерной лингвистике (EACL), Конференцию по компьютерной лингвистике (COLING) и, конечно, Ежегодный симпозиум компьютерных лингвистов — ACL. Это очень крупные события, в которых участвует по несколько тысяч человек.

 В чем главное достижение Вашей диссертации?

 Мне сложно выделить что-то особое: теорему Ферма не доказывал, геном не расшифровывал. Я применил к анализу текстов методы прикладной алгебры — речь о теории решеток замкнутых описаний. Звучит довольно страшно, но в действительности это богатый и математически компактный способ представления знаний. Я использовал некоторые идеи оттуда для представления структуры текстов.

Как развивается область анализа текстов, какие планы на будущее?

С 2013 года существенно повысилось качество извлечения некоторых связей из текста, в частности, дискурсивных связей. Это не наше достижение, но мы им воспользовались и научились проводить очень тонкое различие между текстами, написанными в разных стилях и жанрах.
Недавно мы начали заниматься аргументацией, то есть структурой убеждений и доводов. Стараемся понять, как она связана со смысловой структурой текста.