Семинары 2025
Семинар “Автоматическая обработка и анализ текстов” посвящен различным задачам обработки (токенизации, восстановлению сегментации, частеречной разметки и синтаксического парсинга) и анализа текстовой информации (задачам извлечения информации, построения и использования графов знаний, конструированию вопросно-ответных систем, классификации текстов и др.).
Рабочий семинар по проблемам Genome-Wide Association Studies методами интерпретируемого машинного обучения – GWAS&IML (будет анонсирован)
Совместный семинар НУЛ Моделей и методов вычислительной прагматики и заседание Коломенского научного семинара
17 октября 2025 г. в 15:00 состоялось cовместное заседание Коломенского научного семинара (руководитель, проф.. д.ф.-м.н., Владимир Павлович Лексин) и семинара НУЛ "Моделей и методов вычислительной прагматики":
Докладчик: Игнатов Дмитрий Игоревич - к.т.н., Заведующий научно-учебной лаборатории моделей и методов вычислительной прагматики; доцент департамента анализа данных и искусственного интеллекта НИУ ВШЭ.
Тема: Статистическое обучение для вычисления объемов многогранников по метрическим характеристикам
Аннотация: Мы применяем статистические методы обучения для вычисления объемов многогранников на основе подхода Сабитова, который в свою очередь опирается на выражение (квадрата) объема как корня полинома, зависящего от (квадратов) произведений длин ребер. Известно, что поиск полиномов Сабитова представляет значительные вычислительные трудности для сложных многогранников. Чтобы оценить объем многогранника по длинам его ребер, мы предлагаем использовать регрессию ElasticNet, демонстрируя высокую точность (коэффициент детерминации R2 > 0,999) для (не обязательно правильных) тетраэдров и октаэдров (R2 ≥ 0,98 и > 0,999, в зависимости от параметров генерации многогранников), получая формулы квадратов их объемов как взвешенную сумму произведений троек квадратов расстояний их ребер и диагоналей. Мы также рассматриваем возможности статистического обучения для работы с гибким многогранником Штеффена, где традиционные методы испытывают трудности с получением полинома Сабитова. Полученные результаты объединяют подходы из алгебраической геометрии и машинное обучения, предлагая численную альтернативу для вычисления объема и коэффициентов в формулах объемов.
Онлайн-семинар "Прогнозирование финансовых потоков с использованием моделей временных рядов и анализа новостного фона"
Дата: 2 октября, 18:00
Спикер: Рябых Алексей Геннадьевич - Стажер-исследователь Лаборатории социальной и когнитивной информатики НИУ ВШЭ СПб.
Аннотация: Прогнозирование финансовых потоков является ключевой задачей для банковского сектора, инвестиционных компаний и регуляторов. Современные методы машинного обучения, в частности глобальные модели, демонстрируют высокую прогностическую точность, однако их применение ограничено чувствительностью к качеству данных, недостаточной разработанностью универсальных подходов к интеграции разнородной неструктурированной информации (в том числе финансовых новостей) и низкой интерпретируемостью прогнозов. В работе предложены эффективные процедуры предобработки временных рядов, способы генерации текстовых признаков, позволяющие выделять значимые сигналы из новостного фона и учитывать их влияние на динамику финансовых потоков, подходы к построению глобальных моделей, а также подходы к разработке мульти-модальных моделей (на основе тематического моделирования), объединяющих временные ряды и текстовые данные с сохранением интерпретируемости.
Совместный семинар ДАДиИИ и НУЛ ММВП
Дата: 13 июня 2025 г. в 11:10 в рамках совместного семинара департамента анализа данных и искусственного интеллекта под руководством, С.О. Кузнецова, и научно-учебной лаборатории моделей и методов вычислительной прагматики, Игнатова Д.И., прошла успешная предзащита кандидатской диссертации Ананьевой М.Е. на тему: «Разработка подходов к улучшению качества контекстных рекомендательных систем и алгоритмов».
Докладчик: Ананьева Марина Евгеньевна - аспирант департамента анализа данных и искусственного интеллекта ФКН.
Научный руководитель: к.т.н., доцент Игнатов Дмитрий Игоревич
Рецензенты:
1. PhD, доцент, академический руководитель образовательной программы Финансовые технологии и анализ данных Масютин А.А.
2. PhD, доцент, старший научный сотрудник научно-учебной лаборатории матричных и тензорных методов в машинном обучении Фролов Е.П.
Совместный семинар ДАДиИИ и НУЛ ММВП
Дата: 11 июня 2025 года в рамках совместного семинара департамента анализа данных и искусственного интеллекта под руководством, С.О. Кузнецова, и научно-учебной лаборатории моделей и методов вычислительной прагматики, Игнатова Д.И., прошла успешная предзащита кандидатской диссертации Маневича В.А.:
Докладчик: Маневич Вячеслав Андреевич - Стажер-исследователь Научно-учебной лаборатории моделей и методов вычислительной прагматики, аспирант департамента анализа данных и искусственного интеллекта ФКН.
Тема: "Метод тройной поправки и вейвлет-анализ в задачах прогнозирования фондового рынка и криптовалют". Научным руководителем является заведующий лабораторией НУЛ ММВП, к.т.н., доцент Игнатов Дмитрий Игоревич, а рецензентами выступили PhD, доцент Масютин А.А. и PhD, доцент Каледин М.Л..
Аннотация: В работе «Метод тройной поправки и вейвлет-анализ в задачах прогнозирования фондового рынка и криптовалют» исследуются прогнозные возможности нового предложенного автором метода «метод тройной поправки» на 89 биржевых активах, которые содержат бОльшую долю капитализации индекса S&P500. Также приводится новый критерий абсолютной применимости моделей прогнозирования временных рядов и изучается применимость дискретных вейвлет-преобразований. В результате, при сравнении более чем 200 000 различных моделей и их модификаций с вейвлет-преобразованиями получено, что предложенный метод показывает сопоставимые или опережающие прочие модели результаты в значительной доле случаев, а также подтверждена практическая применимость вейвлет-преобразований в задачах прогнозирования экономических временных рядов.
Совместный семинар центра Языковых и семантических технологий и лаборатории НУЛ ММВП
Дата: 4 апреля, 13:00 в рамках совместного семинара центра Языковых и семантических технологий и лаборатории НУЛ ММВП состоялось предварительное слушание диссертационного исследования аспиранта ДАДиИИ и стажера-исследователя НУЛ ММВП В.А. Маневича по теме: "Метод тройной поправки и вейвлет-анализ в задачах прогнозирования фондового рынка и криптовалют".
Докладчик: Маневич Вячеслав Андреевич - Стажер-исследователь Научно-учебной лаборатории моделей и методов вычислительной прагматики, аспирант департамента анализа данных и искусственного интеллекта ФКН.
Тема: "Метод тройной поправки и вейвлет-анализ в задачах прогнозирования фондового рынка и криптовалют"
Аннотация: В работе «Метод тройной поправки и вейвлет-анализ в задачах прогнозирования фондового рынка и криптовалют» исследуются прогнозные возможности нового предложенного автором метода «метод тройной поправки» на 89 биржевых активах, которые содержат бОльшую долю капитализации индекса S&P500. Также приводится новый критерий абсолютной применимости моделей прогнозирования временных рядов и изучается применимость дискретных вейвлет-преобразований. В результате, при сравнении более чем 200 000 различных моделей и их модификаций с вейвлет-преобразованиями получено, что предложенный метод показывает сопоставимые или опережающие прочие модели результаты в значительной доле случаев, а также подтверждена практическая применимость вейвлет-преобразований в задачах прогнозирования экономических временных рядов.
Ссылка на видеовстречу: https://telemost.yandex.ru/j/34771805587477
Семинар центра Языковых и семантических технологий и лаборатории НУЛ ММВП. "Beyond formulaic (im)politeness: how lexical bundles reveal conventionalization and the negotiability of pragmatic meaning"
Дата: 24 апреля, 18:00 в рамках совместного семинара центра Языковых и семантических технологий и лаборатории НУЛ ММВП состоялся доклад:
Докладчик: Olivier Mozard T. Kamou, PhD student, HSE – Nizhny Novgorod
Тема: Beyond formulaic (im)politeness: how lexical bundles reveal conventionalization and the negotiability of pragmatic meaning
Аннотация: Conventionalization – the process by which linguistic expressions acquire additional pragmatic meaning through repeated use in a specific context – plays a crucial role in (im)politeness. While politeness is widely recognized as a dynamic context-dependent phenomenon, corpus pragmatics and computational approaches often focus on predefined formulae and strategies. This emphasis on default interpretations may obscure the contextual variability of politeness, making it challenging to capture the diverse politeness-related meanings a form can adopt across different linguistic and social contexts. In this report, I will discuss how a more frequency-driven approach based on lexical bundles, extends beyond established politeness formulae to capture how non-conventionalized expressions become conventionalized within a particular community of practice (Wikipedia editors). Furthermore, I will show how, depending on context, the same linguistic expression can exhibit fluidity in pragmatic meaning, offering a broader perspective on computational approaches to pragmatics.
Ссылка на видеовстречу:
https://us06web.zoom.us/j/84456269588?pwd=gAzxy1uJyyyYTOqaHQyH5Wb30vQ5kK.1
Cеминар НУЛ ММВП по теме "Frequent Itemsets and Sequences for Time Series Analysis"
Дата: 10 июля, 15:30 состоялся онлайн-семинар по теме "Frequent Itemsets and Sequences for Time Series Analysis":
Докладчик: Фейзал Бабер (Faisal Baber), студент магистратуры программы "Науки о данных" департамента анализа данных и ИИ ФКН.
Тема: Frequent Itemsets and Sequences for Time Series Analysis
Аннотация: Financial systems keep sequential transaction data organized by time, reflecting the fact that customers use different payment methods. Detecting frequent behaviors helps spot early problems. Looking for patterns in symbolic sequences within the data allows us to see habits, notice anomalies, and create financial services based on the data. I offer a usable guide for dealing with common closed sequential patterns (FCSPs) that often appear in a real bank transaction data set. Initially, I change each raw event log into a symbolic sequence of customer actions. Using information about how much and when the transaction occurred, plus which industry the merchant belongs to. After that, I find all closed sequential pattern, non overlapping motifs in the instructional texts. According to this study, closed sequential pattern mining can be successfully used to discover patterns in transactional finance data.
Подключиться к конференции Zoom:
https://us06web.zoom.us/j/83977478698?pwd=jHsl32PG5FtahU3LpWW2Bhwa2Am301.1
Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.
