Институт ИИ и цифровых наук объединяет лидеров машинного обучения и молодых ученых

В конце марта 2026 года в Лодейном Поле (Ленинградская область) прошел воркшоп «Математика машинного обучения», организованный Институтом искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ (далее — Институт ИИиЦН). Мероприятие уже традиционно выступает ключевой площадкой для сплочения научного сообщества Института ИИиЦН, объединяя как признанных лидеров в области ИИ, так и талантливую молодежь. Значительную часть аудитории составили молодые ученые — аспиранты и стажеры-исследователи, для которых участие в воркшопе стало возможностью перенять опыт у старших коллег и представить результаты собственных исследований.
Формат воркшопа позволил создать уникальную среду для профессионального диалога. Программа мероприятия включала мини-курс, лекции, секционные доклады и ежедневную интенсивную работу над проектами. Участники обсудили широкий спектр тем — от классических методов оптимизации и статистического обучения до новейших подходов к генеративным моделям и проблемам масштабируемости рекомендательных систем. Завершила программу сессия об открытых проблемах машинного обучения (Open Problems Call), где были обозначены нерешенные математические задачи, формирующие будущую повестку исследований.
Сергей Самсонов
заведующий международной лабораторией стохастических алгоритмов и анализа многомерных данных Института ИИиЦН
Мы проводим зимнюю школу в похожем формате уже четвертый год, и мне хочется надеяться, что каждая следующая школа получается лучше предыдущих. Основная идея школы — собрать вместе, в неформальной обстановке, студентов и профессоров, работающих в смежных областях, и создать обстановку, в которой они могут неформально обсудить задачи. Из каждой школы рождаются новые проекты и новые задачи, и этот год, конечно, не станет исключением.
Зимняя школа проходила на фоне потрясающей природы Ленинградской области и собрала множество исследователей и студентов. Мы наслаждались теплым гостеприимством, обменивались идеями и завязывали полезные знакомства. Для меня было большой честью стать частью этого незабываемого события.
(Set amid the breathtaking beauty of the northern St. Petersburg region, the winter school brought together a large number of researchers and students. While enjoying gracious hospitality, we exchanged ideas and forged connections. It has been a great pleasure to be part of this memorable event.)
Воркшоп начался с лекции Сергея Самсонова, посвященной методам амортизированного сэмплирования (Amortized sampling methods), которые позволяют ускорить генерацию данных за счет предварительного обучения.
Штефан Обердерстер в своем докладе рассказал об ускорении генерации при помощи перехода от диффузии к баллистике — подходе, открывающем новые возможности для повышения эффективности диффузионных моделей.
Никита Морозов рассказал об адаптации теории генеративных потоковых сетей (GFlowNets) к пространствам с циклами, а также применении разработанной методологии к задаче поиска кратчайших путей в больших графах, в том числе эффективной сборке кубика Рубика.
Во второй половине дня участники секции «NLA» (Numerical Linear Algebra (численная линейная алгебра)) представили результаты, связанные с оптимизацией и низкоранговыми приближениями. Среди докладов:
- Александр Моложавенко рассказал о методах малопараметрической тонкой настройки больших языковых моделей с помощью геометрических методов римановой оптимизации. Данный подход позволил не только адаптировать современные методы оптимизации на гладкое многообразие матриц фиксированного ранга, но и теоретически обосновал другие методы решения задачи, до этого момента считавшиеся эвристическими.
- Денис Ряполов презентовал новый рандомизированный алгоритм для верхней оценки спектральной нормы матрицы
- Ульяна Паркина представила новый алгоритм для устойчивого взвешенного низкорангового приближения, а также его применение для сжатия больших языковых моделей.
- Аскар Цыганов рассказал об алгоритмах дообучения больших языковых моделей без метода обратного распространения ошибки — направлении, которое может существенно снизить вычислительные затраты.
Во второй день воркшопа Константин Яковлев провел мини-курс «Статистические аспекты дистилляции диффузионных моделей». В курсе были рассмотрены методы построения одношаговых генеративных диффузионных моделей, а также проанализированы их статистические свойства. Были приведены оценки на обобщающую способность методов дистилляции диффузионных моделей в терминах восстановления целевого распределения.
Далее в секции «Стохастическая аппроксимация» рассказали о методе построения доверительных интервалов, основанном на мультипликативном бутстрапе, для федеративной линейной стохастической аппроксимации, о порядках сходимости в нормальной аппроксимации для алгоритма Q-обучения (Q-learning), а также об эффективном методе обучения логистической регрессии с большим числом классов.
В рамках секции «Рекомендательные системы» обсудили проблемы масштабируемости и оценки многоруких бандитов, а также нейросетевые подходы — от графовых рекомендаций и их сочетания с трансформерами до практических трудностей секвенциальных алгоритмов.
Секция «Статистические аспекты машинного обучения» сфокусировалась на современных методах генеративного моделирования и высокоразмерной статистики: были представлены доклады об оценке score-функции и её гессиана в диффузионных моделях, точности оценивания потенциала Шрёдингера, восстановлении ковариационных матриц с тензорной структурой, а также неасимптотическом анализе эффективности конформной квантильной регрессии.
Секция «Диффузионные модели» была посвящена современным исследованиям в области диффузионных моделей. В рамках малых докладов рассказали о теоретических аспектах, таких как применение мостов Шрёдингера для задач оптимального транспорта и улучшение дискретизации диффузионных ОДУ. Кроме того, спикеры поделились новыми практическими применениями: использованием диффузии для генерации текстов и исследованием по ускорению инференса за счет автоматизации расписания кэширования.
Важной частью программы стала ежедневная работа над проектами, где участники в малых группах могли применить полученные знания и провести эксперименты под руководством коллег. Завершила программу сессия об открытых проблемах машинного обучения (Open Problems Call), где участники обозначили нерешенные математические задачи, требующие дальнейшего исследования.
Воркшоп «Математика машинного обучения — 2026», проводившийся в третий раз на площадке отеля Точка на карте Лодейное Поле, подтвердил статус одной из ключевых внутренних научных площадок Института ИИиЦН, где формируется единая исследовательская повестка. Сочетание лекционного формата, секций с короткими докладами и неформального общения позволило участникам всех уровней — от профессоров до стажеров-исследователей — не только представить свои работы, но и заложить основу для будущих совместных проектов.
Впечатления участников воркшопа:
Евгения Шустова, стажер-исследователь международной лаборатории стохастических алгоритмов и анализа многомерных данных
Юрий Свирщевский, стажер-исследователь международной лаборатории стохастических алгоритмов и анализа многомерных данных
Дарья Коровайцева, стажер-исследователь международной лаборатории стохастических алгоритмов и анализа многомерных данных