• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Описание научного проекта

Аннотация проекта

Развитие прикладных методов машинного обучения (МО) для анализа данных в научных приложениях переживает бурный рост. Ставшие классическими применения алгоритмов для таких задач как поиск сверхредких распадов частиц на Большом адронном коллайдере) расширяются, также постоянно возникают новые возможные применения (например, предсказание пространственной структуры белка AlphaFold). В результате применения методов машинного обучения исследователи способны в десятки раз увеличить скорость обработки информации, им становятся доступны ранее недоступные результаты. К наиболее развитым с точки зрения применения методов машинного обучения можно отнести физику частиц и астрофизику, где первые нейронные сети для анализа сигнала были применены в начале 1990-х годов.

Естественные науки предъявляют особые требования к используемым алгоритмам, с точки зрения их надёжности и оценки качества. В частности, научное измерение должно иметь доверительные интервалы, чьи свойства должны быть строго определены в частотном или байесовском смыслах. Выбор вероятностной интерпретации при этом зависит от конкретного применения. Методы построения доверительных интервалов на практике могут иметь ярко выраженные особенности, неочевидные при анализе модельных данных.

Хорошо известно, что для машинного обучения характерны сложные ландшафты лосс функций, со множественными минимумами и перегибами, имеющими характерные долины параметров и нелинейности. Подобные формы могут привести к проблемам при построении гарантий на ответ и дальнейшей интерпретации результатов эксперимента. Например, в случае наличия долины параметров U-формы экспериментальное покрытие доверительного интервала может быть как выше так и ниже теоретического. В этом отношении очень важно развивать методы надёжного построения доверительных интервалов, что, в случае, применения методов машинного обучения для реальных данных может быть затруднено из-за большого количества параметров.

В этом проекте мы предлагаем разработать и применить методики для оценки погрешности предсказания алгоритмов машинного обучения, и апробировать их на задачах астрофизики и физики высоких энергий. Кроме того, в результате проекта будут решены несколько реальных задач из практики естественных наук: построение быстрой симуляции пролёта заряженных частиц через вещество генеративно-состязательными сетями, аументация и анализ кривых блеска сверхновых звёзд, решение обратной задачи солнечной атмосферы на телескопе БСТ-1.

Цели и задачи исследования

  1. Разработка методик оценки неопределённостей для генеративных и дискриминативных моделей машинного обучения. Проверка существующих подходов и оценка их возможностей.
  2. Применение полученных подходов для оценки погрешностей при поиске сверхновых звёзд по анализу кривых блеска в данных, собранных специализированным обзором Zwicky Transient Facility (ZTF).
  3. Применение полученных методов к решению обратной задачи по вычислениюпараметров солнечной атмосферы для солнечного телескопа в Крымской астрофизической обсерватории.
  4. Применение полученных методик для задачи быстрой симуляции детектора LHCb

Сроки проведения работы над проектом

1 января 2022 – 15 декабря 2022

Ожидаемые научные результаты исследований, предполагаемое использование результатов в деятельности НИУ ВШЭ

Планируется две публикации в престижных журналах, входящих в базы данных Scopus и WoS:

  • Название: "Generative model uncertainty”. Содержание: Нейросетевые генеративные модели только недавно начали применяться в науке [1], и сейчас нет методов оценки их неопределённости. Есть статьи про неопределённость классификаторов/регрессоров [2, 3]. Проблема ставится в препринте [4], но не предлагается решения. Значимость. Современные физические симуляторы требуют большого количества вычислительных ресурсов. Решение проблемы с оценкой неопределённости позволит заменить их на генеративные модели. Следующим этапом будет анализ качества работы методов оценки неопределённости генеративных моделей в задаче быстрой симуляции детектора LHCb. Новизна: нет методов, нет и анализа качества их работы. Значимость. Апробация на реальной задаче, которая покажет сильные и слабые места метода и будет убедительным аргументом в пользу его (не) применения в других задача. Реализация внутри быстрой симуляции детектора LHCb расширит спектр её применения и позволит получить больше симулированных данных при ограниченном бюджете, что позволит сделать больше исследований конкретных частиц и распадов в поиске новой физики. Журнал: Jounal of Instrumentation.
  • Название: “Towards Solution of Inverse Problem with Uncertainties”. Содержание: Первым этапом исследования будет аугментация астрономических данных в непериодических кривых блеска. Данная часть проекта направлена на разработку метода анализа кривых блеска с целью получения параметров вспышек сверхновых звёзд разных типов. В данной части проекта будет отработан байесовский подход к анализу неопределённости результатов. Финальные результаты будут релевантны в свете новых телескопов, готовящихся к запуску в ближайшее время (Обсерватория имени Веры Рубин). Работа ведётся совместно с ГАИШ МГУ и университетом Иллинойса. Второй и основной частью будет восстановление параметров атмосферы Солнца по наблюдаемым спектро-поляриметрическим данным. В настоящее время в Крымской астрофизической обсерватории (КрАО) ведутся работы по созданию нового солнечного спектрополяриметра на базе спектрографа Башенного солнечного телескопа (БСТ-1), новый инструмент должен давать возможность проводить спектрополяриметрические наблюдения участков солнечной поверхности с пространственным разрешением порядка 1 угловой секунды и с перекрытием спектра в оптическом диапазоне в полосе 15 – 20 ангстрем. Такие данные позволят определять параметры солнечной атмосферы (в т. ч. внешнее магнитное поле и продольную доплеровскую скорость плазмы) на разных высотах, которые определяются выбранными для наблюдений спектральными линиями. В ходе работы будут проанализированы подходы в классической парадигме, а также будет осуществлено сравнение с подходом с применением нормализующих потоков. Работа ведётся совместно с Пулковской и Крымской астрофизическими обсерваториями РАН. Журнал: Journal of Physics: Conference Series
Результаты буду использованы в НИУ ВШЭ в рамках работы в  экспериментах физики частиц ЦЕРН, ОИЯИ, НЦФМ Саров, а также астрофизики (БСТ-1 и прочие).

Форма представления результатов проекта

Планируется две публикации и доклады на тематических конференциях.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.