ФКН рассказал об использовании методов ML в науках о материалах в Великом Новгороде
23–26 ноября в Новгородском государственном университете состоялся воркшоп «Вычислительные методы в материаловедении и химии». В программе мероприятия было четыре трека: квантово-химические расчеты, классическая молекулярная динамика, основы инфохимии, а также методы машинного обучения в науках о материалах. Последний трек был организован при участии факультета компьютерных наук.
Михаил Лазарев, научный сотрудник научно-учебной лаборатории методов анализа больших данных и доцент департамента больших данных и информационного поиска, участвовал в организации воркшопа, а также вел трек о методах машинного обучения для определения свойств и генерации материалов. Участники трека познакомились с основными методами машинного обучения и попрактиковались в их применении на открытых базах данных для определения различных свойств молекул и материалов, таких как токсичность или предсказание энергии.
Воркшоп прошел прекрасно, в плане организации — лучше, чем я мог себе представить. Место очень хорошее: как сам город, так и площадка в новом корпусе университета, где мы и проводили воркшоп.
Программа моего трека была построена на базе курса, который я читаю в ВШЭ, но в сокращенном виде. «Подружить» машинное обучение с любой наукой относительно не сложно, главное — чтобы были данные. И еще один важный момент — это интерпретация работы ваших моделей: для этого надо иметь экспертизу в области применения и в области машинного и глубинного обучения для постановки корректной задачи.
Этот трек позволил студентам понять, как можно применять машинное обучение к задачам изучения природных явлений на примере молекул и материалов, дал возможность взглянуть на относительно новые области применения наук о данных даже в весьма консервативных областях.
Также в рамках этого трека выступил директор по прикладным исследованиям и разработкам Института искусственного интеллекта и цифровых наук, заведующий научно-учебной лабораторией методов анализа больших данных и доцент департамента больших данных и информационного поиска ФКН Денис Деркач. Он прочел лекцию «Моделирование физических процессов с помощью генеративных моделей».
Сейчас это очень популярная тема, так как становится очевидно, что симуляция берет очень большое количество компьютерных ресурсов, при этом классическое моделирование может иметь значительные отличия от реальных объектов. Естественный способ экономии ресурсов — это использование методов машинного обучения. В докладе я сравнил его с классическим моделированием и другими методами. Думаю, начинающим инфохимикам, которые участвовали в воркшопе, было полезно услышать доклад о методах ИИ.
Слушатели трека «Методы ML в науках о материалах» поделились своими впечатлениями.
София Хазбулат
Этот трек получился очень насыщенным. Я очень много узнала о применении машинного обучения в химии, и благодаря этому я смогу расширить и улучшить свою научную работу. Мне очень понравились практики, понятное оформление презентаций и подача материала. Также я получила много учебных материалов уже для самостоятельной работы и изучения, что тоже немаловажно.
Однако большая концентрация информации на курсе оказалась и минусом: очень сложно уложить в три дня сведения по всей области ИИ, а студентам сложно их усвоить. Мне кажется, что в будущем можно было бы сконцентрироваться на изучении одной из трех областей: машинного обучения, нейронных сетей или генеративных моделей, чтобы как учащимся, так и лекторам было комфортнее.
Александра Макаренко
Практические занятия мне очень понравились — было много примеров и учебных материалов, по которым можно было самому изучить тему или позаниматься уже после воркшопа. Мы разобрали самые популярные архитектуры и применение нейросетей для задач в химии. Получилось очень хорошее введение, мы увидели много готовых библиотек для упрощения работы с молекулами.