Семинар Научно-учебной лаборатории компании Яндекс "Возможности адаптации или персонализации диффузионных моделей"
Научно-учебная лаборатория компании Яндекс: Стажер-исследователь
Дата: 18 апреля 2023 г., 14:00
Докладчик: Хороших Михаил, стажер-исследователь Научно-учебной лаборатории компании Яндекс
Аннотация: Диффузионные модели в данный момент являются самым сильным нейросетевым подходом для решения задачи генерации изображений по текстовому описанию. Можно сказать, что они породили целую новую ветвь исследований в области глубинного обучения. На данном семинаре будет рассказ о возможностях адаптации или персонализации подобных моделей, а также о нашей работе на тему их оптимизации. Основной проблемой существующих методов является их большая требовательность к вычислительным ресурсам. Это вызвано сложностью оценки качества адаптации в процессе обучения, что не позволяет вовремя остановиться. Мы разработали подход для ранней остановки, основанный на новой детерминированной функции потерь, который применим почти ко всем методам использующим градиентный спуск.
Место проведения: Zoom
Идентификатор конференции: 852 1675 7015
Код доступа: 339344