• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Семинар BayesLab. Доклад Никиты Морозова: Reinforcement Learning-Based Fine-Tuning of Diffusion Models – тонкая настройка диффузионных моделей с помощью обучения с подкреплением

16+
Мероприятие завершено

Учёный на основании недавно вышедшей работы расскажет о методах настройки диффузионных моделей для оптимизации функций вознаграждения с помощью методов обучения с подкреплением (reinforcement learning).

Во вторник, 5 ноября 2024 г. в 18:00, Никита Морозов, стажёр-исследователь Центра глубинного обучения и байесовских методов, выступит с докладом «Reinforcement Learning-Based Fine-Tuning of Diffusion Models – тонкая настройка диффузионных моделей с помощью обучения с подкреплением», посвящённым технологии обучения с подкреплением (reinforcement learning) для диффузионных моделей. Учёный на основании недавно вышедшей работы расскажет о методах настройки диффузионных моделей для оптимизации функций вознаграждения с помощью методов обучения с подкреплением. Выступление пройдёт в аудитории 325 корпуса S НИУ ВШЭ (Покровский бульвар, д. 11) с возможностью онлайн-участия в Zoom. Начало состоится в 18:00 по Московскому времени.

Ссылка на Zoom

Статья «Understanding Reinforcement Learning-Based Fine-Tuning of Diffusion Models: A Tutorial and Review»