Семинар BayesLab. Доклад Никиты Морозова: Reinforcement Learning-Based Fine-Tuning of Diffusion Models – тонкая настройка диффузионных моделей с помощью обучения с подкреплением
Учёный на основании недавно вышедшей работы расскажет о методах настройки диффузионных моделей для оптимизации функций вознаграждения с помощью методов обучения с подкреплением (reinforcement learning).
Во вторник, 5 ноября 2024 г. в 18:00, Никита Морозов, стажёр-исследователь Центра глубинного обучения и байесовских методов, выступит с докладом «Reinforcement Learning-Based Fine-Tuning of Diffusion Models – тонкая настройка диффузионных моделей с помощью обучения с подкреплением», посвящённым технологии обучения с подкреплением (reinforcement learning) для диффузионных моделей. Учёный на основании недавно вышедшей работы расскажет о методах настройки диффузионных моделей для оптимизации функций вознаграждения с помощью методов обучения с подкреплением. Выступление пройдёт в аудитории 325 корпуса S НИУ ВШЭ (Покровский бульвар, д. 11) с возможностью онлайн-участия в Zoom. Начало состоится в 18:00 по Московскому времени.
Центр глубинного обучения и байесовских методов: Стажер-исследователь