Спецсеминар группы байесовских методов "Imitation Learning from Observations"
В эту пятницу, 14 мая в 18:00, состоится очередной спецсеминар группы байесовских методов.
Выступит: Артём Цыпин ( МГУ, Samsung AI Center)
Тема: Imitation Learning from Observations
Абстракт: Во многих задачах в обучении с подкреплением ключевую роль играет проектирование функции награды. Однако, для многих задач гораздо легче предоставить демонстрации требуемого поведения. Задачу обучения агента с экспертных демонстраций, в которых не содержатся действия, решают с помощью имитационного обучения с наблюдений. В докладе будут рассмотрены методы для имитационного обучения с наблюдений, а также предложен метод, основанный на оптимизации точечной взаимной информации.
Ссылка на зум: https://zoom.us/j/99764463059