Семинар HDI&TFAIM Lab "Inverse Entropy-regularized RL"

12 сентября в 14:40 с докладом выступит Денис Беломестный (Duisburg-Essen University, НИУ ВШЭ), семинар будет проходить в аудитории R409.

In this talk we consider entropy regularised RL and aim to solve the inverse statistical problem of recovering the rewards from a sample from the expert based on the optimal policy. We propose an estimator and study its convergence.

По всем вопросам обращайтесь к Зеленовой Карине Михайловне kzelenova@hse.ru или к Горнеостаевой Екатерине Дмитриевне egornostaeva@hse.ru

Добавить в календарь

Дата

12 сентября 14:40

Адрес

Покровский бульвар, д. 11, корп. R

В статье упомянуты

Лаборатория теоретических основ моделей искусственного интеллекта