Семинар HDI&TFAIM Lab "Inverse Entropy-regularized RL"
Мероприятие завершено
12 сентября в 14:40 с докладом выступит Денис Беломестный (Duisburg-Essen University, НИУ ВШЭ), семинар будет проходить в аудитории R409.
In this talk we consider entropy regularised RL and aim to solve the inverse statistical problem of recovering the rewards from a sample from the expert based on the optimal policy. We propose an estimator and study its convergence.
По всем вопросам обращайтесь к Зеленовой Карине Михайловне kzelenova@hse.ru или к Горнеостаевой Екатерине Дмитриевне egornostaeva@hse.ru
Дата
12 сентября, 2025 г. 14:40
Адрес
Покровский бульвар, д. 11, корп. R
В статье упомянуты