Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.
Адрес: 109028, г. Москва, Покровский бульвар, д. 11 корпус S кабинет S 803
Телефон: +7 (495) 531-00-00 доб. 27236
Springer, 2020.
PeerJ Computer Science. 2024. Vol. 10.
В кн.: Сборник трудов XIV Всероссийского совещания по проблемам управления ВСПУ-2024. Институт проблем управления им. В.А. Трапезникова РАН, 2024. С. 1630-1634.
В рамках проекта планируется разработать новый метод иерархического обучения с подкреплением, обладающий рядом ключевых особенностей: а) использование понятия внутреннего пространства состояний, действия агента в котором приводят к обновлению иерархии операций, б) чередование процедур абстрагирования действий и абстрагирования состояний внешней среды в процессе обучения, в) использование глубоких нейронных сетей и кортикоморфных алгоритмов по приближению функций оценок качества состояний и планов (стратегий). Новый метод, как ожидается, продемонстрирует большую эффективность в задачах высокой размерности и отложенным подкреплением от среды по сравнению с имеющимися мировыми аналогами, а также позволит эффективно реализовать перенос знаний на новые задачи из того же класса и увеличить мощность класса задач, для которых возможно применение переноса знаний.
Поздарвляем Александра Панова и желаем ему дальнейших успехов в научно-исследовательской деятельности.