Адрес: 109028, г. Москва, Покровский бульвар, д. 11 корпус S кабинет S 803
Телефон: +7 (495) 531-00-00 доб. 27236
Springer, 2020.
Kirill Muravyev, Melekhin A., Yudin D. et al.
IEEE Robotics and Automation Letters. 2025. Vol. 10. No. 4. P. 3126-3133.
In bk.: 2021 IEEE 17th International Conference on Automation Science and Engineering (CASE). IEEE, 2024. Ch. n/a. P. 1489-1494.

В рамках проекта планируется разработать новый метод иерархического обучения с подкреплением, обладающий рядом ключевых особенностей: а) использование понятия внутреннего пространства состояний, действия агента в котором приводят к обновлению иерархии операций, б) чередование процедур абстрагирования действий и абстрагирования состояний внешней среды в процессе обучения, в) использование глубоких нейронных сетей и кортикоморфных алгоритмов по приближению функций оценок качества состояний и планов (стратегий). Новый метод, как ожидается, продемонстрирует большую эффективность в задачах высокой размерности и отложенным подкреплением от среды по сравнению с имеющимися мировыми аналогами, а также позволит эффективно реализовать перенос знаний на новые задачи из того же класса и увеличить мощность класса задач, для которых возможно применение переноса знаний.
Поздарвляем Александра Панова и желаем ему дальнейших успехов в научно-исследовательской деятельности.