Адрес: 109028, г. Москва, Покровский бульвар, д. 11 корпус S кабинет S 803
Телефон: +7 (495) 531-00-00 доб. 27236
Springer, 2020.
Искусственный интеллект и принятие решений. 2025. № 4. С. 76-92.
Микрюкова А. В., Дергачев С. А.
В кн.: XXII национальная конференция по искусственному интеллекту с международным участием (КИИ-2025). Т. 2. СПб.: Санкт-Петербургский Федеральный исследовательский центр РАН, 2025. С. 183-194.

В рамках проекта планируется разработать новый метод иерархического обучения с подкреплением, обладающий рядом ключевых особенностей: а) использование понятия внутреннего пространства состояний, действия агента в котором приводят к обновлению иерархии операций, б) чередование процедур абстрагирования действий и абстрагирования состояний внешней среды в процессе обучения, в) использование глубоких нейронных сетей и кортикоморфных алгоритмов по приближению функций оценок качества состояний и планов (стратегий). Новый метод, как ожидается, продемонстрирует большую эффективность в задачах высокой размерности и отложенным подкреплением от среды по сравнению с имеющимися мировыми аналогами, а также позволит эффективно реализовать перенос знаний на новые задачи из того же класса и увеличить мощность класса задач, для которых возможно применение переноса знаний.
Поздарвляем Александра Панова и желаем ему дальнейших успехов в научно-исследовательской деятельности.