В Центре ИИ изучаются передовые подходы к созданию автономных интеллектуальных агентов и многоагентных систем, способных решать сложные практические задачи.Исследования сосредоточены на разработке агентов, наделенных способностью самостоятельно формулировать и достигать цели, накапливать знания и эффективно использовать внешние инструменты и устройства. Также активно развиваются технологии многоагентных систем, позволяющих различным агентам взаимодействовать друг с другом, конкурируя, сотрудничая и совершенствуясь посредством эволюции.
Анализ сложности моделей глубокого обучения и исследование алгоритмов линейной алгебры, статистики и оптимизации, играющих ключевую роль в процессе их создания
Задачи
-
Разработка новых методов построения доверительных интервалов в задаче автономного обучения с подкреплением, в частности, для методов с использованием временных разностей
-
Применение разработанных методов для оффлайн оценки алгоритмов в домене рекомендательных систем
-
Использование методов энтропийного обучения с подкреплением для повышения разнообразия генерируемых цепочек рассуждений в задачах математического домена
Моделирование времянезависимых и зависимых процессов и построение их суррогатов с помощью методов искусственного интеллекта
Масштабируемые контекстуальные бандиты и алгоритмы RL для задачи персонализированных предложений
Задачи
-
Разработка алгоритмов управления рекомендациями в задаче обучения с подкреплением, а также контекстуальных бандитов: методы масштабируемых контекстуальных бандитов на основе замены меры для больших пространств действий и методы автономной (offline) оценки алгоритмов обучения с подкреплением с использованием алгоритма Fitted Q-evaluation в подстановке дисконтированных и усредненных марковских процессов принятия решений (Markov Decision Process, MDP)
Разработка инновационного программного решения с мультиагентной архитектурой на основе адаптированной LLM
Задачи
-
Разработка целевых агентов для сферы науки, технологий и инноваций (например, для информационного поиска актуальных данных в предметных областях, анализа, метаанализа или синтеза данных), стратегии коммуникации между агентами, методов обработки ошибок и разрешения конфликтов при взаимодействии агентов, прототипа программного решения на основе адаптированной LLM, разработанных целевых агентов и открытых программных модулей