Статья сотрудников Bayes Lab и HDI Lab принята на конференцию ICLR-2025
Статья Тимофея Грицаева и Никиты Морозова, написанная в соавторстве с сотрудниками HDI Lab Сергеем Самсоновым и Даниилом Тяпкиным, принята в программу конференции ICLR, одной из ведущих в области машинного обучения и искусственного интеллекта.
Статья «Optimizing Backward Policies in GFlowNets via Trajectory Likelihood Maximization», написанная учёными Центра глубинного обучения и байесовсих методов: Тимофеем Грицаевым и Никитой Морозовым в соавторстве с сотрудниками HDI Lab – Сергеем Самсоновым и Даниилом Тяпкиным, принята в программу 13-й Международной конференции по обучению представлениям (ICLR).
По результатам исследования был разработан алгоритм оптимизации обратной политики в моделях GFlowNets, основанный на максимизации праводопобия траекторий, а также экспериментально продемонстрирована его улучшенная сходимость и поиск мод распределения в различных задачах. Помимо этого, был расширен известный теоретический результат об эквивалентности GFlowNets и обучения с подкреплением: в статье показывается, что обучаемая обратная политика приводит к задаче обучения с подкреплением с нестационарной функцией вознаграждения, которая может быть эффективна решена предложенным алгоритмом. Работа выполнена с использованием высокопроизводительного вычислительного кластера «cHARISMa» НИУ ВШЭ.
International Conference on Learning Representations (ICLR) – престижная международная конференция в области машинного обучения и искусственного интеллекта, проводящаяся на ежегодной основе с 2013 г. Нынешняя, 13-я по счёту, конференция ICLR будет проходить с 24 по 28 апреля в г. Сингапуре. Статьи, опубликованные в рамках ICLR, имеют рейтинг A*.