Открытые заседания Ученого совета ФКН
Открытое заседание Ученого совета ФКН 09 марта 2023 года
Дата проведения: 9 марта 2023 года
Время проведения: 18:00-19:00
Место проведения: Zoom
Повестка открытого заседания:
1. Тема: Что такое Клуб Предпринимателей ФКН и какие возможности он дает.
Докладчик: Татьяна Лобок, руководитель Центра практики, проектной работы и предпринимательства ФКН НИУ ВШЭ.
Далее выступят студенты ФКН – победители стипендии «Молодой предприниматель ФКН» в номинациях «Лучшая идея предпринимательского проекта» и «Лучший предпринимательский проект».
2. Проект: Take a Place - сервис для поиска, аренды и оплаты гибких рабочих мест в России и за рубежом.
Докладчик: Вьялков Василий, бакалавр 4 курса ОП "Прикладная математика и информатика" ФКН | Победитель номинации «Проект» 2022, «Идея» 2021.
3. Проект: Dvor - мобильное приложения для геймеров, где можно узнать, во что и когда играют друзья на мобильном телефоне.
Докладчик: Завьялов Гордей, бакалавр 1 курса ОП "Прикладная математика и информатика" ФКН | Победитель номинации «Проект» 2022.
4. Проект: YouTeachMe - это полноценный инструмент современного репетитора, включающий поиск учеников, платформу для проведения интерактивных индивидуальных и мини-групповых занятий, а также личный кабинет с расписанием и учетом доходов.
Докладчик: Егоров Сергей, бакалавр 4 курса ОП "Прикладная математика и информатика" ФКН | Победитель номинации «Проект» 2022.
5. Проект: Кратко бот – бот выдает краткое содержание диалогов. После добавления в чат он анализирует то, что пишут пользователи, и выдает суммаризацию текста до 500 сообщений.
Докладчик: Червов Никита, бакалавр 1 курса ОП "Прикладная математика и информатика" ФКН | Победитель номинации «Проект» 2022.
6. Проект: UwU Novels – платформа для создания и чтения визуальных новелл. Предоставляется движок и маркетплейс для создания и распространения новелл, а также дополнительные материалы для контент-мейкеров.
Докладчик: Фёдоров Даниил, бакалавр 3 курса ОП "Программная инженерия" ФКН | Победитель номинации «Идея» 2022.
Докладчики
Лобок Татьяна Сергеевна,
руководитель центра практик, проектной работы и предпринимательствай ФКН.
Вьялков Василий,
бакалавр, 4 курс - ОП ПМИ ФКН.
бакалавр, 1 курс - ОП ПМИ ФКН.
бакалавр, 4 курс - ОП ПМИ ФКН.
бакалавр, 1 курс - ОП ПМИ ФКН.
бакалавр, 3 курс - ОП ПИ ФКН.
Данные для входа
Открытое заседание Ученого совета ФКН 26 января 2023 года / Open meeting of the Academic Council of the Faculty of Computer Science on January 26, 2023
Date: January 26, 2023
Time: 18:00-19:00
Location: Zoom
Agenda for the open meeting:
1. Title: Optimal data compression and distributed compression in polynomial time.
Speaker: Bruno Bauwens, Assistant Professor of Big Data and Information Retrieval School of Faculty of Computer Science.
Abstract: In the design of data compression algorithms, there is a trade-off between 3 objectives: compression length, compression time, and decompression time. There exists no pair of compression and decompression algorithms in which each of these 3 criteria is simultaneously optimal for each string, even in an approximate sense. We argue theoretically that there is no trade-off between compression time and compression length. In other words, they can be simultaneously optimal. We show that for each pair of compression-decompression algorithms (with any compression speed) there exists another pair of compression-decompression algorithms for which compression lengths are essentially the same, but the new compressor works in polynomial time. Disclaimer: this holds for compressors that have a target size and the decompressor might be much slower (we show that both things are unavoidable). The main technical difficulty was to invent an online matching algorithm, and this result also has applications in error-correcting codes, constant depth switching networks, and data structures for set storage.
2. Title: Online Learning in non-Euclidean spaces: Recent trends and perspectives.
Speaker: Quentin Paris, Associate Professor of School of Data Analysis and Artificial Intelligence of Faculty of Computer Science.
Abstract: Among its recent developments, the field of Learning Theory has been increasingly focusing on questions relative to non-Euclidean geometry. The talk will give a brief overview of a research direction that has been developing in recent years concerning the adaption of online learning algorithms in non-Euclidean metric spaces. The talk will illustrate the interest for this level of abstraction by discussing the case of the space of probability measures endowed with the Kantorovich W2 metric, that has been attracting increasing attention in the field of machine learning.
Speakers:
Bruno Bauwens,
Assistant Professor of Big Data and Information Retrieval School of Faculty of Computer Science HSE.
Associate Professor of School of Data Analysis and Artificial Intelligence of Faculty of Computer Science HSE.
Открытое заседание Ученого совета ФКН 17 ноября 2022 года
Дата проведения: 17 ноября 2022 года
Время проведения: 18:00-19:00
Место проведения: Zoom
Повестка открытого заседания:
1. Тема: Устойчивые тор-алгебры в топологическом анализе данных
Докладчик: Лимонченко Иван Юрьевич, кандидат физико-математических наук, заведующий международной лабораторией алгебраической топологии и ее приложений ФКН НИУ ВШЭ.
Аннотация: Межбелковые взаимодействия (PPIs) играют решающую роль практически во всех биологических процессах - от мембранного транспорта до метаболизма и иммунной системы. Эффективная характеристика PPIs на молекулярном уровне является ключом к фундаментальному пониманию механизмов PPI. Даже при наличии громадного количества моделей PPI, основанных на графах, сетях, геометрии и топологии, разработка функциональных моделей, эффективно характеризующих сложную информацию, возникающую в PPI, остается крайне трудной и важной задачей.
Недавно в работах X.Liu, H.Feng, Z.Lu и K.Xia была предложена модель устойчивой тор-алгебры (PTA) для единого алгебраического представления мультифизических взаимодействий. В ней белковые структуры и взаимодействия описываются как серии колец граней симплициальных комплексов Вьеториса-Рипса и их тор-модулей, на основе которых и строится модель PTA. В данной модели информация представляется в виде биградуированного баркода устойчивой тор-алгебры.
В докладе будет рассказано о топологических свойствах этой модели, лежащей в основе приложений торической топологии к проблеме
эффективной характеризации молекулярных структур и взаимодействий.
2. Тема: Линейные и нелинейные отображения матриц, сохраняющие вырожденность
Докладчик: Максаев Артем Максимович, старший преподаватель департамента больших данных и информационного поиска ФКН НИУ ВШЭ, научный сотрудник международной лаборатории теоретической информатики ФКН НИУ ВШЭ.
Аннотация: В 1897 году немецкий математик Георг Фробениус опубликовал работу о групповых определителях, в которой был решен вопрос, поставленный Рихардом Дедекиндом. Эта работа послужила началом теории представлений конечных групп. В качестве промежуточного результата Фробениус рассмотрел биективные линейные отображения комплексных матриц, сохраняющие определитель. Оказалось, что такие отображения могут быть явно охарактеризованы - в определенном смысле они «стандартны». Так зародилась теория линейных отображений, сохраняющих матричные инварианты, и за последние 100 лет она получила большое развитие. В частности, в 1947 году Жан Дьёдонне описал линейные биективные отображения над произвольным полем, сохраняющие вырожденность.
В докладе будут изложены дальнейшие (совсем недавние) обобщения теоремы Фробениуса, ряд смежных результатов и примеров и их связь с классификацией автоморфизмов определённых матричных графов. Доклад основан на совместных работах с А.Э. Гутерманом и В. Промысловым.
Докладчики
Лимонченко Иван Юрьевич,
заведующий международной лабораторией алгебраической топологии и ее приложений ФКН НИУ ВШЭ.
старший преподаватель департамента больших данных и информационного поиска ФКН НИУ ВШЭ.
Открытое заседание Ученого совета ФКН 29 сентября 2022 года
Дата проведения: 29 сентября 2022 года
Время проведения: 18:00-19:00
Место проведения: Zoom
Повестка открытого заседания:
1. Тема: Базы данных для больших многомерных массивов: текущие успехи и вызовы.
Докладчик: Рамон Антонио Родригес Залепинос, доцент департамента программной инженерии ФКН НИУ ВШЭ.
Аннотация: Многомерный массив является естественным представлением для многих важных типов данных, которые находят широкое применение в науке и практике. Большие многомерные массивы возникают благодаря дистанционному зондированию Земли (ДЗЗ), численному моделированию погоды и климата, биоинформатике, наблюдениям астрономических телескопов и многим другим областям.
Современный мир испытывает колоссальный рост данных, которые представляются многомерными массивами. Например, около 203 TiB/день и 80.5 PiB/год – объемы распространяемых продуктов только лишь для одного семейства спутников Sentinel. Следовательно, стремительно растущие объемы многомерных массивов постоянно требуют новых подходов для их эффективного хранения, управления и обработки. В докладе будет представлен обзор ряда достижений и перспектив совершенствования современных баз данных для многомерных массивов (Array DBMS) – активно развивающейся области исследований и разработок. По материалам VLDB и SIGMOD.
2. Тема: Парадигмы и языки программирования. Возможные варианты дальнейшего развития.
Докладчик: Александр Иванович Легалов, профессор департамента программной инженерии ФКН НИУ ВШЭ.
Аннотация: Современные языки программирования позволяют разрабатывать программы с применением различных подходов, которые поддерживаются использованием уже устоявшихся технических приемов. Вместе с тем появляются и новые идеи, изменяющие традиционные взгляды на языки и парадигмы программирования. Ряд таких идей, представляющих точку зрения автора на возможные пути развития языковых и инструментальных средств, будут представлены в докладе.
Докладчики
Открытое заседание Ученого совета ФКН 09 июня 2022 года
Дата проведения: 09 июня 2022 года
Время проведения: 18:00-19:00
Место проведения: Zoom
Повестка открытого заседания:
1. Научный доклад «Равновесия Нэша в позиционных стратегиях игр на графах с аддитивными и терминальными платежами».
Докладчик – Вялый Михаил Николаевич, доцент, профессор департамента больших данных и информационного поиска ФКН НИУ ВШЭ, ведущий научный сотрудник Международной лаборатории теоретической информатики.
Аннотация:
Одной из важных тем в теории игр является существование равновесных позиционных стратегий в играх на графах. В этом докладе будет рассказано об успехах и неудачах в решении вопроса о существовании равновесных позиционных стратегий для некоторого естественного класса игр на графах.
2. Научный доклад «Прогнозирование за горизонтом прогнозирования: хаотические ряды и прогнозирование на много шагов вперёд».
Докладчик - Громов Василий Александрович, профессор, заместитель руководителя департамента анализа данных и искусственного интеллекта ФКН НИУ ВШЭ, старший научный сотрудник Международной лаборатории интеллектуальных систем и структурного анализа.
Аннотация:
В докладе рассматривается новый подход к прогнозированию хаотических временных рядов на много шагов вперёд. Используя обобщённые z-вектора, составленные из непоследовательных наблюдений, мы получаем для каждой точки (промежуточной или той, в которой необходимо получить прогноз) достаточно большое число возможных прогнозных значений. Исследуя такое множество возможных прогнозных значений, мы получаем ответ на вопрос, возможно ли получение единого прогнозного значения на основе элементов этого множества, – если нет, то точка считается непрогнозируемой и исключается из дальнейшего рассмотрения. Концепция непрогнозируемых точек позволило получить новую формулировку задачи прогнозирования на много шагов вперёд: с одной стороны, мы хотим минимизировать число непрогнозируемых точек, с другой, - среднюю ошибку на прогнозируемых. Предлагается несколько алгоритмов идентификации непрогнозируемых точек, рассматриваются результаты для стандартных хаотических временных рядов. Здесь установлено, что доля непрогнозируемых точек растёт экспоненциально с ростом числа шагов вперёд, на которое необходимо получить прогноз, но не достигает 100%; при этом ошибка на точках, которые алгоритм, идентифицирует как прогнозируемыми, остаётся достаточно малой и близкой к постоянной. Указанное обстоятельство позволило получить прогноз на число шагов вперёд, сравнимое с горизонтом прогнозирования.
Докладчики
доцент, профессор департамента больших данных и информационного поиска ФКН НИУ ВШЭ, ведущий научный сотрудник Международной лаборатории теоретической информатики.
профессор, заместитель руководителя департамента анализа данных и искусственного интеллекта ФКН НИУ ВШЭ, старший научный сотрудник Международной лаборатории интеллектуальных систем и структурного анализа.
Открытое заседание Ученого совета ФКН 14 апреля 2022 года
Дата проведения: 14 апреля 2022 года
Время проведения: 18:00-19:00
Место проведения: R504
Повестка открытого заседания:
Тема: Тензорные разложения в глубинном обучении
Докладчик: Максим Рахуба, доцент, старший научный сотрудник Международной лаборатории теоретической информатики
Аннотация: Наряду с матрицами многомерные массивы (тензоры) являются фундаментальной структурой данных, возникающей в широком круге приложений. В частности, в глубинном обучении с помощью тензоров естественным образом представляются как сами данные, так и параметры нейронных сетей. Причем количество параметров в современных нейросетях может быть очень велико (сотни миллиардов параметров в самых больших моделях), что затрудняет их использование на устройствах с ограниченными ресурсами. В докладе пойдет речь об одном из эффективных способов уменьшения числа параметров в нейросетях – о подходе тензорных разложений. Помимо вопроса сжатия в докладе будет рассмотрен контроль константы Липшица в процессе обучения нейронных сетей, которая, в свою очередь, влияет на обобщающую способность и устойчивость к состязательным атакам. В частности, я расскажу о новом применении тензорных разложений для повышения эффективности существующих методов контроля константы Липшица сверточных слоев.
Тема: Применение генеративных моделей машинного обучения в физике частиц
Докладчик: Денис Деркач, доцент, старший научный сотрудник лаборатории LAMBDA
Аннотация: Применение методов машинного обучения стало стандартом при анализе данных в физике частиц. Эти методы применяются на всех стадиях от первичного сбора данных до финального анализа. Новый запуск Большого адронного коллайдера, запланированный на 2022 год, откроет новую страницу применения машинного обучения из-за возросшей скорости обработки данных и новых технологий, доступных для их анализа. Одной из важных проблем при этом станет наличие достаточного количества симулированных событий, необходимых для детального понимания происходящего в данных. В докладе мы опишем специфические требования к генеративных моделей для быстрой симуляции взаимодействия частиц с детектором, рассмотрим текущие разработки и подходы, а также обсудим направления и точки приложения усилий для будущего развития этого направления.
Открытое заседание Ученого совета ФКН 10 февраля 2022 года
Дата проведения: 10 февраля 2022 года
Время проведения: 18:00-19:00
Место проведения: Zoom
Повестка открытого заседания:
1. Научный доклад "Моделирование концептуального обобщения".
Докладчик - Миркин Борис Григорьевич, профессор департамента анализа данных и искусственного интеллекта, ведущий научный сотрудник Международного центра анализа и выбора решений.
Аннотация:
Речь идет о попытке моделирования фундаментальной характеристики когнитивной системы человека - способности к обобщению концепций/понятий. Другие индуктивные подходы, включая глубокое обучение, обобщают характеристики данных - мы обобщаем понятия. Для этого используется система понятий предметной области, организованная в виде таксономии, т.е. корневого дерева, узлам которого приписаны понятия так, чтобы дерево отражало отношение гипонимии/гиперонимии: А входит в Б т.и т.т. когда А - это Б, ограниченное определенным образом.
Мы даем определение наиболее специфического обобщения для нечеткого множества Ф терминальных/листовых понятий таксономии. Это обобщение поднимает множество Ф в более общее «головное понятие» в верхних уровнях дерева, которое покрывает Ф наиболее «тесным» образом, с точностью до минимального числа ошибок, «пробелов» и «выбросов». Разработаны алгоритмы оптимального подъема любого нечеткого Ф как для критерия максимальной парсимонии (экономии), так и критерия максимального правдоподобия.
Имеется определенный задел в двух прикладных направлениях:
- анализ тенденций научных исследований в предметной области путем обработки коллекции публикаций в этой области (обработка включает получение нечетких кластеров понятий таксономии, исходя из матрицы релевантности между листовыми понятиями и текстами, которая получается с использованием разработанной нами технологии суффиксных деревьев, аннотированных частотами встречаемости);
- увеличение численности аудитории таргетированной интернет-рекламы без потери ее качества.
По нашему мнению, данная конструкция также может использоваться для моделирование определенных особенностей когнитивных систем, таких как предвзятость.
(Работа ведется совместно с Др. С. Насименто (Лиссабон), Проф. Т. Феннер (Лондон), к.т.н. Д. Фроловым и Ж. Айрапетяном).
2. Научный доклад "Использование методов машинного обучения для изучения свойств и поиска новых материалов".
Докладчик - Устюжанин Андрей Евгеньевич, заведующий научно-учебной лабораторией методов анализа больших данных, доцент базовой кафедры Яндекс департамента больших данных и информационного поиска ФКН.
Аннотация:
Развитие человечества непрерывно связано с поиском и развитием новых материалов - недаром каждый новый век имеет свое название (каменный, бронзовый, железный и так далее). Сегодня, в 21 веке, сложно дать какое-то однозначное название или характеристику, хотя по некоторым данным мы находимся в веке кремния. В то же время использование различных природных материалов не всегда отличается высокой эффективностью. По большей части мы полагаемся на известные химические соединения, сформировавшиеся в окружающей среде за миллионы лет (железо, алюминий, уголь, нефть). С одной стороны, природные ресурсы быстро истощаются, с другой - потребности человечества в материалах, обладающих новыми свойствами, постоянно растут: сверхпроводники, фильтры, катализаторы, функциональные материалы. Актуальной научной задачей становится поиск таких структурных и химических соединений, которые адекватно соответствуют новым вызовам эффективности, функциональности и сохранения окружающей среды.
В своем докладе я обрисую общие контуры данного исследовательского направления - какие подходы используются для моделирования и поиска новых материалов и с какими проблемами сталкиваются исследователи. Основным фокусом рассказа будет описание роли машинного обучения в решении данных проблем. В заключении я коснусь проектов, которые ведет лаборатория методов анализа больших данных совместно с партнерами из Иннополиса и Национального Университета Сингапура.
Докладчики
профессор департамента анализа данных и искусственного интеллекта, ведущий научный сотрудник Международного центра анализа и выбора решений
заведующий научно-учебной лабораторией методов анализа больших данных, доцент базовой кафедры Яндекс департамента больших данных и информационного поиска
Открытое заседание Ученого совета ФКН 16 декабря 2021 года
Дата проведения: 16 декабря 2021 года
Время проведения: 18:00-19:00
Место проведения: Zoom
Повестка открытого заседания:
1. Научный доклад "Структурные логические и лингвистические представления текстовых данных в задачах обработки текстовой информации".
Докладчик - Кузнецов Сергей Олегович, руководитель департамента анализа данных и искусственного интеллекта, заведующий Международной лабораторией интеллектуальных систем и структурного анализа.
Аннотация:
В докладе будут рассмотрены некоторые структурные логические и лингвистические представления текстовых данных, активно развиваемые и применяемые в прикладных исследованиях международной лаборатории интеллектуальных систем и структурного анализа (МЛ ИССА). Эти представления основаны на широко известных теориях риторических и аргументационных структур, теории речевых действий и т.д. Применение (в том числе в сочетании с нейросетевыми подходами) графовых структур, которые естественным образом возникают в рамках этих теорий, позволяет получать более качественные решения в различных прикладных задачах обработки текстовых данных. К таким задачам относятся кластеризация, классификация, ранжирование в рамках информационного поиска, генерация текстов, построение диалоговых систем.
2. Научный доклад "Глубина булевых схем для функции голосования".
Докладчик - Подольский Владимир Владимирович, руководитель департамента больших данных и информационного поиска, ст. науч. сотр. Международной лаборатории теоретической информатики.
Аннотация:
Доклад посвящен сложности булевой функции голосования в модели булевых схем. Более конкретно нас будет интересовать глубина схем различного вида, вычисляющих эту функцию. Функция голосования — одна из центральных функций в теории сложности вычислений. Тем не менее, многие вопросы для нее остаются открытыми. В частности, важным вопросом является вопрос о глубине булевой схемы, не использующей отрицания и вычисляющих функцию голосования. В классических статьях в 80-х было доказано, что существует такая схема логарифмической по числу переменных глубины. Однако простой (в том числе, с практической точки зрения) схемы неизвестно. В докладе планируется обсудить некоторые варианты этой задачи и рассказать о недавних результатах в этом направлении. Доклад основан на совместных работах с Александром Куликовым и Александром Козачинским.
Докладчики
руководитель департамента анализа данных и искусственного интеллекта, заведующий Международной лаборатории интеллектуальных систем и структурного анализа
руководитель департамента больших данных и информационного поиска, ст. науч. сотр. Международной лаборатории теоретической информатики.
Открытое заседание Ученого совета ФКН 30 сентября 2021 года
Дата проведения: 30 сентября 2021 года
Время проведения: 18:00-19:00
Место проведения: Zoom
Повестка открытого заседания:
1. Научный доклад "Методы машинного обучения в функциональной геномике".
Докладчик - заведующий Международной лабораторией биоинформатики Попцова Мария Сергеевна.
Аннотация:
Геном представляет собой сложную систему взаимодействий функциональных элементов разных уровней организации - самой последовательности ДНК, мотивов, трехмерной структуры, элементов эпигенетического кода и кода вторичных структур ДНК. С помощью методов нейросетевого глубинного обучения стало возможным аггрегирование информации о функциональных элементах разных уровней клеточной организации - геномики, эпигеномики, протеомики, метаболомики - и других “омик”, с целью предсказания функциональных элементов, для которых эксперименты либо не достигли нужного качества, либо отсутствуют.
В докладе я расскажу о методах глубинного обучения, разрабатываемых в международной лаборатории биоинформатики для предсказания вторичных структур ДНК. Были разработаны модели на основе сверточных (CNN), рекуррентных (RNN), генеративно-состязательных (GAN) сетей, а также методы переноса обучения с доменной адаптацией для задач предсказания квадруплексов и Z-ДНК. Также будут представлены разрабатываемые в лаборатории подходы из области объяснительного искусственного интеллекта (XAI) для определения значимых паттернов ассоциации эпигенетического кода и кода вторичных структур ДНК.
2. Научный доклад "Расширение сетей Петри для моделирования и верификации систем с взаимодействующими агентами, параллелизмом и длительными действиями".
Докладчик - заведующий Научно-учебной лабораторией процессно-ориентированных информационных систем (ПОИС) Ломазова Ирина Александровна.
Аннотация:
Сети Петри – популярный формализм для моделирования и анализа параллельных и распределенных систем. В докладе будет рассказано о расширении сетей Петри для моделирования сложных систем, состоящих из взаимодействующих агентов. В этой системе агент представляется сетью Петри высокого уровня с временны́ми условиями для переходов, определяющими интервалы и длительность срабатывания переходов.
Будет показано, что для таких моделей можно строить граф достижимости и использовать его для проверки поведенческих свойств системы, таких как отсутствие тупиков, живость и др., а также получать оценки для временны́х характеристик системы.
Докладчики
Международная лаборатория биоинформатики: Заведующий лабораторией
Научно-учебная лаборатория процессно-ориентированных информационных систем (ПОИС): Заведующий лабораторией
Открытое заседание Ученого Совета ФКН 24 июня 2021 года
Дата проведения: 24 июня 2021 года
Время проведения: 18:00-19:00
Место проведения: Zoom
Повестка открытого заседания:
1. Научный доклад заведующего Центром глубинного обучения и байесовских методов Дмитрия Петровича Ветрова.
Тема доклада: "Необычные свойства рельефа функции потерь в глубинном обучении".
Аннотация:
В докладе мы рассмотрим несколько необычных эффектов, возникающих при обучении современных нейронных сетей и свидетельствующих о том, что рельеф оптимизируемой функции обладает рядом необычных свойств. Также мы обсудим динамику процесса обучения нейросетей и влияние, которое оказывают на нее L2-регуляризация и батч-нормализация весов. В частности, будет показано регуляризация и нормализация весов совместно приводят к стабилизации процесса обучения и делают нейросеть слабозависящей от выбора конкретных гиперпараметров.
2. Научный доклад заведующего Международной лабораторией стохастических алгоритмов и анализа многомерных данных
Наумова Алексея Александровича.
Тема доклада:"Model-Free Approach to Evaluate Reinforcement Learning Algorithms".
Аннотация:
Policy evaluation is an important instrument for the comparison of different algorithms in Reinforcement Learning (RL). Yet even a precise knowledge of the value function V^{\pi} corresponding to a policy \pi does not provide reliable information on how far is the policy \pi from the optimal one. We present a novel model-free upper value iteration procedure (UVIP) that allows us to estimate the suboptimality gap V^{\star}- V^{\pi} from above and to construct confidence intervals for V^\star. Our approach relies on upper bounds to the solution of the Bellman optimality equation via martingale approach. We provide theoretical guarantees for UVIP under general assumptions and illustrate its performance on a number of benchmark RL problems. The talk is based on the join work https://arxiv.org/abs/2105.02135 with Denis Belomestny, Ilya Levin, Eric Moulines, Sergey Samsonov and Veronika Zorina.
Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.