Бутстреп и статистический вывод в задачах оффлайн обучения с подкреплением
Выполнил: Бутырин Богдан Георгиевич
Стохастические методы аппроксимации являются центральным компонентом для решения различных задач оптимизации, возникающих в машинном обучении, эмпирической минимизации риска и обучении с подкреплением. В литературе существует множество работ, охватывающих как асимптотические, так и неасимптотические свойства оценок.
Руководитель проекта
Базовая кафедра Института проблем передачи информации им. А.А. Харкевича РАН: Старший преподаватель
Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.
