Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.

  • A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Семинар Научно-учебной лаборатории компании Яндекс "TabGraphs: new benchmark and insights for learning on graphs with tabular features"

Мероприятие завершено
Баженов Глеб Владимирович,
Научно-учебная лаборатория компании Яндекс: Стажер-исследователь

Дата: 22 ноября 2023 г., 15:00

Докладчик: Баженов Глеб, стажер-исследователь Научно-учебной лаборатории компании Яндекс

Аннотация: Область машинного обучения на табличных данных представляет большой интерес для научных исследований и индустриальных приложений. Наблюдения в таком типе данных принято рассматривать как независимые величины, но довольно часто может быть доступна и дополнительная информация о взаимосвязях между этими наблюдениями, использование которой может повысить качество предсказания в различных задачах. Поскольку такую информацию можно естественным образом моделировать в виде графа, область машинного обучения на табличных данных может заимствовать методы из машинного обучения на графах. Однако графовые модели часто оцениваются на наборах данных с однородными признаками (word embeddings, bag-of-words representations, etc.), которые имеют мало общего с неоднородной смесью числовых и категориальных признаков, свойственных для табличных данных. Такая критическая разница между типами данных, используемыми в соответствующих областях, не позволяет понять, насколько успешно графовые методы могут быть перенесены на табличные данные, когда в них известны связи между наблюдениями. На семинаре мы расскажем про нашу работу, в которой мы стараемся решить эту проблему и предлагаем новый графовый бенчмарк из разнообразных наборов данных с неоднородными табличными признаками в вершинах и реалистичными задачами предсказания. В частности, мы укажем на главные идеи и советы по работе с таким типом данных на основе результатов, которых нам удалось достичь на предложенном бенчмарке путем скрещивания моделей машинного обучения на графах и некоторых приемов из глубокого обучения на табличных данных.

Место проведения: Zoom 

Идентификатор конференции: 853 8594 6666
Код доступа: 203238