• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Студенты магистерской программы "Финансовые технологии и анализ данных" заняли 2-е место на международном хакатоне

Студенты магистерской программы "Финансовые технологии и анализ данных" заняли 2-е место на международном хакатоне

Студенты магистерской программы "Финансовые технологии и анализ данных" Никита Чуркин и Дмитрий Симаков заняли 2-е место на большом международном хакатоне WNS Analytics Wizard 2018, проходившем 14-16 сентября. Конкурс проводился на индийской площадке Analytics Vidhuya (аналог американского Kaggle).

Это самая крупная площадка в Индии среди конкурсов в Data Science. От участников требовалось решить задачу бинарной классификации — спрогнозировать, получит ли сотрудник повышение или нет в зависимости от его характеристик, например, опыта работы и отдела, где он работает.

На хакатоне соревновались мастера Kaggle, несколько представителей России, аналитики и Data Scientists из Индии. Всего 3846 участников, из которых 1300 отправили своё решение на проверку.

Самым сложным для ребят стало придумать, как из 13 признаков получить максимум информации. В итоге на их основе было получено более 4.5 тысяч признаков, что поставило ещё более сложную задачу: как грамотно и в разумные сроки отобрать из этих признаков самые полезные.

Главное отличие WNS Analytics Wizard 2018 от Kaggle, который проводится на протяжении 2-3 месяцев, — его непродолжительность. У Никиты и Дмитрия были частично готовы функции для отбора переменных и быстрой валидации, которые были написаны в процессе работы в Сбербанке и при участии в других соревнованиях по анализу данных. Без них было бы сложнее проделать весь объем работ, который вошёл в финальное решение, за такой короткий срок.

Площадка Analytics Vidhuya предлагает участникам нестандартные задачи. На WNS Analytics Wizard 2018 метрикой качества был F1 Score, для которого нужно было отдельно подобрать cutoff, что является сложной задачей в условиях несбалансированности классов и сильном отличии данных для обучения от данных для тестирования.

Призом стало 100 000 рупий (~100 000 рублей).