Первое место и специальная номинация от QIWI — итоги хакатона GoToHack
С 9 по 11 декабря в "Точке кипения" АСИ прошел второй хакатон GoToHack, посвященный применению технологий машинного обучения в сфере образования и HR. Студенты факультета выступили в качестве кураторов и участников мероприятия, заняли первые места и выиграли специальные призы от партнеров.
На отборочном этапе хакатона организаторы предложили попытаться предсказать поведение учащихся на онлайн-курсах, имея данные трекинга пользователей онлайн-платформы Stepik. Школьники и студенты, не достигшие 20 лет и показавшие хорошие результаты, были приглашены на очный этап мероприятия, где им предоставили для работы датасеты от компаний КРОК, МТС, Stepik, QIWI и других партнеров хакатона. По итогам “рабочих дней” каждая команда презентовала результаты перед экспертами: лучшие команды были награждены призами, в том числе участие в Летней школе по байесовским методам в глубинном обучении байесовскому подходу.
Олег Васильев, победитель хакатона, студент 1 курса образовательной программы “Прикладная математика и информатика”
Мой проект называется Q&A matching. Основная идея — подбирать ответ на вопрос, заданный естественным языком. Существует два подхода: генерировать вопрос с нуля, либо подбирать наиболее подходящий ответ из уже написанных и проверенных человеком. Второй подход позволяет всегда получать грамматически и логически верный ответ, в особенности, если вопросы относятся к узкой теме и на них уже кто-то отвечал.
Алгоритм построен с использованием методов машинного обучения. Вопросы и ответы разбиваются на слова и векторизуются при помощи Word2Vec, попадают в рекуррентную нейронную сеть, после чего при помощи triplet loss отображаются в векторное пространство высокой размерности. Когда задается новый вопрос, к нему применяется то же преобразование, после чего ищется L2-ближайший ответ.
Вся система училась на датасете вопросов от thequestion. Полученные результаты могут быть использованы для автоматизации поддержки программных продуктов и онлайн-курсов. В ближайшее время я планирую доучить нейросеть и и выложить демо.
Для меня это не первый опыт в области анализа данных. Всё началось на первом GoToHack в феврале, где мы с командой сделали проект и были отмечены специальным призом. Это мероприятие дало мощный толчок моему развитию в направлении анализа данных. В течении лета я развивал свои навыки, в том числе на совместной школе GoTo и ФКН, где со студентом третьего курса НИУ ВШЭ Иваном Толкачевым сделал проект по долгосрочному анализу цен на биржевые индексы. Наконец, в конце года я попал на GoToHack 2.
Моим куратором был Илья Якубовский, исследователь группы Байесовских методов на ФКН.
Помимо денежных призов, меня так же пригласили поучаствовать на школе по Байесовским методам в глубоком обучении, которая пройдет летом в Высшей школе экономики.
Хочу поблагодарить моего куратора Илью, Александра Панина, сотрудника компании Яндекс, за менторство и помощь в проектах, а также Алёну Ильину, директора проекта GoTo, за организацию уникальных мероприятий.
Две команды студентов факультета выиграли специальные призы от компании QIWI. Участники первой из них, команды «AlexNet», в состав которой вошли студенты 1 и 2 курса образовательной программы “Программная инженерия” Александр Кулагин, Александр Токмаков и Александр Фрицлер, решали задачу по предсказанию социально-демографических показателей человека (таких как пол и возраст) по их транзакциям в платежной системе QIWI. Другая команда – «Amise» – в составе студентов 1 курса образовательной программы «Программная инженерия» Тарасова Никиты, Гаскарова Айрата и студента 2 курса образовательной программы «Прикладная математика и информатика» Богомолова Павла представила решение задачи по определению признаков трудоустройства по платежным данным.