Выпускники рассказывают: Никита Чуркин
Почему ты решил поступать в магистратуру “Финансовые технологии и анализ данных”?
На момент поступления в магистратуру ФТиАД я уже окончил бакалавриат по специальности “Математические методы в экономике” в РЭУ и магистратуру по математике в МГУ. Ранее я имел шанс поступить в Вышку на магистерскую программу “Науки о данных”, но тогда очень долго выбирал между магистратурами Вышки и МГУ. В итоге, я остановил свой выбор на МГУ, так как хотел получить больше фундаментальной математической подготовки, а машинное обучение я решил изучать самостоятельно. В то же время я подумал, что можно будет вернуться в ВШЭ позже, чтобы прослушать курсы по ML-направлениям, поступив в магистратуру.
В МГУ моей специальностью была алгебра, я ходил на спецкурсы по машинному обучению, но в основном в Университете сконцентрировался на изучении, так называемой, «абстрактной» математики. Машинное обучение я, по большей части, осваивал самостоятельно: читал книги (например, Murphy, Goodfellow) и статьи, решал конкурсы по ML.
После окончания первой магистратуры я подумал, что было бы неплохо поучиться в ВШЭ по специальности, связанной с машинным обучением, систематизировать и углубить свои знания. Тогда как раз был первый набор магистратуры “Финансовые технологии и анализ данных”. Она показалась мне идеальным выбором, потому что в программе были все интересующие меня на тот момент предметы: глубинное обучение, NLP, Управление проектами в DS, – и при этом на 100% оплачивалась Сбербанком.
Что было самым запоминающимся во время учебы?
Наверное, курс по глубинному обучению. Особенно мне понравились семинары, которые вел Алексей Озерин. Также запомнилась поездка в корпоративный университет Сбербанка и командная игра (кейс).
О чем была твоя дипломная работа?
Я разрабатывал подход к автоматическому созданию интерпретируемых моделей ML.
Для большой части моделей, например, банковских, обычные подходы AutoML часто не подходят: нужны несложные алгоритмы (логистические регрессии, деревья), интерпретируемые признаки, специальная предобработка (например, WOE-биннинг) и калибровка. Мейнстримовые AutoML решения в среднем не рассчитаны на модели такого класса.
Ты занимался еще чем-нибудь помимо учебы?
Я активно участвовал и продолжаю участвовать в конкурсах по машинному обучению и хакатонах. Уже удалось накопить хороший призовой фонд. Конкурсы – один из лучших способов научиться применять знания на практике. Кроме самой известной площадки Kaggle есть множество других, поэтому число активных соревнований на данный момент составляет десятки: можно учиться практически любому инструментарию не выходя из дома. Недавно я с коллегой прочитал мини-курс в Вышке как раз посвященный соревнованиям и полезным навыкам, которые можно извлечь из участия в них.
Чем ты сейчас занимаешься?
Я работаю DataScientist’ом в Управлении валидации Сбербанка. Мои задачи не совсем обычные для специалиста по DS: основной обязанностью является анализ уже существующих моделей в Сбербанке с целью проверки качества этих моделей, возможности их улучшения, нахождения зон риска моделей и других “подводных камней”. В каком-то мере, это можно назвать консультированием владельцев и разработчиков моделей. В Сбербанке можно встретить модели почти для любой бизнес задачи: к нам в работу приходят практически все модели Банка, поэтому мы, в некотором смысле, аккумулируем знания обо всех задачах, решаемых в Банке с помощью ML.
В нашей работе анализируется как подход к решаемой задаче (соответствует ли разработанная модель решению поставленной бизнес-проблемы), так и “технические” аспекты (есть ли существенные ошибки при моделировании, в сборе выборок и т.д.). Мы пытаемся найти пространство для качественного улучшения моделей.
При этом в моделях по Банку используется практически весь современный инструментарий ML: от логистических регрессий с WOE-биннингом и бустингов на TFiDF-мере до GraphCNN и BERT’ов. Поэтому приходится постоянно быть в курсе текущих решений различных ML-проблем, много учиться, улучшать, а возможно и пересматривать свои подходы к моделированию.
Почему, как тебе кажется, интересно работать в сфере финансовых технологий?
Машинное обучение еще не полностью проникло в область финансов, и очень интересно наблюдать за этой эволюцией. Например, кажется, что используемые в банках алгоритмы постепенно усложняются: логистические регрессии и простые деревья постепенно уступают место градиентным бустингам, а также моделям из DL в большом ряде задач.
Что может сделать студент уже сейчас в университете, чтобы построить успешную карьеру после выпуска?
Важно подходить творчески к заданиям и иметь проактивную позицию. Это не только поможет вам лучше прокачать свои навыки и получить больше знаний, но и даст соответствующую репутацию в глазах преподавателей, студентов и потенциальных работодателей.
Озерин Алексей Юрьевич
Департамент больших данных и информационного поиска: Приглашенный преподаватель