• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Выпускники рассказывают: Никита Чуркин

Никита Чуркин окончил магистерскую программу “Финансовые технологии и анализ данных” в 2019 году. Сейчас выпускник ФТиАД работает DataScientist’ом в Управлении валидации Сбербанка. В этом учебном году Никита вместе со своим коллегой прочитал на ФКН мини-курс “Практическое машинное обучение и соревнования по анализу данных”. Об учебе на ФКН и о том, как сложилась его карьера после выпуска, Никита расскажет в своем интервью.

Выпускники рассказывают: Никита Чуркин

Почему ты решил поступать в магистратуру “Финансовые технологии и анализ данных”?

На момент поступления в магистратуру ФТиАД я уже окончил бакалавриат по специальности Математические методы в экономике в РЭУ и магистратуру по математике в МГУ. Ранее я имел шанс поступить в Вышку на магистерскую программу “Науки о данных”, но тогда очень долго выбирал между магистратурами Вышки и МГУ. В итоге, я остановил свой выбор на МГУ, так как хотел получить больше фундаментальной математической подготовки, а машинное обучение я решил изучать самостоятельно. В то же время я подумал, что можно будет вернуться в ВШЭ позже, чтобы прослушать курсы по ML-направлениям, поступив в магистратуру. 

В МГУ моей специальностью была алгебра, я ходил на спецкурсы по машинному обучению, но в основном в Университете сконцентрировался на изучении, так называемой, «абстрактной» математики. Машинное обучение я, по большей части, осваивал самостоятельно: читал книги (например, Murphy, Goodfellow) и статьи, решал конкурсы по ML.

После окончания первой магистратуры я подумал, что было бы неплохо поучиться в ВШЭ по специальности, связанной с машинным обучением, систематизировать и углубить свои знания. Тогда как раз был первый набор магистратуры “Финансовые технологии и анализ данных”. Она показалась мне идеальным выбором, потому что в программе были все интересующие меня на тот момент предметы: глубинное обучение, NLP,  Управление проектами в DS, – и при этом на 100% оплачивалась Сбербанком.

Что было самым запоминающимся во время учебы?
 

Наверное, курс по глубинному обучению. Особенно мне понравились семинары, которые вел Алексей Озерин. Также запомнилась поездка в корпоративный университет Сбербанка и командная игра (кейс).
 
О чем была твоя дипломная работа?

Я разрабатывал подход к автоматическому созданию интерпретируемых моделей ML.
Для большой части моделей, например, банковских, обычные подходы AutoML часто не подходят: нужны несложные алгоритмы (логистические регрессии, деревья), интерпретируемые признаки, специальная предобработка (например, WOE-биннинг) и калибровка. Мейнстримовые AutoML решения в среднем не рассчитаны на модели такого класса.


Ты занимался еще чем-нибудь помимо учебы?
 

Я активно участвовал и продолжаю участвовать в конкурсах по машинному обучению и хакатонах. Уже удалось накопить хороший призовой фонд. Конкурсы – один из лучших способов научиться применять знания на практике. Кроме самой известной площадки Kaggle есть множество других, поэтому число активных соревнований на данный момент составляет десятки: можно учиться практически любому инструментарию не выходя из дома. Недавно я с коллегой прочитал мини-курс в Вышке как раз посвященный соревнованиям и полезным навыкам, которые можно извлечь из участия в них.

Чем ты сейчас занимаешься?

Я работаю DataScientist’ом в Управлении валидации Сбербанка. Мои задачи не совсем обычные для специалиста по DS: основной обязанностью является анализ уже существующих моделей в Сбербанке с целью проверки качества этих моделей, возможности их улучшения, нахождения зон риска моделей и других подводных камней. В каком-то мере, это можно назвать консультированием владельцев и разработчиков моделей. В Сбербанке можно встретить модели почти для любой бизнес задачи: к нам в работу приходят практически все модели Банка, поэтому мы, в некотором смысле, аккумулируем знания обо всех задачах, решаемых в Банке с помощью ML.

В нашей работе анализируется как подход к решаемой задаче (соответствует ли разработанная модель решению поставленной бизнес-проблемы), так и технические аспекты (есть ли существенные ошибки при моделировании, в сборе выборок и т.д.). Мы пытаемся найти пространство для качественного улучшения моделей. 

При этом в моделях по Банку используется практически весь современный инструментарий ML: от логистических регрессий с WOE-биннингом и бустингов на TFiDF-мере до GraphCNN и BERT’ов. Поэтому приходится постоянно быть в курсе текущих решений различных ML-проблем, много учиться, улучшать, а возможно и пересматривать свои подходы к моделированию.


Почему, как тебе кажется, интересно работать в сфере финансовых технологий?

Машинное обучение еще не полностью проникло в область финансов, и очень интересно наблюдать за этой эволюцией. Например, кажется, что используемые в банках алгоритмы постепенно усложняются: логистические регрессии и простые деревья постепенно уступают место градиентным бустингам, а также моделям из DL в большом ряде задач.


Что может сделать студент уже сейчас в университете, чтобы построить успешную карьеру после выпуска?   

Важно подходить творчески к заданиям и иметь проактивную позицию. Это не только поможет вам лучше прокачать свои навыки и получить больше знаний, но и даст соответствующую репутацию в глазах преподавателей, студентов и потенциальных работодателей.