• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

«Кто-то же должен двигать науку и индустрию вперед»: как сотрудничество ФКН и ШАД создало новое поколение молодых исследователей и преподавателей

В этом году Школе анализа данных (ШАД) Яндекса исполняется 18 лет. За это время через нее прошли тысячи студентов — многие из них сегодня работают в ведущих ИТ-компаниях, занимаются наукой или развивают собственные проекты. В 2014 году факультет компьютерных наук НИУ ВШЭ был основан с учетом опыта Школы анализа данных Яндекса, и с самого начала тесно сотрудничал с ней. В 2022 году взаимодействие расширилось и была открыта отдельная совместная с Яндексом магистерская программа «Современные компьютерные науки», студенты которой проходят обучение и на ФКН, и в ШАДе, а выпускники получают два диплома. Магистратура связывает академическую глубину с индустриальными задачами и позволяет студентам формировать индивидуальные траектории с учётом их интересов. Помимо преподавателей ФКН и ШАДа в образовательном процессе принимают участие сотрудники международной лаборатории теоретической информатики, базовой кафедры Яндекс, НУЛ компании Яндекс и Yandex Research.  Мы поговорили со студентами и выпускниками ФКН и ШАДа разных лет о том, как обучение повлияло на их карьеру, чему они научились за эти годы и что во время обучения оказалось самым ценным.

Наумов Антон
Выпускник магистерской программы «Науки о данных (Data Science)», специализация совместно с ШАД, 2022 года. Руководитель направления мультимодальных моделей GigaChat Сбера: GigaVision в команда GigaVision.

Что входит в твои основные обязанности на работе?

Все мои обязанности можно разделить на две части: как руководителя и как IC-шника (Individual Contributor). В целом на мне лежит задача технического руководства командой GigaVision, соответственно, я отвечаю за то, чтобы GigaChat умел работать с мультимодальными данными. В первую очередь с картинками, но также с документами и видео. Как руководитель я занимаюсь распределением задач, планированием, приоритезацией, несу личную ответственность за качество продукта. Как IC-шник я осуществляю полный стек работы с нейросетками: работа с данными, изучение статей, постановка экспериментов, работа с кодом, продовые обучения.

Почему ты выбрал именно специализацию ШАДа на магистратуре ФКН «Науки о данных (Data Science)»?

Я окончил бакалавриат «Прикладная математика и информатика» ФКН ВШЭ, благодаря чему уже имел достаточно высокий уровень знаний в сфере и был четко нацелен на продолжение обучения и развития. Слышал много хорошего про ШАД, и хотел туда поступить, но базовая программа ШАДа для меня означала бы большое число повторений материалов за счет обязательных курсов. А в год моего выпуска из бакалавриата как раз появилась совместная специализация на магистратуре ФКН «Науки о данных», в рамках которой можно было учиться и на ШАД. Я собирался пойти в магистратуру так или иначе, изучал варианты как в России, так и за рубежом. Вычитывал программы разных магистратур по миру, но все сходилось к тому, что именно на ФКН были наиболее сильные и интересные курсы. Более того, на продвинутом треке магистратуры можно было обойтись полностью без обязательных курсов, что было для меня идеально. Дальше оставалось только поступить, к чему я серьезно подготовился и поступил с первого раза.

Что можешь сказать о времени обучения?

Время обучения в магистратуре для меня было особенным. Учиться было сложно, но интересно. В середине первого курса случилось три вещи:

— я вышел на работу в Яндекс в сильную команду, которая впоследствии выпустит YandexGPT;

— я стал сначала ассистентом, а позже преподавателем на курсе ML2;

— я съехался с девушкой, которая впоследствии стала моей женой.

Очень много всего одновременно, было действительно сложно, много бессонных ночей, работы на выходных и в целом перегрузки, но искренне считаю, что оно того стоило. Также благодаря ШАД и за время обучения я познакомился с большим числом интересных людей, многие из которых позже становились моими друзьями и коллегами.

Почему решил преподавать в ШАДе?

Мне еще со школы неоднократно говорили, что я хорошо объясняю материал. Звали преподавать в школу и в университет. Мне нравилось преподавать, но как-то все время не складывалось: не было конкретной цели или идеи. А затем, уже когда я учился первый год в магистратуре, была опция помочь в проведении курса: мне было давно интересно попробовать, и я решил подключиться сначала как ассистент, а чуть позже как семинарист и лектор. У меня было много идей, как можно улучшить курс, и я их активно продвигал, а также студентам и другим сотрудникам ШАДа понравилось, как я веду занятия. Со временем мне давали больше ответственности, занятий, в целом свободу в определении того, что и как я рассказываю. Пять лет спустя я, по большому счету, руковожу курсом ML2 и участвую в проведении ML1. В будущем, если позволит время, возможно, присоединюсь к другим курсам.

Насколько тебе помогают в работе те знания, которые ты получил за время обучения?

Очень многие вещи, которые я использую в работе на ежедневной основе, я почерпнул именно за время обучения и преподавания в ШАДе. Ну и в целом я бы сказал, что ШАД дал мне и очень сильную базу, и широкий кругозор в программировании, ML и нейросетях. Что ты можешь посоветовать нынешним абитуриентам, которые закончили бакалавриат и хотят продолжать свое обучение? ШАД — это не просто, но однозначно того стоит. Здесь можно получить как знания, так и знакомства в профессиональном комьюнити, можно найти новых друзей. Поступить в ШАД сложно, но самое главное старайтесь, готовьтесь и еще раз готовьтесь, верьте в себя. Старания всегда окупаются, а вера в себя не даст отступить, если сразу не получится. Для меня ШАД был незаменимым опытом, который я искренне желаю получить каждому из вас.

Что пожелаешь ШАДу в день его совершеннолетия?

— Расти и расширяться, приходить в новые вузы, регионы и, может быть, даже страны.

— Как и всегда, не отставать и даже опережать тренды науки и международных продуктов.

— Привлекать самых сильных и талантливых студентов и специалистов в свою большую команду.

Рубачёв Иван
Выпускник магистерской программы «Науки о данных (Data Science)», специализация совместно с ШАД, 2022 года. ML-исследователь в Yandex Research, аспирант и младший научный сотрудник научно-учебной лаборатории компании Яндекс ФКН НИУ ВШЭ

Где и кем ты работаешь?

Я работаю ML-исследователем в Yandex Research, занимаюсь развитием deep learning методов для табличных данных. Моя задача, если брать максимально широко, — улучшать распространенность и качество методов глубинного обучения для табличных данных. Придумывать методы, создавать бенчмарки, писать статьи, участвовать в мировом научном комьюнити и продвигать его вперед.

Почему именно совместная магистратура? Почему ты выбрал именно специализацию ШАДа на магистратуре ФКН «Науки о данных (Data Science)»?

Пошел в магистратуру «Науки о данных (Data Science)», потому что примерно в то время, когда я выбирал магистратуру и то, куда мне идти, я узнал про ML Residency — программу научного руководства сотрудниками Yandex Research, которая взращивает ML-исследователей. И тогда в й магистратуре ФКН был научный трек от Яндекса, на который я и пошел, в надежде на то, что фулл-тайм буду погружаться в науку, при этом буду проходить релевантные курсы, которые дополнят то, что у меня и так было после окончания бакалавриата ПМИ ФКН.

Что можешь сказать о времени обучения?

Во время обучения, наверное, самое главное для меня было обучение тому, как быть ученым. Из курсов запомнились не самые типичные: полусеместровый спецкурс от NVIDIA по CUDA, курс по теории глубинного обучения, который до сих пор вспоминаю из-за каких-то релевантных тем в работе, и курс по лингвистике.

Расскажи, почему ты решил преподавать?

Потому что в тот момент, когда я шел в магистратуру, мне все время хотелось оставаться в университетской среде. С этим был, отчасти, связан выбор пойти в науку. А еще в какой-то выходной в офисе сидел коллега из research, проверял какие-то домашки по deep learning курсу. И мы как-то разговорились про эту преподавательскую активность, в том же разговоре я и стал семинаристом. И с тех пор каждый год что-то преподаю, участвую в создании ML/DL курсов.

Насколько тебе помогают в работе те знания, которые ты получил за время обучения?

Полученные знания я использую постоянно. Даже до сих пор иногда хочется послушать какие-то новые курсы ШАДа, потому что это относится к каким-то релевантным рабочим проектам, новым статьям.

Что ты можешь посоветовать нынешним абитуриентам, которые закончили бакалавриат и хотят продолжать свое обучение в магистратуре?

Не бояться делать то, что они хотят. Искать то, что ты хочешь делать, а не идти по какому-то проторенному общему пути. Для меня решение пойти на совместный научный трек, уйти из «прода» в Яндексе в ML-residency было нетипичным, но я последовал за своими чувствами и не ошибся.

Что пожелаешь ШАДу в день его совершеннолетия?

Адаптироваться к быстро меняющемуся миру, принимать его изменения, развиваться и не останавливаться.

Березовский Валерий
Студент совместной с Яндексом магистратуры «Современные компьютерные науки». Тимлид команды пайплайнов для подготовки Pretrain датасета GigaChat Сбера.

Кем именно ты работаешь и что ты делаешь?

Я работаю в команде, полностью отвечающей за подготовку pretrain датасета для обучения GigaChat. Обрабатываем тексты из интернета, статьи, генерируем синтетические задачи по математике и программированию, ищем высококачественные источники данных и улучшаем их обработку. Я тимлид команды из пяти человек, которая строит различные технические пайплайны для подготовки данных, инфраструктуру для генерации синтетических данных, замера метрик, экспериментов для валидации наших гипотез. Работаю почти два года. В бакалавриате учился на ПМИ ФКН, в магистратуру пошел на этот же факультет, на СКН.

Какие магистратуры ты рассматривал для поступления? В чем преимущество СКН?

Рассматривал преимущественно магистратуры ФКН, потому что очень нравится атмосфера ВШЭ и конкретно нашего факультета. Преимущество СКН — в интеграции с ШАД, свободе выбора курсов, высококонкурентном окружении. Помогают в работе мне курсы ФКН И ШАД по машинному и глубинному обучению, обработке текстов, компьютерному зрению. Но больше всего помогает умение быстро разбираться в чем-то новом, полученное во время учебы.

Что можешь посоветовать студентам?

Студентам хочу посоветовать терпения, упорства в учебе, а также никогда не стесняться задавать вопросы.

Что пожелаешь ШАДу в день его совершеннолетия?

ШАД поздравляю с 18-летием, очень благодарен всем его организаторам, преподавателям, менеджерам за великолепное качество образования и крутое окружение. Желаю как можно больше классных и мотивированных студентов!

Дискин Михаил
Выпускник совместной с Яндексом магистратуры «Современные компьютерные науки» 2024 года. Техлид команды CoreLLM в Wildberries.

Где и кем ты работаешь?

Работаю в Wildberries, в трудовой книжке написано «ведущий инженер машинного обучения». Фактически, думаю, меня можно назвать техлидом. Хотя я не очень классический техлид, пожалуй: одновременно консультирую коллег, делаю что-то руками, планирую стратегические вещи, нанимаю людей и создаю некоторый технопиар компании. Много кто скажет, что я «ничего не делаю», что уж. Зато разнообразно. Команда официально называется CoreLLM. Название, конечно, обязывает, но реальность сложнее: не все технологии оказываются достаточно «Core», чтобы оправдать первую часть, и не все модели достаточно Large, чтобы претендовать на вторую. Но понтово, да. В работе много болтаю языком в разных контекстах и делаю так, чтобы все как-то работало. Иногда оказывается, что проще взять и сделать самому, чем долго договариваться с коллегами или подчиненными. Если конкретнее — отвечаю за выбор архитектур, настройку пайплайнов обучения и инференса, оптимизацию latency и разработку инфраструктуры. Плюс research-направления — нужно же понимать, что происходит в мире ML дальше, чем на два спринта вперед.

Почему именно магистратура ФКН и Яндекса?

Я «сосуществую» с ШАДом уже довольно давно — начал преподавать еще до поступления в магистратуру. Главная мотивация — я точно знал, что не будет заведомо бессмысленных курсов. Ну и еще это хороший стимул наконец-то пройти те курсы, которые давно откладывал. Что можешь сказать о времени обучения? Совмещать работу, учебу и преподавание было интересным экспериментом над собственным тайм-менеджментом. Спойлер: оказалось, что в сутках все еще 24 часа, как ни крути. Но когда все три активности друг друга дополняют, получается довольно органично. Главное — научиться переключаться между контекстами и не путать, где ты сейчас: на работе, на паре или ведешь семинар.

Что ты преподаешь в ШАДе? Почему решил преподавать? Что думаешь о нынешних студентах?

Мой основной курс — это научный семинар для совместных магистратур (на СКН это называется «Семинар наставника „Искусственный интеллект“»). Это довольно читерский способ быть преподавателем: я тихо сижу, а студенты пересказывают мне интересные новые статьи. Win-win ситуация! Еще читаю несколько лекций на курсе по NLP и веду несколько семинаров по Deep CV. Преподавание — это мой способ держать себя в тонусе и оставаться в контексте актуальных исследований. Когда объясняешь что-то студентам, сам начинаешь лучше это понимать. О студентах: они реально крутые и мотивированные. Иногда задают такие вопросы, что приходится честно говорить «давайте разберемся вместе». И это прекрасно — значит, они думают, а не просто конспектируют.

Насколько тебе помогают в работе те знания, которые ты получил за время обучения?

Использую постоянно. Математическая база ФКН и ШАДа — это фундамент для понимания, почему модели работают (или чаще — почему не работают). Курсы по ML дали системное видение, а не просто набор трюков из туториалов. Инженерные практики вообще применяю каждый день — без них в проде делать нечего. В общем, ROI от обучения определенно положительный.

Что ты можешь посоветовать нынешним абитуриентам, которые закончили бакалавриат и хотят продолжать свое обучение в магистратуре?

Если думаете только о корочке — не идите, будет тяжело. Хотя в этом случае вы скорее всего и не пройдете вступительные: ВШЭ умеет фильтровать тех, кто пришел «просто посидеть». Если же вы реально хотите прокачаться и готовы вкладываться — добро пожаловать в клуб. СКН дает не только знания, но и окружение людей, которые реально двигают индустрию. И будьте готовы, что свободное время — это миф, по крайней мере на ближайшие два года. Зато потом будете с гордостью вспоминать, как выживали.

Что пожелаешь ШАДу в день его совершеннолетия?

Главное пожелание — не терять фокус на том, кого мы учим и для чего. Важно постоянно думать о том, какими мы хотим видеть наших студентов на входе и на выходе, какие навыки и mindset в них закладываем. И здесь критически важно не скатиться в упрощение программы или попытки быть удобными для всех. ШАД всегда был про вызов и преодоление. Простите за пафос, но девиз «будет сложно, вам понравится» — это не просто слова, это философия, которая формирует особых людей. Людей, которые потом в индустрии берутся за задачи, от которых другие отказываются. Собственно, и студентам желаю того же — помнить, зачем они прошли через все эти испытания. Мы учим решать по-настоящему сложные задачи не для галочки, а потому что кто-то же должен двигать индустрию и науку вперед. И если не выпускники ШАДа будут браться за амбициозные проекты и невозможные дедлайны, то кто? Оставайтесь верными этой философии. С совершеннолетием!