Секция 1: «Организация и содержание образовательных программ» 23 октября 11:50 – 12:30

 

Доклад «Проектирование и реализация программного трека «Машинное Обучени» в СПб НИУ ВШЭ»

 

Докладчик:

Алексей Шпильман
заведующий центром "Центр анализа данных и машинного обучения" НИУ ВШЭ в Санкт-Петербурге, руководитель образовательной программы, Научно-исследовательский и образовательный центр "JetBrains" в Санкт-Петербурге

Аннотация: 

Машинное обучение и анализ данных 5 лет назад начали приобретать все большую популярность в качестве образовательных треков для востребованных специалистов. При этом не существовало готовых рецептов для создание полной магистерской программы, на выходе из которой получались бы специалисты, готовые выполнять самые разнообразные задачи. Большинство программ состояло из имеющихся компетенция преподавательского состава того или иного факультета, притянутых по тематике. В докладе будет рассказано о том, как создавалась магистерская программа «Машинное обучение и анализ данных» в НИУ ВШЭ (СПб). Это происходило «с нуля», а именно, - сначала были определены знания и навыки, которым должны были обладать выпускники, после чего была составлена карта необходимых для этого курсов, и на эти курсы были привлечены преподаватели из индустрии и исследовательских лабораторий.

 

Запись доклада

Презентация доклада

 

Резюме: 

Образовательная программа по машинному обучению была создана 4 года назад. С 2012-2013 годов начался бум глубокого обучения, анализа данных и больших данных. Стало понятно, что нужна полноценная программа по машинному обучению. Были проанализированы существующие программы по этому направлению. По итогам дискуссий с сотрудниками Яндекса и ИТ-компаний стало понятно, что существует нехватка специалистов по машинному обучению с достаточно высоким уровнем квалификации. Основная цель программы – подготовка инженеров в области анализа данных и машинного обучения, способных выполнять прикладные задачи на высоком уровне с минимальным риском. Чтобы учесть требования со стороны рынка, проводились консультации с компаниями, заинтересованными в выпускниках программы. Уточнялись требования к знаниям и умениям таких специалистов. Разработчики программы общались и с научными группами, поскольку выпускники должны уметь анализировать свою работу на высоком научном уровне, анализировать результаты современных исследований, понимать, как сейчас выглядит картина мира в искусственном интеллекте, машинном обучении и анализе данных. 

            Разработчики сформировали карту предметов, которые будут реализованы в рамках программы. На ней отражена очерёдность преподавания дисциплин, определены пререквизиты для реализуемых дисциплин. На основе этой карты была создана магистерская программа «Машинное обучение и анализ данных». Отдельные элементы карты используются и в других программах. После разработки этой карты дисциплин была попытка оценить её эффективность. Для этого было проведено сравнение образовательной программы с аналогичными программами западных университетов, которые были ведущими центрами машинного обучения и анализа данных (Stanford University, Massachusetts Institute of Technology, California Institute of Technology, University of Cambridge, University of Edinburgh).

            После утверждения учебного плана образовательной программы началась работа над содержанием программ учебных дисциплин. Анализировались требования к дисциплинам со стороны индустрии и научного сообщества. Рассматривалось какие темы каждого курса необходимы для изучения других курсов. Оценивалась «полнота» курсов, с точки зрения того, что в случае прерывания студентом обучения, освоив лишь часть курсов, он все равно получит полезные знания и умения, повысит свою квалификацию. Один из важнейших элементов всех курсов – практическая составляющая, которая имеет большой вес в программе и требует от студентов значительного внимания, к чему они не всегда готовы. 

            Следующим этапом был поиск преподавателей. Основная группа специалистов уже была сформирована, но требовалось найти преподавателей для ряда курсов.  При поиске учитывалось наличие у преподавателя опыта и практических навыков работы в преподаваемой области. Почти все преподаватели программы – это сотрудники компаний IT-лидеров (JetBrains, Яндекс, ВКонтакте), имеющие опыт применения методов машинного обучения и анализа данных на практике. Мотивация работы для преподавателей – это возможность увеличить число полезных кадров для их компании или области деятельности, а также привлекать студентов к участию в исследовательских и промышленных проектах. 

            На регулярной основе обновляется как учебный план образовательной программы, так и содержание отдельных дисциплин. Например, программа дисциплины по глубокому обучению каждый год обновляется на 20-30%. Появились новые дисциплины, например, глубокое обучение с подкреплением и глубокое обучение без учителя. Чаще всего новые дисциплины преподаются бывшими выпускниками образовательной программы, ставшими специалистами в новых областях науки. При обновлении образовательной программы также учитываются замечания и предложения студентов. Добавляются курсы от новых индустриальных партнёров. 

            Важная составляющая программы – научные семинары, на которых выступают студенты с докладами. Реализуются 5 семинаров на разные тематики машинного обучения. Они позволяют сформировать сообщество для обмена новыми научными знаниями и способствуют приобретению студентами навыков анализа научной литературы и выступления с докладом по итогам проведённой аналитической работы. В процессе подготовки доклада студентам оказывается помощь со стороны руководителя семинара в части сбора и анализа материала и подготовки выступления. Все выступления снимаются на видео и размещаются в открытом доступе в YouTube. Участие студентов в таких семинарах развивает навыки, необходимые для выступания на конференциях, презентации промышленных проектов или стартапов.  

            Неотъемлемой частью программы является работа над выпускным научным или техническим проектом. Темы для выпускных работ предоставляют компании-партнёры и исследовательские лаборатории. Некоторые темы могут быть предложены самими студентами. Около 20% работ публикуются в материалах международных конференций, поставлена цель увеличить этот показатель. Некоторые выпускные работы становятся промышленным внедрением в компаниях.