• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Современный анализ данных, глубокое обучение и приложения

Первая программа профессиональной переподготовки по анализу данных и машинному обучению, которая охватывает все разделы современного анализа данных, в том числе такую популярную сейчас область как глубокое обучение. Программа начинается с самых основ — изучения программирования и базовых разделов математики — и переходит к разделам по машинному обучению, приложениям, глубокому обучению и обучению с подкреплением, анализу социальных сетей и работой с большими данными. При разработке программы мы сделали акцент на практическую работу, разборы ошибок и проектную деятельность, ввели консультационные часы и группу ассистентов, которая будет персонально работать с вами. По итогам программы вы получите самые актуальные знания в одной из самых востребованных областей 21 века, проекты в портфолио и диплом о профессиональной переподготовке установленного НИУ ВШЭ образца. 

608 

академических часов, в том числе 414 часов лекций и семинаров.
Начало обучения — 5 сентября 2018. Завершение обучения — 9 октября 2019.
 

 

300

тысяч рублей — базовая часть программы.
Оплата производится частями.
Для студентов, выпускников и слушателей основных и дополнительных программ НИУ ВШЭ предусмотрены скидки.

Расписание
Адаптационные программы по математике и программированию будут проходить три раза в неделю: среда (19:00-22:00), четверг (19:00-22:00) и суббота (15:00-18:00). С 17 ноября 2018 года занятия будут проходить только по средам (19:00-22:00) и по субботам (15:00-18:00). Занятие будут проходить на факультете компьютерных наук по адресу: Кочновский проезд, дом 3 (метро Аэропорт).  Планируется переезд на Третьяковскую.

Подать заявку

Содержание программы:

Часть 1. Математика для анализа данных

Модуль познакомит вас с базовыми определениями и понятиями математического анализа, линейной алгебры, теории вероятностей, статистики и дискретной математики и подготовит к дальнейшему изучению дисциплин по анализу данных. Данный курс можно пройти отдельно как программу повышения квалификации.

Преподаватели модуля:

Нина Сахарова
Выпускница магистратуры факультета математики Высшей школы экономики, преподаватель кафедры Высшей математики, "Лучший преподаватель" 2014-2016 года по мнению студентов.

Леонид Иосипой
Выпускник механико-математического факультета МГУ, преподаватель факультета компьютерных наук, сотрудник сектора математических методов предсказательного моделирования ИППИ РАН.



 

Часть 2 (вариативная часть). Введение в Python

Вы научитесь программировать, даже если раньше этого никогда не делали, познакомитесь с базовыми возможностями языка Python, узнаете о его «подводных камнях» и начнёте использовать свои навыки в повседневной работе.

Преподаватель модуля:

Илья Щуров

Выпускник механико-математического факультета МГУ, кандидат физико-математических наук, доцент кафедры высшей математики НИУ ВШЭ. Лауреат конкурса молодых математиков фонда «Династия». Разработал и прочитал ряд курсов по программированию, в том числе обещуниверситетский факультатив «Программирование на языке Python для сбора и обработки данных».

Екатерина Денике

Выпускница Механико-математического факультета МГУ, 2014, диплом с отличием. Преподаватель факультета компьютерных наук с 2016 года (python, web-mining, анализ данных) Координация проектов и анализ данных в Яндексе с 2014 года.



 

Часть 3. Обработка и сбор данных на Python

Модуль состоит из двух частей:
I. Обработка данных в Python. Работа с данными в Python немного похожа на использование систем электронных таблиц — только во много раз мощнее. Буквально одной командой можно выбрать нужные записи из таблицы по заданным критериям, сгруппировать их, вычислить агрегированные значения и визуализировать результат. И это только начало!
II. Сбор данных в Python. Не всегда данные доступны сразу в удобном для обработки виде: они могут быть разбросаны по разным сайтам и храниться в разных форматах. Мы обсудим, как извлекать данные с веб-страниц (веб-скреппинг) и как пользоваться массивами открытых данных, доступных в структурированных форматах (XML, JSON) через API.
Часть 2 и 3 можно пройти отдельно как программу повышения квалификации.

Преподаватель модуля:

Илья Щуров
Выпускник механико-математического факультета МГУ, кандидат физико-математических наук, доцент кафедры высшей математики НИУ ВШЭ. Лауреат конкурса молодых математиков фонда «Династия». Разработал и прочитал ряд курсов по программированию, в том числе обещуниверситетский факультатив «Программирование на языке Python для сбора и обработки данных».

Екатерина Денике

Выпускница Механико-математического факультета МГУ, 2014, диплом с отличием. Преподаватель факультета компьютерных наук с 2016 года (python, web-mining, анализ данных) Координация проектов и анализ данных в Яндексе с 2014 года.



 

Часть 4 и 5. Основы машинного обучения и  продвинутые методы машинного обучения

Основные темы модулей:

  • Обучение с учителем. Задачи классификации и регрессии
  • Оценка качества алгоритмов машинного обучения
  • Обучение без учителя и задача кластеризации
  • Поиск выбросов и аномалий в данных
  • Временные ряды
  • Ансамбли алгоритмов классификации и регрессии. Градиентный бустинг
  • Онлайн-обучение и Vowpal Wabbit
  • Смешивание моделей классификации и регрессии
  • Соревнования по анализу данных, обзор решений
  • Онлайн- оффлайн-метрики, A/B тестирование, интерливинг
  • Рекомендательные системы

Преподаватели модуля:

Виталий Шайдуров
Выпускник факультета Вычислительной математики и кибернетики МГУ имени М. В, Ломоносова. Программист-исследователь группы рекомендательных систем в Mail.ru Group.


 

Игорь Слинько
Data Scientist в Mail.ru Group. Разрабатывал и читал "Экспресс-курс Машинного обучения". Образование: Московский физико-технический институт, Школа анализа данных Яндекса.


 

Андрей Шестаков
Преподаватель и аспирант факультета компьютерных наук. Работает в Mail.Ru Group в группе машинного обучения


 

Евгений Соколов
Заместитель руководителя Департамента больших данных и информационного поиска факультета компьютерных наук НИУ ВШЭ. Руководитель группы качества рекомендаций и анализа контента Яндекс.Дзена. Со-автор онлайн-специализации "Машинное обучения и анализ данных" на платформе Coursera.


 

Алексей Артемов
Кандидат физико-математических наук, аналитик в компании Яндекс, преподаватель факультета компьютерных наук НИУ ВШЭ. Выпускник Школы анализа данных Яндекса.



 

Часть 6. Анализ социальных сетей

Основные темы модуля:

  • Введение в анализ социальных сетей. Модели формирования социальных сетей
  • Анализ структуры социальных связей. Каскады в сетях
  • Сообщества в социальных сетях
  • Распространение информации в социальных сетях

Преподаватели модуля:

Андрей Шестаков
Преподаватель и аспирант факультета компьютерных наук. Работает в Mail.Ru Group в группе машинного обучения

София Докука
Кандидат социологических наук, научный сотрудник Института институциональных исследований НИУ ВШЭ. Преподает курсы по компьютерному моделированию в социологии, анализу социальных сетей и динамике социальных сетей. Работала в университете Гронингена (Нидерланды) в рамках программы международной мобильности Erasmus Mundus.



 

Часть 7. Нейронные сети и глубокое обучение

Deep learning является одной из самых популярных областей машинного обучения. Именно благодаря этому подходу были получены наилучшие результаты в распознавании изображений, обработке текста, машинном переводе, обучении с подкреплением и многих других задачах. Но что скрывается за этим термином? Ответ на этот вопрос мы постараемся дать в данном модуле. Слушатели смогут познакомиться с моделями на основе искусственных нейронных сетей, а также теорией, описывающей их работу. Будут рассмотрены примеры решений задач распознавания изображений и анализа текстов, с использованием библиотеки Tensorflow. Программа подразумевает обширную практическую часть и большое количество самостоятельной работы. Данный курс можно пройти отдельно как программу повышения квалификации.

Преподаватели модуля:

Святослав Елизаров
Выпускник факультета компьютерных наук. Data scientist и программист в alterra.ai

Борис Коваленко
Выпускник факультета компьютерных наук. Deep Learning Engineer в международной компании.

Артем Грачев
Выпускник ВМК МГУ. Сейчас является аспирантом ФКН ВШЭ и инженером в Samsung R&D Institute Russia. Область научных интересов: искусственный интеллект, обучение с подкреплением, байесовские методы.


 

Часть 8. Reinforcement Learning

Модуль даёт слушателям понимание и практические навыки использования методов обучения с подкреплением, включая глубокое обучение с подкреплением. В программу входят теоретическая база, практические задания, инженерные трюки и неординарные предметные области.

Преподаватель модуля:

Сергей Свиридов
Закончил магистратуру Всероссийской академии внешней торговли. Предприниматель. Занял первое место с командой OpenDataScience на третьем хакатоне DeepHack по Reinforcement Learning в феврале 2017. Имеет большой опыт практического применения методов машинного обучения и технологий больших данных в индустрии в банковской сфере, транспорте и других отраслях.

Часть 9. Приложения машинного обучения

В данном модуле будут подробно разобраны основные задачи обработки и анализа текстов и компьютерного зрения. С подробным описанием курсов можно ознакомиться на сайте программ, также программу по компьютерному зрению и программу по анализу текстов можно пройти отдельно, как повышение квалификации.

Преподаватели модуля:

Екатерина Черняк
Кандидат технических наук, старший преподаватель Департамента анализа данных и искусственного интеллекта факультета компьютерных наук, младший научный сотрудник Международной научно-учебной лаборатории интеллектуальных систем и структурного анализа

Вячеслав Мурашкин
Выпускник МГТУ имени Баумана, Высшей школы экономики и Школы анализа данных Яндекса. Более шести лет занимается проектами в области анализа больших массивов данных, рекомендательных систем и машинного обучения. Имеет успешный опыт работы как в крупных IT компаниях, так и в небольших стартапах. В настоящее время работает разработчиком-исследователем в направлении беспилотных автомобилей в Яндексе.

Часть 10. Масштабируемое машинное обучение и анализ больших данных с Apache Spark

Основные темы модуля:

  • Парадигма MapReduce в машинном обучении
  • Онлайн-обучение
  • Концепции вычислений в памяти и устойчивых распределенных наборов данных
  • Введение в Apache Spark для анализа данных
  • Машинное обучение с библиотекой MLLib Apache Spark

Преподаватели модуля:

Вячеслав Мурашкин
Выпускник МГТУ имени Баумана, Высшей школы экономики и Школы анализа данных Яндекса. Более шести лет занимается проектами в области анализа больших массивов данных, рекомендательных систем и машинного обучения. Имеет успешный опыт работы как в крупных IT компаниях, так и в небольших стартапах. В настоящее время работает разработчиком-исследователем в направлении беспилотных автомобилей в Яндексе.