• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Программа «Практический анализ данных и машинное обучение»


Новый учебный год — время узнать что-то новое, и даже если вы уже закончили вуз, никогда не поздно снова сесть за парту. А узнать что-то в столь популярной и востребованной сейчас области, как машинное обучение, полезно вдвойне. Данная программа ориентирована на тех, кто уже имеет опыт программирования, но хотел бы получить дополнительные, востребованные сейчас компетенции.

И если сейчас слова "Data Mining", "Deep Learning" и "Text Mining" вы воспринимаете как далекие и недостижимые термины, которые не изучались в университетах, то этот учебный год может все исправить. Учебный курс начнется с повторения математических основ, требуемых для освоения методов анализа данных. Затем слушатели перейдут к изучению основных и продвинутых методов машинного обучения, анализу социальных сетей, узнают, как обрабатывать данные на естественном языке, познакомятся с методами глубинного обучения. Данная программа — результат совместной работы преподавателей Высшей школы экономики и практиков из ведущих ИТ-компаний. В основе обучения — интенсивное освоение навыков, необходимых для решения различных задач в ИТ-компаниях, банковской сфере, ритейле и телеком-операторах. Используя академическую и практическую составляющую, мы создали наполненный курс, в котором изучается как фундаментальная база, которая находит применение в практических методах анализа данных, так и освоение современных инструментов работы с данными. Курс ориентирован на практику и охватывает большинство задач, с которыми аналитик данных регулярно сталкивается в своей работе.

Преподаватели

Дмитрий Игнатов
Кандидат технических наук, преподаватель факультета компьютерных наук НИУ ВШЭ, доцент Департамента анализа данных и искусственного интеллекта, научный сотрудник Международной научно-учебной лаборатории интеллектуальных систем и структурного анализа. Проходил обучение по PhD программе в Техническом университете Дрездена (Германия) в рамках гранта DAAD.


Дмитрий Игнатов

Юрий Кашницкий
Выпускник МФТИ, научный сотрудник и аспирант НИУ ВШЭ. Преподаватель языка Python и машинного обучения на факультете компьютерных наук НИУ ВШЭ. Имеет публикации на семинарах топовых конференций по искусственному интеллекту (IJCAI и ECAI) и машинному обучению (ECML/PKDD). Ранее — Hadoop-разработчик, бизнес-аналитик и Java-программист РДТЕХ.


Юрий Кашницкий

София Докука
Кандидат социологических наук, научный сотрудник Института институциональных исследований НИУ ВШЭ. Преподает курсы по компьютерному моделированию в социологии, анализу социальных сетей и динамике социальных сетей. Работала в университете Гронингена (Нидерланды) в рамках программы международной мобильности Erasmus Mundus.


София Докука

Илья Щуров
Выпускник механико-математического факультета МГУ, кандидат физико-математических наук, доцент кафедры высшей математики НИУ ВШЭ. Лауреат конкурса молодых математиков фонда «Династия». Разработал и прочитал ряд курсов по программированию, в том числе обещуниверситетский факультатив «Программирование на языке Python для сбора и обработки данных». 


Илья Щуров

Екатерина Черняк
Старший преподаватель Департамента анализа данных и искусственного интеллекта факультета компьютерных наук, научный сотрудник Международной научно-учебной лаборатории анализа и выбора решений.


Екатерина Черняк


Святослав Елизаров

Выпускник факультета компьютерных наук. Data scientist и программист в alterra.ai


Святослав Елизаров

Андрей Шестаков
Преподаватель и аспирант факультета компьютерных наук. Работает в Mail.Ru Group в группе машинного обучения


Андрей Шестаков

Игорь Слинько

Data Scientist в Mail.ru Group. Разрабатывал и читал "Экспресс-курс Машинного обучения". Образование: Московский физико-технический институт, Школа анализа данных Яндекса.


Игорь Слинько

 

Занятия будут проходить:

группа по четвергам с 19:00 до 22:00 с 7 сентября 2017 года по 5 июля 2018 года.
группа по субботам с 15:00 до 18:00 с 9 сентября 2017 года по 7 июля 2018 года.


Начальные требования

Знание основ программирования (желательно Python).

Основные темы программы

Адаптационные математические курсы

  • Математический анализ
  • Линейная алгебра
  • Теория вероятностей
  • Математическая статистика
  • Методы оптимизации

Основы машинного обучения

  • Обучение с учителем. Задачи классификации и регрессии
  • Оценка качества алгоритмов машинного обучения
  • Обучение без учителя и задача кластеризации
  • Поиск выбросов и аномалий в данных

Индивидуальный проект по анализу данных

  • Ваши личные либо общедоступные данные и задачи
  • 1.5 месяца работы по четкому плану под руководством преподавателей
  • Презентации и обсуждение проектов

Продвинутые методы машинного обучения

  • Ансамбли алгоритмов классификации и регрессии. Градиентный бустинг
  • Смешивание моделей классификации и регрессии. Стекинг моделей классификации и регрессии
  • Соревнования по анализу данных, обзор решений

Поиск зависимостей в данных

  • Поиск часто покупаемых товаров (Frequent Itemset Mining). Алгоритм Apriori. Алгоритм FP-growth
  • Признаковые зависимости в данных. Импликации и ассоциативные правила (Association Rules)
  • Компактное представление закономерностей. Замкнутые и максимальные частые множества. Алгоритмы GenMax и Charm (или Close-by-One)
  • Анализ частых последовательностей. Примеры из демографии. Библиотека SPMF
  • Меры качества закономерностей. Корреляция как мера связи признаков. Статистическая оценка качества

Анализ социальных сетей

  • Введение в анализ социальных сетей. Модели формирования социальных сетей
  • Анализ структуры социальных связей. Каскады в сетях
  • Сообщества в социальных сетях
  • Распространение информации в социальных сетях

Автоматическая обработка текстов

  • Введение в анализ текстов. Частотный анализ текстов
  • Морфологический анализ. Выделение ключевых слов и словосочетаний
  • Выявление скрытых тем. Введение в корпусную лингвистику
  • Синтаксический анализ. Визуализация текстов

Масштабируемое машинное обучение и анализ больших данных с Apache Spark

  • Парадигма MapReduce в машинном обучении
  • Онлайн-обучение
  • Концепции вычислений в памяти и устойчивых распределенных наборов данных
  • Введение в Apache Spark для анализа данных
  • Машинное обучение с библиотекой MLLib Apache Spark

Нейронные сети и глубинное обучение

  • Введение в нейронные сети
  • Обучение сетей прямого распространения
  • Сверточные нейронные сети
  • Сети прямого распространения в анализе текстов
  • Рекуррентные нейронные сети
  • Модели сопоставления последовательностей (sequence to sequence)
190

академических часов

 

130

тысяч рублей

По итогам программы выдается Удостоверение о повышении квалификации установленного НИУ ВШЭ образца

Подать заявку

 Программа  дала доступный и широкий обзор современных методов предобработки и анализа данных, а также научила пользоваться множеством инструментов для этих задач. После прохождения курса вы больше не будете с восторгом и внутренним содроганием читать научно-популярные статьи про искусственный интеллект, но сильно задумаетесь над тем пластом профессий, которые будут автоматизированы в ближайшем будущем. До окончания программы я смогла найти интересную работу Data Scientist-a в области, схожей с предыдущим опытом работы.

Любовь Рожкова
выпускница программы

 

 У меня есть постоянная необходимость обновлять знания по углубленным методам анализа данных и машинного обучения. Я работаю менеджером продукта аналитических big data сервисов и мне важно хорошо понимать возможности и ограничения современных технологий, поскольку они — основная часть наших продуктов. Также я работаю с data scientists и поэтому мне важно как говорить на одном языке с коллегами, так и уметь самому построить простые прототипы моделей. И несмотря на то, что я закончил ВМК МГУ и за плечами у меня было несколько лет опыта работы «классическим» аналитиком, все равно классическая математическая статистка не равна машинному обучению - есть различия в подходах, моделях и метриках качества. В этом смысле программа оправдала мои ожидания: на выходе у меня есть представление об основных подходах и моделях ML, навыки построения прототипов базовых ML моделей, понимание основных направлений развития разных областей анализа данных: анализ текстов, нейронные сети и другое. Большая благодарность преподавателям, они постарались сделать курсы очень приближенными к реальным задачам

Григорий Мирошников
менеджер Big data продуктов компании OneFactor, выпускник программы

 


 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!