• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Программа "Поиск зависимостей в данных"

Поиск закономерностей (Pattern Mining) – одна из центральных задач в майнинге данных и машинном обучении.  Однако в этих двух дисциплинах к ней подходят по-разному. Так в определении майнинга данных уже заложен термин закономерности (patterns), которые обязаны быть новыми, нетривиальными и полезными с претензией на то, чтобы в конечном итоге стать знаниями. В то время как в машинном обучении основная цель – предложить для решения некоторой задачи такой алгоритм, который смог бы научиться ее решать самостоятельно и улучшать результаты по мере накопления опыта. То есть найденные таким алгоритмом закономерности не обязательно должны быть легко интерпретируемыми человеком. Сейчас, однако, эти две дисциплины тесно взаимосвязаны, и закономерности, полученные в результате машинного обучения, такие как деревья решений, часто используются для объяснения решения задачи (например, классификации – кому выдать кредит, а кому нет), а признаковые зависимости (например, ассоциативные правила), найденные методами майнинга данных, могут рассматриваться как правила, выученные по предъявленным данным алгоритмом классификации (ансамблем правил). В рамках программы мы поговорим об использовании закономерностей (patterns) в этих двух дисциплинах на примере реальных задач и методов.

Преподаватель

Дмитрий Игнатов
Кандидат технических наук, преподаватель факультета компьютерных наук НИУ ВШЭ, доцент Департамента анализа данных и искусственного интеллекта, научный сотрудник Международной научно-учебной лаборатории интеллектуальных систем и структурного анализа.  Проходил обучение по PhD программе в Техническом университете Дрездена (Германия) в рамках гранта DAAD.


ДМИТРИЙ ИГНАТОВ

Основные темы программы

  • Поиск часто покупаемых товаров (Frequent Itemset Mining). Алгоритм Apriori. Алгоритм FP-growth
  • Признаковые зависимости в данных. Импликации и ассоциативные правила (Association Rules)
  • Программные средства Concept Explorer и Orange
  • Компактное представление закономерностей. Замкнутые и максимальные частые множества. Алгоритмы GenMax и Charm (или Close-by-One)
  • Анализ частых последовательностей. Примеры из демографии и анализа поведения покупателей. Библиотека SPMF
  • Меры качества закономерностей. Корреляция как мера связи признаков. Статистическая оценка качества
  • Примеры поиска закономерностей для графов (молекулярные графы).
  • Покупки с высокой полезностью (high-utility patterns).

Начальные требования

Владение базовыми навыками программирования на одном из языков высокого уровня (желательно Python).

20

академических часов
Занятия по четвергам с 19:00 - 22:00

20 000

рублей

По итогам программы выдается Удостоверение о повышении квалификации установленного НИУ ВШЭ образца

Подать заявку

 


 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!