Факультет компьютерных наук Высшей школы экономики предлагает широкий спектр программ дополнительного образования по математике, программированию, анализу данных и машинному обучению. Курсы помогут получить новые профессиональные компетенции как разработчикам, так и менеджерам, маркетологам, аналитикам и HR-специалистам из компаний. Программы разработаны преподавателями факультета в тесном сотрудничестве с представителями индустрии.
Особенности корпоративного обучения:
- Создание индивидуальных обучающих программ в тесном сотрудничестве с клиентом и с учетом специфики компании
- Фокус на результатах обучения для бизнеса
- Использование реальных существующих задач компании в качестве кейсов в процессе обучения
- Баланс теоретических знаний и практических навыков
- Возможность выбрать место проведения обучения: на территории партнера, на территории университета, дистанционно
- Минимальный отрыв от производства
Оставить заявку на разработку корпоративной программы
Примеры программ и тематики курсов*
Машинное обучение и майнинг данных
Программы помогают получить базовые компетенции аналитика данных, среди которых адекватный выбор метода для решения конкретной задачи анализа данных, предобработка данных, настройка параметров метода анализа и интерпретация полученных результатов. Содержание программ охватывает основные разделы современного машинного обучения (Machine Learning) и майнинга данных (Data Mining). По желанию заказчика курс может быть дополнен вводными занятиями по Python, адаптационными курсами по высшей математике. Также в дополнение к данным курсам или отдельными программам можно заказать курсы по автоматической обработке текстов, рекомендательным системам и алгоритмам, анализу социальных сетей, поиску зависимостей в данных, нейронным сетям и глубинному обучению, а также анализу больших данных.
Начальные и продвинутые курсы по программированию
Программы помогут изучить с нуля или улучшить навыки работы на самых востребованных сейчас языках программирования: Python, С++, С#, R, Java и Swift.
Алгоритмы и структуры данных
Алгоритмы используются практически во всех областях компьютерных наук. Цель программы – познакомить слушателей с основными разделами прикладных алгоритмов, показать, какие задачи они решают, какие основные подходы и методы используются и какие проблемы являются актуальными.
Архитектура компьютера и операционные системы
Понимание устройства и принципов работы электронных вычислительных машин (ЭВМ) и основных принципов работы операционных систем является незаменимым при оценке проектных решений, проектировании новых систем, выявлении узких мест в работе существующих информационных систем, диагностики нетривиальных неполадок и ошибок и повышении производительности вычислений за счет более эффективного использования программных и аппаратных средств. Программы направлены на формирование понимания принципов работы компьютеров и деталей взаимодействия прикладного и системного программного обеспечения с аппаратурой ЭВМ.
* это только примерный список готовых программ, предоставляемых факультетом. Если у Вас есть запрос на обучение по тематикам компьютерных наук (машинное обучение, анализ данных, программирование, разработка, алгоритмы, математическое моделирование и другие), мы разработаем программу специально для Вас.
Оставить заявку на разработку корпоративной программы
Прошедшие программы
АО «Национальные Информационные Технологии» (Казахстан). Программа “Поиск зависимостей в данных”.
Данная программа была проведена в форме трехдневного интенсива в офисе компании в Казахстане. Целевой аудиторий курса были аналитики, менеджеры и разработчики, которые уже владели навыками обработки данных на Python и основами машинного обучения.
Изученные темы:
- Поиск часто покупаемых товаров (Frequent Itemset Mining). Алгоритм Apriori. Алгоритм FP-growth
- Признаковые зависимости в данных. Импликации и ассоциативные правила (Association Rules)
- Программные средства Concept Explorer и Orange
- Компактное представление закономерностей. Замкнутые и максимальные частые множества. Алгоритмы GenMax и Charm (или Close-by-One)
- Анализ частых последовательностей. Примеры из демографии и анализа поведения покупателей. Библиотека SPMF
- Меры качества закономерностей. Корреляция как мера связи признаков. Статистическая оценка качества
- Примеры поиска закономерностей для графов (молекулярные графы).
- Покупки с высокой полезностью (high-utility patterns).
АО «Национальные Информационные Технологии» (Казахстан). Программа “Нейронные сети и глубинное обучение”.
Данная программа была проведена в форме четырехдневного интенсива в офисе компании в Казахстане. Целевой аудиторий курса были аналитики, менеджеры и разработчики, которые уже владели навыками обработки данных на Python и основами машинного обучения.
Изученные темы:
- Введение в нейронные сети
- Обучение сетей прямого распространения
- Сверточные нейронные сети
- Сети прямого распространения в анализе текстов
- Рекуррентные нейронные сети
- Модели сопоставления последовательностей (sequence to sequence)
Газпром нефть-НТЦ. Применение современных цифровых интеллектуальных технологий обработки данных в нефтегазовой сфере
18 сотрудников научно-технологического центра «Газпром нефти» и «Информационно-технологической сервисной компании» в рамках четырехдневного интенсива рассмотрели наиболее важные современные подходы к решению задач машинного обучения, компьютерного зрения и статистического обнаружения аномальных событий.
Курс разрабатывался с учетом ключевых образовательных потребностей «Газпром нефти». В первый день были рассмотрены методы машинного обучения, постановки задач классификации и регрессии и основные программные библиотеки. Последующие дни были посвящены конкретным технологиям анализа данных. Специалисты НТЦ в своей работе фокусируются на создании программных продуктов, предназначенных для автоматизации сложных процессов поиска и разработки месторождений, оптимизации процессов добычи и эксплуатации, поэтому каждый раздел курса подкреплялся примерами применения методов анализа и обработки данных в различных индустриальных условиях. По итогам прохождения слушатели программы должны были за короткий срок решить практическую задачу автовыделения интервалов коллектора по данным геофизических исследований скважин, соревнуясь между собой в точности и полноте построенной модели.
Международная ИТ-компания. Математика и основы машинного обучения
Программа была проведена для отдела аналитики и ведения проектов по СНГ и Восточной Европе. Часть обучения была реализована в онлайн-формате.
Изученные темы:
- Адаптационные математические курсы (математический анализ и линейная алгебра, теория вероятностей и математическая статистика, методы оптимизации)
- Обучение с учителем. Задачи классификации и регрессии
- Оценка качества алгоритмов машинного обучения
- Обучение без учителя и задача кластеризации
- Поиск выбросов и аномалий в данных
Тинькофф Банк. Рекомендательные системы и алгоритмы
Данная программа была проведена в форме четырехдневного интенсива в офисе компании. Целевой аудиторий курса были аналитики, менеджеры и разработчики, которые уже работали с машинным обучением.
Изученные темы:
- Постановка задачи построения рекомендаций. Примеры данных. Коллаборативная фильтрация. Memory-based методы: user-based и item-based рекомендации. Матричные разложения в рекомендательных системах: основы.
- Матричные разложения в рекомендательных системах: SVD, latent factor model, ALS, HALS. Неявный фидбек и метод iALS. Неотрицательные матричные разложения. Факторизационные машины. Функционалы ошибок в матричных разложениях
- Архитектура рекомендательных систем. Многоуровневые модели, методы отбора кандидатов. Оценка качества отбора кандидатов. Контентные и гибридные модели. Примеры контентных факторов
- Метрики качества рекомендаций: основные подходы и практическое применение. Выявление некачественного контента. Некачественный контент. Масштабирование классификаторов на разные языки
Международная медицинская компания. Обзор аппарата статистических гипотез и методов классической статистики.
Двухдневный интенсив по статистике для аналитиков компании
Изученные темы:
- Критерий проверки гипотезы, критическое множество. Виды статистических гипотез: параметрические и непараметрические, простые и сложные. Понятие статистической гипотезы.
- Ошибки первого и второго родов. Мощность теста. P-value для теста. Проверка гипотез: о значении разности между двумя математическими ожиданиями независимые выборик, связанные выборки); о равенстве дисперсии теоретическому значению; о равенстве двух дисперсий. Определение мощности теста
- Непараметрические тесты: критерий Уилкоксона(the Wilcoxon test); критерий Манна-Уитни (the Mann-Whitney test). Критерий согласия.Критерий согласия Пирсона. Проверка гипотезы о независимости по таблице сопряженности признаковНепараметрические тесты: критерий Уилкоксона(the Wilcoxon test); критерий Манна-Уитни (the Mann-Whitney test). Критерий согласия.Критерий согласия Пирсона. Проверка гипотезы о независимости по таблице сопряженности признаков
- Критерий согласия.Критерий согласия Пирсона. Проверка гипотезы о независимости по таблице сопряженности признаков
- Понятие о корреляции. Коэффициент корреляции (Пирсона) Проверка гипотезы о равенстве нулю коэффициента корреляции
- Ранговая корреляция и коэффициент ранговой корреляции (Спирмена)
- Модель множественной линейной регрессии. Объясняющая способность уравнения множественной линейной регрессии
- Доверительные интервалы и проверка гипотез для параметров регрессии
Lamoda. Python для анализа данных
Программа повышения квалификации для аналитиков компании.
Изученные темы:
- Введение в Python. Синтаксис языка. Базовые типы данных: числа, строки, списки, словари, множества. Функции. Классы и объекты. Ввод-вывод. Обработка исключений
- Введение в анализ табличных данных в Python. Пакет pandas. Объекты Series (последовательность) и DataFrame (таблица). Чтение-запись данных в различных форматах. Запросы к таблицам: выборка строк/столбцов по заданным критериям. Модификация элементов таблицы. Добавление строк/столбцов.
- Продвинутые возможности pandas. Группировка и агрегирование. Объединение таблиц (различные виды join). Работа с временными рядами. Вычисления: скользящее среднее, кумулятивная сумма и т.д. Работа с пропусками (NA’s). Многомерные данные: мультииндексы. Операции stack-unstack. Построение сводных таблиц (pivot tables).
- Визуализация данных в Python. Обзор библиотек: matplotlib, pandas, seaborn, plotly, bokeh. Базовые типы визуализаций: графики, столбчатые диаграммы, гистограммы, точечные диаграммы (scatter plots), ящики с усами. Комбинирование различных графических элементов. Построение интерактивных диаграмм с помощью plotly и bokeh.
- Сбор и подготовка данных. Веб-скреппинг. Библиотека beautifulsoup. Работа с динамическими сайтами с помощью Selenium. Массовый скреппинг с помощью scrapy. Работа со структурироваными данными: JSON и XML. Открытые API.