Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.
E-mail: info@teta.mts.ru
На данный момент кафедра разрабатывает курсы, записаться на которые можно во время кампании курсов по выбору. Курсы кафедры охватывают актуальные темы в области генеративных моделей ИИ, больших данных и инфраструктуры для больших данных, а ведут их действующие IT-специалисты МТС, среди которых есть руководители больших команд и CTO продуктов. Однако важно отметить, что отдельно взятый курс может запускаться не ежегодно, а в зависимости от актуальности тем и доступности экспертов.
Линейка дисциплин обновляется и расширяется, предлагая новые учебные курсы с акцентом на практикоориентированность, которую позволяет гарантировать экспертиза действующих сотрудников МТС. Это означает, что каждый учебный год может предложить что-то актуальное и востребованное на рынке, без гарантии повторения курсов в будущем.
Список курсов и освещаемые в них темы, подготовленные базовой кафедрой МТС:
Разработка микросервисов на Go
3 курс, 1–2 модули
Курс «Разработка микросервисов на Go» предлагает изучение основ языка Go и микросервисной архитектуры. Вы научитесь настраивать локальное окружение, работать с REST API, а также организовывать взаимодействие между сервисами через gRPC, Kafka и REST. Курс ориентирован на практику: вы будете выполнять задания, начиная с разработки HTTP сервера и клиента, заканчивая созданием системы бронирования отелей, чтобы освоить ключевые навыки разработки микросервисов.
В МТС Go используется для решения огромного количества различных задач, включающих в себя работы с инфраструктурой, парсинг и формирование продуктовых корзин, распараллеливание долгих операций синхронизации и прочее.
Но это не единственная область применения Go. На нем также разрабатываются обычные продуктовые сервисы, к примеру, корпоративные.
В HR Tribe backend всех продуктов реализовывается на Go. Он принят за стандарт и позволяет очень быстро сделать прототип сервиса и начать обкатывать на нем свои гипотезы.
История и идеология Go
Основы Go
Основы WEB для разработчиков
Стандартные библиотеки и практики Go
Архитектура систем
Реляционные БД, PostgreSQL
Архитектура на уровне приложения Go
Асинхронное взаимодействие, Kafka/Rabbit/NATS
Контроль качества кода
Наблюдаемость
Concurrency
Q/A сессия
Общая теория по СУБД
Напутствие и road map развития
Разработать систему бронирования номеров. Сервисы должны удовлетворять контрактам из репозитория.
Разработать схемы для хранения данных, написать миграции и заполнить базы данных тестовыми данными.
Итог = 0,3 * ДЗ + 0,3 * Экзамен + 0,4 * Итоговый проект,
где ДЗ – средняя оценка за все домашние задания
Введение в платформы данных
Асинхронный курс на MTS Link, регулярные семинары и консультации
Практические задания выполняются на вычислительных ресурсах MWS
4 курс, 1–2 модули
Курс посвящен платформам данных, которые упрощают задачи с данными, предоставляя инфраструктуру и инструменты для их загрузки, обработки и анализа. Вы изучите основные концепции платформ данных, научитесь развертывать платформу и организовывать полный цикл работы с данными: от загрузки до анализа. Рассматриваются технологии Big Data, Data Warehouse, Data Lake и Data Governance, с акцентом на Hadoop и Spark. Вы освоите компоненты Hadoop, архитектуру кластера и HDFS, а также работу с Spark DataFrame API и Spark SQL API.
Теоретическая часть представлена в виде онлайн-лекций, а практическая часть проходит при поддержке преподавателей. В рамках курса также предусмотрены QA-сессии для получения ответов на возникающие вопросы.
Причины появления инструментов обработки больших данных. Какие задачи они решают
Компоненты Hadoop и архитектура кластера
HDFS (Hadoop Distributed Filesystem)
Развертывание Hadoop и базовые операции ФС
Парадигма MapReduce
YARN
Форматы файлов
Другие проекты экосистемы Hadoop
Hive: назначение, структура, компоненты
Развертывание Hive и операции с ним
HiveQL и организация данных
Сравнение с традиционными RDBMS
Spark, архитектура и назначение
Развертывание кластера Spark
Spark DataFrame API
Spark SQL API
Взаимодействие между компонентами Hadoop
Средства организации ETL-процессов
DBT, Prefect, NiFi
Сравнение различных инструментов ETL
Способы организации хранилищ: DataLake DataWarehouse, Lakehouse
Greenplum
Clickhouse
Kafka
DQ
DatGov
BI
Выполняются на вычислительных ресурсах MWS
Развертывание Hadoop
Развертывание кластера YARN и выполнение распределенного MapReduce
Развертывание Hive
Развертывание кластера Spark
Развертывание Airflow, реализация ETL процесса с его применением
Работа с Greenplum
Работа с DQ
Работа с BI
Итог = 1,0 * Средн.арифм(ДЗ)
Машинное обучение в прикладных задачах
Курс посвящён специфике применения машинного обучения в широком наборе отраслей бизнеса
Модуль 1 — Оптимизация взаимодействия с клиентом
Модуль 2 — Оптимизация расходов бизнеса
Модуль 3 — Обзор применений по отраслям
Сумма баллов за домашние задания нормируется на шкалу от 0 до 10
Computer vision
Nowadays, digital signals, images and videos appear almost everywhere, both in a plethora of scientific (e.g., astronomical, biomedical) and consumer applications (e.g., computational photography, computer vision, VR/AR etc.). Therefore, the ability to analyze and process digital signals and images is an extremely important skill for engineering/science students to acquire. Indeed, digital signal processing and analysis is mainly responsible for the multimedia technology revolution that we are experiencing today and form the basis of the computational tools and techniques that are extensively utilized by modern deep learning systems. Among important tasks that signal processing techniques can successfully deal with, are inverse problems, such as image/video enhancement and restoration, image recovery, and 3D reconstruction.
This course will cover fundamental concepts of digital signal processing and computational imaging methods and describe how these concepts are applied in practice to solve a variety of existing problems. We will provide a mathematical framework to describe and analyze images as two- or three-dimensional signals in the spatial and frequency domains. The students will become familiar with the theory behind fundamental processing tasks including image enhancement, recovery and reconstruction. They will also learn how to perform these key processing tasks in practice using current state-of-the-art techniques and computational tools. A wide variety of such tools will be introduced including large-scale optimization algorithms and regularization methods. Further, emphasis will be given to highlight the connections between classical signal processing and computational methods with modern deep learning neural networks. Such connections will help the students to better understand the origins of some of the most successful deep learning tools and architectures that currently exist in the fields of computer vision and image processing.
Итог = сумма домашек/n * 0,6 + итоговый проект * 0,4
DevOps
Курс «DevOps: методология и практика» — это вводный и практико-ориентированный курс, состоящий из 7 лекций и 7 семинаров, разработанный совместно с экспертами МТС. Он охватывает основные принципы DevOps, направленные на минимизацию бизнес-рисков, связанных с разработкой и управлением IT-инфраструктурой, а также обучение современным инструментам DevOps, включая CI/CD, контейнеризацию и автоматизацию. Курс включает теоретические и практические компоненты, обеспечивающие студентов актуальными знаниями и навыками для успешного выполнения задач DevOps инженера, а также ориентирован на развитие навыков работы с GitLab и навыков развертывания приложений. Программа нацелена на подготовку студентов к решению бизнес-задач с помощью DevOps методологий и инструментов, что способствует их профессиональному росту.
Итог = Итоговый тест*0,2 + Итоговое задание*0,3 + Защита проекта*0,1 + Дз1*0,1 + Дз2*0,1 + Дз3*0,1+ Дз4*0,1
Методы и системы обработки больших данных
В рамках курса студенты узнают о различных видах программных решений, используемых при работе с большими данными: фреймворке hadoop и его составляющих, MPP СУБД Greenplum, СУБД Clickhouse, Apache Airflow и других инструментах. Узнают какие задачи решают инженеры данных и какие приемы используют. Студенты на практике реализуют несколько ETL процессов, с помощью указанных выше инструментов.
Gen AI
Программа обучения по GenAI подойдет как для тех, кто только начал изучение данной темы, так и для тех, кто хочет углубить свои знания в области генеративного искусственного интеллекта. В рамках программы предусмотрено два трека обучения: бизнес-трек (для начинающих) и научный трек (для тех, кто уже владеет основами ИИ)
В рамках курса студенты изучат историю и текущее состояние ИИ, а также перспективы его развития. Бизнес-трек фокусируется на практических навыках, таких как управление разработкой AI-продуктов, промпт-инжиниринг, fine-tuning и использование инструментов сборки AI-продуктов, включая инновационные подходы, такие как Lang Chai. Научный трек предоставляет углубленное изучение современных методов, включая GAN, трансформеры, diffusion models, а также рассматривает перспективные архитектуры.
В завершение курса студенты смогут применить полученные знания на практике: студенты из научного и бизнес направлений объединяются в смешанные команды, чтобы разработать собственный продукт.
Итог = 0,4 * ДЗ + 0,4 * ИП + 0,1 * Посещаемость + 0,1 * Активность на занятии
Рекомендательные системы
Лекция 1
Введение в рекомендательные системы. Методы оценки качества рекомендаций
Лекция 2
Модели на основе эвристик. Коллаборативная фильтрация: KNN-подходы и линейные модели. Валидация моделей
Лекция 3
Коллаборативная фильтрация: матричная факторизация. Приближённый поиск соседей
Лекция 4
Гибридные модели с использованием контента
Лекция 5
Двух-этапный пайплайн: задача реранжирования градиентным бустингом
Лекция 6
Deep Learning в рекомендательных системах. Трансформеры в sequential рекомендациях.
Лекция 7
Продуктивизация рекомендаций и инфраструктура. Offline, Nearline и Online сценарии рекомендаций. A/B тесты
Итог = ДЗ*0,3+Проект*0,7
Разработка микросервисов на Go
Разработка микросервисов на Go
Методы и системы обработки больших данных
Методы и системы обработки больших данных
Введение в платформы данных
Computer vision (in English)
DevOps
Машинное обучение в прикладных задачах
Машинное обучение в прикладных задачах
Модуль 1 - Оптимизация взаимодействия с клиентом
Модуль 2 - Оптимизация расходов бизнеса
Модуль 3 - Обзор применений по отраслям