E-mail: info@teta.mts.ru
На данный момент кафедра разрабатывает курсы, записаться на которые можно во время кампании курсов по выбору. Курсы кафедры охватывают актуальные темы в области генеративных моделей ИИ, больших данных и инфраструктуры для больших данных, а ведут их действующие IT-специалисты МТС, среди которых есть руководители больших команд и CTO продуктов. Однако важно отметить, что отдельно взятый курс может запускаться не ежегодно, а в зависимости от актуальности тем и доступности экспертов.
Линейка дисциплин обновляется и расширяется, предлагая новые учебные курсы с акцентом на практикоориентированность, которую позволяет гарантировать экспертиза действующих сотрудников МТС. Это означает, что каждый учебный год может предложить что-то актуальное и востребованное на рынке, без гарантии повторения курсов в будущем.
Список курсов и освещаемые в них темы, подготовленные базовой кафедрой МТС:
Введение в платформы данных
Асинхронный курс на MTS Link, регулярные семинары и консультации
Практические задания выполняются на вычислительных ресурсах MWS
4 курс, 1–2 модули
Курс посвящен платформам данных, которые упрощают задачи с данными, предоставляя инфраструктуру и инструменты для их загрузки, обработки и анализа. Вы изучите основные концепции платформ данных, научитесь развертывать платформу и организовывать полный цикл работы с данными: от загрузки до анализа. Рассматриваются технологии Big Data, Data Warehouse, Data Lake и Data Governance, с акцентом на Hadoop и Spark. Вы освоите компоненты Hadoop, архитектуру кластера и HDFS, а также работу с Spark DataFrame API и Spark SQL API.
Теоретическая часть представлена в виде онлайн-лекций, а практическая часть проходит при поддержке преподавателей. В рамках курса также предусмотрены QA-сессии для получения ответов на возникающие вопросы.
Причины появления инструментов обработки больших данных. Какие задачи они решают
Компоненты Hadoop и архитектура кластера
HDFS (Hadoop Distributed Filesystem)
Развертывание Hadoop и базовые операции ФС
Парадигма MapReduce
YARN
Форматы файлов
Другие проекты экосистемы Hadoop
Hive: назначение, структура, компоненты
Развертывание Hive и операции с ним
HiveQL и организация данных
Сравнение с традиционными RDBMS
Spark, архитектура и назначение
Развертывание кластера Spark
Spark DataFrame API
Spark SQL API
Взаимодействие между компонентами Hadoop
Средства организации ETL-процессов
DBT, Prefect, NiFi
Сравнение различных инструментов ETL
Способы организации хранилищ: DataLake DataWarehouse, Lakehouse
Greenplum
Clickhouse
Kafka
DQ
DatGov
BI
Выполняются на вычислительных ресурсах MWS
Развертывание Hadoop
Развертывание кластера YARN и выполнение распределенного MapReduce
Развертывание Hive
Развертывание кластера Spark
Развертывание Airflow, реализация ETL процесса с его применением
Работа с Greenplum
Работа с DQ
Работа с BI
Итог = 1,0 * Средн.арифм(ДЗ)
Проектирование и эксплуатация систем машинного обучения
4 курс, 1–2 модули
Курс «MLOps и ML Systems» посвящён построению и эксплуатации систем машинного обучения в продакшне. Студенты познакомятся с жизненным циклом ML-систем, научатся проектировать пайплайны обработки данных, разрабатывать и деплоить модели, внедрять CI/CD для ML и организовывать мониторинг качества. В курсе уделяется внимание не только алгоритмам, но и инженерным аспектам: инфраструктуре, хранению данных, потоковым системам и интерпретируемости моделей. Для выполнения практических заданий студентам будут предоставлены виртуальные машины MWS Cloud.
Формула итоговой оценки = 0.6 × (среднее арифм. ДЗ 1-6) + 0.4 × (итоговый проект)
Машинное обучение в прикладных задачах
3 курс, 1–2 модули
Курс посвящён специфике применения машинного обучения в широком наборе отраслей бизнеса
Модуль 1 — Оптимизация взаимодействия с клиентом
Модуль 2 — Оптимизация расходов бизнеса
Модуль 3 — Обзор применений по отраслям
Сумма баллов за домашние задания нормируется на шкалу от 0 до 10
Прикладные задачи видеоаналитики
3 курс, 3-4 модули
Дисциплина посвящена анализу и применению современных архитектур компьютерного зрения в реальных прикладных сценариях и ориентирована на формирование у студентов инженерного мышления полного жизненного цикла CV-систем: от постановки задачи и подготовки данных до выбора архитектуры, обучения, оптимизации и развёртывания решения, пригодного для интеграции в производственные пайплайны.
Курс показывает, как фундаментальные методы и модели, изучаемые в базовых курсах (свёрточные сети, трансформеры для зрения, модели внимания, типовые фреймворки детекции и сегментации), используются в прикладных задачах и какие ограничения возникают при переносе академических решений в реальные условия. Особое внимание уделяется факторам успешной интеграции: качеству данных и протоколов валидации, устойчивости к доменному сдвигу, воспроизводимости, масштабируемости, а также инженерной инфраструктуре инференса, мониторинга качества и регрессионного контроля.
В рамках дисциплины рассматриваются типовые классы прикладных задач: классификация и детекция объектов в промышленности и медицине, анализ видеопотоков в системах безопасности и транспорта, визуальный контроль качества, элементы 3D-восприятия для робототехнических систем, а также мультимодальные и open-vocabulary подходы, соединяющие зрение с языковыми моделями. Важной частью курса является критическое сравнение академических и индустриальных подходов: почему одни решения сохраняются в исследовательских прототипах, а другие становятся частью сервисов и продуктов.
0.2 × Домашнее задание 1 + 0.2 × Домашнее задание 2 + 0.6 × Итоговый проект
Интеллектуальные агентные системы на базе языковых моделей
4 курс, 3 модуль
В эпоху больших языковых моделей (LLM) фокус смещается от создания единичных ML-моделей к разработке автономных интеллектуальных агентов, способных рассуждать, планировать и взаимодействовать с инструментами для решения сложных задач. Этот курс посвящен проектированию и реализации мультиагентных систем, которые автоматизируют полный цикл работы Data Scientist'а - от исследования данных (EDA) до построения, валидации и развертывания моделей. Курс построен на практическом подходе: студенты изучат ключевые архитектурные паттерны, такие как ReAct, Chain-of-Thought и BDI, и научатся применять ведущие фреймворки (AutoGen, LangGraph, LlamaIndex) для создания собственных систем. Особое внимание уделяется интеграции RAG-систем для работы со знаниями, механизмам координации и коммуникации между агентами, а также вопросам безопасности, оценки и развертывания в production. Кульминацией курса станет разработка в командах мультиагентной системы для автоматического решения задачи бинарной классификации на соревновании формата Kaggle. Студенты пройдут путь от идеи до реализации готового, надежного и документированного решения, готового к реальным вызовам.
Итоговая оценка = Оценка за итоговый проект
Рекомендательные системы
4 курс, 3 модуль
Recommender systems are a key component of modern digital services, helping users navigate vast amounts of information and find the most relevant products, movies, music, or other types of content. This course explores the principles behind such systems, their classical and modern algorithms, as well as practical approaches to designing and deploying them in real-world products.
The curriculum covers collaborative filtering and matrix factorization methods, neural network architectures including transformers, as well as feature engineering techniques and solutions to the cold-start problem. Special attention is given to recommendation quality metrics, validation methodologies, and A/B testing, enabling a deeper understanding of the strengths and limitations of various approaches.
The course combines theoretical foundations with practical assignments involving modern libraries such as RecTools, LightFM, and PyTorch. This integrated approach enables students not only to master basic models but also to develop skills in using industrial tools. Upon completion, participants will be able to design and adapt recommendation algorithms for various business needs, interpret experimental results, and propose improvements for production systems.
Computer Vision
4 курс, 3 модуль
Nowadays, digital signals, images and videos appear almost everywhere, both in a plethora of scientific (e.g., astronomical, biomedical) and consumer applications (e.g., computational photography, computer vision, VR/AR etc.). Therefore, the ability to analyze and process digital signals and images is an extremely important skill for engineering/science students to acquire. Indeed, digital signal processing and analysis is mainly responsible for the multimedia technology revolution that we are experiencing today and form the basis of the computational tools and techniques that are extensively utilized by modern deep learning systems. Among important tasks that signal processing techniques can successfully deal with, are inverse problems, such as image/video enhancement and restoration, image recovery, and 3D reconstruction.
This course will cover fundamental concepts of digital signal processing and computational imaging methods and describe how these concepts are applied in practice to solve a variety of existing problems. We will provide a mathematical framework to describe and analyze images as two- or three-dimensional signals in the spatial and frequency domains. The students will become familiar with the theory behind fundamental processing tasks including image enhancement, recovery and reconstruction. They will also learn how to perform these key processing tasks in practice using current state-of-the-art techniques and computational tools. A wide variety of such tools will be introduced including large-scale optimization algorithms and regularization methods. Further, emphasis will be given to highlight the connections between classical signal processing and computational methods with modern deep learning neural networks. Such connections will help the students to better understand the origins of some of the most successful deep learning tools and architectures that currently exist in the fields of computer vision and image processing.
Итог = сумма домашек/n * 0,6 + итоговый проект * 0,4
Gen AI
Общеуниверситетский факультатив
Программа обучения по GenAI подойдет как для тех, кто только начал изучение данной темы, так и для тех, кто хочет углубить свои знания в области генеративного искусственного интеллекта. В рамках программы предусмотрено два трека обучения: бизнес-трек (для начинающих) и научный трек (для тех, кто уже владеет основами ИИ)
В рамках курса студенты изучат историю и текущее состояние ИИ, а также перспективы его развития. Бизнес-трек фокусируется на практических навыках, таких как управление разработкой AI-продуктов, промпт-инжиниринг, fine-tuning и использование инструментов сборки AI-продуктов, включая инновационные подходы, такие как Lang Chai. Научный трек предоставляет углубленное изучение современных методов, включая GAN, трансформеры, diffusion models, а также рассматривает перспективные архитектуры.
В завершение курса студенты смогут применить полученные знания на практике: студенты из научного и бизнес направлений объединяются в смешанные команды, чтобы разработать собственный продукт.
0,4*(среднее арифм. ДЗ по бизнес части) + 0,4*(среднее арифм. ДЗ по научной части) + 0,2*защита проекта
Разработка микросервисов на Go
3 курс, 1–2 модули
Курс «Разработка микросервисов на Go» предлагает изучение основ языка Go и микросервисной архитектуры. Вы научитесь настраивать локальное окружение, работать с REST API, а также организовывать взаимодействие между сервисами через gRPC, Kafka и REST. Курс ориентирован на практику: вы будете выполнять задания, начиная с разработки HTTP сервера и клиента, заканчивая созданием системы бронирования отелей, чтобы освоить ключевые навыки разработки микросервисов.
В МТС Go используется для решения огромного количества различных задач, включающих в себя работы с инфраструктурой, парсинг и формирование продуктовых корзин, распараллеливание долгих операций синхронизации и прочее.
Но это не единственная область применения Go. На нем также разрабатываются обычные продуктовые сервисы, к примеру, корпоративные.
В HR Tribe backend всех продуктов реализовывается на Go. Он принят за стандарт и позволяет очень быстро сделать прототип сервиса и начать обкатывать на нем свои гипотезы.
История и идеология Go
Основы Go
Основы WEB для разработчиков
Стандартные библиотеки и практики Go
Архитектура систем
Реляционные БД, PostgreSQL
Архитектура на уровне приложения Go
Асинхронное взаимодействие, Kafka/Rabbit/NATS
Контроль качества кода
Наблюдаемость
Concurrency
Q/A сессия
Общая теория по СУБД
Напутствие и road map развития
Разработать систему бронирования номеров. Сервисы должны удовлетворять контрактам из репозитория.
Разработать схемы для хранения данных, написать миграции и заполнить базы данных тестовыми данными.
Итог = 0,3 * ДЗ + 0,3 * Экзамен + 0,4 * Итоговый проект,
где ДЗ – средняя оценка за все домашние задания
Введение в платформы данных
Асинхронный курс на MTS Link, регулярные семинары и консультации
Практические задания выполняются на вычислительных ресурсах MWS
4 курс, 1–2 модули
Курс посвящен платформам данных, которые упрощают задачи с данными, предоставляя инфраструктуру и инструменты для их загрузки, обработки и анализа. Вы изучите основные концепции платформ данных, научитесь развертывать платформу и организовывать полный цикл работы с данными: от загрузки до анализа. Рассматриваются технологии Big Data, Data Warehouse, Data Lake и Data Governance, с акцентом на Hadoop и Spark. Вы освоите компоненты Hadoop, архитектуру кластера и HDFS, а также работу с Spark DataFrame API и Spark SQL API.
Теоретическая часть представлена в виде онлайн-лекций, а практическая часть проходит при поддержке преподавателей. В рамках курса также предусмотрены QA-сессии для получения ответов на возникающие вопросы.
Причины появления инструментов обработки больших данных. Какие задачи они решают
Компоненты Hadoop и архитектура кластера
HDFS (Hadoop Distributed Filesystem)
Развертывание Hadoop и базовые операции ФС
Парадигма MapReduce
YARN
Форматы файлов
Другие проекты экосистемы Hadoop
Hive: назначение, структура, компоненты
Развертывание Hive и операции с ним
HiveQL и организация данных
Сравнение с традиционными RDBMS
Spark, архитектура и назначение
Развертывание кластера Spark
Spark DataFrame API
Spark SQL API
Взаимодействие между компонентами Hadoop
Средства организации ETL-процессов
DBT, Prefect, NiFi
Сравнение различных инструментов ETL
Способы организации хранилищ: DataLake DataWarehouse, Lakehouse
Greenplum
Clickhouse
Kafka
DQ
DatGov
BI
Выполняются на вычислительных ресурсах MWS
Развертывание Hadoop
Развертывание кластера YARN и выполнение распределенного MapReduce
Развертывание Hive
Развертывание кластера Spark
Развертывание Airflow, реализация ETL процесса с его применением
Работа с Greenplum
Работа с DQ
Работа с BI
Итог = 1,0 * Средн.арифм(ДЗ)
Машинное обучение в прикладных задачах
Курс посвящён специфике применения машинного обучения в широком наборе отраслей бизнеса
Модуль 1 — Оптимизация взаимодействия с клиентом
Модуль 2 — Оптимизация расходов бизнеса
Модуль 3 — Обзор применений по отраслям
Сумма баллов за домашние задания нормируется на шкалу от 0 до 10
Computer vision
Nowadays, digital signals, images and videos appear almost everywhere, both in a plethora of scientific (e.g., astronomical, biomedical) and consumer applications (e.g., computational photography, computer vision, VR/AR etc.). Therefore, the ability to analyze and process digital signals and images is an extremely important skill for engineering/science students to acquire. Indeed, digital signal processing and analysis is mainly responsible for the multimedia technology revolution that we are experiencing today and form the basis of the computational tools and techniques that are extensively utilized by modern deep learning systems. Among important tasks that signal processing techniques can successfully deal with, are inverse problems, such as image/video enhancement and restoration, image recovery, and 3D reconstruction.
This course will cover fundamental concepts of digital signal processing and computational imaging methods and describe how these concepts are applied in practice to solve a variety of existing problems. We will provide a mathematical framework to describe and analyze images as two- or three-dimensional signals in the spatial and frequency domains. The students will become familiar with the theory behind fundamental processing tasks including image enhancement, recovery and reconstruction. They will also learn how to perform these key processing tasks in practice using current state-of-the-art techniques and computational tools. A wide variety of such tools will be introduced including large-scale optimization algorithms and regularization methods. Further, emphasis will be given to highlight the connections between classical signal processing and computational methods with modern deep learning neural networks. Such connections will help the students to better understand the origins of some of the most successful deep learning tools and architectures that currently exist in the fields of computer vision and image processing.
Итог = сумма домашек/n * 0,6 + итоговый проект * 0,4
DevOps
Курс «DevOps: методология и практика» — это вводный и практико-ориентированный курс, состоящий из 7 лекций и 7 семинаров, разработанный совместно с экспертами МТС. Он охватывает основные принципы DevOps, направленные на минимизацию бизнес-рисков, связанных с разработкой и управлением IT-инфраструктурой, а также обучение современным инструментам DevOps, включая CI/CD, контейнеризацию и автоматизацию. Курс включает теоретические и практические компоненты, обеспечивающие студентов актуальными знаниями и навыками для успешного выполнения задач DevOps инженера, а также ориентирован на развитие навыков работы с GitLab и навыков развертывания приложений. Программа нацелена на подготовку студентов к решению бизнес-задач с помощью DevOps методологий и инструментов, что способствует их профессиональному росту.
Итог = Итоговый тест*0,2 + Итоговое задание*0,3 + Защита проекта*0,1 + Дз1*0,1 + Дз2*0,1 + Дз3*0,1+ Дз4*0,1
Методы и системы обработки больших данных
В рамках курса студенты узнают о различных видах программных решений, используемых при работе с большими данными: фреймворке hadoop и его составляющих, MPP СУБД Greenplum, СУБД Clickhouse, Apache Airflow и других инструментах. Узнают какие задачи решают инженеры данных и какие приемы используют. Студенты на практике реализуют несколько ETL процессов, с помощью указанных выше инструментов.
Gen AI
Программа обучения по GenAI подойдет как для тех, кто только начал изучение данной темы, так и для тех, кто хочет углубить свои знания в области генеративного искусственного интеллекта. В рамках программы предусмотрено два трека обучения: бизнес-трек (для начинающих) и научный трек (для тех, кто уже владеет основами ИИ)
В рамках курса студенты изучат историю и текущее состояние ИИ, а также перспективы его развития. Бизнес-трек фокусируется на практических навыках, таких как управление разработкой AI-продуктов, промпт-инжиниринг, fine-tuning и использование инструментов сборки AI-продуктов, включая инновационные подходы, такие как Lang Chai. Научный трек предоставляет углубленное изучение современных методов, включая GAN, трансформеры, diffusion models, а также рассматривает перспективные архитектуры.
В завершение курса студенты смогут применить полученные знания на практике: студенты из научного и бизнес направлений объединяются в смешанные команды, чтобы разработать собственный продукт.
Итог = 0,4 * ДЗ + 0,4 * ИП + 0,1 * Посещаемость + 0,1 * Активность на занятии
Рекомендательные системы
Лекция 1
Введение в рекомендательные системы. Методы оценки качества рекомендаций
Лекция 2
Модели на основе эвристик. Коллаборативная фильтрация: KNN-подходы и линейные модели. Валидация моделей
Лекция 3
Коллаборативная фильтрация: матричная факторизация. Приближённый поиск соседей
Лекция 4
Гибридные модели с использованием контента
Лекция 5
Двух-этапный пайплайн: задача реранжирования градиентным бустингом
Лекция 6
Deep Learning в рекомендательных системах. Трансформеры в sequential рекомендациях.
Лекция 7
Продуктивизация рекомендаций и инфраструктура. Offline, Nearline и Online сценарии рекомендаций. A/B тесты
Итог = ДЗ*0,3+Проект*0,7
Разработка микросервисов на Go
Разработка микросервисов на Go
Методы и системы обработки больших данных
Методы и системы обработки больших данных
Введение в платформы данных
Computer vision (in English)
DevOps
Машинное обучение в прикладных задачах
Машинное обучение в прикладных задачах
Модуль 1 - Оптимизация взаимодействия с клиентом
Модуль 2 - Оптимизация расходов бизнеса
Модуль 3 - Обзор применений по отраслям