Основы инжиниринга данных и высоконагруженного машинного обучения
Преподаватель: Трубаков Антон Юрьевич
Модуль: 1-2
Кредиты: 3
Аннотация:
Курс “Intro to Data Engineering and High Load ML” является обзорным курсом, рассказывающим об основах работы с высоконагруженными системами, работающими с большими потоками данных. В курсе содержится обзор инструментов работы с большими данными, позволяющими реализовать хранение и обработку данных, а также создание ML моделей с использованием большого объема данных. Основные инструменты: Apache Spark, Apache Kafka, Apache Flink, Docker, также некоторое внимание уделяется основам MLOps и работе с NoSQL базами данных.
Пререквизиты: Базовые знания основных ML моделей
Для кого: Студенты 3-4 курсов любых ОП