Семинар лаборатории LAMBDA "Введение в Spark"
Продолжаем серию семинаров лаборатории LAMBDA.
Мы учли обратную связь, полученную после первой встречи, и хотим посвятить вторую встречу знакомству с Apache Spark.
На практике задачи машинного обучения идут рука об руку с проблемой больших данных, при которой требуемые для обработки объемы памяти выходят за рамки одной машины.
Одним из инструментов решения этой проблемы является активно набирающий популярность проект Apache Spark.
На семинаре будут кратко освещены некоторые задачи, связанные с большими данными, система Hadoop, идеология Map-Reduce.
Основное время будет посвящено введению в Spark, знакомству с библиотекой машинного обучения MLlib, входящей в состав, решению практических задач на их основе.
Предполагаемый уровень участников: базовое понимание языка python, основы статистики.
Плюсом будут знание языка Scala и понимание основ функционального программирования.
Место проведения: Кочновский проезд, 3, аудитория 327
Докладчики: Устюжанин Андрей, Максим Борисяк (практикант лаборатории)
Задать дополнительные вопросы по мероприятию и заказать пропуск можно по адресу aglazistov@hse.ru