Семинар лаборатории LAMBDA «Введение в Spark»

Продолжение серии семинаров лаборатории LAMBDA. 
Была учтена обратная связь, полученную после первой встречи, и вторая встреча была посвящена знакомству с Apache Spark.
На практике задачи машинного обучения идут рука об руку с проблемой больших данных, при которой требуемые для обработки объемы памяти выходят за рамки одной машины.
Одним из инструментов решения этой проблемы является активно набирающий популярность проект Apache Spark.

На семинаре были кратко освещены некоторые задачи, связанные с большими данными, система Hadoop, идеология Map-Reduce.
Основное время было посвящено введению в Spark, знакомству с библиотекой машинного обучения MLlib, входящей в состав, решению практических задач на их основе.

Докладчики: Устюжанин Андрей, Максим Борисяк (практикант лаборатории)

Материалы семинара