• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

В основе компьютерных наук лежит математика

Все больше компаний используют методы анализа данных для решения различных задач, и профессия “Специалист по машинному обучению” становится все более востребованной на рынке. Выпускник 2015 года магистерской программы “Науки о данных”, а ныне сотрудник компании Рамблер Борис Коваленко рассказал о том, какие знания нужны специалистам по машинному обучению, как пройти собеседование в одну из крупнейших ИТ-компаний, и поделился своими планами на будущее.

Машинное обучение в Рамблере

Rambler&Co  крупнейший медиа холдинг в рунете. В него входят такие проекты как сайт Рамблер, журнал Афиша, Живой Журнал, новостные сайты Лента.ру и Газета.ру и другие. Большая часть прибыли компании — это интернет-реклама. Показывать релевантную рекламу в интернете — высокотехнологичная задача. Для рекламодателей важно, чтобы реклама была интересна тому, кто ее видит.  Наш отдел занимается повышением качества таргетинга и созданием новых инструментов для рекламодателей, важную роль играют рекомендательные системы. Я занимаюсь исследованиями и разработками в области поведенческой рекламы, это интересная и довольно сложная задача. Работа в отделе машинного обучения  это работа по профессии, и это та область, которая мне очень интересна.

Собеседование и работа в одной из крупнейших ИТ-компаний

Я откликнулся на открытую вакансию и меня позвали на собеседование. Оно было довольно сложным: мои будущие коллеги задавали теоретические вопросы по алгоритмам и машинному обучению, были задачи на знание языка Python, который является основным инструментом прототипирования и разработки.

В первый день работы HR Нина, участвовавшая в моем собеседовании, устроила мне небольшую экскурсию по офису. Затем, через несколько дней, у новичков был сбор, на котором нам рассказали о компании, ее истории и задачах.

В Рамблере утро начинается с 10-12 часов дня, многие приходят позже, чтобы поработать вечером, когда шум оупенспейса стихает. Офис отличный, находится на Даниловской мануфактуре. Это довольно красивый, джентрифицированный уголок Москвы. В отделе работают отличные люди с багажом знаний, опыта и чувством юмора.

Где получить необходимые знания по машинному обучению

В Станкине я получил степень бакалавра по довольно интересному направлению  мехатронике. Эта область в машиностроении зародилась относительно недавно. Ее суть во внедрении компьютерных технологий и элементов искусственного интеллекта в различные машины, одним из примеров являются роботы.

На старших курсах я начал работать в лаборатории университета, работа была интересной и платили достаточно для студента. Но мне не хватало математики и программирования, большая часть работы заключалась в интеграции различных модулей в единое целое. Поэтому я решил искать магистратуру, связанную с прикладной математикой. После довольно долгого поиска я остановил свой выбор на программе “Науки о данных” в НИУ ВШЭ: магистерская программа мне понравилась своими предметами и общим направлением.

Пожалуй, все предметы были для меня полезны,  прикладные развивали мои навыки, теоретические развивали общее мышление. Я с благодарностью вспоминаю профессоров и преподавателей: Ф.Т. АлескеровА.С. БеленькийД.П. ВетровЕ.Р. ГоряиноваЛ.Е. ЖуковА.Е. ЛепскийБ.Г. Миркин, В.В. ПодиновскийА.Г. Федотов. Это были тяжелые два года. Один из плюсов обучения в Вышке — возможность составлять учебный план, исходя из своих желаний, я пытался его сбалансировать между теоретическими и практическими курсами. Большая часть прикладных курсов оказалась очень полезна, теоретические курсы помогли выработать правильный образ мышления, заточенный на решение поставленной задачи.

Из особенностей обучения стоит отметить большой упор на самостоятельное изучение дисциплин. Например, в курсе Ф.Т. Алескерова одна лекция эквивалента одной главе книги. Понятно, что всю главу за лекцию пересказать невозможно, это скорее обзорное знакомство с материалом. Поэтому основное изучение происходило самостоятельно. А это 50-80 страниц текста в неделю, в основном доказательства теорем на английском языке. Двигаться с такой скоростью было сложно.  Большие домашние задания, например, в курсах Л.Е. Жукова, являются основной работой студента. Примером может быть программирование моделей случайных графов или марковских цепей. Такие задания занимают от 2 до 5 дней работы по 8 часов в день, включая написание кода и интерпретации результатов экспериментов.

Очень полезен опыт, полученный во время стажировки, которую я прошел в конце первого курса  в компании Double Data. Там я занимался исследованием свойств социального графа для задачи банковского скоринга.

Цели на будущее

Главная цель для меня на ближайшие несколько лет  развитие компетенций и получение опыта в создании промышленных систем, использующих методы машинного обучения. Область анализа данных бурно развивается, постоянно появляются оригинальные подходы к решению задач и новые инструменты. Изучение новых теорий и практик также является важным приоритетом.

Совет нынешним студентам, которые хотят в будущем заниматься машинным обучением

В основе компьютерных наук лежит математика. Обратите больше внимания на линейную алгебру, теорию вероятностей и другие математические дисциплины. На ФКН очень сильная команда преподавателей с большим спектром курсов, связанных с машинным обучением, так что тут проблем нет. Самые современные методы и алгоритмы можно изучить с помощью материалов, которые выкладываются различными научными группами в интернете.

Как и в любом деле, практика отличается от теории, и получить опыт практического применения алгоритмов и моделей можно на таких сайтах как Kaggle.com, Hackerrank.com и другие. Стажировка в стартапах или крупных компаниях также поможет с изучением инструментария, который используется в индустрии.


 

А для тех, кому интересно больше узнать об инструментах, которые используются в отделе машинного обучения компании Rambler&Co, 12 октября пройдет ИТ-лекторий "Yet Another Data Scientist Toolbox. Focusing on agility and speed".