Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.
Адрес: 109028, г. Москва, Покровский бульвар, д. 11
Телефон: +7 (495) 531-00-00 *27254
Email: computerscience@hse.ru
Факультет готовит разработчиков и исследователей. Программа обучения сформирована с учётом опыта ведущих американских и европейских университетов, таких как Stanford University (США) и EPFL (Швейцария), а также Школы анализа данных — одной из самых сильных магистратур в области computer science в России. Широкий список курсов по выбору и значительная доля программы, выделенная под них, позволит каждому студенту сформировать свою собственную образовательную траекторию. В основе обучения — практика и проектная работа.
Bondarenko A., Ajjour Y., Dittmar V. et al.
In bk.: WSDM 2022 - Proceedings of the 15th ACM International Conference on Web Search and Data Mining. Association for Computing Machinery (ACM), 2022. P. 66-74.
Belomestny Denis, Iosipoi L., Paris Q. et al.
Bernoulli: a journal of mathematical statistics and probability. 2022. Vol. 28. No. 2. P. 1382-1407.
Puchkin N., Zhivotovskiy N.
In bk.: Proceedings of Machine Learning Research. Vol. 134: Conference on Learning Theory. PMLR, 2021. P. 3806-3832.
Derkach D., Maevskiy A., Karpov M. et al.
Journal of High Energy Physics. 2022. P. 1-38.
In bk.: ESEC/FSE 2021: Proceedings of the 29th ACM Joint Meeting on European Software Engineering Conference and Symposium on the Foundations of Software Engineering. Association for Computing Machinery (ACM), 2021. P. 703-715.
Когда речь заходит о построении моделей, мы всегда имеем дело с повторением непростых процессов выбора/обучения/настройки/подтверждения/тестирования алгоритма. И сложность заключается в том, что в большинстве случаев результат всей этой работы - это длиннющий код на языке Python в Jupyter notebook. Ну, так себе...
Даже если разработка моделей - это основа всего, не менее важно сохранить чистоту и структуру кода. Стало быть, деление кода на модули, отвечающие за отдельные процессы (например, модели машинного обучения), и создание небольшого скрипта для их запуска может существенно упростить работу не только с точки зрения навигации по коду, но и с точки зрения корректировки/замены модулей без прерывания самого процесса.
Цель занятия - продемонстрировать вам типовую архитектуру проекта в области анализа данных. По итогам занятия вы сможете самостоятельно создавать простые, но правильно структурированные цепочки процессов в docker-контейнере, начиная с ввода и предварительной обработки данных и до построения, настройки и оценки моделей.
Обратите внимание, что речь пойдет не о построении моделей, а, скорее, о правильной архитектуре, которая поможет усовершенствовать процесс. Поэтому, чтобы получить максимум пользы от занятия, участники должны иметь некоторое представление о языке программирования Python (классы, функции, библиотека sklearn) и хотя бы в общих чертах представлять себе процесс машинного обучения.
После лекции мы расскажем о возможностях для стажировки в группе технологического консалтинга EY и ответим на все ваши вопросы.
Когда: 20 апреля в 18:00-20:00.
Для эффективного занятия участники должны иметь представление о языке программирования Python (классы, функции, библиотека sklearn) и хотя бы в общих чертах представлять себе процесс машинного обучения.