Летняя практика
В ходе прохождения практики студенты смогут познакомиться с реальными научно-техническими задачами, требующими от студентов погружения в интересную предметную область и владение соответствующими навыками в областях анализа данных, машинного обучения и/или разработки программного обеспечения. Работа над проектами может проходить на взаимовыгодной основе. Подробности можно узнать по адресу ntalaikova@hse.ru
Проекты 2020:
Название проекта |
Описание проекта |
Пререквизиты |
Уровень студентов |
Количество мест |
Competition X-ray tomography Маевский Артем Сергеевич |
Автоматизировать определение положения оси вращения в томографии 1) Изучить существующие подходы определения положения оси вращения в томографии |
python, ML, torch/tf |
Бакалавриат (4+) Магистратура |
1-3 |
Уточнение каталога масс галактических скоплений Зароднюк Алена Владимировна |
Уточнение каталога масс галактических скоплений 1) задача кластеризации галактик по галактическим скоплениям; |
Знание машинного обучения, нейронных сетей, pytorch, keras |
Бакалавриат (3+) Магистратура |
2-3 |
Прогнозирование временных рядов Гущин Михаил Иванович |
Прогнозирование временных рядов Применение нескольких современных методов прогнозирования временных рядов и сравнение их точности. |
Знание машинного обучения, нейронных сетей, pytorch. Знание методов анализа временных рядов будет большим плюсом. |
Бакалавриат (4+) Магистратура |
1-2 |
Поиск аномалий во временных рядах Гущин Михаил Иванович |
Поиск аномалий во временных рядах Применение современных методов детектирования и устранения аномалий во временны рядах. |
Знание машинного обучения. Знание методов анализа временных рядов будет большим плюсом. |
Бакалавриат (4+) Магистратура |
1-2 |
Систематика в GAN Ратников Федор Дмитриевич |
Систематика в GAN 1) реализовать метод оценки погрешности |
Глубокое обучение |
Бакалавриат (4+) Магистратура |
1-3 |
CaloGAN Ратников Федор Дмитриевич |
Построение объединенной модели VAE и GAN 1) подбор архитектурные вариационного автоэнкодера |
Глубокое обучение |
Бакалавриат (3+) Магистратура |
4 |
Визуализации Устюжанин Андрей Евгеньевич |
Визуализации работы GAN, Isolation Forest, алгоритма 1+\epsilon 1) создать интерактивную демонстрацию работы GAN, 2) создать интерактивную демонстрацию работы Isolation Forest, 3) создать интерактивную демонстрацию алгоритма 1+\epsilon |
посмотреть https://distill.pub/ |
Бакалавриат (2+) |
1-3 |
Adversarial Augmentation Борисяк Максим Александрович |
Adversarial Augmentation 1) изучение текущего состояния литературы; |
torch/tf, GANs |
Бакалавриат (5+) Магистратура |
1 |
Adversarial Normalization Борисяк Максим Александрович |
Adversarial Normalization 1) изучение текущего состояния литературы; |
torch/tf, GANs |
Бакалавриат (5+) Магистратура |
1 |
Обзор подходов feature importance для нейронных сетей Рыжиков Артем Сергеевич |
Исследование методов определения feature importance для полносвязных сетей и применить их к задаче классификации частиц (PID) 1) исследовать существующие подходы определения feature importance в нейросетях |
torch |
Бакалавриат (3+) Магистратура |
1 |
RICH generators: дифференцируемые деревья, GAN-VAE, skip-connections Казеев Никита Александрович |
RICH generators: дифференцируемые деревья, GAN-VAE, skip-connections Построить быструю точную генеративную модель для задачи мделирования отклика детектора, https://www.popmech.ru/science/news-468032-sozdana-neyroset-uskoryayushchaya-poisk-novyh-chastic-na-lhc/ |
Deep learning |
Бакалавриат (5+) Магистратура |
1 |
Сети vs деревья Казеев Никита Александрович |
Сравнить качество работы нейросетей и градиентного бустинга |
Предрасположенность к программированию и скриптам, не исследованиям |
Бакалавриат (3+) Магистратура |
1 |
Probabilistic process mining Карпов Максим Евгеньевич |
Probabilistic process mining 1) Изучить текущее состояние state-of-the-art вероятностных подходов в process mining |
Машинное обучение, глубинное обучение, знание Python, Pytorch, обработка текстов, регулярные выражения Желательно, но не обязательно: процесс майнинг, анализ логов |
Бакалавриат (3+) Магистратура |
1-3 |
NL2ML Хатбуллина Лейля Равилевна |
Работа над NL2ML корпусом. Улучшение существующих моделей и сбор данных для других вершин графа. 1) улучшение классификации по тэгам |
Python, ML |
Бакалавриат (2+) Магистратура |
1-3 |
BigSister Хатбуллина Лейля Равилевна |
BigSister: система отслеживания прогресса и для мотивации студентов 1) прототип рекомендательной системы |
Java/Scala, software engineering |
Бакалавриат (1+) Магистратура |
1-3 |
RICH distillation Артемьев Максим Радикович |
RICH distillation 1) Научить глубокий ган |
DL, Python, опыт работы с ганами/потоками, Желательно: опыт работы с табличными данными, Очень важно: высокая степень автономности) |
Бакалавриат (3+) Магистратура |
2 |
RICH NF Артемьев Максим Радикович |
RICH NF: работа с глубокими потоками в продолжение и развитие уже имеющихся результатов 1) Научить глубокие потоки (5 штук) |
DL, Python, опыт работы с ганами/потоками, Желательно: опыт работы с табличными данными, Очень важно: высокая степень автономности) |
Бакалавриат (3+) Магистратура |
2 |
Проекты прошлых лет:
— Проекты 2018
Название проекта и контактное лицо | Описание проекта | Знание Программ | Уровень студентов | Количество мест |
Разработка алгоритма сжатия данных о треках частиц эксперимента LHCb Устюжанин Андрей Евгеньевич ( austyuzhanin@hse.ru ) | С 2022 года БАК начнет работать в режиме бо́льшей светимости, это будет означать что необходимо обработать гораздо больше данных, чем обрабатывается сейчас. Одно из узких мест обработки - объемы передаваемой информации о траекториях частиц, зарегистрированных экспериментом. В рамках данного проекта предлагается разработать алгоритм сжатия этой информации нейроморфными методами. Проект ведется совместно с коллегами из MIT. Более подробное описание доступно в слайдах Константина Вейсера | Python.Neural Nets (Autoencoders) | Магистратура | 1-2 |
Поиск стратегии управления квантовым компьютером Устюжанин Андрей Евгеньевич ( austyuzhanin@hse.ru ) | Управление базовыми компонентами квантовых компьютеров - резонаторами - требует учета большого количества факторов, которые сложно оценить исходя из теоретических или численных моделей. В рамках данного проекта предлагается развить подход обучения с подкреплением для повышения точности управления. Проект выполняется совместно с МФТИ. | PythonМетоды Reinforcement Learning | Магистратура | 1-2 |
Поиск двойных гамма-звезд Устюжанин Андрей Евгеньевич ( austyuzhanin@hse.ru ) | Двойные звезды, излучающие в гамма-диапазоне - довольно редки. Тем не менее такие звезды представляют большой интерес для астрономического сообщества. В рамках данного проекта предлагается проанализировать информацию из различных звездных каталогов для сопоставления сигнатур различных небесных объектов и составления списка кандидатов на роль двойных звезд. Проект выполняется совместно с коллегами из Dublin City University и Institut fur Astronomie und Astrophysik Tubingen. | PythonScikit-learn | БакалавриатилиМагистратура | 1-2 |
Классификация сверхновых звёзд по данным Open Supernova Catalog. Деркач Денис Александрович ( dderkach@hse.ru ) | Классификация звёзд на данный момент осуществляется с помощью анализа кривых блеска, набранных в нескольких цветовых каналах. Кривая блеска — это набор наблюдений свернутых спектров в разные моменты времени. Обычным путём является построение физически-мотивированных спектров. Однако в будущем количество информации, набираемое астрофизическими экспериментами, будет превышать возможности ручного анализа. Задачей на практику является построение рекурентной сети, которая будет автоматически разделять звёздные спектры на разные классы. | Python Scikit-learn RNN. | Магистратура | 1-2 |
Построение моделей идентификации заряженных частиц на Большом адронном коллайдере. Деркач Денис Александрович ( dderkach@hse.ru ) | Детектор LHCb состоит из нескольких подчастей, каждая из которых обладает определённым откликом на пролетающую частицу. Нейронные сети уже несколько лет работают для комбинацией данных, записанных субдетекторами. Недостатком текущих моделей является тренировка моделей на симулированных событий. Именно сейчас полученные данные позволяют тренировать модель на реальных данных. Итогом работы должна стать нейронная сеть, натренированная на настоящих данных Большого адронного коллайдера, которая может быть использована в дальнейших анализах. | Python Scikit-learn RNN. | Магистратура | 1 |
Блокчейн для планировки распределённых вычислений. Баранов Александр ( a.baranov@cern.ch ) | Grid вычисления — это когда множество независимых компьютерных кластеров работают над общим пулом задач. Grid-вычисления, например, используются для обработки данных Большого Адронного Коллайдера. Мы хотим попробовать применить блокчейн-технологии для планирования(scheduling) вычислений в grid. Для этого предполагается использовать блокчейн-аукцион, в который пользователи grid отправляют вычислительные задачи, а исполнители задач торгуются за минимальную цену на исполнение задачи. В рамках стажировки вам предстоит сделать прототип планировщика grid-задач основанном на блокчейн-аукционе. Мы предполагаем, что основой аукциона послужит смарт-контракт для Ethereum, хотя и рассматриваем возможность использовать альтернативные технологии. https://ru.wikipedia.org/wiki/Грид https://ru.wikipedia.org/wiki/Blockchain https://ru.wikipedia.org/wiki/Ethereum | Go, Python | Бакалавриат, магистратура | 2-3 |
Разработка системы распределённых вычислений для эксперимента SHiP Баранов Александр ( a.baranov@cern.ch ) | Наша группа разрабатывает систему распределённых вычислений, которой пользуются физики в CERN. Благодаря вычислениям на этой системе наша группа смогла сэкономить CERN более 1 миллиона долларов — http://www.forbes.ru/tehnologii/358829-poymat-temnuyu-materiyu-kak-rossiyskie-uchenye-sekonomili-cern-bolee-1-mln Мы ищем летнего стажёра для работы над этой системой. Конкретно мы хотим:
В рамках стажировки вы получите опыт промышленной backend-разработки на стыке распределённых систем и машинного обучения. | Go, Python, gRPC | Бакалавриат, магистратура | 1-2 |
Оптимизация устройства калориметра LHCb Устюжанин Андрей Евгеньевич ( austyuzhanin@hse.ru ) | Преамбула: разработка и изготовление экспериментальных образцов компонентов детекторных устройств, предназначенных для использования в составе модернизируемой детекторной установки LHCb - очень ответственный этап. Для улучшения понимания характеристик изготавливаемых подсистем детектора используются вспомогательные шаги: - разработка систем физической симуляции работы детектора в различных режимах (на основе GEANT, Delphes)- алгоритмы распознавания типичных откликов детектора на известные физические явления. точность работы таких алгоритмов может быть использована как качество работы детектора- алгоритмы сложной последовательной оптимизации многопараметрических функций (включающих параметры как детектора так и алгоритмов распознавания) Задачи практики:
| Python, C++, GEANT | Магистратура | 1-2 |
_______________________________________
По вопросам прохождения практики писать на ntalaikova@hse.ru
Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.