• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Летняя практика

В ходе прохождения практики студенты смогут познакомиться с реальными научно-техническими задачами, требующими от студентов погружения в интересную предметную область и владение соответствующими навыками в областях анализа данных, машинного обучения и/или разработки программного обеспечения. Работа над проектами может проходить на взаимовыгодной основе. Подробности можно узнать по адресу ntalaikova@hse.ru

Проекты 2020:

Название проекта 
и контактное лицо

Описание проекта
Цель, задачи

Пререквизиты

Уровень студентов
(курс)

Количество мест

Competition X-ray tomography

Маевский Артем Сергеевич

amaevskij@hse.ru

Автоматизировать определение положения оси вращения в томографии

1) Изучить существующие подходы определения положения оси вращения в томографии
2) Оптимизировать существующее решение на основе нейронной сети по синограммам
2а*) Предложить и реализовать подход к определению положения оси на основе классических методов машинного обучения.
2б*) Предложить и реализовать подход к определению положения оси на основе методов глубокого обучения.
3) Провести эксперименты на реальных данных и сравнить качество указанных методов.

python, ML, torch/tf

Бакалавриат (4+)

Магистратура

1-3

Уточнение каталога масс галактических скоплений

Зароднюк Алена Владимировна

azarodnyuk@hse.ru

Уточнение каталога масс галактических скоплений

1) задача кластеризации галактик по галактическим скоплениям;
2) задача регрессии для оценки масс галактических скоплений

Знание машинного обучения, нейронных сетей, pytorch, keras

Бакалавриат (3+)

Магистратура

2-3

Прогнозирование временных рядов

Гущин Михаил Иванович

mhushchyn@hse.ru

Прогнозирование временных рядов

Применение нескольких современных методов прогнозирования временных рядов и сравнение их точности.

Знание машинного обучения, нейронных сетей, pytorch. Знание методов анализа временных рядов будет большим плюсом.

Бакалавриат (4+)

Магистратура

1-2

Поиск аномалий во временных рядах

Гущин Михаил Иванович

mhushchyn@hse.ru

Поиск аномалий во временных рядах

Применение современных методов детектирования и устранения аномалий во временны рядах.

Знание машинного обучения. Знание методов анализа временных рядов будет большим плюсом.

Бакалавриат (4+)

Магистратура

1-2

Систематика в GAN

Ратников Федор Дмитриевич

fratnikov@hse.ru

Систематика в GAN

1) реализовать метод оценки погрешности
2) реализовать цепочку обучения генеративной модели
3) провести серию экспериментов и получить выводы

Глубокое обучение

Бакалавриат (4+)

Магистратура

1-3

CaloGAN

Ратников Федор Дмитриевич

fratnikov@hse.ru

Построение объединенной модели VAE и GAN

1) подбор архитектурные вариационного автоэнкодера
2) оптимизация модели VAE+GAN
3) анализ и подбор функции потерь

Глубокое обучение

Бакалавриат (3+)

Магистратура

4

Визуализации

Устюжанин Андрей Евгеньевич

austyuzhanin@hse.ru

Визуализации работы GAN, Isolation Forest, алгоритма 1+\epsilon

1) создать интерактивную демонстрацию работы GAN, 2) создать интерактивную демонстрацию работы Isolation Forest, 3) создать интерактивную демонстрацию алгоритма 1+\epsilon

посмотреть https://distill.pub/

Бакалавриат (2+)

1-3

Adversarial Augmentation

Борисяк Максим Александрович

mborisyak@hse.ru

Adversarial Augmentation

1) изучение текущего состояния литературы;
2) реализация предложенного алгоритма;
3) сравнение качества алгоритма с текущим state-of-the-art.

torch/tf, GANs

Бакалавриат (5+)

Магистратура

1

Adversarial Normalization

Борисяк Максим Александрович

mborisyak@hse.ru

Adversarial Normalization

1) изучение текущего состояния литературы;
2) реализация предложенного алгоритма;
3) сравнение качества алгоритма с текущим state-of-the-art

torch/tf, GANs

Бакалавриат (5+)

Магистратура

1

 Обзор подходов feature importance для нейронных сетей

Рыжиков Артем Сергеевич

aryzhikov@hse.ru

Исследование методов определения feature importance для полносвязных сетей и применить их к задаче классификации частиц (PID)

1) исследовать существующие подходы определения feature importance в нейросетях
2) подумать над сравнением различных подходов и выбрать лучше
3) применить существующие подходы к обученным моделям

 torch

Бакалавриат (3+)

Магистратура

 1

RICH generators: дифференцируемые деревья, GAN-VAE, skip-connections

Казеев Никита Александрович

nikita.kazeev@cern.ch

RICH generators: дифференцируемые деревья, GAN-VAE, skip-connections

Построить быструю точную генеративную модель для задачи мделирования отклика детектора, https://www.popmech.ru/science/news-468032-sozdana-neyroset-uskoryayushchaya-poisk-novyh-chastic-na-lhc/

 Deep learning

Бакалавриат (5+)

Магистратура

 1

Сети vs деревья

Казеев Никита Александрович

nikita.kazeev@cern.ch

Сравнить качество работы нейросетей и градиентного бустинга

Предрасположенность к программированию и скриптам, не исследованиям

Бакалавриат (3+)

Магистратура

 1

Probabilistic process mining

Карпов Максим Евгеньевич

mekarpov@hse.ru

Probabilistic process mining

1) Изучить текущее состояние state-of-the-art вероятностных подходов в process mining
2.1) Предложить подход, основанный на методе максимального правдоподобия, для построения процессных моделей
2.2) Предложить подход построения байесовской нейросети для построения процессных моделей
2.3) Предложить подход, основанный на алгоритме имитации отжига, для построения процеснных моделей
3) Провести эксперименты на реальных данных (журналы событий/логи) и сравнить качество с существующими бенчмарками

 Машинное обучение, глубинное обучение, знание Python, Pytorch, обработка текстов, регулярные выражения

Желательно, но не обязательно: процесс майнинг, анализ логов

Бакалавриат (3+)

Магистратура

 1-3

NL2ML

Хатбуллина Лейля Равилевна

leila.xr@gmail.com

Работа над NL2ML корпусом. Улучшение существующих моделей и сбор данных для других вершин графа.

1) улучшение классификации по тэгам
2) нахождение синонимов с использованием ast
3) сбор и обработка данных
4) создание прототипа корпуса

Python, ML

Бакалавриат (2+)

Магистратура

 1-3

BigSister

Хатбуллина Лейля Равилевна

leila.xr@gmail.com

BigSister: система отслеживания прогресса и для мотивации студентов

1) прототип рекомендательной системы
2) сделать статистику активности
3) доделать фронт

Java/Scala, software engineering

Бакалавриат (1+)

Магистратура

 1-3

 RICH distillation

Артемьев Максим Радикович

mrartemev.me@gmail.com

RICH distillation

1) Научить глубокий ган
2) научить студентов разными способами
3) Сформулировать трейдоф между качеством и скоростью. Самое главное : в проекте бай дизайн мало физики, но много ганов.

DL, Python, опыт работы с ганами/потоками, Желательно: опыт работы с табличными данными, Очень важно: высокая степень автономности)

Бакалавриат (3+)

Магистратура

 2

RICH NF

Артемьев Максим Радикович

mrartemev.me@gmail.com

RICH NF: работа с глубокими потоками в продолжение и развитие уже имеющихся результатов

1) Научить глубокие потоки (5 штук)
2) Научить conditional и взвешеные версии потоков 
3) Посчитать метрики
В проекте не очень много физики, очень много потоков.

DL, Python, опыт работы с ганами/потоками, Желательно: опыт работы с табличными данными, Очень важно: высокая степень автономности)

Бакалавриат (3+)

Магистратура

 2

 


Проекты прошлых лет:

— Проекты 2018

Название проекта 
и
контактное лицо
Описание проектаЗнание ПрограммУровень студентовКоличество мест
Разработка алгоритма сжатия данных о треках частиц эксперимента LHCb

Устюжанин Андрей Евгеньевич ( austyuzhanin@hse.ru )
С 2022 года БАК начнет работать в режиме бо́льшей светимости, это будет означать что необходимо обработать гораздо больше данных, чем обрабатывается сейчас. Одно из узких мест обработки - объемы передаваемой информации о траекториях частиц, зарегистрированных экспериментом. В рамках данного проекта предлагается разработать алгоритм сжатия этой информации нейроморфными методами. Проект ведется совместно с коллегами из MIT. Более подробное описание доступно в слайдах Константина ВейсераPython.Neural Nets (Autoencoders)Магистратура1-2
Поиск стратегии управления квантовым компьютером

   Устюжанин Андрей Евгеньевич ( austyuzhanin@hse.ru )
Управление базовыми компонентами квантовых компьютеров - резонаторами - требует учета большого количества факторов, которые сложно оценить исходя из теоретических или численных моделей. В рамках данного проекта предлагается развить подход обучения с подкреплением для повышения точности управления. Проект выполняется совместно с МФТИ.PythonМетоды Reinforcement LearningМагистратура1-2
Поиск двойных гамма-звезд
Устюжанин Андрей Евгеньевич ( austyuzhanin@hse.ru )
Двойные звезды, излучающие в гамма-диапазоне - довольно редки. Тем не менее такие звезды представляют большой интерес для астрономического сообщества. В рамках данного проекта предлагается проанализировать информацию из различных звездных каталогов для сопоставления сигнатур различных небесных объектов и составления списка кандидатов на роль двойных звезд. Проект выполняется совместно с коллегами из Dublin City University и  Institut fur Astronomie und Astrophysik Tubingen.PythonScikit-learnБакалавриатилиМагистратура1-2
Классификация сверхновых звёзд по данным Open Supernova Catalog.


Деркач Денис Александрович ( dderkach@hse.ru )
Классификация звёзд на данный момент осуществляется с помощью анализа кривых блеска, набранных в нескольких цветовых каналах.  Кривая блеска — это набор наблюдений свернутых спектров в разные моменты времени. Обычным путём является построение физически-мотивированных спектров. Однако в будущем количество информации, набираемое астрофизическими экспериментами, будет превышать возможности ручного анализа. Задачей на практику является построение рекурентной сети, которая будет автоматически разделять звёздные спектры на разные классы.Python Scikit-learn  RNN. Магистратура1-2
Построение моделей идентификации заряженных частиц на Большом адронном коллайдере. 


Деркач Денис Александрович ( dderkach@hse.ru )
Детектор LHCb состоит из нескольких подчастей, каждая из которых обладает определённым откликом на пролетающую частицу. Нейронные сети уже несколько лет работают для комбинацией данных, записанных субдетекторами. Недостатком текущих моделей является тренировка моделей на симулированных событий. Именно сейчас полученные данные позволяют тренировать модель на реальных данных. Итогом работы должна стать нейронная сеть, натренированная на настоящих данных Большого адронного коллайдера, которая может быть использована в дальнейших анализах.Python Scikit-learn  RNN. Магистратура1
Блокчейн для планировки распределённых вычислений.


Баранов Александр ( a.baranov@cern.ch )
Grid вычисления — это когда множество независимых компьютерных кластеров работают над общим пулом задач. Grid-вычисления, например, используются для обработки данных Большого Адронного Коллайдера. Мы хотим попробовать применить блокчейн-технологии для планирования(scheduling) вычислений в grid. Для этого предполагается использовать блокчейн-аукцион, в который пользователи grid отправляют вычислительные задачи, а исполнители задач торгуются за минимальную цену на исполнение задачи. В рамках стажировки вам предстоит сделать прототип планировщика grid-задач основанном на блокчейн-аукционе. Мы предполагаем, что основой аукциона послужит смарт-контракт для Ethereum, хотя и рассматриваем возможность использовать альтернативные технологии.
https://ru.wikipedia.org/wiki/Грид
https://ru.wikipedia.org/wiki/Blockchain
https://ru.wikipedia.org/wiki/Ethereum
Go, PythonБакалавриат, магистратура2-3
Разработка системы распределённых вычислений для эксперимента SHiP

Баранов Александр ( 
a.baranov@cern.ch )
Наша группа разрабатывает систему распределённых вычислений, которой пользуются физики в CERN. Благодаря вычислениям на этой системе наша группа смогла сэкономить CERN более 1 миллиона долларов — http://www.forbes.ru/tehnologii/358829-poymat-temnuyu-materiyu-kak-rossiyskie-uchenye-sekonomili-cern-bolee-1-mln Мы ищем летнего стажёра для работы над этой системой.

Конкретно мы хотим:
  • Добавить в неё алгоримты планировки(scheduling) задач
  • Улучшить работу с Kubernetes-кластерами

В рамках стажировки вы получите опыт промышленной backend-разработки на стыке распределённых систем и машинного обучения.
Go, Python, gRPCБакалавриат, магистратура1-2
Оптимизация устройства калориметра LHCb

Устюжанин Андрей Евгеньевич ( 
austyuzhanin@hse.ru  )
Преамбула: разработка и изготовление экспериментальных образцов компонентов детекторных устройств, предназначенных для использования в составе модернизируемой детекторной установки LHCb - очень ответственный этап. Для улучшения понимания характеристик изготавливаемых подсистем детектора используются вспомогательные шаги: - разработка систем физической симуляции работы детектора в различных режимах (на основе GEANT, Delphes)- алгоритмы распознавания типичных откликов детектора на известные физические явления. точность работы таких алгоритмов может быть использована как качество работы детектора- алгоритмы сложной последовательной оптимизации многопараметрических функций (включающих параметры как детектора так и алгоритмов распознавания)
 Задачи практики: 
  • научиться запускать модель1 калориметра в Delphes
  • научиться запускать модель2 калориметра в GEANT
  • научиться считать метрики (energy resolution)
  • научиться менять геометрию детектора
  • собрать docker для запуска модели с заданными параметрами и оценки метрик
  • запустить подбор оптимальных параметров локально
  • сохранение параметров запуска на вычислительном кластере
  • обучение модели оптимизации по результатам предыдущих запусков
  • непрерывный процесс оптимизации / вычислений
  • модель1 работает гораздо быстрее чем модель2. научиться использовать точки пространства гиперпараметров модели1 для выбора следующих точек для оценки модели2
 
Python, C++, GEANTМагистратура1-2

_______________________________________
По вопросам прохождения практики писать на ntalaikova@hse.ru


 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.