• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Тел.: +7 (495) 772-95-90 * 12332

computerscience@hse.ru

125319, Москва, Кочновский проезд, д. 3 (недалеко от станции метро "Аэропорт"). 

 

Руководство

Декан — Аржанцев Иван Владимирович

 

Первый заместитель декана факультета — Вознесенская Тамара Васильевна

 

Заместитель декана по научной работе и международным связям — Объедков Сергей Александрович

 

Заместитель декана по развитию и административно-финансовой работе — Плисецкая Ирина Александровна

Образовательные программы
Бакалаврская программа

Прикладная математика и информатика

4 года
Очная форма обучения
100/80/15
100 бюджетных мест
80 платных мест
15 платных мест для иностранцев
RUS
Обучение ведётся на русском языке
Бакалаврская программа

Программа двух дипломов НИУ ВШЭ и Лондонского университета "Прикладной анализ данных"

4 года
Очная форма обучения
80/10
80 платных мест
10 платных мест для иностранцев
ENG
Обучение ведётся на английском языке
Бакалаврская программа

Программная инженерия

4 года
Очная форма обучения
80/80/15
80 бюджетных мест
80 платных мест
15 платных мест для иностранцев
RUS
Обучение ведётся на русском языке
Магистерская программа

Анализ данных в биологии и медицине

2 года
Очная форма обучения
15/5/3
15 бюджетных мест
5 платных мест
3 платных места для иностранцев
RUS/ENG
Обучение ведётся на русском и английском языках
Магистерская программа

Математические методы оптимизации и стохастики

2 года
Очная форма обучения
RUS/ENG
Обучение ведётся на русском и английском языках
Магистерская программа

Науки о данных

2 года
Очная форма обучения
55/15/6
55 бюджетных мест
15 платных мест
6 платных мест для иностранцев
RUS/ENG
Обучение ведётся на русском и английском языках
Магистерская программа

Системная и программная инженерия

2 года
Очная форма обучения
20/10/12
20 бюджетных мест
10 платных мест
12 платных мест для иностранцев
ENG
Обучение ведётся на английском языке
Магистерская программа

Системное программирование

2 года
Очная форма обучения
20/10/5
20 бюджетных мест
10 платных мест
5 платных мест для иностранцев
RUS/ENG
Обучение ведётся на русском и английском языках
Магистерская программа

Статистическая теория обучения

2 года
Очная форма обучения
20/5/5
20 бюджетных мест
5 платных мест
5 платных мест для иностранцев
ENG
Обучение ведётся на английском языке
Магистерская программа

Финансовые технологии и анализ данных

2 года
Очная форма обучения
30/3
30 платных мест
3 платных места для иностранцев
RUS/ENG
Обучение ведётся на русском и английском языках
Статья
Linear switched dynamical systems on graphs
В печати

Protasov V. Y., Cicone A., Guglielmi N.

Nonlinear Analysis: Hybrid Systems. 2018. Vol. 29. P. 165-186.

Статья
Final Results of the OPERA Experiment on ντ Appearance in the CNGS Neutrino Beam

Ustyuzhanin A.

Physical Review Letters. 2018. Vol. 120. No. 21. P. 211801-1-211801-7.

Статья
Qualitative Judgement of Research Impact: Domain Taxonomy as a Fundamental Framework for Judgement of the Quality of Research

Murtagh F., Orlov M. A., Mirkin B.

Journal of Classification. 2018. Vol. 35. No. 1. P. 5-28.

Статья
Predictive Model for the Bottomhole Pressure based on Machine Learning
В печати

Spesivtsev P., Sinkov K., Sofronov I. et al.

Journal of Petroleum Science and Engineering. 2018.

Статья
New and old results on spherical varieties via moduli theory

Roman Avdeev, Cupit-Foutou S.

Advances in Mathematics. 2018. Vol. 328. P. 1299-1352.

Семинар по биоинформатике

На факультете компьютерных наук проводится регулярный семинар, посвященный методам машинного обучения в биоинформатике. Руководит семинаром Мария Попцова, доцент департамента больших данных и информационного поиска

Методы машинного обучения уже нашли широкое применение в областях генетики и геномики. Они оказались наиболее полезны для интерпретации больших наборов геномных данных и аннотации большого числа элементов генома. Методы машинного обучения были успешно применены для распознавания сайтов старта транскрипции, сплайс-сайтов, альтернативного сплайсинга, промотеров, энхансеров, расположения нуклеосом. После революции в технологиях секвенирования накопление экспериментальных данных происходит быстрее, чем построение моделей, объясняющих функционирование генома. Необходима как разработка новых подходов, методов и алгоритмов, так и освоение технологий работы с системами больших данных геномики. На семинаре у слушателей будет возможность познакомиться с современными исследованиями в области применения методов машинного обучения к анализу геномных данных ведущих университетов мира, таких как Harvard, MIT, Cambridge, Sorbonne, EMBL-EBI и др.

Для участия в семинаре необходима регистрация.

Регистрация

2018 

31 мая

Глубинное обучение в фармакогеномике: от генной регуляции к стратификации пациентов

Работа ученых Мичиганского университета США (“Deep learning in pharmacogenomics: from gene regulation to patient stratification”, Kalinin et al.). Публикация в Pharmacogenomics, May 19, 2018. В данной статье дается обзор настоящего состояния и прогнозов на будущее приложений глубинного обучения в фармакогеномике, включая идентификацию новых регуляторных вариантов, расположенных в некодирующих областях генома и их функциональной роли с точки зрения фармакогеномики, стратификацию пациентов по истории болезни, и механистическое предсказание ответа на препарат и его мишеней. Ожидается, что в будущем глубинное обучение будет использоваться для предсказания индивидуального ответа на лекарства и определять курс персонализированного лечения, используя знания, извлеченные из больших и сложных молекулярных, эпидемиологических, клинических и демографических наборов данных.

Время: 18:10 – 19:30   

Место: Кочновский пр-д., 3, ауд. 509


17 мая

Системный анализ и методы машинного обучения в применении к данным геномики рака c использованием CancerSysDB

Работа лаборатории биоинформатики Кельнского университета, Германия. (“Integrative analysis and machine learning 
on cancer genomics data using the Cancer Systems Biology Database (CancerSysDB, Krempel et al.). Публикация в BMC Bioinformatics 2018. Разработанный авторами ресурс CancerSysDB позволяет анализировать различные типы данных из множества исследований разных лабораторий. Также показано, как ресурс может использоваться для классификации типов рака на основе данных 9091 пациентов консорциумного проекта The Cancer Genome Atlas (TCGA).

Время: 18:10 – 19:30   

Место: Кочновский пр-д., 3, ауд. 509


26 апреля

Докладчик:  Иван Кулаковский
Институт молекулярной биологии им. В.А.Энгельгардта РАН, Москва
Институт математических проблем биологии РАН, Пущино

В 2016-2017 году прошло соревнование по машинному обучению в биологии DREAM-ENCODE. Алгоритм, предложенный российской командой под руководством Ивана Кулаковского, для предсказания мест связывания белков, регулирующих экспрессию генов, был признан лучшим.

Перед участниками была поставлена задача предсказания сайтов связывания факторов транскрипции в геноме человека. Для этого предлагалось использовать данные доступности хроматина (DNase-Seq), данные по экспрессии генов (RNA-Seq) и модели мотивов сайтов связывания на основе нуклеотидных последовательностей. Верификация предсказаний проводилась организаторами соревнования на неопубликованных данных по иммунопреципитации хроматина (ChIP-Seq). Доклад будет посвящен особенностям экспериментальных данных, переносимости информации между различными типами клеток, возможным стратегиям машинного обучения и реально достижимой точности предсказаний. Наконец, мы обсудим сопутствующую задачу компьютерной регуляторной геномики: предсказание влияния однонуклеотидных вариантов в регуляторных последовательностях на экспрессию генов.

Время: 18:10 – 19:30   

Место: Кочновский пр-д., 3, ауд. 509


12 апреля

Методы разделения сигналов вслепую и биоинформатические задачи

Докладчик: Дмитрий Левандо —  Факультет экономических наук ВШЭ

Blind Signal Separation (BSS), или разделение сигналов вслепую, это набор методов, предполагающих, что, есть набор независимых источников, которые создают индивидуальные сигналы, и имеется  набор детекторов (регистраторов сигналов). Каждый  детектор может регистрировать все сигналы от всех источников. Требуется идентифицировать, какой сигнал принадлежит какому источнику. Разделение зарегистрированных сигналов происходит через решение  обратной задачи.  Такие задачи с дискретным набором источников и дискретным набором приемников встречаются в томографии, кардиологии, а также применяется в биоинформатике. Например, для разделения неоднородных клеток культуры ткани.

Математическая сторона задачи представляет собой набор систем уравнений (тензорное уравнение), для решения которого вводятся   различные предположения о структуре сигналов. Это позволяет решать задачу методами линейной алгебры. Методы будут обсуждаться. В 2017 году было  предложено расширение задачи на случай  не независимых источников с построением модели Blind Quantum Signal Separation, где   зависимость источников и их сигналов становится аналогом квантовой запутанности. Будут обсуждаться потенциальные применения этого метода для биоинформатических исследований.

Время: 18:10 – 19:30   

Место: Кочновский пр-д., 3, ауд. 509


15 марта

Методы моделирования трехмерной структуры вариабельных доменов антител

Докладчик: Павел Яковлев — директор Департамента вычислительной биологии BIOCAD. 

В современной структурной биологии есть ряд вычислительных методов, позволяющих с высокой достоверностью характеризовать биологические молекулы, их схожесть и различия, способы взаимодействия и функции. Для построения подобных вычислений входным параметром всегда выступает пространственная структура белка, однако её получение не смотря на полувековой прогресс в области кристаллографии может быть затруднен. Лекция посвящена решению этой проблемы с помощью гомологичного моделирования структур белков — построения трехмерных структур на основании данных о структурах белков, схожих с целевым по последовательности. Для примера будут рассмотрены основные терапевтические агенты белковых лекарственных средств — вариабельные домены антител. Эти белки обладают уникальной структурой гипервариабельных петель, что делает их не только удобными для использования в терапии, но и интересным объектом для разработки новых методов предсказания фолдинга белков.

Время: 18:10 – 19:30   

Место: Кочновский пр-д., 3, ауд. 509


1 марта

Предсказание сайтов связывания ДНК с белком с помощью сверточных нейронных сетей

Работа лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института (MIT), США. (“Convolutional neural network architectures for predicting DNA–protein binding”, Zeng et al.). Публикация в Bioinformatics 2016. Были использованы данные связывания транскрипционных факторов из 690 различных ChiP-seq экспериментов консорциумного проекта ENCODE.

Время: 18:10 – 19:30   

Место: Кочновский пр-д., 3, ауд. 509


8 февраля

Распознавание структуры транспозона методом опорных векторов

Работа группы М. Попцовой. Публикация BMC Genomics, 2016. Транспозоны – самостоятельно перемещающиеся фрагменты ДНК – составляют 45% генома человека и большую часть геномов других видов. Важную роль в транспозиции играет вторичная структура РНК на конце транспозона, по которой происходит узнавание транспозона. Используя структурные характеристики ДНК удалось методом опорных векторов построить модель, распознающую структуру транспозонов среди других структур генома.

Время: 18:10 – 19:30  
Место: Кочновский пр-д., 3, ауд. 509


1 февраля

Расшифровка сплайсингового кода с помощью нейронных сетей

Cовместная работа Университета Торонто и Кембриджа. (“Deciphering the splicing code”, Barash et al.). Публикация в Nature 2010. «Сплайсинговый код» использует больше тысячи характеристик РНК для предсказания альтернативного сплайсинга в зависимости от типа ткани методом однослойной логистической байесовой сети. На основе этого кода было создано веб-приложение AVISPA для анализа и предсказания альтернативного сплайсинга (2013, Пенсильванcкий Университет).

Время: 18:10 – 19:30 
Место: Кочновский пр-д., 3, ауд. 509


2017 

11 декабря

Трехмерная структура хроматина: вчера и завтра

Доакладчик: профессор М.С. Гельфанд, руководитель магистерской программы «Анализ данных в биологии и медицине»

Как обычно в молекулярной биологии, прогресс в понимании следует за прогрессом в развитии экспериментальных методик. Одной из таких методик является HiC — способ определять контакты между фрагментами генома в масштабах целого ядра, и таким образом описывать трехмерную структуру хроматина. А дальше ее можно сопоставлять с данными об экспрессии генов и об эпигенетических метках, таких как модификации гистонов, то есть, о функциональном состоянии тех или иных участков генома. Я расскажу о некоторых недавних результатх в этой области — но она настолько быстро развивается, что, похоже, часть из того, что будет рассказано, уже устарела (я скажу, какая, и в чем может заключаться дальнейшее развитие).

Время: 18:10 – 19:30 
Место: Кочновский пр-д., 3, ауд. 205


27 ноября

Первое прочтение эпигенетического кода человека

Результаты данной работы подтверждают ключевую роль эпигенетической информации для понимания регуляции генов, дифференциации клеток и заболеваний человека. Работа консорциума The Roadmap Epigenomics и 95 авторов из 57 институтов и университетов США, Канады, Австралии, Норвегии и Китая. Публикация в Nature 2015. Integrative analysis of 111 reference human epigenomes.

Последний автор — Manolis Kellis — руководитель лаборатории Вычислительной биологии в MIT http://compbio.mit.edu/.  Выступление Манолиса Келиса на TEDxCambridge 2013: Decoding a Genomic Revolution.

Время: 18:10 – 19:30
Место: Кочновский пр-д., 3, ауд. 205


13 ноября

Расшифровка эпигенетического кода с помощью скрытых марковских моделей

Совместная работа Гарварда и Массачусетского технологического института (MIT). Публикация в Nature Biotechnology 2010. J. Ernst & M. Kellis. Discovery and characterization of chromatin states for systematic annotation of the human genome. Manolis Kellis — руководитель лаборатории Вычислительной биологии в MIT http://compbio.mit.edu/.  Выступление Манолиса Келиса на TEDxCambridge 2013: Decoding a Genomic Revolution.

Время: 18:10 – 19:30 
Место: Кочновский пр-д., 3, ауд. 205


30 октября

Предсказание частоты мутаций в раковых геномах по эпигенетическим факторам методом Случайный лес (Random Forest)

Совместная работа Гарварда, Массачусетского технологического института (MIT) и университета Вашингтона. Публикация в Nature 2015. Polak et al. Cell-of-origin chromatin organization shapes the mutational landscape of cancer. PMID: 2569356

Время: 18:10 – 19:30 
Место: Кочновский пр-д., 3, ауд. 205