О школе
Одна из областей приложения биоинформатики и науки о данных (Data Science) — персонализированная медицина. Технологии секвенирования позволяют получать последовательности на уровне полного генома. С помощью инструментов анализа данных производится поиск геномных мутаций, ассоциированных с заболеваниями.
Наш курс посвящен овладению навыками использования инструментов анализа данных полногеномного секвенирования на примере кардиогенетики. Слушатели познакомятся с основными методами поиска мутаций, определения статуса патогенности и связи с заболеванием, а также базовыми методами машинного обучения в применении к анализу геномов. Участники смогут своими руками провести тестирование цифрового двойника пациента.
Для кого
Приглашаем к участию студентов и специалистов из междисциплинарных областей: медицины, биологии, биоинформатики, компьютерных наук, математики, физики, управления, менеджмента и других.
Врачам
Вы научитесь интерпретировать данные секвенирования и применять результаты генетического тестирования в клиническом принятии решений, чтобы уточнять диагноз и подбирать персонализированное лечение пациентам с кардиологическими заболеваниями.
Биологам
Биоинформатикам
Вы погрузитесь в область кардиогенетики
Аналитикам данных и программистам
Вы узнаете, откуда берутся данные в биоинформатике и какую информацию из них можно получить
Административным работникам здравоохранения
Вы поймёте, как использование цифровых двойников и генетических технологий помогает оптимизировать маршрутизацию пациентов, снижать затраты и повышать эффективность работы медицинской организации.
..и другим
Вы узнаете много нового!
В программе
Теоретические и практические занятия
- Биоинформатический анализ данных NGS;
- Интерпретация данных NGS;
- Введение в кардиогенетику;
- Введение в машинное обучение.
Кардиогенетическое тестирование пациента
Каждому слушателю мы выдадим данные секвенирования генома цифрового двойника пациента. Вы обработаете эти данные с помощью методов, которые изучите на занятиях, и в последний день школы представите результаты кардиогенетического тестирования своего пациента.
Экскурсия в «Биотехнологический кампус»
Вы познакомитесь с проектом 100 000 российских геномов
Участие
Cтоимость
65 000 рублей для физических лиц
Формат обучения
- Длительность курса: с 17.08.2026 по 27.08.2026
- Требования к слушателям: высшее или среднее профессиональное образование; лица, получающие высшее образование
- Формат обучения: очный
- Продолжительность общая в часах: 72 ак.ч
- Место проведения: в корпусе ВШЭ на Покровском бульваре д.11
Документ, который вы получите
Преподаватели
Ашниев Герман Альфредович
Департамент больших данных и информационного поиска: Приглашенный преподаватель
Охрименко Галина Сергеевна
Центр биомедицинских исследований и технологий: Младший научный сотрудник
Затейщиков Дмитрий Александрович
заведующий кафедрой терапии, доктор медицинских наук, профессор ФГБУ ДПО «Центральная государственная медицинская академия» Управления делами Президента Российской Федерации, г. Москва
Антонов Иван Валентинович
Расписание
-
День 1 — 17 августа
Введение в NGS и основы работы в командной строке Linux
10:00–11:30
Технологии NGS. Типы и платформы секвенирования. Основные этапы анализа. Референсный геном. Общий план проекта.
11:30–11:45
Перерыв
11:45–13:15
Генетика и кардиология. Механизмы развития наследственных заболеваний.
13:15–14:30
Обед
14:30–16:00
Основы работы с линуксом. Командная строка. Файловая структура. Копирование и просмотр файлов. Запуск и установка программ.
16:00-16:15
Перерыв
16:15 – 17:45
Практическая часть по итогам первого дня
-
День 2 — 18 августа
Биоинформатический анализ данных NGS: контроль качества и предобработка данных
10:00–11:30
Программа оценки качества ридов с помощью программы FastQC. Значения качества Phred-score. Оценка нуклеотидного содержания последовательностей
11:30–11:45
Перерыв
11:45–13:15
Генерация и визуализация отчетов по показателям качества. Программа MultiQC. Стратегия описания данных секвенирования для отчета.
13:15-14:30
Обед
14:30–16:00
Тримминг и фильтрация прочтений. Программа Trimmomatic и аналоги. Оценка качества прочтений секвенирования после проведения тримминга и фильтрации. Стратегия описания данных секвенирования для отчета.
16:00-16:15
Перерыв
16:15–17:45
Практическая часть по итогам второго дня. Стратегия описания данных секвенирования для отчета. Подготовка шаблона презентации для итогового отчета.
-
День 3 — 19 августа
Биоинформатический анализ данных NGS: выравнивание ридов, визуализация картирования и детекция вариантов
10:00–11:30
Алгоритмы картирования ридов. Программа bwa-mem и аналоги. Индексирование референсного генома. Файлы .bam и .sam - особенности и архитектура. Программа SAMtools.
11:30–11:45
Перерыв
11:45–13:15
Визуальное исследование картированных ридов. Browser IGV. Референсные и альтернативные аллели. Гомозиготность и гетерозиготность
13:15–14:30
Обед
14:30–16:00
Основы методов определения однонуклеотидных вариантов (SNPs) и небольших вставок и делеций (indels). Знакомство с программным пакетом GATK и DeepVariant
16:00-16:15
Практическая работа по итогам третьего дня
-
День 4 — 20 августа
Биоинформатический анализ данных NGS: выявление генетических вариантов
10:00–11:30
Продолжение изучения программного пакета GATK. Файлы gvcf и vcf. GATK-конвейер и его варианты. Программы HaplotypeCaller и DeepVariant для определения однонуклеотидных вариантов (SNPs) и коротких вставок и делеций (indels).
11:30–11:45
Перерыв
11:45–13:15
Продолжение изучения программного пакета GATK. Обоснование выбора варианта конвейера GATK. Файлы gvcf и vcf - особенности и архитектура. Программа BCFtools и аналоги.
13:15–14:30
Обед
14:30–16:00
Продолжение изучения программного пакета GATK. Файлы gvcf и vcf. Программы HaplotypeCaller и DeepVariant для определения однонуклеотидных вариантов (SNPs) и коротких вставок и делеций (indels)
16:00-16:15
Перерыв
16:15–17:45
Практическая работа по итогам четвертого дня
-
День 5 — 21 августа
Интерпретация генетических вариантов
10:00–11:30
Критерии патогенности ACMG/AMP и их модификации. Типы генетических вариантов.
11:30–11:45
Перерыв
11:45–13:15
Ресурсы и базы данных для клинической интерпретации генетических вариантов.
13:15-14:30
Обед
14:30–17:45
Экскурсия в ООО «Биотек кампус» — Проект «Национальная генетическая Инициатива «100 000 + Я»
-
День 6 — 24 августа
Современная кардиогенетика: от исследований к клинической практике
10:00–11:30
Кардиогенетика — современное состояние кардиогенетических исследований в мире и в России. Консорциум по кардиогенетике.
11:30–11:45
Перерыв
11:45–13:15
Наследственные генетические заболевания сердечно-сосудистой системы: кардиомиопатия, легочная гипертензия, гиперхолестеринемия. Гены, ассоциированные с диагностикой и прогрессированием заболевания
13:15–14:30
Обед
14:30–16:00
Программы для аннотации генетических вариантов. Аннотация полученных вариантов.
16:00-16:15
Перерыв
16:15–17:45
Практическая работа по итогам дня
-
День 7 — 25 августа
Полигенные шкалы риска. Машинное обучение.
10:00–11:30
Введение в Python, Pandas и Jupyter Notebook для работы с геномными данными.
11:30–11:45
Перерыв
11:45–13:15
Введение в машинное обучение: линейная и логистическая регрессии. Предварительный анализ данных. Оценка метрик.
13:15–14:30
Обед
14:30–16:00
GWAS. Полигенные шкалы риска в кардиогенетике
16:00–16:15
Перерыв
16:15–17:45
Практика: Применение методов машинного обучения для интеграции полигенной шкалы риска
-
День 8 — 27 августа
Защита проектов и закрытие школы
10:00–17:45
Защита индивидуальных проектов
Организационный комитет
Центр биомедицинских исследований и технологий: Директор центра
Центр биомедицинских исследований и технологий: Научный сотрудник
Центр биомедицинских исследований и технологий: Младший научный сотрудник
Центр биомедицинских исследований и технологий: Младший научный сотрудник
Департамент больших данных и информационного поиска: Приглашенный преподаватель
Центр биомедицинских исследований и технологий: Младший научный сотрудник
Центр биомедицинских исследований и технологий: Стажер-исследователь