• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Мероприятия НУГ Роль вторичных структур ДНК/РНК в функционировании генома»

Семинары "Методы машинного обучения в биоинформатике". Руководит семинаром Мария Попцова, доцент департамента больших данных и информационного поиска.



31 мая

Глубинное обучение в фармакогеномике: от генной регуляции к стратификации пациентов

Работа ученых Мичиганского университета США (“Deep learning in pharmacogenomics: from gene regulation to patient stratification”, Kalinin et al.). Публикация в Pharmacogenomics, May 19, 2018. В данной статье дается обзор настоящего состояния и прогнозов на будущее приложений глубинного обучения в фармакогеномике, включая идентификацию новых регуляторных вариантов, расположенных в некодирующих областях генома и их функциональной роли с точки зрения фармакогеномики, стратификацию пациентов по истории болезни, и механистическое предсказание ответа на препарат и его мишеней. Ожидается, что в будущем глубинное обучение будет использоваться для предсказания индивидуального ответа на лекарства и определять курс персонализированного лечения, используя знания, извлеченные из больших и сложных молекулярных, эпидемиологических, клинических и демографических наборов данных.

Время: 18:10 – 19:30
Место: Кочновский пр-д., 3, ауд. 509


17 мая

Системный анализ и методы машинного обучения в применении к данным геномики рака c использованием CancerSysDB

Работа лаборатории биоинформатики Кельнского университета, Германия. (“Integrative analysis and machine learning 
on cancer genomics data using the Cancer Systems Biology Database (CancerSysDB, Krempel et al.). Публикация в BMC Bioinformatics 2018. Разработанный авторами ресурс CancerSysDB позволяет анализировать различные типы данных из множества исследований разных лабораторий. Также показано, как ресурс может использоваться для классификации типов рака на основе данных 9091 пациентов консорциумного проекта The Cancer Genome Atlas (TCGA).

Время: 18:10 – 19:30
Место: Кочновский пр-д., 3, ауд. 509


26 апреля

Докладчик:  Иван Кулаковский
Институт молекулярной биологии им. В.А.Энгельгардта РАН, Москва
Институт математических проблем биологии РАН, Пущино

В 2016-2017 году прошло соревнование по машинному обучению в биологии DREAM-ENCODE. Алгоритм, предложенный российской командой под руководством Ивана Кулаковского, для предсказания мест связывания белков, регулирующих экспрессию генов, был признан лучшим.

Перед участниками была поставлена задача предсказания сайтов связывания факторов транскрипции в геноме человека. Для этого предлагалось использовать данные доступности хроматина (DNase-Seq), данные по экспрессии генов (RNA-Seq) и модели мотивов сайтов связывания на основе нуклеотидных последовательностей. Верификация предсказаний проводилась организаторами соревнования на неопубликованных данных по иммунопреципитации хроматина (ChIP-Seq). Доклад будет посвящен особенностям экспериментальных данных, переносимости информации между различными типами клеток, возможным стратегиям машинного обучения и реально достижимой точности предсказаний. Наконец, мы обсудим сопутствующую задачу компьютерной регуляторной геномики: предсказание влияния однонуклеотидных вариантов в регуляторных последовательностях на экспрессию генов.

Время: 18:10 – 19:30 
Место: Кочновский пр-д., 3, ауд. 509


12 апреля

Методы разделения сигналов вслепую и биоинформатические задачи

Докладчик: Дмитрий Левандо —  Факультет экономических наук ВШЭ

Blind Signal Separation (BSS), или разделение сигналов вслепую, это набор методов, предполагающих, что, есть набор независимых источников, которые создают индивидуальные сигналы, и имеется  набор детекторов (регистраторов сигналов). Каждый  детектор может регистрировать все сигналы от всех источников. Требуется идентифицировать, какой сигнал принадлежит какому источнику. Разделение зарегистрированных сигналов происходит через решение  обратной задачи.  Такие задачи с дискретным набором источников и дискретным набором приемников встречаются в томографии, кардиологии, а также применяется в биоинформатике. Например, для разделения неоднородных клеток культуры ткани.

Математическая сторона задачи представляет собой набор систем уравнений (тензорное уравнение), для решения которого вводятся   различные предположения о структуре сигналов. Это позволяет решать задачу методами линейной алгебры. Методы будут обсуждаться. В 2017 году было  предложено расширение задачи на случай  не независимых источников с построением модели Blind Quantum Signal Separation, где   зависимость источников и их сигналов становится аналогом квантовой запутанности. Будут обсуждаться потенциальные применения этого метода для биоинформатических исследований.

Время: 18:10 – 19:30 
Место: Кочновский пр-д., 3, ауд. 509


15 марта

Методы моделирования трехмерной структуры вариабельных доменов антител

Докладчик: Павел Яковлев — директор Департамента вычислительной биологии BIOCAD. 

В современной структурной биологии есть ряд вычислительных методов, позволяющих с высокой достоверностью характеризовать биологические молекулы, их схожесть и различия, способы взаимодействия и функции. Для построения подобных вычислений входным параметром всегда выступает пространственная структура белка, однако её получение не смотря на полувековой прогресс в области кристаллографии может быть затруднен. Лекция посвящена решению этой проблемы с помощью гомологичного моделирования структур белков — построения трехмерных структур на основании данных о структурах белков, схожих с целевым по последовательности. Для примера будут рассмотрены основные терапевтические агенты белковых лекарственных средств — вариабельные домены антител. Эти белки обладают уникальной структурой гипервариабельных петель, что делает их не только удобными для использования в терапии, но и интересным объектом для разработки новых методов предсказания фолдинга белков.

Время: 18:10 – 19:30
Место: Кочновский пр-д., 3, ауд. 509


1 марта

Предсказание сайтов связывания ДНК с белком с помощью сверточных нейронных сетей

Работа лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института (MIT), США. (“Convolutional neural network architectures for predicting DNA–protein binding”, Zeng et al.). Публикация в Bioinformatics 2016. Были использованы данные связывания транскрипционных факторов из 690 различных ChiP-seq экспериментов консорциумного проекта ENCODE.

Время: 18:10 – 19:30   
Место: Кочновский пр-д., 3, ауд. 509


8 февраля

Распознавание структуры транспозона методом опорных векторов

Работа группы М. Попцовой. Публикация BMC Genomics, 2016. Транспозоны – самостоятельно перемещающиеся фрагменты ДНК – составляют 45% генома человека и большую часть геномов других видов. Важную роль в транспозиции играет вторичная структура РНК на конце транспозона, по которой происходит узнавание транспозона. Используя структурные характеристики ДНК удалось методом опорных векторов построить модель, распознающую структуру транспозонов среди других структур генома.

Время: 18:10 – 19:30  
Место: Кочновский пр-д., 3, ауд. 509


1 февраля

Расшифровка сплайсингового кода с помощью нейронных сетей

Cовместная работа Университета Торонто и Кембриджа. (“Deciphering the splicing code”, Barash et al.). Публикация в Nature 2010. «Сплайсинговый код» использует больше тысячи характеристик РНК для предсказания альтернативного сплайсинга в зависимости от типа ткани методом однослойной логистической байесовой сети. На основе этого кода было создано веб-приложение AVISPA для анализа и предсказания альтернативного сплайсинга (2013, Пенсильванcкий Университет).

Время: 18:10 – 19:30 
Место: Кочновский пр-д., 3, ауд. 509




 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.