• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Научный семинар: Методы машинного обучения в биоинформатике

12+
Мероприятие завершено

Научный семинар: Методы машинного обучения в биоинформатике (Современные приложения машинного обучения к анализу геномных данных).

 

Проводит семинар доцент департамента больших данных и информационного поиска факультета компьютерных наук заведующий научно-учебной лабораторией биоинформатики Попцова Мария Сергеевна

 

Методы машинного обучения уже нашли широкое применение в областях генетики и геномики. Они оказались наиболее полезны для интерпретации больших наборов геномных данных и аннотации большого числа элементов генома. Методы машинного обучения были успешно применены для распознавания сайтов старта транскрипции, сплайс-сайтов, альтернативного сплайсинга, промотеров, энхансеров, расположения нуклеосом. После революции в технологиях секвенирования накопление экспериментальных данных происходит быстрее, чем построение моделей, объясняющих функционирование генома. Необходима как разработка новых подходов, методов и алгоритмов, так и освоение технологий работы с системами больших данных геномики. На научном семинаре мы будем знакомиться с современными исследованиями в области применения методов машинного обучения к анализу геномных данных ведущих университетов мира, таких как Harvard, MIT, Cambridge, Sorbonne, EMBL-EBI и др.
 

19 декабря 2019 (чт)

19:00-20:30

аудитория M302

Условная генеративно-состязательная сеть  для предсказания экспрессии генов

ДокладчикНикита Константиновский

cтудент программы «Big Data Systems» 

 

Работа ученых Питтсбургского университета, США (“Conditional generative adversarial network for gene expression inference”, Wang et al.). Публикация в журнале Bioinformatics, 2018 г. Несмотря на прогресс в профайлинге экспрессии генов, полногеномное секвенирование все еще остается дорогостоящим. Предыдущие исследования показали высокую корреляцию между паттернами экспрессии отдельных генов, так что небольшой набор генов может быть информативен для описания целого транскриптома. Для данных репозитория the Library of Integrated Network-based Cell-Signature было показано, что набор из 1000 отобранных генов содержит 80% информации о полном геноме и может быть использован для предсказания уровня экспрессии оставшихся генов. Модели глубинного обучения являются теми самыми моделями, которые способны выучить сложные взаимосвязи между генами. Авторы предлагают условную генеративно-состязательную сеть (GAN), которая включает в себя как состязание, так и L1- регуляризацию, что позволяет сделать более точные предсказания.  

Регистрация