• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Семинар по биоинформатике «DeepGSR: оптимизированная структура глубинного обучения для распознавания геномных сигналов и участков»

Мероприятие завершено

На факультете компьютерных наук проходит регулярный семинар, посвященный методам машинного обучения в биоинформатике. Руководит семинаром Мария Попцова, доцент департамента больших данных и информационного поиска

Методы машинного обучения уже нашли широкое применение в областях генетики и геномики. Они оказались наиболее полезны для интерпретации больших наборов геномных данных и аннотации большого числа элементов генома. Методы машинного обучения были успешно применены для распознавания сайтов старта транскрипции, сплайс-сайтов, альтернативного сплайсинга, промотеров, энхансеров, расположения нуклеосом. После революции в технологиях секвенирования накопление экспериментальных данных происходит быстрее, чем построение моделей, объясняющих функционирование генома. Необходима как разработка новых подходов, методов и алгоритмов, так и освоение технологий работы с системами больших данных геномики. На семинаре у слушателей будет возможность познакомиться с современными исследованиями в области применения методов машинного обучения к анализу геномных данных ведущих университетов мира, таких как Harvard, MIT, Cambridge, Sorbonne, EMBL-EBI и др.

По четвергам (каждые две недели), аудитория 435 (Кочновский пр-д, д.3)

Даты на 3-4 модуль: 31 января, 14 февраля, 28 февраля, 14 марта, 4 апреля, 18 апреля,
16 мая, 23 мая

Приглашаются все желающие. Для участия и заказа пропуска в здание необходимо пройти регистрацию. 

Регистрация

23 мая 2019, 19:40-21:00, ауд. 435

DeepGSR: оптимизированная структура глубинного обучения для распознавания геномных сигналов и участков

Работа ученых Научно-технологического университета имени короля Абдаллы, Саудовская Аравия (King Abdullah University of Science and Technology, Saudi Arabia), (“DeepGSR: an optimized deep-learning structure for the recognition of genomic signals and regions”, Kalkatawi et al.); публикация в Bioinformatics, 2019 г. Распознавание различных геномных сигналов и участков (genomic signals and regions- GSRs) ДНК критично для понимания организации генома, генной регуляции и генной функции, что помогает создавать более точные аннотации генов и геномов. Компьютерные методы для распознавания GSR требуют отбора свойств последовательностей, и их идентификация по-прежнему остается актуальной задачей. В данной работе авторы исследуют потенциал методов глубинного обучения для распознавания GSR. Авторы разработали программный пакет на основе сверточных сетей для распознавания сигналов полиадениляции и старта начала транскрипции для различных организмов: человека, мыши, быка и мухи. Результаты показали преимущество по сравнению с другими компьютерными методами, кроме того продемонстрировали консервативность сигналов среди разных видов. Программная реализация модели доступна на https://zenodo.org/record/1117159#.XOOoIqZS__Q.