• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Семинары декабрь 2018-февраль 2019

25.02 Модели глубинного обучения для предсказания экспрессии генов по модификациям гистонов

Светлана Шишкова, студент физического факультета МГУ, на семинаре представлила два метода DeepChrome (публикация в Bioinformatics 2016) и DeepDiff (публикация в Bioinformatics 2016) по методам глубинного обучения с графическим представлением входных данных экспериментов Chip-Seq. С помощью DeepChrome по данным о модификации гистонов предсказывается уровень экспрессии генов, а с помощью DeepDiff  дифференциальная экспрессия генов в разных типах тканей.

(Оригинальные статьи: (1) Singh et al., DeepChrome: deep-learning for predicting gene expression from histone modifications. Bioinformatics, 32, 2016 (2); Sekhon et al., DeepDiff: DEEP-learning for predicting DIFFerential gene expression from histone modifications.  Bioinformatics, 34, 2018)

Кочновский проезд, д.3, аудитория 322.

Время проведения: 16:00-18:00

18.02 Слайдинг интронов у млекопитающих

Ирина Поверенная, приглашенный докладчик с факультета биоинженерии и биоинформатики МГУ, рассказала о слайдинге интронов у млекопитающих.

Интроны – это внутригенные участки ДНК, которые не содержат информации о последовательности белка. Интроны являются характерной особенностью эукариотических генов, для которых свойственно дозревание мРНК после транскрипции, в ходе которого интроны вырезаются из последовательности мРНК. Слайдинг интронов является редким эволюционное событием, в ходе которого интрон перемещается на короткое расстояние (1-15 п.о.). Хотя слайдинг может привести к изменению фазы интрона, отражающей его позицию относительно открытой рамки считывания, он никак не влияет на последовательность зрелой мРНК. Неясный молекулярный механизм слайдинга и частые ошибки в аннотации генов ставят под сомнение существование такого события. В нашей работе мы ищем случаи слайдинга между генами человека и 13 видами млекопитающих таких как шимпанзе, мышь и др, путем анализа геномных выравниваний и транскриптомных данных.

Кочновский проезд, д.3, аудитория 618.

Время проведения: 16:00-18:00

11.02 Recognition of prokaryotic and eukaryoticpromoters using convolutional deep learningneural networks

Аспирант факультета Антон Заикин вместе со слушателями разобрал статью "Recognition of prokaryotic and eukaryoticpromoters using convolutional deep learningneural networks" (Ramzan Kh. Umarov, Victor V. Solovyev).

Abstact. Accurate computational identification of promoters remains a challenge as these key DNA regulatory regions have variable structures composed of functional motifs that provide gene-specific initiation of transcription. In this paper we utilize Convolutional Neural Networks(CNN) to analyze sequence characteristics of prokaryotic and eukaryotic promoters and build their predictive models. We trained a similar CNN architecture on promoters of five distant organisms: human, mouse, plant (Arabidopsis), and two bacteria (Escherichia coli and Bacillus subtilis). We found that CNN trained on sigma70 subclass of Escherichia coli promoter gives an excellent classification of promoters and non-promoter sequences (Sn =0.90, Sp = 0.96, CC = 0.84). The Bacillus subtilis promoters identification CNN model achieves Sn = 0.91, Sp = 0.95, and CC = 0.86. For human, mouse and Arabidopsis promoters we employed CNNs for identification of two well-known promoter classes (TATA and non-TATA promoters). CNN models nicely recognize these complex functional regions. For human promoters Sn/Sp/CC accuracy of prediction reached 0.95/0.98/0,90 on TATA and0.90/0.98/0.89 for non-TATA promoter sequences, respectively. For Arabidopsis we observed Sn/Sp/CC 0.95/0.97/0.91 (TATA) and 0.94/0.94/0.86 (non-TATA) promoters.Thus, the developed CNN models, implemented in CNNProm program, demonstrated the ability of deep learning approach to grasp complex promoter sequence characteristics and achieve significantly higher accuracy compared to the previously developed promoter prediction programs. 

PromotersProEuk (PDF, 918 Кб)

Кочновский проезд, д.3, аудитория 219.

Время проведения: 16:00-18:00

28.01 From microarrays to SGS: an overview of sequencing methods and algorithms of sequencing data analysis

О своём исследовании рассказала Ирина Понамарева, стажёр лаборатории (бакалаврская программа "Прикладная математика и информатика).

Кочновский проезд, д.3, аудитория 219.

Время проведения: 16:00-18:00

21.01.2019 An image representation based convolutional network for DNA classification

Первый семинар 2019 года был посвящен обсуждению статьи "An image representation based convolutional network for DNA classification" (Bojian Yin, Marleen Balvert, etc.). Инициатором и модератором обсуждения стала Арина Ностаева, стажёр лаборатории (магистерская программа "Анализ данных в биологии и медицине").

Abstact. The folding structure of the DNA molecule combined with helper molecules, also referred to as the chromatin, is highly relevant for the functional properties of DNA. The chromatin structure is largely determined by the underlying primary DNA sequence, though the interaction is not yet fully understood. In this paper we develop a convolutional neural network that takes an image-representation of primary DNA sequence as its input, and predicts key determinants of chromatin structure. The method is developed such that it is capable of detecting interactions between distal elements in the DNA sequence, which are known to be highly relevant. Our experiments show that the method outperforms several existing methods both in terms of prediction accuracy and training time.

An image representation (PDF, 1,34 Мб)

Кочновский проезд, д.3, аудитория 322.

Время проведения: 16:00-18:00

20.12.2018 Применение CNN и RNN для предсказания функций последовательностей ДНК

На заключительном семинаре 2018 года студент бакалаврской программы "Прикладная математика и информатика" Назар Бекназаров рассказал об исследовательской работе, связанной с применением CNN и RNN.

Кочновский проезд, д.3, аудитория 505.

Время проведения: 16:00-18:00

11.12 Воркшоп "Анализ геномных данных" Часть 2

На второй части воркшопа Антон Заикин и Михаль Розенвальд (стажер лаборатории) вместе со слушателями прошли темы:

- Применение методов машинного обучения на конкретных задачах;
- Python Notebook;
- Random Forest, SVM, xFBoost, RNN, CNN

Кочновский проезд, д.3, аудитория 511.

Время проведения: 16:00-18:00

04.12 Воркшоп "Анализ геномных данных" Часть 1

На воркшопе заведующий лабораторией Мария Попцова и аспирант Антон Заикин разобрали следующие темы:

- основы работы в линукс-среде;
- где скачать геном;
- где скачать аннотацию генома генами, транспозонами и другими функциональными элементами;
- как найти пересечения аннотаций;
- как скачать данные NGS Encode and The Roadmap Epigenomics;
- как собрать данные для машинного обучения.

Кочновский проезд, д.3, аудитория 402.

Время проведения: 16:00-18:00


 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.