• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Семинары

 18 апреля (чт), 18:10-19:30 Кочновский пр., 3, ауд. 205

 

«G-квадруплексы: Современные методы обнаружения и связь с метилированием ДНК » 

 Докладчик - Дмитрий Коновалов, студент магистратуры физического факультета МГУ

 Аннотация - Гуаниновые квадруплексы - это неканонические вторичные структуры ДНК образующиеся из богатых гуанином последовательностей ДНК. Квадруплексы широко распространены в геноме человека и ассоциированы с рядом генетических заболеваний. Роль многих таких структур в геноме, на данный момент является неизвестной. Существуют свидетельства связи квадруплексов с эпигенетической регуляцией. Известно, что квадруплексы могут связываются с DNMT1. При этом, сообщалось как и о увеличении числа квадруплексов при гипометилировании, так и о увеличении стабильности отдельных квадруплексов при иперметилировании. Для изучения роли и выявления общих закономерностей квадруплексов нужны высокопроизводительные методы их обнаружения.

Первая часть доклада посвящена современным высокопроизводительным экспериментальным (G4-seq, G4-Chip-Seq) и компьютерным методам обнаружения G-квадруплексов.
Во второй части доклада будут представлены результаты проверки ряда гипотез о связи квадруплексов с метилированием ДНК человека (существование двух классов квадруплексов; связь с тканеспецифичными дифференциально метилированными участками (DMR), клеткоспецифичными DMR, инактивацией X хромосомы)

Также с практическим обзором ChIP‐Atlas: a data‐mining suite powered by full integration of public ChIP‐seq data выступит Дмитрий Светличный , ведущий научный сотрудник лаборатории, доцент департамента больших данных и информационного поиска ФКН




 

4 апреля (чт), 18:10-19:30 Кочновский пр., 3, ауд. 511

 
«Исследование видоспецифической регуляции генной экспрессии в нервной ткани приматов» 

 Докладчик - Абусаид Шаймарданов, студент 1 курса магистерской программы «Анализ данных в биологии и медицине» ФКН

 Аннотация - Различия в генетической последовательности между человеком и шимпанзе (ближайшим родственником человека) крайне невелики. Сравнение гомологичных белковых последовательностей также демонстрирует небольшую разницу между видами: около 30% полипептидов идентичны, а для большинства остальных молекул различия представлены одной или двумя аминокислотами на белок. Таким образом, можно предположить, что одним из “человекообразующих” факторов, возможно, является изменение регуляции работы генов. В частности, в своей работе, мы рассматриваем различия между цис-регуляторными элементами человека и двух обезьян. В ходе работы были выявлены человекоспецифические, а также общие для приматов регуляторные элементы. Далее, мы попробовали найти отличия между двумя группами элементов, а также произвели поиск мотивов de novo и с помощью открытых баз данных.

 



18 марта (пн), 16:40-18:00 Кочновский пр., 3, ауд. 322

 

«Методы реконструкции генных сетей по экспрессионным данным» 

Докладчик - Дмитрий Светличный , доцент департамента больших данных и информационного поиска ФКН

Аннотация - Современный уровень развития экспериментальной геномики позволяет проводить масштабное исследование активности генов в разных типах клеток и тканей. 

Ключевым практическим аспектом использования полученной информации является установление взаимосвязи между генетическими данными и функциональными свойствами 
клеток
(например, влияние на развитие какого-либо заболевания), что требует обработки данных с целью интерпретация полученных результатов.
Решение этой задачи в значительной степени опирается на современные методы машинного обучения и анализа данных. 
С целью исследования влияния генов применяются вычислительные методы реконструкции генной сети, представляющей собой граф, описывающий связи между генами. 
Будет рассказано о методах реконструкции топологии генной сети из экспериментальных данных с использованием комбинации методов машинного обучения и статистики. 






25 февраля (пн), 16:30-18:00 Кочновский пр., 3, ауд. 322

«Модели глубинного обучения для предсказания экспрессии генов по модификациям гистонов» 

Докладчик - Светлана Шишкова (физфак МГУ)

Аннотация - в докладе будут представлены два метода DeepChrome (публикация в Bioinformatics 2016) и DeepDiff (публикация в Bioinformatics 2016) по методам глубинного обучения с графическим представлением входных данных экспериментов Chip-Seq. С помощью DeepChrome по данным о модификации гистонов предсказывается уровень экспрессии генов, а с помощью DeepDiff  дифференциальная экспрессия генов в разных типах тканей.

(Оригинальные статьи: (1) Singh et al., DeepChrome: deep-learning for predicting gene expression from histone modifications. Bioinformatics, 32, 2016 (2); Sekhon et al., DeepDiff: DEEP-learning for predicting DIFFerential gene expression from histone modifications.  Bioinformatics, 34, 2018)

 



18 февраля (пн), 16:30-18:00 Кочновский пр., 3, ауд. 618

"Слайдинг интронов у млекопитающих"

ДокладчикПоверенная Ирина Владимировна, факультет биоинженерии и биоинформатики МГУ.

Аннотация.   Интроны – это внутригенные участки ДНК, которые не содержат информации о последовательности белка. Интроны являются характерной особенностью эукариотических генов, для которых свойственно дозревание мРНК после транскрипции, в ходе которого интроны вырезаются из последовательности мРНК. Слайдинг интронов является редким эволюционное событием, в ходе которого интрон перемещается на короткое расстояние (1-15 п.о.). Хотя слайдинг может привести к изменению фазы интрона, отражающей его позицию относительно открытой рамки считывания, он никак не влияет на последовательность зрелой мРНК. Неясный молекулярный механизм слайдинга и частые ошибки в аннотации генов ставят под сомнение существование такого события. В нашей работе мы ищем случаи слайдинга между генами человека и 13 видами млекопитающих таких как шимпанзе, мышь и др, путем анализа геномных выравниваний и транскриптомных данных.

 




28
 января (пн), 16:00-18:00 Кочновский пр., 3, ауд. 219

"From microarrays to SGS: an overview of sequencing methods and algorithms of sequencing data analysis".

Понамарева Ирина, стажер-исследователь лаборатории

 

 



11 февраля (пн), 16:30-18:00 Кочновский пр., 3, ауд. 219

Заикин Антон, аспирант, сотрудник НУЛ биоинформатики

На семинаре будет разобрана статья "Recognition of prokaryotic and eukaryoticpromoters using convolutional deep learningneural networks" (Ramzan Kh. Umarov, Victor V. Solovyev).
 PromotersProEuk


Abstact - Accurate computational identification of promoters remains a challenge as these key DNA regulatory regions have variable structures composed of functional motifs that provide gene-specific initiation of transcription. In this paper we utilize Convolutional Neural Networks(CNN) to analyze sequence characteristics of prokaryotic and eukaryotic promoters and build their predictive models. We trained a similar CNN architecture on promoters of five distant organisms: human, mouse, plant (Arabidopsis), and two bacteria (Escherichia coli and Bacillus subtilis). We found that CNN trained on sigma70 subclass of Escherichia coli promoter gives an excellent classification of promoters and non-promoter sequences (Sn =0.90, Sp = 0.96, CC = 0.84). The Bacillus subtilis promoters identification CNN model achieves Sn = 0.91, Sp = 0.95, and CC = 0.86. For human, mouse and Arabidopsis promoters we employed CNNs for identification of two well-known promoter classes (TATA and non-TATA promoters). CNN models nicely recognize these complex functional regions. For human promoters Sn/Sp/CC accuracy of prediction reached 0.95/0.98/0,90 on TATA and0.90/0.98/0.89 for non-TATA promoter sequences, respectively. For Arabidopsis we observed Sn/Sp/CC 0.95/0.97/0.91 (TATA) and 0.94/0.94/0.86 (non-TATA) promoters.Thus, the developed CNN models, implemented in CNNProm program, demonstrated the ability of deep learning approach to grasp complex promoter sequence characteristics and achieve significantly higher accuracy compared to the previously developed promoter prediction programs. 






 21 января (пн), 16:00-18:00 Кочновский пр., 3, ауд. 322

Ностаева Арина, стажер-исследователь НУЛ биоинформатики

На семинаре будет разобрана статья "An image representation based convolutional network for DNA classification" (Bojian Yin, Marleen Balvert, etc.)   An image representation

Abstact - The folding structure of the DNA molecule combined with helper molecules, also referred to as the chromatin, is highly relevant for the functional properties of DNA. The chromatin structure is largely determined by the underlying primary DNA sequence, though the interaction is not yet fully understood. In this paper we develop a convolutional neural network that takes an image-representation of primary DNA sequence as its input, and predicts key determinants of chromatin structure. The method is developed such that it is capable of detecting interactions between distal elements in the DNA sequence, which are known to be highly relevant. Our experiments show that the method outperforms several existing methods both in terms of prediction accuracy and training time.



 

20 декабря (чт), 16:00-18:00 Кочновский пр., 3, ауд. 505

Бекназаров Назар, студент 4 курса ОП "Прикладная математика и информатика"

"Применение CNN и RNN для предсказания функций последовательностей ДНК"



11 декабря (вт), 16:00-18:00 Кочновский пр., 3, ауд. 511

Воркшоп "Анализ геномных данных" Часть 2
Заикин Антон,
аспирант ФКН
Розенвальд Михаль,
студентка 1 курса магистратуры ФКН

 Будут разобраны следующие темы:

- Применение методов машинного обучения на конкретных задачах;
- Python Notebook;
-
Random Forest, SVM, xFBoost, RNN, CNN

 


4 декабря (вт), 16:00-18:00 Кочновский пр., 3, ауд. 402

Воркшоп "Анализ геномных данных" Часть 1

Попцова Мария Сергеевна, заведующий НУЛ Биоинформатики, доцент ДБДиИП
Заикин Антон, аспирант ФКН, НУЛ Биоинформатики

Будут разобраны следующие темы:
- основы работы в линукс-среде;
- где скачать геном;
- где скачать аннотацию генома генами, транспозонами и другими функциональными элементами;
- как найти пересечения аннотаций;
- как скачать данные NGS Encode and The Roadmap Epigenomics;
- как собрать данные для машинного обучения.

 


20 ноября (вт), 16:00-17:50  Кочновский пр., 3, ауд. 314

Анализ структур комплексов белков с нуклеиновыми кислотами с помощью базы NPIDB и её сервисов

Сергей Александрович Спирин, ведущий научный сотрудник научно-учебной лаборатории биоинформатики, доцент факультета компьютерных наук.

NPIDB (Nucleic AcidsProtein Interaction Data Basehttp://npidb.belozersky.msu.ru/ ) — проект, цель которого — предоставить в удобном виде информацию для сравнительного анализа структур ДНК-белковых и РНК-белковых комплексов. Исходные данные (сами структуры) берутся из PDB, но после этого обрабатываются и реорганизуются. Прежде всего выявляются контакты между атомами нуклеиновых кислот, с одной стороны, и белка — с другой. Кроме того, комплексы организуются в семейства согласно семействам белков, к которым принадлежит белковая часть каждого комплекса. Будет рассказано об организации базы, её веб-интерфейсе, программном обеспечении и планируемом развитии.



13 ноября 2018 (чт), 16:00-17:45 Кочновский пр., 3, ауд. 304

Мария Сергеевна Попцова,
заведующий научно-учебной лабораторией биоинформатики, доцент факультета компьютерных наук

Роль вторичных структур ДНК в функционировании генома

В настоящее время известно, что вторичные структуры ДНК (крестообразные структуры, квадруплексы, триплексы, А-форма и Z-форма ДНК) играют важную роль в самых разных процессах функционирования генома, включая транскрипцию, трансляцию и организацию хроматина. Несмотря на множество доступных экспериментальных данных, по которым строится аннотация генома различными геномными элементами, высокопоточные экспериментальные установки, позволяющие обнаруживать вторичные структуры ДНК и определять их функциональную роль, находятся в стадии разработки. Тем не менее, первые полногеномные эксперименты и аннотация геномов компьютерными методами свидетельствует о том, что ДНК обладает огромным потенциалом образовывать вторичные структуры, а экспериментальные данные по отдельным конкретным структурам ДНК указывают на их регуляторную роль. В своем докладе я расскажу о задачах и проектах направления «ДНК-пунктуация» лаборатории биоинформатики, включая поиск характерных паттернов расположения вторичных структур ДНК и экспериментально подтвержденных функциональных элементов генома, а также построение моделей машинного обучения для аннотации геномов обнаруженными вторичными структурами ДНК.


8 ноября 2018 (чт), 16:00-17:45 Кочновский пр., 3, ауд. 306

Михаль Розенвальд,
стажёр-исследователь НУЛ биоинформатики, студентка 1 курса магистерской программы "Анализ данных в биологии и медицине"

Задача исследования трехмерной структуры хроматина с помощью рекуррентных нейронных сетей

В последние годы область применения методов машинного обучения значительно расширилась. В частности, особенно значимо их использование в молекулярной биологии. Развитие технологий позволяет на сегодняшний день быстро генерировать большое количество эпигенетических данных. Новая технология Hi-C дала возможность извлекать данные о взаимодействиях в геноме, которые раскрыли многие принципы укладки хроматина, включая выделение в геноме топологически ассоциированных доменов (ТАДы). Несколько исследований подтвердили наличие корреляции между структурой хроматина и эпигенетическими признаками.

Исследование Михаль Розенвальд посвящено использованию методов машинного обучения для предсказания трехмерной структуры хроматина с помощью эпигенетических ChIP-seq данных (хроматиновых маркеров). Используются линейные модели с тремя типами регуляризации и архитектуры рекуррентных нейронных сетей. В результате модели были обучены и была оценена их производительность. Наилучшие результаты метрики взвешенной средней квадратичной ошибки (wMSE) были получены при применении нейронных сетей.

Были идентифицированы наиболее информативные эпигенетические признаки, что позволяет оценить их значимость для формирования трехмерной структуры хроматина.

 


29 октября 2018 (пн), 16:00-17:45 Кочновский пр., 3, ауд. 304

Отабек Маткаримов, стажёр-исследователь НУЛ биоинформатики, студент 1 курса магистерской программы "Науки о Данных"
Денис Поливода,
стажёр-исследователь НУЛ биоинформатики, студент 1 курса магистерской программы "Компьютерные сисетмы и сети" МИЭМ

Поиск паттернов ассоциации между функциональными элементами генома

Актуальной является задача поиска взаимосвязей между различными функциональными аннотациями генома, как экспериментальными, так и теоретическими. Существующие программы поиска паттернов имеют существенные ограничения, большинство реализовано для работы в системе юникс, графический интерфейс отсутствует, а сами программы сложны в использовании.  Мы разработали программу, запускаемую в браузере в любой операционной системе, с пользовательским графическим интерфейсом, которая принимает на вход два файла геномной аннотации в формате .bed, визуализирует распределение функциональных элементов в виде плотностей на уровне хромосомы и осуществляет поиск паттернов ассоциации между двумя исследуемыми геномными элементами. Найденные паттерны визуализируются, и информация об их расположении выдается в виде списка. Данная программа предназначается для решения широкого класса биоиформатических задач поиска паттернов ассоциации между различными функциональными аннотациями генома.



8 октября 2018 (пн), 16:00-17:45 Кочновский пр., 3, ауд. 304

1. Александр Щербаковстажёр-исследователь НУЛ биоинформатики, студент 2 курса магистерской программы "Анализ данных в биологии и медицине"  

Особенности формы ДНК в зоне контакта с ДНК-узнающими белками

Параметры «формы ДНК», которые считываются ДНК-узнающими белками, могут усилить их специфичность при взаимодействии с ДНК. Однако, насколько сильно влияние этих параметров? Можем ли мы сказать, что родственные ДНК-узнающие белки склонны взаимодействовать с ДНК, у которой похожие параметры «формы», и можем ли мы, используя эти параметры, каким-то образом судить о родственности белков? Используя данные The Nucleic acid–Protein Interaction DataBase (NPIDB) и средства математической статистики, мы постараемся пролить свет на данные вопросы.

2. Николай Бутенко, стажёр-исследователь НУЛ биоинформатики, студент 2 курса магистерской программы "Анализ данных в биологии и медицине" 

Программа множественного структурного выравнивания ДНК-белковых комплексов и ее применение к выявлению консервативных особенностей связывания ДНК белками из широко распространенных семейств ДНК-узнающих белков



1 октября 2018 (пн), 16:00-17:45 Кочновский пр., 3, ауд. 510

Дмитрий Светличный, доцент ДБДИП ФКН

Multiplex enhancer-reporter assays uncover unsophisticated logic of TP53 cis-regulatory modules.

Transcription factors regulate their target genes by binding to regulatory regions in the genome. Although the binding preferences of TP53 are known, it remains unclear what distinguishes functional enhancers from nonfunctional binding. In addition, the genome is scattered with recognition sequences that remain unoccupied. Using multiplex enhancer-reporter assays coupled with machine learning methods we discovered that functional enhancers could be discriminated from nonfunctional binding events by the occurrence of a single TP53 canonical motif. By combining machine learning with a meta-analysis of TP53 ChIP-seq data sets, we identified a core set of more than 1000 responsive enhancers in the human genome. This TP53 cistrome is invariably used between cell types and experimental conditions, whereas differences among experiments can be attributed to indirect nonfunctional binding events. Our data suggest that TP53 enhancers represent a class of unsophisticated cell-autonomous enhancers containing a single TP53 binding site, distinct from complex developmental enhancers that integrate signals from multiple transcription factors.

 


24 сентября 2018 (пн),16:00-17:45 Кочновский пр., 3, ауд. 510

ЭленТеванян, аспирантка ФКН, НУЛ биоинформатики

Machine-Learning Models to Recognize Patterns of Nucleosome and DNA Structures Positioning

Non-B DNA structures have a great potential to form and influence various genomic processes including transcription. One of the mechanisms of transcription regulation is nucleosome positioning. Even though only B-DNA can be wrapped around a nucleosome, non-B DNA structures can compete with a nucleosome for a genomic location. Here we used permanganate/S1 nuclease footprinting data on non-B DNA structures, such as Z-DNA, H-DNA, G-quadruplexes and stress-induced duplex destabilization (SIDD) sites, together with MNase-seq data on nucleosome positioning in the mouse genome. We found three types of patterns of nucleosome positioning around non-B DNA structures: a structure is surrounded by nucleosomes from both sides, from one side, or nucleosome free region. Machine learning models based on random forest and XGBoost algorithms were constructed to recognize DNA regions of 1kB length containing a particular pattern of nucleosome positioning for four types of DNA structures (Z-DNA, H-DNA, G-quadruplexes and SIDD sites) based on statistics of di- and tri-nucleotides. The best performance (94% of accuracy) was reached for G-quadruplexes while for other types of structures the accuracy was under 70%. We conclude that 1kB regions containing G-quadruplexes have distinct compositional properties, and this fact points to preferential locations of such pattern in the genome and requires further investigation. For other DNA structures a region composition is not a sufficient predictive factor and one should take into account other physical and structural DNA properties to improve nucleosome-DNA-structure pattern recognition.
 

 


17 сентября 2018 (пн), 16:00-17:45  Кочновский пр., 3, ауд. 510

Обсуждение статьи "Folded DNA in Action: Hairpin Formation and Biological Functions in Prokaryotes." (Bikard D, Loot C, Baharoglu Z, Mazel D. Microbiol Mol Biol Rev. 2010 Dec; 74(4):570-88.)

Abstract:
 Structured forms of DNA with intrastrand pairing are generated in several cellular processes and are involved in biological functions. These structures may arise on single-stranded DNA (ssDNA) produced during replication, bacterial conjugation, natural transformation, or viral infections. Furthermore, negatively supercoiled DNA can extrude inverted repeats as hairpins in structures called cruciforms. Whether they are on ssDNA or as cruciforms, hairpins can modify the access of proteins to DNA, and in some cases, they can be directly recognized by proteins. Folded DNAs have been found to play an important role in replication, transcription regulation, and recognition of the origins of transfer in conjugative elements. More recently, they were shown to be used as recombination sites. Many of these functions are found on mobile genetic elements likely to be single stranded, including viruses, plasmids, transposons, and integrons, thus giving some clues as to the manner in which they might have evolved. We review here, with special focus on prokaryotes, the functions in which DNA secondary structures play a role and the cellular processes giving rise to them. Finally, we attempt to shed light on the selective pressures leading to the acquisition of functions for DNA secondary structures.


  FoldedDNAinAction

 


10 сентября 2018 (пн), 16:00-17:45 (Кочновский пр., 3, ауд. 510.)

1. Антон Заикин, аспирант ФКН, НУЛ биоинформатики

Cтруктуры стебель-петля в промоторах бактерий

2. Екатерина Тихонова, стажёр-исследователь НУЛ биоинформатики, студентка 2 курса магистерской программы "Анализ данных в биологии и медицине"

Пангеномы бактерий рода Bacillus



 

 

 

 

 



 


 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.