• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Семинары

 

20 декабря (чт), 16:00-18:00 Кочновский пр., 3, ауд. 505

Бекназаров Назар, студент 4 курса ОП "Прикладная математика и информатика"

"Применение CNN и RNN для предсказания функций последовательностей ДНК"



11 декабря (вт), 16:00-18:00 Кочновский пр., 3, ауд. 511

Воркшоп "Анализ геномных данных" Часть 2

Заикин Антон
,
аспирант ФКН
Розенвальд Михаль,
студентка 1 курса магистратуры ФКН

 Будут разобраны следующие темы:

- Применение методов машинного обучения на конкретных задачах;
- Python Notebook;
-
Random Forest, SVM, xFBoost, RNN, CNN

 


4 декабря (вт), 16:00-18:00 Кочновский пр., 3, ауд. 402

Воркшоп "Анализ геномных данных" Часть 1

Попцова Мария Сергеевна, заведующий НУЛ Биоинформатики, доцент ДБДиИП
Заикин Антон, аспирант ФКН, НУЛ Биоинформатики

Будут разобраны следующие темы:
- основы работы в линукс-среде;
- где скачать геном;
- где скачать аннотацию генома генами, транспозонами и другими функциональными элементами;
- как найти пересечения аннотаций;
- как скачать данные NGS Encode and The Roadmap Epigenomics;
- как собрать данные для машинного обучения.

 


20 ноября (вт), 16:00-17:50  Кочновский пр., 3, ауд. 314

Анализ структур комплексов белков с нуклеиновыми кислотами с помощью базы NPIDB и её сервисов

Сергей Александрович Спирин, ведущий научный сотрудник научно-учебной лаборатории биоинформатики, доцент факультета компьютерных наук.

NPIDB (Nucleic AcidsProtein Interaction Data Basehttp://npidb.belozersky.msu.ru/ ) — проект, цель которого — предоставить в удобном виде информацию для сравнительного анализа структур ДНК-белковых и РНК-белковых комплексов. Исходные данные (сами структуры) берутся из PDB, но после этого обрабатываются и реорганизуются. Прежде всего выявляются контакты между атомами нуклеиновых кислот, с одной стороны, и белка — с другой. Кроме того, комплексы организуются в семейства согласно семействам белков, к которым принадлежит белковая часть каждого комплекса. Будет рассказано об организации базы, её веб-интерфейсе, программном обеспечении и планируемом развитии.



13 ноября 2018 (чт), 16:00-17:45 Кочновский пр., 3, ауд. 304

Мария Сергеевна Попцова,
заведующий научно-учебной лабораторией биоинформатики, доцент факультета компьютерных наук

Роль вторичных структур ДНК в функционировании генома

В настоящее время известно, что вторичные структуры ДНК (крестообразные структуры, квадруплексы, триплексы, А-форма и Z-форма ДНК) играют важную роль в самых разных процессах функционирования генома, включая транскрипцию, трансляцию и организацию хроматина. Несмотря на множество доступных экспериментальных данных, по которым строится аннотация генома различными геномными элементами, высокопоточные экспериментальные установки, позволяющие обнаруживать вторичные структуры ДНК и определять их функциональную роль, находятся в стадии разработки. Тем не менее, первые полногеномные эксперименты и аннотация геномов компьютерными методами свидетельствует о том, что ДНК обладает огромным потенциалом образовывать вторичные структуры, а экспериментальные данные по отдельным конкретным структурам ДНК указывают на их регуляторную роль. В своем докладе я расскажу о задачах и проектах направления «ДНК-пунктуация» лаборатории биоинформатики, включая поиск характерных паттернов расположения вторичных структур ДНК и экспериментально подтвержденных функциональных элементов генома, а также построение моделей машинного обучения для аннотации геномов обнаруженными вторичными структурами ДНК.


8 ноября 2018 (чт), 16:00-17:45 Кочновский пр., 3, ауд. 306

Михаль Розенвальд,
стажёр-исследователь НУЛ биоинформатики, студентка 1 курса магистерской программы "Анализ данных в биологии и медицине"

Задача исследования трехмерной структуры хроматина с помощью рекуррентных нейронных сетей

В последние годы область применения методов машинного обучения значительно расширилась. В частности, особенно значимо их использование в молекулярной биологии. Развитие технологий позволяет на сегодняшний день быстро генерировать большое количество эпигенетических данных. Новая технология Hi-C дала возможность извлекать данные о взаимодействиях в геноме, которые раскрыли многие принципы укладки хроматина, включая выделение в геноме топологически ассоциированных доменов (ТАДы). Несколько исследований подтвердили наличие корреляции между структурой хроматина и эпигенетическими признаками.

Исследование Михаль Розенвальд посвящено использованию методов машинного обучения для предсказания трехмерной структуры хроматина с помощью эпигенетических ChIP-seq данных (хроматиновых маркеров). Используются линейные модели с тремя типами регуляризации и архитектуры рекуррентных нейронных сетей. В результате модели были обучены и была оценена их производительность. Наилучшие результаты метрики взвешенной средней квадратичной ошибки (wMSE) были получены при применении нейронных сетей.

Были идентифицированы наиболее информативные эпигенетические признаки, что позволяет оценить их значимость для формирования трехмерной структуры хроматина.

 


29 октября 2018 (пн), 16:00-17:45 Кочновский пр., 3, ауд. 304

Отабек Маткаримов, стажёр-исследователь НУЛ биоинформатики, студент 1 курса магистерской программы "Науки о Данных"
Денис Поливода,
стажёр-исследователь НУЛ биоинформатики, студент 1 курса магистерской программы "Компьютерные сисетмы и сети" МИЭМ

Поиск паттернов ассоциации между функциональными элементами генома

Актуальной является задача поиска взаимосвязей между различными функциональными аннотациями генома, как экспериментальными, так и теоретическими. Существующие программы поиска паттернов имеют существенные ограничения, большинство реализовано для работы в системе юникс, графический интерфейс отсутствует, а сами программы сложны в использовании.  Мы разработали программу, запускаемую в браузере в любой операционной системе, с пользовательским графическим интерфейсом, которая принимает на вход два файла геномной аннотации в формате .bed, визуализирует распределение функциональных элементов в виде плотностей на уровне хромосомы и осуществляет поиск паттернов ассоциации между двумя исследуемыми геномными элементами. Найденные паттерны визуализируются, и информация об их расположении выдается в виде списка. Данная программа предназначается для решения широкого класса биоиформатических задач поиска паттернов ассоциации между различными функциональными аннотациями генома.



8 октября 2018 (пн), 16:00-17:45 Кочновский пр., 3, ауд. 304

1. Александр Щербаковстажёр-исследователь НУЛ биоинформатики, студент 2 курса магистерской программы "Анализ данных в биологии и медицине"  

Особенности формы ДНК в зоне контакта с ДНК-узнающими белками

Параметры «формы ДНК», которые считываются ДНК-узнающими белками, могут усилить их специфичность при взаимодействии с ДНК. Однако, насколько сильно влияние этих параметров? Можем ли мы сказать, что родственные ДНК-узнающие белки склонны взаимодействовать с ДНК, у которой похожие параметры «формы», и можем ли мы, используя эти параметры, каким-то образом судить о родственности белков? Используя данные The Nucleic acid–Protein Interaction DataBase (NPIDB) и средства математической статистики, мы постараемся пролить свет на данные вопросы.

2. Николай Бутенко, стажёр-исследователь НУЛ биоинформатики, студент 2 курса магистерской программы "Анализ данных в биологии и медицине" 

Программа множественного структурного выравнивания ДНК-белковых комплексов и ее применение к выявлению консервативных особенностей связывания ДНК белками из широко распространенных семейств ДНК-узнающих белков



1 октября 2018 (пн), 16:00-17:45 Кочновский пр., 3, ауд. 510

Дмитрий Светличный, доцент ДБДИП ФКН

Multiplex enhancer-reporter assays uncover unsophisticated logic of TP53 cis-regulatory modules.

Transcription factors regulate their target genes by binding to regulatory regions in the genome. Although the binding preferences of TP53 are known, it remains unclear what distinguishes functional enhancers from nonfunctional binding. In addition, the genome is scattered with recognition sequences that remain unoccupied. Using multiplex enhancer-reporter assays coupled with machine learning methods we discovered that functional enhancers could be discriminated from nonfunctional binding events by the occurrence of a single TP53 canonical motif. By combining machine learning with a meta-analysis of TP53 ChIP-seq data sets, we identified a core set of more than 1000 responsive enhancers in the human genome. This TP53 cistrome is invariably used between cell types and experimental conditions, whereas differences among experiments can be attributed to indirect nonfunctional binding events. Our data suggest that TP53 enhancers represent a class of unsophisticated cell-autonomous enhancers containing a single TP53 binding site, distinct from complex developmental enhancers that integrate signals from multiple transcription factors.

 


24 сентября 2018 (пн),16:00-17:45 Кочновский пр., 3, ауд. 510

ЭленТеванян, аспирантка ФКН, НУЛ биоинформатики

Machine-Learning Models to Recognize Patterns of Nucleosome and DNA Structures Positioning

Non-B DNA structures have a great potential to form and influence various genomic processes including transcription. One of the mechanisms of transcription regulation is nucleosome positioning. Even though only B-DNA can be wrapped around a nucleosome, non-B DNA structures can compete with a nucleosome for a genomic location. Here we used permanganate/S1 nuclease footprinting data on non-B DNA structures, such as Z-DNA, H-DNA, G-quadruplexes and stress-induced duplex destabilization (SIDD) sites, together with MNase-seq data on nucleosome positioning in the mouse genome. We found three types of patterns of nucleosome positioning around non-B DNA structures: a structure is surrounded by nucleosomes from both sides, from one side, or nucleosome free region. Machine learning models based on random forest and XGBoost algorithms were constructed to recognize DNA regions of 1kB length containing a particular pattern of nucleosome positioning for four types of DNA structures (Z-DNA, H-DNA, G-quadruplexes and SIDD sites) based on statistics of di- and tri-nucleotides. The best performance (94% of accuracy) was reached for G-quadruplexes while for other types of structures the accuracy was under 70%. We conclude that 1kB regions containing G-quadruplexes have distinct compositional properties, and this fact points to preferential locations of such pattern in the genome and requires further investigation. For other DNA structures a region composition is not a sufficient predictive factor and one should take into account other physical and structural DNA properties to improve nucleosome-DNA-structure pattern recognition.
 

 


17 сентября 2018 (пн), 16:00-17:45  Кочновский пр., 3, ауд. 510

Обсуждение статьи "Folded DNA in Action: Hairpin Formation and Biological Functions in Prokaryotes." (Bikard D, Loot C, Baharoglu Z, Mazel D. Microbiol Mol Biol Rev. 2010 Dec; 74(4):570-88.)

Abstract:
 Structured forms of DNA with intrastrand pairing are generated in several cellular processes and are involved in biological functions. These structures may arise on single-stranded DNA (ssDNA) produced during replication, bacterial conjugation, natural transformation, or viral infections. Furthermore, negatively supercoiled DNA can extrude inverted repeats as hairpins in structures called cruciforms. Whether they are on ssDNA or as cruciforms, hairpins can modify the access of proteins to DNA, and in some cases, they can be directly recognized by proteins. Folded DNAs have been found to play an important role in replication, transcription regulation, and recognition of the origins of transfer in conjugative elements. More recently, they were shown to be used as recombination sites. Many of these functions are found on mobile genetic elements likely to be single stranded, including viruses, plasmids, transposons, and integrons, thus giving some clues as to the manner in which they might have evolved. We review here, with special focus on prokaryotes, the functions in which DNA secondary structures play a role and the cellular processes giving rise to them. Finally, we attempt to shed light on the selective pressures leading to the acquisition of functions for DNA secondary structures.

 FoldedDNAinAction

 


10 сентября 2018 (пн), 16:00-17:45 (Кочновский пр., 3, ауд. 510.)

1. Антон Заикин, аспирант ФКН, НУЛ биоинформатики

Cтруктуры стебель-петля в промоторах бактерий

2. Екатерина Тихонова, стажёр-исследователь НУЛ биоинформатики, студентка 2 курса магистерской программы "Анализ данных в биологии и медицине"

Пангеномы бактерий рода Bacillus



 

 

 

 

 



 


 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.