Реализация фреймворка параллельной интерпретации вариативных нейросетевых алгоритмов с целью выявления релевантных признаков на узкой доменной области биоинформатики
Выполнила: Алаева Амелия Игоревна
В настоящее время подход глубокого обучения широко используется во многих естественных науках и, в частности, в биоинформатике. В такой сложной области, как анализ геномных данных, крайне важно понимать, на каких факторах основаны решения модели. Здесь встает вопрос интерпретируемости.
Задачей проекта была разработка метода, который выделяет наиболее релевантные features (признаки), определяет биологические зависимости, выявленные нейронной сетью, и может быть применен к различным проблемам.
Наша работа была направлена на интерпретацию нейронных сетей в рамках задачи идентификации Z-ДНК. Алгоритм искусственного интеллекта должен подтверждать или отвергать наличие Z-ДНК в интервале генома, принимая во внимание omics-данные (данные «омиксных» технологий, например, геномики, эпигеномики). Мы стремились выделить наиболее важные omics-признаки, на которые модель опирается при принятии прогноза.
Совместными усилиями мы разработали надежные модели глубокого обучения на основе сверточных и графовых нейронных сетей, а также протестировали на обеих архитектурах методы интерпретации: Integrated Gradients, InputXGradients, Guided Backpropagation, Deconvolution, а также методы Saliency и GNNExplainer на графовой нейронной сети.
В результате мы идентифицировали наиболее важные признаки, которые в значительной степени влияют на прогнозы модели. Эти признаки могут иметь биологическую значимость в отношении наличия Z-ДНК в геноме. Более того, нам удалось выделить более крупную группу признаков, которая пригодна для обучения модели с незначительной потерей в качестве. Это означает, что требуется меньше данных для обучения.
Итоговый отчет (Алаева)
Презентация (Алаева)
Ссылка на репозиторий на GitHub
Руководитель проекта
Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.

