Аттила Кертес-Фаркаш о новой лаборатории и своих исследованиях
Недавно на ФКН открылась научно-учебная лаборатория искусственного интеллекта для вычислительной биологии. Мы поговорили с ее руководителем Аттилой Кертес-Фаркашем о лаборатории, исследованиях и его пути в науке.
Моя специальность — компьютерные науки; я занимаюсь исследованиями уже около двадцати лет. Я начинал с работ по распознаванию речи и методов обработки естественного языка, но вскоре переключился на биоинформатику, потому что понял, что венгерский язык невозможно обработать с помощью компьютерных технологий. С тех пор в течение пятнадцати лет я разрабатывал методы машинного обучения и анализа данных для биоинформатики.
После получения PhD в Венгрии я год занимался исследованиями в США в Университете Мэриленда в Балтиморе в проекте Управления по санитарному надзору за качеством пищевых продуктов и медикаментов. Затем я переехал в Италию, где работал в области анализа данных масс-спектрометрии. После этого я вернулся в США, где мне предложили должность старшего научного сотрудника в Университете Вашингтона, который стабильно входит в топ-20 университетов мира. Я был поражен тем, как там организованы исследования: все было очень прагматично и направлено на решение реальных проблем. Это ускоряет и повышает эффективность исследований. Все сосредоточено на решении прикладных вопросов и на том, чтобы делать то, что работает. После США мы с женой (она русская) рассматривали возможность возвращения в Россию или Венгрию. В тот момент я получил предложение от НИУ ВШЭ, поэтому мы приехали в Россию в 2015 году и с тех пор живем здесь.
Наша лаборатория занимается анализом данных масс-спектрометрии. Масс-спектрометрия используется для идентификации органических молекул, например, для белков в образце крови. Также сравниваются опухолевые и здоровые клетки, так как в них содержатся разные вещества. Этот метод может быть использован в химиотерапии для определения эффективности лечения. У масс-спектроскопии есть применения и в криминалистике, например, на месте пожара могут быть найдены горючие вещества, что может свидетельствовать о поджоге. С помощью масс-спектрометрии можно обнаруживать пестициды в почве, гормоны в организме животных, бактерии в питьевой воде и так далее.
У нашей лаборатории есть две цели: во-первых, аннотировать данные, чтобы понять, какая молекула генерирует данный масс-спектр; во-вторых, разработать статистические методы, чтобы доказать, что наша аннотация верна. Наша главная цель — улучшить методы анализа, сделав их более статистически обоснованными.
Сейчас мы находимся в процессе создания нашей лаборатории. Мы ищем людей, которые смогут стать нашими коллегами. У нас есть несколько открытых вакансий: например, мы ищем разработчика C++ для реализации наших методов через инструменты с открытым исходным кодом, чтобы наши методы были доступны научному сообществу. В долгосрочной перспективе мы планируем расширить сферу применения и анализировать различные типы данных.