• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

«Вера в то, что все можно смоделировать, давала стимул к тому, чтобы моделировать все»

«Вера в то, что все можно смоделировать, давала стимул к тому, чтобы моделировать все»

Личный архив Александра Тараканова

Александр Тараканов начинал свой путь в науке как физик, окончил докторантуру в США, успел поработать в индустрии и академии. С сентября он работает на ФКН по программе Tenure Track. Мы поговорили с ним о его исследованиях, любимых статьях и планах.

В науке у меня был долгий путь: я начал с физики, потом переключился на численные методы, потом было машинное обучение в нефтяной промышленности, а потом уже машинное обучение само по себе.

В детстве мне нравилось решать задачки, поэтому я участвовал в школьных олимпиадах по физике и математике. Мне нравились оба предмета, но в старших классах нужно было сделать выбор, чему посвящать больше времени. Так как по математике у нас в области была довольно сильная конкуренция, я выбрал физику. Олимпиады дали мне бонус при поступлении в университет — раз я учил физику, то и пошел на Физтех.

На Физтехе я начинал с физики элементарных частиц, но потом понял, что в чистом виде фундаментальная наука тяжело дается в психологическом плане, ведь результаты работы можно будет увидеть только десятилетия спустя. Поэтому я начал заниматься прикладными науками, в частности, прикладной математикой.

Тогда же, на четвертом или пятом курсе, я впервые заинтересовался программированием. Компьютеры дают возможность изучать огромное разнообразие физических систем с помощью численного моделирования. Осознание того, что для познания мира далеко не всегда требуется лаборатория с дорогим оборудованием, а вполне подойдет ноутбук, было одним из моих главных мотиваторов для изучения прикладной математики. Грубо говоря, вера в то, что все можно смоделировать, давала стимул к тому, чтобы моделировать все.

Что такое численные методы? Любую физическую систему можно описать системой уравнений в частных производных. Эти уравнения — нелинейные, и решить их на бумажке не получается, нужен компьютер. Тут приходят на помощь численные методы. Сначала мы строим модель системы в виде набора уравнений, потом на компьютере решаем данные уравнения численно. Численные методы дают приближенное решение, но с хорошей, контролируемой точностью. Опираясь на полученное решение, можно делать практические выводы.

Интерес к нефтяной промышленности появился после бакалавриата. На тот момент нефтянка предоставляла идеальную возможность удовлетворить научные и материальные интересы: это было машинное обучение того времени. Это и определило выбор специальности для магистратуры: нефтяной инжиниринг.

Чем отличается американская докторантура?

После магистратуры я пошел работать в нефтяную компанию. В какой-то момент во время работы в компании у меня возникло желание углубить свои знания в численных методах и в моделировании течения жидкостей и газов. Второй раз в магистратуру идти было нецелесообразно, поэтому я выбрал докторантуру. Подавал документы в несколько университетов, в итоге поступил в Техасский университет A&M, который высоко ценится в нефтяной сфере.

В каком-то смысле аспирантура похожа на магистратуру, только сложнее. В Америке вообще можно поступить в докторантуру, не имея диплома магистра, достаточно бакалавра, но тогда учеба будет длиться минимум пять лет вместо трех для магистров. Есть обязательные академические часы, которые надо прослушать. Процесс защиты диссертации в Америке почти такой же как в России. Единственная, но очень существенная разница — отсутствие бюрократии (по сравнению с Россией).

В Америке удивило то, что, по сравнению с Россией 2013 года, везде было много компьютеров, и везде был свободный вход, никаких вахтеров — все работает круглосуточно, можно в любое время приходить.

Америка — интересная страна, но не моя. В США приоритет отдан автомобилистам: очень удобно передвигаться на машине между прогулочными зонами и ресторанами, останавливаясь в интересующих местах. В типичном американском городе не получаешь такого удовольствия от прогулок по улицам, как в Москве или Санкт-Петербурге (да и во многих других городах), когда чувствуешь, что жизнь идет, просто выйдя на улицу и находясь среди людей. В США такое можно увидеть только в парках. В остальных местах велик риск быть единственным пешеходом на дороге, кроме, быть может, бегунов.

Соединенное Королевство мне по стилю жизни гораздо ближе: почти все города имеют богатую историю, много парков, можно гулять часами. В каком-то смысле, все европейские города похожи — замок, ратуша, центральный собор, старинные домики — но это не обесценивает удовольствия от исследования новых городов. Но я изначально не планировал оставаться за рубежом — хотелось посмотреть мир и понять жизнь других стран изнутри, чтобы потом вернуться.

Как стать постдоком?

После окончания аспирантуры я начал искать место постдока в Европе — мне захотелось поближе познакомиться с европейской культурой. Попыток было много, найти место постдока непросто из-за высокой конкуренции. Меня взяли примерно с тридцатой попытки.

Первый постдок у меня был в Университете Хериота-Ватта (тот самый Ватт, который киловатт) в Эдинбурге, в Шотландии, второй — в Манчестерском университете в Англии.

В Эдинбурге мне понравилась сама идея проекта. Есть Киотский протокол, в котором все страны пытаются договориться выбрасывать меньше углекислого газа в атмосферу. А проект, куда меня взяли, строился по другому принципу: его авторы решили закачивать углекислый газ из атмосферы под землю. Меня поразило то, что люди не стали ждать, пока все договорятся, а начали действовать. Это меня сильно заинтересовало, я решил попробовать смоделировать эти процессы. Так я пришел в мир машинного обучения.

Здесь же мы с соавтором написали мою любимую статью про байесовский дизайн эксперимента. Байесовский дизайн эксперимента — задача о том, как построить систему сбора данных до проведения эксперимента. Обычно эта задача сводится к марковским цепям, поэтому она вычислительно сложная. Работа над данной статьей потребовала много времени и сил, так как был ряд технических сложностей. Но в какой-то момент пришло понимание того, как их можно обойти. Получился довольно оригинальный метод, описание которого мы и опубликовали.

Второй постдок у меня уже в чистом виде был про математическую статистику и машинное обучение. Здесь было два проекта. 

Первый проект спонсировался Rolls Royce. Они хотели разработать методику описания сплавов на основе фотографий на микронном масштабе. Задача состояла в том, чтобы извлекать из снимка набор количественных признаков, которые бы достаточно полно описывали материал. Для такой постановки задачи было две причины.

Во-первых, хотелось уменьшить роль субъективной оценки при сравнении двух сплавов. Например, несколько экспертов могут дать различные оценки пригодности сплава для изготовления детали. Эффект субъективной оценки можно уменьшить, если проводить сравнение на основе объективных количественных характеристик. 

Вторая причина для такой постановки задачи — снижение затрат памяти на хранение снимков разных сплавов: вместо снимка можно хранить относительно небольшой набор признаков.

Второй проект был посвящен статистическому анализу заболеваемости COVID-19.

Так получилось, что в это время началась пандемия, и часть исследователей переключилась на нее. Я тоже какое-то время этим занимался, у нас вышла статья, где мы оценивали при помощи матстатистики долю зарегистрированных случаев COVID-19 от общего количества заболевших. У нас получалось, что регистрируется только 10% от общего числа случаев. Здесь мы адаптировали известный ранее статистический метод к новым данным.

Статья по COVID-19 примечательна тем, что поставленная в ней задача была решена при помощи классических, в каком-то смысле «скучных» численных методов. Сейчас модно машинное обучение, все хотят нейронки учить. На четвертом курсе в Вышке нет, наверное, ни одного человека, кто не хочет делать нейронки. А мы справились без этого.

Академия и индустрия

После двух постдоков я вернулся в Москву и год работал в Huawei. Там я занимался вопросами расширенного динамического диапазона (High Dynamic Range). Сейчас выпускают телефоны, телевизоры с более совершенными дисплеями, которые позволяют показывать более детальную, более яркую картинку. Основное достоинство таких дисплеев — возможность показывать изображения с большим контрастом. На таком дисплее проще вызвать у зрителя сходства между реальной сценой и изображением. 

Я решал задачу оптимизации алгоритмов для того, чтобы максимально точно передать ощущения контраста яркости между самым темным и самым ярким объектом, при этом, сохранив «натуральность» изображения.

В работе в индустрии и в академии есть как свои плюсы, так и нюансы. В индустрии, например, с оборудованием гораздо проще, но есть ограничения, какие задачи ты можешь решать. А в академии у тебя есть свобода выбора темы. Можно реализовывать свои идеи, публиковать работы, на которых будет твое имя, видишь результат своего труда. Поэтому я вновь пришел в академию, в Вышку. Да и хочется поделиться своим опытом.

Планы

В исследованиях мне интересно решать практические задачи с научной точки зрения, применять теорию к практике.

В машинном обучении есть проблема, где брать данные. А у численных методов есть хорошие модели и методы, но они медленно работают. Здесь тоже применяют модели машинного обучения для ускорения численных методов. Так как у меня есть опыт в обеих областях, я планирую работать на их стыке. Можно разрабатывать методы машинного обучения для решения уравнений в частных производных или ускорять имеющиеся решения и применять их на практике.

Например, есть задача, которую решают коллеги в Сколтехе. Они проводят эксперименты с элементарными частицами. Они не ставят сразу все эксперименты, а пытаются заранее спрогнозировать, какие случаи будут интересными, и ставить эксперименты только в этих случаях. Чтобы это сделать, они решают уравнения Гросса-Питаевского. Это сложная задача, которую можно ускорить с помощью методов машинного обучения.

В свободное время я люблю заниматься спортом — теннисом, фридайвингом, гулять, двигаться. Этим летом первый раз сходил в горы. На работе головой работаю, а после хочется головой отдыхать.