«Машинное обучение в нефтегазовой отрасли»: интервью с выпускником корпоративной программы
Центр непрерывного образования факультета компьютерных наук НИУ ВШЭ провел полугодовое обучение на программе профессиональной подготовки «Машинное обучение в нефтегазовой отрасли» для сотрудников ПАО Лукойл из разных регионов и стран. За время обучения слушатели не только посещали онлайн-занятия и выполняли домашние работы, но и приезжали на недельный очный интенсив в кампус НИУ ВШЭ в Москве, работали над выполнением большого прикладного проекта, защита которого проходила в Доме Дурасова, а также примеряли мантии и подбрасывали конфедератки, как настоящие выпускники НИУ ВШЭ.
О том, как проходило обучение, какие цели ставили перед собой слушатели и как удалось применить полученные знания в нефтегазовой отрасли, рассказал Иван Саморуков, выпускник программы «Машинное обучение в нефтегазовой отрасли» и сотрудник ПАО «ЛУКОЙЛ» в Узбекистане.
Расскажите немного о себе: где вы учились, как складывался ваш профессиональный путь, в какой момент вы решили связать свою карьеру с нефтегазовой отраслью?
В нефтегазовую отрасль я попал случайно. В Узбекистане на момент моего поступления все экзамены в местные ВУЗы проводились в один день – 1 августа. При этом несколько филиалов зарубежных университетов проводили экзамены в июне-июле. В качестве тренировки попробовал поступить в филиал российского государственного университета имени И. М. Губкина в Ташкенте. Поступил, а потом еще и прошел отбор в качестве целевого студента ЛУКОЙЛ Узбекистан. Решил остаться в нефтегазе.
После окончания учёбы устроился на работу на промысел в песчаной степи на юге Узбекистана. Прошел путь от оператора по добыче нефти и газа через инженера-технолога до главного специалиста отдела добычи нефти и газа. Активно участвовал в корпоративных конкурсах на лучшую научно-техническую разработку, принимал участие в молодежной самодеятельности.
Чем занимаетесь на текущей позиции, в чем заключается специфика вашей работы? Какие задачи решаете, как они связаны с современными технологиями?
Сейчас занимаюсь двумя основными направлениями: контролем за работой фонда скважин и внедрением машинного обучения в производственную деятельность. В нефтегазовой отрасли сложные задачи принято решать с помощью инженерных симуляторов. Машинное обучение пока используется не так активно, как хотелось бы. Но тем интереснее.
Основной и самый первый проект – Порфирий. С помощью алгоритмов машинного обучения предсказывается текущий дебит газа скважин без физического замера. Это позволяет на ранних стадиях определять нестабильную работу скважин и принимать меры по восстановлению режима работы. Имя проекта отсылает к Виктору Пелевину и его вселенной Transhumanism Inc.
Порфирий не одинок. У него есть друг, Маркус – помощник в области промышленной безопасности. Мы дообучили модель GPT-4o на нормативной документации Республики Узбекистан в области промышленной безопасности, с помощью которой реализована проверка знаний и симуляция внештатных ситуаций.
Кроме этого, есть проекты в области компьютерного зрения, больших языковых моделей, виртуальной лаборатории, обнаружения аномалий, построения прокси-моделей.
Чем было мотивировано решение пройти корпоративное обучение на программе «Машинное обучение в нефтегазовой отрасли», какие были ожидания и цели?
Так или иначе, я связан с машинным обучением с 2019 года. Сначала это было увлечением, затем плавно стало перетекать в работу. Начинал с тематической специализации на онлайн-платформе от Яндекса и МФТИ. Константин Вячеславович Воронцов, Евгений Соколов, Виктор Кантор, Эмели Драль. Честно, специализацию прошел не до конца, лишь пару курсов. После – изучал темы по необходимости. На программе от Центра непрерывного образования ФКН НИУ ВШЭ решил систематизировать свои знания. Заодно и узнал много нового.
Как проходило обучение? Какие темы и направления были затронуты?
Обучение строилось по-разному: слушал лекции, участвовал в вебинарах, была даже очная неделя для разбора самых интересных тем. Темы и направления были многогранны: от установки Python до NLP. Классическое машинное обучение было рассмотрено наиболее подробно.
Какие прикладные задачи или проекты приходилось выполнять в процессе обучения на программе?
Практически с самого начала программы мы поделились на группы и начали выполнять выпускные работы. У меня была тема выявления аномалий в работе динамического оборудования.
Тема не новая, много кто уже этим занимается. Более того, у нас был MVP подобной системы, построенной еще в 2021 году совместно с коллегой. Целью было усовершенствовать MVP и сделать его более технологичным, улучшить качество моделей, повысить удобство работы для пользователей.
В процессе доработки мы выявили аномалию в работе компрессора отходящих газов на одном из наших производственных объектов. Остановили оборудование, провели небольшой ремонт, после чего оно заработало в нормальном режиме. Хочется верить, что мы предотвратили крупную поломку, которая могла огранить объемы добычи и повлекла бы затраты на ремонт.
Удалось ли изменить подход к решению рутинных задач в нефтегазовой отрасли или внедрить модели машинного обучения в работу компании?
Разработанная система выявления аномалий в работе компрессора отходящих газов сейчас находится на стадии внедрения и формализации. Планируем построить аналогичные системы для другого динамического оборудования, не только в ЛУКОЙЛ Узбекистан.
Изменить сам подход к решению задач сложно. Необходимо, чтобы как можно больше людей хотя бы понимали основные возможности и ограничения машинного обучения, автоматизации.
Активное развитие больших языковых моделей обязательно внесет вклад в пересмотр многих рутинных процессов. Прогресс неизбежен, и важно эффективно использовать новые технологии.
Как вы видите будущее применения технологий машинного обучения в нефтегазовой отрасли?
Направлений два: увеличение количества гибридных инженеров и развитие LLM (Large Language Models).
Увеличение доступности технологий машинного обучения будет вести к росту количества различных самоделок среди гибридных инженеров. Гибридный инженер – технолог, механик, электрик и любой другой профильный инженер в нефтегазовой отрасли, который кроме своей основной деятельности умеет программировать и владеет расширенным анализом данных или машинным обучением. Гибридные инженеры будут использовать машинное обучение наравне с калькулятором и Excel’ем, самостоятельно строить небольшие системы, улучшающие их работу. Такие самоделки начнут масштабироваться, объединяться в группы. Этот процесс рано или поздно систематизируют, увеличив его эффективность.
Продолжается цифровизация, растет количество доступных данных: схемы, регламенты, данные телеметрии, лаборатория, планы, мероприятия. Уже сейчас создано огромное количество физических моделей месторождений нефти и газа, на которых можно проводить различные расчеты. Локальные системы, разработки гибридных инженеров, являются не только источником данных, но и инструментом для проведения расчетов.
Все это будет выступать в качестве исходных данных для больших языковых моделей. Обладая выдающимися мультидисциплинарными компетенциями, с учетом огромного массива исходных данных, они смогут значительно увеличить эффективность реализации нефтегазовых проектов.
Есть ли у вас планы продолжать обучение в области машинного обучения или анализа данных?
Есть планы углубить знания в области Machine Learning System Design и LLM. Использование API от OpenAI относительно простое, но для доработки open-source решений и их адаптации под конкретные задачи требуется глубокое понимание технологий.
Хотя это не напрямую связано с анализом данных, оно тесно связано с этой областью в целом. Считаю важным научиться эффективно управлять разработанными системами. Поэтому сейчас прохожу обучение в области управления продуктовой стратегией. Разработать и внедрить систему недостаточно; главное, чтобы она эффективно работала и приносила пользу. Оказывается, это ничуть не проще разработки.
Что бы вы порекомендовали тем, кто только начинает свой путь в этой области?
- Машинное обучение – это инструмент решения конкретных инженерных задач, а не модное направление, для которого нужно придумывать задачи. Хоть и иногда хочется.
- Задача, решаемая с помощью машинного обучения, должна быть интересна и с трудом решаема или нерешаема с помощью классических подходов.
- Большие языковые модели – это помощники, а не наемные сотрудники. Пока рано брать от них готовые куски кода и использовать в работе. А вот получить подсказку и самому допилить – другое дело. И свой мозг не зачерствеет, и уверенности в корректности кода будет больше.
- Из рекомендаций: учебник Яндекса по машинному обучению (подробное пособие для начинающих и продвинутых специалистов), Hugging Face (платформа с открытым исходным кодом для разработки моделей NLP и не только), треки Open Data Science (курсы и сообщества для обмена опытом в области данных), учебные репозитории ВШЭ.
Центр непрерывного образования ФКН проводит корпоративное обучение по математике, программированию, анализу данных и машинному обучению. Программы разрабатываются с учетом специфики компании-заказчика. Узнать больше об организации корпоративного обучения в центре можно по ссылке.