Наука нефти: Нефть, газ и машинное обучение (+ видео лекции) Избранное

Большие данные — это новая нефть, но и нефть — важный источник больших данных. Машинное обучение и искусственный интеллект меняют нефтегазовую отрасль. Как — рассказывает физик Дмитрий Коротеев, профессор магистерской программы Сколтеха «Нефтегазовое дело». ПостНаука и Сколковский институт науки и технологий представляют курс «Наука нефти», посвященный современным технологиям добычи углеводородов.

В 2016 году стало модно говорить о том, что данные — это новая нефть. Наверное, с научной точки зрения так сказать нельзя, потому что из данных мы не можем генерировать энергию, тепло и электричество напрямую. Но часть правды в этом утверждении есть, и прежде всего потому, что данные, которые генерируются при добыче нефти, помогают ее добывать в оптимальном режиме. Сейчас настал такой период, когда цены на нефть достаточно низкие и нефтяным компаниям требуется оптимизировать свои затраты на разработку нефтегазовых месторождений. Именно поэтому многие нефтяники стали смотреть в сторону применения методов машинного обучения, методов искусственного интеллекта и вообще всего набора методов Big Data для оптимизации и удешевления своих технологических процессов.

Если мы посмотрим на историю работы с данными в нефтегазовой отрасли, то правильно будет выделить ранний период, конец XIX — начало XX века, когда люди работали с данными сугубо эмпирическим путем. Подход заключался в следующем: вот я вижу один холмик, а на соседнем холмике уже разбурили и начали добычу нефти, а значит, надо срочно разбурить вот этот холмик, который я вижу. Такой подход работы с данными полностью основан на опыте инженера-разработчика и анализе аналогичных случаев. В результате получалась очень плотная сетка разбуривания, было много вышек, которые располагались очень близко друг к другу. Был нанесен огромный урон экологии, вырубались леса. И как потом выяснилось с развитием нефтяной инженерии, такая система разработки месторождений приводила к тому, что добывалось на самом деле всего несколько процентов из той нефти, которую можно было бы добыть из этих месторождений. И участки плотно разбуренных месторождений фактически были загублены.

В 20–30-е годы XX века на горизонте появляются братья Шлюмберже, один из которых был физиком, а другой инженером. Они придумывают технологию, которая позволяет измерять физические свойства подземных формаций. Сначала они начали измерять электрическое сопротивление и делали это для того, чтобы понять, где можно искать металлические руды. Там, где под поверхностью земли есть металл, можно детектировать пониженное сопротивление. А потом пришла идея о том, что с помощью этих же измерений сопротивления можно локализовать зоны, где под землей находятся углеводороды: в этих участках сопротивление должно быть повышено.

После того как была придумана знаменитая четырехэлектродная схема измерений, подход к разбуриванию скважин стал существенно более рациональным. А еще через некоторое время придумали, как измерять физические свойства подземных залежей не только с поверхности земли, но и из скважин. Инструменты, которые разработаны для внутрискважинного каротажа братьями Шлюмберже, до сих пор являются основой всех высокоточных исследований свойств геологических формаций, в которых ожидают наличие углеводородов. Вокруг каротажных приборов построен сейчас целый бизнес. Много компаний занимаются внутрискважинными исследованиями, чтобы понять, где есть нефть или газ, сколько в каком количестве и как эффективно эти ресурсы можно добыть. Такой подход уже можно назвать эмпирическим с подкреплением физическими измерениями.

Если мы посмотрим на подход, который существует сейчас, его можно описать так: у нас есть множество измерений, которые позволяют судить о том, что содержится под землей. Из этих измерений мы с помощью большого количества экспертов, так называемых геологов и петрофизиков, собираем геологическую модель месторождения. Из геологической модели месторождения мы делаем гидродинамическую модель месторождения. Проводим большое количество вычислений различных сценариев разработки месторождений. Проводим моделирования, основанные на физических законах движения жидкостей в пластах. И уже на фоне этих промоделированных сценариев выбираем наиболее оптимальную схему разработки.

У нас есть эмпирические знания, множество измерений и их интерпретация, сделанная людьми. Также у нас есть физическое моделирование, и сейчас мы с помощью него стараемся выбрать максимально оптимальный вариант разработки месторождений. Этот подход похож на научный, кажется очень обоснованным, но это не совсем так, потому что при построении геологических моделей мы учитываем косвенные измерения, которые не дают прямой информации о том, сколько нефти находится далеко от скважины и как легко ее можно сместить в сторону скважин с помощью различных методов. Сейчас с развитием методов анализа данных, в том числе предсказательного анализа данных, мы имеем шанс сделать этот подход существенно более научным. Потому что методы машинного обучения позволяют учитывать данные, которые получаются с большой точностью, и с их помощью оптимизировать различные компоненты сложных процессов добычи нефти и газа.

В частности, данные, которые иллюстрируют, сколько каждая скважина отдает нефти, воды, газа, могут быть в оперативном режиме учтены, чтобы обновить и уточнить геологические и гидродинамические модели, которые описывают функционирование всего месторождения, всего пласта. И над собственно оптимизацией различных компонентов работы с месторождениями, начиная с самого первого этапа, когда происходит разведка, сейсморазведка, бурение так называемых разведочных скважин и их исследование, заканчивая этапом, когда уже пласт полностью введен в добычу и происходят процессы, которые на английском языке называются production management, люди стараются внедрять различные алгоритмы, связанные с применением методов машинного обучения. Сейчас вся индустрия, которая подразумевает применение методов предсказательной аналитики для нефтянки, находится в зачаточном состоянии, но ее потенциал огромен.

Чтобы локализовать новое месторождение, проводят операции, которые называются разведкой. Сейсмическая разведка — это основной тип разведки: много датчиков и вибраторов разбрасывают по поверхности земли, и они излучают сейсмические волны, которые отражаются от границы раздела пластов под поверхностью земли. Отраженные волны записываются с помощью распределенной системы датчиков. На базе этого строятся двухмерные срезы или трехмерные сейсмические кубы, которые отражают распределение отражающих поверхностей под землей, часть из которых могут быть границами продуктивных пластов.

На сейсмические изображения смотрит опытный геолог, определяет, какая часть внутри трехмерной картины представляет собой ловушку, и предлагает бурить разведочную скважину там. Процесс зависит от опыта геолога, который смотрит на эти месторождения. И машинное обучение, в частности глубокие нейронные сети, можно применять для автоматической обработки таких изображений. Такие методы позволяют автоматически сегментировать сложные, трехмерные изображения и выделять паттерны или объекты, которые представляют интерес. В других сферах двумерные изображения или видеоряды анализируются уже полностью в автоматическом режиме. Можно определить, где находится человек и даже что он делает. Для задач нефтяной отрасли по сейсмическим изображениям можно определить, где наибольшая вероятность нахождения продуктивного пласта и куда надо бурить первую разведочную скважину.

Когда разведочные скважины пробурены, в них проводятся измерения методом скважинного каротажа, который придумали братья Шлюмберже. Только братья Шлюмберже измеряли электрические свойства, а сейчас измеряется целый набор различных физических свойств. Чтобы по каротажным данным понять, в каких пластах, пропластках и более тонких геологических формациях наиболее перспективно ожидать хороший приток углеводородов, специалистам также нужно произвести комплексный анализ. В этой задаче тоже есть большой потенциал автоматизации и ухода от зависимости от человека, который делает интерпретацию. Можно реализовывать различные подходы машинного обучения. Глубокие нейронные сети не всегда помогают, поэтому мы применяем более простые и робастные методы, более классические методы, начиная с support vector machine и заканчивая подходами, которые называются random forest. Также популярно применение градиентного бустинга над деревьями-решателями.

После разведочных работ обычно идет, во-первых, построение геологической модели, а во-вторых, разбуривание множества скважин, из которых потом добываются углеводороды. И само разбуривание — это та компонента разработки всего месторождения, на которую нефтяные компании тратят самое большое количество денег. И когда нефть дешевая, им важно делать разбуривание максимально оптимальным, чтобы количество затраченных денег на сам процесс бурения заведомо окупалось тем количеством углеводорода, которое к этой скважине притечет.

Кроме того, сейчас происходит сланцевая революция. Она уже сильно сбила цены на нефть на мировом масштабе. Но разработка сланцевых месторождений происходит совсем не по тем лекалам, к которым мы привыкли при подходе к традиционным месторождениям. В частности, никто не знает, как правильно и полностью адекватно физически описать течение углеводородов в сланцевых пластах. Нет такого уравнения, как уравнение Дарси, которое применяется для терригенных коллекторов и которое бы полностью описывало весь процесс притока углеводородов в скважину.

Если мы не знаем физическую модель, нас может спасти машинное обучение. И это уже происходит на американских сланцевых месторождениях, когда по данным о профилях добычи со скважин можно получить представление о том, чего ожидать от новых скважин и как оптимально эти новые скважины расположить. Это еще одна большая область, куда можно направлять активность, связанную с машинным обучением. В России таких месторождений тоже очень много. И я думаю, что с иссяканием запасов в традиционных месторождениях нам нужно будет очень пристально смотреть на наши сланцы и на то, как их разрабатывать.

Самое глобальное направление с точки зрения применения машинного обучения в будущем — это полная автоматизация построения геологических моделей таким образом, чтобы максимально уменьшить неопределенности, которые у нас так или иначе есть, просто потому, что мы действительно не знаем, что происходит вдали от скважин с хорошей точностью. Глубокие нейронные сети самых различных архитектур надо будет настраивать на то, как действуют люди, чтобы описать пласт вдали, не имея прямых измерений. Эти нейронные сети, будучи настроены на опыт различных инженеров-геологов, будут воспроизводить и делать в автоматическом режиме весь тот процесс, который у группы геологов занимает годы. В конце концов у них будет накоплен опыт большого количества людей, независимо от экспертизы и компетенции того или иного инженера-геолога.

К этому автоматизированному построению геологических моделей в ближайшие годы нужно будет разработать присадку, которая бы корректировала эти модели в режиме реального времени, после того как появляются реальные данные о добыче со скважины. Нужно делать продвинутый history matching, который, в отличие от существующего history matching, был бы тоже полностью автоматизирован и независим от пользователя. Это то направление, где машинное обучение нужно применять, чтобы нефть добывалась рационально, оптимально и чтобы, как говорят на Западе, у нас была cost efficiency разработки нефтегазовых месторождений.

Медиа

СЛЕДУЮЩИЙ МАТЕРИАЛ РАЗДЕЛА "IT"