Стыдно не использовать ИИ
Антипова
директор по развитию ООО "Диджитал Петролеум"
Нефтегазовый сектор активно присматривается и уже внедряет различные технологии искусственного интеллекта (ИИ), прежде всего в сфере разведки и добычи углеводородов. Российская компания Digital Petroleum разрабатывает цифровые инструменты, которые помогают принимать решения при разведке и добыче нефти и газа. В интервью главному редактору ComNews Леониду Конику директор по развитию ООО "Диджитал Петролеум" Ксения Антипова рассказала, каковы особенности применения ИИ в нефтегазе, и дала прогноз появления в отрасли систем на основе "сильного" ИИ.
Искусственный интеллект в России поднят на высший государственный уровень, и едва ли не в приказном порядке дана команда его повсеместно внедрять. Как вы относитесь к внедрению технологий по указанию политиков?
- Поддержка развития технологии на государственном уровне полезна. Мы очень рады и горды, что начали реализовывать технологии ИИ гораздо раньше, чем появился такой фокус у государства. Конечно, ИИ - это инструмент, а не цель. У каждой компании-заказчика есть задачи, которые она намерена решить, и цели, которых она хочет достичь, у них имеются технологические стратегии и стратегии развития бизнеса. Когда возникает фокус на определенный инструмент, естественным образом бизнес будет смотреть, как он может решить свои задачи с его применением и какие задачи наиболее эффективно решать с помощью именно этого инструмента. Важно найти баланс, и я не сомневаюсь, что компетенции компаний позволят им с этим справиться.
Как Digital Petroleum определяет понятие "искусственного интеллекта"?
- Едва ли наше представление сильно отличается от понимания остальных игроков рынка. Понятие ИИ было введено еще в 1950-х годах Аланом Тьюрингом. Это широкая научная область, включающая использование электронно-вычислительных машин для имитации деятельности человека и его интеллекта. Сюда относится и машинное обучение, и более простые инструменты - например, решающие правила или линейная регрессия.
В 2020 году утвержден паспорт федерального проекта "Искусственный интеллект", а 10 декабря на совещании президента РФ и членов правительства наконец объявлен суммарный объем вложений в него - 86,5 млрд руб. Заинтересована ли компания Digital Petroleum в участии в этом проекте и получении части запланированных инвестиций?
- Философия компании Digital Petroleum такова: мы стараемся развиваться за счет продажи своих продуктов и услуг - и нам понятно, как такая бизнес-модель работает. Если однажды мы увидим, что для развития определенных продуктовых линеек требуются дополнительные вложения, то начнем искать инвестора. А уж каким он окажется - частным или государственным, - будем решать по ходу процесса.
Ответственным за развитие технологий ИИ в России государство назначило Сбер. Верите ли вы, что финансовая организация - пусть даже создающая цифровую экосистему - может в равной степени заботиться обо всех технологиях ИИ или она всегда будет делать крен в сторону тех технологий, которые комплементарны ее бизнесу?
- Однозначно ответить сложно. Мы на 100% уверены, что для того, чтобы разрабатывать технологии ИИ, нужно иметь очень хорошие компетенции в профессиональной области: понимать, какие вызовы имеются, и какую задачу мы решаем, и какие технологии могут помочь. Без знания специфики отрасли и проблематики получается "ИИ ради ИИ". А ИИ ради ИИ не очень полезен.
В чем состоят принципиальные особенности создания программных продуктов с применением технологий искусственного интеллекта?
- Главная особенность заключается в том, что требуется очень правильная и сбалансированная команда. В ней должны быть и профессионалы, которые хорошо понимают специфику отрасли - в случае Digital Petroleum это нефтянка, - и специалисты, находящиеся на переднем крае науки data science. Еще один важный фактор - аккуратность: одно дело красиво сформулировать концепцию, а другое дело воплотить ее на практике. Если какой-то шум или мусор попадает в алгоритм, то результат хорошим не будет.
Каковы стадии развития программного продукта с применением технологий ИИ?
- ИИ частично имитирует действия человека, поэтому все стадии тоже "человеческие". И характерны данные стадии как для заказчиков подобных решений, так и для тех, кто решился самостоятельно их реализовать. Первая стадия - отрицание. Кажется, что ИИ - это маркетинговый ход, и лучше использовать аппаратное решение. Но идея уже возникла, и компания обычно решает поручить кому-нибудь - хотя бы стажеру - разобраться в этой технологии. Далее - гнев: он возникает из-за того, что компания уже видит в данной технологии потенциал, но как она работает - еще непонятно, а признаться в этом нельзя. Многие в этот момент стремятся объявить себя амбасадорами ИИ и делают доклады примерно с таким содержанием: "Самообучающиеся нейронные сети спасут мир. Мы - обладатели этой уникальной технологии, но деталей не раскроем, потому что вы у нас все украдете". Следующая стадия - торг. К этому моменту стажер уже попытался что-то построить на Python, скажем, на трех скважинах и на базе скудных открытых данных. Уже понятно, что данные - очень важный ресурс, а их подготовка - задача крайне длительная и кропотливая. Основной посыл, декларируемый компанией на данной стадии, - "мы готовы продемонстрировать результат, но прежде предоставьте нам данные, предварительно вами подготовленные и размеченные". Следующая стадия - депрессия. Возникает, когда никто не соглашается размечать данные, да и самих данных крайне мало. В связи с этим алгоритмы не выдают ничего хорошего. И если в этот момент приходится участвовать в публичных мероприятиях, посыл обычно таков: "Мы продолжаем работать над качеством алгоритма". Для тех, кто к этому моменту еще не сдался, далее следует этап принятия. Приходит осознание, что придется самостоятельно собрать данные, самостоятельно, долго и аккуратно, их разметить, а также привлечь хороших экспертов для их обработки и анализа. С этого момента начинается разработка программного продукта, появляются публикации, которые уже можно читать, доклады на конференциях с демонстрацией методов, алгоритмов и результатов. В этот момент кажется, что программный продукт уже готов - осталось сделать интерфейс, и мы запустим его на рынок. По факту это лишь начало разработки информационной системы. И только через три-пять месяцев frontend и backend разработаны и система начинает "дышать". Теперь все готово к ее работе в "боевых" условиях, осталось лишь подключиться к ИТ-инфраструктуре заказчика. Вот только инфраструктура у всех разная: протоколы безопасности, потоки данных, доступы пользователей… Еще через три-пять месяцев кажется, что теперь точно все работает корректно, и очень хочется верить, что уже все "грабли" собраны. В данный момент мы очень в это верим, но в то же время готовы почти ко всему.
Digital Petroleum создана в январе 2019 года. С чего началось создание компании?
- Несмотря на регистрацию компании в начале 2019 года, как команда мы существуем раньше - года с 2017-го. Мы образовались в "Сколтехе", на базе Центра добычи углеводородов (SCHR), как команда под названием Digital Petroleum Research, и занимались заказными разработками, которые касались применения алгоритмов машинного обучения для разведки, разработки и добычи углеводородов. А поскольку у нас есть компетенции в области нефтегаза, то в сотрудничестве с коллегами из Центра анализа данных (CDISE) "Сколтеха" мы стали разрабатывать решения для нефтегазовых компаний. Мы увидели, что наши решения приносят хороший результат, однако отраслевым компаниям нужен не только алгоритм, но и программный продукт на его основе. Поскольку разработка ПО выходит за рамки исследовательской деятельности "Сколтеха", мы основали ООО "Диджитал Петролеум", в рамках которого можем заниматься и научной деятельностью по разработке математических алгоритмов, и создавать итоговые программные продукты.
А почему сферой приложения усилий стал именно нефтегаз? Кто-то из учредителей - выходец из этой отрасли?
- Многие из учредителей Digital Petroleum являются выходцами из нефтегазовой отрасли, включая меня и нашего генерального директора Дмитрия Коротеева. Нам довелось столкнуться с технологиями data science еще на прежних местах работы, и мы увидели, что они могут эффективно применяться для нефтегаза. Кроме того, в "Сколтехе" наши исследования проводятся на базе Центра добычи углеводородов.
Насколько ваши разработки применимы в соседних отраслях, скажем в горнорудной, или на далеких от нефтянки вертикальных рынках?
- В принципе, они применимы - в некоторых аспектах. К примеру, в атомной промышленности существует процесс бурения скважин, а у нас есть технология, которая позволяет его оптимизировать. То же касается и месторождений: если мы можем оптимизировать процессы, касающиеся залежей углеводородов, то эти технологии могут быть применены и для рудных полезных ископаемых.
Сколь охотно нефтяные компании, большинство из которых отличает консервативный взгляд, готовы не на словах, а на деле работать с продуктами на основе ИИ?
- В каждом случае происходит большая подготовительная работа. Если детально раскрыть, как работают алгоритмы и система на их основе, почему используются именно такие данные и как они обрабатываются, уровень доверия повышается, и коллеги из нефтегазовых компаний становятся готовы начать сотрудничество. Предварительно мы всегда проводим эксперименты на исторических данных - это не затрагивает производственный процесс, который мы с помощью этих данных симулируем. Действительно консервативным буровикам и инженерам-разработчикам месторождений нужно показать и доказать, что технология работоспособна. А это не произойдет, пока они воочию не убедятся в данном факте на своих скважинах. После этого они сами начинают нам помогать, дорабатывать, внедрять, кастомизировать, изменять продукт. В целом если еще буквально год назад в отрасли было много недоверия к технологиям ИИ, то теперь все стараются их попробовать. Некоторые уже даже не готовы признаваться, что пока не применяют их.
То есть буквально стало стыдно признавать, что не используешь ИИ?
- Да, в последнее время возникает ощущение, что это именно так.
Одним из способов реализации ИИ являются нейронные сети. Де-факто нейросеть представляет собой "черный ящик" - специалисты не способны объяснить, почему она приняла то или иное решение. Готовы ли компании из нефтегазового сектора - с их любовью все контролировать и повышенными требованиями к безопасности - допускать такие "черные ящики" в корпоративный периметр?
- Очень не нравятся нашим нефтяникам "черные ящики", и на каждом эксперименте, на каждом шаге возникает вопрос: почему система приняла такое решение? Мы работаем с этим, в частности, проводя лекции о том, как работают подобные технологии ИИ. Очень важен и практический аспект: если представители заказчика сами попробовали запрограммировать нейросеть, загрузить в нее данные и получить результат, это становится для них понятнее. В случае с некоторыми алгоритмами мы можем для конкретного кейса проследить все шаги по решающим деревьям и объяснить, почему в данном случае система приняла именно такое решение. Только для следующего кейса цепочка принятия решения может быть совершенно иной. Но пройдя этот путь несколько раз и показав, что каждый раз система действует по-разному, у заказчиков возникает, как минимум, смирение с тем, что алгоритмы работают только так.
Мы движемся в направлении алгоритмов, которые относятся к прогрессивной ветке "сильного" ИИ - а они уже интерпретируемые или, скорее, псевдоинтерпретируемые. Система может показать признаки, на основании которых приняла конкретное решение. Пока все это находится в процессе разработки, но рано или поздно станет реальностью.
На сайте вашей компании приведены примеры реализованных проектов: оценка коэффициента извлечения нефти (КИН) на основе цифровых данных, прогноз эффекта геолого-технических мероприятий (ГТМ), заполнение пропусков каротажных данных при геофизических исследованиях скважин (ГИС). Каждый из этих проектов уникален и создан под конкретного заказчика или можно говорить о квазикоробочных продуктах от Digital Petroleum?
- Названные продукты можно назвать коробочными решениями, и мы предлагаем их неограниченному кругу заказчиков. В большинстве случаев они могут быть применены любой отраслевой компанией без дополнительных настроек. Но при желании заказчика мы можем сделать кастомизацию или специфическую настройку на данные заказчика. Некоторые наши программные продукты принципиально требуют дообучения на данных клиента - но эта процедура не занимает много времени, так как все алгоритмы нам понятны.
Насколько позитивно заказчик Х смотрит на то, что система, дообученная на его данных, потом окажется и у заказчика Y?
- Практически у всех заказчиков есть чувствительность к этому вопросу, и они не хотят, чтобы их данные - пусть и в переработанном виде - использовал кто-то другой. Поэтому мы не используем данные заказчика Х для реализации решения у заказчика Y. Данные и сами по себе представляют большую ценность, поэтому мы генерируем некоторое количество синтетических данных, которые несут в себе основные признаки и паттерны того, что мы должны прогнозировать, но не являются данными заказчика. Таким образом, мы имеем возможность использовать этот унифицированный набор синтетических данных, только дополняя их данными заказчика, что позволяет точнее настроить модель под его специфику.
Но ведь даже для создания синтетических данных вам явно нужны были реальные показатели из бизнеса…
- Мы имели опыт применения экспертного подхода, когда эксперт в данной области описывает процесс, а мы стараемся выделить в нем закономерности и признаки, которые важны для алгоритма при принятии решения. Но этот путь не всегда оптимален, поскольку вносит субъективность. Работая на реальных данных, алгоритм способен выделить наиболее значимые для принятия решения признаки, и этот выбор мы оставляем за алгоритмом. Обычно этот набор признаков логичен и понятен эксперту в данной области. Например, если мы прогнозируем какой-то процесс, связанный с бурением, важно работать с такими параметрами, как нагрузка на долото, частота вращения, момент на роторе и т.п.
Сколько человек работает в Digital Petroleum? Испытываете ли вы трудности в поиске новых сотрудников? Каковы основные квалификации разработчиков в вашей компании?
- В штате у нас работает 17 человек. В плане привлечения кадров у нас есть большой "бонус" в виде Сколковского института науки и технологий, который выступает одним из наших учредителей. Некоторые наши сотрудники одновременно являются аспирантами или магистрантами "Сколтеха". Так что благодаря "Сколтеху" мы имеем хороший кадровый потенциал и в области data science, и в области нефтегаза. Кадры, в которых мы нуждаемся сейчас, - это классические программисты.
Вы уже упомянули понятие "сильного" ИИ. Может ли он представлять угрозу для человека и что нужно делать сейчас, чтобы "думающие роботы" не истребили в будущем человечество?
- Я считаю, что наибольшую угрозу представляет человек, и наиболее легко реализуемый худший сценарий связан скорее с тем, что он что-то неправильно запрограммировал - и что-то пошло не так. Это гораздо более вероятно, чем появление машины, которая осознает себя как личность. "Сильный" ИИ - понятие весьма широкое: мы стремимся реализовать некоторые его элементы - в частности, в создании интерпретируемых алгоритмов. Сама машина может что-то запомнить, воспроизвести, выбрать лучшее, предсказать, но она не создает чего-то принципиально нового. Машина не создаст ситуацию, которая выходит за пределы заложенных в нее данных - если хотите, резко не поумнеет. Так что она не выйдет за рамки задачи и уж точно не должна убить всех людей.
Я бы хотела уточнить понятие "самообучающейся системы". По крайней мере, в нефтянке мы позволяем машине обучаться только под жестким контролем. Нефтяные данные, как, впрочем, и любые иные, несут в себе колоссальное количество шума, выбросов, неточностей. И если машина сама будет обучаться на таких данных, то качество ее прогнозов будет очень низким. Мы внимательно контролируем, на каких данных происходит обучение, и каждая итерация переобучения, каждая смена дата-сета происходит под строгим контролем.
Если мы говорим о полном устранении человеческого фактора, то система на базе ИИ должна не просто дать прогноз или рекомендацию, но и совершить некое управляющее воздействие на тот или иной механизм - условно говоря, бур или насос. Есть ли у заказчиков готовность полностью доверить все процессы искусственному интеллекту и способны ли ваши продукты не просто давать "добрые советы", но и принимать решения?
- Мы идем по пути создания интеллектуального помощника. Индустрия пока явно не готова полностью довериться ИИ, и в принципе это правильно. Сам ИИ еще весьма молод и может принимать неправильные решения. У любого алгоритма есть определенное количество ложных срабатываний, неверных интерпретаций, и мы всегда ищем баланс между тем, чтобы система давала верное предупреждение, скажем об аварии, и малым количеством ложных срабатываний. Также мы не должны забывать про людей, которые явно не хотят потерять работу из-за того, что на их место пришел какой-то робот.
Для того чтобы в будущем система сама принимала решения, к ней должен сформироваться определенный уровень доверия, а сама она должна давать минимальное количество сбоев. Индустрия ИИ очень динамична, и я думаю, что в течение пяти лет такие технологии появятся и в нефтегазовой отрасли - как они уже стали появляться в банках. Нефтянка более инертна, и понятно почему - в ней гораздо выше цена ошибки. Если в финансовой сфере ошибка - это невыданный кредит или ссуда, представленная плохому заемщику, то в нефтегазе это может быть, к примеру, сгоревшая буровая.