Долгий путь к machine learning

Сергей Емельянов, генеральный директор ООО "Транснефтьэнерго"

30.01.2019

Генеральный директор ООО "Транснефтьэнерго" Сергей Емельянов в интервью главному редактору ComNews Леониду Конику рассказал о подходах к машинному обучению и его использованию, а также о том, как даже без этой технологии удалось сэкономить для материнской компании - ПАО "Транснефть" - 7 млрд рублей за восемь лет работы.

- Выступая на IoT World Summit 2018 в Казани, вы сказали, что ООО "Транснефтьэнерго" намерено заняться технологиями машинного обучения, но до этого компания в течение восьми лет накапливала данные. С какой целью вы будете использовать технологию machine learning?

- Технология machine learning (ML) нужна для преданалитики на основании статистических данных. Самостоятельно она ничего "придумать" не способна - она способна только отрабатывать готовые алгоритмы и в основном доказанные зависимости. ML может работать в нескольких ипостасях: во-первых, идентифицировать корреляции, которые были неизвестны (но предварительно нужно иметь гипотезу). Во-вторых, если гипотеза подтвердилась и неизвестная прежде зависимость была найдена - инсталляция этой гипотезы в жизнь. И, в-третьих, верификация гипотез: в жизненном цикле что-то может изменяться - например, меняться оборудование или добавляться иные события, влияющие на результат преданалитики. Исходя из такого цикла использования ML, ключевым моментом является качество данных. Важно понимать сущность рассматриваемой аналитики и привязывать к этой сущности временные ряды данных.

Возьмем, к примеру, большой завод, у которого есть собственное электропотребление и потребление, которое он отдает на сторону, а мы анализируем потребление всего завода целиком и строим ее зависимость от температуры наружного воздуха, объема производства, технологических особенностей режима и проч. Также предположим, что на территории этого завода находится транзитный потребитель, который арендует там помещения и на которого приходится 10% общего электропотребления. Этот арендатор периодически включает и выключает некий мощный электроприбор, и возникают большие всплески. ML не может догадаться о наличии такого потребителя и лишь фиксирует скачки в нагрузке. Но технология ищет причину, и результат ее анализа будет далек от реальности: скажем, он выявит, что кто-то слишком часто включает свет в некоем помещении. Поэтому важно выделять анализируемую нагрузку, а сделать это можно, только правильно построив бизнес-процессы и сегментировав, в нашем случае, крупные объекты потребления.

Все это - большая и кропотливая работа, причем она не одноразовая: данные нужно собирать по каждому технологическому процессу и на всем его жизненном цикле. И тогда при изменении схем энергоснабжения, при добавлении нового или демонтаже старого цеха измерительный цифровой двойник завода будет актуализироваться, и временные ряды отразятся в модели измерения.

- Как "Транснефтьэнерго" двигалась в сторону machine leaning?

- Первым шагом мы создали инфраструктуру (фундамент) всех данных, выделили сущности и определили их жизненный цикл. Также мы научили людей, стимулировали их к внесению данных. Это было самое сложное: чтобы человек, который что-то поменял на физическом уровне, с минимальной задержкой отобразил данное действие в системе. Все наши объекты имеют большую географическую распределенность (они находятся в 62 субъектах РФ), и в целом по системе таких событий происходит немало. Если информация не заносится своевременно, человек просто забывает об этом. А сотрудник "в поле" должен четко понимать, что, сделав шаг номер один, он должен сделать и шаг номер два - и существуют косвенные проверки, которые выявят его бездействие. В противном случае цифрового двойника не создать. Мы добились результата за счет того, что ввели мотивационную и регламентационную схемы, настроили бизнес-процессы и увязали все это с информационной системой.

Когда создан цифровой двойник, есть все временные периоды, зафиксированы все сущности и настроена их актуализация, ведутся измерения различных параметров на этих сущностях, можно переходить на второй уровень – аналитики. Аналитика тоже должна разбиваться на периоды, в которые модель была неизменной, и эти временные периоды может выявлять ML.

- Каков минимальный объем исходной информации для того, чтобы заниматься ML?

- Объем может быть и не очень велик: главное - наладить актуализацию. Это не ИТ-задача, а производственная. Если бы работали роботы, можно было бы написать алгоритм, который они станут четко отрабатывать. По временному периоду - мы только подошли к тому, чтобы заняться ML: на это действительно ушло восемь лет. Мы пришли к пониманию, что можем оперировать только бухгалтерски выверенными фактами - только они дают понимание, что контрагент согласился с нашими измерениями и данными. Также нам потребовались точные данные технического учета. Если этот периметр не закрыт, создаются возможности для искажения и интерпретации данных.

Повторюсь: мы именно подошли к тому, чтобы заняться ML, и сейчас формируем гипотезы, которые предстоит проверить с помощью этой технологии, и пишем технические задания для внешних компаний из этой сферы. Многие проявляют интерес к тому, чтобы с нами поработать.

- А вы готовы допустить сторонних разработчиков к своим информационным системам?

- Да, причем пустим не одного разработчика, а нескольких, создадим для них "песочницу" - среду разработки - и будем сравнивать результаты.

- Какой объем данных вы собираете?

- Типов данных немного: электроэнергия и другие виды энергоресурсов, грузооборот, давление на входе и выходе магистральной трубы "Транснефти", температуры. А вот комбинаций получается много - и за счет географической распределенности, и из-за дифференциации тарифов (не все знают, что существует более 1000 вариантов расчета стоимости электроэнергии). Конечной целью является выбор оптимальных параметров для перекачки нефти.

Перед тем как приступить к использованию ML, мы построили систему сбора данных из технологически изолированных систем (включая систему управления трубопроводом). Для того чтобы поднять оттуда все данные, причем не в виде файлового обмена (который дает сбои и не поддерживает нужные нам форматы), мы построили огромную систему, которая через так называемые "демилитаризированные зоны" забирает с нижнего уровня все необходимые данные. Эта система позволяет получать информацию в разных форматах с любого оборудования, имеющего цифровой выход, и централизованно передает в Москву.

Промышленный счетчик - это умное устройство, и помимо электроэнергии он фиксирует множество разных фактов - открытие крышки, пропажу или падение напряжения, синхронность/несинхронность фаз, качество электроэнергии, частоту в сети и проч. И если на счетчике что-то происходит, система автоматически сообщает об этом на service desk, тот создает наряд на устранение и сообщает об этом ответственному. В случае коммерческого потребителя, если ответственный не отчитался в установленный период об устранении проблемы, потребитель может получить штраф, размер которого составляет 100-кратную цену использованной энергии.

- Эта задача решается в интересах акционера ООО "Транснефтьэнерго" - ПАО "Транснефть". При этом у вас есть и коммерческие потребители. Способна ли ваша информационная система, а в будущем и ML, дать какие-то подсказки им?

- Да, мы сейчас отработаем эту модель с "Транснефтью" и сможем предложить ее коммерческим клиентам. Магистральная нефтяная труба, по сути, является конвейером, с определенными исходными данными и производительностью. И мы вполне можем перенести эту модель на другие конвейеры - например, литейное производство или выпуск кафельной плитки, разве что там может быть больше исходных данных и определенные ограничения. Лайфхаком для работы таких систем является умение управлять информационно-справочными алгоритмами, справочниками - тем, насколько технологу, который может быть далек от программирования, все это удобно и понятно. Хотя я не исключаю, что есть коммерческие потребители, для которых оптимизация по конвейерной модели не будет работать - но и они заинтересованы в прозрачности расчетов, детальном биллинге потребленной энергии. Если в будущем появятся системы хранения энергии, наша система поможет в автоматическом режиме выбирать выгодные моменты переключения от сети питания на аккумуляторные мощности (или на собственную генерацию).

Уже сейчас мы способны дать клиенту рекомендации, которые обеспечат снижение его затрат на электроэнергию до 30%. Принято считать, что добиться этого можно лишь за счет снижения сбытовой надбавки, но мы снижаем чек, вникая в бизнес каждого потребителя, чтобы искать области повышения эффективности и сокращения издержек. Эти рекомендации в формате лайфхаков клиент получает в онлайн-режиме через личный кабинет на ИТ-платформе "Транснефтьэнерго".

Это не просто слова. Даже без ML за восемь лет функционирования информационных систем в "Транснефтьэнерго" мы сократили время выявления проблем с одних суток до онлайн и сэкономили для материнской компании около 7 млрд рублей.

- Возможно ли, что в будущем системы искусственного интеллекта смогут полностью выполнять все задачи, о которых вы рассказали?

- На текущий момент юридически не определена ответственность за последствия регулирования системой без участия человека - и я не думаю, что в ближайшие пять лет ситуация изменится. Но важно превращать позитивный опыт в новые правила игры. Пока наша цель состоит в создании автоматического помощника технологу для принятия решения в выборе оптимальных режимов. Но возможно, что через пять лет эти данные можно будет использовать в кейсовом решении, уже без участия человека.

Сейчас мы собираем данные примерно с 900 объектов потребления энергии в организациях системы "Транснефть" и прогнозируем, что к 2025 году будет 150 тыс. цифровых приборов и видов оборудования, с которых будет необходимо снимать данные, включая серверы, каналообразующее оборудование и прочее. Без ML и автоматизации процессов работать с таким объемом данных будет невозможно.

Долгий путь к machine learning

Делись-делись. ГКРЧ утвердила методику расчета покрытия для "принудительного шеринга"

Минцифры РФ понравилась стратегия видеоигр

Российский фудтех приумножил капитал за счет венчурных инвестиций

"Госкан" вместо паспорта. Минцифры запустило приложение для мгновенной проверки клиентов по QR-коду

"БКС Мир инвестиций" обновил приложение: меньше кликов и больше аналитики

"Ростелеком" после 10 лет переговоров избавился от единственного зарубежного актива

В Тамбовской области запустили цифровой сервис для абитуриентов "Навигатор СПО"

ГК Softline, Минцифры Челябинской области и ЮУрГУ создадут центр компетенций по роботизации

В Омске внедрят платформу "Управление захоронениями"

Астрономический научный центр модернизировал оркестрацию космического мониторинга с помощью ITFB Group

Flowwow запустил кабинет для продвижения товаров на платформе

"РТ-Техприемка" оснастила ОНПП "Технология" роботизированным лазерным комплексом для микрообработки материалов и изделий

"Перекрёсток" тестирует систему "Умный пекарь" для управления выпечкой в супермаркетах

"Норникель" и "Рексофт" разработали мониторинговую систему для процесса сгущения

Когда столица уже не может: как дата-центры в регионах станут хребтом российского IT

Разделённая ответственность в облаке: почему бизнес считает, что за безопасность отвечает провайдер, и чем это заканчивается

Цифровой переполох или приключения Apple в России

"СберМобайл" расширил присутствие в Севастополе

На рынок ПО для консультантов вышла новая ERP-система

Selectel разместил новый выпуск облигаций объемом 7,5 млрд руб.

Билайн обеспечил сервис фискализации для Московского метрополитена

Максим Кузюк возглавил кластер "Софтлайн Технологии"