Разработка модели предиктивной аналитики работоспособности компрессорного оборудования, основанной на анализе диагностических данных

Рассмотрение возможности использования известных методов машинного обучения для анализа отказов нефтегазового оборудования. Сущность модели предиктивной аналитики работоспособности компрессорного оборудования, основанной на анализе диагностических данных.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 01.08.2022
Размер файла 159,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Институт нефтегазового инжиниринга и цифровых технологий

Уфимский государственный нефтяной технический университет

Разработка модели предиктивной аналитики работоспособности компрессорного оборудования, основанной на анализе диагностических данных

Садыков Ильгам Радикович, студент (магистрант)

Научный руководитель: Кулаков Пётр Алексеевич

Аннотация

В статье рассматриваются возможность использования известных методов машинного обучения для анализа отказов нефтегазового оборудования. В качестве исходных данных взят набор реальных данных с одного из нефтеперерабатывающих заводов г. Уфа. Для обработки и интерпретации результатов применен программный комплекс «Python».

Ключевые слова: нефтегазовое оборудование, анализ отказов оборудования, анализ данных, машинное обучение, «деревья принятия решений».

Annotation

The article discusses the possibility of using well-known machine learning methods for oil and gas equipment failure analysis. A set of real data from one of the oil refineries in Ufa was taken as the initial data. The Python software package was used to process and interpret the results.

Key words: oil and gas equipment, equipment failure analysis, data analysis, machine learning, «decision trees».

Одним из главных экономических расходов любого нефтегазового предприятия, является ремонт и обслуживание оборудования, поскольку они часто выходят из строя и на их ремонт, зачастую, привлекаются большое количество рабочих и в ходе ремонта объект простаивает без работы. В связи с этим возникает следующая задача: научиться прогнозировать отказы оборудования для своевременной ревизии всех узлов и деталей, четкого планирования ремонтных работ (совмещая их с плановыми остановами оборудования), а также выявления скрытых закономерностей отказов.

Поскольку большинство современных предприятий оснащены высокоточными датчиками, тщательный анализ записанных значений может показать пути прогнозирования отказов.

В работе рассмотрены возможности использования методов машинного обучения для анализа реальных данных по вибрации ключевых узлов центробежного компрессора. Так как машинное обучение - это класс методов автоматического создания прогнозных моделей на основе большого массива данных этот инструмент лучше всего подходит для обработки вышеупомянутых параметров.

Одним из надежных методов машинного обучения является метод «деревьев решений», который представляет собой древовидную структуру, похожую на блок-схему, где внутренний узел представляет функцию, ветвь представляет правило решения, а каждый конечный узел представляет результат. Он учится разделять на основе значения атрибута, которое называется пороговым значением[1].

На рисунке 1 представлено дерево решения для массива данных, в котором «node №0» корневой узел с которого начинается расщепление значений. «Xn» означает параметр, по которому происходит расщепление. Например: Xi - возраст, Х2 - зарплата, Х3 - пол и т.д. «Samples» - количество либо доля значений, входящих в массив данных; «value» - количество либо доля значений, отнесенных в каждый класс (0 или 1). Цвета обозначают принадлежность узла (по большинству значений) к классам объектов. Чем темнее цвет, тем большая доля значений принадлежат к конкретному классу. Светлые цвета обозначают равенство, представленных в узле классов.

Рисунок 1. Дерево принятия решений

предиктивный работоспособность компрессорный

Описанный выше алгоритм в данном случае, обучаясь на тренировочных данных, выявил те диапазоны значений параметров, в которых ранее происходили остановы либо отказы оборудования. Опираясь на эти данные, дерево построило модель для вновь поступивших значений[2].

Предметом изучения данной исследовательской работы является массив реальных данных полученных в одном из нефтеперерабатывающих заводов г. Уфа. Данные представляют собой значения параметров вибрации (виброперемещения в мкм) центробежного компрессорного агрегата, которые были записаны в течение двух лет через каждые 12 часов, что составляет 1464 строк в программе «excel». Также известны даты, в которых произошли остановы оборудования.

Для исследования набора данных дни, в которых происходили остановы оборудования, промаркированы цифрой «1» безотказные дни цифрой «0». Для достоверного анализа массива данных было предположено, что дефект зарождался задолго до дня остановки. Поэтому цифрой «1» были пронумерованы предыдущие 15 значений до отказа. Данный прием позволил исключить влияние «выбросов» на конечный результат.

По причине отсутствия большого количества данных тестовый набор был спроектирован самостоятельно в отдельном файле «test», из имеющегося массива обучающей выборки «train», путем отбора 3-го и 10-го (из 15) строк остановов. По правилам машинного обучения тестовая выборка должна составлять 20% от обучающей выборки (в данном случае должно быть 293 строки). Поэтому, оставшиеся строки заполняем строками, метки которых равны нулю.

В начале исследований «дерево решений» показывает 45% точности прогнозов, что не является приемлемым результатом для прогнозирования отказов.

Для увеличения показателей точности вручную были подобраны значения внутренних параметров дерева, куда относится: глубина дерева и количество элементов в узле разбиения. Они составили 9 и 2 соответственно. После корректировки внутренних параметров «дерева решений» точность повысилась до 89%, что вполне приемлемый результат для условий ограниченных данных.

В общем виде схема проведения исследований выглядит, как показано на рисунке 2.

Рисунок 2. Блок-схема исследовательской работы

Анализ результатов исследования показал, что остановы случались в те моменты, когда показания значений вибраций находились за пределами определенных значений. Так, параметр который зашифрован как «Х9» должен работать в диапазоне от 22,1 до 42,6 мкм; «Xg» - до 0,07 мкм; «Хо» - до 2,1 мкм; Х11 - от 50,4 до 60,5 мкм. Отклонения значений за пределы указанных могут привезти к отказам оборудования.

Модель рекомендуется применять в дальнейших анализах отказов оборудования как дополнительный критерий оценки отказа, так как на данном этапе недостаточная база данных работы динамического оборудования не позволяют провести гиперплоскость между данными безотказного режима работы и отказами оборудования. Для дальнейшего исследования требуется генерация новых признаков, из существующих наборов данных, и большее количество измерений.

Использованные источники

1. Хенрик Бринк, Машинное обучение/ Хенрик Бринк. - Санкт Петербург: Изд-во ООО «Питер Пресс», 2017. - С. 15-55.

2. Лекция 10. Деревья классификации и регрессии [Электронный ресурс]. URL:https://www.youtube.com/watch?v=hqnsTBKJ5Lg&list=PLlb7e2G7aSpRb9 5_Wi7lZ-zA6fOjV3_l7&index=10 (дата обращения: 16.02.2022).

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.