Machine learning based sucker rod pump fault diagnosis using motor power curve
- Authors: Ahmed O.H.1, Tecle S.I.2, Zyuzev A.A.1, Metelkov V.P.1
-
Affiliations:
- Ural Federal University
- College of Engineering and Technology
- Issue: Vol 336, No 1 (2025)
- Pages: 36-49
- Section: Articles
- URL: https://journal-vniispk.ru/2500-1019/article/view/281100
- DOI: https://doi.org/10.18799/24131830/2025/1/4654
- ID: 281100
Cite item
Full Text
Abstract
Relevance. The complexity of monitoring and diagnosing the condition of underground structural elements of sucker rod pumping units and large economic losses when operating this equipment with defects not identified in a timely manner. Aim. Development of methods for detecting faults in a sucker rod pump that do not require the involvement of highly qualified personnel for diagnosis, using information that is easily available on the surface. Methods. Machine learning methods (Decision tree method, K-nearest neighbors method, Support vector machine, Naive Bayes classifier) using motor power curves. Results and conclusions. The paper demonstrates the possibility of detecting faults in a sucker rod pump based on machine learning methods. The study was carried out on the basis of a developed simulation model of a sucker rod pump, used to reproduce motor power curves, taking into account the impact of the features of various equipment operation scenarios. Being the fundamental energy source for the oil production, motor power is directly related to the real-time operating condition of the oil well, and the motor power curve is a reliable source with the ability to increase the efficiency of sucker rod pump diagnostic. To train the machine learning classifiers and evaluate their performance accuracy, a number of characteristics were used, obtained from motor power curves for six different pump operating states. Namely, operating coefficients were calculated, representing the ratio of the power integral at each of the four stages of the installation operating cycle to the power integral for the entire cycle. The results show that the considered approach allows for high accuracy in diagnosing the operating conditions of a sucker rod pump. The classifier based on the decision tree method showed the highest efficiency among the four studied classifiers in identifying all six types of faults (95.8%), and the support vector machine method showed as well very high efficiency (90.3%).
Full Text
Введение
Штанговые глубинно-насосные установки (ШГНУ) широко используются в нефтедобывающей отрасли, поскольку они имеют простое оборудование, низкую совокупную стоимость и подходят для широкого диапазона производительности скважин. В настоящее время около 80 % нефтяных скважин в мире используют технологию добычи с использованием штанговых насосов [1]. Производительность и затраты на эксплуатацию штангового насоса зависят от условий его работы, а из-за разнообразных и сложных условий эксплуатации системы штанговых насосов зачастую работают в нештатных условиях, что приводит к увеличению частоты отказов оборудования или снижению его производительности. В литературе наряду с нормальным функциональным состоянием выделяют более девяти проблемных рабочих состояний. Поэтому крайне важно использовать надежную и точную систему диагностики неисправностей, чтобы поддерживать функционирование штангового насоса в нормальном рабочем состоянии.
Как правило, системы обнаружения неисправностей базировались на использовании динамограмм (замкнутом графике смещения полированного штока в зависимости от нагрузки на полированный шток) в качестве основного источника данных. Различные состояния функционирования штангового насоса четко идентифицируются по форме динамограммы [2]. Для получения динамограммы можно использовать контроллер штангового насоса, оснащенный встроенными датчиками нагрузки и положения. Эти датчики положения обеспечивают измерение перемещения полированного штока с помощью различных средств, таких как позиционный переключатель, инклинометр или преобразователь на эффекте Холла. Обычно требуется достаточно высокая квалификация персонала для получения достоверных результатов путем исследования динамограммы. При этом принятие решений с использованием такого подхода весьма субъективно и не позволяет проводить мониторинг в реальном времени. Чтобы решить эту проблему, в работах [3–7] предлагаются некоторые весьма сложные методы для извлечения необходимых признаков с последующей классификацией.
Колонна насосных штанг в насосной системе может испытывать статические и динамические силы, связанные с вынужденными и свободными колебаниями, эффекты этих сил передаются на приводной двигатель [7]. Следовательно, изменения нагрузки на плунжер можно наблюдать по измеренным сигналам на входных клеммах двигателя. Примечательно, что электрические измерения, особенно диаграмма мощности двигателя, весьма точно отражают состояние пласта. Диаграмма мощности двигателя является периодической, соответствующей продолжительности одного хода, и эффективно отражает влияние изменения нагрузки с течением времени. Такие электрические измерения не ставят под угрозу надежность системы и обеспечивают достаточно высокую точность. Можно отметить работы [8, 9], исследователи использовали диаграмму мощности двигателя в качестве альтернативного источника данных в системе диагностики неисправностей штанговых насосов. Возможности современных интеллектуальных станций управления ШГНУ позволяют реализовать функции диагностики с использованием динамограмм и графиков мощности двигателя [10].
Методы обнаружения неисправностей штанговых насосов по данным о графике мощности двигателя можно разделить на два подхода – прямой и косвенный. При использовании косвенного подхода нагрузку на полированный шток можно определить на основе электрических измерений с использованием метода коэффициента крутящего момента или с помощью модели на основе одномерного уравнения, описывающего волновые явления с учетом различных подземных параметров и измерений [11]. Однако измерение этих параметров ниже поверхности земли оказывается затруднительным. Кроме того, небольшая величина коэффициента крутящего момента вблизи нижней и верхней мертвых точек приводит к снижению точности получаемой динамограммы. При прямом подходе на основе кривых мощности двигателя имеется возможность извлечения характерных особенностей, которые четко представляют каждое рабочее состояние, позволяя обойти отмеченные выше недостатки.
Проблема классификации – другой вопрос, который необходимо решить при разработке диагностической модели. Задача состоит в соотнесении входного вектора признаков одному из K рабочих условий, желательно в режиме реального времени. Эта задача сводится к проблеме распознавания образов, которая в современной практике решается с использованием различных методов машинного обучения (Machine Learning, ML), таких как Искусственная нейронная сеть (Artificial Neural Network, ANN), Скрытая марковская модель (Hidden Markov Model, HMM), Метод К-ближайших соседей (K-Nearest Neighbors, KNN), Метод решающего дерева (Decision Tree, DT), Метод опорных векторов (Support Vector Machine, SVM), Экстремальная обучающая машина (Extreme Learning Machine, ELM) и другие. HMM – это модель временных рядов, которая использует последовательные шаблоны данных, в то время как другие методы, такие как DT, SVM, KNN, наивный байесовский метод (Naive Bayes classifier, NB), ANN и ELM, представляют собой диагностическую модель, основанную на предположении, что наборы точек данных независимы и одинаково распределены. Методы KNN в [12], SVM в [3, 12], ELM в [13], ANN в [4, 14] и HMM в [9] использовались для классификации случаев неисправности штанговых насосов. В отличие от HMM, методы, основанные на SVM, ELM и ANN, не требуют обязательного описания процесса, поскольку они просто оценивают входные и выходные данные для разработки диагностических моделей.
Еще одна проблема связана с получением достаточного количества обучающих выборок, представляющих различные условия эксплуатации, для создания полного обучающего набора, необходимого для методов машинного обучения. Важно не допустить заблуждения, что эти выборки независимы и одинаково распределены. Корректный подход предполагает ослабление требований к независимости выборки и идентичности распределения. В этих обстоятельствах кажется, что предпочтительным методом машинного обучения для решения проблемы классификации является скрытая марковская модель. Однако появление отдельных эксплуатационных состояний ограничено на протяжении всего жизненного цикла скважины (обычно менее четырех). Следовательно, становится непрактичным аппроксимировать настоящую апостериорную плотность вероятности, используя исторические данные. Можно отметить, что это ограничение не распространяется на алгоритмы машинного обучения, которые используются в данном исследовании, такие как метод дерева решений, метод K-ближайших соседей, метод опорных векторов и наивный Байесовский метод, из-за отсутствия в них апостериорных вероятностей. В результате эти алгоритмы могут достаточно эффективно использовать данные, сгенерированные моделью. Кроме того, эти алгоритмы обладают хорошей способностью использовать небольшие наборы данных для решения задач классификации и распознавания [15]. Таким образом, в данном исследовании, по сравнению с более ранней работой [16], сфера применения алгоритмов машинного обучения расширена за пределы использования только метода опорных векторов и включает в себя другие три метода машинного обучения, которые упомянуты выше. В работе [16] были проанализированы шесть различных сценариев эксплуатации штанговых насосов, но диагностический анализ был ограничен только четырьмя вариантами неисправностей. В данном исследовании классифицируются все шесть вариантов на основе данных о мощности двигателя.
Анализ работы штангового насоса
Конфигурация ШГНУ включает в себя приводной двигатель, редуктор, поверхностное оборудование, колонну насосных штанг и насосно-компрессорные трубы. В большинстве штанговых насосных установок основным источником энергии служат электродвигатели, работающие на высокой скорости, которая впоследствии снижается редуктором в соотношении примерно 30:1 [17]. В насосной установке используется четырехрычажный приводной механизм для преобразования вращательного движения в возвратно-поступательное. Это возвратно-поступательное движение затем передается глубинному насосу через колонну насосных штанг, обеспечивая подъем нефти из скважины на поверхность.
Всасывающий клапан и нагнетательный клапан насоса включаются в работу при возвратно-поступательном движении полированного штока. Хотя открытие обоих клапанов зависит и от количества свободного газа в насосе, в нормальном рабочем состоянии всасывающий клапан закрывается в конце хода вверх, а нагнетательный клапан закрывается в конце хода вниз. От состояния этих клапанов зависит давление насоса, определяющее нагрузку на плунжер. Когда нагнетательный клапан открыт, давление насоса почти равно давлению нагнетания, и на плунжер действует только выталкивающая сила. В то время как при открытом всасывающем клапане давление насоса практически равно давлению всасывания и на плунжер оказывается большая нагрузка. Неравномерная нагрузка на плунжер во время цикла приводит к неравномерной нагрузке редуктора. Поэтому в ШГНУ на кривошипе закреплен противовес для компенсации неравномерности нагрузок и уменьшения мощности двигателя.
При ходе вверх противовес перемещается от положения с большей потенциальной энергией к положению с более низкой, а при ходе вниз потенциальная энергия противовеса постепенно увеличивается. В результате противовес помогает двигателю поднимать тяжелый груз во время хода вверх. И наоборот, при ходе вниз вес колонны насосных штанг помогает двигателю поднимать противовес.
На рис. 1 поясняется механизм работы штангового насоса. В нормальном рабочем состоянии насоса динамограмма по форме приближается к параллелограмму, а кривая изменения мощности двигателя примерно соответствует синусоидальной кривой. Идентификация пиков и спадов на кривой мощности двигателя, а также четырех углов динамограммы оказывается весьма удобной для анализа рабочего процесса. Путь ABC (рис. 1) соответствует ходу вверх, при котором всасывающий клапан открывается в точке B и закрывается в точке C. Путь CDA соответствует ходу вниз, при этом нагнетательный клапан открывается в точке D и закрывается в точке A.
Рис. 1. Диаграммы для анализа механизма ШГНУ
Fig. 1. Diagram for analysis of sucker rod pump mechanism
Система диагностики неисправностей штангового насоса
Изменения условий работы в подземной части установки изменяют нагрузочную кривую двигателя, что отражается на формах динамограммы и кривых мощности двигателя. Но их идентификация даже опытными инженерами посредством интерпретации динамограмм неэффективна из-за ее субъективного характера и необходимости большого труда при подготовке обучающих выборок [18]. Экспериментальные методы, используемые для получения динамограмм, требуют существенных затрат на техническое обеспечение, а использование мощности двигателя в качестве альтернативы для диагностических моделей не столь требовательно к этим затратам. Однако визуальные методы оценки по кривым мощности весьма затруднительны, что подчеркивает необходимость компьютерных методов для эффективного использования этого подхода.
В данном исследовании, помимо метода опорных векторов, для классификации неисправностей штанговых насосов были использованы еще три метода машинного обучения, относящиеся к семейству алгоритмов обучения с учителем, с целью сравнительной оценки их точности и пригодности для выявления такого рода неисправностей. Этими методами являются: метод дерева решений, метод K-ближайших соседей, метод опорных векторов и наивный байесовский классификатор. Системы мониторинга состояния, основанные на машинном обучении, работают с использованием исторических данных, полученных от датчиков на механизме в различных условиях эксплуатации, которые впоследствии используются для извлечения признаков с целью обучения классификаторов. На завершающем этапе модели классификаторов проходят процедуру перекрестной проверки, которая служит для оценки эффективности алгоритма машинного обучения при его работе с новыми наборами данных, на которых классификатор не обучался.
Извлечение признаков
На точность работы диагностической модели сильно влияет построение этапа извлечения признаков. В исследовании были использованы признаки, определяющие характеристики кривой мощности двигателя, полученные на основе положений рабочих точек клапана и относительной работы, совершаемой на разных участках хода. Использовались семь специфических признаков состояния (W1, W2, W3, W4, La, Lb, Lc):
Коэффициенты работы для каждых четырех частей цикла:
(1)
(2)
(3)
(4)
где
(5)
- La – расстояние между положениями, когда открыт всасывающий клапан и нагнетательный:
. (6)
- Lb – расстояние между положениями, когда закрыт и открыт всасывающий клапан:
(7)
- Lc – расстояние между положениями, когда закрыт и открыт нагнетательный клапан:
(8)
В выражениях (1)–(5) обозначено: p – мгновенная мощность двигателя; t0–t1 – продолжительность первой части хода вниз; t1–t2 – продолжительность второй части хода вниз; t2–t3 – продолжительность первой части хода вверх; t3–t4 – продолжительность второй части хода вверх. В выражениях (6)–(8) обозначено: xi – положение i-ой точки на графике мощности по горизонтальной оси (оси времени) в относительных единицах, где за базисное время принято время цикла; yi – положение i-ой точки на графике мощности по вертикальной оси (оси мощности) в относительных единицах, где за базисную мощность принята номинальная мощность двигателя. Индексы i в выражениях (6)–(8): i=SVo – открыт всасывающий клапан; i=TVo – открыт нагнетательный клапан; i=SVc – закрыт всасывающий клапан; i=TVc – закрыт нагнетательный клапан.
Метод дерева решений
Дерево решений – это непараметрический метод обучения, который служит диагностическим инструментом, создающим систему, основанную на знаниях, посредством индуктивного вывода из историй прецедентов. Дерево начинается с корневого узла, разделяющегося на две ветви; дальнейшее разделение происходит на промежуточных узлах, также называемых узлами принятия решений. Завершается дерево конечными или листовыми узлами, и любое связанное подмножество узлов называется поддеревом (рис. 2).
Рис. 2. Структура дерева решений
Fig. 2. Decision tree structure
Структура дерева решений опирается на выбор корня, определяемый теорией информации Куинлана (прирост информации) [19]. Согласно этому критерию, информация в сообщении зависит от ее вероятности [20]. Дерево решений строится на основе обучающего набора T, состоящего из случаев, задающих значения атрибутов и классов, обозначаемых {C1, C2, …, Ck}. Если существует тест с n результатами, разделяющий T на подмножества T1, T2, …, Tn, и S – любой набор случаев, freq(Ci, S) – это количество случаев в S, принадлежащих классу Ci, и |S| – общее количество случаев в наборе S. Если случай выбран из S случайным образом и принадлежит классу Cj, сообщение имеет вероятность freq(Cj,S)/|S|, и информация, ему соответствующая, составляет –log2(freq(Cj,S)/|S|) битов.
Ожидаемая информация, необходимая для определения класса случая в S:
Применительно к ситуации обучения info(T) оценивает среднюю информацию, необходимую для определения класса случая в пределах T. Аналогично после того, как T было разделено в соответствии с n результатами теста X:
Лучшим атрибутом разделения будет тот, который обеспечит максимальный прирост информации результирующего узла относительно исходного. Прирост информации составляет:
Метод K-ближайших соседей
Метод K-ближайших соседей представляет собой классификатор, который, несмотря на свою простоту, демонстрирует высокую эффективность. Важными для реализации этого классификатора параметрами являются целое положительное число (K) и метрика (d). Классификация данных тестирования определяется метками K ближайших к точке соседей [21]. Рис. 3 иллюстрирует эту концепцию: когда K=1, новая точка относится к Классу 1, поскольку в Классе 1 имеется только одно наблюдение, а в Классе 2 нет наблюдений; когда K=2, новая точка относится к классу 2, поскольку большинство наблюдений в этой области относится к Классу 2.
В методе KNN требуется определение расстояния между точкой входных данных и другими точками из набора обучающих данных. Для двух точек и с координатами ( , ..., ) и ( , ,..., ) расстояние между ними вычисляется следующим образом:
где x, y – две точки в n-мерном евклидовом пространстве.
Рис. 3. Иллюстрация алгоритма KNN [22]
Fig. 3. KNN algorithm illustration [22]
Метод опорных векторов
Метод опорных векторов – это метод вычислительного обучения для классификации небольших выборок. Этот метод разделяет данные на положительные и отрицательные классы, определяя некоторую оптимальную гиперплоскость, которая делит все точки данных на эти две группы. Уравнение гиперплоскости можно записать как
где x – вектор признаков; W – n-мерный весовой вектор, нормальный к гиперплоскости; b – скалярный параметр-смещение. Эти параметры используются для нахождения наилучшей гиперплоскости – гиперплоскости с наибольшим зазором между двумя классами. Ближайшие точки, определяющие зазор между классами, называются опорными векторами. Если вектор признаков удовлетворяет условию , он принадлежит к классу А. Если – к классу B.
Наивный байесовский классификатор
Наивный байесовский классификатор представляет собой алгоритм классификации, работающий на основе теоремы Байеса. Классификатор строится с опорой на «наивное» предположение, что каждая пара признаков условно независима и зависит от значения переменной класса. Формально для переменной класса y и зависимых векторов признаков от x1 до xn теорема Байеса устанавливает следующие отношения:
(9)
где xi=(x1, x2, x3, ... , xn).
В (9) обозначено: – апостериорная вероятность, – правдоподобие, – априорная вероятность класса; – априорная вероятность предиктора.
С учетом «наивного» предположения об условной независимости можно записать:
Тогда соотношение (9) упрощается до следующего:
Поскольку априорная вероятность предиктора постоянна с учетом входных данных, получаем следующее правило классификации:
Это значит, что задача наивной байесовской классификации состоит в том, что для разных значений класса y надо найти максимум , пропорциональной . Для определения априорной вероятности класса можно использовать относительную частоту класса в обучающих данных.
Результаты моделирования
Получение набора данных для обучения
Использование методов компьютерной диагностики повышает эффективность контроля за работой штанговых насосов. Однако эти методы требуют обширного набора данных для описания различных рабочих состояний [9], даже несмотря на то, что за срок службы скважины возникает ограниченное число таких состояний. Для решения этой проблемы создана имитационная модель, изображенная на рис. 4, которая включает в себя модель пласта, модель насоса, модель колонны насосных штанг, модель первичного двигателя и модель насосного узла. На рис. 4 обозначено: Vs – напряжение питания; Fpht – нагрузка на полированный шток; hpht – перемещение полированного штока; hpl – перемещение плунжера; vpl – скорость плунжера; Fpl – нагрузка на плунжер; Prev – пластовое давление; Pwf – забойное давление; Ps – давление всасывания; Pd – давление нагнетания; q – скорость потока жидкости.
Блок колонны насосных штанг включает в себя модель колонны насосных штанг как механического звена с распределенными параметрами с учетом как поверхностных, так и подземных граничных условий. Блок, включающий в себя электродвигатель и насосную установку, рассчитывает кинематические параметры полированного штока. Модель насоса определяет нагрузку на плунжер. Корректировка параметров потока, свойств жидкости или принятие допущений о различных механических проблемах в модели пласта позволяет моделировать различные сценарии подземной среды. Блок балансировки рассчитывает забойное давление и давление всасывания на основе скорости притока и жидкости, поступающей в насос.
Исследуя возможные вариации в рамках заданного сценария под поверхностью земли, разработанная модель позволяет получить различные динамограммы и кривые мощности двигателя, которые можно использовать для построения обучающего набора. В этот набор входят образцы, представляющие нормальные рабочие состояния, недостаточную подачу жидкости, утечку нагнетательного клапана, воздействие газа, попадание плунжера в верхнюю мертвую точку, попадание плунжера в нижнюю мертвую точку.
В данном исследовании при построении диагностической модели используется только кривая мощности двигателя. На рис. 5–10 показаны типичные динамограммы (a) и соответствующие им кривые мощности двигателя (b) для различных рабочих состояний.
Рис. 4. Имитационная модель штангового насосного агрегата
Fig. 4. Simulation model for sucker rod pump
Рис. 5. Нормальное рабочее состояние
Fig. 5. Normal working state
Рис. 6. Негерметичность нагнетательного клапана
Fig. 6. Travelling valve leakage
Рис. 7. Эффект захвата газа
Fig. 7. Gas affected
Рис. 8. Недостаточное поступление жидкости
Fig. 8. Insufficient liquid supply
Рис. 9. Состояние, когда плунжер достигает нижней мертвой точки
Fig. 9. Condition when the plunger hits bottom dead center
Рис. 10. Состояние, когда плунжер достигает верхней мертвой точки
Fig. 10. Condition when the plunger hits top dead cente
Извлечение признаков
На рис. 11 показаны нормированные кривые смещения и скорости полированного штока, нагрузки на него, мощности двигателя и давления насоса. На кривой давления насоса легко различимы положения рабочих точек клапанов. Начало сжатия соответствует закрытию всасывающего клапана, а начало расширения соответствует закрытию нагнетательного клапана. Аналогично конец сжатия совпадает с открытием нагнетательного клапана, а конец расширения – с открытием всасывающего клапана. При сравнении кривой давления насоса с кривой мощности двигателя положения открытия, всасывающего и нагнетательного клапанов на кривой мощности двигателя совпадают с пиками, а положения закрытия клапанов соответствуют впадинам. Поэтому пики и провалы на кривой мощности двигателя имеют решающее значение для описания рабочего процесса. В рамках предложенного метода для каждого образца определяются векторы признаков, в таблице представлены средние значения компонентов этих векторов. Можно сделать вывод, что эти векторы признаков весьма отчетливо характеризуют каждое рабочее состояние.
Таблица. Средние значения извлекаемых признаков
Table. Average values of extracted feature
Состояние Condition | La | Lb | Lc | W1 | W2 | W3 | W4 |
Nor | 0,425 | 0,797 | 0,453 | 0,397 | 0,217 | 0,202 | 0,184 |
Lik | 0,477 | 0,729 | 0,462 | 0,355 | 0,217 | 0,241 | 0,187 |
Gaf | 0,416 | 0,799 | 0,503 | 0,448 | 0,247 | 0,102 | 0,204 |
Ins | 0,398 | 0,793 | 0,450 | 0,486 | 0,257 | 0,054 | 0,203 |
Bpb | 0,442 | 0,711 | 0,437 | 0,185 | 0,183 | 0,409 | 0,222 |
Ins | 0,436 | 0,702 | 0,434 | 0,204 | 0,187 | 0,388 | 0,222 |
В таблице обозначено: Nor – нормальное рабочее состояние; Lik – негерметичность нагнетательного клапана; Gaf – эффект захвата газа; Ins – недостаточное поступление жидкости; Bpb – состояние, когда достигается нижняя мертвая точка, и Tpb – состояние, когда плунжер достигает верхней мертвой точки.
Рис. 11. Динамические характеристики механизма
Fig. 11. Mechanism dynamic characteristics
Классификация
На рис. 12 представлена схема диагностической модели на основе упомянутых выше алгоритмов машинного обучения, где процесс диагностики делится на обучение и собственно диагностику. На этапе обучения на основе кривых мощности двигателя создается учебный набор. Выбранные ML-алгоритмы обучаются с использованием этого набора. Обученные модели проходят проверку с помощью четырехкратной перекрестной проверки. В процессе диагностики кривая мощности двигателя обрабатывается в режиме реального времени для создания вектора признаков. Затем классификаторы используют этот вектор признаков для идентификации рабочего состояния.
Рис. 12. Диагностическая модель
Fig. 12. Diagnostic model
На рис. 13–16 представлены матрицы распознавания, показывающие результаты классификации, диагональные элементы в этих матрицах представляют собой точно предсказанные выборки. Здесь обозначено: True Class – истинный класс; Predicted Class – предсказанный класс; TPR – доля правильно классифицированных наблюдений на истинный класс; FNR – доля неправильно классифицированных наблюдений на истинный класс. Строки с первой по шестую соответствуют рабочим состояниям штангового насоса: нормальное, негерметичность нагнетательного клапана, эффект захвата газа, недостаточное поступление жидкости, плунжер достигает верхней мертвой точки и плунжер достигает нижней мертвой точки соответственно.
Рис. 13. Матрица распознавания для метода дерева решений
Fig. 13. Confusion matrix of Decision tree method
Рис. 14. Матрица распознавания для наивного байесовского классификатора
Fig. 14. Confusion matrix of Naive Bayes classifier
Как видно на рис. 13, метод дерева решений с очень высокой точностью (95,8 %) правильно классифицировал все образцы для нормального состояния, утечки нагнетательного клапана, эффект захвата газа, достижение плунжером верхней и нижней мертвой точек. Однако 16,7 % образцов с недостаточным поступлением жидкости ошибочно классифицируются как достижение плунжером верхней мертвой точки, а 8,3 % из них – как эффект захвата газа.
Наивный байесовский классификатор (рис. 14) является вторым по точности классификации, которая составляет 93,1 %, он также не смог правильно классифицировать все образцы с недостаточным поступлением жидкости, правильно классифицировав только 41,7 %.
Рис. 15. Матрица распознавания для метода опорных векторов
Fig. 15. Confusion matrix of Support Vector Machine
Рис. 16. Матрица распознавания для метода К-ближайших соседей
Fig. 16. Confusion matrix of K-Nearest Neighbors method
Метод опорных векторов (рис. 15) обеспечивает среднюю точность – 90,3 % – и более высокую точность правильного распознавания ситуации с недостаточным поступлением жидкости (83,3 %), чем предыдущие методы, однако он не мог точно классифицировать все образцы для нормального состояния, негерметичность нагнетательного клапана и эффект захвата газа.
Классификатор на основе метода K-ближайших соседей (рис. 16) показал среднюю точность распознавания 80,6 %, он не смог точно классифицировать все образцы при нормальном состоянии, недостаточное поступление жидкости и достижение плунжером верхней мертвой точки.
Заключение
В этом исследовании, основанном на более ранней работе [16], для решения задачи идентификации состояний штангового насоса был использован более широкий круг методов. Помимо метода опорных векторов использованы также методы дерева решений, К-ближайших соседей и наивный байесовский алгоритм. Это расширение набора методов предпринято для сравнения точности других классификаторов машинного обучения с результатами метода опорных векторов в контексте выявления неисправностей в штанговых насосах при использовании кривых мощности двигателя. При этом удалось классифицировать не четыре, а шесть режимов работы – добавлены состояния, когда плунжер достигает верхней и нижней мертвой точки. Использование кривых мощности двигателя позволяет построить таблицу признаков для обучения классификаторов. Результаты моделирования показывают, что предлагаемый подход позволяет весьма эффективно определять состояние штангового насоса. Метод дерева решений показал себя лучшим классификатором среди остальных, обеспечив среднюю точность 95,8 %, по сравнению с 90,3 % у метода опорных векторов.
About the authors
Othman H. Ahmed
Ural Federal University
Email: ahmed3.othman3@gmail.com
Postgraduate Student
Russian Federation, EkaterinburgSamuel I. Tecle
College of Engineering and Technology
Email: samuel47tecle@gmail.com
PhD, Assistant Professor
Eritrea, Mai NefhiAnatoliy A. Zyuzev
Ural Federal University
Email: a.m.zyuzev@urfu.ru
ORCID iD: 0000-0002-2233-2730
Dr. Sc., Professor
Russian Federation, EkaterinburgVladimir P. Metelkov
Ural Federal University
Author for correspondence.
Email: v.p.metelkov@urfu.ru
ORCID iD: 0000-0001-5640-1637
Dr. Sc., Professor
Russian Federation, EkaterinburgReferences
- Wilamowski B.M., Kaynak O. Oil well diagnosis by sensing terminal characteristics of the induction motor. IEEE Transactions on Industrial Electronics, 2000, vol. 47, no. 5, pp. 1100–1107. doi: 10.1109/41.873219.
- Martinović B., Bijanić M., Danilović D., Petrović A., Delibasić B. Unveiling deep learning insights: a specialized analysis of sucker rod pump dynamographs, emphasizing visualizations and human insight. Mathematics, 2023, vol. 11, no. 23, article id. 04782, pp. 1–29. doi: 10.3390/math11234782.
- Feng J., Wang M., Yang Y., Gao F., Pan Zh., Shan W., Liu Q., Yang Q., Yuan J. Fault diagnosis of sucker-rod pumping system using support vector machine. Communications and Information Processing. Communications in Computer and Information Science. Berlin, Heidelberg, Springer, 2012. Vol. 289, pp. 179–189. doi: 10.1007/978-3-642-31968-6_22.
- Xu P., Xu S., Yin H. Application of self-organizing competitive neural network in fault diagnosis of Sucker Rod Pump system. Journal of Petroleum Science and Engineering, 2007, vol. 58 (1–2), pp. 43–48. doi: 10.1016/j.petrol.2006.11.008.
- Li K., Han Y., Wang T. A novel prediction method for down-hole working states of the beam pumping unit based on 8-directions chain codes and online sequential extreme learning machine, Journal of Petroleum Science and Engineering, 2018, vol. 160, pp. 285–301. doi: 10.1016/j.petrol.2017.10.052.
- Li K., Gao X., Yang W., Dai Y., Tian Z. Multiple fault diagnosis of down-hole conditions of sucker-rod pumping wells based on Freeman chain code and DCA. Petroleum Science, 2013, vol. 10 (3), pp. 347–360. doi: 10.1007/s12182-013-0283-4.
- Sukhachev I.S., Sidorov S.V., Sushkov V.V., Antropova V.R. Development of a model for forecasting the technical condition of oilfield power-mechanical equipment using an artificial neural network. Electrical and data processing facilities and systems, 2022, vol. 18, no. 1, pp. 88–94. (In Russ). doi: 10.17122/1999-5458-2022-18-1-88-94.
- Wei J., Gao X. Fault diagnosis of sucker rod pump based on deep-broad learning using motor data. IEEE Access, 2020, vol. 8, pp. 222562–222571. doi: 10.1109/ACCESS.2020.3036078.
- Zheng B., Gao X., Li X. Fault detection for sucker rod pump based on motor power. Control Engineering Practice, 2019, vol. 86, pp. 37–47. doi: 10.1016/j.conengprac.2019.02.001.
- Pachin M.G., Yashin A.N., Bodylev A.S., Khakimyanov M.I. Development of an intelligent control station for rod pumps. Bulletin of the Tomsk Polytechnic University, Geo Assets Engineering, 2022, vol. 333, no. 3. pp. 68–75. (In Russ). doi: 10.18799/24131830/2022/3/3465.
- Wang A., Gong G., Shen R., Mao W., Lu H., Wang K., Wang J. Tracking the multi-well surface dynamometer card state for a sucker-rod pump by using a particle filter. IET Communications, 2018, vol. 12 (16), pp. 2058–2066. doi: 10.1049/iet-com.2018.5331.
- Chen L., Gao X., Li X. Using the motor power and XGBoost to diagnose working states of a sucker rod pump. Journal of Petroleum Science and Engineering, 2021, vol. 199, article id. 108329. doi: 10.1016/j.petrol.2020.108329.
- Deng X., Gao Y., Yang M., Sun Z., Cui W. Fault diagnosis of sucker rod pumping system using modified extreme learning machine assisted by gravitational search algorithm. 2019 IEEE Chinese Control And Decision Conference (CCDC). Nanchang, China, 3–5 June 2019. doi: 10.1109/CCDC.2019.8833177.
- Ramez A., Abu El Ela M., El-Banbi A. Identification of downhole conditions in sucker rod pumped wells using deep neural networks and genetic algorithms (includes associated discussion). SPE Production & Operations, 2020, vol. 35.02, pp. 435–447. doi: 10.2118/200494-PA.
- Liu J., Feng J., Gao X. Fault diagnosis of rod pumping wells based on support vector machine optimized by improved chicken swarm optimization. IEEE Access, 2019, vol. 7, pp. 171598–171608. doi: 10.1109/ACCESS.2019.2956221
- Tecle S.I., Ziuzev A., Spiridonov V. Development of fault diagnosis model for sucker rod pump using motor power curve. 2021 XVIII International Scientific Technical Conference Alternating Current Electric Drives (ACED). Ekaterinburg, Russia, IEEE, May 24–27, 2021. pp. 1–6. doi: 10.1109/ACED50605.2021.9462307.
- Takács G. Sucker-rod pumping manual. Tulsa, Oklahoma, PennWell Books, 2003. 395 p.
- Li K., Gao X.-W., Zhou H.-B., Han Y. Fault diagnosis for down-hole conditions of sucker rod pumping systems based on the FBH–SC method. Petroleum Science, 2015, vol. 12, pp. 135–147. doi: 10.1007/s12182-014-0006-5.
- Quinlan J.R. C4.5: Programs for Machine Learning. San Francisco, Morgan Kaufmann Publ., Inc., 1993. 302 p.
- Ngoc-Tu N., Kwon J.-M., Lee H.-H. Fault diagnosis of induction motor using decision tree with an optimal feature selection. 2007 7th International Conference on Power Electronics. Daegu, Korea, 27–30 November 2007. doi: 10.1109/ICPE.2007.4692484.
- He D., Li R., Zhu J. Plastic bearing fault diagnosis based on a two-step data mining approach. IEEE Transactions on Industrial Electronics, 2013, vol. 60 (8), pp. 3429–3440. doi: 10.1109/TIE.2012.2192894.
- Jamil M.A., Khan M.A.A., Khanam S. Feature-based performance of SVM and KNN classifiers for diagnosis of rolling element bearing faults. Vibroengineering PROCEDIA, 2021, vol. 39, pp. 36–42. doi: 10.21595/vp.2021.22307.
Supplementary files
