CN112434930B - 钻进过程故障诊断方法、***及设备 - Google Patents
钻进过程故障诊断方法、***及设备 Download PDFInfo
- Publication number
- CN112434930B CN112434930B CN202011308717.4A CN202011308717A CN112434930B CN 112434930 B CN112434930 B CN 112434930B CN 202011308717 A CN202011308717 A CN 202011308717A CN 112434930 B CN112434930 B CN 112434930B
- Authority
- CN
- China
- Prior art keywords
- drilling process
- process data
- data set
- parameter
- fault diagnosis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 285
- 238000005553 drilling Methods 0.000 title claims abstract description 250
- 230000008569 process Effects 0.000 title claims abstract description 232
- 238000003745 diagnosis Methods 0.000 title claims abstract description 67
- 238000012360 testing method Methods 0.000 claims abstract description 15
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 12
- 238000000605 extraction Methods 0.000 claims abstract description 12
- 238000010219 correlation analysis Methods 0.000 claims abstract description 9
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000001514 detection method Methods 0.000 claims description 4
- 239000012530 fluid Substances 0.000 claims description 4
- 238000007619 statistical method Methods 0.000 claims description 4
- 230000007613 environmental effect Effects 0.000 abstract description 4
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000002002 slurry Substances 0.000 description 2
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- E—FIXED CONSTRUCTIONS
- E21—EARTH OR ROCK DRILLING; MINING
- E21B—EARTH OR ROCK DRILLING; OBTAINING OIL, GAS, WATER, SOLUBLE OR MELTABLE MATERIALS OR A SLURRY OF MINERALS FROM WELLS
- E21B44/00—Automatic control systems specially adapted for drilling operations, i.e. self-operating systems which function to carry out or modify a drilling operation without intervention of a human operator, e.g. computer-controlled drilling systems; Systems specially adapted for monitoring a plurality of drilling variables or conditions
- E21B44/02—Automatic control of the tool feed
- E21B44/04—Automatic control of the tool feed in response to the torque of the drive ; Measuring drilling torque
-
- E—FIXED CONSTRUCTIONS
- E21—EARTH OR ROCK DRILLING; MINING
- E21B—EARTH OR ROCK DRILLING; OBTAINING OIL, GAS, WATER, SOLUBLE OR MELTABLE MATERIALS OR A SLURRY OF MINERALS FROM WELLS
- E21B47/00—Survey of boreholes or wells
-
- E—FIXED CONSTRUCTIONS
- E21—EARTH OR ROCK DRILLING; MINING
- E21B—EARTH OR ROCK DRILLING; OBTAINING OIL, GAS, WATER, SOLUBLE OR MELTABLE MATERIALS OR A SLURRY OF MINERALS FROM WELLS
- E21B47/00—Survey of boreholes or wells
- E21B47/06—Measuring temperature or pressure
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mining & Mineral Resources (AREA)
- Geology (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Geochemistry & Mineralogy (AREA)
- General Life Sciences & Earth Sciences (AREA)
- Environmental & Geological Engineering (AREA)
- Fluid Mechanics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Biology (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Geophysics (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Probability & Statistics with Applications (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- Game Theory and Decision Science (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
- Testing Or Calibration Of Command Recording Devices (AREA)
Abstract
本发明涉及地质钻探工程领域,提供一种钻进过程故障诊断方法,包括步骤:通过钻机传感器获取钻进过程数据集,对钻进过程数据集进行预处理,获得预处理后的钻进过程数据集;通过距离相关性分析方法对预处理后的钻进过程数据集进行钻进过程参数的选择与合并,获得k个参数组合;根据Mann‑Kendall趋势检验和近似熵对各参数组合进行时间序列特征提取,获得各参数组合对应的特征组合;通过密度峰值搜索聚类算法对各特征组合进行聚类,获得各参数组合的聚类结果;根据各参数组合的聚类结果,通过朴素贝叶斯分类器进行故障诊断,获得钻进过程故障诊断结果。能够有效地实现钻进过程的故障诊断,保障钻进过程的安全性,减少故障发生造成的经济和环境损失。
Description
技术领域
本发明涉及地质钻探工程领域,尤其涉及一种钻进过程故障诊断方法、***及设备。
背景技术
钻进过程是进行资源能源勘探及开采的重要工业过程。随着信息技术的发展,钻进过程可以实时采集多种反映钻进过程状态的过程参数。但在钻进过程中,由于地质环境的复杂性、司钻操作的不确定性等问题,井漏、井涌等钻进过程故障的发生通常无法避免。若不能及时发现并处理,将可能演化为重大安全生产事故,造成严重的经济和环境损失。据统计,钻进过程故障导致的非生产时间占整个钻进工程周期的20%左右。因此,开展钻进过程故障诊断的研究,对保障钻进过程的安全性,较少经济和环境损失,具有重要意义。
钻进过程具有强非线性和强耦合性,使得很难建立精确的钻进过程数学模型。由于高温高压的复杂地质环境,在钻进过程中存在很强的固-液-热相互作用,导致很难基于人工经验对钻进过程故障进行诊断。同时,钻进过程的不确定性也对故障诊断提出了挑战。此外,目前对于钻进过程故障诊断的研究,对钻进参数间的时间关联性考虑较少,诊断结果的可信度较低。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于,提供一种钻进过程故障诊断方法、***及设备,旨在解决现有技术中对钻进参数间的时间关联性考虑较少,诊断结果的可信度较低的技术问题。
为实现上述目的,本发明提供钻进过程故障诊断方法,包括以下步骤:
通过钻机传感器获取钻进过程数据集,对所述钻进过程数据集进行预处理,获得预处理后的钻进过程数据集;
通过距离相关性分析方法对所述预处理后的钻进过程数据集进行钻进过程参数的选择与合并,获得k个参数组合;
根据Mann-Kendall趋势检验和近似熵对各所述参数组合进行时间序列特征提取,获得各所述参数组合对应的特征组合;
通过密度峰值搜索聚类算法对各所述特征组合进行聚类,获得各所述参数组合的聚类结果;
根据各所述参数组合的聚类结果,通过朴素贝叶斯分类器进行故障诊断,获得钻进过程故障诊断结果。
优选地,所述通过钻机传感器获取钻进过程数据集,对所述钻进过程数据集进行预处理,获得预处理后的钻进过程数据集,包括:
通过钻机传感器,每隔预设时间t采集一次原始钻进过程数据;
收集所有原始钻进过程数据,获得钻进过程数据集;
剔除所述钻进过程数据集中所有原始钻进过程数据的零检测数据,获得预处理后的钻进过程数据集。
优选地,所述收集所有原始钻进过程数据,获得钻进过程数据集后,还包括:
对所述钻进过程数据集中钻井液迟到时间进行统计分析,获得所述钻进过程数据集中各钻进过程参数的时间序列,其中,各所述时间序列的长度为T分钟,各所述钻进过程参数包含T/t个钻进过程数据点。
优选地,所述预处理后的钻进过程数据集包括:游车高度、钻压、钩载、转速、扭矩、立管压力、入口流量、出口流量、总池体积、泥浆密度、泥浆电导率、入口温度和出口温度中的至少一种钻进过程参数类型。
优选地,所述通过距离相关性分析方法对所述预处理后的钻进过程数据集进行钻进过程参数的选择与合并,获得k个参数组合,包括:
通过计算获得所述预处理后的钻进过程数据集中各钻进过程参数间的距离相关系数;
选取所述距离相关系数大于0.5的钻进过程参数进行组合,获得k个参数组合。
优选地,所述根据Mann-Kendall趋势检验和近似熵对各所述参数组合进行时间序列特征提取,获得各所述参数组合对应的特征组合,包括:
通过Mann-Kendall趋势检验提取各所述参数组合中,各钻进过程参数的时间序列的趋势特征,获得全局趋势特征ZX;将所述钻进过程参数的时间序列划分为4个子时间序列,分别提取各所述子时间序列的趋势特征,获得4个局部趋势特征ZX1,ZX2,ZX3,ZX4;通过近似熵提取熵特征AE;
所述参数组合中各钻进过程参数的时间序列提取的特征集合为:{AE,ZX,ZX1,ZX2,ZX3,ZX4};
通过提取所述全局趋势特征ZX、所述4个局部趋势特征ZX1,ZX2,ZX3,ZX4和所述熵特征AE,获得每个参数组合对应的特征组合;
若参数组合中包含n个钻进过程参数的时间序列,则所述参数组合对应的特征组合有6*n个特征值。
优选地,所述通过密度峰值搜索聚类算法对各所述特征组合进行聚类,获得各所述参数组合的聚类结果,包括:
通过密度峰值搜索聚类算法,计算各所述特征组合中,各钻进过程数据点的局部密度及与高密度点之间的距离,从而获得聚类决策变量;
根据所述聚类决策变量通过线性拟合确定阈值,获得各所述特征组合的聚类中心;
将各所述特征组合的其他钻进过程数据点聚类到距离自己最近的聚类中心,获得各参数组合的聚类结果。
优选地,所述根据各所述参数组合的聚类结果,通过朴素贝叶斯分类器进行故障诊断,获得钻进过程故障诊断结果,包括:
所述参数组合的聚类结果为C={C1,C2,...,Ck},作为朴素贝叶斯分类器的输入;
钻进过程故障类型为A={A1,A2,A3}={井漏,正常,井涌},作为朴素贝叶斯分类器的输出;
朴素贝叶斯分类器根据贝叶斯原理进行分类,具体公式为:
依次计算获得P(A1|C),P(A2|C)和P(A3|C);
将所述P(A1|C),所述P(A2|C)和所述P(A3|C)中的最大值作为钻进过程故障诊断结果,所述钻进过程故障诊断结果包括:井漏、正常和井涌。
此外,为实现上述目的,本发明还提出钻进过程故障诊断设备,所述钻进过程故障诊断设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的钻进过程故障诊断程序,所述钻进过程故障诊断程序配置为实现如上文所述的钻进过程故障诊断方法的步骤。
此外,为实现上述目的,本发明还提出钻进过程故障诊断***,包括:
数据采集模块,用于通过钻机传感器获取钻进过程数据集,对所述钻进过程数据集进行预处理,获得预处理后的钻进过程数据集;
参数组合模块,用于通过距离相关性分析方法对所述预处理后的钻进过程数据集进行钻进过程参数的选择与合并,获得k个参数组合;
特征提取模块,用于根据Mann-Kendall趋势检验和近似熵对各所述参数组合进行时间序列特征提取,获得各所述参数组合对应的特征组合;
特征聚类模块,用于通过密度峰值搜索聚类算法对各所述特征组合进行聚类,获得各所述参数组合的聚类结果;
故障诊断模块,用于根据各所述参数组合的聚类结果,通过朴素贝叶斯分类器进行故障诊断,获得钻进过程故障诊断结果。
本发明具有以下有益效果:能够有效地实现钻进过程的故障诊断,保障钻进过程的安全性,减少故障发生造成的经济和环境损失,具有实用性和适用性。
附图说明
图1为本发明实施例方案涉及的硬件运行环境的钻进过程故障诊断设备的结构示意图;
图2为本发明钻进过程故障诊断方法的流程示意图;
图3为本发明钻进过程故障诊断***的结构框图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的钻进过程故障诊断设备结构示意图。
如图1所示,该钻进过程故障诊断设备可以包括:处理器1001,例如中央处理器(Central Processing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(WIreless-FIdelity,WI-FI)接口)。存储器1005可以是高速的随机存取存储器(Random Access Memory,RAM),也可以是稳定的存储器(Non-volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对钻进过程故障诊断设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作***、网络通信模块、用户接口模块以及钻进过程故障诊断程序。
在图1所示的钻进过程故障诊断设备中,网络接口1004主要用于连接后台服务器,与所述后台服务器进行数据通信;用户接口1003主要用于连接用户设备;所述钻进过程故障诊断设备通过处理器1001调用存储器1005中存储的钻进过程故障诊断程序,并执行本发明实施例提供的钻进过程故障诊断方法。
基于上述硬件结构,提出本发明钻进过程故障诊断方法的实施例。
参照图2,图2为本发明钻进过程故障诊断方法的流程示意图。
在实施例中,所述钻进过程故障诊断方法,用于实现钻进过程的井漏井涌诊断,且该技术能够实现钻进过程井漏井涌的诊断,进而为提升钻进过程的安全性奠定基础,具体包括以下步骤:
S10:通过钻机传感器获取钻进过程数据集,对所述钻进过程数据集进行预处理,获得预处理后的钻进过程数据集。
S20:通过距离相关性分析方法对所述预处理后的钻进过程数据集进行钻进过程参数的选择与合并,获得k个参数组合。
S30:根据Mann-Kendall趋势检验和近似熵对各所述参数组合进行时间序列特征提取,获得各所述参数组合对应的特征组合。
S40:通过密度峰值搜索聚类算法对各所述特征组合进行聚类,获得各所述参数组合的聚类结果。
S50:根据各所述参数组合的聚类结果,通过朴素贝叶斯分类器进行故障诊断,获得钻进过程故障诊断结果。
进一步地,步骤S10包括:
S101:通过钻机传感器,每隔预设时间t采集一次原始钻进过程数据。
S102:收集所有原始钻进过程数据,获得钻进过程数据集。
S103:剔除所述钻进过程数据集中所有原始钻进过程数据的零检测数据,获得预处理后的钻进过程数据集。
进一步地,在步骤S102之后,还包括:
对所述钻进过程数据集中钻井液迟到时间进行统计分析,获得所述钻进过程数据集中各钻进过程参数的时间序列,其中,各所述时间序列的长度为T分钟,各所述钻进过程参数包含T/t个钻进过程数据点。
具体实现中,优选地,T取值为120,t取值为2,T/t的值为60。
进一步地,所述预处理后的钻进过程数据集包括:游车高度、钻压、钩载、转速、扭矩、立管压力、入口流量、出口流量、总池体积、泥浆密度、泥浆电导率、入口温度和出口温度中的至少一种钻进过程参数类型。
进一步地,步骤S20包括:
S201:通过计算获得所述预处理后的钻进过程数据集中各钻进过程参数间的距离相关系数。
具体实现中,对于两个钻进过程参数a=[a1,a2,...,an]和b=[b1,b2,...,bn],其距离相关系数dcor(a,b)如下式:
其中,距离协方差dcov(a,b)的计算如下式:
其中,‖a‖d为d维变量a的欧几里德范数;i和j为标号变量,取值范围均为1到n的整数;ai和aj为过程参数a中的钻进过程数据点,bi和bj为过程参数b中的钻进过程数据点;同理可计算出dcov(a,a)和dcov(b,b)。
S202:选取所述距离相关系数dcor>0.5的钻进过程参数进行组合,获得k个参数组合。
具体实现中,可得到4个参数组合,包括:第一参数组合、第二参数组合、第三参数组合和第四参数组合;
第一参数组合中,包含的钻进过程参数类型为:游车高度、转速和泥浆电导率;
第二参数组合中,包含的钻进过程参数类型为:钻压、钩载和扭矩;
第三参数组合中,包含的钻进过程参数类型为:总池体积、立管压力、入口流量、出口流量、入口温度和出口温度;
第四参数组合中,包含的钻进过程参数类型为:泥浆密度。
进一步地,步骤S30包括:
S301:通过Mann-Kendall趋势检验提取各所述参数组合中,各钻进过程参数的时间序列的趋势特征,获得全局趋势特征ZX;将所述钻进过程参数的时间序列划分为4个子时间序列,分别提取各所述子时间序列的趋势特征,获得4个局部趋势特征ZX1,ZX2,ZX3,ZX4;通过近似熵提取熵特征AE;
所述参数组合中各钻进过程参数的时间序列提取的特征集合为:{AE,ZX,ZX1,ZX2,ZX3,ZX4}。
具体实现中,分为以下步骤:
S3011:对于时间序列X={x1,x2,...,xN},N为样本数量,计算Mann-Kendall统计量SX,计算公式如下:
其中,sign()符号函数;i和j为标号变量,i的取值范围为1到N-1的整数,j的取值范围为2到N的整数,且j=i+1。
由上可计算检验统计量ZX,计算公式如下:
其中,ZX为趋势特征值,其正负符号代表趋势变化的方向,其大小代表趋势变化的程度。ZX为正值表示增加趋势,负值表示减少趋势。
按上述步骤对整个时间序列进行趋势特征提取,获得全局趋势特征ZX。将整个时间序列均分成四个子时间序列,并按上述步骤对各个子时间序列进行趋势特征提取,获得四个局部趋势特征ZX1,ZX2,ZX3,ZX4。
S3012:计算时间序列的近似熵特征AE的具体方式是,首先对于时间序列X={x1,x2,...,xN},重构m维向量,具体公式如下:
X(i)={xi,xi+1,...,xi+m-1},(i=1,2,...,N-m+1) (7)
其中m=2,为比较向量的长度;N为样本数量;i为标号变量,i的取值范围为1到N-m+1的整数。
计算X(i)和X(j)之间的距离rij,计算公式如下:
其中,j为标号变量,j的取值范围为1到N-m+1的整数;k为中间变量,其值为0到m-1范围里最大的差值。
统计rij小于设定阈值r的向量个数所占比重,计算公式如下:
其中,r=0.2σ,σ为时间序列X的方差;Θ为Heaviside函数。
可得到比重如下:
将m加1,重复上述步骤得到和Φm+1(r),最终计算近似熵AE,公式如下:
AE=Φm(r)-Φm+1(r) (12)
S3013:按照步骤S3011-S3013的计算后,时间序列X将变成一个包含六个特征参数的集合{AE,ZX,ZX1,ZX2,ZX3,ZX4},各参数组合将变为对应的特征组合。
S302:通过提取所述全局趋势特征ZX、所述4个局部趋势特征ZX1,ZX2,ZX3,ZX4和所述熵特征AE,获得每个参数组合对应的特征组合;
若参数组合中包含n个钻进过程参数的时间序列,则所述参数组合对应的特征组合有6*n个特征值。
具体实现中,例如钻进参数组合1包含3个钻进参数的时间序列,特征提取后对应的为一个18维的特征组合。
进一步地,步骤S40包括:
S401:通过密度峰值搜索聚类算法,计算各所述特征组合中,各钻进过程数据点的局部密度及与高密度点之间的距离,从而获得聚类决策变量。
具体实现中,首先计算钻进过程数据点的局部密度,计算公式如下:
其中,dij为两点间的欧式距离,dc为截断距离,通常设置为整个数据集总体数据点个数2%;i和j为标号变量,取值均为整数,且i不等于j;χ(d)为如下函数:
根据上述计算结果获得与其他拥有更高密度的钻进过程数据点的最小距离,计算公式如下:
获得选择聚类中心的决策变量γi,其中γi=ρjδi。
S402:根据所述聚类决策变量通过线性拟合确定阈值,获得各所述特征组合的聚类中心;
具体实现中,将决策变量γi按降序排列,通过线性拟合确定阈值进而决定聚类中心,计算公式如下:
其中,Ii=(Ii,Ii+1,...,Ii+lf-1),lf=5。
取最后一个满足αidx<-1的点作为阈值,即进而可确定聚类中心。
S403:将各所述特征组合的其他钻进过程数据点聚类到距离自己最近的聚类中心,获得各参数组合的聚类结果。
具体实现中,第一参数组合的聚类数目为25,第二参数组合的聚类数目为24,第三参数组合的聚类数目为52,第四参数组合的聚类数目为5。
进一步地,步骤S50包括:
S501:所述参数组合的聚类结果为C={C1,C2,...,Ck},作为朴素贝叶斯分类器的输入;
钻进过程故障类型为A={A1,A2,A3}={井漏,正常,井涌},作为朴素贝叶斯分类器的输出;
S502:朴素贝叶斯分类器根据贝叶斯原理进行分类,具体公式为:
依次计算获得P(A1|C),P(A2|C)和P(A3|C);
S503:将所述P(A1|C),所述P(A2|C)和所述P(A3|C)中的最大值作为钻进过程故障诊断结果,所述钻进过程故障诊断结果包括:井漏、正常和井涌。
根据获得的620组时间序列数据开展十折交叉验证实验,获得了如表1所示的混淆矩阵,并计算了故障诊断的精度、误报率和漏报率。可见,精度为95.65%,误报率为2.33%,漏报率为8.90%,实现了钻进过程有效的故障诊断。
表1
本发明的有益效果是:能够有效地实现钻进过程的故障诊断,具有重要的经济价值和应用价值。
此外,参照图3,本发明实施例还提出钻进过程故障诊断***,所述钻进过程故障诊断***包括:
数据采集模块,用于通过钻机传感器获取钻进过程数据集,对所述钻进过程数据集进行预处理,获得预处理后的钻进过程数据集;
参数组合模块,用于通过距离相关性分析方法对所述预处理后的钻进过程数据集进行钻进过程参数的选择与合并,获得k个参数组合;
特征提取模块,用于根据Mann-Kendall趋势检验和近似熵对各所述参数组合进行时间序列特征提取,获得各所述参数组合对应的特征组合;
特征聚类模块,用于通过密度峰值搜索聚类算法对各所述特征组合进行聚类,获得各所述参数组合的聚类结果;
故障诊断模块,用于根据各所述参数组合的聚类结果,通过朴素贝叶斯分类器进行故障诊断,获得钻进过程故障诊断结果。
本发明所述钻进过程故障诊断***的其他实施例或具体实现方式可参照上述各方法实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者***不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者***所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者***中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。在列举了若干***的单元权利要求中,这些***中的若干个可以是通过同一个硬件项来具体体现。词语第一、第二、以及第三等的使用不表示任何顺序,可将这些词语解释为标识。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器镜像(Read Only Memory image,ROM)/随机存取存储器(Random AccessMemory,RAM)、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (6)
1.一种钻进过程故障诊断方法,其特征在于,包括以下步骤:
通过钻机传感器获取钻进过程数据集,对所述钻进过程数据集进行预处理,获得预处理后的钻进过程数据集;
通过距离相关性分析方法对所述预处理后的钻进过程数据集进行钻进过程参数的选择与合并,获得k个参数组合;
根据Mann-Kendall趋势检验和近似熵对各所述参数组合进行时间序列特征提取,获得各所述参数组合对应的特征组合;
通过密度峰值搜索聚类算法对各所述特征组合进行聚类,获得各所述参数组合的聚类结果;
根据各所述参数组合的聚类结果,通过朴素贝叶斯分类器进行故障诊断,获得钻进过程故障诊断结果;
所述通过钻机传感器获取钻进过程数据集,对所述钻进过程数据集进行预处理,获得预处理后的钻进过程数据集,包括:
通过钻机传感器,每隔预设时间t采集一次原始钻进过程数据;
收集所有原始钻进过程数据,获得钻进过程数据集;
剔除所述钻进过程数据集中所有原始钻进过程数据的零检测数据,获得预处理后的钻进过程数据集;
所述收集所有原始钻进过程数据,获得钻进过程数据集后,还包括:
对所述钻进过程数据集中钻井液迟到时间进行统计分析,获得所述钻进过程数据集中各钻进过程参数的时间序列,其中,各所述时间序列的长度为T分钟,各所述钻进过程参数包含T/t个钻进过程数据点;
所述根据Mann-Kendall趋势检验和近似熵对各所述参数组合进行时间序列特征提取,获得各所述参数组合对应的特征组合,包括:
通过Mann-Kendall趋势检验提取各所述参数组合中,各钻进过程参数的时间序列的趋势特征,获得全局趋势特征ZX;将所述钻进过程参数的时间序列划分为4个子时间序列,分别提取各所述子时间序列的趋势特征,获得4个局部趋势特征ZX1,ZX2,ZX3,ZX4;通过近似熵提取熵特征AE;
所述参数组合中各钻进过程参数的时间序列提取的特征集合为:{AE,ZX,ZX1,ZX2,ZX3,ZX4};
通过提取所述全局趋势特征ZX、所述4个局部趋势特征ZX1,ZX2,ZX3,ZX4和所述熵特征AE,获得每个参数组合对应的特征组合;
若参数组合中包含n个钻进过程参数的时间序列,则所述参数组合对应的特征组合有6*n个特征值;
所述根据各所述参数组合的聚类结果,通过朴素贝叶斯分类器进行故障诊断,获得钻进过程故障诊断结果,包括:
所述参数组合的聚类结果为C={C1,C2,...,Ck},作为朴素贝叶斯分类器的输入;
钻进过程故障类型为A={A1,A2,A3}={井漏,正常,井涌},作为朴素贝叶斯分类器的输出;
朴素贝叶斯分类器根据贝叶斯原理进行分类,具体公式为:
依次计算获得P(A1|C),P(A2|C)和P(A3|C),i=1,2,3;
将所述P(A1|C),所述P(A2|C)和所述P(A3|C)中的最大值作为钻进过程故障诊断结果,所述钻进过程故障诊断结果包括:井漏、正常和井涌。
2.根据权利要求1所述的一种钻进过程故障诊断方法,其特征在于,所述预处理后的钻进过程数据集包括:游车高度、钻压、钩载、转速、扭矩、立管压力、入口流量、出口流量、总池体积、泥浆密度、泥浆电导率、入口温度和出口温度中的至少一种钻进过程参数类型。
3.根据权利要求1所述的一种钻进过程故障诊断方法,其特征在于,所述通过距离相关性分析方法对所述预处理后的钻进过程数据集进行钻进过程参数的选择与合并,获得k个参数组合,包括:
通过计算获得所述预处理后的钻进过程数据集中各钻进过程参数间的距离相关系数;
选取所述距离相关系数大于0.5的钻进过程参数进行组合,获得k个参数组合。
4.根据权利要求1所述的一种钻进过程故障诊断方法,其特征在于,所述通过密度峰值搜索聚类算法对各所述特征组合进行聚类,获得各所述参数组合的聚类结果,包括:
通过密度峰值搜索聚类算法,计算各所述特征组合中,各钻进过程数据点的局部密度及与高密度点之间的距离,从而获得聚类决策变量;
根据所述聚类决策变量通过线性拟合确定阈值,获得各所述特征组合的聚类中心;
将各所述特征组合的其他钻进过程数据点聚类到距离自己最近的聚类中心,获得各参数组合的聚类结果。
5.一种钻进过程故障诊断***,其特征在于,所述一种钻进过程故障诊断***包括:
数据采集模块,用于通过钻机传感器获取钻进过程数据集,对所述钻进过程数据集进行预处理,获得预处理后的钻进过程数据集;
参数组合模块,用于通过距离相关性分析方法对所述预处理后的钻进过程数据集进行钻进过程参数的选择与合并,获得k个参数组合;
特征提取模块,用于根据Mann-Kendall趋势检验和近似熵对各所述参数组合进行时间序列特征提取,获得各所述参数组合对应的特征组合;
特征聚类模块,用于通过密度峰值搜索聚类算法对各所述特征组合进行聚类,获得各所述参数组合的聚类结果;
故障诊断模块,用于根据各所述参数组合的聚类结果,通过朴素贝叶斯分类器进行故障诊断,获得钻进过程故障诊断结果;
所述通过钻机传感器获取钻进过程数据集,对所述钻进过程数据集进行预处理,获得预处理后的钻进过程数据集,包括:
通过钻机传感器,每隔预设时间t采集一次原始钻进过程数据;
收集所有原始钻进过程数据,获得钻进过程数据集;
剔除所述钻进过程数据集中所有原始钻进过程数据的零检测数据,获得预处理后的钻进过程数据集;
所述收集所有原始钻进过程数据,获得钻进过程数据集后,还包括:
对所述钻进过程数据集中钻井液迟到时间进行统计分析,获得所述钻进过程数据集中各钻进过程参数的时间序列,其中,各所述时间序列的长度为T分钟,各所述钻进过程参数包含T/t个钻进过程数据点;
所述根据Mann-Kendall趋势检验和近似熵对各所述参数组合进行时间序列特征提取,获得各所述参数组合对应的特征组合,包括:
通过Mann-Kendall趋势检验提取各所述参数组合中,各钻进过程参数的时间序列的趋势特征,获得全局趋势特征ZX;将所述钻进过程参数的时间序列划分为4个子时间序列,分别提取各所述子时间序列的趋势特征,获得4个局部趋势特征ZX1,ZX2,ZX3,ZX4;通过近似熵提取熵特征AE;
所述参数组合中各钻进过程参数的时间序列提取的特征集合为:{AE,ZX,ZX1,ZX2,ZX3,ZX4};
通过提取所述全局趋势特征ZX、所述4个局部趋势特征ZX1,ZX2,ZX3,ZX4和所述熵特征AE,获得每个参数组合对应的特征组合;
若参数组合中包含n个钻进过程参数的时间序列,则所述参数组合对应的特征组合有6*n个特征值;
所述根据各所述参数组合的聚类结果,通过朴素贝叶斯分类器进行故障诊断,获得钻进过程故障诊断结果,包括:
所述参数组合的聚类结果为C={C1,C2,...,Ck},作为朴素贝叶斯分类器的输入;
钻进过程故障类型为A={A1,A2,A3}={井漏,正常,井涌},作为朴素贝叶斯分类器的输出;
朴素贝叶斯分类器根据贝叶斯原理进行分类,具体公式为:
依次计算获得P(A1|C),P(A2|C)和P(A3|C),i=1,2,3;
将所述P(A1|C),所述P(A2|C)和所述P(A3|C)中的最大值作为钻进过程故障诊断结果,所述钻进过程故障诊断结果包括:井漏、正常和井涌。
6.一种钻进过程故障诊断设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的钻进过程故障诊断程序,所述钻进过程故障诊断程序被所述处理器执行时实现如权利要求1至4中任一项所述的一种钻进过程故障诊断方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011308717.4A CN112434930B (zh) | 2020-11-20 | 2020-11-20 | 钻进过程故障诊断方法、***及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011308717.4A CN112434930B (zh) | 2020-11-20 | 2020-11-20 | 钻进过程故障诊断方法、***及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112434930A CN112434930A (zh) | 2021-03-02 |
CN112434930B true CN112434930B (zh) | 2023-08-08 |
Family
ID=74693076
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011308717.4A Active CN112434930B (zh) | 2020-11-20 | 2020-11-20 | 钻进过程故障诊断方法、***及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112434930B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113516334A (zh) * | 2021-03-12 | 2021-10-19 | 中电建电力检修工程有限公司 | 一种大坝的接缝和裂缝的检验方法及*** |
CN114862071B (zh) * | 2022-07-07 | 2022-09-09 | 中国长江三峡集团有限公司 | 水平定向钻进扩孔扭矩预测方法、装置、设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5592381A (en) * | 1991-09-26 | 1997-01-07 | Elf Aquitaine Production | Device for processing and interpreting drilling data, placed at the bottom of a well and method implementing this device |
JP2008176703A (ja) * | 2007-01-22 | 2008-07-31 | Fuji Xerox Co Ltd | 故障診断システム及び故障診断プログラム |
CN103323228A (zh) * | 2013-07-02 | 2013-09-25 | 中煤科工集团西安研究院 | 一种矿用钻机故障智能识别方法 |
CN104675380A (zh) * | 2015-01-28 | 2015-06-03 | 扬州大学 | 石油钻井钻柱在线监测***及故障诊断方法 |
WO2016101690A1 (zh) * | 2014-12-22 | 2016-06-30 | 国家电网公司 | 基于时间序列分析的输变电设备的状态监测数据清洗方法 |
CN109947076A (zh) * | 2019-03-14 | 2019-06-28 | 华中科技大学 | 一种基于贝叶斯信息准则的工业过程故障诊断方法 |
CN110736968A (zh) * | 2019-10-16 | 2020-01-31 | 清华大学 | 基于深度学习的雷达异常状态诊断方法 |
CN111612033A (zh) * | 2020-04-15 | 2020-09-01 | 广东电网有限责任公司 | 基于引力搜索与密度峰值聚类的配电变压器故障诊断方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10533920B2 (en) * | 2014-08-05 | 2020-01-14 | Acoem France | Automatic rotating-machine fault diagnosis with confidence level indication |
US20190384255A1 (en) * | 2018-06-19 | 2019-12-19 | Honeywell International Inc. | Autonomous predictive real-time monitoring of faults in process and equipment |
-
2020
- 2020-11-20 CN CN202011308717.4A patent/CN112434930B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5592381A (en) * | 1991-09-26 | 1997-01-07 | Elf Aquitaine Production | Device for processing and interpreting drilling data, placed at the bottom of a well and method implementing this device |
JP2008176703A (ja) * | 2007-01-22 | 2008-07-31 | Fuji Xerox Co Ltd | 故障診断システム及び故障診断プログラム |
CN103323228A (zh) * | 2013-07-02 | 2013-09-25 | 中煤科工集团西安研究院 | 一种矿用钻机故障智能识别方法 |
WO2016101690A1 (zh) * | 2014-12-22 | 2016-06-30 | 国家电网公司 | 基于时间序列分析的输变电设备的状态监测数据清洗方法 |
CN104675380A (zh) * | 2015-01-28 | 2015-06-03 | 扬州大学 | 石油钻井钻柱在线监测***及故障诊断方法 |
CN109947076A (zh) * | 2019-03-14 | 2019-06-28 | 华中科技大学 | 一种基于贝叶斯信息准则的工业过程故障诊断方法 |
CN110736968A (zh) * | 2019-10-16 | 2020-01-31 | 清华大学 | 基于深度学习的雷达异常状态诊断方法 |
CN111612033A (zh) * | 2020-04-15 | 2020-09-01 | 广东电网有限责任公司 | 基于引力搜索与密度峰值聚类的配电变压器故障诊断方法 |
Non-Patent Citations (1)
Title |
---|
基于多传感器信息融合的贝叶斯网络故障诊断方法研究及应用;刘希亮;陈桂明;李方溪;张倩;;机械科学与技术(01);97-101 * |
Also Published As
Publication number | Publication date |
---|---|
CN112434930A (zh) | 2021-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112434930B (zh) | 钻进过程故障诊断方法、***及设备 | |
CN110352389B (zh) | 信息处理装置及信息处理方法 | |
CN105488539B (zh) | 分类模型的生成方法及装置、***容量的预估方法及装置 | |
CN113033622A (zh) | 跨模态检索模型的训练方法、装置、设备和存储介质 | |
Wang et al. | Change-point detection in multinomial data with a large number of categories | |
CN111612037A (zh) | 异常用户检测方法、装置、介质及电子设备 | |
CN116089838B (zh) | 窃电用户智能识别模型训练方法和识别方法 | |
EP3249549B1 (en) | Time series data search device and time series data search program | |
CN110796159A (zh) | 基于k-means算法的电力数据分类方法及*** | |
CN113447759A (zh) | 一种多分类的rvm电网故障判别方法和*** | |
CN116340388A (zh) | 一种基于异常检测的时序数据的压缩存储方法及装置 | |
CN109902731B (zh) | 一种基于支持向量机的性能故障的检测方法及装置 | |
CN113449778B (zh) | 用于量子数据分类的模型训练方法以及量子数据分类方法 | |
CN108760268B (zh) | 一种基于信息熵的立磨运行数据阶跃故障诊断方法 | |
CN114463587A (zh) | 一种异常数据检测方法、装置、设备及存储介质 | |
CN111506624B (zh) | 一种电力缺失数据辨识方法和相关装置 | |
Li et al. | Fault diagnosis and prediction of complex system based on Hidden Markov model | |
CN115169489B (zh) | 数据检索方法、装置、设备以及存储介质 | |
CN111273126A (zh) | 一种配电网拓扑快速感知方法 | |
CN115358327A (zh) | 基于pca-svm的海洋温跃层数据可视化方法、装置、设备及介质 | |
Chen et al. | Distribution‐free model selection for longitudinal zero‐inflated count data with missing responses and covariates | |
CN112487646B (zh) | 基于关联同步时间序列信号变点检测的寿命预测方法 | |
JP7448023B2 (ja) | 学習方法、学習装置及びプログラム | |
CN113155422B (zh) | 一种故障检测方法、装置和存储介质 | |
JP2019105870A (ja) | 判別プログラム、判別方法および判別装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |