CN110008253B - 一种工业数据关联规则挖掘及异常工况预测方法 - Google Patents

一种工业数据关联规则挖掘及异常工况预测方法 Download PDF

Info

Publication number
CN110008253B
CN110008253B CN201910244856.6A CN201910244856A CN110008253B CN 110008253 B CN110008253 B CN 110008253B CN 201910244856 A CN201910244856 A CN 201910244856A CN 110008253 B CN110008253 B CN 110008253B
Authority
CN
China
Prior art keywords
data
sequence
fitting
association
line segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910244856.6A
Other languages
English (en)
Other versions
CN110008253A (zh
Inventor
徐正国
王豆
陈积明
程鹏
孙优贤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201910244856.6A priority Critical patent/CN110008253B/zh
Publication of CN110008253A publication Critical patent/CN110008253A/zh
Application granted granted Critical
Publication of CN110008253B publication Critical patent/CN110008253B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种工业数据关联规则挖掘及异常工况预测方法,可应用于工业过程的故障预测与健康管理。本发明把关联规则挖掘引入工业设备故障预测中,通过关联规则挖掘算法寻找运行参数间的关联性。针对工业数据特点,从设备运行参数的变化趋势入手,通过以运行参数变化趋势为最重要的指标生成事务集,并以此为基础进行参数与参数之间的关联规则挖掘,随后将关联规则挖掘结果引入工业设备异常工况预测中,以获得更为准确的预测结果。对于工程上的故障预测和健康管理有重大应用价值。

Description

一种工业数据关联规则挖掘及异常工况预测方法
技术领域
本发明属于可靠性维护工程技术领域,涉及一种基于两阶段频繁项集产生策略的工业数据关联规则挖掘及异常工况预测方法。
背景技术
随着复杂***的不断出现以及工业过程实时监测的需求不断增加,现代工业设备在运行过程中往往配备多个传感器对其运行状态进行监测。同时,设备运行过程中可能会出现多种故障模式,某一故障可能对应若干征兆,在此情况下,单传感器信息已无法完全体现设备运行状态,基于多传感器信息的故障预测应运而生。基于多传感器信息的故障预测旨在利用全面的传感器信息分析设备的运行状态,从而进行更可靠的设备诊断和预测。随着传感技术的持续发展,使用多个传感器进行设备的状态监测、故障诊断和预测已经成为发展趋势。
设备运行过程中其运行参数之间存在一定关联性,在故障预测领域,目前仍鲜有将关联规则挖掘与故障预测相结合的工作。而实际上,对于时间序列数据,设备故障或失效往往是通过参数或从参数中提取的相关特征进行体现,其预测往往便是对参数或相关特征的变化趋势进行预测。挖掘参数间的关联规则,可以获取更完备的参数即设备运行状态信息,为后续的预测提供一定的依据。
发明内容
针对现有技术的现状,本发明的目的是解决现有数据驱动的预测技术中鲜有考虑传感器数据存在关联规则的情况,提出一种基于运行参数关联规则的设备异常工况预测方法,构造更为适用的小波神经网络进行异常工况预测(故障预测)。
现将本发明的构思阐述如下:
本发明利用关联规则对工业过程运行参数的关联性进行刻画,研究了基于时序数据关联规则挖掘的异常工况预测问题。为了对于时间序列数据在序列层面上挖掘关联规则,本发明提出了一种包含两阶段频繁项集产生过程的时间序列数据关联规则挖掘算法。在第一阶段,提取时间序列的变化趋势信息作为关联规则挖掘的基本模式,发现时间序列变化形态的频繁项集;在第二阶段,以时间序列变化形态的频繁项集为基础,发现序列为基本模式的频繁项集,并对两两序列进行了关联规则挖掘。随后,利用挖掘所得的关联规则相关的***变量进行异常工况预测,将关联规则引入小波神经网络中提高预测准确性。本发明提出的方法将运行参数关联规则纳入考虑,能够获得更准确的故障预测结果。
根据以上发明构思,本发明提出了一种基于两阶段频繁项集产生策略的工业数据关联规则挖掘及预测方法,具体步骤如下:
步骤1:对时间序列数据分段线性化表示和符号化,构造适用于关联规则挖掘的离散型数据集;
步骤2:采用两阶段的频繁项集挖掘算法生成数据集的频繁项集;
步骤3:根据频繁项集生成关联规则,提取满足最小支持度和最小置信度阈值的关联规则;
步骤4:将关联规则挖掘结果引入小波神经网络,并用于工业设备的异常工况预测。
基于上述方案,各步骤可具体采用如下实现方式:
作为优选,所述步骤1包含以下子步骤:
步骤1.1:记传感器测量时间序列为
Figure GDA0002883649050000021
N为传感器数量,k时间序列长度;初始拟合起点为
Figure GDA0002883649050000022
初始拟合终点为
Figure GDA0002883649050000023
记拟合起点为
Figure GDA0002883649050000024
拟合终点为
Figure GDA0002883649050000025
拟合误差阈值为ωE
步骤1.2:对于每一
Figure GDA0002883649050000026
按如下方法进行分段拟合:
1.2.1初始化分段点计数值count=1;
1.2.2依次对每个拟合起点
Figure GDA0002883649050000027
执行步骤1)-步骤4):
1)首先计算end=start+h;
2)对于数据
Figure GDA0002883649050000028
并利用最小二乘法进行拟合,计算拟合误差ERR;
3)若拟合误差ERR不大于拟合误差阈值ωE,则h=h+1,重新跳转至步骤1);
4)若拟合误差ERR大于拟合误差阈值ωE,获得
Figure GDA0002883649050000029
的线段拟合序列
Figure GDA00028836490500000210
start=start+h,记录分段点
Figure GDA00028836490500000211
重置h=2,count=count +1;
1.2.3循环执行1.2.2直到end大于k结束,得到拟合后的线段化时间序列
Figure GDA0002883649050000031
和分段点
Figure GDA0002883649050000032
组成的分段点序列Pi
步骤1.3:将任一传感器拟合后的时间序列
Figure GDA0002883649050000033
记为Yk={y1,y2,…,yk},提取每条拟合线段的趋势以及数值信息,并采用以下三元组的方式表示一条拟合线段 si
Figure GDA0002883649050000034
其中,ki表示该线段的斜率,
Figure GDA0002883649050000035
表示该线段在时间轴上的跨度,ri表示该线段数据的增长率,对于该线段对应的数据{yj,yj+1,…,yj+h},
Figure GDA0002883649050000036
j为该线段的起始点;
对线段化时间序列Yk中的所有线段进行三元组表示,得到三元组序列 Sn={s1,s2,…,sn},其中n表示时间序列Xk分段后的线段数;
步骤1.4:对三元组序列中的线段序列进行聚类并对线段进行符号化,用于表示设备或***不同的变化形式,采用欧氏距离描述线段si和sj的相似度dij
Figure GDA0002883649050000037
其中,dij表示线段si和sj的相似度,dij越小,则表示两条线段有更相似的变化形态,ωk和ωr为权重;
随后根据相似度指标dij,采用K-means聚类算法对Sn进行聚类,并为同一类线段分配一个相同符号以表示运行参数的变化方式,得到符号化的序列 Fn={f1,f2,…,fn},f1,f2,…,fn分别表示第1,2…,n条线段分配到的符号;
步骤1.5:对于每两个传感器的测量时间序列
Figure GDA0002883649050000038
Figure GDA0002883649050000039
合并其分段点序列Pi和 Pj,记为Pij,nij-1为Pi和Pj合并后的分段点个数;并按合并后的分段点对其符号化序列
Figure GDA00028836490500000310
Figure GDA00028836490500000311
进行分割重构,得到重构后的符号化序列
Figure GDA00028836490500000312
Figure GDA00028836490500000313
作为优选,所述步骤2包含以下子步骤:
步骤2.1:对于测量时间序列
Figure GDA0002883649050000041
Figure GDA0002883649050000042
分别对应的运行参数Vi和Vj,由步骤1 获得其测量序列的符号化数据为
Figure GDA0002883649050000043
Figure GDA0002883649050000044
由其构成事务集,即每一事务记为
Figure GDA0002883649050000045
Figure GDA0002883649050000046
Figure GDA0002883649050000047
中所包含的线段类别符号分别记为
Figure GDA0002883649050000048
Figure GDA0002883649050000049
记两阶段的最小支持度阈值分别为minsup1和minsup2
步骤2.2:通过单次扫描数据集,计算每一项的支持度,获得频繁1-项集,按如下2.2.1~2.2.3过程进行:
2.2.1:记σ(·)为项或项集的支持度计数,初始为0;设
Figure GDA00028836490500000418
的类别符号为tk,t表示a或b;
2.2.2:对于每一个事务
Figure GDA00028836490500000410
计算σ(tk)=σ(tk)+1;
2.2.3:对于每一个tk,如果
Figure GDA00028836490500000411
不小于最小支持度阈值minsup1,则认为tk为频繁1-项集,保留tk并记录相应的支持度计数;如果
Figure GDA00028836490500000412
小于最小支持度阈值 minsup1,则认为tk不是频繁1-项集;
步骤2.3:使用步骤2.2中获得的频繁1-项集tk构成2-项集,并计算其支持度,用以发现频繁2-项集,按如下过程进行:
2.3.1:记ap和bq分别为经过步骤2.2从原线段类别符号
Figure GDA00028836490500000413
Figure GDA00028836490500000414
中保留的项;
2.3.2对于每一个{ap,bq},执行以下步骤:
1)对每一个存在于
Figure GDA00028836490500000415
中的{ap,bq},计算σ({ap,bq})=σ({ap,bq})+1
2)如果
Figure GDA00028836490500000416
不小于minsup1,则认为{ap,Bq}为频繁2-项集,保留{ap,bq}并记录相应的支持度计数;
步骤2.4:使用步骤2.3中获得的频繁2-项集{ap,bq}计算每两个运行参数在整个数据集中的支持度,并得到参数层面的频繁项集,按如下过程进行:对每两个运行参数Vi和Vj构成的项集{Vi,Vj},计算σ({Vi,Vj})=sum(σ({ap,bq})),若
Figure GDA00028836490500000417
不小于最小支持度阈值minsup2,则保留{Vi,Vj}并记录相应的支持度,并计算σ(Vi)=sum(σ(ap));σ(Vj)=sum(σ(bq))。
作为优选,所述步骤3包含以下子步骤:
步骤3.1:对步骤2中获得的满足支持度阈值的每组{Vi,Vj},产生如下关联规则:Vj→Vi和Vi→Vj,记最小置信度阈值为minconf;
步骤3.2:根据产生的每组关联规则,计算其置信度阈值,提取关联规则的过程如下:对于每一个关联规则Vi→Vj,计算
Figure GDA0002883649050000051
若 conf(Vi→Vj)不小于最小置信度阈值为minconf,则保留关联规则Vi→Vj并记录相应的支持度和置信度ωi
作为优选,所述步骤4包含以下子步骤:
步骤4.1:对于从关联规则中提取的任一组关联参数,记为{V1,V2,…,Vu},其中u表示关联参数的数量,Vu为规则后项即目标参数,对于每一个关联规则 Vi→Vu,i=1,2,…u-1,均有一个置信度,将其记为ωi;对于目标参数Vu,利用小波神经网络,进行异常工况预测;
步骤4.2:构造训练样本:记预设的预测步长为l,由关联规则挖掘提取的一组关联参数为{V1,V2,…,Vu},由其构成的完整训练数据集记为
Figure GDA0002883649050000052
构造以下矩阵Itrain为神经网络的训练输入:
Figure GDA0002883649050000053
其中,Itrain中每一列为一个训练输入样本,构造训练输出Otrain为:
Figure GDA0002883649050000054
步骤4.3:利用构造的训练样本对小波神经网络进行训练:输入参数为Vi, i=1,2,…u-1,输出参数为Vu,其中在网络初始化时,利用由关联规则得到的置信度ωi,i=1,2,…u-1,设置网络输入层和隐含层之间的初始权值;
步骤4.4:新数据预测:记预设的异常工况发生阈值为ωp,对于新采集到的传感器测量数据,使用步骤4.3中训练好的模型进行l步预测,若得到的目标参数预测值相对于初始正常的漂移量超过所设阈值ωp,则认为异常工况发生。
作为优选,在设备未失效之前,随着数据的更新,每更新预定数量的测量数据后,需重新构造并训练模型,以得到更准确的预测结果。
本发明提出的一种基于两阶段频繁项集产生策略的工业数据关联规则挖掘及预测方法,可用于传感器测量的复杂工业***。通过对工业设备运行参数进行关联规则挖掘,获得相应的参数关联性,并将其引入小波神经网络预测中,能够获得更加准确的预测效果。这将给随后的设备维护计划制定提供坚实的支撑,对于对可靠性要求严格的设备维护管理大有裨益,在工程实际应用方面具有广阔前景。
附图说明
图1为实施例中IDV(13)变量7预测结果以及与真实值对比;
图2为实施例中IDV(13)变量11预测结果以及与真实值对比;
图3为实施例中IDV(13)变量7预测误差率;
图4为实施例中IDV(13)变量11预测误差率。
具体实施方式
现结合附图对本发明的具体实施方式作进一步的说明。
下面本例通过田纳西-伊斯曼(TE)过程仿真数据来具体阐述具体操作步骤以及验证方法的效果。
该数据集的采样间隔为3分钟,数据集记录了该采样间隔下各传感器采集到的变量测量值。在每一种运行条件下(正常运行状态以及21种预设故障下的故障运行状态),仿真过程的测量数据都将生成两类数据集,即训练集和测试集。其中,对于训练集的采集过程,是在仿真过程运行25个小时的情况下获得的所有52个变量的测量值,其中,除正常运行状态采集到的训练集外,其余21个训练集数据的采集是在仿真过程运行1小时候引入故障,并只记录随后24个小时的测量数据。也即是说,正常运行状态的训练集有500个观测样本,其余21个故障状态下采集的训练集均为480个观测样本。另外,对于22个测试集,其数据是仿真过程运行48个小时所采集到的所有变量测量值,也就是说,每一个测试集中包含960个样本数据。需要注意的是,在对21种过程故障进行仿真时,相应的故障是在仿真运行8小时后引入的。因此,对于21个故障运行状态下的测试集,其前160个观测样本为正常数据,后800个观察样本为故障数据。在TE过程仿真模型中,只有IDV(13)是一个缓变故障,因此,在本例中,我们使用IDV(13)的相关数据进行实验。工业数据关联规则挖掘及异常工况预测方法的具体过程如下:
步骤1:对时间序列数据分段线性化表示和符号化,构造适用于关联规则挖掘的离散型数据集。本步骤具体包含以下子步骤:
步骤1.1:记传感器测量时间序列为
Figure GDA0002883649050000071
N为传感器数量,k时间序列长度;初始拟合起点为
Figure GDA0002883649050000072
初始拟合终点为
Figure GDA0002883649050000073
记拟合起点为
Figure GDA0002883649050000074
拟合终点为
Figure GDA0002883649050000075
拟合误差阈值为ωE。需要注意的是,在本发明中,i、j作为上标是表示传感器的编号,作为下标是仅表示序数,与传感器编号无关。
步骤1.2:对于每一
Figure GDA0002883649050000076
按如下方法进行分段拟合:
1.2.1初始化分段点计数值count=1;
1.2.2依次对每个拟合起点
Figure GDA0002883649050000077
执行步骤1)-步骤4):
1)首先计算end=start+h;
2)对于数据
Figure GDA0002883649050000078
并利用最小二乘法进行拟合,计算拟合误差ERR;
3)若拟合误差ERR不大于拟合误差阈值ωE,则h=h+1,重新跳转至步骤1);
4)若拟合误差ERR大于拟合误差阈值ωE,获得
Figure GDA0002883649050000079
的线段拟合序列
Figure GDA00028836490500000710
start=start+h,记录分段点
Figure GDA00028836490500000711
重置h=2,count=count +1;
1.2.3循环执行1.2.2直到end大于k结束,得到最小二乘法拟合后的线段化时间序列
Figure GDA00028836490500000712
和分段点
Figure GDA00028836490500000713
组成的分段点序列Pi
步骤1.3:将任一传感器拟合后的时间序列
Figure GDA00028836490500000714
记为Yk={y1,y2,…,yk},其中具有多条前述最小二乘法拟合的线段。提取每条拟合线段的趋势以及数值信息,并采用以下三元组的方式表示一条拟合线段si
Figure GDA0002883649050000081
其中,ki表示该线段的斜率,
Figure GDA0002883649050000082
表示该线段在时间轴上的跨度,ri表示该线段数据的增长率,对于该线段对应的数据{yj,yj+1,…,yj+h},
Figure GDA0002883649050000083
j为该线段的起始点;
对线段化时间序列Yk中的所有线段进行三元组表示,得到三元组序列 Sn={s1,s2,…,sn},其中n表示时间序列Xk分段后的线段数;
步骤1.4:对三元组序列中的线段序列进行聚类并对线段进行符号化,用于表示设备或***不同的变化形式,从而为后续的关联规则挖掘做准备。采用欧氏距离描述线段si和sj的相似度dij
Figure GDA0002883649050000084
其中,dij表示线段si和sj的相似度,dij越小,则表示两条线段有更相似的变化形态,ωk和ωr为权重;
随后根据相似度指标dij,采用K-means聚类算法对Sn进行聚类,并为同一类线段分配一个相同符号以表示运行参数的变化方式,得到符号化的序列 Fn={f1,f2,…,fn},f1,f2,…,fn分别表示第1,2…,n条线段分配到的符号;
步骤1.5:对于每两个传感器的测量时间序列
Figure GDA0002883649050000085
Figure GDA0002883649050000086
合并其分段点序列Pi和 Pj,记为Pij,nij-1为Pi和Pj合并后的分段点个数;并按合并后的分段点分别对其符号化序列
Figure GDA0002883649050000087
Figure GDA0002883649050000088
进行分割重构,得到重构后的符号化序列
Figure GDA0002883649050000089
Figure GDA00028836490500000810
步骤2:采用两阶段的频繁项集挖掘算法生成数据集的频繁项集。本步骤具体包含以下子步骤:
步骤2.1:对于测量时间序列
Figure GDA00028836490500000811
Figure GDA00028836490500000812
分别对应的运行参数Vi和Vj,由步骤1 获得其测量序列的符号化数据为
Figure GDA00028836490500000813
Figure GDA00028836490500000814
由其构成事务集,即每一事务记为
Figure GDA00028836490500000815
Figure GDA00028836490500000816
Figure GDA00028836490500000817
中所包含的线段类别符号分别记为
Figure GDA0002883649050000091
Figure GDA0002883649050000092
记两阶段的最小支持度阈值分别为minsup1和minsup2。在本例中,设置最小支持度阈值为:minsup1=0.2, minsup2=0.2。
步骤2.2:通过单次扫描数据集,计算每一项的支持度,获得频繁1-项集,按如下2.2.1~2.2.3过程进行:
2.2.1:记σ(·)为项或项集的支持度计数,初始为0;设
Figure GDA0002883649050000093
的类别符号为tk,t表示 a或b;
2.2.2:对于每一个事务
Figure GDA0002883649050000094
计算σ(tl)=σ(tl)+1;
2.2.3:对于每一个tl,如果
Figure GDA0002883649050000095
不小于最小支持度阈值minsup1,则认为tk为频繁1-项集,保留tk并记录相应的支持度计数;如果
Figure GDA0002883649050000096
小于最小支持度阈值 minsup1,则认为tk不是频繁1-项集;
步骤2.3:使用步骤2.2中获得的频繁1-项集tk构成2-项集,并计算其支持度,用以发现频繁2-项集,按如下过程进行:
2.3.1:记ap和bq分别为经过步骤2.2从原线段类别符号
Figure GDA0002883649050000097
Figure GDA0002883649050000098
中保留的项;
2.3.2对于每一个{ap,bq},执行以下步骤:
1)对每一个存在于
Figure GDA0002883649050000099
中的{ap,bq},计算σ({ap,bq})=σ({ap,bq})+1
2)如果
Figure GDA00028836490500000910
不小于minsup1,则认为{ap,bq}为频繁2-项集,保留{ap,bq}并记录相应的支持度计数;
步骤2.4:使用步骤2.3中获得的频繁2-项集{ap,bq}计算每两个运行参数在整个数据集中的支持度,并得到参数层面的频繁项集,按如下过程进行:对每两个运行参数Vi和Vj构成的项集{Vi,Vj},计算σ({Vi,Vj})=sum(σ({ap,bq})),若
Figure GDA00028836490500000911
不小于最小支持度阈值minsup2,则保留{Vi,Vj}并记录相应的支持度,并计算σ(Vi)=sum(σ(ap));σ(Vj)=sum(σ(bq))。
步骤3:根据频繁项集生成关联规则,提取满足最小支持度和最小置信度阈值的关联规则。本步骤具体包含以下子步骤:
步骤3.1:对步骤2中获得的满足支持度阈值的每组{Vi,Vj},产生如下关联规则:Vj→Vi和Vi→Vj,记最小置信度阈值为minconf;在本例中,在本例中,设置最小置信度阈值为:minconf=0.7;
步骤3.2:根据产生的每组关联规则,计算其置信度阈值,提取关联规则的过程如下:对于每一个关联规则Vi→Vj,计算
Figure GDA0002883649050000101
若 conf(Vi→Vj)不小于最小置信度阈值为minconf,则保留关联规则Vi→Vj并记录相应的支持度和置信度ωi
本步骤生成满足阈值条件的关联规则,并提取部分关联参数及其置信度值如表1所示。由表1结果可知,本例将使用变量7和变量11作为目标参数进行预测操作。
步骤4:将关联规则挖掘结果引入小波神经网络,并用于工业设备的异常工况预测。本步骤具体包含以下子步骤:
步骤4.1:对于从关联规则中提取的任一组关联参数,记为{V1,V2,…,Vu},其中u表示关联参数的数量,Vu为规则后项即目标参数,对于每一个关联规则 Vi→Vu,i=1,2,…u-1,均有一个置信度,将其记为ωi;对于目标参数Vu,利用小波神经网络,进行异常工况预测;
步骤4.2:构造训练样本:记预设的预测步长为l,,在本例中,预测步长设为10。由关联规则挖掘提取的一组关联参数为{V1,V2,…,Vu},由其构成的完整训练数据集记为
Figure GDA0002883649050000102
构造以下矩阵Itrain为神经网络的训练输入:
Figure GDA0002883649050000103
其中,Itrain中每一列为一个训练输入样本,构造训练输出Otrain为:
Figure GDA0002883649050000104
特别的是,此处的训练集并不仅仅使用IDV(13)相关变量的故障数据,同时也使用相关变量正常运行状态下的数据。
步骤4.3:利用构造的训练样本对小波神经网络进行训练:输入参数为Vi, i=1,2,…u-1,输出参数为Vu,其中在网络初始化时,利用由关联规则得到的置信度ωi,i=1,2,…u-1,设置网络输入层和隐含层之间的初始权值。在本例中,对于变量7,输入层为4个节点,隐含层为8个节点;对于变量11,输入层为3个节点,隐含层为6个节点,两个变量的输出层均为1个节点,其中采用的小波基函数均为Morlet母小波基函数,并以表1中的相关置信度值作为神经网络输入层和隐含层的初始化权值;
步骤4.4:新数据预测:记预设的异常工况发生阈值为ωp,对于新采集到的传感器测量数据,使用步骤4.3中训练好的模型进行l步预测,若得到的目标参数预测值相对于初始正常的漂移量超过所设阈值ωp,则认为异常工况发生。在设备未失效之前,随着数据的更新,每更新预定数量Nl的测量数据后,需重新构造并训练模型,以得到更准确的预测结果,其中Nl根据传感器采样频率和实际工业现场需求而定。本例利用测试集(共960个采样点)的前300个数据来验证预测效果,且根据每10个数据对神经网络进行更新。此处设置异常工况(失效)发生(即参数偏离其正常值一定百分比)的阈值为ωp=0.015。
表1关联规则
规则前项 规则后项 置信度
变量13 变量7 0.7527
变量16 变量7 0.7446
变量36 变量7 0.7017
变量35 变量11 0.7513
变量36 变量11 0.7390
表2总预测误差率
引入关联规则 未引入关联规则
变量7 1.0482 1.8548
变量11 0.8536 1.2135
图1和图2为变量7和变量13预测结果,为验证引入关联规则的优势,本例将预测结果与未引入关联规则的条件下的神经网络预测结果进行了对比。在图 1和图2中,竖实线为在我们的阈值设定下实际的异常工况发生时间,竖虚线和竖点划线分别为引入关联规则和未引入关联规则的前提下异常发生时间的预测值。由图1和图2可知,本发明所提的方法所得到的预测结果可以较好地逼近真实值,尤其在前半部分测试数据的预测中,得到了很好的预测结果,这是由于前半部分为正常状态下的运行数据,其训练集较完备且数值较集中。在失效时间的预测上,本发明所提的方法也得到了较好的预测结果,在图1中,预测值与真实值相比滞后了8个采样点,在图2中,预测值与真实值相比则滞后了5个采样点。与未引入关联规则的预测结果相比,本发明所提方法显然获得了更准确的预测结果。变量7和变量11的预测误差率计算结果如图3和图4所示。同时,为进一步量化结果,本例还计算了总预测误差率,如表2所示。从整体预测误差来看,关联规则的引入明显降低了神经网络的预测误差,这一点在表2所呈现的数据中也得到了很好的体现。

Claims (5)

1.一种工业数据关联规则挖掘及异常工况预测方法,其特征在于,具体步骤如下:
步骤1:对时间序列数据分段线性化表示和符号化,构造适用于关联规则挖掘的离散型数据集;
步骤2:采用两阶段的频繁项集挖掘算法生成数据集的频繁项集;
步骤3:根据频繁项集生成关联规则,提取满足最小支持度和最小置信度阈值的关联规则;
步骤4:将关联规则挖掘结果引入小波神经网络,并用于工业设备的异常工况预测;
所述步骤1包含以下子步骤:
步骤1.1:记传感器测量时间序列为
Figure FDA0002883649040000011
N为传感器数量,k时间序列长度;初始拟合起点为
Figure FDA0002883649040000012
初始拟合终点为
Figure FDA0002883649040000013
h=2;记拟合起点为
Figure FDA0002883649040000014
拟合终点为
Figure FDA0002883649040000015
拟合误差阈值为ωE
步骤1.2:对于每一
Figure FDA0002883649040000016
按如下方法进行分段拟合:
1.2.1初始化分段点计数值count=1;
1.2.2依次对每个拟合起点
Figure FDA0002883649040000017
执行步骤1)-步骤4):
1)首先计算end=start+h;
2)对于数据
Figure FDA0002883649040000018
并利用最小二乘法进行拟合,计算拟合误差ERR;
3)若拟合误差ERR不大于拟合误差阈值ωE,则h=h+1,重新跳转至步骤1);
4)若拟合误差ERR大于拟合误差阈值ωE,获得
Figure FDA0002883649040000019
的线段拟合序列
Figure FDA00028836490400000110
start=start+h,记录分段点
Figure FDA00028836490400000111
重置h=2,count=count+1;
1.2.3循环执行1.2.2直到end大于k结束,得到拟合后的线段化时间序列
Figure FDA0002883649040000021
和分段点
Figure FDA0002883649040000022
组成的分段点序列Pi
步骤1.3:将任一传感器拟合后的时间序列
Figure FDA0002883649040000023
记为Yk={y1,y2,…,yk},提取每条拟合线段的趋势以及数值信息,并采用以下三元组的方式表示一条拟合线段si
Figure FDA0002883649040000024
其中,ki表示该线段的斜率,
Figure FDA0002883649040000025
表示该线段在时间轴上的跨度,ri表示该线段数据的增长率,对于该线段对应的数据{yj,yj+1,…,yj+h},
Figure FDA0002883649040000026
j为该线段的起始点;
对线段化时间序列Yk中的所有线段进行三元组表示,得到三元组序列Sn={s1,s2,…,sn},其中n表示时间序列Xk分段后的线段数;
步骤1.4:对三元组序列中的线段序列进行聚类并对线段进行符号化,用于表示设备或***不同的变化形式,采用欧氏距离描述线段si和sj的相似度dij
Figure FDA0002883649040000027
其中,dij表示线段si和sj的相似度,dij越小,则表示两条线段有更相似的变化形态,ωk和ωr为权重;
随后根据相似度指标dij,采用K-means聚类算法对Sn进行聚类,并为同一类线段分配一个相同符号以表示运行参数的变化方式,得到符号化的序列Fn={f1,f2,…,fn},f1,f2,…,fn分别表示第1,2…,n条线段分配到的符号;
步骤1.5:对于每两个传感器的测量时间序列
Figure FDA0002883649040000028
Figure FDA0002883649040000029
合并其分段点序列Pi和Pj,记为Pij,nij-1为Pi和Pj合并后的分段点个数;并按合并后的分段点对其符号化序列
Figure FDA00028836490400000210
Figure FDA00028836490400000211
进行分割重构,得到重构后的符号化序列
Figure FDA00028836490400000212
Figure FDA00028836490400000213
2.根据权利要求1所述的一种工业数据关联规则挖掘及异常工况预测方法,其特征在于所述步骤2包含以下子步骤:
步骤2.1:对于测量时间序列
Figure FDA00028836490400000214
Figure FDA00028836490400000215
分别对应的运行参数Vi和Vj,由步骤1获得测量时间序列的符号化序列为
Figure FDA0002883649040000031
Figure FDA0002883649040000032
由其构成事务集,即每一事务记为
Figure FDA0002883649040000033
Figure FDA0002883649040000034
Figure FDA0002883649040000035
中所包含的线段类别符号分别记为
Figure FDA0002883649040000036
Figure FDA0002883649040000037
记两阶段的最小支持度阈值分别为minsup1和minsup2
步骤2.2:通过单次扫描数据集,计算每一项的支持度,获得频繁1-项集,按如下2.2.1~2.2.3过程进行:
2.2.1:记σ(·)为项或项集的支持度计数,初始为0;设
Figure FDA0002883649040000038
的类别符号为tk,t表示a或b;
2.2.2:对于每一个事务中的
Figure FDA0002883649040000039
计算σ(tk)=σ(tk)+1;
2.2.3:对于每一个tk,如果
Figure FDA00028836490400000310
不小于最小支持度阈值minsup1,则认为tk为频繁1-项集,保留tk并记录相应的支持度计数;如果
Figure FDA00028836490400000311
小于最小支持度阈值minsup1,则认为tk不是频繁1-项集;
步骤2.3:使用步骤2.2中获得的频繁1-项集tk构成2-项集,并计算其支持度,用以发现频繁2-项集,按如下过程进行:
2.3.1:记ap和bq分别为经过步骤2.2从原线段类别符号
Figure FDA00028836490400000312
Figure FDA00028836490400000313
中保留的项;
2.3.2对于每一个{ap,bq},执行以下步骤:
1)对每一个存在于
Figure FDA00028836490400000314
中的{ap,bq},计算σ({ap,bq})=σ({ap,bq})+1
2)如果
Figure FDA00028836490400000315
不小于minsup1,则认为{ap,bq}为频繁2-项集,保留{ap,bq}并记录相应的支持度计数;
步骤2.4:使用步骤2.3中获得的频繁2-项集{ap,bq}计算每两个运行参数在整个数据集中的支持度,并得到参数层面的频繁项集,按如下过程进行:对每两个运行参数Vi和Vj构成的项集{Vi,Vj},计算σ({Vi,Vj})=sum(σ({ap,bq})),若
Figure FDA00028836490400000316
不小于最小支持度阈值minsup2,则保留{Vi,Vj}并记录相应的支持度,并计算σ(Vi)=sum(σ(ap));σ(Vj)=sum(σ(bq))。
3.根据权利要求2所述的一种工业数据关联规则挖掘及异常工况预测方法,其特征在于所述步骤3包含以下子步骤:
步骤3.1:对步骤2中获得的满足支持度阈值的每组{Vi,Vj},产生如下关联规则:Vj→Vi和Vi→Vj,记最小置信度阈值为minconf;
步骤3.2:根据产生的每组关联规则,计算其置信度阈值,提取关联规则的过程如下:对于每一个关联规则Vi→Vj,计算
Figure FDA0002883649040000041
若conf(Vi→Vj)不小于最小置信度阈值minconf,则保留关联规则Vi→Vj并记录相应的支持度和置信度ωi
4.根据权利要求3所述的一种工业数据关联规则挖掘及异常工况预测方法,其特征在于所述步骤4包含以下子步骤:
步骤4.1:对于从关联规则中提取的任一组关联参数,记为{V1,V2,…,Vu},其中u表示关联参数的数量,Vu为规则后项即目标参数,对于每一个关联规则Vi→Vu,i=1,2,…u-1,均有一个置信度,将其记为ωi;对于目标参数Vu,利用小波神经网络,进行异常工况预测;
步骤4.2:构造训练样本:记预设的预测步长为l,由关联规则挖掘提取的一组关联参数为{V1,V2,…,Vu},由其构成的完整训练数据集记为
Figure FDA0002883649040000042
构造以下矩阵Itrain为神经网络的训练输入:
Figure FDA0002883649040000043
其中,Itrain中每一列为一个训练输入样本,构造训练输出Otrain为:
Figure FDA0002883649040000044
步骤4.3:利用构造的训练样本对小波神经网络进行训练:输入参数为Vi,i=1,2,…u-1,输出参数为Vu,其中在网络初始化时,利用由关联规则得到的置信度ωi,i=1,2,…u-1,设置网络输入层和隐含层之间的初始权值;
步骤4.4:新数据预测:记预设的异常工况发生阈值为ωp,对于新采集到的传感器测量数据,使用步骤4.3中训练好的模型进行l步预测,若得到的目标参数预测值相对于初始正常的漂移量超过所设阈值ωp,则认为异常工况发生。
5.根据权利要求1所述的一种工业数据关联规则挖掘及异常工况预测方法,其特征在于在设备未失效之前,随着数据的更新,每更新预定数量的测量数据后,需重新构造并训练模型,以得到更准确的预测结果。
CN201910244856.6A 2019-03-28 2019-03-28 一种工业数据关联规则挖掘及异常工况预测方法 Active CN110008253B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910244856.6A CN110008253B (zh) 2019-03-28 2019-03-28 一种工业数据关联规则挖掘及异常工况预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910244856.6A CN110008253B (zh) 2019-03-28 2019-03-28 一种工业数据关联规则挖掘及异常工况预测方法

Publications (2)

Publication Number Publication Date
CN110008253A CN110008253A (zh) 2019-07-12
CN110008253B true CN110008253B (zh) 2021-02-23

Family

ID=67168723

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910244856.6A Active CN110008253B (zh) 2019-03-28 2019-03-28 一种工业数据关联规则挖掘及异常工况预测方法

Country Status (1)

Country Link
CN (1) CN110008253B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112130541A (zh) * 2020-10-20 2020-12-25 陕西煤业新型能源科技股份有限公司 一种基于物联网的能源综合管理控制***
CN112380274B (zh) * 2020-11-16 2023-08-22 北京航空航天大学 一种面向控制过程的异常检测方法
CN112800686A (zh) * 2021-03-29 2021-05-14 国网江西省电力有限公司电力科学研究院 一种变压器dga在线监测数据异常模式判定方法
CN112801426B (zh) * 2021-04-06 2021-06-22 浙江浙能技术研究院有限公司 一种基于关联参数挖掘的工业过程故障融合预测方法
CN113032912A (zh) * 2021-04-20 2021-06-25 上海交通大学 基于关联规则的船舶柴油机故障检测方法
CN114936581B (zh) * 2022-06-01 2024-04-26 中国人民解放军63796部队 一种基于时序数据分段的多参数关联挖掘方法
CN115497267A (zh) * 2022-09-06 2022-12-20 江西小手软件技术有限公司 基于时序关联规则的设备预警平台
CN115689071B (zh) * 2023-01-03 2023-05-02 南京工大金泓能源科技有限公司 一种基于关联参数挖掘的设备故障融合预测方法及***
CN116204842B (zh) * 2023-03-10 2023-09-08 广东省建设工程质量安全检测总站有限公司 一种电气设备的异常监测方法及***

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201142630A (en) * 2009-12-21 2011-12-01 Ibm Method for training and using a classification model with association rule models
CN201898519U (zh) * 2010-09-01 2011-07-13 燕山大学 带有风险控制的设备维修预警装置
CN103676645B (zh) * 2013-12-11 2016-08-17 广东电网公司电力科学研究院 一种时间序列数据流中的关联规则的挖掘方法
CN108873859B (zh) * 2018-05-31 2020-07-31 浙江工业大学 基于改进关联规则的桥式抓斗卸船机故障预测模型方法

Also Published As

Publication number Publication date
CN110008253A (zh) 2019-07-12

Similar Documents

Publication Publication Date Title
CN110008253B (zh) 一种工业数据关联规则挖掘及异常工况预测方法
CN110018670B (zh) 一种基于动态关联规则挖掘的工业过程异常工况预测方法
JP7240691B1 (ja) データドライブの能動配電網異常状態検知方法及びシステム
CN110008565B (zh) 基于运行参数关联性分析的工业过程异常工况预测方法
CN111222549B (zh) 一种基于深度神经网络的无人机故障预测方法
CN112418277B (zh) 旋转机械零部件剩余寿命预测方法、***、介质、设备
JP6216242B2 (ja) 異常検知方法およびその装置
CN109298697B (zh) 基于动态基线模型的火电厂***各部件工作状态评估方法
CN102789545B (zh) 基于退化模型匹配的涡轮发动机剩余寿命的预测方法
JP2019527413A (ja) 根本的原因分析を実行してプラントワイド操業での希少イベントの発生の予測モデルを構築するコンピュータシステムおよび方法
CN110414154B (zh) 一种带有双测点的风机部件温度异常检测和报警方法
CN105548764A (zh) 一种电力设备故障诊断方法
CN105607631B (zh) 间歇过程弱故障模型控制限建立方法及弱故障监测方法
CN109917777B (zh) 基于混合多采样率概率主成分分析模型的故障检测方法
CN105574284A (zh) 一种基于趋势特征点的电力设备故障诊断方法
CN112683535B (zh) 基于多阶段维纳过程的轴承寿命预测方法
CN111950627A (zh) 一种多源信息融合方法及其应用
CN116380445B (zh) 基于振动波形的设备状态诊断方法及相关装置
CN111103137A (zh) 基于深度神经网络的风力涡轮机齿轮箱故障诊断方法
CN112731890A (zh) 一种电厂设备故障的检测方法和装置
CN115186762A (zh) 一种基于dtw-knn算法的发动机异常检测方法及***
CN109299201B (zh) 基于两阶段聚类的电厂生产子***异常监测方法及装置
CN114896861A (zh) 基于平方根容积卡尔曼滤波的滚动轴承剩余寿命预测方法
CN110308713A (zh) 一种基于k近邻重构的工业过程故障变量识别方法
JP6915693B2 (ja) システム分析方法、システム分析装置、および、プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant