CN105302848B - 一种设备智能预警***的评估值校准方法 - Google Patents

一种设备智能预警***的评估值校准方法 Download PDF

Info

Publication number
CN105302848B
CN105302848B CN201510105156.0A CN201510105156A CN105302848B CN 105302848 B CN105302848 B CN 105302848B CN 201510105156 A CN201510105156 A CN 201510105156A CN 105302848 B CN105302848 B CN 105302848B
Authority
CN
China
Prior art keywords
measuring point
data
value
assessed value
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510105156.0A
Other languages
English (en)
Other versions
CN105302848A (zh
Inventor
邢宏伟
安佰京
徐扬
张华伟
赵俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Luruan Digital Technology Co Ltd
Original Assignee
Shandong Luneng Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Luneng Software Technology Co Ltd filed Critical Shandong Luneng Software Technology Co Ltd
Priority to CN201510105156.0A priority Critical patent/CN105302848B/zh
Publication of CN105302848A publication Critical patent/CN105302848A/zh
Application granted granted Critical
Publication of CN105302848B publication Critical patent/CN105302848B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明属于设备状态预警技术领域,特别涉及一种基于SVM回归模型的设备智能预警***的评估值校准方法。该设备智能预警***的评估值校准方法,依次通过建立设备智能预警模型、影响关系曲线拟合、异常测点识别和校准受扰的评估值四部分可以实时地消除异常测点对其他正常测点评估值的偏离,具有良好的通用性,可以嫁接到其他回归算法中进行性能优化;在线调整设备受影响测点的评估值的时候,不会产生过多的延时效果,确保了模型对设备实时预警能力;能实时地进行异常测点辨析,判断的实时性得以保证,可以为设备数据进行在线状态解析;能为正常测点稳定输出无干扰的评估值;本发明的预警模型可靠性更高,且生命周期长。

Description

一种设备智能预警***的评估值校准方法
(一)技术领域
本发明属于设备状态预警技术领域,特别涉及一种基于SVM回归模型的设备智能预警***的评估值校准方法。
(二)背景技术
众所周知,重要设备的运行状态对于工厂生产影响巨大,比如电厂机组中的锅炉、发电机等关键设备。设备在正常工况下运行过程中体现出来的功能特征、表象特征以及电气特征与异常状态下的特征是有差异的。设备智能预警是指在设备部件萌发异常的征兆时,提前对设备管理人员发出预警信号,防止异常质变成不可控的故障,保证生产人员的安全,提高设备的使用寿命。
目前,在设备状态预警方面主要有两大类方法:一是采用设备生产厂商根据制造工艺设定各个部件不同预警级别的阈值方法,二是采用非线性多元回归建模的数学挖掘方法拟合出设备各个部分之间的复杂冗余关系,通过分析实际值与评估值之间的差距来进行预警。然后两种方法均有各自的特点与局限性。
对于传统的固定阈值方法,如电厂中建立的DCS***可实时监控关键设备的运行状态,而这些固定阈值多是依据设备生产厂家的要求设定的多级报警阈值。这种传统方法比较保险,却容易忽视了设备运行性能退化的特点,而且不同部件因材质、使用程度、磨损程度会有不同的退化程度,因此这种传统预警方法会在设备使用后期往往产生较多的虚警,大大降低预警效率。
人们于是越来越注重建立非线性回归模型方法的使用,其基本原理在于运用已有的数学建模方法充分挖掘***设备的海量历史数据建立高效实用的模型进行设备实时状态评价,而模型对设备实时状态的评估可信度是设备预警成功与否的根本。然而影响其对设备预警的评价可信度的因素有以下两点:首先,最常见的问题在于不同回归算法中的关键参数,比如说BP神经网络中的隐含层层数l、隐含层节点数n、各层之间的激活函数f类型等参数;还有,支持向量机中的误差惩罚因子、核函数带宽等重要参数因素。这些参数都需要在原方法嵌入参数寻优策略基础上进行优化以减少对设备实时值评估的偏差。
除此之外近期发现这种建立非线性回归模型方法的又一不足之处,由于非线性建模时会将设备每个部件之间建立起密切的函数映射关系,以至于当设备中的某个部件发生病变时,其他部件的评估值会产生不同程度的偏离,难以真实展现当前设备该部件的运行状态,同时带来一定的虚警,降低了这类智能预警方法的使用价值。对于这种问题,目前在非线性建模预警算法中对于这种正常部件评估值受影响的问题或者是被忽略或者是从现象上判断却没有成型的校准算法进行弥补这种缺陷问题,缺少对评估值受影响问题产生机理的透彻研究。
比如说,论文《SVM回归估计方法在卫星故障诊断中的应用》(电机与控制学报,2008年第12卷第4期)中使用支持向量机回归方法实现对卫星姿势的状态监控与故障诊断,在对支持向量机算法优化方面采用Lancastrian的半正定规划方法进行核优化已达到减小泛化误差的目的。在实现多输出方面采用单独为每个输出参数构建回归模型的方法。同时使用分割训练数据提取支持向量的方法进行训练数据压缩,目的是减少训练模型时间。但是这篇文章对正常测点评估值受影响缺陷问题只是进行了现象性的阐述,并没有解释现象产生机理与相应解决方法,只是表象上讲述如何分辨真正发生故障的卫星部件。
目前提高非线性建模算法预警性能的主流方法是使用各类参数寻优策略在数值上优化,获取最佳的回归评估效果以提高设备预警性能。例如在论文《基于ARMA误差修正和自适应粒子群优化的SVM短期负荷预测》(电力***保护和控制2011年14期)对支持向量机回归模型的优化局限是蚁群算法、粒子群算法只能对核函数带宽、误差惩罚因子两参数进行全局寻优;还有国家专利《一种基于SVM的粮情预测预警方法及***》(申请号201410068731.X)均提到用经预处理的历史健康多参数样本数据建立支持向量机回归预测模型,实现对粮情安全等级参数的实时评估,但是对支持向量机进行关键参数寻优也只能一定限度地调整回归评估值,无法在根本上改变测点之间的冗余关系,一个或多个测点异常依旧会影响到其他测点的评估值,以致降低设备预警***的精确性和有效性。由于异常测点通过扰乱正常测点的复杂非线性映射关系来影响其正常测点的评估,所以寻优策略无法从本质上消除异常测点带来干扰影响的现象。
针对以上现象,亟需有新的评估值校准技术修复被异常测点干扰的函数映射关系,对设备智能预警算法的评估性能进行有效补偿,实现对设备正常状态数据的有效拟合及异常状态数据的凸显,这样才可能最大幅度提高设备智能预警算法在在线实时评估方面的精确性。
(三)发明内容
本发明为了弥补现有技术的不足,提供了一种设备智能预警***的评估值校准方法, 弥补了当前各种回归算法中在设备状态评估预警中精确性不高的现状,旨在使用插值补偿法消除异常测点对正常测点评估值的偏离,使设备正常测点的评估值校准到符合其实际状态的水平,从而实现了回归算法的性能优化;为支持向量机等回归算法在设备状态评估预警精度方面给予了强大的保证,从历史设备数据挖掘出所有影响情形下异常测点与正常测点的非线性影响关系,并使用插值方法实时在线地为当前实时数据修正有偏差的评估值;可以应用在线评估设备状态方面,且能有效减少因测点相互影响产生的虚警,同时通用性强,同样可以为其他回归算法进行性能优化。
本发明是通过如下技术方案实现的:
一种设备智能预警***的评估值校准方法,其特征是:由以下部分组成:
第一部分:建立设备智能预警模型,包括以下步骤:
1.1、导入相应设备训练数据,训练数据为一定时间的单设备或复合设备的多测点正常历史健康数据;
1.2、数据预处理;
1.3、训练数据压缩,采用无参数压缩方式从训练数据选取包含所有设备正常运行状态的定量数据;
1.4、构建多输入多输出的预警模型,n个测点依次作为输出构建n个对应的SVM回归模型;
第二部分:影响关系曲线拟合,包括以下步骤:
2.1、确定影响类型和异常测点的数目;
2.2、选取适合的影响关系曲线;
2.3、计算曲线的拟合度;
2.4、获取曲线参数,保存到参数数据库中备用;
第三部分:异常测点识别,包括以下步骤:
3.1、实时数据在回归评估之后,使用健康残差上下限指标检测,将未受影响测点筛选出来
3.2、实时数据在回归评估之后,使用健康数据上下限指标检测,将超限的异常测点筛选出来;
3.3、实时数据在回归评估之后,使用波动特性指标检测,将异常程度较低的测点筛选出来;
3.4、实时数据在回归评估之后,使用极限值逼近度指标检测,将异常微弱的测点从中选出来;
第四部分:校准受扰测点的评估值,包括以下步骤:
4.1、每个正常测点根据影响类型调用相应的影响曲线;
4.2、计算异常测点的突变程度;
4.3、根据影响曲线计算每个正常测点评估值的偏离程度;
4.4、使用插值法依次校准每个正常测点的评估值。
优选的,在步骤(1.2)中,对训练数据中的Nan数据采取擦除或填充处理手段后,进行归一化操作。
优选的,在步骤(2.2)中,选取的影响关系曲线均为不同坡度的S型曲线。
优选的,在步骤(4.2)中,计算异常测点跟本测点未发生异常之前的情况进行对比。
本发明的有益效果是:
(1)、可以实时地消除异常测点对其他正常测点评估值的偏离,经过回归补偿法校准的评估值更能体现设备正常测点的实际运行水平,且不会改变异常测点的评估值,可以极大地提高支持向量机算法在回归评估方面的精确性,同时具有良好的通用性,可以嫁接到其他回归算法中进行性能优化;
(2)、使用多重回归的方式从历史健康数据中挖掘出设备的异常测点与正常测点之间的非线性影响关系,由于非线性影响关系具有在建模过程中提前提炼出各个测点的受影响水平趋势的优点,因此在线调整设备受影响测点的评估值的时候,不会产生过多的延时效果,确保了模型对设备实时预警能力;
(3)、能实时地进行异常测点识别,虽然具有多重的辨析条件,但是判断条件多是轻巧简洁且精确适用的逻辑判断,没有涉及复杂耗时的运算,判断的实时性得以保证,可以为设备数据进行在线状态解析;
(4)、使用插值法进行受影响测点的评估值修正,且插值法有多种方式可根据效果灵活进行选择,且本发明的核心支持向量机回归模型性能稳定,既可固定又可根据需要进行更新,配合插值法能为正常测点稳定输出无干扰的评估值;
(5)、使用的历史数据的数据规模不受限制,用获取的设备历史数据中挖掘出各个测点之间的冗余关系来构建预警模型,同时基于数据驱动来运行预警模型,完全基于数据的特性使本发明不受专家经验知识以及物理结构的限制,因此本发明的预警模型可靠性更高,且生命周期长。
(四)附图说明
下面结合附图对本发明作进一步的说明。
附图1为本发明的流程图;
附图2为本发明的异常测点识别部分的条件判断流程图;
附图3为本发明的运用插值补偿法校准评估值的运行流程图;
附图4为本发明的正常测点与异常测点影响曲线示意图;
附图5为本发明的不同S型函数与影响曲线拟合示意图;
附图6为本实施例二中异常测点应用本发明前后的设备预警情形对比图;
附图7为本实施例二中正常测点应用本发明前后的设备预警情形对比图。
(五)具体实施方式
附图为本发明的一种具体实施例。
实施例1
一种基于SVM的设备智能预警***的评估值校准方法,如附图1所示,本发明整个设计包括以下几个过程:
过程1为设备建立设备智能预警模型,本过程主要包括四个主要步骤。
步骤1.1 训练数据导入
现所选的训练数据为一单设备的多测点历史健康数据,大致操作过程为:以选定的测点为准从电厂数据库中读取该相关设备足够时间的历史运行状态数据;然后利用设定的筛选规则从所有的历史数据中筛选出运行状态良好的健康设备数据作为构建支持向量机回归模型的训练数据。
训练数据的筛选规则是为了将全部的历史数据剔除异常数据而获取健康运行数据,在趋势图中如果数据趋势中出现数值超限、波动剧烈、无波动等现象,则本段数据会被视作异常数据应当剔除,筛选过后剩余的数据即可作为建模的训练数据。
假若从一个具有n个观察测点的设备数据库截取m个时刻的设备数据作为训练数据,则在j时刻的各个观察测点数据可看作一个n维的向量,可表示为:
则该训练数据文件应当为m×n的矩阵形式。具体形式如下:
步骤1.2 数据预处理
主要是对Nan数据进行填充处理,处理后再进行标准化处理。
由于网络或者软件等原因获取的原始训练数据不可避免会存在一些无效的空数据即Nan(Not a number)数据,如果不处理的话,含有Nan数据的时刻将无法训练支持向量机回归模型。对于此种情况,本发明采用最近邻数据插值填充的方式来求取新数据弥补Nan数据的位置。所采用的公式为:
(1)
其中,Valueboundary1、Valueboundary2为前后边界数据,Timeboundary1 、Timeboundary12为前后边界时间,Valuenan、Timenan为Nan数据及其时间。
为了消除各个测点之间不同量纲造成的回归评估结果不准确的影响,训练数据处理Nan数据之后还需要进行标准化处理的操作,经标准化处理的训练数据各个测点数据均符合均值为0方差为1的正态分布。标准化处理的过程将按照以下公式进行:
(2)
其中,dataValue为训练数据,meanValue为训练数据均值,stdValue为训练数据标准差。
步骤1.3 训练数据压缩
为了节省支持向量机建模时间以及防止模型训练过度而出现过拟合,本发明采用一种无参数的训练数据压缩方式来达到以上目的。原始训练数据所包含的数据状态很多,但是周期性的数据或者相邻的数据状态很相似甚至是重复,完全可以用其中一条数据代替所有与其状态相近的数据。
本发明按以下方式进行数据压缩,首先人为主观确定压缩数据所包含的状态个数d,然后将各个观察测点下的极值状态提取出来,共包括d1个;若极值状态数d1仍然小于要求的d,便将m个时刻的训练数据求欧几里得范数,获得一个m维的向量,再将m维的向量重新升序排列,按照一定的步长L从m维向量中等距抽取一定数据的状态d2;合并d1、d2便可获得压缩数据R。步长L的确定是由m与d相除取整获得的,而压缩数据R将包含训练数据中所有的健康运行状态,它可以代替训练数据用来构建支持向量机回归模型,以达到节省时间与防止过拟合的目的。
步骤1.4 构建多输入多输出的SVM回归模型
SVM回归原理是将多个测点参数映射到高维的特征空间中,然后以目标参数为输出来构造强凸问题,通过捕捉的特征空间边界向量(即支持向量机)不断调整函数***去逼近一个可以解决上述问题同时又包含输入参数与输出参数复杂非线性映射关系的完整函数表达式。因此普通的SVM回归模型只可能是多输入单输出的模式。为实现多测点参数的输出,本发明将以所有测点参数均作为输入参数的同时这些测点参数依次作为输出目标参数的方式来构建一系列的多输入多输出SVM回归模型。
由于本发明用到建模数据是上步骤得到m×n的矩阵形式的压缩数据,最终的SVM回归模型会是n组均为n-1形式的多SVM回归模型。下面以构建一个单SVM回归模型进行建模原理说明。
为将输入参数与输出参数之间的非线性映射关系表示出来,按照一般的SVM建模原理,通过引入核函数将非线性问题转化为二次规划问题,其目标函数为,为提高SVM的泛化性能,特引入松弛变量、误差惩罚因子C以及判断函数,从而求取最大间距超平面优化问题转化为二次规划问题,如下所示:
(3)
为解决上述优化问题,需引入拉格朗日因子转化问题为对偶问题,如下所示:
(4)
解上述的对偶问题,得到最优化的拉格朗日因子,其中,l为支持向量机的个数,将拉格朗日因子、支持向量机l、松弛变量、误差惩罚因子C等重要参数保存到SVM模型中,从而将回归问题得以解决。
n个SVM回归模型的构建均按照上述方式进行构建完成后,便可以对每条测试数据向量的所有测点参数拟合出一个相对于历史数据中的评估值向量。
过程2为影响关系曲线拟合过程,此过程也属于模型建立部分,主要包括以下四个主要步骤。
步骤2.1,确定影响类型
本发明需要考虑所有异常测点组合影响其他正常测点的方式,影响类型的决定因素有异常源数目x(即异常测点的多少)以及正常测点的偏离程度e大小。则对于一个拥有n个测点的数据,则应当有
(5)个影响类型需要进行影响关系的挖掘。
假设每条训练数据为一个n维向量,则异常源数目大小范围在之内,而正常测点的偏离程度e的大小应该在之内,如附图4中所示某测点的极限偏离程度f是指在回归算法中随着异常测点的突变程度的逐渐增加,正常测点参数的评估值会沿着特定的轨迹逐渐逼近的极限值,其f值大小因训练数据中该正常测点的数值量纲不同而不同。下面以测点为例,对其f值的求取进行一下说明:
首先提取测点i的原始训练数据S数据的极值
然后再将两极值的间距均分成100等分间距,并依次统计训练数据s中落在每个等分间距内的频数yi和均值
最后按照以下的公式便可求得极限值f:
(6)
步骤2.2,选取适合的匹配曲线,影响关系曲线为多参数的S型曲线;
本步骤主要是寻找适合用来表达附图4曲线的函数,求取此类函数来代替不同异常测点组合对各个正常测点的影响非线性关系。
附图4中曲线类似于动物种群增长、细胞生长繁殖等模式,查阅相关资料文献可以用来表达类似曲线关系的有函数、函数以及函数,它们的数学表达式如下所示:
1、 (7)
其中重要相关系数为:A1为初始值,A2为极限值,x0为曲线横坐标中心,p为坡度;
2、 (8)
其中重要相关系数为:y0为补偿值,A1为振幅度1,A2为振幅度2,t1为带宽1,t2为带宽2;
3、 (9)
其中重要相关系数为:A1为初始值,A2为极限值,x0为曲线横坐标中心,dx为坡度;
每一种影响类型均可需按照以上三种函数进行关系曲线的拟合,设定拟合指标调整每种函数的相关系数使其能准确表达异常测点影响正常测点评估值的方式。
步骤2.3,计算曲线的拟合度,即衡量曲线预测值与实时值的偏差程度;
本步骤用于选取最能代表特定情形下测点影响关系曲线的函数表达式,并求解出具有最佳拟合度的函数相关系数。
首先,人为主观地规定要研究的目标测点的方式以及影响其评估值的异常源规模和程度。以原始训练数据测点i的63数值、测点j作为人造的异常源为例,将异常测点的异常程度从原先的正常水平2倍以0.01的步长逐步增长到10倍,并记录测点i的评估值偏离程度于下表1中,以异常程度e为横轴,正常测点评估值偏离程度f为纵轴作出如附图4的趋势图。
然后,对以步骤2.3中三种S型曲线函数的为基准函数中的相关系数进行调整,且以曲线拟合度指标R2进行评价代表测点影响关系曲线的性能,R2越大表示选择的函数拟合性能越佳,如附图5所示函数的R2值大于其他两个函数的R2值,应当选定函数,每种情形选择出最佳的基准函数与相关系数。下面为评价函数曲线拟合度指标公式:
(10)
其中,yi为上表中的正常偏离程度,为上表中的正常偏离程度的均值, 为选定函数的预测值,n为异常测点的异常程度改变次数。
步骤2.4,将曲线参数保存到参数数据库中备用;
此步骤中需要上步骤求取的所有影响类型的拟合曲线的基准函数与相关系数存储到指定的参数数据库中,作为回归模型的一部分。
本发明实行三层节点存储规则,保证校准评估值的时效性。
1、以异常测点的影响类型l3作为第三层的存储节点,l3为步骤2.1中确定的影响类型
(11)
2、以受影响的正常测点l1为第一层的存储节点,因为进行评估值校准时是按受影响测点的序号依次插值法补偿的;
3、以受影响的正常测点的数值l2为第二层的存储节点,l2是按以下方式确定:
(12)
其中,Smax为训练数据该正常测点的最大值,Smin为训练数据该正常测点的最小值,n为细分的程度,一般定义为10,i为序号;
存储的内容为步骤2.2中的基准函数和步骤2.3中调整好的相关系数。
过程3为异常测点识别过程,本过程属于模型运行范畴,主要包括四个主要步骤。
本过程先在介绍模型运行的基础上进行详细的阐述。
输入到n个SVM回归模型的每条实时数据的测点数目必须与训练数据R相同,而且需要进行在训练数据的标准下进行标准化处理,以消除量纲影响。将一条n维实时数据V并行输入对应的n个SVM回归模型中进行评估,就会得到相应的一条n维的评估向量。通过附图2可以看出本过程将以相应的四步骤来对的数值准确性进行四个指标的评价,合格的话值不再改正,不合格的话值需要在过程四中进行校准。
步骤3.1,实时数据在回归评估之后,使用健康残差上下限指标检测,可将未受影响测点以及疑似异常测点分别筛选出来;
此步骤首先说明一下,残差的定义为实时值与评估值的差值,而健康残差上下限标准的获取完成在SVM模型训练完成之后,将原始训练数据依次输入SVM模型中全部进行回归评估并求取残差值,则每个测点的残差的最值可作为健康残差上下限T。
当前的实时数据进行评估之后的残差,若,则该测点属于未受影响测点,若,则该测点属于疑似异常测点,需要转入下步骤进行更具体的检测。
步骤3.2,实时数据在回归评估之后,使用健康数据上下限指标检测,可将超限的异常测点筛选出来;
此步骤首先说明以下,本步骤只检测上步骤的疑似异常测点的实时数据。健康数据上下限标准的获取完成在SVM模型训练完成之后,将原始训练数据每个测点的最值可作为健康数据上下限D。
对实时数据的疑似异常测点数值使用健康数据上下限D进行检测,检测的方式为:
,则该测点仍为疑似异常测点,需要进行下步骤的检测;
,则该测点确定为异常测点。
步骤3.3,实时数据在回归评估之后,使用波动特性指标检测,可将异常程度较低的测点筛选出来;
此步骤首先说明一下,本步骤只检测上步骤的疑似异常测点的实时数据与相应的评估值。波动特性使用变异系数特征CV来表示,其具体的表达式如下:
(13)
在这里,stdValue表示大小为5的时间窗内的方差,stdValue表示大小为5的时间窗内的均值,本步骤的检测方式如下:
首先,分别截取以本时刻为终点的大小为5的时间窗的实时数据组与评估数据组;
然后,分别实时数据组与评估数据组的变异系数特征CV;
最后,依次将上步骤进行比较,若的话,该测点确定为异常测点,若的话,该测点仍为疑似异常测点需要进行下一步的检测。
步骤3.4,实时数据在回归评估之后,使用极限值逼近度指标检测,可将异常初期的测点从中选出来;
此步骤首先说明一下,本步骤只检测上步骤的疑似异常测点的实时数据与相应的评估值。测点极限值f在步骤2.1中有介绍,它的获取也是完成在SVM模型训练完成之后,下面介绍如何进行检测:
首先,分别截取以本时刻为终点的大小为5的时间窗的实时数据组与评估数据组;
然后,分别依次计算各疑似异常测点的实时值与极限值的差值、评估值与极限值的差值
最后,计算的均值,若的话,该测点判定为异常测点;若的话,该测点最终判定为正常测点。
以上四个步骤完成之后,会将实时数据的所有测点划分为正常测点与异常测点两类。
过程4为调整受干扰的评估值过程,本过程依旧属于模型运行范畴,将按照附图3以时刻ti为例介绍整个过程的四个主要步骤。
步骤4.1,每个正常测点可根据影响类型调用相应的影响曲线;
此步骤是当前时刻ti根据在过程3中辨析出来的n个异常测点组,为每个正常测点从过程2中保存好的参数数据库调用影响关系曲线的类型,假若,应当选择坡度比较大的影响关系曲线的类型。相同时刻下由于具有共同的异常测点组p,故而此时的每个正常测点影响类型属于同一类别;不同时刻因为异常测点组p会发生改变,故而不同时刻的正常测点影响类型属于不同类别。
本步骤的细节过程为:
首先,确定当前时刻的异常测点组
然后,根据异常测点组p,每个正常测点从参数数据库确定影响关系曲线类型ci
步骤4.2,计算每个异常测点的突变程度,主要与该测点未发生异常之前的情况进行对比;
根据异常测点组p,依次确定每个异常测点pi的突变程度L,以下介绍如何计算突变程度L:
首先,以异常测点PI为例,从当前时刻ti开始,往后查询异常测点pi的历史数据中,距离当前时刻ti最近的未报警正常时刻t
然后,为异常测点pi计算突变程度LI,p为未报警正常时刻t的实时数值,则:,依次将所有异常测点组的测点突变程度L。
步骤4.3,根据影响曲线计算每个正常测点的评估值偏离程度范围;
此步骤用于为每个正常测点锁定一个评估值偏离程度范围。由于在过程2中无法将每个测点的所有正常范围内的实时数值的影响关系曲线全部确定出来,只能在全部范围内间隔求取影响关系曲线。本步骤所做的是确定当前时刻ti的正常测点实时数值属于中哪两个间隔点之间,再利用对应的影响关系曲线锁定评估值偏离度范围。
现以受影响的正常测点pi为例,介绍如何确定评估值偏离度范围。
首先,根据正常测点的pi实时数值,确定其在中的左右临近间隔点
然后,根据影响关系曲线类型ci以及异常测点组p,确定对应的两个影响关系曲线
最后,根据异常测点组的测点突变程度L,带入中可得受影响的正常测点pi的评估值偏离度范围yi、yj
步骤4.4,根据上述步骤使用插值法对正常测点的评估值进行调整;
本步骤主要介绍如何采用插值法将受影响的正常测点评估值调整到相应的正常水平。
以下为插值法精确计算每个正常测点的评估值偏离程度yx,计算公式为:
(14)
调整后正常测点pi的评估值调整公式为:(15)。
当前时刻ti所有正常测点组的评估值均调整完成后与不需调整的异常测点组的评估值组合成一条新的评估值,且更能体现当前时刻ti所有测点的状态水平。
实施例2
为了进一步说明本发明的实施过程,本发明选取来自某火电厂的1号机组锅炉辅机中的A一次风机设备的重要测点数据,以验证本发明对设备状态预警的有益补助。
本发明对A一次风机的基于支持向量机的评估值校准方法主要步骤如下:
一、利用A一次风机的历史健康数据构建多输入多输出的智能预警模型过程
首先,选定要参与构建SVM回归模型的重要参数测点,并从电厂数据库中提取时间足够长的数据,按照筛选规则获取训练数据。
本实例选取A一次风机的测点有机组实发功率(MW)、总一次风量(t/h)、A一次风机出口压力(Kpa)、A一次风机电流(A)、A一次风机轴承X向振动(nm/s)等10个与该设备运行状态密切相关的参数测点。
本实例选取的原始历史数据的时间是从2013年6月到2013年12月约半年的时间段,共计有220000条数据。我们将数据的前4个月的数据用于构建设备预警模型,而后2个月的数据用于检测预警模型的预警效果。
对于4个月的建模数据,我们需要利用已有的筛选规则来依次剔除每个测点数据中的异常数据,因为该部分数据不代表A一次风机设备的正常运行状态。剩余的数据便可作为构建SVM回归模型的训练数据T。
训练数据T的数据预处理。提取之前需要对训练数据T进行数据预处理,利用式(1)对训练数据T的出现Nan数据的位置完成空数据填充处理;利用式(2)对训练数据T进行标准化处理以消除量纲影响;
训练数据T提取压缩数据R。按照步骤1.2所讲述的方式,人为地确定压缩数据R的数据量2000,先选取每个测点的极值状态数据,后利用范数规则以一定步长抽取一定数量的普通状态数据,极值状态数据与普通状态数据合并即可获取数量约为2000的压缩数据R,压缩数据R便包含了训练数据几乎所有的数据状态。
然后,按照SVM回归原理使用压缩数据R训练10个SVM回归模型。一个SVM为多输入单输出的形式,这里用A一次风机的10个测点均作为输入,10个测点依次作为输出的方式来实现多输出的功能。模型的训练过程是按式(3)、式(4)实现拉格朗日因子、支持向量机l、松弛变量、误差惩罚因子C等重要参数信息存储到SVM回归模型中。
二、为A一次风机设备数据建立影响关系曲线参数数据库M
为了节省模型运行时间,本发明将本过程在模型构建过程中完成。影响关系曲线体现的是异常测点的突变程度与正常测点的评估值偏离度的关系。由于研究的A一次风机设备拥有10个关键测点,故而按式(5)应有种影响关系曲线需要计算参数。
以测点1为受影响的正常测点,测点2为异常测点的情形为例,介绍如何计算影响关系曲线的相关参数。
首先确定测点1的训练数据R的最值为50与150后,通过式(6)加权平均获得评估极限值f为110.7;
然后测点1以最小值50为初始值,测点2突变程度可从任意正常数值开始,以初始值0.01倍的步长逐步突变,并记录下对应的畸变评估值,建立如表1形式的表格。
依次调用三种不同的S型函数函数、函数以及函数对上述表格蕴含的关系进行拟合,并用拟合指标R2来考察曲线的拟合度,选择R2最佳的一组参数值保存到参数数据库M中。
数值为50的测点1获取最佳函数参数后,以步长为10的增大度间隔取值,每获取一参数均需进行保存,以保证参数数据库M的完整性。
所有的种影响关系曲线的参数均按照上述方式计算,并保存到参数数据库M中。
三、设备预警模型运行以及异常测点识别过程
在运行预警模型之前,为保证实施异常测点辨析的顺利进行,我们需要提前完成以下几个工作:
首先,从A一次风机的10个测点的历史健康数据中提取健康数据上下限D,即每个测点历史健康数据的最值。
然后,我们还需要求取A一次风机的所有测点健康残差上下限T,历史健康数据依次全部放入到预警模型中进行回归评估,实时值与评估值作差获得残差数据,每个测点残差数据的最值即作为该测点的健康残差上下限T。
令测试数据可作为设备的实时数据,每条实时数据的所有测点数据作为输入,并行进入n个SVM回归模型中即可获取n个对应的评估值。
我们以A一次风机的实时数据Vi为例,来说明异常测点的识别过程。
实时数据Vi在SVM回归模型中评估得到评估数据后,先后使用四个指标进行异常测点的辨析,第一个指标为健康残差上下限T,处于残差范围之外的测点数据将被判作疑似异常测点数据,继续下个指标的判定。第二个指标为健康数据上下限D,处于数据范围之外的测点将被判作异常测点,其他的判作疑似异常测点数据,继续下个指标的判定。第三个指标为波动性检测,按照式(13)求取CV特征后,比较CV与CV的大小,若CV>CV,则判作异常测点数据,否则判作疑似异常测点数据继续下个指标的判定。第四个指标为极限值逼近度指标,按照步骤3.4的判定规则,满足条件的为异常测点数据。经过以上的层层筛选,实时数据Vi的所有测点被分作两类:异常测点(测点3、5、7)与正常测点(测点1,2,4,6,8,9,10)。
四、校准A一次风机受干扰正常测点的评估值过程
本过程是在过程三的基础上进行的,依旧以时刻ti的A一次风机设备测试数据Vi为例,过程三将Vt的测点分成异常测点与正常测点,这里我们校准的是正常测点的评估值数据
在过程三辨析出来的异常测点决定了正常测点的影响类型,以校准测点1的评估值为例
从一次风机参数数据库M中调用正常测点为1且异常测点为3、5、7的影响关系曲线参数。
按照步骤4.2的计算规则可得测点3、5、7的各自的突变程度L为以及测点1实时值8.53的范围为之间。按照步骤4.3的计算规则,依据影响关系曲线可算得与初始值的对应的评估值偏离度为。最后调用插值法算法在实时值为8.53的情形下的评估值偏离度为2.67,而实际的评估值为11.1,校准后的评估值为8.43。
时刻ti的A一次风机设备测试数据Vi所有正常测点数据均按照上述方式进行校准后得到的新评估值,其他时刻实时数据的评估值按照相同方式获取对应的校准评估值。如附图5所示,图6展示的是异常测点3校准前后对比情况,而图7展示的是受影响的正常测点1校准前后对比情况,可以看出在时刻1300~1900之间,发生异常的为测点3,校准之前受影响的正常测点1的评估值发生偏离,而校准后测点1的评估值实现完好的校准,数值大小更能体现设备该测点的运行状况水平。

Claims (7)

1.一种设备智能预警***的评估值校准方法,其特征是:由以下部分组成:
第一部分:建立设备智能预警模型,包括以下步骤:
1.1、导入相应设备训练数据,训练数据为一定时间的单设备或复合设备的多测点正常历史健康数据;
1.2、数据预处理:对Nan数据进行填充处理,处理后再进行标准化处理;采用最近邻数据插值填充的方式来求取新数据弥补Nan数据的位置,所采用的公式为:
其中,Valueboundary1、Valueboundary2为前后边界数据,Timeboundary1、Timeboundary2为前后边界时间,Valuenan、Timenan为Nan数据及其时间;训练数据处理Nan数据之后还需要进行标准化处理的操作,经标准化处理的训练数据各个测点数据均符合均值为0方差为1的正态分布,标准化处理的过程将按照以下公式进行:
其中,dataValue为训练数据,meanValue为训练数据均值,stdValue为训练数据标准差;
1.3、训练数据压缩,采用无参数压缩方式从训练数据选取包含所有设备正常运行状态的定量数据;
1.4、构建多输入多输出的预警模型,n个测点依次作为输出构建n个对应的SVM回归模型;
第二部分:影响关系曲线拟合,包括以下步骤:
2.1、确定影响类型和异常测点的数目;
2.2、选取影响关系曲线;
2.3、计算曲线的拟合度;
2.4、获取曲线参数,保存到参数数据库中备用;
第三部分:异常测点识别,包括以下步骤:
3.1、实时数据在回归评估之后,使用健康残差上下限标准检测,将未受影响测点筛选出来;
3.2、实时数据在回归评估之后,使用健康数据上下限标准检测,将超限的异常测点筛选出来;
3.3、实时数据在回归评估之后,使用波动特性指标检测,将异常程度较低的测点筛选出来:检测上步骤的疑似异常测点的实时数据与相应的评估值,波动特性使用变异系数特征CV来表示,其具体的表达式如下:
在这里,stdValue表示大小为5的时间窗内的方差,meanValue表示大小为5的时间窗内的均值,本步骤的检测方式如下:
首先,分别截取以本时刻为终点的大小为5的时间窗的实时数据组与评估数据组;
然后,分别实时数据组与评估数据组的变异系数特征CV;
最后,依次将上步骤进行比较,若CV>CV的话,该测点确定为异常测点,若CV≤CV的话,该测点仍为疑似异常测点需要进行下一步的检测;
3.4、实时数据在回归评估之后,使用极限值逼近度指标,将异常微弱的测点从中选出来:检测上步骤的疑似异常测点的实时数据与相应的评估值,首先,分别截取以本时刻为终点的大小为5的时间窗的实时数据组与评估数据组;
然后,分别依次计算各疑似异常测点的实时值与极限值的差值σ、评估值与极限值的差值σ
最后,计算σ与σ的均值,若的话,该测点判定为异常测点;若的话,该测点最终判定为正常测点;
第四部分:校准受扰测点的评估值,包括以下步骤:
4.1、每个正常测点根据影响类型调用相应的影响曲线;
4.2、计算异常测点的突变程度;
4.3、根据影响曲线计算每个正常测点评估值的偏离程度;
4.4、使用插值法依次校准每个正常测点的评估值。
2.根据权利要求1所述的一种设备智能预警***的评估值校准方法,其特征是:在步骤(1.2)中,对训练数据中的Nan数据采取擦除或填充处理手段后,进行归一化操作。
3.根据权利要求1所述的一种设备智能预警***的评估值校准方法,其特征是:在步骤(2.2)中,选取的影响关系曲线均为不同坡度的S型曲线。
4.根据权利要求1所述的一种设备智能预警***的评估值校准方法,其特征是:在步骤(4.2)中,计算异常测点跟本测点未发生异常之前的情况进行对比。
5.根据权利要求1所述的一种设备智能预警***的评估值校准方法,其特征是:在步骤(1.3)中,确定压缩数据所包含的状态个数d,然后将各个观察测点下的极值状态提取出来,共包括d1个;若极值状态数d1仍然小于要求的d,便将m个时刻的训练数据求欧几里得范数,获得一个m维的向量,再将m维的向量重新升序排列,按照一定的步长L从m维向量中等距抽取一定数据的状态d2;合并d1、d2便可获得压缩数据R。
6.根据权利要求5所述的一种设备智能预警***的评估值校准方法,其特征是:步长L的确定是由m与d2相除取整获得的,压缩数据R包含训练数据中所有的健康运行状态。
7.根据权利要求1所述的一种设备智能预警***的评估值校准方法,其特征是:在步骤(4.3)中,首先,根据正常测点的实时数值,确定其左右临近间隔点;然后,根据影响关系曲线类型以及异常测点组,确定对应的两个影响关系曲线;最后,根据异常测点组的测点突变程度,带入两个影响关系曲线中可得受影响的正常测点的评估值偏离度范围。
CN201510105156.0A 2014-10-11 2015-03-10 一种设备智能预警***的评估值校准方法 Active CN105302848B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510105156.0A CN105302848B (zh) 2014-10-11 2015-03-10 一种设备智能预警***的评估值校准方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201410532898 2014-10-11
CN2014105328987 2014-10-11
CN201510105156.0A CN105302848B (zh) 2014-10-11 2015-03-10 一种设备智能预警***的评估值校准方法

Publications (2)

Publication Number Publication Date
CN105302848A CN105302848A (zh) 2016-02-03
CN105302848B true CN105302848B (zh) 2018-11-13

Family

ID=55200121

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510105156.0A Active CN105302848B (zh) 2014-10-11 2015-03-10 一种设备智能预警***的评估值校准方法

Country Status (1)

Country Link
CN (1) CN105302848B (zh)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106127359A (zh) * 2016-08-30 2016-11-16 北京协同创新智能电网技术有限公司 一种基于局部加权线性回归模型的变频水泵出口流量预警方法
CN107067143A (zh) * 2016-12-30 2017-08-18 山东鲁能软件技术有限公司 一种设备安全等级分类方法
CN106682781A (zh) * 2016-12-30 2017-05-17 山东鲁能软件技术有限公司 一种电力设备多指标预测方法
CN106960554B (zh) * 2017-03-20 2018-06-29 山东科技大学 基于单一模拟量和报警延迟器的报警***评价方法及装置
CN107678930A (zh) * 2017-09-11 2018-02-09 华东理工大学 一种基于光滑支持向量机的银行自动终端异常报警方法
CN107807961B (zh) * 2017-10-10 2021-11-19 国网浙江省电力公司丽水供电公司 一种基于Spark计算引擎的配电网大数据分区处理方法
CN108089962A (zh) * 2017-11-13 2018-05-29 北京奇艺世纪科技有限公司 一种异常检测方法、装置及电子设备
CN108133326A (zh) * 2017-12-22 2018-06-08 华润电力(菏泽)有限公司 一种基于火电设备的状态预警方法及***
CN109669849B (zh) * 2018-12-04 2022-01-28 哈尔滨工业大学 一种基于未确知深度理论的复杂***健康状态评估方法
EP3879370B1 (en) * 2018-12-05 2022-12-21 Mitsubishi Electric Corporation Abnormality detection device and abnormality detection method
CN109492193B (zh) * 2018-12-28 2020-11-27 同济大学 基于深度机器学习模型的异常网络数据生成与预测方法
CN110321366B (zh) * 2019-06-27 2021-06-25 中国科学院自动化研究所 基于在线学习的统计量确定方法及***
US11561959B2 (en) * 2019-07-15 2023-01-24 Huawei Cloud Computing Technologies Co., Ltd. Method and system for automatic anomaly detection in data
CN110469496B (zh) * 2019-08-27 2021-04-09 苏州热工研究院有限公司 一种水泵智能预警方法及***
CN110391840B (zh) * 2019-09-17 2019-12-17 中国人民解放军国防科技大学 太阳同步轨道卫星遥测参数异常判断方法和***
CN111241208B (zh) * 2019-12-31 2024-03-29 合肥城市云数据中心股份有限公司 一种周期性时序数据的异常监测方法及装置
CN111797250B (zh) * 2020-09-09 2020-12-11 腾讯科技(深圳)有限公司 媒体内容的推送控制方法、装置、计算机设备和存储介质
CN112633329B (zh) * 2020-12-05 2023-01-31 歌尔科技有限公司 一种智能设备力学特性缺陷检测的方法
CN112734977B (zh) * 2020-12-25 2022-07-05 安徽省安泰科技股份有限公司 一种基于物联网的设备风险预警***及算法
CN112650660B (zh) * 2020-12-28 2024-05-03 北京中大科慧科技发展有限公司 一种数据中心动力***预警方法及装置
CN113066549B (zh) * 2021-04-06 2022-07-26 青岛瑞斯凯尔生物科技有限公司 基于人工智能的医疗器械的临床有效性评估方法及***
CN114017136A (zh) * 2021-11-02 2022-02-08 浙江大唐国际绍兴江滨热电有限责任公司 一种联合循环发电机组的软光字牌报警方法及***
CN113806615B (zh) * 2021-11-18 2022-03-04 成都索贝数码科技股份有限公司 一种智能it运维***的kpi异常预警方法
CN114356998A (zh) * 2022-01-08 2022-04-15 浙江力石科技股份有限公司 一种大数据旅游资源数据补偿方法
CN114742391B (zh) * 2022-04-02 2022-12-30 格莱杰(深圳)科技有限公司 基于人工智能的异常处理方法、装置、计算机设备及介质
CN116302848B (zh) * 2023-05-19 2023-09-01 杭州安脉盛智能技术有限公司 一种评估值被带偏的检测方法、装置、电子设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2448663A1 (en) * 2001-05-31 2002-12-05 Goldman Sachs & Co. Method and system for verifying the integrity of data in a data warehouse and applying warehoused data to a plurality of predefined analysis models
CN102982383A (zh) * 2012-05-15 2013-03-20 红云红河烟草(集团)有限责任公司 一种基于支持向量机的能源供需预测方法
CN103345585A (zh) * 2013-07-12 2013-10-09 清华大学 基于支持向量机的风功率预测校正方法及***
CN103473480A (zh) * 2013-10-08 2013-12-25 武汉大学 基于改进万有引力支持向量机的在线监测数据校正方法
CN104102773A (zh) * 2014-07-05 2014-10-15 山东鲁能软件技术有限公司 一种设备故障预警及状态监测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120123981A1 (en) * 2010-08-04 2012-05-17 Graves Spencer B Software to facilitate design, data flow management, data analysis and decision support in structural health monitoring systems

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2448663A1 (en) * 2001-05-31 2002-12-05 Goldman Sachs & Co. Method and system for verifying the integrity of data in a data warehouse and applying warehoused data to a plurality of predefined analysis models
CN102982383A (zh) * 2012-05-15 2013-03-20 红云红河烟草(集团)有限责任公司 一种基于支持向量机的能源供需预测方法
CN103345585A (zh) * 2013-07-12 2013-10-09 清华大学 基于支持向量机的风功率预测校正方法及***
CN103473480A (zh) * 2013-10-08 2013-12-25 武汉大学 基于改进万有引力支持向量机的在线监测数据校正方法
CN104102773A (zh) * 2014-07-05 2014-10-15 山东鲁能软件技术有限公司 一种设备故障预警及状态监测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SVM回归估计方法在卫星故障诊断中的应用;赵石磊等;《电机与控制学报》;20080731;第12卷(第4期);第483-486页 *
基于支持向量机回归的光伏发电出力预测;栗然等;《中国电力》;20080229;第41卷(第2期);第74-78页 *
支持向量回归在线建模及应用;王定成;《控制与决策》;20030131;第18卷(第1期);第89-95页 *

Also Published As

Publication number Publication date
CN105302848A (zh) 2016-02-03

Similar Documents

Publication Publication Date Title
CN105302848B (zh) 一种设备智能预警***的评估值校准方法
CN107480341B (zh) 一种基于深度学习的大坝安全综合评判方法
US8527223B2 (en) Methods and systems for energy prognosis
CN105117602B (zh) 一种计量装置运行状态预警方法
CN102289590B (zh) Sf6高压断路器运行状态评估方法及智能***
CN110223196A (zh) 基于典型行业特征库和反窃电样本库的反窃电分析方法
CN108694470B (zh) 一种基于人工智能的数据预测方法及装置
CN105044759B (zh) 一种数字式核探测器的状态评估与保障维护方法及***
CN111525587B (zh) 一种基于无功负荷态势的电网无功电压控制方法及***
CN104331773A (zh) 一种电网规划方案综合评估方法
CN110221976B (zh) 一种基于度量技术的计量终端软件质量量化评价方法
CN110941797B (zh) 基于业务指标的经营指标监控及趋势预测***
CN115099335A (zh) 多源异构数据的异常辨识和特征筛选方法、***
CN116683588B (zh) 锂离子电池充放电控制方法及***
CN104239712A (zh) 一种雷达抗干扰效能实时评估方法
KR20190027419A (ko) 의사결정 지원 기반의 상수관망최적관리시스템
CN106530082A (zh) 基于多机器学习的股票预测方法及***
CN111178585A (zh) 基于多算法模型融合的故障接报量预测方法
CN112329969A (zh) 一种基于支持向量机的建筑智能化工程投资预测方法
CN110147827A (zh) 一种基于iaalo-svm与相似性度量的故障预测方法
CN113240527A (zh) 基于可解释机器学习的债券市场违约风险预警方法
Gu et al. Comparison of machine learning techniques for the detection of the electricity theft
US12001199B2 (en) Method, system and computer program product for evaluation of energy consumption in industrial environments
CN113469409A (zh) 一种基于高斯过程的电能量计量装置状态预测方法及装置
CN117094599A (zh) 基于机器学习的生产质量管理方法、装置和计算机设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 250101 5th floor, block B, Yinhe building, 2008 Xinluo street, high tech Zone, Jinan City, Shandong Province

Patentee after: Shandong luruan Digital Technology Co.,Ltd.

Address before: 250101 5th floor, block B, Yinhe building, 2008 Xinluo street, high tech Zone, Jinan City, Shandong Province

Patentee before: SHANDONG LUNENG SOFTWARE TECHNOLOGY Co.,Ltd.