CN111949012B - 一种基于双权重多邻域保持嵌入算法的间歇过程故障检测方法 - Google Patents

一种基于双权重多邻域保持嵌入算法的间歇过程故障检测方法 Download PDF

Info

Publication number
CN111949012B
CN111949012B CN202010943683.XA CN202010943683A CN111949012B CN 111949012 B CN111949012 B CN 111949012B CN 202010943683 A CN202010943683 A CN 202010943683A CN 111949012 B CN111949012 B CN 111949012B
Authority
CN
China
Prior art keywords
data
test
spe
matrix
double
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010943683.XA
Other languages
English (en)
Other versions
CN111949012A (zh
Inventor
姚红娟
赵小强
李炜
惠永永
宋昭漾
牟淼
刘凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lanzhou University of Technology
Original Assignee
Lanzhou University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lanzhou University of Technology filed Critical Lanzhou University of Technology
Priority to CN202010943683.XA priority Critical patent/CN111949012B/zh
Publication of CN111949012A publication Critical patent/CN111949012A/zh
Application granted granted Critical
Publication of CN111949012B publication Critical patent/CN111949012B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0243Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/20Pc systems
    • G05B2219/24Pc safety
    • G05B2219/24065Real time diagnostics
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于双权重多邻域保持嵌入算法的间歇过程故障检测方法,包括如下步骤:(1)采集多个批次正常工况下的间歇过程数据,构成三维训练数据X;(2)将采集到的三维训练数据X展开为二维数据并进行标准化处理;(3)建立双权重多邻域保持嵌入模型,求取映射变换矩阵A,根据Y=ATX,得到降维数据矩阵Y;(4)建立正常数据下霍特林统计模型T2和平方预测误差统计模型SPE的统计量,并求取其控制限;(5)采集在线的间歇过程数据,构成测试数据Xtest并对其展开并标准化处理;(6)将测试数据通过映射变换矩阵A进行投影,得到其降维数据矩阵Ytest;(7)求取测试数据的霍特林统计模型统计量T2和平方预测误差统计模型统计量SPE,判断有无故障发生。

Description

一种基于双权重多邻域保持嵌入算法的间歇过程故障检测方法
技术领域
本发明属于工业过程监控技术领域,涉及一种基于双权重多邻域保持嵌入算法的间歇过程故障检测方法。
背景技术
间歇过程数据具有动态特性,不满足过程采样独立的假设,若用传统的方法进行监测,必然会导致高漏报率的存在。针对这一问题,Ku最早提出了动态主元分析(DPCA)算法,通过包含当前时刻和历史时刻采样值的增广矩阵建立故障检测模型,考虑了过程数据之间的时序相关性,提高了故障检测率。此后,一系列基于增广矩阵的多元统计方法被用于动态过程监控中,取得了一定的故障检测效果。翟坤提出了一种改进的DKPCA故障检测方法,首先通过不可区分度筛选出相关程度较大的变量以减少数据量,接着构建增广矩阵,并通过KPCA建模,该方法对微小故障表现出更好的故障检测能力。但是,以上方法揭示的是数据的全局结构,忽略了数据的局部结构,导致特征提取效果欠佳,直接影响算法的故障检测效果。
近年来,NPE算法由于能够在降维的同时挖掘数据的局部结构,被广泛用于过程监测中,但是它没有考虑过程数据的时序相关性,对此,Hu借鉴于DPCA的思想,将增广矩阵应用于NPE算法,提出了DMNPE算法,并成功应用于间歇过程故障检测,然而间歇过程数据丰富,采用增广矩阵的方法使得算法的计算效率降低。Miao提出了时序扩展的NPE(TNPE)算法,通过为每一个样本点挑选k个时间近邻重构样本点,以挖掘出采样数据之间的相关信息,通过T2和SPE统计量监控过程性能,能够较好的解决数据的动态性问题,然而,该方法仅是对数据在时间上的挖掘,忽略了其空间结构,而且NPE算法在求取重构权值时,未考虑近邻的大小顺序,导致一些重要信息的丢失。
发明内容
本发明针对间歇过程的动态特性问题,提供一种基于双权重多邻域保持嵌入算法(DWMNPE)的间歇过程故障检测方法。该方法通过定义角度近邻,并挑选距离近邻、时间近邻、角度近邻重构样本点,在时间和空间上完成对样本点的重构。
为了进一步考虑近邻顺序信息对重构权重的影响,构建新的目标函数,同时考虑近邻顺序信息和重构误差,有效提取数据的本质流形特征,能够对原始数据集进行更好的学习和特征提取,从而提高故障检测率。
为此,本发明采用如下技术方案:
一种基于双权重多邻域保持嵌入算法的间歇过程故障检测方法,包括如下步骤:
(1)采集多个批次正常工况下的间歇过程数据,构成三维训练数据X;
(2)将采集到的三维训练数据X展开为二维数据并进行标准化处理;
(3)建立双权重多邻域保持嵌入模型,求取映射变换矩阵A,根据Y=ATX,得到降维数据矩阵Y;
(4)建立正常数据下霍特林统计模型T2和平方预测误差统计模型SPE的统计量,并求取其控制限;
(5)采集在线的间歇过程数据,构成测试数据Xtest,按步骤(2)方法对其展开并标准化处理;
(6)将预处理后的测试数据通过步骤(3)得到的映射变换矩阵A进行投影,得到其降维数据矩阵Ytest
(7)求取测试数据Xtest的霍特林统计模型统计量T2和平方预测误差统计模型统计量SPE,判断有无故障发生。
进一步地,步骤(1)的具体过程如下:
利用集散控制***收集间歇过程正常运行情况下多个批次的各关键变量数据信息,构成三维数据X(I×J×K),其中I表示批次,J表示变量,K表示采样点。
进一步地,步骤(2)的具体过程如下:
首先沿着批次I的方向将三维数据X(I×J×K)展开为二维数据X(I×KJ),如式(1)所示:
Figure BDA0002674514960000031
其中,
Figure BDA0002674514960000032
代表第i个操作批次在第k个采样时刻的变量xj
接着对二维数据矩阵X(I×KJ)进行标准化处理:
Figure BDA0002674514960000033
Figure BDA0002674514960000041
Figure BDA0002674514960000042
式中,
Figure BDA0002674514960000043
Figure BDA0002674514960000044
的平均值,δj,k
Figure BDA0002674514960000045
的标准差,
Figure BDA0002674514960000046
Figure BDA0002674514960000047
标准化后的取值;从而使得各个过程变量的均值为0,方差为1,并将标准化后的二维数据重新排列成X(KI×J),如式(5)所示:
Figure BDA0002674514960000048
其中,
Figure BDA0002674514960000049
代表第i个操作批次在第k个采样时刻的变量xj
进一步地,步骤(3)具体是通过基于双权重多邻域保持嵌入算法提取间歇过程数据的本质特征信息,而基于双权重多邻域保持嵌入算法实际是通过寻找映射变换矩阵A(a1,a2,…,an)将Rm空间的数据集X(x1,x2…xn)投影到相对低维的空间Y={y1,…yn},{yi|yi∈Rd}(d≤m)中,且满足Y=ATX。为此,通过如下计算得到:
(3a)定义角度近邻,为样本点寻找距离、时间、角度近邻
NPE算法通过构建样本点的多个局部邻域来描述其特征结构,因此,邻域划分的好坏直接影响了NPE算法的特征提取能力。传统NPE算法通过欧氏距离选择邻域点,没有考虑采样点之间的时序相关性。通常,在较短的采样时间内,样本点变化较小,可以认为每个邻域内的样本点之间构成线性相关的关系,因此,本发明以采样时间邻近的样本点作为一种近邻点,来描述样本点之间的动态相关信息。然而,时间近邻表达了在时间序列上的相近,却忽略了在空间上的表达。NPE算法通过欧氏距离度量样本在空间上的相似性,但是这种方式并不充分,如附图1所示,样本点xi和样本点xj、xk之间的距离d1、d2相等,但xi和xj、xk之间的夹角不同,可见样本之间的空间相似性并不相同,说明仅仅通过欧氏距离大小来衡量样本之间的空间相似性是不准确的。为此,通过样本间角度的大小来定义另一种空间相似性的度量指标,即角度近邻。
定义角度近邻如下:
Figure BDA0002674514960000051
其中,θij是样本点xi和xj(j=1,2,…n,j≠i)之间的角度,样本间夹角余弦值越大,夹角越小,样本间相似性就越大;
为了能够在时间和空间上充分表达样本的结构特征,本发明为样本点寻找距离、时间以及角度三种近邻点,从三种不同的角度来衡量样本点之间的相似性,更加准确地表征样本的本质特征。此外,一个样本点可能同时具有多个近邻属性,即它既是距离近邻又是时间近邻或角度近邻,这种近邻属性的重叠体现了样本点之间的更大的相似程度。其中三种近邻的挑选过程如下:
挑选距离近邻:计算样本点xi和xj(j=1,2,…n,j≠i)之间的欧式距离,并根据欧式距离从小到大排序,选取距样本点xi最近的前k个样本点作为xi的距离近邻;
挑选时间近邻:为数据点xi选择其l个“过去”采样时间序列样本点和l个“未来”采样时间序列样本点,构成时间近邻集{xi-l,…,xi-1,xi+1,…,xi+l};
挑选角度近邻:根据式(6)计算样本点xi和xj(j=1,2,…n,j≠i)间夹角余弦值,并根据余弦值从大到小排序,选取与xi间余弦值最大的s个样本点作为xi的角度近邻;
三种近邻点个数通过实验经验确定,距离近邻数k一般取值在5-20之间,时间近邻数2l一般取值为2或4,角度近邻数s取值在5-10之间。
(3b)构造目标函数
NPE算法在用近邻点重构样本点时,仅仅通过重构误差求解重构系数矩阵W,未考虑近邻距离大小的顺序,一般来说,相比于距离较远的近邻点,距离较近的近邻点应该在重构样本点时具有更大的权重。
因此,双权重多邻域保持嵌入算法在求解重构权重时,不仅考虑了重构误差,还考虑到三种近邻的顺序信息,目标函数构造如下:
min J=min(αpJE+(1-αp)JO)   (7)
其中,αp为平衡JE和JO对新目标函数贡献的调节因子。
JE是基础算法NPE的目标函数,具体如式(8)所示:
Figure BDA0002674514960000061
式中,WE表征了样本点与其近邻点的重构误差信息,通过最小化重构误差计算:
Figure BDA0002674514960000071
wEij表示样本点xj对重构xi的“贡献”,约束条件为
Figure BDA0002674514960000072
每个样本点仅由其近邻点重构,当xj不是xi的近邻时,wEij=0。
JO为表征重构顺序信息的目标函数,具体如式(10)所示:
Figure BDA0002674514960000073
A为待求解的映射变换矩阵,其能够将Rm空间的数据集X(x1,x2…xn)投影到相对低维的数据集Y={y1,y2,…yn},{yi|yi∈Rd}(d≤m)中,即Y是数据集X经映射变换矩阵A投影后得到的降维数据矩阵。
WO为表征数据距离、时间以及角度三种顺序信息的权重矩阵,借鉴高斯核,WO定义如下:
Figure BDA0002674514960000074
式中,t为采样时刻,β为高斯核参数;
因此,双权重多邻域保持嵌入算法的目标函数为:
Figure BDA0002674514960000075
                                                             
Figure BDA0002674514960000081
式中,
Figure BDA0002674514960000082
约束条件为:yTy=aTXXTaT=1,a为投影矩阵A的列向量。
因此,投影矩阵A通过求解如下最优化问题得到:
Figure BDA0002674514960000083
引入拉格朗日函数,并通过一定的代数运算,将式(13)的最优化问题转换为式(14)的广义特征值求解问题:
Figure BDA0002674514960000084
求解最小的d个特征值(λ1≤λ2≤…≤λd)所对应的特征向量构成投影矩阵A(a1,…,ad)。
本发明通过对间歇过程数据进行建模统计分析,在提取过程数据时,定义角度近邻,并为样本点挑选距离近邻、时间近邻、角度近邻,在时间和空间上充分描述样本点的局部特征,接着在NPE算法考虑误差最小化的基础上,考虑近邻的顺序信息,定义一种新的目标函数,能够对原始数据集进行更好的学习和特征提取,并解决其动态性问题;之后基于双权重多邻域保持嵌入模型建立相应的统计监测量,判断故障的发生。
本发明的有益效果在于:相比于目前的其他方法,本发明可显著提高间歇过程故障检测率并减少故障误报率,能在故障发生时及时检测到故障,有利于对产品质量和生产安全进行严格把控。
附图说明
图1为样本间角度示意图;
图2为本发明方法间歇过程三维数据展开示意图;
图3为本发明的方法流程图;
图4(a)为DPCA方法对青霉素发酵过程通风速率添加2%斜坡故障的T2统计量故障检测图;
图4(b)为DPCA方法对青霉素发酵过程通风速率添加2%斜坡故障的SPE统计量故障检测图;
图5(a)为TNPE方法对青霉素发酵过程通风速率添加2%斜坡故障的T2统计量故障检测图;
图5(b)为TNPE方法对青霉素发酵过程通风速率添加2%斜坡故障的SPE统计量故障检测图;
图6(a)为本发明方法对青霉素发酵过程通风速率添加2%斜坡故障的T2统计量故障检测图;
图6(b)为本发明方法对青霉素发酵过程通风速率添加2%斜坡故障的SPE统计量故障检测图。
具体实施方式
下面结合具体实施例对本发明方法做进一步的说明。
青霉素生产过程是一个典型的动态、非线性、时变、多阶段的间歇过程。本发明通过Pensim2.0青霉素发酵过程的标准仿真平台产生出间歇过程数据,Pensim2.0是美国Illinois州立理工学院为了更加方便地研究典型间歇过程而开发的,它可产生出不同初始条件和不同工况下青霉素发酵过程中各变量每个时刻的数据用以分析研究。在青霉素发酵模型里,充分的考虑了发酵过程的温度变化、pH值、空气流量的变化、底物流加速率、搅拌率等对菌体合成的影响,可以接近真实地模拟青霉素发酵的实际过程。接下来结合具体过程对本发明的方法步骤作一阐述:
(1)本实施例将每批次的反应时间设定为400h,每隔1h采样一次,在不同初始条件且没有故障的情况下共产生30个批次的正常工况下数据。从产生的18个变量数据中选择其中10个过程变量作为监控变量(如表1所示),构成三维数据矩阵X(30×10×400)作为训练样本集。
表1监控变量
Figure BDA0002674514960000101
(2)将得到的三维数据X(30×10×400)沿着批次方向展开为X(30×4000)后,进行标准化处理并重新排列成沿变量方向的二维数据X(12000×10);
(3)建立基于双权重多邻域保持嵌入模型,求取映射变换矩阵
(3a)定义角度近邻,为样本点寻找时间、距离、角度近邻
定义角度近邻如下:
Figure BDA0002674514960000102
其中,θij是样本点xi和xj(j=1,2,…n,j≠i)之间的角度,样本间夹角余弦值越大,夹角越小,样本间相似性就越大。
定义角度近邻后,按照欧氏距离的大小、采样时间的邻近、角度的大小分别为样本点寻找距离、时间以及角度三种近邻点,具体过程如下:
挑选距离近邻:计算样本点xi和xj(j=1,2,…n,j≠i)之间的欧式距离,并根据欧式距离从小到大排序,选取距样本点xi最近的前k个样本点作为xi的距离近邻;
挑选时间近邻:为数据点xi选择其l个“过去”采样时间序列样本点和l个“未来”采样时间序列样本点,构成时间近邻集{xi-l,…,xi-1,xi+1,…,xi+l};
挑选角度近邻:根据式(1)计算样本点xi和xj间夹角余弦值,并根据余弦值从大到小排序,选取与xi间余弦值最大的s个样本点作为xi的角度近邻。
三种样本点个数通过实验经验确定,距离近邻数k一般取值在5-20之间,时间近邻数2l一般取值为2或4,角度近邻数s取值在5-10之间。本实例中取k=12,2l=4,s=8。
(3b)构造目标函数
构造目标函数如下:
min J=min(αpJE+(1-αp)JO)   (2)
其中,JE为表征重构误差信息的目标函数,JO为表征近邻顺序信息的目标函数,αp为平衡JE和JO对新目标函数贡献的调节因子,考虑到重构误差信息和近邻顺序信息对新目标函数有同样的贡献,因此,此处取αp=0.5。
JE是基础算法NPE的目标函数,具体如式(3)所示:
Figure BDA0002674514960000121
式中,WE表征了样本点与其近邻点的重构误差信息,通过最小化重构误差计算得到:
Figure BDA0002674514960000122
wEij表示样本点xj对重构xi的“贡献”,约束条件为
Figure BDA0002674514960000123
每个样本点仅由其近邻点重构,当xj不是xi的近邻时,wEij=0。
JO为表征重构顺序信息的目标函数,具体如式(5)所示:
Figure BDA0002674514960000124
由于双权重多邻域保持嵌入算法挑选的是距离、时间以及角度三种类型的近邻,因此,也存在三种顺序信息,即距离顺序、时间顺序以及角度顺序。式(4)中,WO为表征数据三种顺序信息的权重矩阵,借鉴高斯核,WO定义如下:
Figure BDA0002674514960000125
其中,t为采样时刻,β为高斯核参数,根据经验取β=50;
因此,双权重多邻域保持嵌入算法的目标函数为:
Figure BDA0002674514960000131
式中,
Figure BDA0002674514960000132
约束条件为:yTy=aTXXTaT=1,y为降维矩阵Y的列向量,a为投影矩阵A的列向量;
因此,投影矩阵A通过求解如下最优化问题得到:
Figure BDA0002674514960000133
引入拉格朗日函数,并通过一定的代数运算,将式(8)的最优化问题转换为式(9)的广义特征值求解问题。
Figure BDA0002674514960000134
求解最小的d个特征值(λ1≤λ2≤…≤λd)所对应的特征向量构成投影矩阵A(a1,…,an)。根据经验,一般计算时d值均取2,因此,本实施例中,数据降维的维度d选择为2。
(4)求取正常数据下的霍特林统计模型T2和平方预测误差统计模型SPE的统计量及其控制限,具体为,
在样本数据集X(KI×J)的特征空间中,霍特林统计模型T2的统计量通过下式求得:
Figure BDA0002674514960000135
式中:Λ为样本数据集X(KI×J)对应的低维数据集Y的协方差矩阵,且
Figure BDA0002674514960000141
T2 α是T2统计量的控制限,F(d,n-d;α)是显著性水平为α、自由度为d和n-d的F分布,此处n为训练样本集中样本的个数且n=120000,自由度d为数据降维的维度且d=2,取显著性水平α=0.95;求得
Figure BDA0002674514960000142
在样本数据集X(KI×J)的残差空间中,平方预测误差统计模型SPE的统计量通过下式求得:
Figure BDA0002674514960000143
式中:
Figure BDA0002674514960000144
表示残差空间的投影,SPEα为SPE统计量的控制限,
Figure BDA0002674514960000145
m和v分别为SPE统计量的均值和方差,
Figure BDA0002674514960000146
为自由度为h、置信水平为α=0.95的χ2分布,求得
Figure BDA0002674514960000147
(5)Pensim2.0仿真平台不仅可以产生正常工况下数据,还提供了三种故障类型,分别为:通风速率故障、搅拌功率故障和底物进料速率故障。为了验证算法的效果,本发明中引入故障类型1,即变量1通风速率故障,在采样时间150-400h期间加入2%的斜坡信号作为故障信号,产生一批测试数据Xtest(400×10),将其数据进行标准化处理后作为故障样本以供在线检测。
(6)将标准化后的故障样本Xtest(400×10)通过步骤(3)得到的特征变换矩阵A进行投影,得到:Ytest=ATXtest
(7)将标准化后的故障样本进行投影后,在特征空间和残差空间分别建立在线数据的统计模型T2和SPE,判断有无故障发生;具体如下:
在特征空间中,T2 test通过下式求得:
T2 test=ytestΛ-1ytest   (12)
式中
Figure BDA0002674514960000151
测试数据样本个数n=400;
在残差空间中,SPEtest通过下式求得:
SPEtest=||xtest-Aytest||2   (13)
Figure BDA0002674514960000152
或者SPEtest>SPEα,则说明发生故障,否则没有故障发生。
以上所述步骤即为本发明方法在青霉素发酵仿真平台Pensim上的具体应用。分别用动态主成分分析算法(DPCA)、基于时序的邻域保持嵌入算法(TNPE)以及本发明提出方法来对相同故障样本进行监控,得到图4-6所示的监控图。图4为DPCA算法的统计量检测图,从图中可知,其T2和SPE分别在第185采样点和158采样点开始检测到故障,DPCA虽考虑到了过程数据的动态性,但由于PCA丢失了数据的局部结构,因此故障检测存在一定的延迟,图5为TNPE算法的统计量检测图,从图中可知,其T2和SPE分别在第167采样点和165采样点开始检测到故障,相较与DPCA算法,TNPE具有较小的故障检测延迟,图6为本发明所提方法的T2和SPE统计量检测图,从图中可知,其T2和SPE分别在第153采样点和154采样点开始检测到故障,与DPCA和TNPE相比,本发明所提方法的故障检测响应最快,能够在故障发生时及时检测到故障,表现出更为满意的故障检测效果,原因在于本发明所提方法充分提取了潜藏在过程数据的局部结构信息,更加准确地描述了样本点与近邻点之间的相似性,可以对原始数据进行更好的学习和特征提取,因此基于此方法的故障检测效果得到明显的改善。

Claims (8)

1.一种基于双权重多邻域保持嵌入算法的间歇过程故障检测方法,其特征在于,包括如下步骤:
(1)采集多个批次正常工况下的间歇过程数据,构成三维训练数据X;
(2)将采集到的三维训练数据X展开为二维数据并进行标准化处理;
(3)建立双权重多邻域保持嵌入模型,求取映射变换矩阵A,根据Y=AΤX,得到降维数据矩阵Y;
(4)建立正常数据下霍特林统计模型T2和平方预测误差统计模型SPE的统计量,并求取其控制限;
(5)采集在线的间歇过程数据,构成测试数据Xtest,按步骤(2)方法对其展开并标准化处理;
(6)将预处理后的测试数据通过步骤(3)得到的映射变换矩阵A进行投影,得到其降维数据矩阵Ytest
(7)求取测试数据的霍特林统计模型统计量T2和平方预测误差统计模型统计量SPE,判断有无故障发生;
其中,步骤(3)的具体过程如下:
(3a)定义角度近邻,为样本点寻找距离、时间、角度近邻
定义样本点角度近邻如下:
Figure FDA0004152179220000011
其中,θij是样本点xi和xj(j=1,2,…n,j≠i)之间的角度,样本间夹角余弦值越大,夹角越小,样本间相似性越大;
定义角度近邻后,按照欧氏距离的大小、采样时间的邻近、夹角的大小分别为样本点寻找距离、时间以及角度三种近邻点;
(3b)构造目标函数
构造目标函数如下:
minJ=min(αpJE+(1-αp)JO)                 (2)
其中,αp为平衡JE和JO对新目标函数贡献的调节因子;
JE是基础算法NPE的目标函数,具体如式(3)所示:
Figure FDA0004152179220000021
式中,WE表征了样本点与其近邻点的重构误差信息,并通过最小化重构误差计算得到:
Figure FDA0004152179220000022
wEij表示样本点xj对重构xi的“贡献”,约束条件为
Figure FDA0004152179220000023
每个样本点仅由其近邻点重构,当xj不是xi的近邻时,wEij=0;
JO为表征重构顺序信息的目标函数,具体如式(5)所示:
Figure FDA0004152179220000024
式中,A为待求解的映射变换矩阵,其能够将Rm空间的数据集X(x1,x2…xn)投影到相对低维的数据集Y={y1,y2,…yn},{yi|yi∈Rd}(d≤m)中,即Y是数据集X经映射变换矩阵A投影后得到的降维数据矩阵,且满足Y=AΤX;
WO为表征数据距离、时间以及角度三种顺序信息的权重矩阵,借鉴高斯核,WO定义如下:
Figure FDA0004152179220000031
式中,t为采样时间,β为高斯核参数;
因此,双权重多邻域保持嵌入算法的目标函数为:
Figure FDA0004152179220000032
式中,
Figure FDA0004152179220000033
约束条件为:yΤy=aΤXXΤaΤ=1,其中,y为降维矩阵Y的列向量,a为投影矩阵A的列向量;
因此,投影矩阵A通过求解如下最优化问题得到:
Figure FDA0004152179220000034
引入拉格朗日函数,并通过一定的代数运算,将式(8)的最优化问题转换为式(9)的广义特征值求解问题:
Figure FDA0004152179220000035
求解最小的d个特征值(λ1≤λ2≤…≤λd)所对应的特征向量,构成投影矩阵A(a1,…,an)。
2.根据权利要求1所述的一种基于双权重多邻域保持嵌入算法的间歇过程故障检测方法,其特征在于,步骤(1)的具体过程如下:
利用集散控制***收集间歇过程正常运行情况下多个批次的各关键变量数据信息,构成三维数据集X(I×J×K),其中I表示批次,J表示变量,K表示采样点。
3.根据权利要求1所述的一种基于双权重多邻域保持嵌入算法的间歇过程故障检测方法,其特征在于,步骤(2)的具体过程如下:
首先沿着批次I的方向将三维数据集X(I×J×K)展开为二维数据集X(I×KJ),然后将展开的二维数据集进行标准化处理,使得各个过程变量的均值为0,方差为1,并将标准化后的二维数据重新排列成X(KI×J)。
4.根据权利要求1所述的一种基于双权重多邻域保持嵌入算法的间歇过程故障检测方法,其特征在于,步骤(3a)中,距离、时间以及角度三种近邻点的挑选过程如下:
挑选距离近邻:计算样本点xi和xj(j=1,2,…n,j≠i)之间的欧式距离,并根据欧式距离从小到大排序,选取距样本点xi最近的前k个样本点作为xi的距离近邻;
挑选时间近邻:为数据点xi选择其l个“过去”采样时间序列样本点和l个“未来”采样时间序列样本点,构成时间近邻集{xi-l,…,xi-1,xi+1,…,xi+l};
挑选角度近邻:计算样本点xi和xj(j=1,2,…n,j≠i)间夹角余弦值,并根据余弦值从大到小排序,选取与xi间余弦值最大的s个样本点作为xi的角度近邻;
三种近邻点的个数通过实验经验确定,距离近邻数k取值在5-20之间,时间近邻数2l取值为2或4,角度近邻数s取值在5-10之间。
5.根据权利要求1所述的一种双权重多邻域保持嵌入算法的间歇过程故障检测方法,其特征在于,步骤(4)的具体过程如下:
在样本数据集X(KI×J)的特征空间中,霍特林统计模型T2的统计量通过下式求得:
Figure FDA0004152179220000051
式中:Λ为样本数据集X(KI×J)对应的低维数据集Y的协方差矩阵,且
Figure FDA0004152179220000052
T2 α是T2统计量的控制限,F(d,n-d;α)是显著性水平为α、自由度为d和n-d的F分布;
在样本数据集X(KI×J)的残差空间中,平方预测误差统计模型SPE的统计量通过下式求得:
Figure FDA0004152179220000053
式中:
Figure FDA0004152179220000054
表示残差空间的投影,SPEα为SPE统计量的控制限,
Figure FDA0004152179220000055
m和v分别为SPE统计量的均值和方差,
Figure FDA0004152179220000056
为自由度为h、置信水平为α=0.95的χ2分布。
6.根据权利要求1所述的一种基于双权重多邻域保持嵌入算法的间歇过程故障检测方法,其特征在于,步骤(5)的具体过程如下:
采集在线的间歇过程数据并参照步骤(2)进行标准化处理,使得各个变量的均值为0,方差为1,得到标准化后的在线测试数据Xtest
7.根据权利要求1所述的一种基于双权重多邻域保持嵌入算法的间歇过程故障检测方法,其特征在于,步骤(6)的具体过程如下:
将Xtest通过步骤(3)得到的基于双权重多邻域保持嵌入的模型进行投影,即通过映射变换矩阵A投影得到:Ytest=AΤXtest
8.根据权利要求1所述的一种基于双权重多邻域保持嵌入算法的间歇过程故障检测方法,其特征在于,步骤(7)的具体过程如下:
参照步骤(4),在特征空间和残差空间分别建立在线数据集Xtest的霍特林统计模型T2和平方预测误差统计模型SPE的统计量T2 test和SPEtest,判断有无故障发生,具体地,在特征空间中,T2 test通过下式求得:
T2 test=ytestΛ-1ytest            (12)
在残差空间中,SPEtest通过下式求得:
SPEtest=||xtest-Aytest||2         (13)
Figure FDA0004152179220000061
或者SPEtest>SPEα,则说明发生故障,否则没有故障发生。
CN202010943683.XA 2020-09-09 2020-09-09 一种基于双权重多邻域保持嵌入算法的间歇过程故障检测方法 Active CN111949012B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010943683.XA CN111949012B (zh) 2020-09-09 2020-09-09 一种基于双权重多邻域保持嵌入算法的间歇过程故障检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010943683.XA CN111949012B (zh) 2020-09-09 2020-09-09 一种基于双权重多邻域保持嵌入算法的间歇过程故障检测方法

Publications (2)

Publication Number Publication Date
CN111949012A CN111949012A (zh) 2020-11-17
CN111949012B true CN111949012B (zh) 2023-05-05

Family

ID=73357497

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010943683.XA Active CN111949012B (zh) 2020-09-09 2020-09-09 一种基于双权重多邻域保持嵌入算法的间歇过程故障检测方法

Country Status (1)

Country Link
CN (1) CN111949012B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113033690B (zh) * 2021-04-07 2024-04-02 东北大学 一种基于声音的双投影邻域保持嵌入的托辊故障检测方法
CN113134956B (zh) * 2021-04-23 2023-02-24 广东工业大学 一种基于改进mlle的注塑机异常检测方法
CN113341926B (zh) * 2021-06-10 2023-11-17 兰州理工大学 一种基于稀疏加权邻域保持嵌入的多阶段间歇过程故障检测方法
CN113741364A (zh) * 2021-08-26 2021-12-03 上海应用技术大学 一种基于改进t-SNE的多模态化工过程故障检测方法
CN116595454A (zh) * 2023-05-18 2023-08-15 兰州理工大学 基于邻域嵌入神经正交映射算法的间歇过程故障检测方法
CN116502168B (zh) * 2023-05-18 2024-02-02 兰州理工大学 基于孪生深度邻域保持嵌入网络的间歇过程故障检测方法
CN116627116B (zh) * 2023-07-26 2023-10-20 沈阳仪表科学研究院有限公司 一种流程工业故障定位方法、***及电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104483962A (zh) * 2014-11-20 2015-04-01 沈阳化工大学 基于多向正交局部保持投影的间歇过程在线故障检测方法
CN109144039A (zh) * 2018-11-04 2019-01-04 兰州理工大学 一种基于时序扩展和邻域保持极限学习机的间歇过程故障检测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104483962A (zh) * 2014-11-20 2015-04-01 沈阳化工大学 基于多向正交局部保持投影的间歇过程在线故障检测方法
CN109144039A (zh) * 2018-11-04 2019-01-04 兰州理工大学 一种基于时序扩展和邻域保持极限学习机的间歇过程故障检测方法

Also Published As

Publication number Publication date
CN111949012A (zh) 2020-11-17

Similar Documents

Publication Publication Date Title
CN111949012B (zh) 一种基于双权重多邻域保持嵌入算法的间歇过程故障检测方法
CN112101480B (zh) 一种多变量聚类与融合的时间序列组合预测方法
Li et al. Data-driven bearing fault identification using improved hidden Markov model and self-organizing map
CN108062565B (zh) 基于化工te过程的双主元-动态核主元分析故障诊断方法
CN103824137B (zh) 一种复杂机械设备多工况故障预测方法
Cai et al. A new fault detection method for non-Gaussian process based on robust independent component analysis
CN105739489B (zh) 一种基于ica‑knn的间歇过程故障检测方法
CN104699077B (zh) 一种基于嵌套迭代费舍尔判别分析的故障变量隔离方法
CN108549908B (zh) 基于多采样概率核主成分模型的化工过程故障检测方法
CN111506041A (zh) 一种基于扩散距离改进的邻域保持嵌入的间歇过程故障检测方法
Wang et al. Fault detection and identification using a Kullback-Leibler divergence based multi-block principal component analysis and Bayesian inference
Hong et al. The entropy and PCA based anomaly prediction in data streams
CN109144039A (zh) 一种基于时序扩展和邻域保持极限学习机的间歇过程故障检测方法
CN113095402A (zh) 一种基于编码输入的生成对抗网络故障检测方法及***
Qin et al. An analytical partial least squares method for process monitoring
CN117458955A (zh) 电机的运行控制方法及***
CN110084301B (zh) 一种基于隐马尔可夫模型的多工况过程工况辨识方法
Tian et al. Decentralized monitoring for large‐scale process using copula‐correlation analysis and Bayesian inference–based multiblock principal component analysis
CN113341926B (zh) 一种基于稀疏加权邻域保持嵌入的多阶段间歇过程故障检测方法
Attouri et al. Improved fault detection based on kernel PCA for monitoring industrial applications
CN116048036A (zh) 基于动态非平稳投影结构的故障检测方法
CN109656202B (zh) 基于局部和结构一致性流形gmm的多模态过程监测方法
Geng et al. Fault diagnosis of chemical processes based on a novel adaptive kernel principal component analysis
Ma et al. Process monitoring of the pneumatic control valve using canonical variate analysis
CN110927243A (zh) 一种基于PCA-Kmeans算法的冷轧带钢故障诊断优化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant