CN109407652B - 基于主辅pca模型的多变量工业过程故障检测方法 - Google Patents

基于主辅pca模型的多变量工业过程故障检测方法 Download PDF

Info

Publication number
CN109407652B
CN109407652B CN201811503665.9A CN201811503665A CN109407652B CN 109407652 B CN109407652 B CN 109407652B CN 201811503665 A CN201811503665 A CN 201811503665A CN 109407652 B CN109407652 B CN 109407652B
Authority
CN
China
Prior art keywords
data set
formula
spe
variable
statistics
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811503665.9A
Other languages
English (en)
Other versions
CN109407652A (zh
Inventor
邓晓刚
邓佳伟
曹玉苹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Petroleum East China
Original Assignee
China University of Petroleum East China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Petroleum East China filed Critical China University of Petroleum East China
Priority to CN201811503665.9A priority Critical patent/CN109407652B/zh
Publication of CN109407652A publication Critical patent/CN109407652A/zh
Application granted granted Critical
Publication of CN109407652B publication Critical patent/CN109407652B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0243Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/20Pc systems
    • G05B2219/24Pc safety
    • G05B2219/24065Real time diagnostics

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明涉及一种基于主辅PCA模型的多变量工业过程故障检测方法,其步骤为:对正常数据集与先验故障数据集进行标准化处理;对正常数据集建立PCA模型作为主监控模型,计算先验故障和正常数据的相对互信息,借助广义Dice对变量进行分组,对分组后的数据集建立PCA模型作为辅助监控模型,对测试数据集进行标准化处理,将测试数据集分别向主监控模型和辅助监控模型投影,并计算其投影到主监控模型和辅助监控模型的统计量,应用贝叶斯理论整合变量组的信息得到总的监控统计量,根据监控统计量是否超出控制限判断测试数据集是否发生故障。本发明不仅有效地降低部分重要先验故障信息的遗漏和浪费,还通过变量分组挖掘变量局部信息提高故障检测率,改善故障检测性能。

Description

基于主辅PCA模型的多变量工业过程故障检测方法
技术领域
本发明属于工业过程故障检测技术领域,涉及一种基于主辅PCA模型(英文:Primary Assisted Principal Component Analysis,简称:PA-PCA)的多变量工业过程故障检测方法。
背景技术
由于现代工业***日益复杂化,人们对过程安全和产品质量日益重视,故障诊断在工业生产中的地位越来越重要。随着存储技术的发展,大量生产过程数据被采集并记录。因此,基于数据驱动的故障诊断方法得到了广泛应用。经典的故障检测方法包括主元分析(PCA)、独立元分析(ICA)和费舍尔判别分析(FDA)等方法。其中PCA方法近年来成为控制领域研究的热点,并得到了研究者们的广泛应用,但该方法仍然存在一些问题值得进一步研究。传统的PCA方法在进行统计建模时仅仅利用正常数据,忽略了部分已知先验故障信息,造成部分重要信息的遗漏和浪费,从而导致故障检测性能降低。因此,如何有效利用已知先验故障数据挖掘有效信息提高PCA的故障检测性能,已经成为一种具有挑战性的课题。
发明内容
本发明针对传统PCA方法存在的无法深入挖掘与故障相关的局部信息导致故障检测性能低等问题,提供一种基于主辅PCA模型的多变量工业过程故障检测方法。该方法能够利用先验故障信息并能够深入挖掘变量局部信息,提高故障检测率,进而改善故障检测结果。
为了达到上述目的,本发明提供了一种基于主辅PCA模型的多变量工业过程故障检测方法,含有以下步骤:
(一)收集历史数据库中的正常数据集X和C类已知故障数据集Fc,c=1,2,...,C作为训练数据集,并使用正常数据集X的均值μ和标准差σ对训练数据集X和Fc进行标准化处理,得到标准化后的训练数据集
Figure GDA0002276610680000011
Figure GDA0002276610680000012
(二)对数据集
Figure GDA0002276610680000013
建立PCA模型作为主监控模型;
(三)计算故障数据集相对于正常数据集的相对互信息矩阵ΔRc,c=1,2,...,C;
(四)对相对互信息矩阵ΔRc,基于广义Dice系数对过程变量进行变量分组,获得分组后的数据集
Figure GDA0002276610680000014
其中,Bc为变量组的个数;
(五)对分组后的数据集建立PCA模型作为辅助监控模型;
(六)采集测试数据集xnew,利用正常数据集X的均值μ和标准差σ对测试数据集xnew进行标准化处理,得到标准化后的测试数据集
Figure GDA0002276610680000021
(七)将数据集
Figure GDA0002276610680000022
分别向主监控模型和辅助监控模型投影,并计算数据集
Figure GDA0002276610680000023
投影到主监控模型的统计量T2和SPE,数据集
Figure GDA0002276610680000024
投影到辅助监控模型的统计量
Figure GDA0002276610680000025
和SPEc,b,统计量T2的控制限
Figure GDA0002276610680000026
统计量SPE的控制限SPElim、统计量
Figure GDA0002276610680000027
的控制限
Figure GDA0002276610680000028
和统计量SPEc,b的控制限[SPEc,b]lim均通过核密度估计计算;
(八)整合所有监控结果得到总的监控统计量
Figure GDA0002276610680000029
和BICSPE,根据统计量
Figure GDA00022766106800000210
或统计量BICSPE是否超出控制限判断数据集
Figure GDA00022766106800000211
是否发生故障。
进一步的,所述步骤(一)中,利用正常数据集的均值μ和标准差σ通过公式(1)对训练数据集X和Fc进行标准化处理,公式(1)的表达式为:
Figure GDA00022766106800000212
训练数据集X和Fc经上述公式(1)标准化处理后即可获得标准化后的训练数据集
Figure GDA00022766106800000213
Figure GDA00022766106800000214
进一步的,所述步骤(二)中,对训练数据集
Figure GDA00022766106800000215
进行PCA分解,通过公式(2)中的主监控模型计算训练数据集的负载矩阵P,公式(2)表示为:
Figure GDA00022766106800000216
式中,T为数据集
Figure GDA00022766106800000217
的得分矩阵,E为数据集
Figure GDA00022766106800000218
的模型残差矩阵。
进一步的,步骤(三)中,相对互信息矩阵ΔRc的计算步骤为:
通过公式(3)计算数据集
Figure GDA00022766106800000219
的互信息矩阵R,通过公式(4)计算数据集
Figure GDA00022766106800000220
的互信息矩阵Rc,公式(3)和公式(4)表示为:
Figure GDA00022766106800000221
Figure GDA0002276610680000031
式中,m表示变量个数,Rij表示数据集
Figure GDA0002276610680000032
的第i列和第j列的互信息,Rc,ij表示数据集
Figure GDA0002276610680000033
的第i列和第j列的互信息;
相对互信息矩阵ΔRc则表示为:
Figure GDA0002276610680000034
进一步的,步骤(四)中,进行变量分组的具体步骤为:
(1)定义相对互信息向量为:
ri=[ΔRc,i1,ΔRc,i2,…,ΔRc,im]T (6)
用广义Dice系数衡量某一变量与其余变量之间相对互信息相关度的相似性,定义为:
Figure GDA0002276610680000035
式中,0≤Si,j≤1;
选择使||ri||最大的变量作为第一个变量组并初始化变量组的个数Bc=1;
(2)按照变量顺序选择下一个向量rj,其中j≠i且j≤m,并通过公式(8)计算向量rj与已知变量组中各向量相似性的均值,公式(8)表示为::
Figure GDA0002276610680000036
式中,b表示第b个变量组,nb表示第b个变量组内变量的个数;
(3)确定
Figure GDA0002276610680000037
中最大的值并判断其值是否超过阈值γ,若超过γ,则该向量所对应的变量xj被划分到变量组b中;反之,变量xj构成一个新变量组,即Bc=Bc+1;
(4)重复步骤(2)和步骤(3)直至所有的变量分组完成,即
Figure GDA0002276610680000038
进一步的,步骤(五)中,对变量分组后的数据集
Figure GDA0002276610680000041
进行PCA分解,通过公式(9)中的辅助监控模型计算变量分组后数据集
Figure GDA0002276610680000042
的负载矩阵Pc,b,公式(9)表示为:
Figure GDA0002276610680000043
式中,Tc,b为数据集
Figure GDA0002276610680000044
的得分矩阵,Ec,b为数据集
Figure GDA0002276610680000045
的模型残差矩阵。
进一步的,步骤(六)中,利用正常数据集X的均值μ和标准差σ通过公式(10)对测试数据集xnew进行标准化处理,进行标准化处理,公式(10)的表达式为:
Figure GDA0002276610680000046
测试数据集xnew经上述公式(10)标准化处理后即可获得标准化后的测试数据集
Figure GDA0002276610680000047
进一步的,步骤(七)中,通过公式(11)和公式(12)计算数据集
Figure GDA0002276610680000048
投影到主监控模型的统计量T2和SPE,公式(11)和公式(12)表示为:
Figure GDA0002276610680000049
Figure GDA00022766106800000410
式中,Σ表示主监控模型特征值组成的对角阵;
通过公式(13)和公式(14)计算数据集
Figure GDA00022766106800000411
投影到辅助监控模型的统计量
Figure GDA00022766106800000412
和SPEc,b,公式(13)和公式(14)表示为:
Figure GDA00022766106800000413
Figure GDA00022766106800000414
式中,Σc,b表示辅监控模型特征值组成的对角阵,
Figure GDA00022766106800000415
表示根据第c类故障信息获得的
Figure GDA00022766106800000416
中第b组变量。
进一步的,步骤(八)中,采用贝叶斯推理整合所有监控结果,具体步骤为:
定义样本
Figure GDA00022766106800000417
在第b个统计量发生故障的概率为:
Figure GDA00022766106800000418
式中,S表示统计量T2、统计量SPE、统计量
Figure GDA0002276610680000051
和统计量SPEc,b
Figure GDA0002276610680000052
表示样本故障的后验概率,
Figure GDA0002276610680000053
代表正常情况下的后验概率,通过公式(16)和公式(17)分别求解
Figure GDA0002276610680000054
公式(16)和公式(17)表示为:
Figure GDA0002276610680000055
Figure GDA0002276610680000056
式中,Slim表示统计量T2、统计量SPE、统计量
Figure GDA0002276610680000057
和统计量SPEc,b相应的控制限,P(F)为置信水平α,则P(N)=1-α,进而融合所有的监控结果所得总监控统计量为:
Figure GDA0002276610680000058
Figure GDA0002276610680000059
进一步的,步骤(八)中,依据融合后的总监控统计量
Figure GDA00022766106800000510
或总监控统计量BICSPE是否超过控制限判断数据集
Figure GDA00022766106800000511
是否是故障数据;当
Figure GDA00022766106800000512
或BICSPE>0.01时,则认为过程出现了故障;否则,认为过程中并无故障发生。
与现有技术相比,本发明的有益效果在于:
本发明提供的多变量工业过程故障检测方法,计算先验故障和正常数据的相对互信息衡量由于故障的发生所引起变量间相关关系结构变化的差异性,借助广义Dice对变量进行分组,不仅能够充分利用已知先验故障信息,尽可能避免有用故障信息的浪费和遗漏,还能够通过变量分组提取变量的局部信息;在此基础上,分别对包含所有变量的正常数据集建立PCA模型作为主监控模型和在不同变量组的数据集建立PCA子模型作为辅助监控模型,并应用贝叶斯推理整合变量组的信息得到总的监控统计量,根据监控统计量是否超出控制限判断测试数据集是否发生故障,通过融合后的统计量判断是否发生故障,进而改善故障检测结果,提高故障检测率。
附图说明
图1为本发明基于主辅PCA模型的多变量工业过程故障检测方法的流程图;
图2为本发明实施例所述CSTR控制***的结构图;
图3a为本发明实施例采用本发明基于主辅PCA模型的多变量工业过程故障检测方法对CSTR控制***中正常测试数据与标准正常数据的互信息对比图;
图3b为本发明实施例采用本发明基于主辅PCA模型的多变量工业过程故障检测方法对CSTR控制***中故障1与标准正常数据的互信息对比图;
图3c为本发明实施例采用本发明基于主辅PCA模型的多变量工业过程故障检测方法对中故障4与标准正常数据的互信息对比图;
图4a为本发明实施例采用本发明基于主辅PCA模型的多变量工业过程故障检测方法对CSTR控制***利用故障1的先验故障信息变量分组结果示意图;
图4b为本发明实施例本发明基于主辅PCA模型的多变量工业过程故障检测方法对CSTR控制***利用故障4的先验故障信息变量分组结果示意图;
图5a为本发明实施例采用现有PCA方法对CSTR控制***故障3的监控结果示意图;
图5b为本发明实施例采用本发明基于主辅PCA模型的多变量工业过程故障检测方法对CSTR控制***故障3的监控结果示意图;
图6a为本发明实施例采用现有PCA方法对CSTR控制***故障6的监控结果示意图;
图6b为本发明实施例采用本发明基于主辅PCA模型的多变量工业过程故障检测方法对CSTR控制***故障6的监控结果示意图。
具体实施方式
下面,通过示例性的实施方式对本发明进行具体描述。然而应当理解,在没有进一步叙述的情况下,一个实施方式中的元件、结构和特征也可以有益地结合到其他实施方式中。
参见图1,本发明揭示了一种基于主辅PCA模型的多变量工业过程故障检测方法,含有以下步骤:
(一)收集历史数据库中的正常数据集X和C类已知故障数据集Fc,c=1,2,...,C作为训练数据集,利用正常数据集的均值μ和标准差σ通过公式(1)对训练数据集X和Fc进行标准化处理,公式(1)的表达式为:
Figure GDA0002276610680000061
训练数据集X和Fc经上述公式(1)标准化处理后即可获得标准化后的训练数据集
Figure GDA0002276610680000071
Figure GDA0002276610680000072
(二)对数据集
Figure GDA0002276610680000073
建立PCA模型作为主监控模型;具体为:对数据集
Figure GDA0002276610680000074
进行PCA分解,通过公式(2)中的主监控模型计算训练数据集的负载矩阵P,公式(2)表示为:
Figure GDA0002276610680000075
式中,T为数据集
Figure GDA0002276610680000076
的得分矩阵,E为数据集
Figure GDA0002276610680000077
的模型残差矩阵。
(三)计算故障数据集相对于正常数据集的相对互信息矩阵ΔRc,c=1,2,...,C;具体步骤为;
通过公式(3)计算数据集
Figure GDA0002276610680000078
的互信息矩阵R,通过公式(4)计算数据集
Figure GDA0002276610680000079
的互信息矩阵Rc,公式(3)和公式(4)表示为:
Figure GDA00022766106800000710
Figure GDA00022766106800000711
式中,m表示变量个数,Rij表示数据集
Figure GDA00022766106800000712
的第i列和第j列的互信息,Rc,ij表示数据集
Figure GDA00022766106800000713
的第i列和第j列的互信息;
相对互信息矩阵ΔRc则表示为:
Figure GDA00022766106800000714
由于不同的故障引起变量间的互信息是不同的,故以正常数据集的互信息矩阵R为基准,分别衡量故障数据集的互信息与该基准的差异性,以此可以获得不同的变量分组结果。在相对互信息中,每行代表某一变量与所有变量之间互信息变化的差异性,若两个变量的变化差异性相似,说明由于故障的发生造成变量间相关关系结构的变化是相似的,为此可以将两个变量划分为同一变量组。
(四)对相对互信息矩阵ΔRc,基于广义Dice系数对过程变量进行变量分组,获得分组后的数据集
Figure GDA0002276610680000081
其中,Bc为变量组的个数;
进行变量分组的具体步骤为:
(1)定义相对互信息向量为:
ri=[ΔRc,i1,ΔRc,i2,…,ΔRc,im]T (6)
用广义Dice系数衡量某一变量与其余变量之间相对互信息相关度的相似性,定义为:
Figure GDA0002276610680000082
式中,0≤Si,j≤1;Si,j值越接近于1两个向量相似度越强,则故障引起变量间相关关系结构的变化相似,两个变量间具有一定的内部关系,两个变量应划分为同一变量组;
选择使||ri||最大的变量作为第一个变量组并初始化变量组的个数Bc=1;
(2)按照变量顺序选择下一个向量rj,其中j≠i且j≤m,并通过公式(8)计算向量rj与已知变量组中各向量相似性的均值,公式(8)表示为::
Figure GDA0002276610680000083
式中,b表示第b个变量组,nb表示第b个变量组内变量的个数;
(3)确定
Figure GDA0002276610680000084
中最大的值并判断其值是否超过阈值γ,若超过γ,则该向量所对应的变量xj被划分到变量组b中;反之,变量xj构成一个新变量组,即Bc=Bc+1;
(4)重复步骤(2)和步骤(3)直至所有的变量分组完成,即
Figure GDA0002276610680000085
本发明考虑到运算的复杂程度,将变量组内个数小于等于2的变量合成一个变量组。通过上述变量分组方法可以有效利用已知先验故障信息,降低了对已知故障信息的浪费量,更能够进一步挖掘变量的局部信息,更加有利于提高故障的检测性能。该步骤中,利用不同的先验故障信息可以得到不同的变量分组结果。
(五)对分组后的数据集建立PCA模型作为辅助监控模型;具体为:对变量分组后的数据集
Figure GDA0002276610680000091
进行PCA分解,通过公式(9)中的辅助监控模型计算变量分组后数据集
Figure GDA0002276610680000092
的负载矩阵Pc,b,公式(9)表示为:
Figure GDA0002276610680000093
式中,Tc,b为数据集
Figure GDA0002276610680000094
的得分矩阵,Ec,b为数据集
Figure GDA0002276610680000095
的模型残差矩阵。
(六)采集测试数据集xnew,利用正常数据集X的均值μ和标准差σ通过公式(10)对测试数据集xnew进行标准化处理,进行标准化处理,公式(10)的表达式为:
Figure GDA0002276610680000096
测试数据集xnew经上述公式(10)标准化处理后即可获得标准化后的测试数据集
Figure GDA0002276610680000097
(七)将数据集
Figure GDA0002276610680000098
分别向主监控模型和辅助监控模型投影;通过公式(11)和公式(12)计算数据集
Figure GDA0002276610680000099
投影到主监控模型的统计量T2和SPE,公式(11)和公式(12)表示为:
Figure GDA00022766106800000910
Figure GDA00022766106800000911
式中,Σ表示主监控模型特征值组成的对角阵;
通过公式(13)和公式(14)计算数据集
Figure GDA00022766106800000912
投影到辅助监控模型的统计量
Figure GDA00022766106800000913
和SPEc,b,公式(13)和公式(14)表示为:
Figure GDA00022766106800000914
Figure GDA00022766106800000915
式中,Σc,b表示辅监控模型特征值组成的对角阵,
Figure GDA00022766106800000916
表示根据第c类故障信息获得的
Figure GDA00022766106800000917
中第b组变量;
通过核密度估计计算分别统计量T2的控制限
Figure GDA00022766106800000918
统计量SPE的控制限SPElim、统计量
Figure GDA00022766106800000919
的控制限
Figure GDA00022766106800000920
和统计量SPEc,b的控制限[SPEc,b]lim
(八)采用贝叶斯推理整合所有监控结果得到总的监控统计量
Figure GDA00022766106800000921
和BICSPE,具体步骤为:
定义样本
Figure GDA00022766106800000922
在第b个统计量发生故障的概率为:
Figure GDA0002276610680000101
式中,S表示统计量T2、统计量SPE、统计量
Figure GDA0002276610680000102
和统计量SPEc,b
Figure GDA0002276610680000103
表示样本故障的后验概率,
Figure GDA0002276610680000104
代表正常情况下的后验概率,通过公式(16)和公式(17)分别求解
Figure GDA0002276610680000105
Figure GDA0002276610680000106
公式(16)和公式(17)表示为:
Figure GDA0002276610680000107
Figure GDA0002276610680000108
式中,Slim表示统计量T2、统计量SPE、统计量
Figure GDA0002276610680000109
和统计量SPEc,b相应的控制限,P(F)为置信水平α,则P(N)=1-α,进而融合所有的监控结果所得总监控统计量为:
Figure GDA00022766106800001010
Figure GDA00022766106800001011
依据融合后的总监控统计量
Figure GDA00022766106800001012
或总监控统计量BICSPE是否超过控制限判断数据集
Figure GDA00022766106800001013
是否是故障数据;当
Figure GDA00022766106800001014
或BICSPE>0.01时,则认为过程出现了故障;否则,认为过程中并无故障发生。
上述方法中,步骤(一)至(五)为离线建模阶段,步骤(六)至(八)为在线测试阶段。
本发明上述故障检测方法,一方面利用正常过程数据建立PCA模型,作为主监控模型,另一方面根据正常过程数据与故障数据之间的相对互信息对变量分组,然后针对先验故障信息建立PCA模型,作为辅助监控模型,融合主监控模型和辅助监控模型的结果监视过程变化。能够利用先验故障信息并能够深入挖掘变量局部信息,减少有用故障信息的浪费和遗漏,提高故障检测率,进而改善故障检测结果。
为了能更清楚地说明本发明上述故障检测方法的有益效果,以下结合实施例对本发明上述故障检测方法做出进一步说明。
实施例:连续搅拌反应釜(简称:CSTR)控制***,作为一类化学反应器,具有成本低、热交换能力强和产品质量稳定等优势,在工业过程反应中得到广泛应用。在反应过程中,反应物A在反应器中发生一级不可逆的放热反应,同时生成物质B。该CSTR控制***中测量了10个变量,其中包括4个状态变量和6个输入变量,变量详情见表1。
表1
变量 说明
C<sub>a</sub> 反应物A从反应釜流出时的浓度
T 反应釜的温度
T<sub>c</sub> 夹套出口冷却剂的温度
h 反应釜液位高度
Q 反应釜流出物料的浓度
Q<sub>c</sub> 夹套内冷却剂的流量
Q<sub>f</sub> 进料A的流量
C<sub>af</sub> 反应釜进料A的浓度
T<sub>f</sub> 进料A的温度
T<sub>cf</sub> 夹套入口冷却剂温度
在上述CSTR控制***仿真中,采集了1000个正常数据作为训练集,另生成表2中的6种故障数据,每种故障均包含1000个样本,每种故障均从第161个采样点加入故障。
表2
故障 描述
1 进料流量阶跃变化
2 进料浓度斜坡变化
3 催化剂的活性降低
4 热交换率下降
5 反应器温度传感器发生偏差
6 冷却水温度传感器发生偏差
采用本发明上述故障检测方法(以下简称:PA-PCA方法)对本实施例所述CSTR控制***进行故障检测。检测到发生故障后,为评价不同故障检测方法的故障检测性能,通过故障检出率FDR指标对不同方法的故障检测结果对比。故障检出率FDR定义为能够检测出的故障数据个数占总故障数据个数的百分比。很显然,FDR的数值越大,意味着工业过程故障检测方法的故障检测效果越好;反之,工业过程故障检测方法的故障检测效果越差。
在本实施例的CSTR控制***仿真中,采用PCA方法和本发明PA-PCA方法两种方法监控过程的变化。选取故障1(阶跃故障)和故障4(斜坡故障)两种不同类型的信息作为先验故障信息。两种方法中主元个数的选取均根据80%的方差贡献率,变量组划分的阈值γ设置为0.65,99%置信度被用来计算各方法的控制限。以故障3和故障6为例说明故障检测效果。
图3a给出了正常测试数据与标准正常数据的互信息对比示意图,图3b给出了CSTR控制***中的故障1与标准正常数据的互信息对比示意图,图3c给出了CSTR控制***中的故障4与标准正常数据的互信息对比示意图。图3a-3c中均为变量1与其余变量之间的互信息。从图3a可以看出,两组不同正常数据集的互信息基本是重合的,说明在正常工况下,过程数据中变量间的相关关系结构基本没有发生变化。从图3b和图3c可以看出,两种不同故障的互信息和标准正常数据集之间的互信息存在较大差异,说明在异常工况下,过程数据中变量间的相关关系结构发生了变化,这也验证了本发明从先验故障信息考虑的必要性。
故障3是由催化剂的活性以斜坡的形式发生变化而引起。图4a给出了利用故障1的先验信息变量分组结果示意图,图4b给出了利用故障4的先验信息变量分组结果示意图。从图4a、图4b中可以看出,利用不同的先验故障信息可以得到不同的变量分组结果。PCA方法和本发明PA-PCA方法的故障监控图如图5。根据图5a,PCA方法的T2和SPE统计量分别在第760和第639个采样时刻给出报警信号,两个统计量的故障检出率分别为32.02%和39.88%,故障检出率较低。而图5b中,PA-PCA方法的两个统计量能够比传统PCA方法分别提前285和106个时刻报警,且故障检出率分别为46.43%和58.81%,与传统PCA方法相比,监控性能得到了提高。
故障6是由冷却水温度传感器发生偏差而引起的。两种方法对该故障的监控图如图6a和图6b所示。由图6a可以看出,PCA方法的两个统计量虽然能够在第413和239个采样时刻检测出该故障,但是统计量均在控制线的上下波动,这使得大部分统计量位于控制线下方,故障检出率仅为26.07%和40.6%。相比之下,虽然本发明PA-PCA方法中SPE统计量的监控性能与传统PCA方法基本一致,检测时刻提前了1个,故障检出率为43.45%,但是本发明PA-PCA方法的T2统计量能够在第161个采样时刻及时给出报警信号,比PCA方法的T2统计量提前了252个时刻,且具有较高的故障检出率,故障检出率提到了77.5%,监控性能得到了提升,如图6b。因此,本发明所提的PA-PCA方法能够改善对CSTR控制***故障6的故障检测性能。
表3给出了PCA方法和本发明PA-PCA方法对于CSTR控制***6种故障的故障检出率。
表3
Figure GDA0002276610680000131
由表3可知,本发明PA-PCA方法对6种故障的监控效果最好,具有最高的平均故障检出率,尤其是对故障3和故障6的监控性能改善更为明显。综合以上分析,本发明PA-PCA方法的故障检测效果要优于传统PCA方法。
以上所举实施例仅用为方便举例说明本发明,并非对本发明保护范围的限制,在本发明所述技术方案范畴,所属技术领域的技术人员所作各种简单变形与修饰,均应包含在以上申请专利范围中。

Claims (8)

1.一种基于主辅PCA模型的多变量工业过程故障检测方法,含有以下步骤:
(一)收集历史数据库中的正常数据集X和C类已知故障数据集Fc,c=1,2,...,C作为训练数据集,并使用正常数据集X的均值μ和标准差σ对训练数据集X和Fc进行标准化处理,得到标准化后的训练数据集
Figure FDA0002276610670000011
Figure FDA0002276610670000012
(二)对数据集
Figure FDA0002276610670000013
建立PCA模型作为主监控模型;
(三)计算故障数据集相对于正常数据集的相对互信息矩阵ΔRc,c=1,2,...,C;相对互信息矩阵ΔRc的计算步骤为:
通过公式(3)计算数据集
Figure FDA0002276610670000014
的互信息矩阵R,通过公式(4)计算数据集
Figure FDA0002276610670000015
的互信息矩阵Rc,公式(3)和公式(4)表示为:
Figure FDA0002276610670000016
Figure FDA0002276610670000017
式中,m表示变量个数,Rij表示数据集
Figure FDA0002276610670000018
的第i列和第j列的互信息,Rc,ij表示数据集
Figure FDA0002276610670000019
的第i列和第j列的互信息;
相对互信息矩阵ΔRc则表示为:
Figure FDA00022766106700000110
(四)对相对互信息矩阵ΔRc,基于广义Dice系数对过程变量进行变量分组,获得分组后的数据集
Figure FDA00022766106700000111
其中,Bc为变量组的个数;
(五)对分组后的数据集建立PCA模型作为辅助监控模型;
(六)采集测试数据集xnew,利用正常数据集X的均值μ和标准差σ对测试数据集xnew进行标准化处理,得到标准化后的测试数据集
Figure FDA0002276610670000021
(七)将数据集
Figure FDA0002276610670000022
分别向主监控模型和辅助监控模型投影,并计算数据集
Figure FDA0002276610670000023
投影到主监控模型的统计量T2和SPE,数据集
Figure FDA0002276610670000024
投影到辅助监控模型的统计量
Figure FDA0002276610670000025
和SPEc,b,通过核密度估计分别计算统计量T2的控制限
Figure FDA0002276610670000026
统计量SPE的控制限SPElim、统计量
Figure FDA0002276610670000027
的控制限
Figure FDA0002276610670000028
和统计量SPEc,b的控制限[SPEc,b]lim
(八)采用贝叶斯推理整合所有监控结果得到总的监控统计量
Figure FDA0002276610670000029
和BICSPE,根据统计量
Figure FDA00022766106700000210
或统计量BICSPE是否超出控制限判断数据集
Figure FDA00022766106700000211
是否发生故障;采用贝叶斯推理整合所有监控结果的具体步骤为:
定义样本
Figure FDA00022766106700000212
在第b个统计量发生故障的概率为:
Figure FDA00022766106700000213
式中,S表示统计量T2、统计量SPE、统计量
Figure FDA00022766106700000214
和统计量SPEc,b
Figure FDA00022766106700000215
表示样本故障的后验概率,
Figure FDA00022766106700000216
代表正常情况下的后验概率,通过公式(16)和公式(17)分别求解
Figure FDA00022766106700000217
Figure FDA00022766106700000218
公式(16)和公式(17)表示为:
Figure FDA00022766106700000219
Figure FDA00022766106700000220
式中,Slim表示统计量T2、统计量SPE、统计量
Figure FDA00022766106700000221
和统计量SPEc,b相应的控制限,P(F)为置信水平α,则P(N)=1-α,进而融合所有的监控结果所得总监控统计量为:
Figure FDA00022766106700000222
2.如权利要求1所述的基于主辅PCA模型的多变量工业过程故障检测方法,其特征在于,所述步骤(一)中,利用正常数据集的均值μ和标准差σ通过公式(1)对训练数据集X和Fc进行标准化处理,公式(1)的表达式为:
Figure FDA0002276610670000031
训练数据集X和Fc经上述公式(1)标准化处理后即可获得标准化后的训练数据集
Figure FDA0002276610670000032
Figure FDA0002276610670000033
3.如权利要求2所述的基于主辅PCA模型的多变量工业过程故障检测方法,其特征在于,所述步骤(二)中,对训练数据集
Figure FDA0002276610670000034
进行PCA分解,通过公式(2)中的主监控模型计算训练数据集的负载矩阵P,公式(2)表示为:
Figure FDA0002276610670000035
式中,T为数据集
Figure FDA0002276610670000036
的得分矩阵,E为数据集
Figure FDA0002276610670000037
的模型残差矩阵。
4.如权利要求1所述的基于主辅PCA模型的多变量工业过程故障检测方法,其特征在于,步骤(四)中,进行变量分组的具体步骤为:
(1)定义相对互信息向量为:
ri=[ΔRc,i1,ΔRc,i2,…,ΔRc,im]T (6)
用广义Dice系数衡量某一变量与其余变量之间相对互信息相关度的相似性,定义为:
Figure FDA0002276610670000038
式中,0≤Si,j≤1;
选择使||ri||最大的变量作为第一个变量组并初始化变量组的个数Bc=1;
(2)按照变量顺序选择下一个向量rj,其中j≠i且j≤m,并通过公式(8)计算向量rj与已知变量组中各向量相似性的均值,公式(8)表示为:
Figure FDA0002276610670000039
式中,b表示第b个变量组,nb表示第b个变量组内变量的个数;
(3)确定
Figure FDA0002276610670000041
中最大的值并判断其值是否超过阈值γ,若超过γ,则该向量所对应的变量xj被划分到变量组b中;反之,变量xj构成一个新变量组,即Bc=Bc+1;
(4)重复步骤(2)和步骤(3)直至所有的变量分组完成,即
Figure FDA0002276610670000042
5.如权利要求4所述的基于主辅PCA模型的多变量工业过程故障检测方法,其特征在于,步骤(五)中,对变量分组后的数据集
Figure FDA0002276610670000043
进行PCA分解,通过公式(9)中的辅助监控模型计算变量分组后数据集
Figure FDA0002276610670000044
的负载矩阵Pc,b,公式(9)表示为:
Figure FDA0002276610670000045
式中,Tc,b为数据集
Figure FDA0002276610670000046
的得分矩阵,Ec,b为数据集
Figure FDA0002276610670000047
的模型残差矩阵。
6.如权利要求5所述的基于主辅PCA模型的多变量工业过程故障检测方法,其特征在于,步骤(六)中,利用正常数据集X的均值μ和标准差σ通过公式(10)对测试数据集xnew进行标准化处理,进行标准化处理,公式(10)的表达式为:
Figure FDA0002276610670000048
测试数据集xnew经上述公式(10)标准化处理后即可获得标准化后的测试数据集
Figure FDA0002276610670000049
7.如权利要求6所述的基于主辅PCA模型的多变量工业过程故障检测方法,其特征在于,步骤(七)中,通过公式(11)和公式(12)计算数据集
Figure FDA00022766106700000410
投影到主监控模型的统计量T2和SPE,公式(11)和公式(12)表示为:
Figure FDA00022766106700000411
Figure FDA00022766106700000412
式中,Σ表示主监控模型特征值组成的对角阵;
通过公式(13)和公式(14)计算数据集
Figure FDA00022766106700000413
投影到辅助监控模型的统计量
Figure FDA00022766106700000414
和SPEc,b,公式(13)和公式(14)表示为:
Figure FDA00022766106700000415
Figure FDA0002276610670000051
式中,Σc,b表示辅监控模型特征值组成的对角阵,
Figure FDA0002276610670000052
表示根据第c类故障信息获得的
Figure FDA0002276610670000053
中第b组变量。
8.如权利要求1所述的基于主辅PCA模型的多变量工业过程故障检测方法,其特征在于,步骤(八)中,依据融合后的总监控统计量
Figure FDA0002276610670000054
或总监控统计量BICSPE是否超过控制限判断数据集
Figure FDA0002276610670000055
是否是故障数据;当
Figure FDA0002276610670000056
或BICSPE>0.01时,则认为过程出现了故障;否则,认为过程中并无故障发生。
CN201811503665.9A 2018-12-10 2018-12-10 基于主辅pca模型的多变量工业过程故障检测方法 Active CN109407652B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811503665.9A CN109407652B (zh) 2018-12-10 2018-12-10 基于主辅pca模型的多变量工业过程故障检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811503665.9A CN109407652B (zh) 2018-12-10 2018-12-10 基于主辅pca模型的多变量工业过程故障检测方法

Publications (2)

Publication Number Publication Date
CN109407652A CN109407652A (zh) 2019-03-01
CN109407652B true CN109407652B (zh) 2020-03-06

Family

ID=65458148

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811503665.9A Active CN109407652B (zh) 2018-12-10 2018-12-10 基于主辅pca模型的多变量工业过程故障检测方法

Country Status (1)

Country Link
CN (1) CN109407652B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110501986B (zh) * 2019-09-03 2021-06-18 山东科技大学 一种基于加权部分互信息的质量相关过程监控方法
CN110942258B (zh) * 2019-12-10 2022-02-25 山东科技大学 一种性能驱动的工业过程异常监测方法
CN111126870B (zh) * 2019-12-30 2023-10-27 华东理工大学 利用集成主成分分析的污水处理过程异常工况检测方法
CN111382029B (zh) * 2020-03-05 2021-09-03 清华大学 基于pca和多维监测数据的主板异常诊断方法及装置
CN111752147B (zh) * 2020-05-28 2022-04-22 山东科技大学 一种具有持续学习能力改进pca的多工况过程监测方法
CN111914888A (zh) * 2020-06-13 2020-11-10 宁波大学 一种多工况识别与故障检测一体化的化工过程监测方法
CN112180893B (zh) * 2020-09-15 2021-07-13 郑州轻工业大学 Cstr过程中故障相关分布式正交邻域保持嵌入模型的构建方法及其故障监控方法
CN112947649B (zh) * 2021-03-19 2021-11-23 安阳师范学院 一种基于互信息矩阵投影的多变量过程监控方法
CN115291582A (zh) * 2022-02-22 2022-11-04 江南大学 一种炼铁过程故障监测的方法、装置以及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015171654A1 (en) * 2014-05-06 2015-11-12 Kla-Tencor Corporation Automatic calibration sample selection for die-to-database photomask inspection
CN105955219A (zh) * 2016-05-30 2016-09-21 宁波大学 基于互信息的分布式动态过程故障检测方法
CN108762228A (zh) * 2018-05-25 2018-11-06 江南大学 一种基于分布式pca的多工况故障监测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015171654A1 (en) * 2014-05-06 2015-11-12 Kla-Tencor Corporation Automatic calibration sample selection for die-to-database photomask inspection
CN105955219A (zh) * 2016-05-30 2016-09-21 宁波大学 基于互信息的分布式动态过程故障检测方法
CN108762228A (zh) * 2018-05-25 2018-11-06 江南大学 一种基于分布式pca的多工况故障监测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Distributed plant-wide process monitoring based on PCA with minimal redundancy maximal relevance;Chen Xu 等;《Chemometrics and Intelligent Laboratory Systems》;20171231;第53-63页 *
基于双层局部KPCA 的非线性过程微小故障检测方法;邓晓刚 等;《化工学报》;20180731;第3092-3100 *

Also Published As

Publication number Publication date
CN109407652A (zh) 2019-03-01

Similar Documents

Publication Publication Date Title
CN109407652B (zh) 基于主辅pca模型的多变量工业过程故障检测方法
Lou et al. A novel multivariate statistical process monitoring algorithm: Orthonormal subspace analysis
CN108062565B (zh) 基于化工te过程的双主元-动态核主元分析故障诊断方法
EP3005004B1 (en) System and method for monitoring a process
CN110244692B (zh) 化工过程微小故障检测方法
CN108803520B (zh) 一种基于变量非线性自相关性剔除的动态过程监测方法
Monroy et al. A semi-supervised approach to fault diagnosis for chemical processes
Yu A support vector clustering‐based probabilistic method for unsupervised fault detection and classification of complex chemical processes using unlabeled data
Zhang et al. Fault detection in the Tennessee Eastman benchmark process using principal component difference based on k-nearest neighbors
CN104714537A (zh) 一种基于联合相对变化分析和自回归模型的故障预测方法
CN112904810B (zh) 基于有效特征选择的流程工业非线性过程监测方法
CN108388234B (zh) 一种基于相关性划分多变量块pca模型的故障监测方法
CN103970092A (zh) 一种基于自适应fcm的多阶段发酵过程故障监测方法
CN104699077A (zh) 一种基于嵌套迭代费舍尔判别分析的故障变量隔离方法
CN108919755B (zh) 一种基于多块非线***叉关系模型的分布式故障检测方法
CN108830006B (zh) 基于线性评价因子的线性-非线性工业过程故障检测方法
CN104536439A (zh) 一种基于嵌套迭代费舍尔判别分析的故障诊断方法
CN114611067A (zh) 一种基于典型变量相异性分析的化工过程缓变故障检测方法
CN109683594B (zh) 一种异常变量精确识别与定位方法
Samuel et al. Fault detection in a multivariate process based on kernel PCA and kernel density estimation
CN103995985A (zh) 基于Daubechies小波变换和弹性网的故障检测方法
CN116661410A (zh) 基于加权有向图的大规模工业过程故障检测及诊断方法
CN113253682B (zh) 非线性化工过程故障检测方法
CN111914886A (zh) 一种基于在线简略核学习的非线性化工过程监测方法
Uchida et al. Process fault diagnosis method based on MSPC and LiNGAM and its application to Tennessee Eastman process

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant