CN114660931A - 用于石油化工过程故障诊断与识别的方法及*** - Google Patents

用于石油化工过程故障诊断与识别的方法及*** Download PDF

Info

Publication number
CN114660931A
CN114660931A CN202011530237.2A CN202011530237A CN114660931A CN 114660931 A CN114660931 A CN 114660931A CN 202011530237 A CN202011530237 A CN 202011530237A CN 114660931 A CN114660931 A CN 114660931A
Authority
CN
China
Prior art keywords
training
data
svm model
set data
training set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011530237.2A
Other languages
English (en)
Inventor
牛鲁娜
韩磊
兰正贵
陈文武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Petroleum and Chemical Corp
Sinopec Qingdao Safety Engineering Institute
Original Assignee
China Petroleum and Chemical Corp
Sinopec Qingdao Safety Engineering Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Petroleum and Chemical Corp, Sinopec Qingdao Safety Engineering Institute filed Critical China Petroleum and Chemical Corp
Priority to CN202011530237.2A priority Critical patent/CN114660931A/zh
Publication of CN114660931A publication Critical patent/CN114660931A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明提供一种用于石油化工过程故障诊断与识别的方法及***,属于化工安全技术领域。所述方法包括:通过训练集数据计算SVM模型的核函数参数;通过所述训练集数据训练所述SVM模型,其中,所述SVM模型的权重参数被用于过程变量对所述训练集数据类型的贡献得分,所述贡献得分被用于训练过程中所述过程变量的贡献得分排序,所述贡献得分排序被用于所述训练过程中特征选择;在训练完成后,获得最优特征集数据和最优SVM模型。本发明用于现代复杂的石油化工过程的故障诊断。

Description

用于石油化工过程故障诊断与识别的方法及***
技术领域
本发明涉及化工安全技术领域,具体地涉及一种用于石油化工过程故障诊断与识别的模型的获取方法、一种用于石油化工过程故障诊断与识别的在线诊断方法、一种用于石油化工过程故障诊断与识别的***、一种电子设备和一种计算机可读存储介质。
背景技术
由于石油化工过程具有极大的复杂性,对装置的安全性和可靠性也有更高的要求,因此,对石油化工过程进行在线诊断与识别故障极其重要。故障诊断与识别方法是保障过程安全稳定运行的重要技术手段,可通过监测***的异常状态,而准确定位故障点,及时对工艺操作进行优化调整,从而确保生产过程的稳定性、可靠性和安全性,达到提升生产效率、产品质量和生产安全的目的。
有一些现有方案是将支持向量机(Support Vector Machine,SVM)和相关向量机(Relevance Vector Machine,RVM)构成多分类模型解决监测电气设备是否状态异常,该方案对于特征较多以及数据集过大时,分类情况众多,计算耗时且准确性难以保证,很难实现在线化工装置的监测;还有一些现有方案是使用常规支持向量机SVM作为分类模型,用于监测数据***,其中,具体是结合经验,通过人工分析进行特征选择,同样,对于特征较多以及数据集过大时,形成可用的分类模型将是很困难的,并且不同人员可能对同一化工装置进行不同的特征选择,可能存在不合适的特征。
发明内容
本发明的目的是提供一种用于石油化工过程故障诊断与识别的方法及***,解决了现有技术由于没有合适的分类模型适合化工过程而导致的难以在线诊断与识别化工过程故障等技术问题。
为了实现上述目的,本发明实施例提供一种用于石油化工过程故障诊断与识别的模型的获取方法,该获取方法包括:
通过训练集数据计算SVM模型的核函数参数;
通过所述训练集数据训练所述SVM模型,其中,
所述SVM模型的权重参数被用于过程变量对所述训练集数据类型的贡献得分,
所述贡献得分被用于训练过程中所述过程变量的贡献得分排序,
所述贡献得分排序被用于所述训练过程中特征选择;
在训练完成后,获得最优特征集数据和最优SVM模型。
具体的,所述通过训练集数据计算SVM模型的核函数参数,其中,所述训练集数据通过预处理获得,所述预处理包括:
对待处理训练集数据执行数据归一化;
对数据归一化后训练集数据执行数据平衡化,其中,
所述数据平衡化包括对所述数据归一化后训练集数据进行NTS1次的NFS1倍交叉验证,并将交叉验证后获得的训练-验证集数据作为所述训练集数据,NTS1和NFS1为正整数且NTS1和NFS1分别为交叉验证的重复次数和数据分组数。
具体的,所述对待处理训练集数据执行数据归一化,其中,所述数据归一化的计算式为:
Figure BDA0002851952770000021
所述计算式中,x为所述待处理训练集数据,μ为所述待处理训练集数据的均值,σ1为所述待处理训练集数据的标准方差,y为数据归一化后训练集数据。
具体的,所述通过训练集数据计算SVM模型的核函数参数,包括:
通过训练集数据进行NTS2次的NFS2倍交叉验证,计算SVM模型的高斯核函数参数,其中,交叉验证后获得的NTS2个核函数参数值的均值作为所述SVM模型的高斯核函数参数,NTS2和NFS2为正整数且NTS2和NFS2分别为交叉验证的重复次数和数据分组数。
具体的,所述通过所述训练集数据训练所述SVM模型,包括:
选用目标函数,所述目标函数为:
Figure BDA0002851952770000031
所述目标函数式中,xi∈Rm和xj∈Rm,xi为m个过程变量中第i个样本的特征的向量,xj为m个过程变量中第j个样本的特征的向量,
yi∈{1,-1}和yj∈{1,-1},yi为所述第i个样本的类别,yj为所述第j个样本的类别,
k(xi,xj)为高斯核函数,所述高斯核函数k(xi,xj)为:
Figure BDA0002851952770000032
所述高斯核函数中,σ2为高斯核函数参数,
xi、xj属于训练特征集,yi、yj属于训练分类集,(xi,yi)和(xj,yj)属于训练集数据
Figure BDA0002851952770000033
min为最小值函数,αi和αj为拉格朗日乘子,n为样本数且为正整数;
选用约束条件,所述约束条件为:
Figure BDA0002851952770000034
0≤αi≤C,i=1,2,3,...,n
所述约束条件中C为预设权衡因子;
选用所述SVM模型的分类器,所述分类器f(xq)为:
f(xq)=wTxq+b
Figure BDA0002851952770000041
所述分类器中,xq为待分类的数据,b为常向量,w为xi的权重参数的向量。
具体的,所述通过所述训练集数据训练所述SVM模型,还包括:
确定所述贡献得分的映射式,所述映射式为:
Figure BDA0002851952770000042
所述映射式中,cp为所述贡献得分。
具体的,所述通过所述训练集数据训练所述SVM模型,还包括:
通过与所述训练集数据对应的训练特征集和训练分类集执行用于特征选择的迭代计算,
其中,所述迭代计算中一次计算包括:
通过当前的训练特征集和与所述当前的训练特征集对应的训练分类集,在所述约束条件下求解所述目标函数,训练所述分类器,并获得与各个特征的向量对应的权重参数的向量,
通过获得的权重参数的向量计算每个过程变量的贡献得分,形成所述过程变量的贡献得分排序,将形成的贡献得分排序作为各个特征的向量的特征排序,
根据所述特征排序,在所述当前的训练特征集中去除与所述特征排序中最小得分对应的特征,将去除后的训练特征集返回至所述训练所述分类器的步骤中。
具体的,所述迭代计算中一次计算,还包括:
至少计算性能指标量中F1-score值,所述性能指标量用于评估与所述当前的训练特征集对应的分类器;
记录所述F1-score值。
具体的,在所述通过所述训练集数据训练所述SVM模型之后,且在所述获得最优特征集数据和最优SVM模型之前,还包括:
根据记录的各个F1-score值大小关系,获得拟确定最优特征集数据和拟确定最优SVM模型,其中,所述拟确定最优SVM模型具有与所述拟确定最优特征集数据对应的分类器;
通过关于真实分类和预测分类的混淆矩阵计算所述拟确定最优SVM模型的故障检测率FDR、误报警率FAR和准确率ACC,将所述故障检测率FDR、所述误报警率FAR和所述准确率ACC作为最优特征集数据和最优SVM模型的评价因素。
本发明实施例提供一种用于石油化工过程故障诊断与识别的在线诊断方法,该在线诊断方法包括:
获取与所述训练集数据同数据结构的化工过程在线采集数据;
通过前述的最优特征集数据建立所述在线采集数据的测试集;
根据前述的最优SVM模型识别所述测试集的分类,确定化工过程正常或故障。
本发明实施例提供一种用于石油化工过程故障诊断与识别的***,该***包括:
离线训练模块,用于通过训练集数据计算SVM模型的核函数参数;
通过所述训练集数据训练所述SVM模型,其中,
所述SVM模型的权重参数被用于过程变量对所述训练集数据类型的贡献得分,
所述贡献得分被用于训练过程中所述过程变量的贡献得分排序,
所述贡献得分排序被用于所述训练过程中特征选择;
在训练完成后,获得最优特征集数据和最优SVM模型;
该***还包括:
在线诊断模块,用于获取与所述训练集数据同数据结构的化工过程在线采集数据;
通过所述最优特征集数据建立所述化工过程在线采集数据的测试集;
根据所述最优SVM模型识别所述测试集的分类,确定化工过程正常或故障。
再一方面,本发明实施例提供一种电子设备,该电子设备包括:
至少一个处理器;
存储器,与所述至少一个处理器连接;
其中,所述存储器存储有能被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令,所述至少一个处理器通过执行所述存储器存储的指令实现前述的方法。
又一方面,本发明实施例提供一种计算机可读存储介质,存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行前述的方法。
本发明实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明实施例,但并不构成对本发明实施例的限制。在附图中:
图1为本发明实施例的基于SVM非线性特征选择的石油化工过程故障诊断与识别流程示意图;
图2为本发明实施例的田纳西-伊斯曼过程流程示意图;
图3为本发明实施例的SVM故障诊断与识别故障与正常的数据对比示意图。
具体实施方式
以下结合附图对本发明实施例的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明实施例,并不用于限制本发明实施例。
实施例1
如图1,本发明实施例提供了用于石油化工过程故障诊断与识别的模型的获取方法,该获取方法包括:
通过训练集数据计算SVM模型的核函数参数;通过所述训练集数据训练所述SVM模型,其中,所述SVM模型的权重参数被用于过程变量(SVM模型的特征)对所述训练集数据类型的贡献得分,所述贡献得分被用于训练过程中所述过程变量的贡献得分排序,所述贡献得分排序被用于所述训练过程中特征选择;在训练完成后,获得最优特征集数据和最优SVM模型。
在一些具体实施中,对于收集训练集数据,可以通过化工过程中涉及的传感采集***和控制***等进行记录与收集。训练集数据可以经过预处理,所述预处理包括:对待处理训练集数据执行数据归一化;
对数据归一化后训练集数据执行数据平衡化,其中,
所述数据平衡化包括对所述数据归一化后训练集数据进行NTS1次的NFS1倍交叉验证,并将交叉验证后获得的训练-验证集数据作为所述训练集数据,NTS1和NFS1为正整数且NTS1和NFS1分别为交叉验证的重复次数和数据分组数,NTS1可以取为100,NFS1可以取为5,这一过程可以称为训练集数据的数据归一化和形成平衡数据集。
具体的,对于训练集数据归一化,将训练集数据标准化为均值为0,方差为1的标准正态分布数据集。利用零均值(z-score,Z分数,也叫标准分数standard score,是一个数与平均数的差再除以标准差的过程)规范化可以将原始数据集标准化为均值为0,方差为1的正态分布标准数据集合。表示原始数据偏离均值的距离长短,而该距离度量的标准是标准方差。当数据分布过于凌乱,无法判断最大值与最小值,或者数据中存在过多的奇异点时,可以采用z-score规范化对数据做归一化处理,数学表达如式(1)所示:
Figure BDA0002851952770000081
所述计算式中,x为所述待处理训练集数据,μ为所述待处理训练集数据的均值,σ1为所述待处理训练集数据的标准方差,y为数据归一化后训练集数据。
具体的,对于产生平衡的训练-验证数据集,利用100次的5倍交叉验证产生平衡的训练-验证数据集,因为不平衡的数据集可能会由于模型学习不充分,导致模型精度不高的后果。在算法计算时,可以选择迭代次数为100,保证参数尽可能最优。
对于训练过程,可以分为确定高斯核函数参数并计算所有特征的得分排名,以及确定最优特征集与最优SVM模型。
具体的,对于确定高斯核函数参数,可以通过10(此时的NFS2取10)倍交叉验证确定核函数参数;进一步地,交叉验证首先将训练数据平均分成X个小数据集,每次将其中一个作为测试集,X-1个作为训练集,训练过程重复NTS2次后产生X个可用的核参数值,然后将X个值的平均值作为核函数参数σ2。通常X的取值从3开始,常用取值为5和10。
具体的,对于计算所有变量对数据集类型的贡献得分排名,可以基于SVM的特征顺序进行后向特征选择,特征选择可以进行迭代计算,对数据集所有变量进行得分排名,依次进行迭代计算,剔除排名最低的特征直到特征集为空集。每次迭代过程中,特征的排名取决于权重系数,其数学表达如式(2)所示:
Figure BDA0002851952770000091
每一个特征集中第p个特征对应的排名分数(即贡献得分)计算如式(3)所示:
Figure BDA0002851952770000092
二分类问题中,对于样本数量为n的训练集数据
Figure BDA0002851952770000093
xi∈Rm和xj∈Rm,xi为m个过程变量中第i个样本的特征的向量,xj为m个过程变量中第j个样本的特征的向量,xi、xj属于训练特征集,yi、yj属于训练分类集,yi∈{1,-1}和yj∈{1,-1}(1和-1一者可以表示正常,则另一者表示故障),yi为所述第i个样本的类别标签,yj为所述第j个样本的类别标签,当yi=1时,可以将SVM模型的分类器表示为式(4):
f(xq)=wTxq+b (4)
所述分类器中,xq为待分类的数据,b为常向量,w为xi的权重参数的向量,此时,w=[w1,w2,...,wm]T,通过使用高斯核函数,基于SVM的二分类问题可以转化为式(5):
Figure BDA0002851952770000094
Figure BDA0002851952770000095
0≤αi≤C,i=1,2,3,...,n
上式目标函数和约束条件,αi和αj为拉格朗日乘子,C是预先设定的表示训练精度与模型复杂度的权衡因子,其中,高斯核函数k(xi,xj)可以为:
Figure BDA0002851952770000096
σ2为高斯核函数参数。
具体的,通过与所述训练集数据对应的训练特征集和训练分类集执行用于特征选择的迭代计算,
其中,所述迭代计算中一次计算包括:
通过当前的训练特征集和与所述当前的训练特征集对应的训练分类集,在所述约束条件下求解所述目标函数,训练所述分类器,并获得与各个特征的向量对应的权重参数的向量,
通过获得的权重参数的向量计算每个过程变量的贡献得分,形成所述过程变量的贡献得分排序,将形成的贡献得分排序作为各个特征的向量的特征排序,
根据所述特征排序,在所述当前的训练特征集中去除与所述特征排序中最小得分对应的特征,将去除后的训练特征集返回至所述训练所述分类器的步骤中。
在一些情况中,上述迭代计算开始时,还可以有初始化过程,当前的训练特征集可以初始化为一个原集合,并且初始化一个空的排序集合,将贡献得分用于排序后更新具备顺序的特征至排序集合,以此完成特征排序和去除。
具体的,对于确定最优特征集,对(3)式得到的变量排名依次建立的模型计算模型的分类性能指标量(可以只使用)F1-score值(F1-score,又称F-score或F-measure,是在二分类数据分析中的一种测试准确性的度量)、故障检测率FDR(False Discovery Rate)、误报警率FAR(Fault Detection Rate)和准确率ACC(Accuary),选择F1-score值最大的模型中的特征组成最优特征集。
具体的,对于确定最优模型,最优特征集对应的SVM模型为最优故障诊断与识别模型。在特征选择的迭代过程中,需要根据每个特征集对应的分类器的性能指标确定最优特征集和最优模型,可以选择评价二分类器性能的F1-score作为当前的指标量,F1-score通过结合精确度(Precision)和回忆度(Recall)评估模型的准确性,其表达式如(7)所示:
Figure BDA0002851952770000111
其中,式(7)中的量根据混淆矩阵确定,混淆矩阵如表1所示。
表1混淆矩阵
Figure BDA0002851952770000112
其中,TP表示被正确分类的正常数据,FP表示被错误分类的正常数据,TN表示被正确分类的故障数据,FN表示被错误分类的故障数据。精确度和回忆度对应的数学表达式如式(8),Precision计算式和Recall计算式:
Figure BDA0002851952770000113
Figure BDA0002851952770000114
为了证明提出的最优模型的故障诊断效果,可以将模型的FDR、误报警率FAR和准确率ACC作为评价因素,对应的数学表达式如(9):
Figure BDA0002851952770000115
Figure BDA0002851952770000116
Figure BDA0002851952770000117
在一些情况中,可以根据所需的故障诊断敏感程度选择上述评价因素的阈值。
本发明实施例还提供了用于石油化工过程故障诊断与识别的在线诊断方法,该在线诊断方法包括:
获取与所述训练集数据同数据结构的化工过程在线采集数据;
通过前述的最优特征集数据建立所述在线采集数据的测试集;
根据前述的最优SVM模型识别所述测试集的分类,确定化工过程正常或故障。
具体的,对于采集在线数据进行故障诊断与识别,可以收集与离线数据同类型过程数据并归一化,在线采集与训练集同类型的过程数据用于验证离线阶段建立的SVM故障诊断与识别模型,然后利用与训练集相同的归一化方法z-score规范化预处理采集的数据集。
具体的,可以根据离线阶段的最优特征集确定测试集对应的特征集。
具体的,可以利用最优SVM模型诊断与识别在线确定的特征集数据。计算模型的分类性能指标F1-score、故障检测率FDR、误报警率FAR和准确率ACC,用于评价故障诊断与识别效果。
实施例2
本发明实施例与实施例1属于同一发明构思,本发明实施例提供一种用于石油化工过程故障诊断与识别的***,该***包括:
离线训练模块,用于通过训练集数据计算SVM模型的核函数参数;
通过所述训练集数据训练所述SVM模型,其中,
所述SVM模型的权重参数被用于过程变量对所述训练集数据类型的贡献得分,
所述贡献得分被用于训练过程中所述过程变量的贡献得分排序,
所述贡献得分排序被用于所述训练过程中特征选择;
在训练完成后,获得最优特征集数据和最优SVM模型;
该***还包括:
在线诊断模块,用于获取与所述训练集数据同数据结构的化工过程在线采集数据;
通过所述最优特征集数据建立所述化工过程在线采集数据的测试集;
根据所述最优SVM模型识别所述测试集的分类,确定化工过程正常或故障。
对于所述离线训练模块,其中,所述训练集数据通过预处理获得,所述预处理包括:
对待处理训练集数据执行数据归一化;
对数据归一化后训练集数据执行数据平衡化,其中,
所述数据平衡化包括对所述数据归一化后训练集数据进行NTS1次的NFS1倍交叉验证,并将交叉验证后获得的训练-验证集数据作为所述训练集数据,NTS1和NFS1为正整数且NTS1和NFS1分别为交叉验证的重复次数和数据分组数。
对于所述离线训练模块,所述对待处理训练集数据执行数据归一化,其中,所述数据归一化的计算式为:
Figure BDA0002851952770000131
所述计算式中,x为所述待处理训练集数据,μ为所述待处理训练集数据的均值,σ1为所述待处理训练集数据的标准方差,y为数据归一化后训练集数据。
所述离线训练模块具体用于:通过训练集数据进行NTS2次的NFS2倍交叉验证,计算SVM模型的高斯核函数参数,其中,交叉验证后获得的NTS2个核函数参数值的均值作为所述SVM模型的高斯核函数参数,NTS2和NFS2为正整数且NTS2和NFS2分别为交叉验证的重复次数和数据分组数。
所述离线训练模块具体用于:选用目标函数,所述目标函数为:
Figure BDA0002851952770000132
所述目标函数式中,xi∈Rm和xj∈Rm,xi为m个过程变量中第i个样本的特征的向量,xj为m个过程变量中第j个样本的特征的向量,
yi∈{1,-1}和yj∈{1,-1},yi为所述第i个样本的类别,yj为所述第j个样本的类别,
k(xi,xj)为高斯核函数,所述高斯核函数k(xi,xj)为:
Figure BDA0002851952770000141
所述高斯核函数中,σ2为高斯核函数参数,
xi、xj属于训练特征集,yi、yj属于训练分类集,(xi,yi)和(xj,yj)属于训练集数据
Figure BDA0002851952770000142
min为最小值函数,αi和αj为拉格朗日乘子,n为样本数且为正整数;
选用约束条件,所述约束条件为:
Figure BDA0002851952770000143
0≤αi≤C,i=1,2,3,...,n
所述约束条件中C为预设权衡因子;
选用所述SVM模型的分类器,所述分类器f(xq)为:
f(xq)=wTxq+b
Figure BDA0002851952770000144
所述分类器中,xq为待分类的数据,b为常向量,w为xi的权重参数的向量。
所述离线训练模块具体用于:确定所述贡献得分的映射式,所述映射式为:
Figure BDA0002851952770000145
所述映射式中,cp为所述贡献得分。
所述离线训练模块具体用于通过与所述训练集数据对应的训练特征集和训练分类集执行用于特征选择的迭代计算,
其中,所述迭代计算中一次计算包括:
通过当前的训练特征集和与所述当前的训练特征集对应的训练分类集,在所述约束条件下求解所述目标函数,训练所述分类器,并获得与各个特征的向量对应的权重参数的向量,
通过获得的权重参数的向量计算每个过程变量的贡献得分,形成所述过程变量的贡献得分排序,将形成的贡献得分排序作为各个特征的向量的特征排序,
根据所述特征排序,在所述当前的训练特征集中去除与所述特征排序中最小得分对应的特征,将去除后的训练特征集返回至所述训练所述分类器的步骤中。
所述离线训练模块具体用于:至少计算性能指标量中F1-score值,所述性能指标量用于评估与所述当前的训练特征集对应的分类器;
记录所述F1-score值。
所述离线训练模块还用于:根据记录的各个F1-score值大小关系,获得拟确定最优特征集数据和拟确定最优SVM模型,其中,所述拟确定最优SVM模型具有与所述拟确定最优特征集数据对应的分类器;
通过关于真实分类和预测分类的混淆矩阵计算所述拟确定最优SVM模型的故障检测率FDR、误报警率FAR和准确率ACC,将所述故障检测率FDR、所述误报警率FAR和所述准确率ACC作为最优特征集数据和最优SVM模型的评价因素。
实施例3
本发明实施例与实施例1和2属于同一发明构思,本发明实施例提供了田纳西-伊斯曼(TE)过程的诊断与识别方法,该过程能够代表一般的现代化工过程,本发明实施例选择该过程数据作为方法验证依据。
1.如下图2所示(P代表压力,F代表流量,T代表温度,J代表功率,H代表阀门开度,L代表液位,I代表指示和C代表控制),TE过程主要由反应器、冷凝器、汽提塔、气液分离塔、压缩机等多个操作单元构成。TE过程共有四种气体反应物分别为:A(g)、D(g)、E(g)和C(g),这4种(简记为A、D、E、C)气体反应物中分别都含有少数的惰性气体B(g)(简记为B)。在催化剂的作用下,反应器中主要有4个同时进行的化学反应,其中的两个主化学反应生成的液态产物分别为液态产物G(liq)(简记为G)和液态产物H(liq)(简记为H),同时会生成液态副产物F,四个化学反应方程如式(10):
A(g)+C(g)+D(g)→G(liq)
A(g)+C(g)+E(g)→H(liq)
A(g)+E(g)→F(liq)
3D(g)→2F(liq) (10)
TE过程包括41个测量变量和12个控制变量,如下表2所示。工况包括一种正常工况和21种可操作的故障工况(SVM的目标可为故障分类或故障工况分类)。21种工况下的采样时间间隔都设置为3分钟。在工业过程的正常工况下,过程运48小时产生的960个数据样本被采集作为正常数据样本;在所有21种过程的故障工况下,都是在过程稳定运行8小时后引入故障,故采集的960个数据样本中前面的160个数据样本不含有故障,后面800个数据样本含有故障。将在正常工况下采集的960个数据样本作为训练样本,所有含有故障的数据样本作为测试样本。故障模式1-7是关于TE过程变量的阶跃故障,故障模式8-12是变量的随机变化故障,故障模式13是化工反应动力学的慢漂移故障,故障模式14-15是相应的粘滞故障,故障模式16-20是未知故障,故障模式21为恒定位置故障。
表2田纳西-伊斯曼过程故障
Figure BDA0002851952770000171
2.数据标准化。原始数据都来自于多个传感器,每组数据都有各自的量纲、数据级别范围,为了将所有数据整合在一个数据矩阵中进行后续的聚类分析,需要对这些数据数据归一化。归一化将待分析的数据变成具有相对关系的可在同一数量级上进行衡量的相对数值,是一种缩小数值之间落差的有效方法。将TE数据的正常与故障1工况数据组成预处理数据集,进行z-score规范化。
3.交叉验证产生平衡数据集。5倍交叉验证将训练集数据平均分成五部分,每一部分依次作为训练集,其他的作为测试集进行交叉验证,平衡数据集,避免原始数据不平衡而导致SVM模型精度低。
4.100次的10倍交叉验证确定高斯核函数参数。交叉验证首先将训练数据平均分成X个小数据集,每次将其中一个作为测试集,X-1个作为训练集,训练过程重复X次后产生X个可用的核参数值,然后将X个值的平均值作为核函数参数σ2
5.最优SVM模型与最优特征集确定。以TE过程故障1为例。最优SVM非线性模型评价指标F1-score为100%、故障检测率为100%、误报警率为0%、模型精度ACC为100时,最优特征集对应操作变量44。
6.故障1在线诊断与识别。根据变量44就可以诊断出故障1,如下图3所示。另外,故障1中变量排名最前的是44、1、4和18,若C进料变化,导致测量变量18(汽提塔温度)改变,为了保持组分B含量不变,需要改变操作变量44(A进料),对应的测量变量为1(A进料)和4(总进料)。
本发明适用于现代复杂的石油化工过程的故障诊断,可以选择田纳西-伊斯曼(TE)过程故障作为方法验证依据,该过程具有一般性和代表性。然后对训练集数据进行z-score标准化,将来自不同传感器的具有很大值域差异的数据归一化为满足均值为1、方差为0的正态分布数据。基于SVM故障诊断与识别模型的高斯核函数参数由10倍交叉验证确定,然后计算用于建模的所有变量的得分排名。通过F1-score、故障检测率FDR、误报警率FAR和模型精度ACC选择最优的SVM故障诊断与识别模型和最优特征集。最后在线采集数据集利用SVM模型实现故障诊断与识别。相对于其他基于数据驱动的故障诊断方法,具有准确、客观,效率高等特点;本发明立足于数据本身的信息,诊断与识别过程的算法耗时少,能够提高现代复杂石油化工过程故障诊断与识别的效率。
以上结合附图详细描述了本发明实施例的可选实施方式,但是,本发明实施例并不限于上述实施方式中的具体细节,在本发明实施例的技术构思范围内,可以对本发明实施例的技术方案进行多种简单变型,这些简单变型均属于本发明实施例的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本发明实施例对各种可能的组合方式不再另行说明。
本领域技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得单片机、芯片或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
此外,本发明实施例的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明实施例的思想,其同样应当视为本发明实施例所公开的内容。

Claims (13)

1.一种用于石油化工过程故障诊断与识别的模型的获取方法,其特征在于,该获取方法包括:
通过训练集数据计算SVM模型的核函数参数;
通过所述训练集数据训练所述SVM模型,其中,
所述SVM模型的权重参数被用于过程变量对所述训练集数据类型的贡献得分,
所述贡献得分被用于训练过程中所述过程变量的贡献得分排序,
所述贡献得分排序被用于所述训练过程中特征选择;
在训练完成后,获得最优特征集数据和最优SVM模型。
2.根据权利要求1所述的用于石油化工过程故障诊断与识别的模型的获取方法,其特征在于,所述通过训练集数据计算SVM模型的核函数参数,其中,所述训练集数据通过预处理获得,所述预处理包括:
对待处理训练集数据执行数据归一化;
对数据归一化后训练集数据执行数据平衡化,其中,
所述数据平衡化包括对所述数据归一化后训练集数据进行NTS1次的NFS1倍交叉验证,并将交叉验证后获得的训练-验证集数据作为所述训练集数据,NTS1和NFS1为正整数且NTS1和NFS1分别为交叉验证的重复次数和数据分组数。
3.根据权利要求2所述的用于石油化工过程故障诊断与识别的模型的获取方法,其特征在于,所述对待处理训练集数据执行数据归一化,其中,所述数据归一化的计算式为:
Figure FDA0002851952760000011
所述计算式中,x为所述待处理训练集数据,μ为所述待处理训练集数据的均值,σ1为所述待处理训练集数据的标准方差,y为数据归一化后训练集数据。
4.根据权利要求1所述的用于石油化工过程故障诊断与识别的模型的获取方法,其特征在于,所述通过训练集数据计算SVM模型的核函数参数,包括:
通过训练集数据进行NTS2次的NFS2倍交叉验证,计算SVM模型的高斯核函数参数,其中,交叉验证后获得的NTS2个核函数参数值的均值作为所述SVM模型的高斯核函数参数,NTS2和NFS2为正整数且NTS2和NFS2分别为交叉验证的重复次数和数据分组数。
5.根据权利要求1所述的用于石油化工过程故障诊断与识别的模型的获取方法,其特征在于,所述通过所述训练集数据训练所述SVM模型,包括:
选用目标函数,所述目标函数为:
Figure FDA0002851952760000021
所述目标函数式中,xi∈Rm和xj∈Rm,xi为m个过程变量中第i个样本的特征的向量,xj为m个过程变量中第j个样本的特征的向量,
yi∈{1,-1}和yj∈{1,-1},yi为所述第i个样本的类别,yj为所述第j个样本的类别,
k(xi,xj)为高斯核函数,所述高斯核函数k(xi,xj)为:
Figure FDA0002851952760000022
所述高斯核函数中,σ2为高斯核函数参数,
xi、xj属于训练特征集,yi、yj属于训练分类集,(xi,yi)和(xj,yj)属于训练集数据
Figure FDA0002851952760000031
min为最小值函数,αi和αj为拉格朗日乘子,n为样本数且为正整数;
选用约束条件,所述约束条件为:
Figure FDA0002851952760000032
0≤αi≤C,i=1,2,3,...,n
所述约束条件中C为预设权衡因子;
选用所述SVM模型的分类器,所述分类器f(xq)为:
f(xq)=wTxq+b
Figure FDA0002851952760000033
所述分类器中,xq为待分类的数据,b为常向量,w为xi的权重参数的向量。
6.根据权利要求5所述的用于石油化工过程故障诊断与识别的模型的获取方法,其特征在于,所述通过所述训练集数据训练所述SVM模型,还包括:
确定所述贡献得分的映射式,所述映射式为:
Figure FDA0002851952760000034
所述映射式中,cp为所述贡献得分。
7.根据权利要求6所述的用于石油化工过程故障诊断与识别的模型的获取方法,其特征在于,所述通过所述训练集数据训练所述SVM模型,还包括:
通过与所述训练集数据对应的训练特征集和训练分类集执行用于特征选择的迭代计算,
其中,所述迭代计算中一次计算包括:
通过当前的训练特征集和与所述当前的训练特征集对应的训练分类集,在所述约束条件下求解所述目标函数,训练所述分类器,并获得与各个特征的向量对应的权重参数的向量,
通过获得的权重参数的向量计算每个过程变量的贡献得分,形成所述过程变量的贡献得分排序,将形成的贡献得分排序作为各个特征的向量的特征排序,
根据所述特征排序,在所述当前的训练特征集中去除与所述特征排序中最小得分对应的特征,将去除后的训练特征集返回至所述训练所述分类器的步骤中。
8.根据权利要求7所述的用于石油化工过程故障诊断与识别的模型的获取方法,其特征在于,所述迭代计算中一次计算,还包括:
至少计算性能指标量中F1-score值,所述性能指标量用于评估与所述当前的训练特征集对应的分类器;
记录所述F1-score值。
9.根据权利要求8所述的用于石油化工过程故障诊断与识别的模型的获取方法,其特征在于,在所述通过所述训练集数据训练所述SVM模型之后,且在所述获得最优特征集数据和最优SVM模型之前,还包括:
根据记录的各个F1-score值大小关系,获得拟确定最优特征集数据和拟确定最优SVM模型,其中,所述拟确定最优SVM模型具有与所述拟确定最优特征集数据对应的分类器;
通过关于真实分类和预测分类的混淆矩阵计算所述拟确定最优SVM模型的故障检测率FDR、误报警率FAR和准确率ACC,将所述故障检测率FDR、所述误报警率FAR和所述准确率ACC作为最优特征集数据和最优SVM模型的评价因素。
10.一种用于石油化工过程故障诊断与识别的在线诊断方法,其特征在于,该在线诊断方法包括:
获取与所述训练集数据同数据结构的化工过程在线采集数据;
通过权利要求1至9中任意一项所述的最优特征集数据建立所述在线采集数据的测试集;
根据权利要求1至9中任意一项所述的最优SVM模型识别所述测试集的分类,确定化工过程正常或故障。
11.一种用于石油化工过程故障诊断与识别的***,其特征在于,该***包括:
离线训练模块,用于通过训练集数据计算SVM模型的核函数参数;
通过所述训练集数据训练所述SVM模型,其中,
所述SVM模型的权重参数被用于过程变量对所述训练集数据类型的贡献得分,
所述贡献得分被用于训练过程中所述过程变量的贡献得分排序,
所述贡献得分排序被用于所述训练过程中特征选择;
在训练完成后,获得最优特征集数据和最优SVM模型;
该***还包括:
在线诊断模块,用于获取与所述训练集数据同数据结构的化工过程在线采集数据;
通过所述最优特征集数据建立所述化工过程在线采集数据的测试集;
根据所述最优SVM模型识别所述测试集的分类,确定化工过程正常或故障。
12.一种电子设备,其特征在于,该电子设备包括:
至少一个处理器;
存储器,与所述至少一个处理器连接;
其中,所述存储器存储有能被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令实现权利要求1至10中任意一项权利要求所述的方法。
13.一种计算机可读存储介质,存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行权利要求1至10中任意一项权利要求所述的方法。
CN202011530237.2A 2020-12-22 2020-12-22 用于石油化工过程故障诊断与识别的方法及*** Pending CN114660931A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011530237.2A CN114660931A (zh) 2020-12-22 2020-12-22 用于石油化工过程故障诊断与识别的方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011530237.2A CN114660931A (zh) 2020-12-22 2020-12-22 用于石油化工过程故障诊断与识别的方法及***

Publications (1)

Publication Number Publication Date
CN114660931A true CN114660931A (zh) 2022-06-24

Family

ID=82024488

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011530237.2A Pending CN114660931A (zh) 2020-12-22 2020-12-22 用于石油化工过程故障诊断与识别的方法及***

Country Status (1)

Country Link
CN (1) CN114660931A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116484292A (zh) * 2023-04-25 2023-07-25 上海船舶运输科学研究所有限公司 一种通过算法择优实现船舶柴油机滑油压力故障预测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116484292A (zh) * 2023-04-25 2023-07-25 上海船舶运输科学研究所有限公司 一种通过算法择优实现船舶柴油机滑油压力故障预测方法

Similar Documents

Publication Publication Date Title
CN108062565B (zh) 基于化工te过程的双主元-动态核主元分析故障诊断方法
Samanta et al. Artificial neural networks and genetic algorithm for bearing fault detection
Said et al. Machine learning technique for data-driven fault detection of nonlinear processes
CN112200104B (zh) 一种基于增强主成分分析新型贝叶斯框架的化工故障诊断方法
CN111222549A (zh) 一种基于深度神经网络的无人机故障预测方法
WO2011034805A1 (en) Supervised fault learning using rule-generated samples for machine condition monitoring
EP2930579A2 (en) State monitoring system, state monitoring method and state monitoring program
CN111898690B (zh) 一种电力变压器故障分类方法及***
CN113255848A (zh) 基于大数据学习的水轮机空化声信号辨识方法
CN113420061B (zh) 炼油和化工生产装置的稳态工况分析方法、优化调试方法及***
US20240144043A1 (en) Prediction model for predicting product quality parameter values
CN108681742B (zh) 用于分析司机驾驶行为对车辆能耗敏感性的分析方法
CN112904810B (zh) 基于有效特征选择的流程工业非线性过程监测方法
CN113092981A (zh) 晶圆数据检测方法及***、存储介质及测试参数调整方法
EP3712728A1 (en) Apparatus for predicting equipment damage
CN108830006B (zh) 基于线性评价因子的线性-非线性工业过程故障检测方法
CN110503133A (zh) 一种基于深度学习的离心式压缩机故障预测方法
CN115730241A (zh) 一种水轮机空化噪声识别模型的构建方法
CN115691722A (zh) 医疗数据检测的质控方法、装置、设备、介质及程序产品
CN116380445A (zh) 基于振动波形的设备状态诊断方法及相关装置
CN112000081A (zh) 基于多块信息提取和马氏距离的故障监测方法及***
CN115496108A (zh) 一种基于流形学习和大数据分析的故障监测方法及***
CN109683594B (zh) 一种异常变量精确识别与定位方法
CN113721000B (zh) 一种变压器油中溶解气体异常检测方法和***
CN112434739A (zh) 一种基于多核学习的支持向量机的化工过程故障诊断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination