CN106569982A - 带奇异点检测补偿的gpr在线软测量方法及*** - Google Patents

带奇异点检测补偿的gpr在线软测量方法及*** Download PDF

Info

Publication number
CN106569982A
CN106569982A CN201610543007.7A CN201610543007A CN106569982A CN 106569982 A CN106569982 A CN 106569982A CN 201610543007 A CN201610543007 A CN 201610543007A CN 106569982 A CN106569982 A CN 106569982A
Authority
CN
China
Prior art keywords
point
sample point
sample
gpr
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610543007.7A
Other languages
English (en)
Inventor
熊伟丽
钟怀兵
刘登峰
徐保国
张丽萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangnan University
Original Assignee
Jiangnan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangnan University filed Critical Jiangnan University
Priority to CN201610543007.7A priority Critical patent/CN106569982A/zh
Publication of CN106569982A publication Critical patent/CN106569982A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种带奇异点检测补偿的GPR在线软测量方法及***,解决了软测量方法实际应用中查询样本可能出现奇异点影响预测结果这一问题。本发明所述的方法首先对训练样本利用高斯过程回归(GPR)方法进行建模,得到GPR软测量模型;然后对新来查询样本采用拉依达准则进行奇异点检测,当新来查询样本被确定为奇异值时,利用辅助模型对奇异值进行修补,然后再利用GPR软测量模型对修补后查询样本点进行预测;否则,直接使用GPR软测量模型对新来查询样本点进行预测。本发明用于最终实现对化工过程重要指标的在线估计,提升了工业***在运行期间的稳定性。

Description

带奇异点检测补偿的GPR在线软测量方法及***
技术领域
本发明涉及一种涉及带奇异点检测补偿的GPR在线软测量方法及***,属于复杂工业过程建模和软测量领域。
背景技术
科学技术的日益发展使得工业生产过程变得越来越复杂和精细,同时对工业过程的指标监控以及控制的要求更高。但是目前这些指标进行在线实时测量非常困难。因此软测量技术应运而生并大大节省了人工分析时间和设备成本。
目前,常见的基于数据的建模方法主要有偏最小二乘(partial least squares,PLS)、人工神经网络(artificial neural networks,ANN)、最小二乘支持向量机(leastsquares support vector machine,LSSVM)以及高斯过程回归(gaussian processregression,GPR)等。其中高斯过程回归是基于贝叶斯统计理论发展起来的一种全新机器学习方法。它在处理一些小样本、高维数、非线性等复杂问题上具有很好的适应性。除此之外,其还具有模型参数少、参数优化相对容易、输出具有概率意义等优点。
考虑到软测量模型在实际生产应用中会遇到一类问题,即当采集到一个新查询样本点时,无法保证所采样本点精确无误。然而传统软测量方法在研究应用中很少注意此类问题,一般只在离线建模阶段对训练样本进行奇异值处理,在实际应用中直接对查询样本点进行预测,以此结果对实际生产过程进行指导。但是,当查询样本点存在奇异值时,盲目对其进行预测必然会得到一个错误的预测值。使用此错误预测值对实际生产过程进行反馈指导时,必然会影响到实际工业生产***的稳定性与优化效果,甚至会引起***崩溃。
有鉴于上述的缺陷,本设计人积极加以研究创新,以期创设一种带奇异点检测补偿的GPR在线软测量方法及***,使其更具有产业上的利用价值。
发明内容
为解决上述技术问题,本发明的目的是提供一种有效检测出新的查询样本点为奇异点,并对奇异点进行补偿,提高了在线软测量预测的准确性,进而提升了工业***在运行期间的稳定性。
本发明带奇异点检测补偿的GPR在线软测量方法,包括:
利用高斯过程回归方法建立GPR软测量模型;
采用改进拉以达准则对新来的查询样本点进行奇异点检测;
若查询样本点为正常,则利用GPR软测量模型对该查询样本点进行预测,得到预测结果;
若查询样本点为奇异点,则利用奇异点信息对训练样本进行处理,得到处理后的训练样本集并建立辅助模型,随后利用辅助模型对奇异点xq进行修补,得到补偿后查询样本点则利用GPR软测量模型对该查询样本点进行预测,得到预测结果;
其中,拉依达准则具体为:
如果有训练数据集X={xi|xi∈Rm}i=1…n,m是过程变量的维数,n是训练数据的个数,X是一个n×m的矩阵,对于每一列数据根据下式得到其均值以及均方差Sj
当一个新采集样本点xq到来时对其每一维元素通过拉依达准则计算得到γj,其中
若满足任一γj>3,则表明此样本点属于奇异样本点,同时得到此样本点奇异值所处位置;
辅助模型修补包括:假设奇异查询样本点所处位置为样本点xq第j维,以此对训练样本集X进行处理,所述处理包括:
由xq得xq′={xq,1,xq,2…xq,j-1,xq,j+1…xq,m},同理由X得X′,如下式所示:
Y'=[x1,j,x2,j,……xn,j]T
同时对查询样本点xq进行处理,如下式所示:
通过上述处理得到X′、Y′以及xq′,其中X′是原训练样本X经过处理后所得新输入训练样本集,Y′是由原训练样本X中奇异值所处列组成的新输出训练样本集,而xq′则是xq经过处理后所得新查询样本点。最后将X′和Y′重新组合为一个新的训练样本集,利用高斯过程回归方法对其进行训练得到辅助模型;
利用所得辅助模型对xq′进行预测得到奇异值xq,j的预测值x′q,j,利用所得x′q,j对xq中奇异值xq,j进行替换得到补偿后查询样本点
进一步地,还包括对判定为奇异点的查询样本进行二次检测,具体包括:
利用欧氏距离的方法从训练样本中选取与xq最相似样本点,具体计算公式下如式所示:
di(xq,xi)=||xq,xi||,i=1,…,n
式中,xi、di以及si分别代表训练样本点、样本点之间欧式距离以及相似度系数;
由于奇异点中奇异值会对求取相似样本点产生干扰,故在求取相似样本点之前对奇异样本点进行处理。由奇异点xq得x′q={xq,1,xq,2…xq,j-1,xq,j+1…xq,m},同理由X得X′,如下式所示:
在X′中获得x′q最相似样本点x′p,从而获得x′p在X′中所在位置信息,最后根据所得位置信息获得xq在X中最相似样本点xp。得到误差向量xe如下式:
xe={xq,1-xp,1,xq,2-xp,2,…,xq,m-xp,m}
由误差向量xe得:
则查询样本点xq为奇异样本点;
否则,xq为误报奇异样本点即为正常查询样本点,其中α为预设阈值。
进一步地,预设阈值α定为0.9。
进一步地,GPR软测量模型模型如下:
给定训练样本集输入X={xi|xi∈Rm}i=1…n和输出Y={yi∈R}i=1…n,输入和输出之间的关系如下式所示:
y=f(x)+ε
其中f(x)是未知的函数形式,ε是均值为0,方差为的高斯噪声;
高斯过程回归模型是有限个f(xi)随机变量所组成的多元高斯分布:f(x1),…,f(xn)∝N(0,Σ),其中协方差矩阵的求取用到了径向基协方差函数,如下式所示:
其中v表示先验知识的总体度量;
表示服从高斯分布的噪声的方差;
δij是Kronecher算子;
ωt代表各辅助变量的相对重要性;
对于所述的径向基协方差函数,其对数似然函数如下公式所示:
其中超参数C为对应的协方差矩阵,然后对数似然函数进行求导得:
通过共轭梯度法得到最优的超参数θ;
对于新来测试样本点xq,假设其和训练样本的数据同属于一个联合正态分布,得到其预测均值和预测方差:
yq(xq)=cT(xq)C-1Y
其中c(xq)为测试样本和各个训练样本之间的协方差向量,c(xq,xq)为测试样本与自身的协方差值,C为训练样本的协方差矩阵。
本发明带奇异点检测补偿的GPR在线软测量***,包括:
模型建立单元,用于建立GPR软测量模型、GPR辅助模型;
奇异点检测单元,用于采用改进拉以达准则对新来的查询样本点进行奇异点检测;
若查询样本点为正常,则利用模型建立单元建立的GPR软测量模型对该查询样本点进行预测,得到预测结果;
若查询样本点为奇异点,则利用奇异点信息对训练样本进行处理,得到处理后的训练样本集,模型建立单元建立GPR辅助模型,随后利用该GPR辅助模型对奇异点xq进行修补,得到补偿后查询样本点则利用模型建立单元建立的GPR软测量模型对该补偿后查询样本点进行预测,得到预测结果;
其中,拉依达准则具体为:
如果有训练数据集X={xi|xi∈Rm}i=1…n,m是过程变量的维数,n是训练数据的个数,X是一个n×m的矩阵,对于每一列数据根据下式得到其均值以及均方差Sj
当一个新采集样本点xq到来时对其每一维元素通过拉依达准则计算得到γj,其中
若满足任一γj>3,则表明此样本点属于奇异样本点,同时得到此样本点奇异值所处位置;
辅助模型修补方法包括:假设奇异查询样本点所处位置为样本点xq第j维,以此对训练样本集X进行处理,所述处理包括:
由xq得x′q={xq,1,xq,2…xq,j-1,xq,j+1…xq,m},同理由X得X′、Y′,如下式所示:
Y'=[x1,j,x2,j,……xn,j]T
同时对查询样本点xq进行处理,如下式所示:
通过上述处理得到X′、Y′以及x′q,其中X′是原训练样本X经过处理后所得新输入训练样本集,Y′是由原训练样本X中奇异值所处列组成的新输出训练样本集,而x′q则是xq经过处理后所得新查询样本点。最后将X′和Y′重新组合为一个新的训练样本集,利用高斯过程回归方法对其进行训练得到辅助模型;
利用所得辅助模型对x′q进行预测得到奇异值xq,j的预测值x′q,j,利用所得x′q,j对xq中奇异值xq,j进行替换得到补偿后查询样本点
进一步地,还包括对奇异点二次查询单元,用于对判定为奇异点的查询样本进行二次检测,具体包括:
利用欧氏距离的方法从训练样本中选取与xq最相似样本点,具体计算公式下如式所示:
di(xq,xi)=||xq,xi||,i=1,…,n
式中,xi、di以及si分别代表训练样本点、样本点之间欧式距离以及相似度系数;
由于奇异点中奇异值会对求取相似样本点产生干扰,故在求取相似样本点之前对奇异样本点进行处理。由奇异点xq得x′q={xq,1,xq,2…xq,j-1,xq,j+1…xq,m},同理由X得X′,如下式所示:
在X′中获得x′q最相似样本点x′p,从而获得x′p在X′中所在位置信息,最后根据所得位置信息获得xq在X中最相似样本点xp。得到误差向量xe如下式:
xe={xq,1-xp,1,xq,2-xp,2,…,xq,m-xp,m}
由误差向量xe得:
则查询样本点xq为奇异样本点;
否则,xq为误报奇异样本点即为正常查询样本点,其中α为预设阈值。
借由上述方案,本发明至少具有以下优点:
本发明首先对原始训练数据利用高斯过程回归进行离线建模;其次利用改进拉依达准则对新来查询样本点进行奇异点检测。若新来查询样本点被确认为奇异点,则采用辅助模型方法对此奇异点进行修补,然后利用离线软测量模型对修补后查询样本点进行预测;否则,直接利用离线软测量模型对查询样本点进行预测。最终实现对化工过程重要指标的在线估计,并大大提高了***的稳定性。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合附图详细说明如后。
附图说明
图1是带奇异点检测补偿的GPR在线软测量方法的建模流程图;
图2硫回收装置流程;
图3无奇异点检测补偿方法预测结果;
图4无奇异点检测补偿方法预测误差;
图5奇异点检测性能对比;
图6带奇异点检测补偿方法预测结果;
图7带奇异点检测补偿方法预测误差。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
实施例1
本实施例带奇异点检测补偿的GPR在线软测量方法,通过一个实际硫回收工业过程数据进行仿真,验证了本发明所提方法具有较强的奇异点抗干扰能力。
步骤1:采集过程的输入和输出数据组成软测量建模数据库。
步骤2:对训练样本进行标准化、归一化以及去奇异点等预处理。
步骤3:将处理后输入数据和输出数据组成训练样本集并建立相应的GPR软测量模型。建立的GPR模型为:
给定训练样本集输入X={xi|xi∈Rm}i=1…n和输出Y={yi∈R}i=1…n。一般情况下输入和输出之间的关系如式(1)所示:
y=f(x)+ε (1)
其中f(x)是未知的函数形式,ε是均值为0,方差为的高斯噪声。高斯过程回归模型是有限个f(xi)随机变量所组成的多元高斯分布:f(x1),…,f(xn)∝N(0,Σ)。其中协方差矩阵的求取用到了协方差函数,本发明选取径向基协方差函数,如公式(2)所示:
其中v表示先验知识的总体度量,可以控制局部相关性的程度。表示服从高斯分布的噪声的方差,δij是Kronecher算子,ωt代表各辅助变量的相对重要性。对于上述的协方差函数,其对数似然函数如公式(3)所示:
其中超参数C为对应的协方差矩阵。然后对公式(3)对数似然函数进行求导可得:
通过共轭梯度法得到最优的超参数θ。
对于新来测试样本点xq,假设其和训练样本的数据同属于一个联合正态分布,可得到其预测均值和预测方差:
yq(xq)=cT(xq)C-1Y (5)
公式(5)、(6)中c(xq)为测试样本和各个训练样本之间的协方差向量,c(xq,xq)为测试样本与自身的协方差值,C为训练样本的协方差矩阵。
步骤4:当任意一个查询样本点xq到来时,采用拉依达准则对其进行奇异点检测。若查询样本点正常则转步骤6;否则,转步骤5。拉依达准则方法为:
如果有训练数据集X={xi|xi∈Rm}i=1…n,m是过程变量的维数,n是训练数据的个数。很明显X是一个n×m的矩阵。对于每一列数据我们可根据式(7)、(8)得到其均值以及均方差:
当一个新采集样本点xq到来时对其每一维元素通过式(9)计算得到γj
若满足任一γj>3,则表明此样本点属于奇异样本点,同时可得到此样本点奇异值所处位置。判别式(9)即为拉依达准则。
然而在实际应用之中我们会发现有一部分正常查询样本点会被检测为奇异样本点。针对此问题,结合相似度方法进一步对查询样本点进行分析,以此减少拉依达准则的误报率。
当拉依达准则检测到奇异点xq时,可假设奇异值所处位置为样本点xq第j维。然后可利用相似度准则的方法从训练样本中选取与xq最相似样本点。本发明相似度准则选择欧氏距离的方法,具体计算公式如式(10)、(11)所示:
di(xq,xi)=||xq,xi||,i=1,…,n (10)
式中,xi、di以及si分别代表训练样本点、样本点之间欧式距离以及相似度系数。
由于奇异点中奇异值会对求取相似样本点产生干扰,故在求取相似样本点之前对奇异样本点进行处理。首先由xq可得x′q={xq,1,xq,2…xq,j-1,xq,j+1…xq,m},同理由X可得X′,如式(12)所示:
通过式(10)、(11)可以在在X′中获得x′q最相似样本点x′p,从而获得x′p在X′中所在位置信息,最后根据所得位置信息可以获得xq在X中最相似样本点xp。。因此可得到误差向量xe如式(13)
xe={xq,1-xp,1,xq,2-xp,2,…,xq,m-xp,m} (13)
由误差向量xe可得:
(α为预设阈值,具体可根据实验仿真分析获取),则查询样本点xq为奇异样本点;否则,xq为误报奇异样本点即为正常查询样本点。
步骤5:首先利用奇异点信息对原始训练样本进行处理,得到处理后的训练样本集并建立辅助模型。随后利用辅助模型对奇异点xq进行修补,得到补偿后查询样本点辅助模型方法为:
当新采集查询样本点xq到来时,首先利用拉依达准则对其进行奇异值检测。若检测结果显示查询样本点xq属于正常查询样本点,则直接采用GPR软测量模型对其进行预测,同时对实际工业生产控制过程进行指导;否则,对查询样本点xq利用辅助模型方法进行修补,具体过程如下:
首先可假设奇异值所处位置为样本点xq第j维,以此对训练样本集X进行处理,如式(12)、(15)所示:
Y'=[x1,j,x2,j,……xn,j]T (15)
同时对查询样本点xq进行处理,如式(16)所示:
然后通过上述处理得到X′、Y′以及x′q,其中X′是原训练样本X经过处理后所得新输入训练样本集,Y′是由原训练样本X中奇异值所处列组成的新输出训练样本集,而x′q则是xq经过处理后所得新查询样本点。最后将X′和Y′重新组合为一个新的训练样本集,利用高斯过程回归方法对其进行训练得到辅助模型。建模具体过程可参考步骤3。
利用所得辅助模型对x′q进行预测得到奇异值xq,j的预测值x′q,j,利用所得x′q,j对xq中奇异值xq,j进行替换得到补偿后查询样本点
步骤6:利用所得GPR软测量模型对补偿后查询样本点或xq(查询样本点非奇异点时)进行预测并得到预测结果以此对实际工业生产控制过程进行指导。
从图3、图4中可以看出对于存在奇异点的测试样本集,如果不经处理直接对测试样本点进行预测则会在奇异点位置产生严重偏离真值的预测结果,如图3 中圆圈选中点所示。如果贸然利用此预测结果对实际工业过程进行指导,必定会对控制***产生较大冲击,甚至导致生产***崩溃,造成大量经济损失。
由于预设阈值α关系到奇异值检测结果的质量,故本发明对阈值α设置不同值时进行比较的检测。从图5对比可发现当取0.9是可以完全杜绝奇异点误报,故本发明预设阈值定为0.9。
通过图6、图7所示可以看出,经过奇异点检测与补偿过后的预测结果在奇异点位置能够很好的跟踪实际情况。相比于图3、图4所示结果,此方法能够对奇异点产生更强的抵抗能力,对实际工业过程提供更加精准的指导信息。
实施例2
本实施例基于辅助模型的GPR在线软测量***,包括:
模型建立单元,用于建立GPR软测量模型、辅助模型;
奇异点检测单元,用于采用改进拉以达准则对新来的查询样本点进行奇异点检测;
若查询样本点为正常,则利用模型建立单元建立的GPR软测量模型对该查询样本点进行预测,得到预测结果;
若查询样本点为奇异点,则利用奇异点信息对训练样本进行处理,得到处理后的训练样本集,模型建立单元建立辅助模型,随后利用该辅助模型对奇异点xq进行修补,得到补偿后查询样本点则利用模型建立单元建立的GPR软测量模型对该补偿后查询样本点进行预测,得到预测结果;
其中,拉依达准则具体为:
如果有训练数据集X={xi|xi∈Rm}i=1…n,m是过程变量的维数,n是训练数据的个数,X是一个n×m的矩阵,对于每一列数据根据下式得到其均值以及均方差Sj
当一个新采集样本点xq到来时对其每一维元素通过拉依达准则计算得到γj,其中
若满足任一γj>3,则表明此样本点属于奇异样本点,同时可得到此样本点奇异值所处位置;
辅助模型修补方法包括:假设奇异查询样本点所处位置为样本点xq第j维,以此对训练样本集X进行处理,所述处理包括:
由xq可得x′q={xq,1,xq,2…xq,j-1,xq,j+1…xq,m},同理由X可得X′,如下式所示:
Y'=[x1,j,x2,j,……xn,j]T
同时对查询样本点xq进行处理,如下式所示:
然后通过上述处理得到X′、Y′以及x′q,其中X′是原训练样本X经过处理后所得新输入训练样本集,Y′是由原训练样本X中奇异值所处列组成的新输出训练样本集,而x′q则是xq经过处理后所得新查询样本点。最后将X′和Y′重新组合为一个新的训练样本集,利用高斯过程回归方法对其进行训练得到辅助模型。
利用所得辅助模型对x′q进行预测得到奇异值xq,j的预测值x′q,j,利用所得x′q,j对xq中奇异值xq,j进行替换得到补偿后查询样本点
本实施例还包括对奇异点二次查询单元,用于对判定为奇异点的查询样本进行二次检测,具体包括:
利用欧氏距离的方法从训练样本中选取与xq最相似样本点,具体计算公式下如式所示:
di(xq,xi)=||xq,xi||,i=1,…,n
式中,xi、di以及si分别代表训练样本点、样本点之间欧式距离以及相似度系数;
由于奇异点中奇异值会对求取相似样本点产生干扰,故在求取相似样本点之前对奇异样本点进行处理。由奇异点xq得x′q={xq,1,xq,2…xq,j-1,xq,j+1…xq,m},同理由X得X′,如下式所示:
在X′中获得x′q最相似样本点x′p,从而获得x′p在X′中所在位置信息,最后根据所得位置信息可以获得xq在X中最相似样本点xp。得到误差向量xe如下式:
xe={xq,1-xp,1,xq,2-xp,2,…,xq,m-xp,m}
由误差向量xe得:
则查询样本点xq为奇异样本点;
否则,xq为误报奇异样本点即为正常查询样本点,其中α为预设阈值。
上述各实施例中建立的GPR软测量模型还可以替换为:偏最小二乘(partialleast squares,PLS)、人工神经网络(artificial neural networks,ANN)、最小二乘支持向量机(least squares support vector machine,LSSVM)。
以上所述仅是本发明的优选实施方式,并不用于限制本发明,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变型,这些改进和变型也应视为本发明的保护范围。

Claims (6)

1.一种带奇异点检测补偿的GPR在线软测量方法,其特征在于,包括:
利用高斯过程回归方法建立GPR软测量模型;
采用改进拉以达准则对新来的查询样本点xq进行奇异点检测;
若查询样本点为正常,则利用GPR软测量模型对该查询样本点进行预测,得到预测结果;
若查询样本点为奇异点,则利用奇异点信息对训练样本进行处理,得到处理后的训练样本集并建立辅助模型,随后利用辅助模型对查询样本点xq进行修补,得到补偿后查询样本点最后利用软测量模型对该查询样本点进行预测,得到预测结果;
其中,拉依达准则具体为:
有训练数据集X={xi|xi∈Rm}i=1…n,m是过程变量的维数,n是训练数据的个数,X是一个n×m的矩阵,对于每一列数据根据下式得到其均值以及均方差Sj
当一个新查询样本点xq到来时对其每一维元素通过拉依达准则计算得到γj,其中γj为:
若满足任一γj>3,则表明此样本点属于奇异样本点,同时可得到此样本点奇异值所处位置;
辅助模型修补包括:假设奇异查询样本点所处位置为查询样本点xq第j维,以此对训练样本集X进行处理,所述处理包括:
由查询样本点xq可得xq′={xq,1,xq,2…xq,j-1,xq,j+1…xq,m},同理由X可得X′以及Y′,如下式所示:
Y'=[x1,j,x2,j,……xn,j]T
通过上述处理得到X′、Y′以及x′q,其中X′是原训练样本X经过处理后所得新输入训练样本集,Y′是由原训练样本X中奇异值所处列组成的新输出训练样本集,而x′q则是xq经过处理后所得新查询样本点,最后将X′和Y′重新组合为一个新的训练样本集,利用高斯过程回归方法对其进行训练得到辅助模型;
利用所得辅助模型对x′q进行预测得到奇异值xq,j的预测值x′q,j,利用所得x′q,j对xq中奇异值xq,j进行替换得到补偿后查询样本点
2.根据权利要求1所述的带奇异点检测补偿的GPR在线软测量方法,其特征在于,还包括对判定为奇异点的查询样本进行二次检测,具体包括:
利用欧氏距离的方法从训练样本中选取与奇异点xq最相似样本点,具体计算公式下式所示:
di(xq,xi)=||xq,xi||,i=1,…,n
式中,xi、di以及si分别代表训练样本点、样本点之间欧式距离以及相似度系数;
由于奇异点中奇异值会对求取相似样本点产生干扰,故在求取相似样本点之前对奇异样本点进行处理,由奇异点xq得x′q={xq,1,xq,2…xq,j-1,xq,j+1…xq,m}。
在X′中获得x′q最相似样本点x′p,从而获得x′p在X′中所在位置信息,最后根据所得位置信息获得xq在X中最相似样本点xp,得到误差向量xe如下式:
xe={xq,1-xp,1,xq,2-xp,2,…,xq,m-xp,m}
由误差向量xe得:
则查询样本点xq为奇异样本点;
否则,查询样本点xq为误报奇异样本点即为正常查询样本点,其中α为预设阈值。
3.根据权利要求2所述的带奇异点检测补偿的GPR在线软测量方法,其特征在于,预设阈值α定为0.9。
4.根据权利要求1所述的带奇异点检测补偿的GPR在线软测量方法,其特征在于,GPR软测量模型模型如下:
给定训练样本集输入X={xi|xi∈Rm}i=1…n和输出Y={yi∈R}i=1…n,输入和输出之间的关系如下式所示:
y=f(x)+ε
其中f(x)是未知的函数形式,ε是均值为0,方差为的高斯噪声;
高斯过程回归模型是有限个f(xi)随机变量所组成的多元高斯分布:f(x1),…,f(xn)∝N(0,Σ),其中协方差矩阵的求取用到了径向基协方差函数,如下式所示:
其中v表示先验知识的总体度量;
表示服从高斯分布的噪声的方差;
δij是Kronecher算子;
ωt代表各辅助变量的相对重要性;
对于所述的径向基协方差函数,其对数似然函数如下公式所示:
其中超参数C为对应的协方差矩阵,然后对数似然函数进行求导得:
通过共轭梯度法得到最优的超参数θ;
对于新来测试样本点xq,假设其和训练样本的数据同属于一个联合正态分布,得到其预测均值和预测方差:
yq(xq)=cT(xq)C-1Y
其中c(xq)为测试样本和各个训练样本之间的协方差向量,c(xq,xq)为测试样本与自身的协方差值,C为训练样本的协方差矩阵。
5.一种带奇异点检测补偿的GPR在线软测量***,其特征在于,包括:
模型建立单元,用于建立GPR软测量模型、GPR辅助模型;
奇异点检测单元,用于采用改进拉依达准则对新来的查询样本点进行奇异点检测;
若查询样本点为正常,则利用模型建立单元建立的GPR软测量模型对该查询样本点进行预测,得到预测结果;
若查询样本点为奇异点,则利用奇异点信息对训练样本进行处理,得到处理后的训练样本集,模型建立单元建立GPR辅助模型,随后利用该GPR辅助模型对奇异点xq进行修补,得到补偿后查询样本点则利用模型建立单元建立的GPR软测量模型对该补偿后查询样本点进行预测,得到预测结果;
其中,拉依达准则具体为:
如果有训练数据集X={xi|xi∈Rm}i=1…n,m是过程变量的维数,n是训练数据的个数,X是一个n×m的矩阵,对于每一列数据根据下式得到其均值以及均方差Sj
当一个新采集样本点xq到来时对其每一维元素通过拉依达准则计算得到γj,其中 γ j = | x q , j - x ‾ j | S j , j = 1 ... m
若满足任一γj>3,则表明此样本点属于奇异样本点,同时得到此样本点奇异值所处位置;
辅助模型修补方法包括:假设奇异查询样本点所处位置为样本点xq第j维,以此对训练样本集X进行处理,所述处理包括:
由xq得x′q={xq,1,xq,2…xq,j-1,xq,j+1…xq,m},同理由X得X′、Y′,如下式所示:
Y'=[x1,j,x2,j,……xn,j]T
同时对查询样本点xq进行处理,如下式所示:
通过上述处理得到X′、Y′以及x′q,其中X′是原训练样本X经过处理后所得新输入训练样本集,Y′是由原训练样本X中奇异值所处列组成的新输出训练样本集,而x′q则是xq经过处理后所得新查询样本点。最后将X′和Y′重新组合为一个新的训练样本集,利用高斯过程回归方法对其进行训练得到辅助模型;
利用所得辅助模型对x′q进行预测得到奇异值xq,j的预测值x′q,j,利用所得x′q,j对xq中奇异值xq,j进行替换得到补偿后查询样本点
6.根据权利要求5所述的带奇异点检测补偿的GPR在线软测量方法,其特征在于,还包括对奇异点二次查询单元,用于对判定为奇异点的查询样本进行二次检测,具体包括:
利用欧氏距离的方法从训练样本中选取与xq最相似样本点,具体计算公式下如式所示:
di(xq,xi)=||xq,xi||,i=1,…,n
式中,xi、di以及si分别代表训练样本点、样本点之间欧式距离以及相似度系数;
由于奇异点中奇异值会对求取相似样本点产生干扰,故在求取相似样本点之前对奇异样本点进行处理,由奇异点xq得x′q={xq,1,xq,2…xq,j-1,xq,j+1…xq,m},同理由X得X′,如下式所示:
在X′中获得x′q最相似样本点x′p,从而获得x′p在X′中所在位置信息,最后根据所得位置信息以获得xq在X中最相似样本点xp,得到误差向量xe如下式:
xe={xq,1-xp,1,xq,2-xp,2,…,xq,m-xp,m}
由误差向量xe得:
则查询样本点xq为奇异样本点;
否则,查询样本点xq为误报奇异样本点即为正常查询样本点,其中α为预设阈值。
CN201610543007.7A 2016-07-11 2016-07-11 带奇异点检测补偿的gpr在线软测量方法及*** Pending CN106569982A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610543007.7A CN106569982A (zh) 2016-07-11 2016-07-11 带奇异点检测补偿的gpr在线软测量方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610543007.7A CN106569982A (zh) 2016-07-11 2016-07-11 带奇异点检测补偿的gpr在线软测量方法及***

Publications (1)

Publication Number Publication Date
CN106569982A true CN106569982A (zh) 2017-04-19

Family

ID=58532182

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610543007.7A Pending CN106569982A (zh) 2016-07-11 2016-07-11 带奇异点检测补偿的gpr在线软测量方法及***

Country Status (1)

Country Link
CN (1) CN106569982A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107423503A (zh) * 2017-07-21 2017-12-01 江南大学 基于核慢特征分析和时滞估计的gpr建模
CN108171002A (zh) * 2017-11-30 2018-06-15 浙江大学 一种基于半监督混合模型的聚丙烯熔融指数预测方法
CN112098605A (zh) * 2020-09-21 2020-12-18 哈尔滨工业大学 一种高鲁棒性化学传感器阵列软测量方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107423503A (zh) * 2017-07-21 2017-12-01 江南大学 基于核慢特征分析和时滞估计的gpr建模
CN108171002A (zh) * 2017-11-30 2018-06-15 浙江大学 一种基于半监督混合模型的聚丙烯熔融指数预测方法
CN108171002B (zh) * 2017-11-30 2020-01-03 浙江大学 一种基于半监督混合模型的聚丙烯熔融指数预测方法
CN112098605A (zh) * 2020-09-21 2020-12-18 哈尔滨工业大学 一种高鲁棒性化学传感器阵列软测量方法

Similar Documents

Publication Publication Date Title
WO2021004154A1 (zh) 一种数控机床刀具剩余寿命预测方法
CN107451101B (zh) 一种分层集成的高斯过程回归软测量建模对脱丁烷塔底丁烷浓度进行预测的方法
CN109934130A (zh) 基于深度学习的卫星故障在轨实时故障诊断方法及***
Xiong et al. JITL based MWGPR soft sensor for multi-mode process with dual-updating strategy
CN109297689B (zh) 一种引入权重因子的大型水力机械智能诊断方法
CN108920863B (zh) 一种机器人伺服***能耗估计模型的建立方法
CN104914723A (zh) 基于协同训练偏最小二乘模型的工业过程软测量建模方法
CN103914064A (zh) 基于多分类器和d-s证据融合的工业过程故障诊断方法
CN102880809A (zh) 基于关联向量回归模型的聚丙烯熔融指数在线检测方法
CN111142538B (zh) 一种水环境监测的无人船运行策略实时决策方法
CN113012766B (zh) 一种基于在线选择性集成的自适应软测量建模方法
JP2019135638A (ja) 生産プロセス中に異常なワークピースを自動検出するためのデータ駆動方法
CN106569982A (zh) 带奇异点检测补偿的gpr在线软测量方法及***
CN116467674B (zh) 一种配电网智能故障处理融合更新***及其方法
CN105955214A (zh) 基于样本时序和近邻相似性信息的间歇过程故障检测方法
CN103389701A (zh) 基于分布式数据模型的厂级过程故障检测与诊断方法
CN111105082A (zh) 基于机器学习的工件质量预测模型构建方法及预测方法
CN109947076A (zh) 一种基于贝叶斯信息准则的工业过程故障诊断方法
CN111639304A (zh) 基于Xgboost回归模型的CSTR故障定位方法
CN110673568A (zh) 玻璃纤维制造业工业设备故障顺序确定方法及***
CN108171002B (zh) 一种基于半监督混合模型的聚丙烯熔融指数预测方法
Arengas et al. A search method for selecting informative data in predominantly stationary historical records for multivariable system identification
CN103390103A (zh) 基于子空间独立成分回归模型的熔融指数在线检测方法
CN108459579A (zh) 基于时间序列模型系数的半导体批次过程故障诊断方法
CN115407753B (zh) 一种多变量加权集成学习的工业故障诊断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170419

RJ01 Rejection of invention patent application after publication