CN109033524B - 一种基于鲁棒混合模型的化工过程浓度变量在线估计方法 - Google Patents

一种基于鲁棒混合模型的化工过程浓度变量在线估计方法 Download PDF

Info

Publication number
CN109033524B
CN109033524B CN201810678469.9A CN201810678469A CN109033524B CN 109033524 B CN109033524 B CN 109033524B CN 201810678469 A CN201810678469 A CN 201810678469A CN 109033524 B CN109033524 B CN 109033524B
Authority
CN
China
Prior art keywords
variable
model
concentration
variables
distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810678469.9A
Other languages
English (en)
Other versions
CN109033524A (zh
Inventor
邵伟明
宋执环
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201810678469.9A priority Critical patent/CN109033524B/zh
Publication of CN109033524A publication Critical patent/CN109033524A/zh
Application granted granted Critical
Publication of CN109033524B publication Critical patent/CN109033524B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Computer Hardware Design (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Computation (AREA)
  • Algebra (AREA)
  • Geometry (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种基于鲁棒混合模型的化工过程浓度变量在线估计方法,它首先设计一种新的混合学生氏分布模型结构使得鲁棒回归学***稳性、过程监控以及决策制定提供技术支持与保障。

Description

一种基于鲁棒混合模型的化工过程浓度变量在线估计方法
技术领域
本发明属于化工过程软测量建模与应用领域,具体涉及一种基于鲁棒混合模型的化工过程浓度变量在线估计方法。
背景技术
众多化工过程存在一类浓度变量,如脱丁烷塔中丁烷的浓度,青霉素发酵过程中盘尼西林、生物量以及基质的浓度,硫回收单元中二氧化硫和硫化氢的浓度、燃烧炉中氧气的浓度、二氧化碳吸收塔中二氧化碳的浓度、高低温变换单元中一氧化碳的浓度等。这类浓度变量通常十分重要,他们要么直接关系到产品质量,要么关系到环保指标,甚至关系到生产过程的安全性。因此,对这类变量需要严格监控。然而,不同于常规的过程变量如温度、压力、流量等,浓度变量的测量十分困难,它们通常采用实验室化验分析或在线分析仪的方式测量。但实验室化验分析需要较长时间(可能长达几个小时),在线分析仪表价格昂贵且极易出现故障。不能实时测量这类变量,将导致闭环控制器性能下降甚至无法工作,可能引起一系列的不良后果,如废品率增加、能源消耗增加等引起的环境污染和成本增加等问题,甚至导致安全隐患。
数据驱动的软测量模型可以实现浓度变量的在线实时估计,以弥补实验室化验与在线分析仪表的不足。其原理是在离线阶段根据浓度变量与过程中容易测量的变量(如温度、压力、流量、液位等参数,又被称之为辅助变量)间的依赖关系建立数学模型,然后在线利用该数学模型对浓度变量进行估计,因此具有无测量滞后、成本低、通用性好、易维护等优点。但由化工过程机理十分复杂,且工况切换频繁,生产数据呈现不确定性、多模态、强非线性等特点,使得传统的软测量模型(如主成分分析模型、偏最小二乘模型,神经网络模型、支持向量机模型等)难以取得满意的估计精度。另一方面,传统的数据驱动的软测量模型假设建模数据是纯净的,但在工业过程中,采集到的样本中不可避免地存在离群点(即非常样本),使得传统软测量方法的性能严重恶化。
因此,研究和开发能够同时解决化工过程中的不确定性、强非线性、多模态特性,尤其是离群点问题的软测量建模方法,有助于提高浓度变量的估计精度,从而助力化工企业实现安全生产、节能环保、降本增效的目标,是十分必要和迫切的。
发明内容
针对现有技术的不足,本发明提供一种基于鲁棒混合模型的化工过程浓度变量在线估计方法,以学生氏混合模型的形式建立浓度变量与辅助变量间的鲁棒数学模型,并根据工况切换自适应分配混合模型的贡献度,有效解决离群点、不确定性、非线性、多模态等问题。具体技术方案如下:
一种基于鲁棒混合模型的化工过程浓度变量在线估计方法,其特征在于,包括以下步骤:
(1)选择与浓度变量
Figure BDA0001709855000000021
关联的辅助变量
Figure BDA0001709855000000022
其中d表示辅助变量个数;
(2)收集同时包含辅助变量与浓度变量的样本集
Figure BDA0001709855000000023
其中n代表样本数量,xi表示第i个辅助变量的采样值,yi表示第i个浓度变量的采样值;
(3)对(X,Y)做无量纲化处理,将辅助变量与浓度变量的样本方差转换为单位方差;
(4)设鲁棒混合模型的组分数量为M,初始化模型参数
Figure BDA0001709855000000024
其中
Figure BDA0001709855000000025
表示第k个混合模型的先验概率;
Figure BDA0001709855000000026
表示第k个混合模型中学生氏分布的均值向量;
Figure BDA0001709855000000027
表示第k个混合模型中学生氏分布的精度矩阵;
Figure BDA0001709855000000028
表示第k个混合模型中学生氏分布的自由度;
Figure BDA0001709855000000029
表示第k个混合模型中辅助变量x与浓度变量y之间的线性回归系数;
Figure BDA00017098550000000210
表示第k个混合模型中浓度变量测量噪声方差的倒数;
所述的鲁棒混合模型为有监督的、用于回归的混合学生氏分布模型;
(5)构建无量纲化后的(X,Y)及其对应的隐变量
Figure BDA00017098550000000211
的条件概率密度函数和先验概率密度函数,其中,zi=(zi1,…,ziM)T表示与第i个样本(xi,yi)对应的隐变量,zik为0-1型变量,即其取值只能为0或1,且满足
Figure BDA00017098550000000212
(6)将步骤(3)处理后的训练样本集,步骤(4)中的初始模型参数,以及步骤(5)中构建的条件概率密度函数和先验概率密度函数输入鲁棒混合模型中,通过期望最大化算法学习模型参数。
(7)采集仅包含辅助变量的未知样本,按步骤(3)消除辅助变量的量纲,利用步骤(6)中获得的模型参数,对浓度变量进行估计。
进一步地,所述的步骤(5)中构建的(X,Y)及其对应的隐变量Z的条件概率密度函数和先验概率密度函数为:
Figure BDA0001709855000000031
Figure BDA0001709855000000032
Figure BDA0001709855000000033
其中
Figure BDA0001709855000000034
表示随机变量
Figure BDA0001709855000000035
的概率密度函数,
Figure BDA0001709855000000036
表示给定
Figure BDA0001709855000000037
时,随机变量
Figure BDA0001709855000000038
的条件概率密度函数,
Figure BDA0001709855000000039
表示学生氏分布的概率密度函数,其中随机变量为
Figure BDA00017098550000000310
参数为均值向量μ、精度矩阵Λ和自由度v,
Figure BDA00017098550000000311
表示正态分布的概率密度函数,其中随机变量为
Figure BDA00017098550000000312
参数为均值向量μ、协方差矩阵∧-1),
Figure BDA00017098550000000313
进一步地,所述步骤(6)的模型参数的学习过程包括两个阶段,即期望阶段与最大化阶段;
在期望阶段,需要在第k个混合模型中计算xi对应的隐变量zik、ηik与lnηik的期望,其中ηik为中间变量。具体计算公式为
Figure BDA00017098550000000314
Figure BDA00017098550000000315
Figure BDA00017098550000000316
其中,ψ(·)表示digamma函数,
Figure BDA00017098550000000317
表示根据
Figure BDA00017098550000000318
的分布计算
Figure BDA00017098550000000319
的期望,符号
Figure BDA00017098550000000320
的含义是表示为。
在最大化阶段,模型参数的更新公式为
Figure BDA00017098550000000321
Figure BDA0001709855000000041
Figure BDA0001709855000000042
Figure BDA0001709855000000043
Figure BDA0001709855000000044
Figure BDA0001709855000000045
其中,vk的求解公式属于非线性方程,没有解析解,只能通过迭代获得数值解,这里采用二分法求解vk
进一步地,所述的步骤(7)具体为:
根据步骤(6)中获得的模型参数,对浓度未知的样本xt按照步骤(3)进行去量纲化,然后可获得xt的边缘分布,计算公式为
Figure BDA0001709855000000046
进而可得xt对应的隐变量zt=(zt1,…,ztM)的后验分布为
Figure BDA0001709855000000047
其中zt1,…,ztM均为0-1型变量,且满足
Figure BDA0001709855000000048
然后可求得浓度变量的概率分布,从而得到浓度变量的估计值。
进一步地,所述的浓度变量yt的条件概率分布为:
Figure BDA0001709855000000051
其中
Figure BDA0001709855000000052
因此,可得浓度变量的估计值
Figure BDA0001709855000000053
其计算公式为
Figure BDA0001709855000000054
与现有技术相比,本发明的有益效果如下:
1、以混合模型的形式建立浓度变量和辅助变量的数学模型,能够有效解决由工况切换及复杂的化学反应引起的多模态、强非线性问题;
2、在每个混合模型中采用鲁棒的学生氏分布描述辅助变量的概率分布,能够增强对离群点的免疫能力,从而提高浓度变量的估计精度。
附图说明
图1为本发明的基于鲁棒混合模型的化工过程浓度变量在线估计方法的流程图;
图2为某二氧化碳吸收塔装置的工艺原理图;
图3为本发明对二氧化碳浓度的估计结果示意图,其中,纵坐标代表二氧化碳浓度,单位为摩尔百分比(mol%),横坐标代表测试样本序号,实线代表二氧化碳浓度的真实值,虚线代表二氧化碳浓度的估计值;
图4为高斯混合模型对二氧化碳浓度的估计结果示意图,其中,纵坐标代表二氧化碳浓度,单位为摩尔百分比(mol%),横坐标代表测试样本序号,实线代表二氧化碳浓度的真实值,虚线代表二氧化碳浓度的估计值;
图5为偏最小二乘模型对二氧化碳浓度的估计结果示意图,其中,纵坐标代表二氧化碳浓度,单位为摩尔百分比(mol%),横坐标代表测试样本序号,实线代表二氧化碳浓度的真实值,虚线代表二氧化碳浓度的估计值。
具体实施方式
下面结合具体的实施例对本发明的基于鲁棒混合模型的化工过程浓度变量在线估计方法作进一步的阐述。需要指出的是,所描述的实施例仅旨在加强对本发明的理解,并不对本发明起任何限定作用。
一种基于鲁棒混合模型的化工过程浓度变量在线估计方法,如图1所示,具体包括如下步骤:
(1)选择与浓度变量
Figure BDA0001709855000000061
关联的辅助变量
Figure BDA0001709855000000062
其中d表示辅助变量个数;
本实施例根据对某ICI-AMV工艺(产量为1000t/d)合成氨生产工厂二氧化碳吸收塔(如图2所示)的工艺机理分析,选择对二氧化碳浓度影响最大的11个容易测量的变量作为辅助变量,分别为:
进入05E001的工艺气压力(x1,位号:PRC04011.PV)、
05F003液位(x2,位号:LRC05020.PV)、
05E003出口贫液温度(x3,TIC05015.PV)、
到05C001的贫液流量(x4,FRC05015.PV)、
到05C001的半贫液流量(x5,FRC05016.PV)、
05F003出口工艺气温度(x6,TI05016.PV)、
05C001工艺气进出口压差(x7,PDR05016.PV)、
05C001出口富液温度(x8,TI05018.PV)、
05C001液位(x9,LRC05022.PV)、
06F001的高液位报警值(x10,LAH06001.PV)、
进入06单元工艺气压力(x11,PR06001.PV),
其中PV代表仪表的测量值。
因此辅助变量x=[x1,…,x11]T,即
Figure BDA0001709855000000063
d=11。
(2)收集同时包含辅助变量与二氧化碳浓度的样本集
Figure BDA0001709855000000064
其中n代表样本的数量,xi表示第i个辅助变量的采样值,yi表示第i个浓度变量的采样值。
本发明从计算机分散控制***数据库中收集同时包含辅助变量与二氧化碳浓度的样本2000组(记为
Figure BDA0001709855000000065
),即n=2000。
(3)对(X,Y)做无量纲化处理,将辅助变量与二氧化碳浓度的样本方差转换为单位方差;
其中去量纲的方法为:
Figure BDA0001709855000000066
Figure BDA0001709855000000067
式中,
Figure BDA0001709855000000068
分别代表第l个辅助变量和二氧化碳浓度的样本标准差,xi(l)表示第i个样本中第l个辅助变量的采样值。
(4)设鲁棒混合模型的组分数量为M,初始化模型参数
Figure BDA0001709855000000071
其中
Figure BDA0001709855000000072
表示第k个混合模型的先验概率;
Figure BDA0001709855000000073
表示第k个混合模型中学生氏分布的均值向量;
Figure BDA0001709855000000074
表示第k个混合模型中学生氏分布的精度矩阵;
Figure BDA0001709855000000075
表示第k个混合模型中学生氏分布的自由度;
Figure BDA0001709855000000076
表示第k个混合模型中辅助变量x与浓度变量y之间的线性回归系数;
Figure BDA0001709855000000077
表示第k个混合模型中浓度变量测量噪声方差的倒数。
所述的鲁棒混合模型为有监督的、用于回归的混合学生氏分布模型;
在本实例中,πk被初始化为0~1之间的随机数,且满足
Figure BDA0001709855000000078
μk被随机初始化为d维列向量;Λk被随机初始化为d×d维正定矩阵;vk和λk被初始化为正的随机数;
Figure BDA0001709855000000079
被随机初始化为(d+1)维列向量。此外,本例中将M设为18。
(5)构建无量纲化后的(X,Y)及其对应的隐变量
Figure BDA00017098550000000710
的条件概率密度函数和先验概率密度函数,其中,zi=(zi1,…,ziM)T表示与第i个样本(xi,yi)对应的隐变量,zik为0-1型变量,其取值只能为0或1,且满足
Figure BDA00017098550000000711
具有如下形式:
Figure BDA00017098550000000712
Figure BDA00017098550000000713
Figure BDA00017098550000000714
其中
Figure BDA00017098550000000715
表示随机变量
Figure BDA00017098550000000716
的概率密度函数,
Figure BDA00017098550000000717
表示给定
Figure BDA00017098550000000718
时,随机变量
Figure BDA00017098550000000719
的条件概率密度函数,
Figure BDA00017098550000000720
表示学生氏分布的概率密度函数,其中随机变量为
Figure BDA00017098550000000721
参数为均值向量μ、精度矩阵Λ、自由度v,
Figure BDA00017098550000000722
表示正态分布的概率密度函数,其中随机变量为
Figure BDA00017098550000000723
参数为均值向量μ、协方差矩阵Λ-1
Figure BDA00017098550000000724
(6)将步骤(3)处理后的训练样本集,步骤(4)中的初始模型参数,以及步骤(5)中构建的条件概率密度函数和先验概率密度函数输入鲁棒混合模型中,通过期望最大化算法学习各个模型参数。具体过程包括期望部分和最大化部分。
在期望部分,首先需要计算隐变量
Figure BDA0001709855000000081
的后验分布,根据式(2)~式(4)可得
Figure BDA0001709855000000082
Figure BDA0001709855000000083
p(zik=1)=πk (7)
根据概率的加法和乘法公式,可得每个隐变量zi=(zi1,…,ziM)T的后验分布如下
Figure BDA0001709855000000084
根据随机变量期望的定义,可得
Figure BDA0001709855000000085
其中,
Figure BDA0001709855000000086
表示根据
Figure BDA0001709855000000087
的分布计算
Figure BDA0001709855000000088
的期望,符号
Figure BDA0001709855000000089
的含义是表示为。
此外,为获得参数vk的学习公式,需在第k个混合模型中,针对xi引入中间隐变量ηik,其先验分布定义如下
Figure BDA00017098550000000810
其中
Figure BDA00017098550000000811
表示参数为χ1和χ2的伽马分布的概率密度函数,其中,随机变量为
Figure BDA00017098550000000812
根据学生氏分布的定义,可知
Figure BDA00017098550000000813
因此,由概率乘法公式得隐变量ηik的后验概率密度函数为
Figure BDA0001709855000000091
由式(12)可知,ηik的后验分布仍是伽马分布,即
Figure BDA0001709855000000092
其中
Figure BDA0001709855000000093
因此,由期望的定义可得
Figure BDA0001709855000000094
在最大化部分,需要最大化完整数据的对数似然函数的期望值,即
Figure BDA0001709855000000095
其定义如下
Figure BDA0001709855000000096
其中,
Figure BDA0001709855000000097
将式(16)进一步展开可得,
Figure BDA0001709855000000098
其中,
Figure BDA0001709855000000101
表示自变量为
Figure BDA0001709855000000102
的伽马函数,
Figure BDA0001709855000000103
表示与模型参数无关的常数项。
结合式(17)与约束
Figure BDA0001709855000000104
构造拉格朗日函数
Figure BDA0001709855000000105
如式(18)所示
Figure BDA0001709855000000106
式中
Figure BDA0001709855000000107
表示拉格朗日乘子。将
Figure BDA0001709855000000108
对πk的导数置零,可得
Figure BDA0001709855000000109
根据<zik>的性质
Figure BDA00017098550000001010
对式(19)两边按照k求和,可得
Figure BDA00017098550000001011
将式(20)带入式(19)可得πk的更新公式如下
Figure BDA00017098550000001012
进一步,将
Figure BDA00017098550000001013
对μk的导数置零可得μk的更新公式如下
Figure BDA00017098550000001014
其中0d×1为d维零向量。
Figure BDA00017098550000001015
对Λk的导数置零可得Λk的更新公式如下
Figure BDA00017098550000001016
其中0d×d为d×d维零矩阵。
Figure BDA00017098550000001017
对vk的导数置零可得vk的更新公式如下
Figure BDA0001709855000000111
式(23)为属于非线性方程,没有解析解,只能通过迭代获得数值解。本发明采用二分法求解vk
Figure BDA0001709855000000112
Figure BDA0001709855000000113
的导数置零可得
Figure BDA0001709855000000114
的更新公式如下
Figure BDA0001709855000000115
其中0(d+1)×1为d+1维零向量。
Figure BDA0001709855000000116
对λk的导数置零可得λk的更新公式如下
Figure BDA0001709855000000117
迭代执行期望部分的<zik>、<ηik>、<lnηik>,以及最大化部分的πk、μk、Λk、vk
Figure BDA0001709855000000118
λk的更新公式,收敛后可获得模型的最优参数
Figure BDA0001709855000000119
可通过观察训练样本(X,Y)的对数似然函数,即lnp(X,Y)来判断迭代过程是否收敛,其定义如下
Figure BDA00017098550000001110
迭代过程收敛的标准为
Figure BDA0001709855000000121
其中Θ(t)表示在第t次迭代过程完成后获得的模型参数值,ε为很小的正数,表示收敛阈值,由使用者设定。本例中设定ε=10-4
(7)在线阶段,采集仅包含辅助变量的未知样本xt,按步骤(3)消除辅助变量的量纲,利用步骤(6)中获得的最优模型参数
Figure BDA0001709855000000122
对浓度变量进行估计。
具体来说,首先定义xt对应的隐变量zt=(zt1,…,ztM),其中zt1,…,ztM均为0-1型变量且满足
Figure BDA0001709855000000123
其先验概率为p(ztk=1)=πk。此外,根据式(5)可知,
Figure BDA0001709855000000124
进而可以计算xt的边缘分布,计算公式为
Figure BDA0001709855000000125
进一步地,隐变量zt=(zt1,…,ztM)的后验分布的计算方法为
Figure BDA0001709855000000126
根据式(6)可知,与xt对应的浓度变量yt在第k个混合模型中的条件分布,即
Figure BDA0001709855000000127
消除隐变量zt=(zt1,…,ztM)后可得
Figure BDA0001709855000000128
因此,浓度变量的估计值
Figure BDA0001709855000000129
的计算公式为
Figure BDA00017098550000001210
为了验证本发明的有效性,从该合成氨工厂二氧化碳吸收塔装置计算机分散控制***中收集额外的样本5000组作为测试样本集,按照步骤(7),对二氧化碳浓度进行估计,平均估计结果如图3所示。同时,图4和图5分别给出了传统的高斯混合模型与偏最小二乘模型对二氧化碳浓度的平均估计结果。在高斯混合模型中,混合组分数量也设置为18;在偏最小二乘模型中,主成分数量通过交叉验证法设置为8。可以看出,由于不能处理非线性对象,偏最小二乘模型提供的二氧化碳浓度的估计值显著偏离真值;而传统的高斯混合模型的估计结果虽然较偏最小二乘模型有所改善,但预测值波动很大,仍不能令人满意。相比之下,本发明提供的方法在所有操作区域提供的二氧化碳浓度估计值基本符合其真值。
采用均方根误差(RMSE)量化本发明与传统的高斯混合模型、偏最小二乘模型的估计精度,定义如下
Figure BDA0001709855000000131
其中
Figure BDA0001709855000000132
Figure BDA0001709855000000133
分别代表第nt个测试样本的真实二氧化碳浓度与估计值。本发明提供的方法与高斯混合模型、偏最小二乘模型的估计RMSE分别为0.29%、0.38%、0.63%。可见,本发明较高斯混合模型、偏最小二乘模型对二氧化碳浓度的估计精度有显著提高,估计误差分别降低了约24%和54%。
上述实施例用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明做出的任何修改和改变,都落入本发明的保护范围。

Claims (5)

1.一种基于鲁棒混合模型的化工过程浓度变量在线估计方法,其特征在于,包括以下步骤:
(1)选择与浓度变量
Figure FDA0003511321810000011
关联的辅助变量
Figure FDA0003511321810000012
其中d表示辅助变量个数;
(2)收集同时包含辅助变量与浓度变量的样本集
Figure FDA0003511321810000013
其中n代表样本数量,xi表示第i个辅助变量的采样值,yi表示第i个浓度变量的采样值;
(3)对(X,Y)做无量纲化处理,将辅助变量与浓度变量的样本方差转换为单位方差;
(4)设鲁棒混合模型的组分数量为M,初始化模型参数
Figure FDA0003511321810000014
其中
Figure FDA0003511321810000015
表示第k个混合模型的先验概率;
Figure FDA0003511321810000016
表示第k个混合模型中学生氏分布的均值向量;
Figure FDA0003511321810000017
表示第k个混合模型中学生氏分布的精度矩阵;
Figure FDA0003511321810000018
表示第k个混合模型中学生氏分布的自由度;
Figure FDA0003511321810000019
表示第k个混合模型中辅助变量x与浓度变量y之间的线性回归系数;
Figure FDA00035113218100000110
表示第k个混合模型中浓度变量测量噪声方差的倒数;
所述的鲁棒混合模型为有监督的、用于回归的混合学生氏分布模型;
(5)构建无量纲化后的(X,Y)及其对应的隐变量
Figure FDA00035113218100000111
的条件概率密度函数和先验概率密度函数,其中,zi=(zi1,…,ziM)T表示与第i个样本(xi,yi)对应的隐变量,zik为0-1型变量,即其取值只能为0或1,且满足
Figure FDA00035113218100000112
(6)将步骤(3)处理后的训练样本集,步骤(4)中的初始模型参数,以及步骤(5)中构建的条件概率密度函数和先验概率密度函数输入鲁棒混合模型中,通过期望最大化算法学习模型参数;
(7)采集仅包含辅助变量的未知样本,按步骤(3)消除辅助变量的量纲,利用步骤(6)中获得的模型参数,对浓度变量进行估计。
2.根据权利要求1所述的基于鲁棒混合模型的化工过程浓度变量在线估计方法,其特征在于,所述的步骤(5)中构建的(X,Y)及其对应的隐变量Z的条件概率密度函数和先验概率密度函数为:
Figure FDA0003511321810000021
Figure FDA0003511321810000022
Figure FDA0003511321810000023
其中
Figure FDA0003511321810000024
表示随机变量
Figure FDA0003511321810000025
的概率密度函数,
Figure FDA0003511321810000026
表示给定
Figure FDA0003511321810000027
时,随机变量
Figure FDA0003511321810000028
的条件概率密度函数,
Figure FDA0003511321810000029
表示学生氏分布的概率密度函数,其中随机变量为
Figure FDA00035113218100000210
参数为均值向量μ、精度矩阵Λ和自由度v,
Figure FDA00035113218100000211
表示正态分布的概率密度函数,其中随机变量为
Figure FDA00035113218100000212
参数为均值向量μ、协方差矩阵Λ-1,
Figure FDA00035113218100000213
3.根据权利要求2所述的基于鲁棒混合模型的化工过程浓度变量在线估计方法,其特征在于,所述步骤(6)的模型参数的学习过程包括两个阶段,即期望阶段与最大化阶段;
在期望阶段,需要在第k个混合模型中计算xi对应的隐变量zik、ηik与lnηik的期望,其中ηik为中间变量;具体计算公式为
Figure FDA00035113218100000214
Figure FDA00035113218100000215
Figure FDA00035113218100000216
其中,ψ(·)表示digamma函数,
Figure FDA00035113218100000217
表示根据
Figure FDA00035113218100000218
的分布计算
Figure FDA00035113218100000219
的期望,符号
Figure FDA00035113218100000220
的含义是表示为;
在最大化阶段,模型参数的更新公式为
Figure FDA00035113218100000221
Figure FDA0003511321810000031
Figure FDA0003511321810000032
Figure FDA0003511321810000033
Figure FDA0003511321810000034
Figure FDA0003511321810000035
其中,vk的求解公式属于非线性方程,没有解析解,只能通过迭代获得数值解,这里采用二分法求解vk
4.根据权利要求2所述的基于鲁棒混合模型的化工过程浓度变量在线估计方法,所述的步骤(7)具体为:
根据步骤(6)中获得的模型参数,对浓度未知的样本xt按照步骤(3)进行去量纲化,然后可获得xt的边缘分布,计算公式为
Figure FDA0003511321810000036
进而可得xt对应的隐变量zt=(zt1,…,ztM)的后验分布为
Figure FDA0003511321810000037
其中zt1,…,ztM均为0-1型变量,且满足
Figure FDA0003511321810000038
符号
Figure FDA0003511321810000039
的含义是表示为;然后可求得浓度变量的概率分布,从而得到浓度变量的估计值。
5.根据权利要求4所述的基于鲁棒混合模型的化工过程浓度变量在线估计方法,所述的浓度变量yt的条件概率分布为:
Figure FDA0003511321810000041
其中
Figure FDA0003511321810000042
因此,可得浓度变量的估计值
Figure FDA0003511321810000043
其计算公式为
Figure FDA0003511321810000044
CN201810678469.9A 2018-06-27 2018-06-27 一种基于鲁棒混合模型的化工过程浓度变量在线估计方法 Active CN109033524B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810678469.9A CN109033524B (zh) 2018-06-27 2018-06-27 一种基于鲁棒混合模型的化工过程浓度变量在线估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810678469.9A CN109033524B (zh) 2018-06-27 2018-06-27 一种基于鲁棒混合模型的化工过程浓度变量在线估计方法

Publications (2)

Publication Number Publication Date
CN109033524A CN109033524A (zh) 2018-12-18
CN109033524B true CN109033524B (zh) 2022-04-29

Family

ID=64611120

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810678469.9A Active CN109033524B (zh) 2018-06-27 2018-06-27 一种基于鲁棒混合模型的化工过程浓度变量在线估计方法

Country Status (1)

Country Link
CN (1) CN109033524B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110826021B (zh) * 2019-10-31 2021-03-12 哈尔滨工业大学 一种非线性工业过程鲁棒辨识和输出估计方法
CN113027427B (zh) * 2019-12-25 2024-04-05 中石化石油工程技术服务有限公司 一种基于贝叶斯理论的含可信度地层压力随钻修正方法
CN112837761A (zh) * 2020-12-28 2021-05-25 广东石油化工学院 一种烟气成分的预测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103927412A (zh) * 2014-04-01 2014-07-16 浙江大学 基于高斯混合模型的即时学习脱丁烷塔软测量建模方法
CN104778298A (zh) * 2015-01-26 2015-07-15 江南大学 基于egmm的高斯过程回归软测量建模方法
CN107451101A (zh) * 2017-07-21 2017-12-08 江南大学 一种分层集成的高斯过程回归软测量建模方法
CN108171002A (zh) * 2017-11-30 2018-06-15 浙江大学 一种基于半监督混合模型的聚丙烯熔融指数预测方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100682888B1 (ko) * 2004-02-11 2007-02-15 삼성전자주식회사 가중된 회귀모델 결정 방법 및 이를 이용한 혼합물의 성분농도 예측 방법
EP3341498B1 (en) * 2015-08-28 2022-03-30 The Trustees of Columbia University in the City of New York Virtual inference of protein activity by regulon enrichment analysis

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103927412A (zh) * 2014-04-01 2014-07-16 浙江大学 基于高斯混合模型的即时学习脱丁烷塔软测量建模方法
CN104778298A (zh) * 2015-01-26 2015-07-15 江南大学 基于egmm的高斯过程回归软测量建模方法
CN107451101A (zh) * 2017-07-21 2017-12-08 江南大学 一种分层集成的高斯过程回归软测量建模方法
CN108171002A (zh) * 2017-11-30 2018-06-15 浙江大学 一种基于半监督混合模型的聚丙烯熔融指数预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Bayesian Regularized Gaussian Mixture Regression with Application to Soft Sensor Modeling for Multi-Mode Industrial Processes;Weiming Shao等;《2018 IEEE 7th Data Driven Control and Learning Systems Conference》;20180527;全文 *

Also Published As

Publication number Publication date
CN109033524A (zh) 2018-12-18

Similar Documents

Publication Publication Date Title
Grbić et al. Adaptive soft sensor for online prediction and process monitoring based on a mixture of Gaussian process models
CN109033524B (zh) 一种基于鲁棒混合模型的化工过程浓度变量在线估计方法
Khatibisepehr et al. Design of inferential sensors in the process industry: A review of Bayesian methods
Xiong et al. JITL based MWGPR soft sensor for multi-mode process with dual-updating strategy
CN108664706B (zh) 一种基于半监督贝叶斯高斯混合模型的合成氨过程一段炉氧气含量在线估计方法
CN111639304B (zh) 基于Xgboost回归模型的CSTR故障定位方法
CN101673096B (zh) 一种丹参注射液生产浓缩过程密度的软测量方法
Yang et al. Domain adaptation network with uncertainty modeling and its application to the online energy consumption prediction of ethylene distillation processes
CN108171002B (zh) 一种基于半监督混合模型的聚丙烯熔融指数预测方法
Li et al. Data cleaning method for the process of acid production with flue gas based on improved random forest
Lejarza et al. Discovering governing equations via moving horizon learning: The case of reacting systems
CN114169459A (zh) 基于半监督贝叶斯正则化混合Student’s t模型的鲁棒软测量方法
CN116738866B (zh) 一种基于时间序列特征提取的即时学习的软测量建模方法
CN1327376C (zh) 基于支持向量机的软测量仪表建模方法
Ngu et al. Prediction of dissolved oxygen using least square support vector regression model
CN113707240A (zh) 基于半监督非线性变分贝叶斯混合模型的成分参数鲁棒软测量方法
Zhang et al. Multivariate discrete grey model base on dummy drivers
Zhu et al. Dynamic data reconciliation for enhancing the performance of kernel learning soft sensor models considering measurement noise
Liu et al. Semi-Supervised Dynamic Latent Variable Regression for Prediction and Quality-Relevant Fault Monitoring
Aouichaoui et al. DeepGSA: Plant Data-Driven Global Sensitivity Analysis using Deep Learning
CN112765141A (zh) 基于迁移学习的连续大规模水质缺失数据填补方法
Ren et al. Fault detection and process monitoring of industrial process based on spherical kernel T-PLS
CN114841000B (zh) 一种基于模态共有特征分离的软测量建模方法
Xu et al. Change point detection of multimode processes considering both mode transitions and parameter changes
Yu A just-in-time learning approach for sewage treatment process monitoring with deterministic disturbances

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant