CN108664706B - 一种基于半监督贝叶斯高斯混合模型的合成氨过程一段炉氧气含量在线估计方法 - Google Patents

一种基于半监督贝叶斯高斯混合模型的合成氨过程一段炉氧气含量在线估计方法 Download PDF

Info

Publication number
CN108664706B
CN108664706B CN201810338582.2A CN201810338582A CN108664706B CN 108664706 B CN108664706 B CN 108664706B CN 201810338582 A CN201810338582 A CN 201810338582A CN 108664706 B CN108664706 B CN 108664706B
Authority
CN
China
Prior art keywords
oxygen content
model
distribution
parameters
posterior distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810338582.2A
Other languages
English (en)
Other versions
CN108664706A (zh
Inventor
邵伟明
宋执环
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201810338582.2A priority Critical patent/CN108664706B/zh
Publication of CN108664706A publication Critical patent/CN108664706A/zh
Application granted granted Critical
Publication of CN108664706B publication Critical patent/CN108664706B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明公开一种基于半监督贝叶斯高斯混合模型的合成氨过程一段炉氧气含量在线估计方法,它首先设计一种新的完全贝叶斯模型结构,将所有模型参数概率化并使得半监督回归学***稳性、过程监控以及决策制定提供技术支持与保障。

Description

一种基于半监督贝叶斯高斯混合模型的合成氨过程一段炉氧 气含量在线估计方法
技术领域
本发明属于化工过程软测量建模与应用领域,具体涉及一种基于半监督贝叶斯高斯混合模型的合成氨过程一段炉氧气含量在线估计方法。
背景技术
氨是一种非常重要的基础化工产品,其产量在各类化工产品中位居榜首,在工业上大量用于生产尿素、纯碱、铵态氮肥、硝酸,以及制成纤维、塑料、染料等有机合成工业产品。合成氨的原料包括氮气和氢气,其中氮气可从空气中大量获得,而氢气需要通过专门的制氢设备生产。在多数合成氨工艺中,一段转化炉(简称一段炉)是制备氢气的主要设备,其中的化学反应(催化剂为镍)如下:
Figure BDA0001629961810000011
Figure BDA0001629961810000012
Figure BDA0001629961810000013
上述化学反应是吸热反应,需要对一段炉提供热量。因此,反应温度是保持制氢反应稳定进行的重要因素。一段炉常规的加热方式是在辐射段烧咀燃烧燃料气以及回收的废气。为了维持工艺设定的反应温度,需要将一段炉内的氧气含量控制在指定的范围内。氧气含量(单位为摩尔百分比,mol%)可以通过质量分析仪测定。但质量分析仪不仅价格高昂、测量周期较长,且容易出故障。失去氧气含量的测量值,闭环控制器将无法工作,可能引起一系列的不良后果,如废品率增加、能源消耗增加等引起的环境污染和成本增加等问题,甚至导致安全隐患。
数据驱动的氧气含量软测量模型可以实现氧气含量的在线实时估计,以弥补质量分析仪的不足。其原理是在离线阶段根据氧气含量与过程中容易测量的变量(如温度、压力、流量、液位等参数,又被称之为辅助变量)间的依赖关系建立数学模型,然后在线利用该数学模型对氧气含量进行估计,因此具有无测量滞后、成本低、通用性好、易维护等优点。但由于一段炉燃烧过程十分复杂,且工况切换频繁,生产数据呈现不确定性、多模态、强非线性等特点,使得传统的软测量模型(如主成分分析模型、偏最小二乘模型,神经网络模型、支持向量机模型等)难以取得满意的估计精度。另一方面,由于质量分析仪的测量周期较长,有标签样本(即氧气含量已知的样本)数量很少,导致传统有监督的建模方法由于“过学习”或“欠学习”等原因难以获得准确的模型参数。训练不佳的氧气含量软测量模型必然无法提供满意的估计精度,而且人工整定参数耗时费力,难度非常大。
因此,研究和开发能够同时处理一段炉过程中复杂的不确定性、强非线性、多模态以及有标签样本稀少等问题的氧气含量软测量模型,有助于提高氧气含量的估计精度,从而助力合成氨企业实现安全生产、节能环保、降本增效的目标,是十分必要和迫切的。
发明内容
针对现有技术的不足,本发明提供一种基于半监督贝叶斯高斯混合模型的合成氨过程一段炉氧气含量在线估计方法,以贝叶斯高斯混合模型的形式建立氧气含量与辅助变量间的概率化数学模型,根据工况切换自适应分配混合模型的贡献度,有效解决不确定性、非线性、多模态等问题,并通过半监督学习同时利用有标签样本和无标签样本(即氧气含量未知、仅辅助变量已知的样本),解决有标签样本稀少导致的模型估计精度不高的问题。具体技术方案如下:
一种基于半监督贝叶斯高斯混合模型的合成氨过程一段炉氧气含量在线估计方法,其特征在于,包括以下步骤:
(1)选择与一段炉氧气含量y关联的辅助变量
Figure BDA0001629961810000021
其中d表示辅助变量个数;
(2)收集同时包含辅助变量与氧气含量的有标签样本集
Figure BDA0001629961810000022
与仅包含辅助变量的无标签样本集
Figure BDA0001629961810000023
其中nl与nu分别代表有标签样本与无标签样本的数量;
(3)对(Xl,Yl)与Xu做无量纲化处理,将辅助变量样本与氧气含量样本的样本方差转换为单位方差;
(4)给定狄利克雷过程的截断水平M,初始化模型参数
Figure BDA0001629961810000024
的共轭先验分布参数a0、b0、c0、d0、e0、f0、β0、v0、m0、W0与后验分布参数a、b、hk、lk、ck、dk、ek、fk、βk、vk、mk、Wk、ωk、Ωk,其中,
Figure BDA0001629961810000025
Figure BDA0001629961810000026
Figure BDA0001629961810000027
α表示狄利克雷过程的集中因子;
χk表示第k个混合模型系数的参数;
μk和Λk分别表示第k个混合模型中辅助变量x的分布的均值向量和精度矩阵;
Figure BDA0001629961810000028
表示第k个混合模型中辅助变量x与氧气含量y之间的线性回归系数;
τk表示
Figure BDA0001629961810000031
的精度矩阵参数;
ηk表示第k个混合模型中测量噪声的精度矩阵系数。
共轭先验分布参数和后验分布参数的含义为:
(a0,b0)和(a,b)分别表示α的先验分布参数和后验分布参数;
(hk,lk)表示χk的后验分布参数;
(m00,W0,v0)和(mkk,Wk,vk)分别表示(μkk)的先验分布参数和后验分布参数;
(c0,d0)和(ck,dk)分别表示τk的先验分布参数和后验分布参数;
(e0,f0)和(ek,fk)分别表示ηk的先验分布参数和后验分布参数;
ωk和Ωk表示
Figure BDA0001629961810000032
的后验分布参数;
(5)构建有标签样本(Xl,Yl)和无标签样本Xu及其对应的隐变量
Figure BDA0001629961810000033
的似然函数,其中,zi=(zi1,…,ziM)T和zj=(zj1,…,zjM)T分别表示第i个有标签样本(xi,yi)和第j个无标签样本xj对应的二进制隐变量,且满足
Figure BDA0001629961810000034
(6)将步骤(3)处理后的训练样本集,步骤(4)中的初始模型参数,以及步骤(5)中构建的似然函数输入半监督贝叶斯高斯混合模型中,通过变分推理学习各个模型参数的最优后验分布q(α)与
Figure BDA0001629961810000035
这里q(·)表示对应变量的最优后验分布。
(7)采集仅包含辅助变量的未知样本,按步骤(3)消除辅助变量的量纲,利用步骤(6)中获得的模型参数的最优后验分布,对氧气含量进行估计。
进一步地,所述的步骤(5)中构建的有标签样本(Xl,Yl)和无标签样本Xu及其对应的隐变量Zl、Zu的似然函数为:
Figure BDA0001629961810000036
Figure BDA0001629961810000037
Figure BDA0001629961810000038
Figure BDA0001629961810000039
Figure BDA0001629961810000041
其中χ=(χ1,…,χM),μ=(μ1,…,μM),Λ=(Λ1,…,ΛM),
Figure BDA0001629961810000042
η=(η1,…,ηM),
Figure BDA0001629961810000043
表示均值为μk、协方差矩阵为
Figure BDA0001629961810000044
的高斯概率密度函数,
Figure BDA0001629961810000045
进一步地,所述步骤(6)的模型参数的最优后验分布的参数a,b,hk,lk,ck,dk,ek,fk,βk,vk,mk,Wk,ωk和Ωk的迭代公式具有如下形式:
a=a0+M-1
Figure BDA0001629961810000046
Figure BDA0001629961810000047
Figure BDA0001629961810000048
Figure BDA0001629961810000049
Figure BDA00016299618100000410
Figure BDA00016299618100000411
Figure BDA00016299618100000412
Figure BDA00016299618100000413
Figure BDA00016299618100000414
ck=c0+(d+1)/2
Figure BDA00016299618100000415
Figure BDA00016299618100000416
Figure BDA00016299618100000417
其中,ψ(·)表示digamma函数,I表示相应维数的单位矩阵,
Figure BDA0001629961810000051
1为全1列向量,Tr(·)矩阵的迹,
Figure BDA0001629961810000052
Figure BDA0001629961810000053
表示第k个混合模型的估计误差,
Figure BDA0001629961810000054
Figure BDA0001629961810000055
这里
Figure BDA0001629961810000056
表示根据
Figure BDA0001629961810000057
的分布计算
Figure BDA0001629961810000058
的期望;κik和κjk的计算方式为
Figure BDA0001629961810000059
Figure BDA00016299618100000510
其中
Figure BDA00016299618100000511
Figure BDA00016299618100000512
进一步地,所述的步骤(7)具体为:
根据步骤(6)中计算出来的α的后验分布以及狄利克雷过程的性质,各模型混合系数π=(π1,…,πM)的后验分布可计算为
q(π)=Dir(π|φ1,…,φM)
其中Dir(π|φ1,…,φM)代表参数为(φ1,…,φM)的狄利克雷分布,且
Figure BDA00016299618100000513
然后,根据步骤(6)中计算出的模型参数的后验分布,可得去量纲后的辅助变量xt的边缘分布为
Figure BDA00016299618100000514
其中
Figure BDA0001629961810000061
Figure BDA0001629961810000062
表示参数为
Figure BDA0001629961810000063
的学生氏t分布。进而可得xt对应的隐变量zt=(zt1,…,ztM)的后验分布为
Figure BDA0001629961810000064
其中zt1,…,ztM均为0-1变量,且满足
Figure BDA0001629961810000065
然后可求得氧气含量的概率分布,从而得到氧气含量的估计值。
进一步地,所述的氧气含量yt的概率分布为:
Figure BDA0001629961810000066
其中
Figure BDA0001629961810000067
因此,可得氧气含量的估计值为
Figure BDA0001629961810000068
与现有技术相比,本发明的有益效果如下:
1、以混合模型的形式建立氧气含量和辅助变量的数学模型,能够有效解决由工况切换及复杂的燃烧过程引起的多模态、强非线性问题;
2、通过半监督学习可以同时利用有标签样本和无标签样本,解决有标签样本不足引起的模型参数学习不佳的问题,从而提高氧气含量的估计精度;
3、可在一轮训练中同时解决参数学习和模型选择问题,不必遍历所有候选混合模型数量,从而提高训练效率。
附图说明
图1为本发明的基于半监督贝叶斯高斯混合模型的合成氨过程一段炉氧气含量在线估计方法的流程图;
图2为某合成氨工厂一段炉装置的工艺原理图;
图3为本发明对氧气含量的估计结果示意图,其中,横坐标代表氧气含量,单位为摩尔百分比(mol%),纵坐标代表测试样本序号,实线代表氧气含量真实值,虚线代表氧气含量估计值;
图4为高斯混合模型对氧气含量的估计结果示意图,其中,横坐标代表氧气含量,单位为摩尔百分比(mol%),纵坐标代表测试样本序号,实线代表氧气含量真实值,虚线代表氧气含量估计值;
图5为偏最小二乘模型对氧气含量的估计结果示意图,其中,横坐标代表氧气含量,单位为摩尔百分比(mol%),纵坐标代表测试样本序号,实线代表氧气含量真实值,虚线代表氧气含量估计值。
具体实施方式
下面结合具体的实施例对本发明的基于半监督贝叶斯高斯混合模型的合成氨过程一段炉氧气含量在线估计方法作进一步的阐述。需要指出的是,所描述的实施例仅旨在加强对本发明的理解,并不对本发明起任何限定作用。
一种基于半监督贝叶斯高斯混合模型的合成氨过程一段炉氧气含量在线估计方法,如图1所示,具体包括如下步骤:
(1)在一段炉生产设备中选择与氧气含量y关联的辅助变量
Figure BDA0001629961810000071
其中d表示辅助变量个数;
本实施例根据对某ICI-AMV工艺(产量为1000t/d)合成氨生产过程一段炉装置(如图2所示)的工艺机理分析,选择对氧气含量影响最大的13个变量作为辅助变量,分别为:到03B001的燃料气流量(x1,位号:FR03001.PV)、到03B001的燃料废气流量(x2,位号:FR03002.PV)、03E005出口处燃料废气的压力(x3,位号:PC03002.PV)、03B001出口处燃料气的压力(x4,位号:PC03007.PV)、03E005出口处燃料废气的温度(x5,位号:TI03001.PV)、03B002E06出口处燃料气的温度(x6,位号:TI03009.PV)、03B001入口处过程气的温度(x7,位号:TR03012.PV)、03B001左上方燃料气的温度(x8,位号:TI03013.PV)、03B001右上方燃料气的温度(x9,位号:TI03014.PV)、03B001正上方混合气的温度(x10,位号:TR03015.PV)、03B001左侧出口转换气的温度(x11,位号:TR03016.PV)、03B001右侧出口转换气的温度(x12,位号:TR03017.PV)、03B001出口转换气的温度(x13,位号:TR03020.PV)。因此辅助变量x=[x1,…,x13],即
Figure BDA0001629961810000072
(2)收集同时包含辅助变量与氧气含量的有标签样本集
Figure BDA0001629961810000073
与仅包含辅助变量的无标签样本集
Figure BDA0001629961810000074
其中nl与nu分别代表有标签样本与无标签样本的数量;
本发明从计算机分散控制***数据库中收集同时包含辅助变量与氧气含量的有标签样本集2000组(记为
Figure BDA0001629961810000081
与仅包含辅助变量的无标签样本集5000组(记为
Figure BDA0001629961810000082
作为训练数据集,其中nl=2000与nu=5000分别代表有标签样本与无标签样本的数量。
(3)对(Xl,Yl)与Xu做无量纲化处理,将辅助变量样本与氧气含量样本的样本方差转换为单位方差;
其中去量纲的方法为:
Figure BDA0001629961810000083
式中,
Figure BDA0001629961810000084
分别代表第l个辅助变量和氧气含量的样本标准差,xn(l)表示第n个样本的第l个辅助变量的采样值。
(4)给定狄利克雷过程的截断水平M,初始化模型参数
Figure BDA0001629961810000085
的共轭先验分布参数与后验分布参数,模型参数的含义为:
α表示狄利克雷过程的集中因子;
χk表示第k个混合模型系数的参数;
μk和Λk分别表示第k个混合模型中辅助变量x的分布的均值向量和精度矩阵;
Figure BDA0001629961810000086
表示第k个混合模型中辅助变量x与氧气含量y之间的线性回归系数;
τk表示
Figure BDA0001629961810000087
的精度矩阵参数;
ηk表第k个混合模型中测量噪声的精度矩阵系数。
在本发明中,各模型参数的共轭先验分布和后验分布确定为:
α的先验分布p(α)和后验分布q(α)均为伽马分布,即p(α)=Gam(α|a0,b0),q(α)=Gam(α|a,b),其中Gam(α|a0,b0)和Gam(α|a,b)分别表示参数为(a0,b0)和(a,b)的伽马分布;
χk的先验分布p(χk)和后验分布q(χk)均为贝塔分布,即p(χk)=Beta(χk|1,α),q(χk)=Beta(χk|hk,lk),其中Beta(χk|1,α)和Beta(χk|hk,lk)分别表示参数为(1,α)和(hk,lk)的贝塔分布;
μkk的先验分布p(μkk)和后验分布q(μkk)均为高斯-威沙特分布,即
Figure BDA0001629961810000091
其中
Figure BDA0001629961810000092
Figure BDA0001629961810000093
分别表示参数为(m00,W0,v0)和(mkk,Wk,vk)的高斯-威沙特分布;
Figure BDA0001629961810000094
的先验分布
Figure BDA0001629961810000095
和后验分布
Figure BDA0001629961810000096
均为高斯分布,即
Figure BDA0001629961810000097
Figure BDA0001629961810000098
其中
Figure BDA0001629961810000099
表示均值向量为0、协方差矩阵为
Figure BDA00016299618100000910
的高斯分布,
Figure BDA00016299618100000911
表示均值向量为ωk、协方差矩阵为Ωk的高斯分布,I表示相应维数的单位矩阵,;
τk的先验分布p(τk)和后验分布q(τk)均为伽马分布,即p(τk)=Gam(τk|c0,d0),q(τk)=Gam(τk|ck,dk),其中Gam(τk|c0,d0)和Gam(τk|ck,dk)分别表示参数为(c0,d0)和(ck,dk)的伽马分布;
ηk的先验分布p(ηk)和后验分布q(ηk)均为伽马分布,即p(ηk)=Gam(ηk|e0,f0),q(ηk)=Gam(ηk|ek,fk),其中Gam(ηk|e0,f0)和Gam(ηk|ek,fk)分别表示参数为(e0,f0)和(ek,fk)的伽马分布。
因此,在该步骤中,需要初始化先验分布参数,包括
Figure BDA00016299618100000912
Figure BDA00016299618100000913
以及后验分布参数,包括
Figure BDA00016299618100000914
Figure BDA00016299618100000915
Figure BDA00016299618100000916
在本实例中,先验分布的参数设定为a0=1,b0=1,c0=1,d0=1,e0=1,f0=1,β0=1,v0=1,m0=0,W0=I;后验分布的参数a,b,hk,lk,ck,dk,ek,fk,βk,vk,mk,Wk,ωk,Ωk的初始值为随机值。
(5)构建有标签样本(Xl,Yl)和无标签样本Xu及其对应的隐变量
Figure BDA00016299618100000917
Figure BDA00016299618100000918
的似然函数,其中,zi=(zi1,…,ziM)T和zj=(zj1,…,zjM)T分别表示第i个有标签样本(xi,yi)和第j个无标签样本xj对应的二进制隐变量,且满足
Figure BDA00016299618100000919
具有如下形式:
Figure BDA0001629961810000101
Figure BDA0001629961810000102
Figure BDA0001629961810000103
Figure BDA0001629961810000104
Figure BDA0001629961810000105
(6)将步骤(3)处理后的训练样本集,步骤(4)中的初始模型参数,以及步骤(5)中构建的似然函数输入半监督贝叶斯高斯混合模型中,通过变分推理学习各个模型参数的最优后验分布q(α)以及
Figure BDA0001629961810000106
具体过程包括变分期望部分和变分最大化部分。
在变分期望部分,需要计算隐变量Zl和Zu的后验分布q(Zl)和q(Zu)。根据变分推理的原理可得
Figure BDA0001629961810000107
其中
Figure BDA0001629961810000108
表示根据
Figure BDA0001629961810000109
的分布计算
Figure BDA00016299618100001010
的期望,χ=(χ1,…,χM),μ=(μ1,…,μM),Λ=(Λ1,…,ΛM),
Figure BDA00016299618100001011
η=(η1,…,ηM),
Figure BDA00016299618100001012
表示均值为μk、协方差矩阵为
Figure BDA00016299618100001013
的高斯概率密度函数,
Figure BDA00016299618100001014
Figure BDA00016299618100001015
其中ψ(·)表示digamma函数。因此,
Figure BDA00016299618100001016
其中
Figure BDA0001629961810000111
为简便期间,公式(7)中常数项被省略了;后续计算各参数后验分布时仍省略常数项。
同理,可得Zu的后验分布q(Zu)如下:
Figure BDA0001629961810000112
其中
Figure BDA0001629961810000113
从而可得
Figure BDA0001629961810000114
其中
Figure BDA0001629961810000115
在变分最大化部分,需要计算模型参数
Figure BDA0001629961810000116
的后验分布q(Θ)。仍然采用变分推理的原理。具体来说,q(α)的求解方法为
Figure BDA0001629961810000117
因此,α的后验分布q(α)=Gam(α|a,b)的参数更新公式为
Figure BDA0001629961810000118
lnq(χk)可按照下式计算
Figure BDA0001629961810000121
因此,χk的后验分布q(χk)=Beta(χk|hk,lk)的参数更新公式为
Figure BDA0001629961810000122
lnq(μkk)可按照下式计算
Figure BDA0001629961810000123
其中
Figure BDA0001629961810000124
上式即μkk的后验分布
Figure BDA0001629961810000125
的参数更新公式,Tr(·)矩阵的迹;
Figure BDA0001629961810000126
可按照下式计算
Figure BDA0001629961810000131
其中,
Figure BDA0001629961810000132
1为全1列向量,
Figure BDA0001629961810000133
Figure BDA0001629961810000134
表示第k个混合模型的估计误差,因此,
Figure BDA0001629961810000135
的后验分布
Figure BDA0001629961810000136
的参数更新公式为
Figure BDA0001629961810000137
lnq(τk)可按照下式计算
Figure BDA0001629961810000138
因此,τk的后验分布q(τk)=Gam(τk|ck,dk)的参数更新公式为
Figure BDA0001629961810000139
lnq(ηk)可按照下式计算
Figure BDA00016299618100001310
因此,ηk的后验分布q(ηk)=Gam(ηk|ek,fk)的参数更新公式为
Figure BDA0001629961810000141
通过迭代执行变分期望部分和变分最大化部分,模型参数的后验分布将会收敛。本例中收敛的准则为变分下界的相对增量低于设定阈值(10-7)。
(7)在线阶段,采集仅包含辅助变量的未知样本xt,按步骤(3)消除辅助变量的量纲,利用步骤(6)中获得的模型参数的最优后验分布,对氧气含量进行估计。具体来说,根据步骤(6)中计算出来的α的后验分布以及狄利克雷过程的性质,各模型混合系数π=(π1,…,πM)的后验分布可计算为
q(π)=Dir(π|φ1,…,φM) (25)
其中Dir(π|φ1,…,φM)代表参数为(φ1,…,φM)的狄利克雷分布,且
Figure BDA0001629961810000142
然后,根据步骤(6)中计算出的模型参数的后验分布,可得去量纲后的辅助变量xt的边缘分布为
Figure BDA0001629961810000143
其中
Figure BDA0001629961810000144
Figure BDA0001629961810000145
表示参数为
Figure BDA0001629961810000146
的学生氏t分布。进而可得xt对应的隐变量zt=(zt1,…,ztM)的后验分布为
Figure BDA0001629961810000147
其中zt1,…,ztM均为0-1变量,且满足
Figure BDA0001629961810000148
最后,可得氧气含量yt的概率分布为
Figure BDA0001629961810000151
其中
Figure BDA0001629961810000152
因此,根据式(29),可得氧气含量的估计值为
Figure BDA0001629961810000153
为了验证本发明的有效性,从该合成氨工厂一段炉装置计算机分散控制***中收集额外的有标签样本4000组作为校验样本集,按照步骤(7),对氧气含量进行估计,平均估计结果如图3所示。同时,图4和图5分别给出了传统的高斯混合模型与偏最小二乘模型对氧气含量的平均估计结果。在高斯混合模型中,混合组分数量通过贝叶斯信息准则设置为12;在偏最小二乘模型中,主成分数量通过交叉验证法设置为10。可以看出,由于不能处理非线性对象,偏最小二乘模型提供的氧气含量的估计值显著偏离真值;而传统的高斯混合模型的估计结果虽然较偏最小二乘模型有所改善,但仍不能令人满意,尤其在第三、四个操作区域(第2500-4000个样本处)。相比之下,本发明提供的方法在所有操作区域提供的氧气含量估计值基本符合其真值。
采用均方根误差(RMSE)量化本发明与传统的高斯混合模型、偏最小二乘模型的估计精度,定义如下
Figure BDA0001629961810000154
其中yt
Figure BDA0001629961810000155
分别代表第t个校验样本的真实氧气含量与估计值。本发明提供的方法与高斯混合模型、偏最小二乘模型的估计RMSE分别为0.6933、1.1515、1.7143。可见,本发明较高斯混合模型、偏最小二乘模型对氧气含量的估计精度有显著提高,估计误差分别降低了约40%和60%。
上述实施例用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明做出的任何修改和改变,都落入本发明的保护范围。

Claims (5)

1.一种基于半监督贝叶斯高斯混合模型的合成氨过程一段炉氧气含量在线估计方法,其特征在于,包括以下步骤:
(1)选择与一段炉氧气含量y关联的辅助变量
Figure FDA0002478273170000011
其中d表示辅助变量个数;
(2)收集同时包含辅助变量与氧气含量的有标签样本集
Figure FDA0002478273170000012
与仅包含辅助变量的无标签样本集
Figure FDA0002478273170000013
其中nl与nu分别代表有标签样本与无标签样本的数量;
(3)对(Xl,Yl)与Xu做无量纲化处理,将辅助变量样本与氧气含量样本的样本方差转换为单位方差;
(4)给定狄利克雷过程的截断水平M,初始化模型参数
Figure FDA0002478273170000014
的共轭先验分布参数a0、b0、c0、d0、e0、f0、β0、v0、m0、W0与后验分布参数a、b、hk、lk、ck、dk、ek、fk、βk、vk、mk、Wk、ωk、Ωk,其中,
Figure FDA0002478273170000015
Figure FDA0002478273170000016
Figure FDA0002478273170000017
α表示狄利克雷过程的集中因子;
χk表示第k个混合模型系数的参数;
μk和Λk分别表示第k个混合模型中辅助变量x的分布的均值向量和精度矩阵;
Figure FDA0002478273170000018
表示第k个混合模型中辅助变量x与氧气含量y之间的线性回归系数;
τk表示
Figure FDA0002478273170000019
的精度矩阵参数;
ηk表示第k个混合模型中测量噪声的精度矩阵系数;
共轭先验分布参数和后验分布参数的含义为:
(a0,b0)和(a,b)分别表示α的先验分布参数和后验分布参数;
(hk,lk)表示χk的后验分布参数;
(m00,W0,v0)和(mkk,Wk,vk)分别表示(μkk)的先验分布参数和后验分布参数;
(c0,d0)和(ck,dk)分别表示τk的先验分布参数和后验分布参数;
(e0,f0)和(ek,fk)分别表示ηk的先验分布参数和后验分布参数;
ωk和Ωk表示
Figure FDA0002478273170000021
的后验分布参数;
(5)构建有标签样本(Xl,Yl)和无标签样本Xu及其对应的隐变量
Figure FDA0002478273170000022
Figure FDA0002478273170000023
的似然函数,其中,zi=(zi1,…,ziM)T和zj=(zj1,…,zjM)T分别表示第i个有标签样本(xi,yi)和第j个无标签样本xj对应的二进制隐变量,且满足
Figure FDA0002478273170000024
(6)将步骤(3)处理后的训练样本集,步骤(4)中的初始模型参数,以及步骤(5)中构建的似然函数输入半监督贝叶斯高斯混合模型中,通过变分推理学习各个模型参数的最优后验分布q(α)与
Figure FDA0002478273170000025
这里q(·)表示对应变量的最优后验分布;
(7)采集仅包含辅助变量的未知样本,按步骤(3)消除辅助变量的量纲,利用步骤(6)中获得的模型参数的最优后验分布,对氧气含量进行估计。
2.根据权利要求1所述的基于半监督贝叶斯高斯混合模型的合成氨过程一段炉氧气含量在线估计方法,其特征在于,所述的步骤(5)中构建的有标签样本(Xl,Yl)和无标签样本Xu及其对应的隐变量Zl、Zu的似然函数为:
Figure FDA0002478273170000026
Figure FDA0002478273170000027
Figure FDA0002478273170000028
Figure FDA0002478273170000029
Figure FDA00024782731700000210
其中χ=(χ1,…,χM),μ=(μ1,…,μM),Λ=(Λ1,…,ΛM),
Figure FDA00024782731700000211
η=(η1,…,ηM),
Figure FDA00024782731700000212
表示均值为μk、协方差矩阵为
Figure FDA00024782731700000213
的高斯概率密度函数,
Figure FDA00024782731700000214
3.根据权利要求1或2所述的基于半监督贝叶斯高斯混合模型的合成氨过程一段炉氧气含量在线估计方法,其特征在于,所述步骤(6)的模型参数的最优后验分布的参数a,b,hk,lk,ck,dk,ek,fk,βk,vk,mk,Wk,ωk和Ωk的迭代公式具有如下形式:
a=a0+M-1
Figure FDA0002478273170000031
Figure FDA0002478273170000032
Figure FDA0002478273170000033
Figure FDA0002478273170000034
Figure FDA0002478273170000035
Figure FDA0002478273170000036
Figure FDA0002478273170000037
Figure FDA0002478273170000038
Figure FDA0002478273170000039
ck=c0+(d+1)/2
Figure FDA00024782731700000310
Figure FDA00024782731700000311
Figure FDA00024782731700000312
其中,ψ(·)表示digamma函数,I表示相应维数的单位矩阵,
Figure FDA00024782731700000313
1为全1列向量,Tr(·)为矩阵的迹,
Figure FDA00024782731700000314
表示第k个混合模型的估计误差,
Figure FDA00024782731700000315
Figure FDA00024782731700000316
这里
Figure FDA00024782731700000317
表示根据
Figure FDA00024782731700000318
的分布计算
Figure FDA00024782731700000319
的期望;κik和κjk的计算方式为
Figure FDA0002478273170000041
Figure FDA0002478273170000042
其中
Figure FDA0002478273170000043
Figure FDA0002478273170000044
4.根据权利要求1或2所述的基于半监督贝叶斯高斯混合模型的合成氨过程一段炉氧气含量在线估计方法,所述的步骤(7)具体为:
根据步骤(6)中计算出来的α的后验分布以及狄利克雷过程的性质,各模型混合系数π=(π1,…,πM)的后验分布可计算为
q(π)=Dir(π|φ1,…,φM)
其中Dir(π|φ1,…,φM)代表参数为(φ1,…,φM)的狄利克雷分布,且
Figure FDA0002478273170000045
然后,根据步骤(6)中计算出的模型参数的后验分布,可得去量纲后的辅助变量xt的边缘分布为
Figure FDA0002478273170000046
其中
Figure FDA0002478273170000047
表示参数为
Figure FDA0002478273170000048
的学生氏t分布;进而可得xt对应的隐变量zt=(zt1,…,ztM)的后验分布为
Figure FDA0002478273170000051
其中zt1,…,ztM均为0-1变量,且满足
Figure FDA0002478273170000052
然后可求得氧气含量的概率分布,从而得到氧气含量的估计值。
5.根据权利要求4所述的基于半监督贝叶斯高斯混合模型的合成氨过程一段炉氧气含量在线估计方法,所述的氧气含量yt的概率分布为:
Figure FDA0002478273170000053
其中
Figure FDA0002478273170000054
因此,可得氧气含量的估计值为
Figure FDA0002478273170000055
CN201810338582.2A 2018-04-16 2018-04-16 一种基于半监督贝叶斯高斯混合模型的合成氨过程一段炉氧气含量在线估计方法 Active CN108664706B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810338582.2A CN108664706B (zh) 2018-04-16 2018-04-16 一种基于半监督贝叶斯高斯混合模型的合成氨过程一段炉氧气含量在线估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810338582.2A CN108664706B (zh) 2018-04-16 2018-04-16 一种基于半监督贝叶斯高斯混合模型的合成氨过程一段炉氧气含量在线估计方法

Publications (2)

Publication Number Publication Date
CN108664706A CN108664706A (zh) 2018-10-16
CN108664706B true CN108664706B (zh) 2020-11-03

Family

ID=63783484

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810338582.2A Active CN108664706B (zh) 2018-04-16 2018-04-16 一种基于半监督贝叶斯高斯混合模型的合成氨过程一段炉氧气含量在线估计方法

Country Status (1)

Country Link
CN (1) CN108664706B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110083065B (zh) * 2019-05-21 2020-07-10 浙江大学 一种基于流式变分贝叶斯有监督因子分析的自适应软测量方法
CN113470739B (zh) * 2021-07-03 2023-04-18 中国科学院新疆理化技术研究所 一种基于混合隶属度随机块模型的蛋白质相互作用预测方法和***
CN113707240B (zh) * 2021-07-30 2023-11-07 浙江大学 基于半监督非线性变分贝叶斯混合模型的成分参数鲁棒软测量方法
CN117150931B (zh) * 2023-10-30 2024-01-30 中国石油大学(华东) 基于混合单隐层神经网络的混油长度在线估计方法及***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107451102A (zh) * 2017-07-28 2017-12-08 江南大学 一种改进自训练算法的半监督高斯过程回归软测量建模方法
CN107464247A (zh) * 2017-08-16 2017-12-12 西安电子科技大学 一种基于g0分布的随机梯度变分贝叶斯sar图像分割方法
CN107505837A (zh) * 2017-07-07 2017-12-22 浙江大学 一种半监督神经网络模型及基于该模型的软测量建模方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180018757A1 (en) * 2016-07-13 2018-01-18 Kenji Suzuki Transforming projection data in tomography by means of machine learning

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107505837A (zh) * 2017-07-07 2017-12-22 浙江大学 一种半监督神经网络模型及基于该模型的软测量建模方法
CN107451102A (zh) * 2017-07-28 2017-12-08 江南大学 一种改进自训练算法的半监督高斯过程回归软测量建模方法
CN107464247A (zh) * 2017-08-16 2017-12-12 西安电子科技大学 一种基于g0分布的随机梯度变分贝叶斯sar图像分割方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Multimode process data modeling: A Dirichlet process mixture model based Bayesian robust factor analyzer approach;Zhu, JL 等;《CHEMOMETRICS AND INTELLIGENT LABORATORY SYSTEMS》;20150331;第142卷;全文 *
Quality variable prediction for chemical processes based on semisupervised Dirichlet process mixture of Gaussians;Weiming Shao等;《CHEMICAL ENGINEERING SCIENCE》;20190116;第193卷;全文 *

Also Published As

Publication number Publication date
CN108664706A (zh) 2018-10-16

Similar Documents

Publication Publication Date Title
CN108664706B (zh) 一种基于半监督贝叶斯高斯混合模型的合成氨过程一段炉氧气含量在线估计方法
Xiong et al. JITL based MWGPR soft sensor for multi-mode process with dual-updating strategy
CN107688701B (zh) 基于wasp模型的水质软测量及水体富营养化评价方法
CN101863088B (zh) 一种橡胶混炼过程中门尼粘度的预报方法
CN112650063B (zh) 一种基于半监督增量高斯混合回归的自适应软测量方法
CN109033524B (zh) 一种基于鲁棒混合模型的化工过程浓度变量在线估计方法
CN114239400A (zh) 基于局部双加权概率隐变量回归模型的多工况过程自适应软测量建模方法
CN112989711B (zh) 基于半监督集成学习的金霉素发酵过程软测量建模方法
CN104462850A (zh) 基于模糊高斯混合模型的多阶段间歇过程软测量方法
CN109670625A (zh) 基于无迹卡尔曼滤波最小二乘支持向量机的NOx排放浓度预测方法
CN110046377B (zh) 一种基于异构相似度的选择性集成即时学习软测量建模方法
CN105159071A (zh) 一种迭代学习策略下工业模型预测控制***的经济性能评估方法
CN101673096B (zh) 一种丹参注射液生产浓缩过程密度的软测量方法
CN110189800A (zh) 基于多粒度级联循环神经网络的炉氧含量软测量建模方法
CN108171002B (zh) 一种基于半监督混合模型的聚丙烯熔融指数预测方法
CN114169459A (zh) 基于半监督贝叶斯正则化混合Student’s t模型的鲁棒软测量方法
CN114239397A (zh) 基于动态特征提取与局部加权深度学习的软测量建模方法
CN1327376C (zh) 基于支持向量机的软测量仪表建模方法
CN116825253A (zh) 基于特征选择的热轧带钢力学性能预测模型的建立方法
CN116843052A (zh) 一种炼厂生产计划的多目标优化方法
CN113707240B (zh) 基于半监督非线性变分贝叶斯混合模型的成分参数鲁棒软测量方法
CN110728031A (zh) 一种基于ann建模平衡复杂石化过程产能的多目标优化方法
CN112580692B (zh) 一种基于插值算法的虚拟样本生成方法
CN110879873B (zh) 一种基于哈密顿蒙特卡洛采样的vine copula相关性描述的软测量方法及***
CN115035962A (zh) 基于变分自编码器和生成对抗网络的虚拟样本生成及软测量建模方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant