CN104680015A - 一种基于快速相关向量机的污水处理在线软测量方法 - Google Patents

一种基于快速相关向量机的污水处理在线软测量方法 Download PDF

Info

Publication number
CN104680015A
CN104680015A CN201510093369.6A CN201510093369A CN104680015A CN 104680015 A CN104680015 A CN 104680015A CN 201510093369 A CN201510093369 A CN 201510093369A CN 104680015 A CN104680015 A CN 104680015A
Authority
CN
China
Prior art keywords
alpha
phi
sigma
model
formula
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510093369.6A
Other languages
English (en)
Inventor
许玉格
曹涛
罗飞
宋亚龄
张雍涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201510093369.6A priority Critical patent/CN104680015A/zh
Publication of CN104680015A publication Critical patent/CN104680015A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Activated Sludge Processes (AREA)

Abstract

本发明公开了一种基于快速相关向量机的污水处理在线软测量方法,包含以下顺序的步骤:通过快速边际似然算法估计超参数,得到模型的权重值和样本偏差值;然后建立快速相关向量机在线预测模型,对模型参数寻优,实现了污水中BOD的精确快速测量。本发明的测量方法,能够满足实时性的要求,建立最优预测模型,预测精度得到了提高,效果显著,性能得到了改善,快速相关向量机建立的污水水质在线软测量模型预测精度高、泛化能力强、更新时间短,对于节省污水处理厂运营费用,实时反映污水水质状况,对污水处理自动控制***具有重要的意义。

Description

一种基于快速相关向量机的污水处理在线软测量方法
技术领域
本发明涉及污水处理领域,特别涉及一种基于快速相关向量机的污水处理在线软测量方法。
背景技术
污水处理是经济发展和水资源保护不可或缺的组成部分。随着国民经济的快速增长,污水排放量也大大增加,而污水处理厂太少,处理周期太长,远远达不到国家对环境保护的要求。同时国家对环境保护的投入加大,污水处理技术越来越受到更多的关注。国家发展规划中明确提出要研发并推广低能耗、有效的污水处理技术。
污水排放标准中,衡量是否达标的参数指标有:化学需氧量COD、生化需氧量BOD、氨氮、磷、固体悬浮物等。其中生化需氧量BOD和化学需氧量COD反映水被有机污染的程序,BOD/COD的比率反映出了污水的生物降解能力。这两个参数的测量对控制污水处理具有非常重要的价值。化学需氧量COD是指,水样在一定条件下,以氧化1升水样中还原性物质所消耗的氧化剂的量为指标,折算成每升水样全部被氧化后,需要的氧的毫克数,以mg/L表示。生化需氧量BOD是指微生物在一定的温度和时间条件下分解氧化有机物所消耗的溶解氧量,以mg/L表示。
现在的污水处理一般都采用稀释法、传感器等测量污水中BOD、COD的浓度,但由于分析测定这两个指标的周期较长,测量中时常出现误差,不能及时反应污水处理的现场情况,因而污水控制***存在着较大的延时,不能发挥其最佳的性能。本发明提出一种新的测量BOD的软测量方法,通过快速边际似然算法来对相关向量机的训练过程进行改进,能够更快地使超参数达到稳定值,从而得到权重值和偏差值,并构建在线的快速相关向量机软测量模型,实现对污水处理出水BOD的测量。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种基于快速相关向量机的污水处理在线软测量方法。
本发明的目的通过以下的技术方案实现:
一种基于快速相关向量机的污水处理在线软测量方法,包含以下顺序的步骤:
A、通过快速边际似然算法估计超参数,得到模型的权重值和样本偏差值;
B、然后建立快速相关向量机在线预测模型,对模型参数寻优,实现了污水中BOD的精确快速测量。
所述的基于快速相关向量机的污水处理在线软测量方法,具体包含以下步骤:
S1.剔除输入和输出的数据中的异常点,由于各输入变量量纲的不同,对其进行归一化处理,归一化到[0,1]区间中;
S2.给定污水数据集{(xn,tn),n=1,2,...,N},xn∈Rd,tn∈R,N是样本数,为简便起见,只考虑标量目标函数,我们遵循标准的概率公式,假定:
tn=y(xn;w)+εn    (1)
其中,y(·)是非线性函数,εn是均值为0,方差为σ2的高斯噪声,即因此有tn~N(y(xn),σ2),这表明tn满足均值y(xn)为方差为σ2的高斯噪声分布,与支持向量机类似,函数y(x)定义为
y ( x ; w ) = Σ i = 1 N w i K ( x , x i ) + w 0 - - - ( 2 )
其中,由公式φi(x)=K(x,xi)来确定基函数,其核被训练向量参数化,假定tn是相互独立的,则整个训练集的似然函数可写为
p ( t | w , σ 2 ) = ( 2 πσ 2 ) - N / 2 exp ( - | | t - Φw | | 2 2 σ 2 ) - - - ( 3 )
式中t=[t1,t2,...,tN]T,w=[w0,w1,...,wM]T,Φ是一个N×(N+1)的设计矩阵,Φ=[φ12,...,φM]是组非线性基函数,φ(xn)=[1,K(xn,x1),K(xn,x2),...,K(xn,xN)]T
由于在模型中有和训练样本差不多的参数个数,从(3)式中得到的w和σ2的最大似然估计值有可能导致模型过拟合;为了避免过度拟合,通常的做法是给参数强加一些限制条件;在这里,我们从贝叶斯概率框架出发,通过定义一个先验概率分布来限制参数w和σ2
这里选择一个比较平滑的函数,定义w的先验概率分布为零均值的高斯分布:
p ( w | α ) = Π j = 0 N N ( w j | 0 , α j - 1 ) - - - ( 4 )
式(4)中:超参数α=[α01,...,αN]T,更重要的是,每个独立的超参数αj只与其对应的权值wj相关;通过这个限制条件,在经过大量的污水数据学习后,大部分超参数会趋近于无穷大,而与其对应的权值为0,从而使RVM具有较高的稀疏性;
现在已经定义了先验概率,从贝叶斯规则来看,对于给定的数据中未知数据,贝叶斯推理通过计算后验概率处理:
p ( w , α , σ 2 | t ) = p ( t | w , α , σ 2 ) p ( w , α , σ 2 ) p ( t ) - - - ( 5 )
给定一个测试点x*,相应的污水出水水质预测值t*的预测分布为
p(t*|t)=∫p(t*|w,α,σ2)p(w,α,σ2|t)dwdαdσ2    (6)
根据贝叶斯公式,利用样本似然函数(4)和w先验分布(5)可得w的后验分布为
p ( w | tα , β ) = p ( w | α ) p ( t | w , β ) p ( t | α , β ) - - - ( 7 )
我们把后验概率分解为
p(w,α,σ2|t)=p(|w|t,α,σ2)p(α,σ2|t)    (8)
因此对权重的后验概率分布为
p ( w | t , α , σ 2 ) = p ( t | w , σ 2 ) p ( w | α ) p ( t | α , σ 2 ) = ( 2 π ) - ( N + 1 ) / 2 | Σ | - 1 / 2 exp { - 1 2 ( w - μ ) T Σ - 1 ( w - μ ) } - - - ( 9 )
其协方差为∑=(σ-2ΦTΦ+A)-1    (10)
平均值为μ=σ-2∑ΦTt    (11)
其中矩阵A=diag(α01,...,αN)
( α i ) new = γ i μ i 2 - - - ( 12 )
( σ 2 ) new = | | t - Φμ | | 2 N - Σ i γ i - - - ( 13 )
其中γi≡1-αiii,∑ii为协方差矩阵∑的第i个对角元素;最后通过公式(10)到公式(13)的迭代推理运算得到超参数α和方差σ2的估计值;输出的污水水质预测值为y*=μTφ(x*),x*是污水处理过程输入值;
S3.用快速边际似然算法估计超参数
针对相关向量机计算时间复杂度大、内存开销大的问题,采用了一种快速边际似然算法;它在训练过程中从空集开始动态地扩充基矩阵Φ,从而增大边际似然函数,或者去掉基矩阵Φ冗余的列来增大目标函数;
S4.对待预测的污水样本数据进行预测:将入水数据作为训练好的相关向量机软测量模型的输入,模型的输出即为出水BOD的预测结果。
所述的步骤S3,具体包含以下顺序的步骤:
相关向量机是通过最大化边际似然函数p(t|α,σ2)的方法确定超参数α和方差σ2的,等价于最大化为其对数;记L(α)=log[p(t|α,σ2)],整理有
L ( α ) = log [ p ( t | α , σ 2 ) ] = log [ ∫ p ( t | w , σ 2 ) p ( w | α ) ] = - 1 2 [ N log 2 π + log | C | + t T C - 1 t ] - - - ( 14 )
其中C=σ2I+ΦA-1ΦT,t=[t1,t2,…,tN]T
为了便于最大化L(α),对矩阵C进行等价变换,如下:
C = σ 2 I + ΦA - 1 Φ T = σ 2 I + Σ m ≠ i α m - 1 φ m φ m T + α i - 1 φ i φ i T = C - i + α i - 1 φ i φ i T - - - ( 15 )
其中此矩阵表示当αi=∞时,相应的基向量φi被移除后样本对应的协方差矩阵,根据矩阵相关性质整理可得
| C | = | C - i | | 1 + α i - 1 φ i T C - i - 1 φ i | C - 1 = C - i - 1 - C - i - 1 φ i φ i T C - i - 1 α i + φ i T C - i - 1 φ i - - - ( 16 )
因此公式(14)可以改写为
L ( α ) = - 1 2 [ N log 2 π + log | C | + t T C - i t - log α i + log ( α i + φ i T C - i - 1 φ i ) - ( φ i T C - i - 1 t ) 2 α i + φ i T C - i - 1 φ i ] = L ( α - i ) + 1 2 [ log α i - log ( α i + s i ) + ( q i ) 2 α i + s i = L ( α - i ) + l ( α i ) - - - ( 17 )
注意L(α-i)表示为当αi=∞时,相应的基本向量φi被移除后所对应的边界似然函数的对数,而l(αi)表示边界似然的对数函数中只与αi有关的独立部分,上式对αi求偏导有
∂ L ( α ) ∂ α i = ∂ l ( α i ) ∂ α i = 1 2 [ 1 α i - 1 α i + φ i T C - i - 1 φ i - ( φ i T C - i - 1 t ) 2 α i + φ i T C - i - 1 φ i ] - - - ( 18 )
S i = φ i T C - i - 1 φ i , Q i = φ i T C - i - 1 t - - - ( 19 )
所以公式(18)可改写为
∂ L ( α ) ∂ α i = α i - 1 S i 2 - ( Q i 2 - S i ) 2 ( α i + S i ) 2 - - - ( 20 )
令公式(20)等于零,考虑到αi是方差值必须为正,所以当时有
α i = S i 2 Q i 2 - S i - - - ( 21 )
对L(α)关于αi求二阶偏导有
∂ 2 L ( α ) ∂ α i 2 = - α i - 2 S i 2 ( α i + S i ) 2 - 2 ( α i + S i ) [ α i - 1 S i 2 - ( Q i 2 - S i ) ] 2 ( α i + S i ) 4 = α i - 2 S i 2 2 ( α i + S i ) 2 - S i 2 α i ( α i + S i ) 3 - [ α i - 1 S i 2 - ( Q i 2 - S i ) ] ( α i + S i ) 3 - - - ( 22 )
综合公式(20)和(21)进行分析可知
∂ 2 L ( α ) ∂ α i 2 | α i = S i 2 Q i 2 - S i = - S i 2 2 α i 2 ( α i + S i ) 2 - - - ( 23 )
所以当时,公式(23)左边的表达式是恒小于零的,并对以上推导公式分析可得,L(α)有唯一最大值点为
α i = S i 2 Q i 2 - S i Q i 2 > S i ∞ Q i 2 ≤ S i - - - ( 24 )
由此得到L(α)的最大值。
所述的贝叶斯L(α)通过以下方法最大化:
a、当基向量φi在模型中,即αi<∞,但有则将φi从模型中删除,即令αi=∞,这样可以增大贝叶斯L(α);
b、当基向量φi在模型中,即αi=∞,但有则将φi添加到模型中并利用公式(24)更新αi,这样可以增大贝叶斯L(α);
c、当基向量φi在模型中,即αi<∞,但有则用公式(24)更新αi,这样可以增大贝叶斯L(α)。
所述的快速相关向量机,其回归基本算法步骤如下:
Ⅰ、初始化σ2
Ⅱ、用单个基向量φi初始化αi,由公式(24)分析整理可得并设置其他的αm(m≠i)为无穷大;
Ⅲ、计算∑、μ并对所有M个基函数φm初始化Sm和Qm
Ⅳ、从所有M个基函数φm集合中选择候选的基向量φi
Ⅴ、计算 &theta; i &equiv; Q i 2 - S i ;
Ⅵ、若θi>0且αi<∞(基向量φi在模型中),重新估计αi
Ⅶ、若θi>0且αi=∞(基向量φi不在模型中),添加φi到模型中并重新估计αi
Ⅷ、若θi≤0且αi<∞,删除φi并设置αi=∞;
Ⅸ、估计噪声方差其中N为数据个数,M为基函数个数;
Ⅹ、重新计算协方差矩阵∑,权重矩阵μ以及相应迭代过程中的Sm和Qm
Ⅺ、若收敛或者达到最大迭代次数,则保存权重值及偏差值,此次训练结束;否则转步骤IV继续训练。
本发明与现有技术相比,具有如下优点和有益效果:
1、本发明采用一种基于快速相关向量机的污水出水水质在线软测量模型。首先建立快速相关向量机离线模型,然后根据工况实时更新模型,保留模型中重要的信息数据,并运用快速边际似然算法加快模型的学习速度,满足实时性的要求,建立最优预测模型,预测精度得到了提高,效果显著,性能得到了改善。快速相关向量机建立的污水水质在线软测量模型预测精度高、泛化能力强、更新时间短,对于节省污水处理厂运营费用,实时反映污水水质状况,对污水处理自动控制***具有重要的意义。
2、软测量的基本思想是把自动控制理论与生产过程知识有机结合起来,应用计算机技术,针对难于测量或暂时不能测量的重要变量(或称之为主导变量),选择另外一些容易测量的变量(或称之为辅助变量),通过构成某种数学关系来推断和估计,以软件来代替硬件(传感器)功能。这种方法响应迅速,能够连续给出主导变量信息,且具有投资低、维护保养简单等优点。将软测量技术用于污水处理过程,能降低污水处理厂的能耗,设备维护费等,并且对于传感器测量产生的误差有较正作用。但是传统的离线软测量模型是根据大量的数据一次训练建立的,之后不会再改变,这样就可能造成对新数据适应度不那么强。在线的软测量模型则是先建立离线模型,然后根据工况的变化模型也作相应的改变,始终与最新的数据保持近似同步更新,这样预测精度也得到了相应提高。
附图说明
图1是本发明模型在线模型出水BOD结果拟合图;
图2是本发明模型离线训练权重值分布图;
图3是本发明模型离线模型出水BOD结果拟合图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
本发明采用快速相关向量机建立离线模型;利用快速边际似然算法改进模型的训练过程,可以加快模型的在线训练速度,使超参数更快地达到稳定值。其算法步骤如下
算法步骤:
S1.初始化σ2
S2.用单个基向量φi初始化αi,由公式(24)分析整理可得并设置其他的αm(m≠i)为无穷大;
S3.计算∑、μ并对所有M个基函数φm初始化Sm和Qm
S4.从所有M个基函数φm集合中选择候选的基向量φi
S5.计算 &theta; i &equiv; Q i 2 - S i ;
S6.若θi>0且αi<∞(基向量φi在模型中),重新估计αi
S7.若θi>0且αi=∞(基向量φi不在模型中),添加φi到模型中并重新估计αi
S8.若θi≤0且αi<∞,删除φi并设置αi=∞;
S9.估计噪声方差其中N为数据个数,M为基函数个数;
S10.重新计算协方差矩阵∑,权重矩阵μ以及相应迭代过程中的Sm和Qm
S11.若收敛或者达到最大迭代次数,则保存权重值及偏差值,此次训练结束;否则转S4继续训练。
污水数据来源于加州大学数据库(UCI)中的污水数据。BOD是反映水体被有机物污染程度的综合指标。与悬浮固体浓度,进出水的化学需氧量,进水的生物需氧量,流量,PH值等变量密切相关温度。建模所需辅助变量为可降解固体浓度RD-SED-G,悬浮固体浓度RD-SS-G,生化需氧量RD-DBO-G,化学需氧量RD-DQO-G,初沉池中的生化需氧量RD-DBO-P,悬浮固体浓度RD-SS-P,二沉池中的生化需氧量RD-DBO-S,化学需氧量RD-DQO-S,入水中的生化需氧量DBO,化学需氧量DQO,二级处理中的化学需氧量DQO,生化需氧量DBO,悬浮固体浓度SS,PH值PH-S,可降解固体浓度SED,出水的化学需氧量DQO-S,可降解固体浓度SED-S,悬浮固体浓度SS-S,PH值PH-S。由上可知,输入属性19个,输出属性1个。选取处理后的400组数据,其中200组用于训练模型,200组用作新数据测试模型精度。
(2)RVM建模步骤如下:
污水数据集{(xn,tn),n=1,2,...,N},xn∈Rd,tn∈R,N是样本数,假定:
tn=y(xn;w)+εn    (1)
其中,y(·)是非线性函数,εn是均值为0,方差为σ2的高斯噪声,即因此有tn~N(y(xn),σ2),函数y(x)定义为
y ( x ; w ) = &Sigma; i = 1 N w i K ( x , x i ) + w 0 - - - ( 2 )
在公式中确定基函数,其核被训练向量参数化φi(x)=K(x,xi).假定tn是相互独立的,则整个训练集的似然函数可写为
p ( t | w , &sigma; 2 ) = ( 2 &pi;&sigma; 2 ) - N / 2 exp ( - | | t - &Phi;w | | 2 2 &sigma; 2 ) - - - ( 3 )
式中t=[t1,t2,...,tN]T,w=[w0,w1,...,wM]T,Φ是一个N×(N+1)的设计矩阵,Φ=[φ12,...,φM]是组非线性基函数,φ(xn)=[1,K(xn,x1),K(xn,x2),...,K(xn,xN)]T.
由于在模型中有和训练样本差不多的参数个数,从(3)式中得到的w和σ2的最大似然估计值有可能导致模型过拟合.为了避免过度拟合,通常的做法是给参数强加一些限制条件.在这里,我们从贝叶斯概率框架出发,通过定义一个先验概率分布来限制这些参数,
这里选择一个比较平滑的函数,定义w的先验概率分布为零均值的高斯分布:
p ( w | &alpha; ) = &Pi; j = 0 N N ( w j | 0 , &alpha; j - 1 ) - - - ( 4 )
式(4)中:超参数α=[α01,...,αN]T,更重要的是,每个独立的超参数αj只与其对应的权值wj相关.通过这个限制条件,在经过大量的污水数据学习后,大部分超参数会趋近于无穷大,而与其对应的权值为0,从而使RVM具有较高的稀疏性。
从贝叶斯规则来看,对于给定的数据中未知数据,贝叶斯推理通过计算后验概率处理,
p ( w , &alpha; , &sigma; 2 | t ) = p ( t | w , &alpha; , &sigma; 2 ) p ( w , &alpha; , &sigma; 2 ) p ( t ) - - - ( 5 )
给定一个测试点x*,相应的污水出水水质预测值t*的预测分布为
p(t*|t)=∫p(t*|w,α,σ2)p(w,α,σ2|t)dwdαdσ2    (6)
根据贝叶斯公式,利用样本似然函数(4)和w先验分布(5)可得w的后验分布为
p ( w | t&alpha; , &beta; ) = p ( w | &alpha; ) p ( t | w , &beta; ) p ( t | &alpha; , &beta; ) - - - ( 7 )
我们把后验概率分解为
p(w,α,σ2|t)=p(|w|t,α,σ2)p(α,σ2|t)    (8)
因此对权重的后验概率分布为
p ( w | t , &alpha; , &sigma; 2 ) = p ( t | w , &sigma; 2 ) p ( w | &alpha; ) p ( t | &alpha; , &sigma; 2 ) = ( 2 &pi; ) - ( N + 1 ) / 2 | &Sigma; | - 1 / 2 exp { - 1 2 ( w - &mu; ) T &Sigma; - 1 ( w - &mu; ) } - - - ( 9 )
其协方差为
∑=(σ-2ΦTΦ+A)-1    (10)
平均值为
μ=σ-2∑ΦTt    (11)
其中矩阵A=diag(α01,...,αN)
( &alpha; i ) new = &gamma; i &mu; i 2 - - - ( 12 )
( &sigma; 2 ) new = | | t - &Phi;&mu; | | 2 N - &Sigma; i &gamma; i - - - ( 13 )
其中γi≡1-αiii,∑ii为协方差矩阵∑的第i个对角元素.最后通过(10)到(13)式的迭代推理运算得到超参数α和方差σ2的估计值。
输出的污水水质预测值为y*=μTφ(x*),x*是污水处理过程输入值。离线模型预测结果如图3所示。权值分布如图2所示。
(3)假设最新的污水输入属性为xnew,实际的出水BOD值为ynew,则出水BOD的在线更新算法如下步骤:
S1.根据历史数据使用上节所述快速相关向量机回归基本算法步骤建立初始模型;
S2.如果来了新数据,则对新来的污水数据xnew用公式(2)进行预测并计算偏差;否则,转到S8;
S3.添加新样本(xnew,ynew)到模型中并初始化权重w为0,αnew初始化为1;
S5.估计噪声方差其中N为数据个数,M为基函数个数;
S6.重新计算∑,μ以及相应迭代过程中的Sm和Qm,计算公式分别为∑=(σ-2ΦTΦ+A)-1,μ=σ-2∑ΦTt,
S7.若收敛或者达到最大迭代次数,则保存权重值和偏差,转S2继续预测数据;否则转S4。
S8.程序结束。
在线模型实际运行预测结果如图1所示。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (5)

1.一种基于快速相关向量机的污水处理在线软测量方法,其特征在于,包含以下顺序的步骤:
A、通过快速边际似然算法估计超参数,得到模型的权重值和样本偏差值;
B、然后建立快速相关向量机在线预测模型,对模型参数寻优,实现了污水中BOD的精确快速测量。
2.根据权利要求1所述的基于快速相关向量机的污水处理在线软测量方法,其特征在于,具体包含以下步骤:
S1.剔除输入和输出的数据中的异常点,由于各输入变量量纲的不同,对其进行归一化处理,归一化到[0,1]区间中;
S2.给定污水数据集{(xn,tn),n=1,2,...,N},xn∈Rd,tn∈R,N是样本数,为简便起见,只考虑标量目标函数,我们遵循标准的概率公式,假定:
tn=y(xn;w)+εn                    (1)
其中,y(·)是非线性函数,εn是均值为0,方差为σ2的高斯噪声,即因此有tn~N(y(xn),σ2),这表明tn满足均值y(xn)为方差为σ2的高斯噪声分布,与支持向量机类似,函数y(x)定义为
y ( x ; w ) = &Sigma; i = 1 N w i K ( x , x i ) + w 0 - - - ( 2 )
其中,由公式φi(x)=K(x,xi)来确定基函数,其核被训练向量参数化,假定tn是相互独立的,则整个训练集的似然函数可写为
p ( t | w , &sigma; 2 ) = ( 2 &pi; &sigma; 2 ) - N / 2 exp ( - | | t - &Phi;w | | 2 2 &sigma; 2 ) - - - ( 3 )
式中t=[t1,t2,...,tN]T,w=[w0,w1,...,wM]T,Φ是一个N×(N+1)的设计矩阵,Φ=[φ12,...,φM]是组非线性基函数,φ(xn)=[1,K(xn,x1),K(xn,x2),...,K(xn,xN)]T
由于在模型中有和训练样本差不多的参数个数,从(3)式中得到的w和σ2的最大似然估计值有可能导致模型过拟合;为了避免过度拟合,通常的做法是给参数强加一些限制条件;在这里,我们从贝叶斯概率框架出发,通过定义一个先验概率分布来限制参数w和σ2
这里选择一个比较平滑的函数,定义w的先验概率分布为零均值的高斯分布:
p ( w | &alpha; ) = &Pi; j = 0 N N ( w j | 0 , &alpha; j - 1 ) - - - ( 4 )
式(4)中:超参数α=[α01,...,αN]T,更重要的是,每个独立的超参数αj只与其对应的权值wj相关;通过这个限制条件,在经过大量的污水数据学习后,大部分超参数会趋近于无穷大,而与其对应的权值为0,从而使RVM具有较高的稀疏性;
现在已经定义了先验概率,从贝叶斯规则来看,对于给定的数据中未知数据,贝叶斯推理通过计算后验概率处理:
p ( w , &alpha; , &sigma; 2 | t ) = p ( t | w , &alpha; , &sigma; 2 ) p ( w , &alpha; , &sigma; 2 ) p ( t ) - - - ( 5 )
给定一个测试点x*,相应的污水出水水质预测值t*的预测分布为
p(t*|t)=∫p(t*|w,α,σ2)p(w,α,σ2|t)dwdαdσ2          (6)
根据贝叶斯公式,利用样本似然函数(4)和w先验分布(5)可得w的后验分布为
p ( w | t&alpha; , &beta; ) = p ( w | &alpha; ) p ( t | w , &beta; ) p ( t | &alpha; , &beta; ) - - - ( 7 )
我们把后验概率分解为
p(w,α,σ2|t)=p(|w|t,α,σ2)p(α,σ2|t)           (8)
因此对权重的后验概率分布为
p ( w | t , &alpha; , &sigma; 2 ) = p ( t | w , &sigma; 2 ) p ( w | &alpha; ) p ( t | &alpha; , &sigma; 2 ) = ( 2 &pi; ) - ( N + 1 ) / 2 | &Sigma; | - 1 / 2 exp { - 1 2 ( w - &mu; ) T &Sigma; - 1 ( w - &mu; ) } - - - ( 9 )
其协方差为Σ=(σ-2ΦTΦ+A)-1              (10)
平均值为μ=σ-2ΣΦTt              (11)
其中矩阵A=diag(α01,...,αN)
( &alpha; i ) new = &gamma; i &mu; i 2 - - - ( 12 )
( &sigma; 2 ) new = | | t - &Phi;&mu; | | 2 N - &Sigma; i &gamma; i - - - ( 13 )
其中γi≡1-αiΣii,Σii为协方差矩阵Σ的第i个对角元素;最后通过公式(10)到公式(13)的迭代推理运算得到超参数α和方差σ2的估计值;输出的污水水质预测值为y*=μTφ(x*),x*是污水处理过程输入值;
S3.用快速边际似然算法估计超参数
针对相关向量机计算时间复杂度大、内存开销大的问题,采用了一种快速边际似然算法;它在训练过程中从空集开始动态地扩充基矩阵Φ,从而增大边际似然函数,或者去掉基矩阵Φ冗余的列来增大目标函数;
S4.对待预测的污水样本数据进行预测:将入水数据作为训练好的相关向量机软测量模型的输入,模型的输出即为出水BOD的预测结果。
3.根据权利要求2所述的基于快速相关向量机的污水处理在线软测量方法,其特征在于,所述的步骤S3,具体包含以下顺序的步骤:
相关向量机是通过最大化边际似然函数p(t|α,σ2)的方法确定超参数α和方差σ2的,等价于最大化为其对数;记L(α)=log[p(t|α,σ2)],整理有
L ( &alpha; ) = log [ p ( t | &alpha; , &sigma; 2 ) ] = log [ &Integral; p ( t | w , &sigma; 2 ) p ( w | &alpha; ) ] = - 1 2 [ N log 2 &pi; + log | C | + t T C - 1 t ] - - - ( 14 )
其中C=σ2I+ΦA-1ΦT,t=[t1,t2,…,tN]T
为了便于最大化L(α),对矩阵C进行等价变换,如下:
C = &sigma; 2 I + &Phi; A - 1 &Phi; T = &sigma; 2 I + &Sigma; m &NotEqual; i &alpha; m - 1 &phi; m &phi; m T + &alpha; i - 1 &phi; i &phi; i T = C - i + &alpha; i - 1 &phi; i &phi; i T - - - ( 15 )
其中此矩阵表示当αi=∞时,相应的基向量φi被移除后样本对应的协方差矩阵,根据矩阵相关性质整理可得
| C | = | C i | | 1 + &alpha; i - 1 &phi; i T C - i - 1 &phi; i |
C - 1 = C - i - 1 - C - i - 1 &phi; i &phi; i T C - i - 1 &alpha; i + &phi; i T C - i - 1 &phi; i - - - ( 16 )
因此公式(14)可以改写为
L ( &alpha; ) = - 1 2 [ N log 2 &pi; + log | C | + t T C - i t - log &alpha; i + log ( &alpha; i + &phi; i T C - i - 1 &phi; i ) - ( &phi; i T C - i - 1 t ) 2 &alpha; i + &phi; i T C - i - 1 &phi; i ] = L ( &alpha; - i ) + 1 2 [ log &alpha; i - log ( &alpha; i + s i ) + ( q i ) 2 &alpha; i + s i ] = L ( &alpha; - i ) + l ( &alpha; i ) - - - ( 17 )
注意L(α-i)表示为当αi=∞时,相应的基本向量φi被移除后所对应的边界似然函数的对数,而l(αi)表示边界似然的对数函数中只与αi有关的独立部分,上式对αi求偏导有
&PartialD; L ( &alpha; ) &PartialD; &alpha; i = &PartialD; l ( &alpha; i ) &PartialD; &alpha; i = 1 2 [ 1 &alpha; i - 1 &alpha; i + &phi; i T C - i - 1 &phi; i - ( &phi; i T C - i - 1 t ) 2 &alpha; i + &phi; i T C - i - 1 &phi; i ] - - - ( 18 )
S i = &phi; i T C - i - 1 &phi; i , Q i = &phi; i T C - i - 1 t - - - ( 19 )
所以公式(18)可改写为
&PartialD; L ( &alpha; ) &PartialD; &alpha; i = &alpha; i - 1 S i 2 - ( Q i 2 - S i ) 2 ( &alpha; i + S i ) 2 - - - ( 20 )
令公式(20)等于零,考虑到αi是方差值必须为正,所以当时有
&alpha; i = S i 2 Q i 2 - S i - - - ( 21 )
对L(α)关于αi求二阶偏导有
&PartialD; 2 L ( &alpha; ) &PartialD; &alpha; i 2 = - &alpha; i - 2 S i 2 ( &alpha; i + S i ) 2 - 2 ( &alpha; i + S i ) [ &alpha; i - 1 S i 2 - ( Q i 2 - S i ) ] 2 ( &alpha; i + S i ) 4 = &alpha; i - 2 S i 2 2 ( &alpha; i + S i ) 2 - S i 2 &alpha; i ( &alpha; i + S i ) 3 - [ &alpha; i - 1 S i 2 - ( Q i 2 - S i ) ] ( &alpha; i + S i ) 3 - - - ( 22 )
综合公式(20)和(21)进行分析可知
&PartialD; 2 L ( &alpha; ) &PartialD; &alpha; i 2 | &alpha; i = S i 2 Q i 2 - S i = - S i 2 2 &alpha; i 2 ( &alpha; i + S i ) 2 - - - ( 23 )
所以当时,公式(23)左边的表达式是恒小于零的,并对以上推导公式分析可得,L(α)有唯一最大值点为
&alpha; i = S i 2 Q i 2 - S i Q i 2 > S i &infin; Q i 2 &le; S i - - - ( 24 )
由此得到L(α)的最大值。
4.根据权利要求3所述的基于快速相关向量机的污水处理在线软测量方法,其特征在于,所述的贝叶斯L(α)通过以下方法最大化:
a、当基向量φi在模型中,即αi<∞,但有则将φi从模型中删除,即令αi=∞,这样可以增大贝叶斯L(α);
b、当基向量φi在模型中,即αi=∞,但有则将φi添加到模型中并利用公式(24)更新αi,这样可以增大贝叶斯L(α);
c、当基向量φi在模型中,即αi<∞,但有则用公式(24)更新αi,这样可以增大贝叶斯L(α)。
5.根据权利要求3所述的基于快速相关向量机的污水处理在线软测量方法,所述的快速相关向量机,其回归基本算法步骤如下:
Ⅰ、初始化σ2
Ⅱ、用单个基向量φi初始化αi,由公式(24)分析整理可得并设置其他的αm(m≠i)为无穷大;
Ⅲ、计算Σ、μ并对所有M个基函数φm初始化Sm和Qm
Ⅳ、从所有M个基函数φm集合中选择候选的基向量φi
Ⅴ、计算 &theta; i = Q i 2 - S i ;
Ⅵ、若θi>0且αi<∞(基向量φi在模型中),重新估计αi
Ⅶ、若θi>0且αi=∞(基向量φi不在模型中),添加φi到模型中并重新估计αi
Ⅷ、若θi≤0且αi<∞,删除φi并设置αi=∞;
Ⅸ、估计噪声方差其中N为数据个数,M为基函数个数;
Ⅹ、重新计算协方差矩阵Σ,权重矩阵μ以及相应迭代过程中的Sm和Qm
Ⅺ、若收敛或者达到最大迭代次数,则保存权重值及偏差值,此次训练结束;否则转步骤IV继续训练。
CN201510093369.6A 2015-03-02 2015-03-02 一种基于快速相关向量机的污水处理在线软测量方法 Pending CN104680015A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510093369.6A CN104680015A (zh) 2015-03-02 2015-03-02 一种基于快速相关向量机的污水处理在线软测量方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510093369.6A CN104680015A (zh) 2015-03-02 2015-03-02 一种基于快速相关向量机的污水处理在线软测量方法

Publications (1)

Publication Number Publication Date
CN104680015A true CN104680015A (zh) 2015-06-03

Family

ID=53315048

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510093369.6A Pending CN104680015A (zh) 2015-03-02 2015-03-02 一种基于快速相关向量机的污水处理在线软测量方法

Country Status (1)

Country Link
CN (1) CN104680015A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104914227A (zh) * 2015-06-16 2015-09-16 华南理工大学 基于多高斯核自优化相关向量机的污水水质软测量方法
CN105023071A (zh) * 2015-08-14 2015-11-04 中国科学院重庆绿色智能技术研究院 一种基于高斯云变换和模糊时间序列的水质预测方法
CN105243256A (zh) * 2015-08-27 2016-01-13 肖红军 一种生化需氧量参数在线软测量方法
CN105487526A (zh) * 2016-01-04 2016-04-13 华南理工大学 一种Fast RVM污水处理故障诊断方法
CN105740619A (zh) * 2016-01-28 2016-07-06 华南理工大学 基于核函数的加权极限学习机污水处理在线故障诊断方法
CN106021924A (zh) * 2016-05-19 2016-10-12 华南理工大学 基于多属性高斯核函数快速相关向量机的污水在线软测量方法
CN106681305A (zh) * 2017-01-03 2017-05-17 华南理工大学 一种Fast RVM污水处理在线故障诊断方法
CN110110890A (zh) * 2019-03-28 2019-08-09 杭州电子科技大学 基于elman神经网络的日污水量预测方法
CN110197022A (zh) * 2019-05-21 2019-09-03 浙江大学 面向流式大数据的并行概率变分软测量建模方法
CN110717601A (zh) * 2019-10-15 2020-01-21 厦门铅笔头信息科技有限公司 一种基于有监督学习和无监督学习的反欺诈方法
CN111523676A (zh) * 2020-04-17 2020-08-11 第四范式(北京)技术有限公司 辅助机器学习模型上线的方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140099971A1 (en) * 2012-10-10 2014-04-10 University-Industry Cooperation Group Of Kyunghee University Apparatus and method for measuring location of user equipment located indoors in wireless network
CN103793604A (zh) * 2014-01-25 2014-05-14 华南理工大学 一种基于相关向量机的污水处理软测量方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140099971A1 (en) * 2012-10-10 2014-04-10 University-Industry Cooperation Group Of Kyunghee University Apparatus and method for measuring location of user equipment located indoors in wireless network
CN103793604A (zh) * 2014-01-25 2014-05-14 华南理工大学 一种基于相关向量机的污水处理软测量方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘俊顺: "基于聚类的相关向量机快速分类算法研究", 《中国优秀硕士学位论文全文数据库》 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104914227A (zh) * 2015-06-16 2015-09-16 华南理工大学 基于多高斯核自优化相关向量机的污水水质软测量方法
CN104914227B (zh) * 2015-06-16 2016-10-05 华南理工大学 基于多高斯核自优化相关向量机的污水水质软测量方法
CN105023071A (zh) * 2015-08-14 2015-11-04 中国科学院重庆绿色智能技术研究院 一种基于高斯云变换和模糊时间序列的水质预测方法
CN105243256A (zh) * 2015-08-27 2016-01-13 肖红军 一种生化需氧量参数在线软测量方法
CN105487526A (zh) * 2016-01-04 2016-04-13 华南理工大学 一种Fast RVM污水处理故障诊断方法
CN105487526B (zh) * 2016-01-04 2019-04-09 华南理工大学 一种Fast RVM污水处理故障诊断方法
CN105740619B (zh) * 2016-01-28 2018-06-12 华南理工大学 基于核函数的加权极限学习机污水处理在线故障诊断方法
CN105740619A (zh) * 2016-01-28 2016-07-06 华南理工大学 基于核函数的加权极限学习机污水处理在线故障诊断方法
CN106021924A (zh) * 2016-05-19 2016-10-12 华南理工大学 基于多属性高斯核函数快速相关向量机的污水在线软测量方法
CN106021924B (zh) * 2016-05-19 2019-01-18 华南理工大学 基于多属性高斯核函数快速相关向量机的污水在线软测量方法
CN106681305A (zh) * 2017-01-03 2017-05-17 华南理工大学 一种Fast RVM污水处理在线故障诊断方法
CN110110890A (zh) * 2019-03-28 2019-08-09 杭州电子科技大学 基于elman神经网络的日污水量预测方法
CN110197022A (zh) * 2019-05-21 2019-09-03 浙江大学 面向流式大数据的并行概率变分软测量建模方法
CN110717601A (zh) * 2019-10-15 2020-01-21 厦门铅笔头信息科技有限公司 一种基于有监督学习和无监督学习的反欺诈方法
CN110717601B (zh) * 2019-10-15 2022-05-03 厦门铅笔头信息科技有限公司 一种基于有监督学习和无监督学习的反欺诈方法
CN111523676A (zh) * 2020-04-17 2020-08-11 第四范式(北京)技术有限公司 辅助机器学习模型上线的方法及装置
CN111523676B (zh) * 2020-04-17 2024-04-12 第四范式(北京)技术有限公司 辅助机器学习模型上线的方法及装置

Similar Documents

Publication Publication Date Title
CN104680015A (zh) 一种基于快速相关向量机的污水处理在线软测量方法
US10570024B2 (en) Method for effluent total nitrogen-based on a recurrent self-organizing RBF neural network
US11346831B2 (en) Intelligent detection method for biochemical oxygen demand based on a self-organizing recurrent RBF neural network
Bagherzadeh et al. Prediction of energy consumption and evaluation of affecting factors in a full-scale WWTP using a machine learning approach
CN102854296B (zh) 一种基于集成神经网络的污水处理软测量方法
CN107358021B (zh) 一种基于优化bp神经网络的do预测模型建立方法
CN108469507B (zh) 一种基于自组织rbf神经网络的出水bod软测量方法
CN104182794B (zh) 一种基于神经网络的污水处理过程出水总磷tp软测量方法
Hansen et al. Modeling phosphorous dynamics in a wastewater treatment process using Bayesian optimized LSTM
CN101799888B (zh) 基于仿生智能蚁群算法的工业软测量方法
CN101566612A (zh) 一种污水化学需氧量软测量方法
CN114037163A (zh) 一种基于动态权重pso优化bp神经网络的污水处理出水质量预警方法
CN109828089A (zh) 一种基于dbn-bp的水质参数亚硝酸氮的在线预测方法
CN109492265A (zh) 基于高斯过程回归的动态非线性pls软测量建模方法
CN103793604A (zh) 一种基于相关向量机的污水处理软测量方法
CN104914227B (zh) 基于多高斯核自优化相关向量机的污水水质软测量方法
Wang et al. A full-view management method based on artificial neural networks for energy and material-savings in wastewater treatment plants
CN111125907B (zh) 一种基于混合智能模型的污水处理氨氮软测量方法
Qiao et al. A repair algorithm for radial basis function neural network and its application to chemical oxygen demand modeling
CN109408896B (zh) 一种污水厌氧处理产气量多元智能实时监控方法
CN115206444A (zh) 基于fcm-anfis模型的最佳投药量预测方法
CN114330815A (zh) 一种基于改进goa优化lstm的超短期风电功率预测方法与***
Chang et al. Soft measurement of effluent index in sewage treatment process based on overcomplete broad learning system
CN112001436A (zh) 一种基于改进的极限学习机的水质分类方法
CN110837886A (zh) 一种基于elm-sl0神经网络的出水nh4-n软测量方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150603

WD01 Invention patent application deemed withdrawn after publication