CN103106139A - 基于相关向量回归估计的软件失效时间预测方法 - Google Patents

基于相关向量回归估计的软件失效时间预测方法 Download PDF

Info

Publication number
CN103106139A
CN103106139A CN2013100130049A CN201310013004A CN103106139A CN 103106139 A CN103106139 A CN 103106139A CN 2013100130049 A CN2013100130049 A CN 2013100130049A CN 201310013004 A CN201310013004 A CN 201310013004A CN 103106139 A CN103106139 A CN 103106139A
Authority
CN
China
Prior art keywords
software
software failure
failure time
sigma
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013100130049A
Other languages
English (en)
Other versions
CN103106139B (zh
Inventor
蒋云良
楼俊钢
沈张果
范婧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huzhou University
Original Assignee
Huzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huzhou University filed Critical Huzhou University
Priority to CN201310013004.9A priority Critical patent/CN103106139B/zh
Publication of CN103106139A publication Critical patent/CN103106139A/zh
Application granted granted Critical
Publication of CN103106139B publication Critical patent/CN103106139B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于相关向量回归估计的软件失效时间预测方法,它对软件失效时刻与在它之前的m个失效时刻数据进行学习从而捕捉失效时刻之间的内在依赖关系,由此构建基于相关向量机软件可靠性预测方法。由于充分考虑了软件可靠性预测的小样本特性,采用核函数技术能克服观测变量多于观测样本数的情形以及变量之间存在的多重共线性,因此不会出现神经网络等建模方法所产生的模型“过拟合”情况。在新预测方法中,随着软件失效不断发生,模型参数将不断自动调整以适应失效过程的动态变化,从而实现软件可靠性的自适应预测,有效提高软件失效预测模型的适应能力。

Description

基于相关向量回归估计的软件失效时间预测方法
【技术领域】
本发明涉及软件可靠性测试以及评估过程中下一次或未来较长时间内软件失效时间数据预测方法。 
【背景技术】
软件可靠性指在规定条件下,在规定时间内,软件不发生失效的概率。在解决可靠性预测问题是,传统解决方法反映了大样本统计学的哲学,容易出现过学习以及适用性差等问题。 
统计学习理论是建立在一套较坚实的理论基础之上的,为解决有限样本学习问题提供了一个统一的框架。它能将很多现有方法纳入其中,有望帮助解决许多原来难以解决的问题,如神经网络结构选择问题、局部极小点问题等。相关向量机(relevance vector machine,RVM)是Tipping于2001年所提出的一种稀疏贝叶斯学习模型,在很多方面取得了非常不错的应用,如物体的跟踪,3D姿态估计,3D模型恢复等,电力负荷预测,信道均衡预测等。 
【发明内容】
本发明所要解决的技术问题是提供一种基于相关向量回归估计的软件失效时间预测方法,能实现软件可靠性的自适应预测。为此,本发明采用以下技术方案,它包含如下步骤: 
(1)、首先观测并记录顺序软件失效数据集,并把所有的输入输出数据归一化; 
(2)、通过合理抽象与假设,把软件失效时间预测问题转化为一个函数回归问题; 
(3)、选择用于预测的核函数,并给定参数的初始化值; 
(4)、选择用于学习的失效数据数目; 
(5)、采用相关向量回归估计算法针对不同失效数据集进行学习优化; 
(6)、最后选用优化后的参数对新的失效时间进行预测。 
进一步地,步骤(2)所述的把软件失效时间预测问题转化为一个函数回归问题,采用如下方法: 
假设已发生的软件失效时间为t1,t2,L,tn,令tl=f(tl-m,tl-m+1,L,tl-1),则tl服从固定但未知的条件分布函数F(tl|tl-m,tl-m+1,L,tl-1),在t1,t2,L,tk已知条件下对tk+1进行预测变为:已知k-m个观测(T1,tm+1),(T2,tm+2),L,(Tk-m,tk)和第k-m+1个输入Tk-m+1的情况下,估计第k-m+1个输出值
Figure BDA00002732419100021
其中,Ti表示m维向量[ti,ti+1,L,tm-i]; 
步骤(3)中用到的核函数为高斯核函数,
Figure BDA00002732419100022
其参数初始值g=1。 
步骤(4)中的失效数据数目为5-8之间的整数。 
进一步地,步骤(5)所述的采用相关向量回归估计算法针对不同失效数据集进行学习优化,包括如下过程: 
(5.1)、给定一群向量
Figure BDA00002732419100023
与对应的目标值
Figure BDA00002732419100024
作为输入,假设x与t的对应关系符合以下的函数: 
p(ti)=N(ti|y(xi;w),σ2
(5.2)、令t的概率分布为: 
p ( t | w , σ 2 ) = Π i = 1 n N ( t i | y ( x i ; w ) , σ 2 ) = ( 2 πσ 2 ) - N 2 exp ( - | | t - Φw | | 2 2 σ 2 )
式中,Φ=[φ(x1),φ(x2),Lφ(xN)]T,φ(xn)=[1,k(xn,x1),k(xn,x2),L,k(xn,xN)]T; 
w=[w0,w1,LwN]T, 
(5.3)、对每个权值ωi定义先验概率分布: 
Figure BDA00002732419100026
式中,αi是决定wi先验分布的超参数, 
α=(α1i,LαN)。 
(5.4)、计算未知量的后验分布: p ( w , α , σ 2 | t ) = p ( t | w , α , σ 2 ) p ( w , α , σ 2 ) p ( t )
(5.5)、积分后化简得到: 
p ( w | t , α , σ 2 ) = ( 2 π ) - N + 1 2 | Σ | - 1 2 exp { - ( w - μ ) T Σ - 1 ( w - μ ) 2 } ,
p ( t | α , σ 2 ) = ( 2 π ) - N 2 | Ω | - 1 2 exp { - t T Ω - 1 t 2 }
μ=σ-2∑ΦTt,∑=(A+σ-2ΦTΦ)-1,A=diag(α01,LαN),Ω=σ2I+ΦA-1ΦT, 
(5.6)、计算p(t*|t)的近似解: 
p ( α MP , σ MP 2 ) = arg max α , σ 2 p ( α , σ 2 | t ) , p ( t * | t ) ≈ ∫ p ( t * | w , α MP , σ MP 2 ) p ( w , α MP , σ MP 2 | t ) dw
(5.7)、使用下式迭代求解αMP,
Figure BDA00002732419100036
α i new = γ i μ i 2 , ( σ 2 ) new = | | t - Φμ | | 2 N - Σ i = 0 N γ i , γi=1-αiii。 
由于采用本发明的技术方案,本发明使用RVM对软件失效时刻与在它之前的m个失效时刻数据进行学习从而捕捉失效时刻之间的内在依赖关系,由此构建基于相关向量机软件可靠性预测方法。通过核函数技术的应用,把软件可靠性预测问题转化为一个回归估计问题,并应用相关向量回归估计算法来解决这一问题。在新预测方法中,随着软件失效不断发生,模型参数将不断自动调整以适应失效过程的动态变化,从而实现软件可靠性的自适应预测。 
【附图说明】
图1为本发明软件失效时间预测方法的流程图,即基于相关向量回归估计算法的软件可靠性预测流程图。 
【具体实施方式】
1)数据归一化 
在使用回归估计算法进行学习预测时,首先需要把所有的输入输出数据归一 化到区间[0.1,0.9],具体转化式子为:
Figure BDA00002732419100041
其中,y是归一化后的值,x是实际值,xmax是数据集中的最大值,xmin是最小值,Δ=xmax-xmin,预测结束后,采用以下映射把数据映射回到实际值:
Figure BDA00002732419100042
2)问题转化 
假设已发生的软件失效时间为t1,t2,L,tn,令tl=f(tl-m,tl-m+1,L,tl-1),则tl服从固定但未知的条件分布函数F(tl|tl-m,tl-m+1,L,tl-1),使用RVM对软件失效时刻数据进行学习,可以捕捉失效时间内在的依赖关系。RVM的输入为m维向量[tl-m,tl-m+1,L,tl-1],输出为tl,则RVM总的输入序列为t1,t2,L,tn,L; 
输出序列为:tm+1,tm+2,L,tn,tn+1,L。 
若用于RVM进行学习的失效时刻序列为t1,t2,L,tk(k>m),则在t1,t2,L,tk已知条件下对tk+1进行预测变为:已知k-m个观测(T1,tm+1),(T2,tm+2),L,(Tk-m,tk)和第k-m+1个输入Tk-m+1的情况下,估计第k-m+1个输出值
Figure BDA00002732419100043
其中,Ti表示m维向量[ti,ti+1,L,tm+i]。把
Figure BDA00002732419100044
作为输入,则可以预测同理可以得到
Figure BDA00002732419100046
Figure BDA00002732419100047
预测值的均值函数由下式给出: 
t k + 1 ^ = Σ i = 1 m w i K ( T i + 1 , T i ) + w 0
Figure BDA00002732419100049
概率预测分布函数为: 
p ( t k + 1 | T ) ≈ N ( t k + 1 | y k + 1 , σ k + 1 2 )
3)选择用于预测的核函数,并给定参数的初始化值 
Figure BDA000027324191000411
Figure BDA00002732419100051
4)确定核函数参数的值 
核函数参数选择问题,其实质就是一个优化问题,采用网格搜索法进行核函数参数选择,比如在用SVM预测时,采用高斯核函数,需要确定两个参数即惩罚因子C与核函数参数g,基于网格法将C∈[C1,C2],变化步长为Cs,而g∈[g1,g2],变化步长为gt,针对每对参数(C,g)进行训练,选取效果最好的一对参数作为模型参数 
5)相关向量机回归估计算法 
用RVM解决回归问题可以描述为:给定一群向量
Figure BDA00002732419100052
与对应的目标值 作为输入,想要找出xi与ti之间的对应关系,使得在遇到一个新的向量x*时,能够预测出它所对应的目标值t*,ti是任意实数。x与t的对应关系符合以下的函数: 
p(ti)=N(ti|y(xi;w),σ2
可以合理地假设
Figure BDA00002732419100054
是彼此独立的随机变数, 
在已知
Figure BDA00002732419100055
与σ2条件下,t的概率分布为 
p ( t | w , σ 2 ) = Π i = 1 n N ( t i | y ( x i ; w ) , σ 2 ) = ( 2 π σ 2 ) - N 2 exp ( - | | t - Φw | | 2 2 σ 2 )
式中,Φ=[φ(x1),φ(x2),Lφ(xN)]T,φ(xn)=[1,k(xn,x1),k(xn,x2),L,k(xn,xN)]T; 
w=[w0,w1,LwN]T,对每个权值ωi定义先验概率分布: 
p ( w | α ) = Π i = 0 N α i 2 π exp ( - α i w i 2 2 )
式中,αi是决定wi先验分布的超参数,α=(α1i,LαN)。 
根据权值的先验分布和样本集似然函数,未知量的后验分布可由贝叶斯公式计算得到: 
p ( w , α , σ 2 | t ) = p ( t | w , α , σ 2 ) p ( w , α , σ 2 ) p ( t )
因此,给定一个新的向量x*时,t*的概率分布预测为: 
p(t*|t)=∫p(t*|w,α,σ2)p(w,α,σ2|t)dwdαdσ2, 
p(w,α,σ2|t)=p(w|t,α,σ2)p(α,σ2|t) 
从而,有 
p ( w | t , α , σ 2 ) = p ( w , α , σ 2 | t ) p ( α , σ 2 | t ) = p ( t | w , σ 2 ) p ( w | α ) p ( t | α , σ 2 ) = p ( t | w , σ 2 ) p ( w | α ) ∫ p ( t | w , σ 2 ) p ( w | α ) dw
上式中的p(t|w,σ2)与p(w|α)都是高斯函数的乘积,积分后化简得到: 
p ( w | t , α , σ 2 ) = ( 2 π ) - N + 1 2 | Σ | - 1 2 exp { - ( w - μ ) T Σ - 1 ( w - μ ) 2 } ,
p ( t | α , σ 2 ) = ( 2 π ) - N 2 | Ω | - 1 2 exp { - t T Ω - 1 t 2 }
其中,μ=σ-2∑ΦTt,∑=(A+σ-2ΦTΦ)-1,A=diag(α01,LαN),Ω=σ2I+ΦA-1ΦT,从而可以找到p(t*|t)的近似解: 
p ( α MP , σ MP 2 ) = arg max α , σ 2 p ( α , σ 2 | t ) , p ( t * | t ) ≈ ∫ p ( t * | w , α MP , σ MP 2 ) p ( w , α MP , σ MP 2 | t ) dw
积分式中的两项皆为高斯函数的乘积。这样,定积分后结果为: 
p ( t * | t ) ≈ N ( t * | y * , σ * 2 ) , y*=μTφ(x*), σ * 2 = σ MP 2 + φ ( x * ) T Σφ ( x * ) ,
φ(x*)=[1,k(x*,x1),k(x*,x2),L,k(x*,xN)]T
最后,剩下的问题是求解αMP, σ MP 2 : α i new = γ i μ i 2 , ( σ 2 ) new = | | t - Φμ | | 2 N - Σ i = 0 N γ i , γi=1-αiii,其中∑ii是∑中第i项在对角线上的元素,先给出α,σ2的猜测值,然后由上式不断 更新,就能逼近αMP,
Figure BDA00002732419100071
为了对所建立的模型提供合理的比较与分析,采用10个来自不同类型软件的真实失效数据集对所提出的模型进行了实验分析,如表2所示。这些数据集描述了各个软件***的失效过程,每个数据点包含两种观测统计集合:累计执行时间和累计失效次数。在实验中,训练集包括从测试开始后完整的***失效过程,为了让核函数进行充分的学习,在实验过程中,取所有数据集的前三分之一作为学习数据,对后面三分之二数据进行预测后与真实数据进行比较。 
表中列出了在十个数据集上各个模型的AE值,其中模型1-6分别代表SRGM With Logistic TEF、SRGM With Rayleigh TEF、Delayed S-Shaped Model With Logistic TEF、Delayed S-Shaped Model With Rayleigh TEF,G-O model、Yamada Delayed S-Shaped;模型7代表本发明采用的方法,a、b、c、d代表采用的核函数分别为Gaussian Function、Linear Function、Polynomial Function、Symmetric Triangle Function。 
表1:10个数据集上各个模型预测的AE值 
Figure BDA00002732419100072
结论:在不同数据集上,采用不同的核函数以及采用不同的回归估计方法 时,模型预测性能均有差异,采用基于相关向量回归估计算法的软件可靠性预测模型能有效提高模型的预测性能和适用性。 

Claims (4)

1.基于相关向量回归估计的软件失效时间预测方法,其特征是,它包含如下步骤: 
(1)、首先观测并记录顺序软件失效数据集,并把所有的输入输出数据归一化; 
(2)、通过合理抽象与假设,把软件失效时间预测问题转化为一个函数回归问题; 
(3)、选择用于预测的核函数,并给定参数的初始化值; 
(4)、选择用于学习的失效数据数目; 
(5)、采用相关向量回归估计算法针对不同失效数据集进行学习优化; 
(6)、最后选用优化后的参数对新的失效时间进行预测。 
2.如权利要求1所述的基于相关向量回归估计的软件失效时间预测方法,其特征是,步骤(2)所述的把软件失效时间预测问题转化为一个函数回归问题,采用如下方法: 
假设已发生的软件失效时间为t1,t2,L,tn,令tl=f(tl-m,tl-m+1,L,t1-1),则tl服从固定但未知的条件分布函数F(tl|tl-m,tl-m+1,L,tl-1),在t1,t2,L,tk已知条件下对tk+1进行预测变为:已知k-m个观测(T1tm+1),(T2,tm+2),L,(Tk-m,tk)和第k-m+1个输入Tk-m+1的情况下,估计第k-m+1个输出值
Figure FDA00002732419000011
其中,Ti表示m维向量[ti,ti+1,L,tm+i]。 
3.如权利要求1所述基于相关向量回归估计的软件失效时间预测方法,其特征是,步骤(3)中用到的核函数为高斯核函数,
Figure FDA00002732419000012
其参数初始值g=1。步骤(4)中的失效数据数目为5-8之间的整数。 
4.如权利要求1所述基于相关向量回归估计的软件失效时间预测方法,其特征是,步骤(5)所述的采用相关向量回归估计算法针对不同失效数据集进行学习优化,包括如下过程: 
(5.1)、给定一群向量
Figure FDA00002732419000021
与对应的目标值
Figure FDA00002732419000022
作为输入,假设x与t的对应关系符合以下的函数: 
p(ti)=N(ti|y(xi;w),σ2
(5.2)、令t的概率分布为: 
式中,Φ=[φ(x1),φ(x2),Lφ(xN)]T,φ(xn)=[1,k(xn,x1),k(xn,x2),L,k(xn,xN)]T; 
w=[w0,w1,LwN]T, 
(5.3)、对每个权值ωi定义先验概率分布: 
Figure FDA00002732419000024
式中,αi是决定wi先验分布的超参数, 
α=(α1i,LαN)。 
(5.4)、计算未知量的后验分布:
Figure FDA00002732419000025
(5.5)、积分后化简得到: 
Figure FDA00002732419000027
μ=σ-2∑ΦTt,∑=(A+σ-2ΦTΦ)-1,A=diag(α01,LαN),Ω=σ2I+ΦA-1ΦT, 
(5.6)、计算p(t*|t)的近似解: 
Figure FDA00002732419000028
(5.7)、使用下式迭代求解αMP,
Figure FDA000027324190000210
Figure FDA00002732419000031
γi=1-αiii。 
CN201310013004.9A 2013-01-14 2013-01-14 基于相关向量回归估计的软件失效时间预测方法 Active CN103106139B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310013004.9A CN103106139B (zh) 2013-01-14 2013-01-14 基于相关向量回归估计的软件失效时间预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310013004.9A CN103106139B (zh) 2013-01-14 2013-01-14 基于相关向量回归估计的软件失效时间预测方法

Publications (2)

Publication Number Publication Date
CN103106139A true CN103106139A (zh) 2013-05-15
CN103106139B CN103106139B (zh) 2016-06-15

Family

ID=48314017

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310013004.9A Active CN103106139B (zh) 2013-01-14 2013-01-14 基于相关向量回归估计的软件失效时间预测方法

Country Status (1)

Country Link
CN (1) CN103106139B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104111887A (zh) * 2014-07-01 2014-10-22 江苏科技大学 基于Logistic模型的软件故障预测***及方法
CN105260304A (zh) * 2015-10-19 2016-01-20 湖州师范学院 一种基于qbgsa-rvr的软件可靠性预测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1667587A (zh) * 2005-04-11 2005-09-14 北京航空航天大学 基于扩展的马尔克夫贝叶斯网的软件可靠性评估方法
US20120209575A1 (en) * 2011-02-11 2012-08-16 Ford Global Technologies, Llc Method and System for Model Validation for Dynamic Systems Using Bayesian Principal Component Analysis

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1667587A (zh) * 2005-04-11 2005-09-14 北京航空航天大学 基于扩展的马尔克夫贝叶斯网的软件可靠性评估方法
US20120209575A1 (en) * 2011-02-11 2012-08-16 Ford Global Technologies, Llc Method and System for Model Validation for Dynamic Systems Using Bayesian Principal Component Analysis

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
楼俊钢 等: "软件可靠性预测的核函数方法", 《计算机科学》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104111887A (zh) * 2014-07-01 2014-10-22 江苏科技大学 基于Logistic模型的软件故障预测***及方法
CN105260304A (zh) * 2015-10-19 2016-01-20 湖州师范学院 一种基于qbgsa-rvr的软件可靠性预测方法
CN105260304B (zh) * 2015-10-19 2018-03-23 湖州师范学院 一种基于qbgsa‑rvr的软件可靠性预测方法

Also Published As

Publication number Publication date
CN103106139B (zh) 2016-06-15

Similar Documents

Publication Publication Date Title
Bosman et al. Spatial anomaly detection in sensor networks using neighborhood information
Kaytez et al. Forecasting electricity consumption: A comparison of regression analysis, neural networks and least squares support vector machines
Corizzo et al. Anomaly detection and repair for accurate predictions in geo-distributed big data
Almeida et al. PV power forecast using a nonparametric PV model
Maatallah et al. Recursive wind speed forecasting based on Hammerstein Auto-Regressive model
Yan et al. Time series wind power forecasting based on variant Gaussian Process and TLBO
US10929529B2 (en) Cyber physical attack detection
Alekseev et al. A multivariate neural forecasting modeling for air transport–preprocessed by decomposition: a Brazilian application
Gaitan et al. Comparison of statistically downscaled precipitation in terms of future climate indices and daily variability for southern Ontario and Quebec, Canada
Ropero et al. Discretizing environmental data for learning Bayesian-network classifiers
Shen et al. A novel echo state network for multivariate and nonlinear time series prediction
Wang et al. A support vector machine based MSM model for financial short-term volatility forecasting
Krishna An integrated approach for weather forecasting based on data mining and forecasting analysis
CN103093095A (zh) 基于核主成分回归算法的软件失效时间预测方法
Kajornrit et al. Estimation of missing precipitation records using modular artificial neural networks
Efendi et al. Maximum-minimum temperature prediction using fuzzy random auto-regression time series model
Gallego et al. Maintaining flexibility in smart grid consumption through deep learning and deep reinforcement learning
Pan et al. Probabilistic Short‐Term Wind Power Forecasting Using Sparse Bayesian Learning and NWP
Wang et al. An optimized complementary prediction method based on data feature extraction for wind speed forecasting
CN103106139B (zh) 基于相关向量回归估计的软件失效时间预测方法
Zaman et al. A deep learning model for forecasting photovoltaic energy with uncertainties
CN103093094A (zh) 基于核偏最小二乘回归算法的软件失效时间预测方法
Jokar et al. On the existence of proper stochastic Markov models for statistical reconstruction and prediction of chaotic time series
Dong et al. An improved prediction approach on solar irradiance of photovoltaic Power Station
CN116523001A (zh) 电网薄弱线路识别模型构建方法、装置和计算机设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant