CN109460356B - 一种用于软件故障预测的数据融合方法 - Google Patents

一种用于软件故障预测的数据融合方法 Download PDF

Info

Publication number
CN109460356B
CN109460356B CN201811218891.2A CN201811218891A CN109460356B CN 109460356 B CN109460356 B CN 109460356B CN 201811218891 A CN201811218891 A CN 201811218891A CN 109460356 B CN109460356 B CN 109460356B
Authority
CN
China
Prior art keywords
software
data
evidence
fault prediction
prediction data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811218891.2A
Other languages
English (en)
Other versions
CN109460356A (zh
Inventor
王丽
方建勇
张贝贝
杨召
李吟
姜婷婷
张峻玮
陈善浩
王凯
陈丹阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
716th Research Institute of CSIC
Original Assignee
716th Research Institute of CSIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 716th Research Institute of CSIC filed Critical 716th Research Institute of CSIC
Priority to CN201811218891.2A priority Critical patent/CN109460356B/zh
Publication of CN109460356A publication Critical patent/CN109460356A/zh
Application granted granted Critical
Publication of CN109460356B publication Critical patent/CN109460356B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3604Software analysis for verifying properties of programs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种用于软件故障预测的数据融合方法,该方法首先根据软件故障预测数据集合的固有数据特征对待融合的两个软件故障预测数据集合进行可融合度判定,然后对故障数据进行特征提取,采用D‑S证据理论对软件故障预测数据集合进行一致性判断,再通过阈值设置,判断是否达到数据融合的条件,从而实现故障预测数据融合。本发明可实现将***联调、软件三方测试、***运行、同类软件历史数据等不同的软件故障预测数据进行融合用于故障预测的目的;通过该方法可以扩大软件故障预测数据的样本容量、缩短软件故障预测数据采集时间,提高软件故障预测精度。

Description

一种用于软件故障预测的数据融合方法
技术领域
本发明涉及数据融合技术,特别是一种用于软件故障预测的数据融合方法。
背景技术
为了提高软件故障预测精度,需要拥有足够多的故障数据采集时间和足够大的预测样本数据量,以确保软件故障预测的准确性。
考虑到在软件全生命周期中同样可以采集到大量的故障数据,这些数据一般不包含时间标签,但与***运行时采集到故障预测拥有相同的数据特征,如缺陷类型、严重级别、根本原因、发生位置、触发条件等。如果能采取某种方法,判断出两类数据是否拥有同样的失效原因,并且将失效原因相同的数据加以融合和消除,而将失效原因不同的数据合并到已有的故障预测数据中,就能够达到扩大样本量、缩短数据采集时间的目的,但现有技术中尚无一种方法能解决上述问题。
发明内容
本发明的目的在于提供一种用于软件故障预测的数据融合方法。
实现本发明目的的技术方案为:一种用于软件故障预测的数据融合方法,包括以下步骤:
步骤1、定义软件故障预测数据的识别框架和识别特征集合,将D-S证据理论引入到软件故障预测数据集合一致性的判断过程中;
步骤2、基于软件故障预测数据集合在识别特征上的分布规律,将每一识别特征可信度函数确定的问题转化为数理统计中样本方差的F检验问题,并根据D-S证据理论的合成法则进行证据合成计算;
步骤3、根据软件***所在的领域不同,设置相应的阈值,当可融合度达到或超过该阈值时,将待融合的数据集合融合到软件故障预测数据集合中,实现软件故障预测数据融合。
本发明与现有技术相比,其显著优点为:
(1)本发明可在不延长软件运行时故障预测数据采集时间的前提下,丰富软件故障预测数据的样本量;
(2)本发明可为融合到软件故障预测数据集合中的软件全生命周期阶段采集到的数据添加时间标签,有效支撑软件故障预测;
(3)本发明可在同等预测精度的前提下,缩短软件故障预测数据采集时间,提高软件故障预测效率。
下面结合附图对本发明作进一步详细描述。
附图说明
图1为本发明用于软件故障预测的数据融合方法。
图2为本发明基于D-S证据理论的软件故障预测数据融合方法实施流程图。
具体实施方式
本发明在研究D-S证据理论原理以及软件故障预测数据特征分布规律的基础上,将软件故障预测数据特征定义为D-S证据理论中的识别特征,将样本的方差检验显著性水平定义为D-S证据理论中单一识别特征上的可信度函数,进而运用D-S证据理论,实现数据集合的可融合判定;然后通过对软件故障预测数据的切片处理和测试用例的特征提取与比对,实现对融合到软件故障预测数据集合中的软件全生命周期阶段的故障预测数据添加时间标签的目的。
如图1所示,一种用于软件故障预测的数据融合方法,包括以下步骤:
步骤1、构建软件故障预测数据的识别框架和识别特征集合,利用D-S证据理论进行软件故障预测数据集合一致性判断;具体方法为:
步骤1-1、定义识别框架Θ={可融合,不可融合},焦元分别为A={可融合},B={不可融合};
步骤1-2、定义识别特征集合
Figure GDA0003318007640000021
步骤1-3、设定依据数据特征,推出的基本可信度函数为mi,其中在mi上可融合的概率为:mi(A)=ai,在mi上不可融合的概率为:mi(B)=bi,其他情况的概率为:ci=1-ai-bi
步骤2、基于软件故障预测数据集合在识别特征上的分布规律,将每一识别特征的可信度函数确定问题转化为数理统计中样本方差的F检验问题,并根据D-S证据理论的合成法则进行证据合成计算,得到软件故障预测数据集合的可融合度;具体为:
步骤2-1、针对第i个数据特征Mi,假设数据Xi={Xi1,Xi2,...Xim}和Yi={Yi1,Yi2,...,Yin}为来自同一总体的两个独立样本,且该总体服从正态分布,如果假设成立,则两组数据应当拥有相同的方差值,之后确定单一特征上的可信度函数,由数理统计可知,当样本X和Y均服从正态分布时,其样本方差
Figure GDA0003318007640000031
Figure GDA0003318007640000032
的比值满足F分布,即
Figure GDA0003318007640000033
其中m和n分别为X和Y的样本容量,则利用样本方差
Figure GDA0003318007640000034
Figure GDA0003318007640000035
的比值
Figure GDA0003318007640000036
来确定X和Y的总体方差
Figure GDA0003318007640000037
Figure GDA0003318007640000038
相等的概率ri,即F检验的显著性水平,固令样本X和Y在特征mi上可融合的可信度函数为:mi(A)=ai=ri
步骤2-2、构建证据不冲突情况下的合成法则,证据无冲突的情况下,直接应用D-S组合公式进行两两组合计算,得到:
k=mi(A)mj(B)+mi(B)mj(A)
mij(A)=[mi(A)mj(Θ)+mi(Θ)mj(A)+mi(A)mj(A)]/(1-k)
mij(B)=[mi(B)mj(Θ)+mi(Θ)mj(B)+mi(B)mj(B)]/(1-k)
mij(Θ)=[mi(Θ)mj(Θ)]/(1-k)
式中,mi(Θ)=ci;mij(A)、mij(B)和mij(Θ)为识别特征mi和mj联合支持证据A、B和其他情况的概率;
化简得到:
k=aibj+biaj
Figure GDA0003318007640000041
Figure GDA0003318007640000042
Figure GDA0003318007640000043
其中1≤i,j≤k
由此得到联合基本可信度函数
Figure GDA0003318007640000044
的计算公式:
mij(A)=aij;mij(B)=bij;mij(Θ)=cij
对全部数据特征作用下的基本可信度函数m0,由
Figure GDA0003318007640000045
依序进行两两运算,并由
a0=m0(A)
得出利用全部数据特征推论得到的X和Y可融合度a0
步骤2-3、构建证据冲突情况下的合成法则,当证据冲突的情况下,采用基于加权的平均证据组合方法,对证据进行处理,其步骤为:
①计算证据之间的距离d,将证据mi看作向量,即
mi=[mi(A),mi(B),mi(Θ)]
Figure GDA0003318007640000046
其中<mi,mj>表示向量的内积,||mi||2=<mi,mi>
用距离矩阵DM表示证据间的两两距离,即
Figure GDA0003318007640000051
②计算证据两两相似性,定义证据间的相似度为Sij=1-dij
得到相似性矩阵SM
Figure GDA0003318007640000052
③计算证据的可信度,设其他证据对mi的支持度
Figure GDA0003318007640000053
则证据mi的可信度C(mi)可表示为
Figure GDA0003318007640000054
④对证据做加权平均
以可信度C(mi)作为mi的权重,得到
Figure GDA0003318007640000055
则X和Y可融合度
a0=m(A)。
步骤3、根据软件***所在的领域不同,设置相应的阈值,当可融合度达到或超过该阈值时,将待融合的数据集合融合到软件故障预测数据集合中,实现软件故障预测数据融合。
下面结合实施例对本发明进行详细说明。
实施例
结合图2,本发明一种基于D-S证据理论的软件故障预测数据融合方法,步骤如下:
第一步:定义软件故障预测数据的识别框架和识别特征集合,将D-S证据理论引入到软件故障预测数据集合一致性的判断过程中;
工程实践中对软件故障预测数据通常通过缺陷类型、根本原因等属性进行描述,通过对一般软件故障预测数据和可靠性测试软件故障预测数据的共有属性进行分析,整理出4个典型的属性:M1(缺陷类型)、M2(根本原因)、M3(严重级别)、M4(发生位置)。如果两个软件故障预测数据在上述4个属性描述上都是一致的,则认为,这两个软件故障预测数据是同一个软件故障预测数据,认为二者是可融合的。因此,把M1(缺陷类型)、M2(根本原因)、M3(严重级别)、M4(发生位置)定义为软件故障预测数据的识别特征,并定义数据特征Mi推出的基本可信度函数为mi,其中mi(A)=ai,mi(B)=bi,ci=1-ai-bi
第二步:基于软件故障预测数据集合在识别特征上的分布规律,将每一识别特征上的可信度函数确定的问题转化为数理统计中样本方差的F检验问题,并根据D-S证据理论的合成法则进行证据合成计算;
根据对大量的软件故障预测数据样本统计分析发现,软件的软件故障预测数据在特定的识别特征上的分布近似服从正态分布。一般软件故障预测数据集合X和可靠性软件故障预测数据集合Y均为来自总体Z的样本。如果X、Y的样本量足够大,则二者的方差必然相等或近似相等。但一般情况下,二者的样本量不大,所以如果两个样本中的数据不是完全一致或者近似一致,二者的方差必然会出现差别,为了保证能从一般软件故障预测数据集合X中甄选出足够多的与Y中不一致的软件故障预测数据,我们设定可融合度的门限值为0.95。
第一、假设由前文提及的可信度函数计算得到在每个识别特征上,样本X、Y的可信度值分别为m1(A)=r1,m2(A)=r2,m3(A)=r3,m4(A)=r4
第二、根据计算公式:
Figure GDA0003318007640000061
或基于加权的平均证据组合方法得到a0
第三、根据软件***所在的领域不同,设置相应的阈值,当可融合度a0达到或超过该阈值时,则认为软件故障预测数据集合X和Y中数据近似一致,X中软件故障预测数据对扩充样本量没有帮助;反之则认为X中数据可添加到Y中,对后续可靠性测试与评估有帮助。
第三步:将待融合的数据集合融合到软件故障预测数据集合中,实现软件故障预测数据融合,达到扩大软件故障预测数据的样本容量、缩短软件故障预测数据采集时间,提高软件故障预测精度的目的。

Claims (3)

1.一种用于软件故障预测的数据融合方法,其特征在于,包括以下步骤:
步骤1、构建软件故障预测数据的识别框架和识别特征集合,利用D-S证据理论进行软件故障预测数据集合一致性判断;
步骤2、基于软件故障预测数据集合在识别特征上的分布规律,将每一识别特征的可信度函数确定问题转化为数理统计中样本方差的F检验问题,并根据D-S证据理论的合成法则进行证据合成计算,得到软件故障预测数据集合的可融合度;
步骤3、根据软件***所在的领域不同,设置相应的阈值,当可融合度达到或超过该阈值时,将待融合的数据集合融合到软件故障预测数据集合中,实现软件故障预测数据融合。
2.根据权利要求1所述的用于软件故障预测的数据融合方法,其特征在于,步骤1具体为:
步骤1-1、定义识别框架Θ={可融合,不可融合},焦元分别为A={可融合},B={不可融合};
步骤1-2、定义识别特征集合
Figure FDA0003340683570000011
步骤1-3、设定依据数据特征,推出的基本可信度函数为mi(·),其中在mi(·)上可融合的概率为:mi(A)=ai,在mi(·)上不可融合的概率为:mi(B)=bi,其他情况的概率为:ci=1-ai-bi,i表示次序。
3.根据权利要求2所述的用于软件故障预测的数据融合方法,其特征在于,步骤2基于软件故障预测数据集合在识别特征上的分布规律,将每一识别特征的可信度函数确定问题转化为数理统计中样本方差的F检验问题,并根据D-S证据理论的合成法则进行证据合成计算,具体为:
步骤2-1、针对第i个基本可信度函数为mi(·),假设数据Xi={Xi1,Xi2,...,Xip}和Yi={Yi1,Yi2,...,Yiq}为来自同一总体的两个独立样本,且该总体服从正态分布,如果假设成立,则两组数据应当拥有相同的方差值,之后确定单一特征上的可信度函数,由数理统计可知,当样本Xi和Yi均服从正态分布时,其样本方差
Figure FDA0003340683570000027
Figure FDA0003340683570000028
的比值满足F分布,即
Figure FDA0003340683570000021
其中p和q分别为Xi、Yi的样本容量,则利用样本方差
Figure FDA0003340683570000022
Figure FDA0003340683570000023
的比值
Figure FDA0003340683570000024
来确定Xi和Yi的总体方差
Figure FDA0003340683570000025
Figure FDA0003340683570000026
相等的概率ri,即F检验的显著性水平,因此可得,样本Xi和Yi的基本可信度函数为mi(·)为:mi(A)=ai=ri
步骤2-2、构建证据不冲突情况下的合成法则,证据无冲突的情况下,直接应用D-S组合公式进行两两组合计算,得到:
k=mi(A)mj(B)+mi(B)mj(A)
mij(A)=[mi(A)mj(Θ)+mi(Θ)mj(A)+mi(A)mj(A)]/(1-k)
mij(B)=[mi(B)mj(Θ)+mi(Θ)mj(B)+mi(B)mj(B)]/(1-k)
mij(Θ)=[mi(Θ)mj(Θ)]/(1-k)
式中,mi(Θ)=ci;mij(A)、mij(B)和mij(Θ)分别为基本可信度函数为mi(·)和基本可信度函数为mj(·)联合支持证据A、B和其他情况的概率,i、j表示次序;
化简得到:
k=aibj+biaj
Figure FDA0003340683570000031
Figure FDA0003340683570000032
Figure FDA0003340683570000033
其中1≤i,j≤k;
由此得到联合基本可信度函数
Figure FDA0003340683570000034
的计算公式:
mij(A)=aij;mij(B)=bij;mij(Θ)=cij
对全部数据特征作用下的基本可信度函数m0(·),由
Figure FDA0003340683570000035
依序进行两两运算,并由
a0=m0(A)
得出利用全部数据特征推论得到的Xi和Yi可融合度a0
步骤2-3、构建证据冲突情况下的合成法则,当证据冲突的情况下,采用基于加权的平均证据组合方法,对证据进行处理,其步骤为:
①计算证据之间的距离d,将基本可信度函数为mi(·)看作向量,即
mi=[mi(A),mi(B),mi(Θ)]
Figure FDA0003340683570000036
其中<mi,mj>表示向量的内积,‖mi2=<mi,mi>
用距离矩阵DM表示证据间的两两距离,即
Figure FDA0003340683570000041
②计算证据两两相似性,定义证据间的相似度为Sij=1-dij
得到相似性矩阵SM
Figure FDA0003340683570000042
③计算证据的可信度,设其他证据对mi的支持度
Figure FDA0003340683570000043
n表示矩阵的行数;
则基本可信度函数为mi(·)的可信度C(mi)可表示为
Figure FDA0003340683570000044
④对证据做加权平均
以可信度C(mi)作为mi的权重,得到
Figure FDA0003340683570000045
则Xi和Yi可融合度
a0=m(A)。
CN201811218891.2A 2018-10-19 2018-10-19 一种用于软件故障预测的数据融合方法 Active CN109460356B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811218891.2A CN109460356B (zh) 2018-10-19 2018-10-19 一种用于软件故障预测的数据融合方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811218891.2A CN109460356B (zh) 2018-10-19 2018-10-19 一种用于软件故障预测的数据融合方法

Publications (2)

Publication Number Publication Date
CN109460356A CN109460356A (zh) 2019-03-12
CN109460356B true CN109460356B (zh) 2021-12-28

Family

ID=65607917

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811218891.2A Active CN109460356B (zh) 2018-10-19 2018-10-19 一种用于软件故障预测的数据融合方法

Country Status (1)

Country Link
CN (1) CN109460356B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102721941A (zh) * 2012-06-20 2012-10-10 北京航空航天大学 一种基于som和d-s理论的电表电路故障信息融合和诊断方法
CN103557884A (zh) * 2013-09-27 2014-02-05 杭州银江智慧城市技术集团有限公司 一种输电线路杆塔监控的多传感器数据融合预警方法
CN103984623A (zh) * 2014-04-28 2014-08-13 天津大学 一种基于缺陷检测的软件安全风险评估方法
CN106198749A (zh) * 2015-05-08 2016-12-07 中国科学院声学研究所 一种基于金属裂纹监测的多路传感器的数据融合方法
CN107222322A (zh) * 2016-03-22 2017-09-29 ***通信集团陕西有限公司 一种通信故障诊断方法及装置
CN107797931A (zh) * 2017-11-13 2018-03-13 长春长光精密仪器集团有限公司 一种基于二次评价的软件质量评价方法及***

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7383239B2 (en) * 2003-04-30 2008-06-03 Genworth Financial, Inc. System and process for a fusion classification for insurance underwriting suitable for use by an automated system

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102721941A (zh) * 2012-06-20 2012-10-10 北京航空航天大学 一种基于som和d-s理论的电表电路故障信息融合和诊断方法
CN103557884A (zh) * 2013-09-27 2014-02-05 杭州银江智慧城市技术集团有限公司 一种输电线路杆塔监控的多传感器数据融合预警方法
CN103984623A (zh) * 2014-04-28 2014-08-13 天津大学 一种基于缺陷检测的软件安全风险评估方法
CN106198749A (zh) * 2015-05-08 2016-12-07 中国科学院声学研究所 一种基于金属裂纹监测的多路传感器的数据融合方法
CN107222322A (zh) * 2016-03-22 2017-09-29 ***通信集团陕西有限公司 一种通信故障诊断方法及装置
CN107797931A (zh) * 2017-11-13 2018-03-13 长春长光精密仪器集团有限公司 一种基于二次评价的软件质量评价方法及***

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Data-fusion method for flaws detection based on reliability evaluation;Li Wang等,;《 2017 36th Chinese Control Conference (CCC)》;20170728;全文 *
Three-layer information fusion for braking system fault diagnosis;Shaojin Wang等,;《 2012 5th International Conference on BioMedical Engineering and Informatics》;20121018;全文 *
基于改进PSO和D-S的融合方法及其在智能诊断上的应用;吕朋亮等,;《计算机集成制造***》;20140923;第21卷(第8期);全文 *
故障诊断的信息融合方法;朱大奇等,;《控制与决策》;20071215;第22卷(第12期);全文 *

Also Published As

Publication number Publication date
CN109460356A (zh) 2019-03-12

Similar Documents

Publication Publication Date Title
JP7116103B2 (ja) 光モジュールの故障を予測するための方法、装置、およびデバイス
US8078913B2 (en) Automated identification of performance crisis
CN109977895B (zh) 一种基于多特征图融合的野生动物视频目标检测方法
CN112257963B (zh) 基于航天软件缺陷数据分布离群点的缺陷预测方法及装置
CN114978037B (zh) 太阳能电池性能数据监控方法及***
CN115018840B (zh) 精密铸件裂纹检测方法、***及装置
CN111191720B (zh) 一种业务场景的识别方法、装置及电子设备
CN109670549B (zh) 火电机组的数据筛选方法、装置以及计算机设备
CN105471647A (zh) 一种电力通信网故障定位方法
CN110544047A (zh) 一种不良数据辨识方法
CN111221807A (zh) 一种面向云服务的工业设备大数据质量的测试方法及架构
CN114325405A (zh) 电池组一致性分析方法、建模方法、装置、设备及介质
CN113033624A (zh) 一种基于联邦学习的工业图像故障诊断方法
CN117076258A (zh) 一种基于互联网云端的远程监控方法及***
CN116821777B (zh) 一种新型基础测绘数据整合方法及***
CN109460356B (zh) 一种用于软件故障预测的数据融合方法
CN111614504A (zh) 基于时间序列和故障树分析的电网调控数据中心业务特性故障定位方法及***
US20220276954A1 (en) Device identification device, device identification method, and device identification program
CN111488272A (zh) 一种复杂交易文件的自动化测试方法及装置
CN112014821B (zh) 一种基于雷达宽带特征的未知车辆目标识别方法
CN116151799A (zh) 一种基于bp神经网络的配电线路多工况故障率快速评估方法
CN115588157A (zh) 交联低烟低卤聚烯烃材料的性能数据处理方法及***
CN115775601A (zh) 一种材料力热试验的异常数据监测方法及***
CN114936614A (zh) 一种基于神经网络的作业风险识别方法及***
CN114020905A (zh) 一种文本分类外分布样本检测方法、装置、介质及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 222001 No.18 Shenghu Road, Lianyungang City, Jiangsu Province

Patentee after: The 716th Research Institute of China Shipbuilding Corp.

Address before: 222001 No.18 Shenghu Road, Lianyungang City, Jiangsu Province

Patentee before: 716TH RESEARCH INSTITUTE OF CHINA SHIPBUILDING INDUSTRY Corp.

CP01 Change in the name or title of a patent holder