CN103793613B - 基于回归分析和rbf神经网络的退化数据缺失插补方法 - Google Patents
基于回归分析和rbf神经网络的退化数据缺失插补方法 Download PDFInfo
- Publication number
- CN103793613B CN103793613B CN201410061310.4A CN201410061310A CN103793613B CN 103793613 B CN103793613 B CN 103793613B CN 201410061310 A CN201410061310 A CN 201410061310A CN 103793613 B CN103793613 B CN 103793613B
- Authority
- CN
- China
- Prior art keywords
- data
- obs
- mis
- rbf neural
- trend
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Complex Calculations (AREA)
Abstract
本发明公开了一种回归分析和RBF神经网络的退化数据缺失插补方法,包括以下几个步骤:步骤一、已观测的退化数据趋势回归建模;步骤二、计算已观测退化数据的残差序列;步骤三、建立RBF神经网络,并利用已观测数据的残差序列训练网络;步骤四、通过训练好的RBF神经网络估计缺失数据的残差序列;步骤五、合并缺失数据的趋势项与残差序列的估计结果为退化数据插补结果。本发明将回归分析方法与RBF神经网络方法结合,提出了一种退化数据缺失插补方法,解决了加速退化试验中缺失性能退化数据的插补问题。
Description
技术领域
本发明涉及一种基于回归分析RBF神经网络的退化数据缺失插补方法,属于加速退化试验技术领域。
背景技术
由于检测仪器故障、记录人员过失等原因,常常会造成在加速退化试验中采集到的性能退化数据缺失的情况。而在加速退化试验的数据处理与评估、故障预测或寿命预测中,都需要完整的数据作为输入。数据缺失给性能退化数据的处理带来了很大的困难,很多传统的性能退化数据处理方法无法对有缺失数据的数据进行统计分析,比如一些关于时间序列数据分析的方法就要求所分析的数据为完整的等间距数据集。在故障预测或寿命预测中,性能退化数据的缺失会造成预测结果的偏差。
这时要么改进传统的数据处理方法,使之能够适应有缺失的性能退化数据,要么针对有缺失的数据进行处理,使之转化为完整的数据。前一种方案,在实现上有难度,后一种方案的实现更切合实际,且有缺失的数据转化为完整的数据后可以应用到更多的数据处理方法中,适用性更强。
缺失数据的插补方法是如今应用最多、发展最快的缺失数据处理方法。采用有效的方法处理缺失数据可以提高对数据资源的有效利用,减少数据资源的浪费;并会有助于性能退化数据的处理,有助于加速退化试验评估,有助于故障预测或寿命预测等工作,甚至可能影响研究结论,减少如寿命预测结果不准确等情况所带来的隐患。因此,对有缺失的性能退化数据采用正确和有效的方法进行处理是能否得出正确结论的关键之一。
常用的缺失数据插补法有均值插补法、热卡插补法、冷卡插补法、最邻近插补法、回归插补法、EM(Expectation Maximization)算法等。这些方法有一个共同的缺点:扭曲样本分布。比如均值插补法会降低变量间的相关关系,回归插补法则会人为的增大变量间的相关关系,而且这些插补法忽略了缺失数据插补的不确定性。尽管由于回归插补引入随机误差项,能够缓解这一问题,但是随机误差项的确定是比较困难的。
回归分析插补是一种非常常用的插补方法。回归分析插补的基本思想是利用辅助变量与已观测数据的关系,建立回归模型,利用已知的辅助变量的信息,对缺失的数据进行估计。回归分析插补通常使用服从正态分布的残差作为随机项,以使插补数据保持原始数据的离散性,但有些情况下正态分布随机项并不能够反映原始数据的离散性。
径向基函数(Radial Basis Function,RBF)神经网络是目前应用最广泛的神经网络模型之一,相比于以BP神经网络拓扑结构为基础的小波神经网络,RBF神经网络在函数逼近能力、分类能力和学***面,RBF神经网络的每个隐层神经元的函数都构成了拟合平面的一个基函数。RBF神经网络结构简单、训练简洁而且学习收敛速度快,能够逼近任意非线性函数。
发明内容
本发明的目的是为了解决性能退化数据的缺失插补问题,提出了一种通用性较强的基于回归分析和RBF神经网络的退化数据缺失插补方法。本发明综合采用回归分析方法与RBF神经网络方法,利用已观测退化数据的信息来实现缺失退化数据的插补。
本发明是一种基于回归分析和RBF神经网络的退化数据缺失插补方法,包括以下几个步骤:
步骤一、已观测的退化数据趋势回归建模;
步骤二、计算已观测退化数据的残差序列;
步骤三、建立RBF神经网络,并利用已观测退化数据的残差序列训练网络;
步骤四、通过训练好的RBF神经网络估计缺失数据的残差序列;
步骤五、合并缺失数据的趋势项与缺失数据的残差序列的估计结果为退化数据插补结果。
本发明的优点在于:
(1)对已观测退化数据的趋势进行回归建模可以使插补数据的趋势与原始数据保持一致。
(2)使用RBF神经网络估计缺失数据的残差序列可以使插补数据保持原始数据的离散性,使插补数据更加接近真实。
(3)RBF神经网络可以应对不同类型的残差,适用范围广泛。
附图说明
图1是本发明所述基于回归分析和RBF神经网络的退化数据缺失插补方法的流程图;
图2是本发明实施例有缺失的退化数据曲线;
图3是本发明实施例缺失数据的退化趋势估计结果;
图4是本发明实施例缺失数据的残差序列估计结果;
图5是本发明实施例缺失数据的最终插补结果。
具体实施方式
下面将结合附图和实施例对本发明作进一步的详细说明。
本发明提供一种基于回归分析和RBF神经网络的退化数据缺失插补方法,所述方法针对有缺失的性能退化数据进行插补处理,假设完整的退化数据为Y,其对应的时间为T,记Y=(Yobs,Ymis),T=(Tobs,Tmis),其中已观测退化数据Yobs、已观测退化数据对应的时间Tobs和缺失数据对应的时间Tmis为已知数据,具体为:
式中,n为已观测退化数据的数据量,m为缺失数据的数据量。
通过已知数据,综合利用回归分析方法与RBF神经网络方法来估计缺失数据Ymis:
Ymis=(ymis_1,ymis_2,…,ymis_m) (2)
并最后得到插补完整的退化数据Y=(Yobs,Ymis)。
本发明是一种基于回归分析和RBF神经网络的退化数据缺失插补方法,方法流程图1所示,包括以下几个步骤:
步骤一、已观测退化数据趋势回归建模;
根据已观测退化数据的趋势特点选择回归函数,本发明中选择指数函数作为回归函数。再根据已观测退化数据Yobs=(yobs_1,yobs_2,…,yobs_n)与对应的时间Tobs=(tobs_1,tobs_2,…,tobs_n),利用最小二乘法来估计回归模型参数,得到退化趋势的函数表达式:
式中,a、b与c为回归模型参数,tobs_i表示已观测退化数据对应的时间。
通过回归分析得到的退化趋势模型f(t),将缺失数据对应的时间Tmis=(tmis_1,tmis_2,…,tmis_m)作为输入,计算缺失数据的趋势序列Qmis=(qmis_1,qmis_2,…,qmis_m):
步骤二、计算已观测退化数据的残差序列;
将已观测退化数据对应的时间Tobs作为输入,通过趋势模型f(t)计算已观测退化数据的趋势序列Qobs=(qobs_1,qobs_2,…,qobs_n),并用相应的已观测退化数据的真实值Yobs减去已观测数据的趋势序列Qobs,得到已观测退化数据的残差序列Eobs=(eobs_1,eobs_2,…,eobs_n):
eobs_i=yobs_i-qobs_i,i=1,2,…,n (5)
步骤三、建立RBF神经网络,并利用已观测退化数据的残差序列训练网络;
建立单输入单输出的RBF神经网络:
式中,y表示一维输出向量,x表示一维输入向量,wi是隐层与输出层间权值,k是感知单元的个数,Ri(*)表示基函数,最常用的基函数是高斯函数:
式中,ci是第个i基函数的中心,与x具有相同维数的向量;σi是第i个基函数的方差,它决定了该基函数中心点的宽度;||x-ci||表示x和ci之间的距离。
将已观测退化数据的残差序列Eobs作为输出向量,相应的时间Tobs作为输入向量,采用RBF神经网络的学习算法对RBF神经网络进行训练,得到基函数的中心ci和方差σi,以及权值wi。
本发明通过MATLAB软件中内嵌的RBF神经网络工具箱完成上述RBF神经网络的训练,通过调节扩展速度参数SPREAD,得到适合的RBF神经网络模型。
步骤四、通过训练好的RBF神经网络估计缺失数据的残差序列;
将缺失数据对应的时间Tmis作为输入,通过训练好的RBF神经网络估计缺失数据的残差序列Emis=(emis_1,emis_2,…,emis_m):
在估计缺失数据的残差序列的过程中,不断更新RBF神经网络的训练数据,将已经估计得到的残差序列值emis_i与对应的时间tmis_i补充到训练数据{Eobs,Tobs}中,通过新训练数据训练得到的RBF神经网络去估计下一个缺失数据的残差值emis_i+1。这样不断更新训练数据再估计,直到估计完所有缺失数据的残差序列值。
步骤五、合并缺失数据的趋势项与残差序列的估计结果为退化数据插补结果;
将由步骤一中得到的缺失数据的趋势序列Qmis与由步骤四中得到的缺失数据的残差序列Emis合并,得到最终的缺失数据插补结果Ymis=(ymis_1,ymis_2,…,ymis_m):
ymis_i=qmis_i+emis_i,i=1,2,…,m (9)
这样最后得到插补完整的性能退化数据Y=(Yobs,Ymis),完成了退化数据的缺失插补工作。
实施例1:
以一组仿真的有缺失性能退化数据为例,完整数据共有300个,数据中间有120个数据出现缺失,单位已略去,如图2所示。采用本发明提出的基于回归分析和RBF神经网络的退化数据缺失插补方法对其缺失数据进行插补,应用步骤和方法如下:
步骤一、已观测的退化数据趋势回归建模;
对已观测退化数据进行回归建模得到的退化趋势模型为f(t)=300.2954-0.0215×e0.0272t。通过得到的退化趋势模型f(t),将Tmis作为输入,计算缺失数据的趋势序列Qmis,结果如图3所示。
步骤二、计算已观测退化数据的残差序列;
将Tobs作为输入,通过趋势模型f(t)计算观测数据的趋势序列Qobs,并用已观测退化数据的真实值Yobs减去已观测退化数据的趋势序列Qobs,得到已观测退化数据的残差序列Eobs。
步骤三、建立RBF神经网络,并利用已观测数据的残差序列训练网络;
通过MATLAB软件中内嵌的RBF神经网络工具箱建立RBF神经网络,并用已观测退化数据的残差序列Eobs与对应的时间Tobs作为训练数据,取扩展速度参数SPREAD=0.005,得到适合的RBF神经网络模型。
步骤四、通过训练好的RBF神经网络估计缺失数据的残差序列;
将缺失数据对应的时间Tmis作为输入,通过训练好的RBF神经网络估计缺失数据的残差序列Emis,结果如图4所示。
步骤五、合并缺失数据的趋势项与残差序列的估计结果为退化数据插补结果;
将由步骤一中得到的缺失数据的趋势序列Qmis与由步骤四中得到的缺失数据残差序列Emis合并,得到最终的缺失数据插补结果Ymis,并最后得到插补完整的性能退化数据Y=(Yobs,Ymis),最终插补结果如图5所示。从图中可以看出,插补结果不仅保持了原始数据的退化趋势,也保持了原始数据的离散性,插补结果很好的还原了真实数据,因此,本发明提出的方法是准确可行的。
Claims (2)
1.一种基于回归分析和RBF神经网络的退化数据缺失插补方法,其特征在于,包括以下几个步骤:
步骤一、已观测的退化数据趋势回归建模;
根据已观测退化数据的趋势特点选择回归函数,再根据已观测退化数据Yobs=(yobs_1,yobs_2,…,yobs_n)与对应的时间Tobs=(tobs_1,tobs_2,…,tobs_n),利用最小二乘法来估计回归模型参数,得到退化趋势的函数表达式;
式中,a、b与c为回归模型参数;
通过回归分析得到的退化趋势模型f(t),将缺失数据数据对应的时间Tmis=(tmis_1,tmis_2,…,tmis_m)作为输入,计算缺失数据的趋势序列Qmis=(qmis_1,qmis_2,…,qmis_m);
步骤二、计算已观测退化数据的残差序列;
将已观测数据对应的时间Tobs作为输入,通过趋势模型f(t)计算已观测数据的趋势序列Qobs=(qobs_1,qobs_2,…,qobs_n),并用已观测退化数据的真实值Yobs减去已观测数据的趋势序列Qobs,得到已观测退化数据的残差序列Eobs=(eobs_1,eobs_2,…,eobs_n):
eobs_i=yobs_i-qobs_i,i=1,2,…,n;
步骤三、建立RBF神经网络,并利用已观测数据的残差序列训练网络;
建立单输入单输出的RBF神经网络:
式中,y表示一维输出向量,x表示一维输入向量,wi是隐层与输出层间权值,k是感知单元的个数,Ri(x)表示基函数;
将已观测退化数据的残差序列Eobs作为输出向量,相应的时间Tobs作为输入向量,采用RBF神经网络的学习算法对网络进行训练,得到基函数的中心ci和方差σi,以及权值wi;
步骤四、通过训练好的RBF神经网络估计缺失数据的残差序列;
将缺失数据对应的时间Tmis作为输入,通过训练好的RBF神经网络估计缺失数据的残差序列Emis=(emis_1,emis_2,…,emis_m):
在估计缺失数据残差序列的过程中,不断更新RBF神经网络的训练数据,将已经估计得到的残差序列值emis_i与对应的时间tmis_i补充到训练数据{Eobs,Tobs}中,通过新训练数据训练得到的RBF神经网络去估计下一个缺失数据的残差值emis_i+1;这样不断更新训练数据再估计,直到估计完所有缺失数据的残差序列值;
步骤五、合并缺失数据的趋势项与残差序列的估计结果为退化数据插补结果;
将由步骤一中得到的缺失数据的趋势序列Qmis与由步骤四中得到的缺失数据残差序列Emis合并,得到最终的缺失数据插补结果Ymis=(ymis_1,ymis_2,…,ymis_m):
ymis_i=qmis_i+emis_i,i=1,2,…,m
这样最后得到插补完整的性能退化数据Y=(Yobs,Ymis),完成了退化数据的缺失插补工作。
2.根据权利要求1所述的一种基于回归分析和RBF神经网络的退化数据缺失插补方法,其特征在于,步骤三中,所述的基函数是高斯函数:
式中,ci是第i个基函数的中心,与x具有相同维数的向量;σi是第个i基函数的方差,它决定了该基函数中心点的宽度;||x-ci||表示x和ci之间的距离。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410061310.4A CN103793613B (zh) | 2013-12-13 | 2014-02-24 | 基于回归分析和rbf神经网络的退化数据缺失插补方法 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310684436.2 | 2013-12-13 | ||
CN201310684436 | 2013-12-13 | ||
CN2013106844362 | 2013-12-13 | ||
CN201410061310.4A CN103793613B (zh) | 2013-12-13 | 2014-02-24 | 基于回归分析和rbf神经网络的退化数据缺失插补方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103793613A CN103793613A (zh) | 2014-05-14 |
CN103793613B true CN103793613B (zh) | 2017-01-11 |
Family
ID=50669275
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410061310.4A Expired - Fee Related CN103793613B (zh) | 2013-12-13 | 2014-02-24 | 基于回归分析和rbf神经网络的退化数据缺失插补方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103793613B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106156260B (zh) * | 2015-04-28 | 2020-01-21 | 阿里巴巴集团控股有限公司 | 一种数据缺失修补的方法和装置 |
CN105184072B (zh) * | 2015-08-31 | 2018-05-25 | 中国华能集团清洁能源技术研究院有限公司 | 数据插补的方法和装置 |
CN105930303A (zh) * | 2016-04-11 | 2016-09-07 | 中国石油大学(华东) | 含有不可忽略缺失数据的估计方程的稳健估计方法 |
CN107423742A (zh) * | 2016-05-23 | 2017-12-01 | 中兴通讯股份有限公司 | 人群流量的确定方法及装置 |
CN107862409B (zh) * | 2017-11-06 | 2021-11-02 | 重庆大学 | 一种基于回归分析的变电站输变电设备大量缺失数据填补方法 |
CN109448445A (zh) * | 2018-09-05 | 2019-03-08 | 南京航空航天大学 | 基于长短期记忆神经网络的航班延误分级预警方法 |
CN109583044B (zh) * | 2018-11-09 | 2022-07-15 | 中国直升机设计研究所 | 基于rbf神经网络的直升机旋翼飞行载荷预测方法 |
CN112784744B (zh) * | 2021-01-22 | 2022-10-28 | 北京航空航天大学 | 一种具有缺失值的机械构件振动信号预处理方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7983443B2 (en) * | 1995-05-08 | 2011-07-19 | Digimarc Corporation | Methods for managing content using intentional degradation and insertion of steganographic codes |
CN102262700A (zh) * | 2011-08-01 | 2011-11-30 | 北京航空航天大学 | 基于小波分析的退化数据预处理的产品寿命预测方法 |
CN102323049A (zh) * | 2011-07-18 | 2012-01-18 | 福州大学 | 数据不完备下基于一致性数据替换的结构异常检测方法 |
CN102867132A (zh) * | 2012-10-16 | 2013-01-09 | 南京航空航天大学 | 基于分数阶小波变换的航空直流变换器在线故障组合预测方法 |
-
2014
- 2014-02-24 CN CN201410061310.4A patent/CN103793613B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7983443B2 (en) * | 1995-05-08 | 2011-07-19 | Digimarc Corporation | Methods for managing content using intentional degradation and insertion of steganographic codes |
CN102323049A (zh) * | 2011-07-18 | 2012-01-18 | 福州大学 | 数据不完备下基于一致性数据替换的结构异常检测方法 |
CN102262700A (zh) * | 2011-08-01 | 2011-11-30 | 北京航空航天大学 | 基于小波分析的退化数据预处理的产品寿命预测方法 |
CN102867132A (zh) * | 2012-10-16 | 2013-01-09 | 南京航空航天大学 | 基于分数阶小波变换的航空直流变换器在线故障组合预测方法 |
Non-Patent Citations (2)
Title |
---|
基于一维漂移布朗运动的SLD退化失效建模;晁代宏等;《红外与激光工程》;20120814;第41卷(第7期);1848-1853 * |
基于相关分析和组合神经网络的退化预测;党香俊等;《北京航空航天大学学报》;20130115;第39卷(第1期);42-51 * |
Also Published As
Publication number | Publication date |
---|---|
CN103793613A (zh) | 2014-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103793613B (zh) | 基于回归分析和rbf神经网络的退化数据缺失插补方法 | |
Lefèvre et al. | Comparison of parametric and non-parametric approaches for vehicle speed prediction | |
CN102445902B (zh) | 用于机器状况监视的条件多输出回归的***和方法 | |
Wilkinson | Bayesian calibration of expensive multivariate computer experiments | |
CN107563067A (zh) | 基于自适应代理模型的结构可靠性分析方法 | |
Wang et al. | Uncertain hypothesis testing for two experts’ empirical data | |
CN107704962B (zh) | 一种基于不完整训练数据集的蒸汽流量区间预测方法 | |
CN102622510A (zh) | 一种软件缺陷量化管理***和方法 | |
CN102901651B (zh) | 电子产品分数阶神经网络性能退化模型及寿命预测方法 | |
CN101576443A (zh) | 基于灰色rbf神经网络的加速寿命试验寿命预测方法 | |
CN103942461A (zh) | 基于在线贯序极限学习机的水质参数预测方法 | |
CN103268519A (zh) | 基于改进Lyapunov指数的电力***短期负荷预测方法及装置 | |
CN103678869A (zh) | 一种飞行参数缺失数据的预测估计方法 | |
Abudu et al. | Modeling of daily pan evaporation using partial least squares regression | |
CN103810392B (zh) | 基于支持向量机和rbf神经网络的退化数据缺失插补方法 | |
CN108734361A (zh) | 拼车订单处理方法和装置 | |
CN104318110B (zh) | 一种提高大型复杂***风险设计及维修效率的方法 | |
Wischnewski et al. | A model-free algorithm to safely approach the handling limit of an autonomous racecar | |
Gao et al. | IMA health state evaluation using deep feature learning with quantum neural network | |
CN106125713A (zh) | 一种区间删失情况下可靠性增长的评估与预测方法 | |
Gallego et al. | Maintaining flexibility in smart grid consumption through deep learning and deep reinforcement learning | |
CN105228185A (zh) | 一种用于识别通信网络中模糊冗余节点身份的方法 | |
Liaqat et al. | Applying a neural network collocation method to an incompletely known dynamical system via weak constraint data assimilation | |
KR20190015415A (ko) | 동적 시스템에 의한 시스템 상태의 모델-기반 결정 | |
Husmeier | Modelling conditional probability densities with neural networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170111 Termination date: 20200224 |
|
CF01 | Termination of patent right due to non-payment of annual fee |