一种基于DCNN模型的矿井机械设备的剩余寿命预测方法
技术领域
本发明属于产品设备的剩余寿命预测或可靠性评估技术领域,具体是一种基于DCNN模型的矿井机械设备的剩余寿命预测方法。
背景技术
CNN广泛应用于厂品设备的故障分析中,但是在产品设备剩余寿命预测中应用却鲜有,一般被应用于数据特征提取中。现有预测模型的预测准确性低,泛化能力弱,基本是针对精密设备的关键零部件和通用零部件。目前对于矿井这种工作环境复杂、可靠性要求高、剩余寿命预测难度大的复杂设备剩余寿命预测手段比较落后,基本停留在仿真、基于模型驱动、建立相关数学模型进行分析的阶段,这导致预测效果差,结果真实性低,对于复杂的工况的零部件剩余寿命预测困难。
传统方法对于时间序列的数据在划分训练集和测试集时必须严格按照时间序列,不能打乱,将整个数据集按照6:4或者7:3划分,即整体数据前60%或70%为训练集,后40%或30%设置为测试集,但是这种划分方法在数据集发生变化时,为了达到同样的预测精度,对模型也必须提出相应的调整。因此,模型对数据集的依赖性比较大,这在一定程度上降低了模型的泛化能力。为了避免上述情况,在数据集划分过程中,不按照传统时间序列数据划分的规则划分数据,基于数学理论,应用新的划分方法,减少模型对数据结构的依赖性,提高模型的泛化能力。
现有技术对产品进行剩余寿命预测基本采用回归模型,但是目前回归模型的预测精确度不高,对数据的依赖性强。
发明内容
本发明为了解决目前对于矿井这种工作环境复杂、可靠性要求高、剩余寿命预测难度大的复杂设备剩余寿命预测手段比较落后,基本停留在仿真、基于模型驱动、建立相关数学模型进行分析的阶段,这导致预测效果差,结果真实性低,对于复杂的工况的零部件剩余寿命预测困难的问题,提供一种基于DCNN模型的矿井机械设备的剩余寿命预测方法。
本发明采取以下技术方案:一种基于DCNN模型的矿井机械设备的剩余寿命预测方法,包括以下步骤。
S100~收集设备从投入使用到完全报废的整个寿命周期的数据,对收集的原始数据进行去噪、缺失值弥补、归一化处理,对于高维数据进行降维处理以及特征提取的预处理。
S200~将设备历史运转信息,即投入使用-报废,划分为训练集和测试集。
S300~构建深度卷积神经网络DCNN模型,使模型的学习能力增强,提高预测的准确度,同时能够处理大量数据。
S400~基于训练好的模型,利用测试集测试模型预测值,将模型的预测值和实际值做对比,得到模型预测的准确性,对模型预测结果进行评判。
S500~可视化预测结果,进行预测剩余寿命分析。
所述的步骤S200采取以下方法:
S201~对经过预处理的数据集进行划分,在数据集划分时,采用分层抽样的方法,即在完整的数据集中,每隔四个数据抽取一个数据,按照这样的顺序一直抽取到数据结束,抽取的数据作为测试集,剩余的作为训练集,则训练集和测试集的比例为4:1;
S202~设置训练集和预测集的对应标签,
上式中RULi即为对应的标签,RULi表示第i个时间点的设备剩余寿命,xi表示第i个时间点监测值的特征值,xmin表示所有特征值中最小特征,xmax表示所有特征中最大特征,当i点属于训练集中的一个,则对应的RULi也为训练集标签中的一个,且输入值xi的对应标签为RULi,同理,测试集中的标签对应方式和训练集中的对应方式一样。
所述步骤S300采取以下方法,
S301~建立合适深度的DCNN模型,设置初始参数值,参数值包括网络的层数,卷积层的卷积核的大小,卷积核的移动步长,激活函数类型,每个对应函数的偏置和权重系数,池化层的池化方式,池化层的核尺寸以及核移动步长,dropout值防止过拟合,初始化设置循环次数,每次输入的样本数量;
S302~用训练集数据作为输入,在训练过程中,以交叉熵损失函数MSE作为评价模型参数调整的依据,为了使模型的交叉熵损失函数达到最小,交叉熵损失阈值设置为10-6,当训练得到的值小于阈值,可认为模型达到最优,在训练过程中不断调整S301中提到的参数,直至交叉熵损失函数达到设定的阈值,可认为模型各个参数达到最优,此时保存模型;
S303~用测试集进行DCNN模型的训练,使模型学习到不同阶段的特征,进行S301中提到的参数优化,直至训练集中的预测值和实际值的均方误差达到最小,训练预测结果达到最优;均方误差表达式:
N表示参加训练的数据量,ypi表示对第i个输入的预测值,yti表示第i个输入对应的实际值。
所述的步骤S400采取以下方法,对模型预测结果进行评判,采用四个指标进行评判;分别为均方根误差RMSE、拟合优度检验R2、调整拟合优度检验Adjusted_R2和Score_function,其表达式分别如下:
预测分析中RMSE越接近0,代表预测结果越精确。
表示预测的均值,R2值越接近1,代表预测结果越好。
P代表特征数量,Adjusted_R2越接近1,表示预测结果越精确。
RULi表示第i个时间点预测的剩余寿命,RULi表示第i个时间点的实际剩余寿命,Score值越接近0,代表预测结果越精确。
所述的步骤S500采取以下方法,为了进行模型预测结果的定性评价,采用模型可视化,基于python语言,调用matplotlib库实现可视化,可视化窗口中包含模型预测值的变化曲线以及模型实际剩余寿命变化曲线,图形的横坐标代表各个监测点,纵坐标代表剩余寿命的百分比。观察预测点的预测结果对应的纵坐标值,这个值反应模型在该点预测的机械设备关键零部件剩余寿命,依据实际得到的关键零部件的剩余寿命与模型预测的剩余寿命进行对比,然后结合机械设备的实际工作条件和环境,综合决定设备的剩余寿命。
与现有技术相比,本发明提出的模型预测结果是基于零件历史运转数据,预测结果真实性高,强大的DCNN模型可以适用于多维输入数据的预测,使该模型能适用于复杂工况零部件预测,其较强的学习能力使得预测准确度高,特殊的数据划分方式使得模型的泛化能力强。最好的预测结果评判标准值R2为0.99762(R2变化范围为[0,1],该值越大,代表预测结果越准确),另一个评价指标score为0.1116(该值越小,代表预测结果越好)。
附图说明
图1为数据不去噪SVR模型预测结果;
图2为数据不去噪RNN模型预测结果;
图3为数据不去噪LSTM模型预测结果;
图4为数据不去噪window-CNN模型预测结果;
图5为数据不去噪DCNN模型预测结果;
图6为采用3σ准则去噪SVR模型预测结果;
图7为采用3σ准则去噪RNN模型预测结果;
图8为采用3σ准则去噪LSTM模型预测结果;
图9为采用3σ准则去噪window-CNN模型预测结果;
图10为采用3σ准则去噪DCNN模型预测结果;
图11为选择不同零件监测运行数据采用3σ准则去噪SVR模型预测结果;
图12为选择不同零件监测运行数据采用3σ准则去噪RNN模型预测结果;
图13为选择不同零件监测运行数据采用3σ准则去噪LSTM模型预测结果;
图14为选择不同零件监测运行数据采用3σ准则去噪window-CNN模型预测结果;
图15为选择不同零件监测运行数据采用3σ准则去噪DCNN模型预测结果。
具体实施方式
一种基于DCNN模型的矿井机械设备的剩余寿命预测方法,包括以下步骤。
S100~收集设备从投入使用到完全报废的整个寿命周期的数据,对收集的原始数据进行去噪、缺失值弥补、归一化处理,对于高维数据进行降维处理,特征提取等一系列预处理。
在采煤机易损部位安装相应的传感器,同时基于无线网络技术的数据采集***,采集主要特征参数。收集的原始数据包括,如截割部中截三轴失效率最高,截三轴的主要组成为齿轮轴、齿轮、轴承。齿轮监测数据有:震动信号、噪声信号、温度等;轴承监测数据有:震动信号、噪声信号、温度、轴承间隙测定、油膜电阻测定、旋转速度等。
数据去噪:
针对采集数据的分布特性(高斯分布),依据数据采集的方式(大量多次采集),基于数学理论,采用3σ准则对数据进行去噪,去除监测数据中的粗大误差,提高预测精确度。即认为正常数据分布在(μ -3σ,μ+3σ)之内,超出区间的数据量占总数据量的0.27%,可认为是粗大误差P(μ-3σ<x<μ+3σ)=0.9973。
因此,对于采集到的数据,先求出数据的均值μ和标准差σ,依据3σ准则,去除超出区间分布的数据点,保存落在区间内的点,完成数据去噪。
缺失值弥补:
采用最近邻算法(K-Nearest Neighbor,KNN)进行缺失值弥补。即一个样本在空间中的K个最相似(特征空间中最邻近)的样本中大多数属于某一类别,则该样本也属于这一类别。对于实际监测的设备运行参数,针对缺失值,选取K个距离缺失值最近的同类参数,求K个值加权平均数即为对应的样本缺失值。
归一化处理:
为了避免采集数据变化范围对模型预测精确度的影响,方便数据描述,对进行完缺失值弥补的数据进行归一化操作,即将整个数据的变化范围映射到[0,1]。
fnori-第i个数据的归一化结果,fi-第i个监测数据值(如齿轮的振幅),fmin-所有监测数据集中的最小值(监测到的最小振幅值),fmax- 所有监测数据集中的最大值(监测到的最大振幅值)。
数据降维:
对于高维的数据,为了更清楚地表述数据变化和剩余寿命之间的关系,减少运算的复杂度,去除冗余信息,采用数据降维。这里采用 PCA(principal componentsanalysis),即主成分分析法进行数据降维处理,具体步骤如下:
对输入的n维采集样本数据集D=(x(1),x(2),x(3),…,x(n)),要求降到n′维作为输出,降维后的样本集记为D‘。
1)对所有的输入样本进行中心化处理: (x如齿轮的振幅)。
2)计算样本的协方差矩阵XXT。
当m个n维数组经过1)方法的中心化后,经投影变换后得到新的坐标系{w1,w2,...,wn},而w为标准正交基,即||w||2=1,在数据降维过程中,产生新的坐标系{w1,w2,...,wn′},样本点x(i)在n′维坐标中的投影为:而是x(i)在低维坐标系里第j维的坐标,用z(i)恢复原始数据x(i),则恢复数据为:
W为标准正交基组成的矩阵。
即恢复数据与原始数据的差值最小可认为理解数据的降维损失最小,即最小化
对上式进行展开求值
而为常量,
3)对矩阵XXT进行特征值分解
为使上式最小化,即计算样本的协方差矩阵XXT,W里面的每一个向量是标准正交基,依据拉格朗日条件极值求解,s.t.WTW=I,构造拉格朗日函数
J(W)=-tr(WTXXTW+α(WTW-I))
上式对W求导,整理得
-XXTW+αW=0
XXTW=αW
则α为矩阵XXT对应的若干特征组成的矩阵,即可依据对应的特征值进行矩阵分解。
4)取出最大的n′个特征值对应的特征向量(w1,w2,w3,…,wn′),将所有的特征向量标准化后,组成特征向量矩阵W.
5)对样本集中的每一个样本x(i),转化为新的样本z(i)=WTx(i)
6)得到输出样本集D′=(z(1),z(2),z(3),…,z(n′)).
即完成数据降维处理。S200~将设备历史运转信息,即投入使用 -报废,划分为训练集和测试集;训练集和测试集划分方法。依据预测模型的特征,基于数学理论,采用分层抽样的方法将设备历史运转信息(投入使用-报废)划分为训练集和测试集(按照4:1划分训练集和测试集)。
S201~对经过预处理的数据集进行划分,在数据集划分时,采用分层抽样的方法,即在完整的数据集中,每隔四个数据抽取一个数据,按照这样的顺序一直抽取到数据结束,抽取的数据作为测试集,剩余的作为训练集,则训练集和测试集的比例为4:1;
S202~设置训练集和预测集的对应标签,
上式中RULi即为对应的标签,RULi表示第i个时间点的设备剩余寿命,xi表示第i个时间点监测值的特征值,xmin(齿轮振幅值)表示所有特征值中最小特征,xmax表示所有特征中最大特征,当i点属于训练集中的一个,则对应的RULi也为训练集标签中的一个,且输入值xi的对应标签为RULi,同理,测试集中的标签对应方式和训练集中的对应方式一样。
这种划分使训练集包含设备整个运转过程的信息,在模型训练时,能够使模型学习到不同阶段的特征,提高模型的预测准确率和泛化能力。
S300~构建深度卷积神经网络DCNN模型。由于CNN具有较强的学习特征的能力,构建深度卷积神经网络DCNN模型,使模型的学习能力增强,提高预测的准确度,同时能够处理大量数据。
所述步骤S300采取以下方法,
S301~建立合适深度的DCNN模型,设置初始参数值,参数值包括网络的层数,卷积层的卷积核的大小,卷积核的移动步长,激活函数类型,每个对应函数的偏置和权重系数,池化层的池化方式,池化层的核尺寸以及核移动步长,dropout值防止过拟合,初始化设置循环次数,每次输入的样本数量;
S302~用训练集数据作为输入,在训练过程中,以交叉熵损失函数MSE作为评价模型参数调整的依据,为了使模型的交叉熵损失函数达到最小,交叉熵损失阈值设置为10-6,当训练得到的值小于阈值,可认为模型达到最优,在训练过程中不断调整S301中提到的参数,直至交叉熵损失函数达到设定的阈值,可认为模型各个参数达到最优,此时保存模型;
S303~用测试集进行DCNN模型的训练,使模型学习到不同阶段的特征,进行S301中提到的参数优化,直至训练集中的预测值和实际值的均方误差达到最小,训练预测结果达到最优;均方误差表达式:
N表示参加训练的数据量,ypi表示对第i个输入的预测值,yti表示第i个输入对应的实际值。
S400~基于训练好的模型,利用测试集测试模型预测值,将模型的预测值和实际值做对比,得到模型预测的准确性。最后,对模型预测结果进行评判,这里采用四个指标进行评判。分别为均方根误差 RMSE、拟合优度检验R2、调整拟合优度检验Adjusted_R2和Score_function,其表达式分别如下:
预测分析中RMSE越接近0,代表预测结果越精确。
表示预测的均值,R2值越接近1,代表预测结果越好。
P代表特征数量,Adjusted_R2越接近1,表示预测结果越精确。
RULi表示第i个时间点预测的剩余寿命,RULi表示第i个时间点的实际剩余寿命,Score值越接近0,代表预测结果越精确。
试验中具体构建的DCNN模型结构如下:
该模型中池化层采用最大池化,核尺寸大小为2x2,核移动步长为 2,模型中的优化函数采用Adam,最后的池化层采用Max_pooling, 为了防止训练过程中模型过拟合采用dropout,此处dropout=0.3。
S500~可视化预测结果。为了进行模型预测结果的定性评价,采用模型可视化,基于python语言,调用matplotlib库实现可视化,可视化窗口中包含模型预测值的变化曲线以及模型实际剩余寿命变化曲线,图形的横坐标代表各个监测点,纵坐标代表剩余寿命的百分比。观察预测点的预测结果对应的纵坐标值,这个值反应模型在该点预测的机械设备关键零部件剩余寿命,依据实际得到的关键零部件的剩余寿命与模型预测的剩余寿命进行对比,然后结合机械设备的实际工作条件和环境,综合决定设备的剩余寿命。
进行实验对比。为了验证模型的预测结果的准确性和泛化能力。实验中采用支持向量回归(SVR)、循环神经网络(RNN)、长短时记忆神经网络(LSTM-RNN)、Window-CNN作为对比模型,对比验证模型的准确度;改变数据预处理方法,验证不同数据预处理时模型对同一组数据的预测结果;然后设置两组不同的数据集,在保持模型参数和结构不变的情况下,分别对比不同数据集中模型的预测准确性,验证各模型的泛化能力。
1.数据不去噪各模型预测结果如图1、2、3、4、5所示。
表1各模型预测评价指标
数据不进行任何去噪时,模型的预测结果趋势图和各个模型评价参数上表所示,由图进行定性分析可知,SVR,RNN,LSTM预测模型的预测曲线图和实际曲线图差异明显,预测曲线拟合效果差,可知预测结果差。WCNN的预测曲线和DCNN的预测曲线拟合效果好,预测结果好。
由表1进行定量分析,每个预测模型都通过四个评价指标进行评价。分析五个模型的RMSE可知,DCNN的RMSE最小,值为RMSE=0.01818,拟合优度检验R2的最大值为0.95846,Adjusted_R2最大值为0.95812, score的最小值为0.23231,由表知这四个评价指标的最优值均为模型 DCNN的评价值。
综合定性分析和定量分析,在数据不进行去噪时,五个预测模型中DCNN的预测结果最接近实际结果。
2.采用3σ准则去噪如图6、7、8、9、10所示。
表2各模型预测评价指标
当对原始数据采用3σ准则去噪时,各个模型的预测结果趋势和评价指标如表2所示。进行定量分析,RNN和LSTM的预测曲线和实际曲线差距明显,预测结果差;SVR、WCNN、DCNN模型的预测曲线和实际曲线拟合效果较好。与数据不去噪时的模型曲线对比可知,用3σ去噪之后五个模型的预测曲线拟合效果都有所优化。
依表2进行定量分析,最小的RMSE=0.00525,最大的R2=0.99762, Adjusted_R2=0.99760,最小的score=0.11116.而这几个最优值都是模型DCNN的评价值。对比表1和表2,四个评价指标的最优值均来自于表2,即采用3σ准则模型的预测效果较好。
综合定性评价指标和定量评价指标,对数据进行3σ准则去噪之后,模型DCNN的预测结果最接近真实值。
3.选择不同零件监测运行数据,保持模型的结构和参数都不变,采用3σ去噪后的预测结果如图11、12、13、14、15所示。
表3各模型预测评价指标
选择不同的数据集,保持模型结构和参数不变,验证模型的泛化能力。依图进行定性分析可知,SVR、RNN、WCNN的预测曲线和实际曲线拟合效果差,LSTM,DCNN模型的预测曲线和实际曲线拟合效果好,即LSTM和DCNN模型的预测结果更接近真实值。对比条件3和条件2的拟合曲线,综合可知DCNN模型的预测曲线始终是最好的,变化不明显。即在数据集变化的情况下,DCNN模型的稳定性较好。
依表3进行定量分析,各评价指标的最优值分别为RMSE=0.00772, R2=0.99548,Adjusted_R2=0.99544,score=0.13116.这四个最优值均为DCNN模型的评价值,即该模型的预测结果更接近真实值。对比表2和表3分析可知,模型DCNN的评价指标值变动最小,即该模型的稳定性好,对数据的依赖性小。
综合定性分析和定量分析,结合条件2和条件3的结果可知,模型DCNN的预测效果最好,而且对不同的数据集,其泛化能力强。