CN112632466A

CN112632466A - 一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法

Info

Publication number: CN112632466A
Application number: CN202011351795.2A
Authority: CN
Inventors: 张胜文; 杨凌翮; 程德俊; 张辉; 方喜峰
Original assignee: Jiangsu University of Science and Technology
Current assignee: Jiangsu University of Science and Technology
Priority date: 2020-11-26
Filing date: 2020-11-26
Publication date: 2021-04-09
Anticipated expiration: 2040-11-26
Also published as: CN112632466B

Abstract

本发明公开了一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法，包括如下步骤：获取轴承运行时的原始振动信号，分析选择出一个最优的样本长度；生成样本，使用主成分分析法对所有的样本进行降维；标准化降维后的新样本，定义故障类型，根据新样本划分训练集和验证集；构建并调整双向长短时记忆网络模型，采用训练集对双向长短时记忆网络模型进行训练；利用训练好的双向长短时记忆网络模型，根据验证集进行轴承的故障预测。

Description

一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法

技术领域

本发明属于轴承故障诊断领域，具体涉及一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法。

背景技术

滚动轴承作为旋转机械必不可少的关键件，在各个领域中得到广泛的应用，它的工作状态与整个旋转机械的生命周期存在紧密的联系，滚动轴承是机械设备中极其常见且极其易损坏的零件之一，如果未能及时识别故障，不仅会给工厂带来巨大的经济损失，还会造成机器的损伤甚至是人员伤亡。因此，在实际的工作和生产中，为保证安全和降低成本，监测滚动轴承的工作状态具有现实的理论和实际意义。

滚动轴承在运行过程中会产生相应的振动信号，振动信号能够反映滚动轴承的健康状态。由于轴承在不同状态下所产生的振动信号有所不同，所以通过产生的振动信号可以对滚动轴承的状态进行诊断，有效降低故障造成的损失。对滚动轴承运行过程进行监测和记录，为后期分析故障提供相应的数据支持，从而避免重大故障的发生。

在工业智能化的进程中，随着测控技术的快速发展，设备的数据也随之增大。数据量从小批量数据转换为海量数据，维度从单维数据转变为多维数据，滚动轴承运行状态的监测也同样面临数据增大的问题。传统的轴承故障诊断对于工作人员的专业性知识要求较高，通常要求工作人员熟练掌握信号处理技术。在经过信号处理后，再对其进行故障诊断。传统的故障诊断技术主要使用浅层网络模型，当面对大量高维度振动信号时，无法挖掘出信号的深层次的特征，大大降低轴承故障诊断的效率和准确率。

机器学习具有强大的非线性数据处理能力，在机器视觉、语音识别、图像处理等领域应用广泛。其主要分为有监督学习和无监督学习两种形式。机器学习可以利用轴承振动信号的深层特征，自适应地识别轴承故障类型。机器学习和传统信号处理方法相比，避免人工特征提取的过程，直接从高维信号中学习数据的规律，其故障诊断准确率也得到相应的提高。

深度学习主要指深度神经网络，深度前馈神经网络无法处理带有序列的数据，有文献提出一种基于循环神经网络的方法处理时序数据。但循环神经网络存储能力有限，随着时间的推移，隐藏层的原有信息会被覆盖，从而导致之前的信息缺失，容易导致梯度消失的状况。有文献提出一种基于双向长短时记忆网络的预测方法，通过引入记忆单元，解决以上存在的梯度消失的问题。作为时间序列的代表，轴承的数据不仅具有非线性的特点，还具有动态特性，***的输出不仅与当前的时刻的输入相关，还与之前时刻的相关，因此，双向长短时记忆网络适用于轴承的故障预测。

样本长度对双向长短时记忆网络的训练和预测都会产生一定的影响。目前，样本长度主要通过人为经验确定或人工实验确定，这样不仅误差较大，而且计算成本较高，效率低。

如果双向长短时记忆网络要解决一个高复杂度的问题，那么双向长短时记忆网络就需要增加或者减少隐藏层神经元数量。但是，隐藏层神经元的数量目前仍需要通过人工实验来确定，并且在训练过程中网络结构是固定不变的。这样不仅误差较大，而且计算成本较高，效率较低。

所以，需要一个新的技术方案来解决这个问题。

发明内容

发明目的：为了克服现有技术中存在的轴承故障诊断问题，考虑到高维度对轴承故障诊断的影响和原始振动信号的具有时序相关性的特点，提供一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法，使双向长短时记忆网络在训练过程中可以根据当前训练情况动态调整隐藏层神经元，优化网络结构，使其更好的解决轴承故障预测的问题，提高轴承预测的精度。

技术方案：为实现上述目的，本发明提供一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法，包括如下步骤：

S1：获取轴承运行时的原始振动信号(即时域信号)，分析选择出一个最优的样本长度；

S2：生成样本，使用主成分分析法(PCA)对所有的样本进行降维；

S3：标准化降维后的新样本，定义故障类型，根据新样本划分训练集和验证集；

S4：构建并调整双向长短时记忆网络模型，采用训练集对双向长短时记忆网络模型进行训练；

S5：保存较优样本长度和较优双向长短时记忆网络模型，利用训练好的双向长短时记忆网络模型，根据验证集进行轴承的故障预测。

进一步地，所述步骤S1中较优样本长度的分析选择方法为：

A1：根据原始振动信号中一个周期信号的数据点数量N_T和样本的个数N_S，确定样本长度N_SL范围，其中，采集的原始振动信号所有数据点的数量为N，N_SL范围如下所示：

A2：根据样本长度N_SL的范围大小确定不同的搜索策略，即在样本长度的范围内获取一个样本长度的值N_SV；

A3：重复步骤S2到步骤S4，通过评价准则，直到获取最优的样本长度N_SV。

进一步地，所述步骤A3中的评价准则包括针对样本长度范围小和样本长度范围大的两种评价准则，分别如下：

针对样本长度范围小的评价准则：

N_sv＝arg max(A(n)，A(n-1))

其中，arg max(A(n)，A(n-1))表示：在两次迭代完成后，保留模型中准确率高的网络，此时模型属于局部最优，保留此时的样本长度N_SV；直到遍历结束后，得到全局最优的模型，并保留与之对用的样本长度N_SV；

针对样本长度范围大的评价准则：

使用随机搜索策略在样本长度范围内搜索，获得样本长度值，在样本长度值中遍历，如果满足停止条件，则停止搜索，获取模型，停止条件为：

A(N_sv)＞θ

其中，A(N_sv)表示：当原始信号自动分割成长度为N_SV的样本时，将验证样本集放进模型验证得到的准确率；θ表示：验证准确率的阈值，即模型的验证准确率高于给定的阈值时停止，保留此时的样本长度N_SV。

进一步地，所述步骤S2中对于所有的样本进行降维的具体过程为：

B1：给定轴承振动信号T∈R^k×n，其中，X为k行n列的样本矩阵，矩阵中k表示振动幅值的个数，n表示样本个数，即n＝N_S，计算所有样本的均值：

其中，i＝1，2，...，k；j＝1，2，...，n；

B2：计算样本的标准差：

其中，i＝1，2，3，...，k；j＝1，2，3，...，n；

B3：计算样本的标准化数据：

B4：根据样本的标准化数据计算协方差矩阵：

B5：根据协方差矩阵，利用奇异值分解计算出特征值和对应的特征向量：

[U，S，V]＝SVD(ε)

其中，λ₁，λ₂，λ₃，...，λ_n是计算出的特征值；

U＝[u⁽¹⁾ u⁽²⁾ u⁽³⁾ … ... u⁽ⁿ⁾]

其中，u⁽¹⁾，u⁽²⁾，u⁽³⁾，...，u⁽ⁿ⁾是λ₁，λ₂，λ₃，...，λ_n所对应的特征向量，且λ₁＞λ₂＞λ₃＞...＞λ_n；

B6：计算贡献率：

即

如果α≥0.85，构造有对应特征向量u⁽ⁱ⁾，i＝1，..，n组成的矩阵E∈R^n×r，即E＝(u⁽¹⁾，u⁽²⁾，u⁽³⁾，...，u^(r))。

降维后的数据与原始数据相比，新的样本在保留主要信息的同时又降低了数据的维度。

进一步地，所述步骤S4中双向长短时记忆网络模型的构建和调整方法具体包括如下步骤：

C1：根据前人研究所提出的经验公式，确定双向长短时记忆网络中的隐藏层单元数量N_H的范围：

0≤N_H≤2L_max

其中，L_max为输入样本的序列最大长度；

C2：自动确定输出层神经元个数、全连接层的层数以及每层神经元的数量；

C3：获取到隐含层神经元数量的最大值2L_max，将神经元进行编号H₁’H₂，…H_2Lmax，形成序列形式；

C4：初始化双向长短时记忆网络的相关参数；

C5：利用过滤法过滤冗余的神经元，在隐藏层神经元数量的范围内，获取一个对应的隐藏层神经元数量，使得网络中冗余神经元得以去除，实现对双向长短时记忆网络结构的动态调整功能。

进一步地，所述步骤C5具体包括如下步骤：

D1：计算各个神经元对于所有样本的激活概率，然后比较某个神经元的激活概率对于平均值的离散程度；

双向长短时记忆网络的主要目的是提取输入样本的主要特征。其中，提取的主要特征通过隐藏层神经元的激活概率表示。判断提取特征的有效性主要通过观察某个神经元的激活概率对所有样本的离散程度。如果离散程度越高，表明该神经元提取特征的效果越好，则保留该神经元；如果离散程度越低，表明该神经元对提取特征的效果越差，则去除该神经元。某个神经元对于所有样本的离散程度主要使用方差进行衡量。如果方差越大，说明该神经元对于所有样本的离散程度高，则保留该神经元；如果方差越小，说明该神经元对于所有样本的离散程度低，则去除该神经元。

D2：利用过滤法中的方差选择法来筛除冗余的神经元，选择离散程度较小的神经元，即保留方差大于阈值的神经元，去除方差小于阈值的神经元。

进一步地，所述步骤D1中使用方差衡量某个神经元对于所有样本的离散程度，方差表达式如下：

其中，P(i，j)表示第j个神经元对第i个样本的激活概率，

表示第j个神经元对所有样本的平均激活概率，N_S代表样本的数量。

进一步地，所述步骤D2具体为：为实现提取特征的高效性，则需删除隐藏层中冗余神经元，删除冗余神经元需要制定相应的策略。在一次迭代过程中，计算每一个神经元对于所有样本的方差，如果方差小于给定的阈值，则在形成的序列中删除这些方差对应的神经元，然后进入下一次迭代，重复以上操作，直到序列中每个神经元对所有样本的方差都低于阈值后时停止。

停止条件如下所示：

S(j)²＞u

进一步地，所述步骤S5具体为：将降维后的验证集输入到训练过的双向长短时记忆网络模型中，通过双向长短时记忆网络提取测试样本的主要特征，然后将这些主要特征输入到全连接层中，再输入到最后一层输出层中，输出的值代表轴承故障类型，即预测出滚动轴承的故障类型。

进一步地，所述步骤S4中采用训练集对双向长短时记忆网络模型进行训练的过程为：将划分的训练集(包括数据及标签)放进深度长短时记忆网络的输入端，利用双向长短时记忆网络对数据进行自适应的特征提取，在提取之后输入到全连接层，最终通过softmax函数从输出层输出预测的结果。

有益效果：本发明与现有技术相比，具备如下优点：

1、利用主成分分析和双向长短时记忆网络的特殊结构，有效规避了常规神经网络训练过程中的梯度消失和梯度***问题，从而有效地利用历史时间序列信息，使时间序列的状态特征更加易于区分。该方法无需进行信号处理提取特征，减少了人为因素的影响，降低了样本数据的维度，提高了机器学习模型的训练效率；

2、本发明中的双向长短时记忆网络，处理轴承振动信号十分有效，适用于滚动轴承故障诊断。

3、本发明方法能够自动确定样本长度，获得较优的样本长度，提高网络模型的预测准确度和减少时间成本，除此之外，还包括自动分割采集的原始数据，并形成网络训练、验证以及预测所需的样本，取代手动分割原始数据，减少了重复性的操作，大大提高了样本生成的时间。

4、本发明方法能够动态调整网络模型，使得双向长短时记忆网络在训练的过程中可以根据当前的训练情况改变网络结构，主要涉及隐藏层中冗余神经元的筛除，优化了双向长短时记忆网络的结构，取代了人工实验，克服了网络结构设计的困难，提高了故障特征的提取能力和轴承故障预测的能力以及减少长短时记忆网络设计的时间。

附图说明

图1为本发明的整体流程示意图；

图2为本发明实施例中主成分分析(PCA)降维的流程示意图；

图3为本发明实施例中采用的双向长短时记忆网络模型图；

图4为本发明实施例中移除隐藏层冗余神经元的操作示意图；

图5为本发明实施例中移除隐藏层冗余神经元的流程示意图；

图6为本发明实施例中获取较优样本长度的流程示意图。

具体实施方式

下面结合附图和具体实施例，进一步阐明本发明，应理解这些实施例仅用于说明本发明而不用于限制本发明的范围，在阅读了本发明之后，本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。

本发明提供一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法，如图1所示，其包括如下步骤：

S1：获取轴承运行时的原始振动信号(即时域信号)，分析选择出一个较优的样本长度。

对照图6，本实施例中较优样本长度的分析选择方法包括如下步骤A1～A3为：

A2：根据样本长度N_SL的范围大小确定不同的搜索策略，即在样本长度的范围内获取一个较优的样本长度值N_SV；

评价准则包括针对样本长度范围小和样本长度范围大的两种评价准则，分别为遍历法和随机搜索法，具体如下：

针对样本长度范围小的评价准则(遍历法)：

N_sv＝arg max(A(n)，A(n-1))

针对样本长度范围大的评价准则(随机搜索法)：

A(N_sv)＞θ

S2：生成样本，使用主成分分析法(PCA)对所有的样本进行降维，如图2所示，具体包括如下步骤B1-B6：

其中，i＝1，2，...，k；j＝1，2，...，n；

B2：计算样本的标准差：

其中，i＝1，2，3，...，k；j＝1，2，3，...，n；

B3：计算样本的标准化数据：

B4：根据样本的标准化数据计算协方差矩阵：

[U，S，V]＝SVD(ε)

其中，λ₁，λ₂，λ₃，...，λ_n是计算出的特征值；

U＝[u⁽¹⁾ u⁽²⁾ u⁽³⁾ … ... u⁽ⁿ⁾]

其中，u⁽¹⁾，u⁽²⁾，u⁽³⁾，…，u⁽ⁿ⁾是λ₁，λ₂，λ₃，...，λ_n所对应的特征向量，且λ₁＞λ₂＞λ₃＞...＞λ_n；

B6：计算贡献率：

即

S3：标准化降维后的新样本，定义故障类型，故障类型包括正常数据、驱动端内圈故障和风扇端内圈故障，根据新样本划分训练集和验证集；

S4：构建并调整双向长短时记忆网络模型，采用训练集对双向长短时记忆网络模型进行训练。

如图3展示了本实施例应用的双向长短时记忆网络模型，对照图4和图5，双向长短时记忆网络模型的构建和调整方法具体包括如下步骤C1～C5：

0≤N_H≤2L_max

其中，L_max为输入样本的序列最大长度；

C4：初始化双向长短时记忆网络的相关参数；

步骤C5具体包括如下步骤D1和D2：

使用方差衡量某个神经元对于所有样本的离散程度，方差表达式如下：

其中，P(i，j)表示第j个神经元对第i个样本的激活概率，

为实现提取特征的高效性，则需删除隐藏层中冗余神经元，删除冗余神经元需要制定相应的策略。在一次迭代过程中，计算每一个神经元对于所有样本的方差，如果方差小于给定的阈值，则在形成的序列中删除这些方差对应的神经元，然后进入下一次迭代，重复以上操作，直到序列中每个神经元对所有样本的方差都低于阈值后时停止。

停止条件如下所示：

S(j)²＞u

本步骤中采用训练集对双向长短时记忆网络模型进行训练的过程为：将划分的训练集(包括数据及标签)放进深度长短时记忆网络的输入端，利用双向长短时记忆网络对数据进行自适应的特征提取，在提取之后输入到全连接层，最终通过softmax函数从输出层输出预测的结果。

具体为：将降维后的验证集输入到训练过的双向长短时记忆网络模型中，通过双向长短时记忆网络提取测试样本的主要特征，然后将这些主要特征输入到全连接层中，再输入到最后一层输出层中，输出的值代表轴承故障类型，即预测出滚动轴承的故障类型。

基于上述滚动轴承故障预测方法，本实施例对采集到的滚动轴承振动数据进行检测。该数据集包括450个样本，其中训练样本360个，测试样本90个。经过上述方法自动调整获得较优的样本长度为512，较优隐藏层神经元数量为100；输出结果为三种故障类型的一种，故障类型包括正常数据、驱动端内圈故障、风扇端内圈故障。检测结果表明基于动态双向长短时记忆网络的轴承故障预测方法比传统的人工控制方法节约了28％的处理时间，准确率也从92％提高到了98％。因此，本发明方法可以有效的预测轴承的故障，并且节约时间和成本，实现高效的故障预测。

Claims

1.一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法，其特征在于，包括如下步骤：

S1：获取轴承运行时的原始振动信号，分析选择出一个最优的样本长度；

S2：生成样本，使用主成分分析法对所有的样本进行降维；

S5：利用训练好的双向长短时记忆网络模型，根据验证集进行轴承的故障预测。

2.根据权利要求1所述的一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法，其特征在于，所述步骤S1中最优样本长度的分析选择方法为：

3.根据权利要求2所述的一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法，其特征在于，所述步骤A3中的评价准则包括针对样本长度范围小和样本长度范围大的两种评价准则，分别如下：

针对样本长度范围小的评价准则：

N_sv＝argmax(A(n)，A(n-1))

其中，argmax(A(n)，A(n-1))表示：在两次迭代完成后，保留模型中准确率高的网络，此时模型属于局部最优，保留此时的样本长度N_SV；直到遍历结束后，得到全局最优的模型，并保留与之对用的样本长度N_SV；

针对样本长度范围大的评价准则：

A(N_sv)>θ

4.根据权利要求1所述的一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法，其特征在于，所述步骤S2中对于所有的样本进行降维的具体过程为：

其中，i＝1,2,…,k；j＝1,2,…,n；

B2：计算样本的标准差：

其中，i＝1,2,3,…,k；j＝1,2,3,…,n；

B3：计算样本的标准化数据：

B4：根据样本的标准化数据计算协方差矩阵：

[U,S,V]＝SVD(ε)

其中，λ₁,λ₂,λ₃,…,λ_n是计算出的特征值；

U＝[u⁽¹⁾ u⁽²⁾ u⁽³⁾ … … u⁽ⁿ⁾]

其中，u⁽¹⁾，u⁽²⁾，u⁽³⁾，…,u⁽ⁿ⁾是λ₁,λ₂,λ₃,…,λ_n所对应的特征向量，且λ₁>λ₂>λ₃>…>λ_n；

B6：计算贡献率：

即

如果α≥0.85，构造有对应特征向量u⁽ⁱ⁾，i＝1,..,n组成的矩阵E∈R^n×r，即E＝(u⁽¹⁾，u⁽²⁾，u⁽³⁾，…,u^(r))。

5.根据权利要求1所述的一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法，其特征在于，所述步骤S4中双向长短时记忆网络模型的构建和调整方法具体包括如下步骤：

C1：确定双向长短时记忆网络中的隐藏层单元数量N_H的范围：

0≤N_H≤2L_max

其中，L_max为输入样本的序列最大长度；

C4：初始化双向长短时记忆网络的相关参数；

6.根据权利要求5所述的一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法，其特征在于，所述步骤C5具体包括如下步骤：

D2：利用过滤法中的方差选择法来筛除冗余的神经元，保留方差大于阈值的神经元，去除方差小于阈值的神经元。

7.根据权利要求6所述的一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法，其特征在于，所述步骤D1中使用方差衡量某个神经元对于所有样本的离散程度，方差表达式如下：

其中，P(i,j)表示第j个神经元对第i个样本的激活概率，

8.根据权利要求6所述的一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法，其特征在于，所述步骤D2具体为：在一次迭代过程中，计算每一个神经元对于所有样本的方差，如果方差小于给定的阈值，则在形成的序列中删除这些方差对应的神经元，然后进入下一次迭代，重复以上操作，直到序列中每个神经元对所有样本的方差都低于阈值后时停止。

9.根据权利要求1所述的一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法，其特征在于，所述步骤S5具体为：将降维后的验证集输入到训练过的双向长短时记忆网络模型中，通过双向长短时记忆网络提取测试样本的主要特征，然后将这些主要特征输入到全连接层中，再输入到最后一层输出层中，输出的值代表轴承故障类型，即预测出滚动轴承的故障类型。

10.根据权利要求1所述的一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法，其特征在于，所述步骤S4中采用训练集对双向长短时记忆网络模型进行训练的过程为：将划分的训练集放进深度长短时记忆网络的输入端，利用双向长短时记忆网络对数据进行自适应的特征提取，在提取之后输入到全连接层，最终通过softmax函数从输出层输出预测的结果。