CN112632466A - 一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法 - Google Patents
一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法 Download PDFInfo
- Publication number
- CN112632466A CN112632466A CN202011351795.2A CN202011351795A CN112632466A CN 112632466 A CN112632466 A CN 112632466A CN 202011351795 A CN202011351795 A CN 202011351795A CN 112632466 A CN112632466 A CN 112632466A
- Authority
- CN
- China
- Prior art keywords
- memory network
- short
- bidirectional long
- time
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002457 bidirectional effect Effects 0.000 title claims abstract description 69
- 238000000034 method Methods 0.000 title claims abstract description 63
- 230000015654 memory Effects 0.000 title claims abstract description 59
- 238000000513 principal component analysis Methods 0.000 title claims abstract description 23
- 238000012549 training Methods 0.000 claims abstract description 31
- 238000012795 verification Methods 0.000 claims abstract description 24
- 230000009467 reduction Effects 0.000 claims abstract description 10
- 238000012847 principal component analysis method Methods 0.000 claims abstract 2
- 210000002569 neuron Anatomy 0.000 claims description 91
- 230000008569 process Effects 0.000 claims description 18
- 230000004913 activation Effects 0.000 claims description 16
- 238000011156 evaluation Methods 0.000 claims description 15
- 230000007787 long-term memory Effects 0.000 claims description 15
- 238000005096 rolling process Methods 0.000 claims description 14
- 238000001914 filtration Methods 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 9
- 230000006403 short-term memory Effects 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 4
- 238000000354 decomposition reaction Methods 0.000 claims description 3
- 230000000737 periodic effect Effects 0.000 claims description 3
- 238000010187 selection method Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 2
- 238000003745 diagnosis Methods 0.000 description 9
- 239000006185 dispersion Substances 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 231100000517 death Toxicity 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/04—Bearings
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/04—Bearings
- G01M13/045—Acoustic or vibration analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Pure & Applied Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Molecular Biology (AREA)
- Evolutionary Biology (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Algebra (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Medical Informatics (AREA)
- Acoustics & Sound (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法,包括如下步骤:获取轴承运行时的原始振动信号,分析选择出一个最优的样本长度;生成样本,使用主成分分析法对所有的样本进行降维;标准化降维后的新样本,定义故障类型,根据新样本划分训练集和验证集;构建并调整双向长短时记忆网络模型,采用训练集对双向长短时记忆网络模型进行训练;利用训练好的双向长短时记忆网络模型,根据验证集进行轴承的故障预测。
Description
技术领域
本发明属于轴承故障诊断领域,具体涉及一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法。
背景技术
滚动轴承作为旋转机械必不可少的关键件,在各个领域中得到广泛的应用,它的工作状态与整个旋转机械的生命周期存在紧密的联系,滚动轴承是机械设备中极其常见且极其易损坏的零件之一,如果未能及时识别故障,不仅会给工厂带来巨大的经济损失,还会造成机器的损伤甚至是人员伤亡。因此,在实际的工作和生产中,为保证安全和降低成本,监测滚动轴承的工作状态具有现实的理论和实际意义。
滚动轴承在运行过程中会产生相应的振动信号,振动信号能够反映滚动轴承的健康状态。由于轴承在不同状态下所产生的振动信号有所不同,所以通过产生的振动信号可以对滚动轴承的状态进行诊断,有效降低故障造成的损失。对滚动轴承运行过程进行监测和记录,为后期分析故障提供相应的数据支持,从而避免重大故障的发生。
在工业智能化的进程中,随着测控技术的快速发展,设备的数据也随之增大。数据量从小批量数据转换为海量数据,维度从单维数据转变为多维数据,滚动轴承运行状态的监测也同样面临数据增大的问题。传统的轴承故障诊断对于工作人员的专业性知识要求较高,通常要求工作人员熟练掌握信号处理技术。在经过信号处理后,再对其进行故障诊断。传统的故障诊断技术主要使用浅层网络模型,当面对大量高维度振动信号时,无法挖掘出信号的深层次的特征,大大降低轴承故障诊断的效率和准确率。
机器学习具有强大的非线性数据处理能力,在机器视觉、语音识别、图像处理等领域应用广泛。其主要分为有监督学习和无监督学习两种形式。机器学习可以利用轴承振动信号的深层特征,自适应地识别轴承故障类型。机器学习和传统信号处理方法相比,避免人工特征提取的过程,直接从高维信号中学习数据的规律,其故障诊断准确率也得到相应的提高。
深度学习主要指深度神经网络,深度前馈神经网络无法处理带有序列的数据,有文献提出一种基于循环神经网络的方法处理时序数据。但循环神经网络存储能力有限,随着时间的推移,隐藏层的原有信息会被覆盖,从而导致之前的信息缺失,容易导致梯度消失的状况。有文献提出一种基于双向长短时记忆网络的预测方法,通过引入记忆单元,解决以上存在的梯度消失的问题。作为时间序列的代表,轴承的数据不仅具有非线性的特点,还具有动态特性,***的输出不仅与当前的时刻的输入相关,还与之前时刻的相关,因此,双向长短时记忆网络适用于轴承的故障预测。
样本长度对双向长短时记忆网络的训练和预测都会产生一定的影响。目前,样本长度主要通过人为经验确定或人工实验确定,这样不仅误差较大,而且计算成本较高,效率低。
如果双向长短时记忆网络要解决一个高复杂度的问题,那么双向长短时记忆网络就需要增加或者减少隐藏层神经元数量。但是,隐藏层神经元的数量目前仍需要通过人工实验来确定,并且在训练过程中网络结构是固定不变的。这样不仅误差较大,而且计算成本较高,效率较低。
所以,需要一个新的技术方案来解决这个问题。
发明内容
发明目的:为了克服现有技术中存在的轴承故障诊断问题,考虑到高维度对轴承故障诊断的影响和原始振动信号的具有时序相关性的特点,提供一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法,使双向长短时记忆网络在训练过程中可以根据当前训练情况动态调整隐藏层神经元,优化网络结构,使其更好的解决轴承故障预测的问题,提高轴承预测的精度。
技术方案:为实现上述目的,本发明提供一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法,包括如下步骤:
S1:获取轴承运行时的原始振动信号(即时域信号),分析选择出一个最优的样本长度;
S2:生成样本,使用主成分分析法(PCA)对所有的样本进行降维;
S3:标准化降维后的新样本,定义故障类型,根据新样本划分训练集和验证集;
S4:构建并调整双向长短时记忆网络模型,采用训练集对双向长短时记忆网络模型进行训练;
S5:保存较优样本长度和较优双向长短时记忆网络模型,利用训练好的双向长短时记忆网络模型,根据验证集进行轴承的故障预测。
进一步地,所述步骤S1中较优样本长度的分析选择方法为:
A1:根据原始振动信号中一个周期信号的数据点数量NT和样本的个数NS,确定样本长度NSL范围,其中,采集的原始振动信号所有数据点的数量为N,NSL范围如下所示:
A2:根据样本长度NSL的范围大小确定不同的搜索策略,即在样本长度的范围内获取一个样本长度的值NSV;
A3:重复步骤S2到步骤S4,通过评价准则,直到获取最优的样本长度NSV。
进一步地,所述步骤A3中的评价准则包括针对样本长度范围小和样本长度范围大的两种评价准则,分别如下:
针对样本长度范围小的评价准则:
Nsv=arg max(A(n),A(n-1))
其中,arg max(A(n),A(n-1))表示:在两次迭代完成后,保留模型中准确率高的网络,此时模型属于局部最优,保留此时的样本长度NSV;直到遍历结束后,得到全局最优的模型,并保留与之对用的样本长度NSV;
针对样本长度范围大的评价准则:
使用随机搜索策略在样本长度范围内搜索,获得样本长度值,在样本长度值中遍历,如果满足停止条件,则停止搜索,获取模型,停止条件为:
A(Nsv)>θ
其中,A(Nsv)表示:当原始信号自动分割成长度为NSV的样本时,将验证样本集放进模型验证得到的准确率;θ表示:验证准确率的阈值,即模型的验证准确率高于给定的阈值时停止,保留此时的样本长度NSV。
进一步地,所述步骤S2中对于所有的样本进行降维的具体过程为:
B1:给定轴承振动信号T∈Rk×n,其中,X为k行n列的样本矩阵,矩阵中k表示振动幅值的个数,n表示样本个数,即n=NS,计算所有样本的均值:
其中,i=1,2,...,k;j=1,2,...,n;
B2:计算样本的标准差:
其中,i=1,2,3,...,k;j=1,2,3,...,n;
B3:计算样本的标准化数据:
B4:根据样本的标准化数据计算协方差矩阵:
B5:根据协方差矩阵,利用奇异值分解计算出特征值和对应的特征向量:
[U,S,V]=SVD(ε)
其中,λ1,λ2,λ3,...,λn是计算出的特征值;
U=[u(1) u(2) u(3) … ... u(n)]
其中,u(1),u(2),u(3),...,u(n)是λ1,λ2,λ3,...,λn所对应的特征向量,且λ1>λ2>λ3>...>λn;
B6:计算贡献率:
如果α≥0.85,构造有对应特征向量u(i),i=1,..,n组成的矩阵E∈Rn×r,即E=(u(1),u(2),u(3),...,u(r))。
降维后的数据与原始数据相比,新的样本在保留主要信息的同时又降低了数据的维度。
进一步地,所述步骤S4中双向长短时记忆网络模型的构建和调整方法具体包括如下步骤:
C1:根据前人研究所提出的经验公式,确定双向长短时记忆网络中的隐藏层单元数量NH的范围:
0≤NH≤2Lmax
其中,Lmax为输入样本的序列最大长度;
C2:自动确定输出层神经元个数、全连接层的层数以及每层神经元的数量;
C3:获取到隐含层神经元数量的最大值2Lmax,将神经元进行编号H1’H2,…H2Lmax,形成序列形式;
C4:初始化双向长短时记忆网络的相关参数;
C5:利用过滤法过滤冗余的神经元,在隐藏层神经元数量的范围内,获取一个对应的隐藏层神经元数量,使得网络中冗余神经元得以去除,实现对双向长短时记忆网络结构的动态调整功能。
进一步地,所述步骤C5具体包括如下步骤:
D1:计算各个神经元对于所有样本的激活概率,然后比较某个神经元的激活概率对于平均值的离散程度;
双向长短时记忆网络的主要目的是提取输入样本的主要特征。其中,提取的主要特征通过隐藏层神经元的激活概率表示。判断提取特征的有效性主要通过观察某个神经元的激活概率对所有样本的离散程度。如果离散程度越高,表明该神经元提取特征的效果越好,则保留该神经元;如果离散程度越低,表明该神经元对提取特征的效果越差,则去除该神经元。某个神经元对于所有样本的离散程度主要使用方差进行衡量。如果方差越大,说明该神经元对于所有样本的离散程度高,则保留该神经元;如果方差越小,说明该神经元对于所有样本的离散程度低,则去除该神经元。
D2:利用过滤法中的方差选择法来筛除冗余的神经元,选择离散程度较小的神经元,即保留方差大于阈值的神经元,去除方差小于阈值的神经元。
进一步地,所述步骤D1中使用方差衡量某个神经元对于所有样本的离散程度,方差表达式如下:
进一步地,所述步骤D2具体为:为实现提取特征的高效性,则需删除隐藏层中冗余神经元,删除冗余神经元需要制定相应的策略。在一次迭代过程中,计算每一个神经元对于所有样本的方差,如果方差小于给定的阈值,则在形成的序列中删除这些方差对应的神经元,然后进入下一次迭代,重复以上操作,直到序列中每个神经元对所有样本的方差都低于阈值后时停止。
停止条件如下所示:
S(j)2>u
进一步地,所述步骤S5具体为:将降维后的验证集输入到训练过的双向长短时记忆网络模型中,通过双向长短时记忆网络提取测试样本的主要特征,然后将这些主要特征输入到全连接层中,再输入到最后一层输出层中,输出的值代表轴承故障类型,即预测出滚动轴承的故障类型。
进一步地,所述步骤S4中采用训练集对双向长短时记忆网络模型进行训练的过程为:将划分的训练集(包括数据及标签)放进深度长短时记忆网络的输入端,利用双向长短时记忆网络对数据进行自适应的特征提取,在提取之后输入到全连接层,最终通过softmax函数从输出层输出预测的结果。
有益效果:本发明与现有技术相比,具备如下优点:
1、利用主成分分析和双向长短时记忆网络的特殊结构,有效规避了常规神经网络训练过程中的梯度消失和梯度***问题,从而有效地利用历史时间序列信息,使时间序列的状态特征更加易于区分。该方法无需进行信号处理提取特征,减少了人为因素的影响,降低了样本数据的维度,提高了机器学习模型的训练效率;
2、本发明中的双向长短时记忆网络,处理轴承振动信号十分有效,适用于滚动轴承故障诊断。
3、本发明方法能够自动确定样本长度,获得较优的样本长度,提高网络模型的预测准确度和减少时间成本,除此之外,还包括自动分割采集的原始数据,并形成网络训练、验证以及预测所需的样本,取代手动分割原始数据,减少了重复性的操作,大大提高了样本生成的时间。
4、本发明方法能够动态调整网络模型,使得双向长短时记忆网络在训练的过程中可以根据当前的训练情况改变网络结构,主要涉及隐藏层中冗余神经元的筛除,优化了双向长短时记忆网络的结构,取代了人工实验,克服了网络结构设计的困难,提高了故障特征的提取能力和轴承故障预测的能力以及减少长短时记忆网络设计的时间。
附图说明
图1为本发明的整体流程示意图;
图2为本发明实施例中主成分分析(PCA)降维的流程示意图;
图3为本发明实施例中采用的双向长短时记忆网络模型图;
图4为本发明实施例中移除隐藏层冗余神经元的操作示意图;
图5为本发明实施例中移除隐藏层冗余神经元的流程示意图;
图6为本发明实施例中获取较优样本长度的流程示意图。
具体实施方式
下面结合附图和具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
本发明提供一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法,如图1所示,其包括如下步骤:
S1:获取轴承运行时的原始振动信号(即时域信号),分析选择出一个较优的样本长度。
对照图6,本实施例中较优样本长度的分析选择方法包括如下步骤A1~A3为:
A1:根据原始振动信号中一个周期信号的数据点数量NT和样本的个数NS,确定样本长度NSL范围,其中,采集的原始振动信号所有数据点的数量为N,NSL范围如下所示:
A2:根据样本长度NSL的范围大小确定不同的搜索策略,即在样本长度的范围内获取一个较优的样本长度值NSV;
A3:重复步骤S2到步骤S4,通过评价准则,直到获取最优的样本长度NSV。
评价准则包括针对样本长度范围小和样本长度范围大的两种评价准则,分别为遍历法和随机搜索法,具体如下:
针对样本长度范围小的评价准则(遍历法):
Nsv=arg max(A(n),A(n-1))
其中,arg max(A(n),A(n-1))表示:在两次迭代完成后,保留模型中准确率高的网络,此时模型属于局部最优,保留此时的样本长度NSV;直到遍历结束后,得到全局最优的模型,并保留与之对用的样本长度NSV;
针对样本长度范围大的评价准则(随机搜索法):
使用随机搜索策略在样本长度范围内搜索,获得样本长度值,在样本长度值中遍历,如果满足停止条件,则停止搜索,获取模型,停止条件为:
A(Nsv)>θ
其中,A(Nsv)表示:当原始信号自动分割成长度为NSV的样本时,将验证样本集放进模型验证得到的准确率;θ表示:验证准确率的阈值,即模型的验证准确率高于给定的阈值时停止,保留此时的样本长度NSV。
S2:生成样本,使用主成分分析法(PCA)对所有的样本进行降维,如图2所示,具体包括如下步骤B1-B6:
B1:给定轴承振动信号T∈Rk×n,其中,X为k行n列的样本矩阵,矩阵中k表示振动幅值的个数,n表示样本个数,即n=NS,计算所有样本的均值:
其中,i=1,2,...,k;j=1,2,...,n;
B2:计算样本的标准差:
其中,i=1,2,3,...,k;j=1,2,3,...,n;
B3:计算样本的标准化数据:
B4:根据样本的标准化数据计算协方差矩阵:
B5:根据协方差矩阵,利用奇异值分解计算出特征值和对应的特征向量:
[U,S,V]=SVD(ε)
其中,λ1,λ2,λ3,...,λn是计算出的特征值;
U=[u(1) u(2) u(3) … ... u(n)]
其中,u(1),u(2),u(3),…,u(n)是λ1,λ2,λ3,...,λn所对应的特征向量,且λ1>λ2>λ3>...>λn;
B6:计算贡献率:
如果α≥0.85,构造有对应特征向量u(i),i=1,..,n组成的矩阵E∈Rn×r,即E=(u(1),u(2),u(3),...,u(r))。
降维后的数据与原始数据相比,新的样本在保留主要信息的同时又降低了数据的维度。
S3:标准化降维后的新样本,定义故障类型,故障类型包括正常数据、驱动端内圈故障和风扇端内圈故障,根据新样本划分训练集和验证集;
S4:构建并调整双向长短时记忆网络模型,采用训练集对双向长短时记忆网络模型进行训练。
如图3展示了本实施例应用的双向长短时记忆网络模型,对照图4和图5,双向长短时记忆网络模型的构建和调整方法具体包括如下步骤C1~C5:
C1:根据前人研究所提出的经验公式,确定双向长短时记忆网络中的隐藏层单元数量NH的范围:
0≤NH≤2Lmax
其中,Lmax为输入样本的序列最大长度;
C2:自动确定输出层神经元个数、全连接层的层数以及每层神经元的数量;
C3:获取到隐含层神经元数量的最大值2Lmax,将神经元进行编号H1’H2,…H2Lmax,形成序列形式;
C4:初始化双向长短时记忆网络的相关参数;
C5:利用过滤法过滤冗余的神经元,在隐藏层神经元数量的范围内,获取一个对应的隐藏层神经元数量,使得网络中冗余神经元得以去除,实现对双向长短时记忆网络结构的动态调整功能。
步骤C5具体包括如下步骤D1和D2:
D1:计算各个神经元对于所有样本的激活概率,然后比较某个神经元的激活概率对于平均值的离散程度;
双向长短时记忆网络的主要目的是提取输入样本的主要特征。其中,提取的主要特征通过隐藏层神经元的激活概率表示。判断提取特征的有效性主要通过观察某个神经元的激活概率对所有样本的离散程度。如果离散程度越高,表明该神经元提取特征的效果越好,则保留该神经元;如果离散程度越低,表明该神经元对提取特征的效果越差,则去除该神经元。某个神经元对于所有样本的离散程度主要使用方差进行衡量。如果方差越大,说明该神经元对于所有样本的离散程度高,则保留该神经元;如果方差越小,说明该神经元对于所有样本的离散程度低,则去除该神经元。
使用方差衡量某个神经元对于所有样本的离散程度,方差表达式如下:
D2:利用过滤法中的方差选择法来筛除冗余的神经元,选择离散程度较小的神经元,即保留方差大于阈值的神经元,去除方差小于阈值的神经元。
为实现提取特征的高效性,则需删除隐藏层中冗余神经元,删除冗余神经元需要制定相应的策略。在一次迭代过程中,计算每一个神经元对于所有样本的方差,如果方差小于给定的阈值,则在形成的序列中删除这些方差对应的神经元,然后进入下一次迭代,重复以上操作,直到序列中每个神经元对所有样本的方差都低于阈值后时停止。
停止条件如下所示:
S(j)2>u
本步骤中采用训练集对双向长短时记忆网络模型进行训练的过程为:将划分的训练集(包括数据及标签)放进深度长短时记忆网络的输入端,利用双向长短时记忆网络对数据进行自适应的特征提取,在提取之后输入到全连接层,最终通过softmax函数从输出层输出预测的结果。
S5:保存较优样本长度和较优双向长短时记忆网络模型,利用训练好的双向长短时记忆网络模型,根据验证集进行轴承的故障预测。
具体为:将降维后的验证集输入到训练过的双向长短时记忆网络模型中,通过双向长短时记忆网络提取测试样本的主要特征,然后将这些主要特征输入到全连接层中,再输入到最后一层输出层中,输出的值代表轴承故障类型,即预测出滚动轴承的故障类型。
基于上述滚动轴承故障预测方法,本实施例对采集到的滚动轴承振动数据进行检测。该数据集包括450个样本,其中训练样本360个,测试样本90个。经过上述方法自动调整获得较优的样本长度为512,较优隐藏层神经元数量为100;输出结果为三种故障类型的一种,故障类型包括正常数据、驱动端内圈故障、风扇端内圈故障。检测结果表明基于动态双向长短时记忆网络的轴承故障预测方法比传统的人工控制方法节约了28%的处理时间,准确率也从92%提高到了98%。因此,本发明方法可以有效的预测轴承的故障,并且节约时间和成本,实现高效的故障预测。
Claims (10)
1.一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法,其特征在于,包括如下步骤:
S1:获取轴承运行时的原始振动信号,分析选择出一个最优的样本长度;
S2:生成样本,使用主成分分析法对所有的样本进行降维;
S3:标准化降维后的新样本,定义故障类型,根据新样本划分训练集和验证集;
S4:构建并调整双向长短时记忆网络模型,采用训练集对双向长短时记忆网络模型进行训练;
S5:利用训练好的双向长短时记忆网络模型,根据验证集进行轴承的故障预测。
3.根据权利要求2所述的一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法,其特征在于,所述步骤A3中的评价准则包括针对样本长度范围小和样本长度范围大的两种评价准则,分别如下:
针对样本长度范围小的评价准则:
Nsv=argmax(A(n),A(n-1))
其中,argmax(A(n),A(n-1))表示:在两次迭代完成后,保留模型中准确率高的网络,此时模型属于局部最优,保留此时的样本长度NSV;直到遍历结束后,得到全局最优的模型,并保留与之对用的样本长度NSV;
针对样本长度范围大的评价准则:
使用随机搜索策略在样本长度范围内搜索,获得样本长度值,在样本长度值中遍历,如果满足停止条件,则停止搜索,获取模型,停止条件为:
A(Nsv)>θ
其中,A(Nsv)表示:当原始信号自动分割成长度为NSV的样本时,将验证样本集放进模型验证得到的准确率;θ表示:验证准确率的阈值,即模型的验证准确率高于给定的阈值时停止,保留此时的样本长度NSV。
4.根据权利要求1所述的一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法,其特征在于,所述步骤S2中对于所有的样本进行降维的具体过程为:
B1:给定轴承振动信号T∈Rk×n,其中,X为k行n列的样本矩阵,矩阵中k表示振动幅值的个数,n表示样本个数,即n=NS,计算所有样本的均值:
其中,i=1,2,…,k;j=1,2,…,n;
B2:计算样本的标准差:
其中,i=1,2,3,…,k;j=1,2,3,…,n;
B3:计算样本的标准化数据:
B4:根据样本的标准化数据计算协方差矩阵:
B5:根据协方差矩阵,利用奇异值分解计算出特征值和对应的特征向量:
[U,S,V]=SVD(ε)
其中,λ1,λ2,λ3,…,λn是计算出的特征值;
U=[u(1) u(2) u(3) … … u(n)]
其中,u(1),u(2),u(3),…,u(n)是λ1,λ2,λ3,…,λn所对应的特征向量,且λ1>λ2>λ3>…>λn;
B6:计算贡献率:
如果α≥0.85,构造有对应特征向量u(i),i=1,..,n组成的矩阵E∈Rn×r,即E=(u(1),u(2),u(3),…,u(r))。
5.根据权利要求1所述的一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法,其特征在于,所述步骤S4中双向长短时记忆网络模型的构建和调整方法具体包括如下步骤:
C1:确定双向长短时记忆网络中的隐藏层单元数量NH的范围:
0≤NH≤2Lmax
其中,Lmax为输入样本的序列最大长度;
C2:自动确定输出层神经元个数、全连接层的层数以及每层神经元的数量;
C3:获取到隐含层神经元数量的最大值2Lmax,将神经元进行编号H1’H2,…H2Lmax,形成序列形式;
C4:初始化双向长短时记忆网络的相关参数;
C5:利用过滤法过滤冗余的神经元,在隐藏层神经元数量的范围内,获取一个对应的隐藏层神经元数量,使得网络中冗余神经元得以去除,实现对双向长短时记忆网络结构的动态调整功能。
6.根据权利要求5所述的一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法,其特征在于,所述步骤C5具体包括如下步骤:
D1:计算各个神经元对于所有样本的激活概率,然后比较某个神经元的激活概率对于平均值的离散程度;
D2:利用过滤法中的方差选择法来筛除冗余的神经元,保留方差大于阈值的神经元,去除方差小于阈值的神经元。
8.根据权利要求6所述的一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法,其特征在于,所述步骤D2具体为:在一次迭代过程中,计算每一个神经元对于所有样本的方差,如果方差小于给定的阈值,则在形成的序列中删除这些方差对应的神经元,然后进入下一次迭代,重复以上操作,直到序列中每个神经元对所有样本的方差都低于阈值后时停止。
9.根据权利要求1所述的一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法,其特征在于,所述步骤S5具体为:将降维后的验证集输入到训练过的双向长短时记忆网络模型中,通过双向长短时记忆网络提取测试样本的主要特征,然后将这些主要特征输入到全连接层中,再输入到最后一层输出层中,输出的值代表轴承故障类型,即预测出滚动轴承的故障类型。
10.根据权利要求1所述的一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法,其特征在于,所述步骤S4中采用训练集对双向长短时记忆网络模型进行训练的过程为:将划分的训练集放进深度长短时记忆网络的输入端,利用双向长短时记忆网络对数据进行自适应的特征提取,在提取之后输入到全连接层,最终通过softmax函数从输出层输出预测的结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011351795.2A CN112632466B (zh) | 2020-11-26 | 2020-11-26 | 一种基于深度双向长短时记忆网络的轴承故障预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011351795.2A CN112632466B (zh) | 2020-11-26 | 2020-11-26 | 一种基于深度双向长短时记忆网络的轴承故障预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112632466A true CN112632466A (zh) | 2021-04-09 |
CN112632466B CN112632466B (zh) | 2024-01-23 |
Family
ID=75304017
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011351795.2A Active CN112632466B (zh) | 2020-11-26 | 2020-11-26 | 一种基于深度双向长短时记忆网络的轴承故障预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112632466B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116756881A (zh) * | 2023-08-21 | 2023-09-15 | 人工智能与数字经济广东省实验室(广州) | 一种轴承剩余使用寿命预测方法、装置及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7430546B1 (en) * | 2003-06-07 | 2008-09-30 | Roland Erwin Suri | Applications of an algorithm that mimics cortical processing |
CN109344517A (zh) * | 2018-10-14 | 2019-02-15 | 毛述春 | 一种新能源汽车的高压绝缘故障诊断方法 |
CN109883699A (zh) * | 2018-12-20 | 2019-06-14 | 上海理工大学 | 一种基于长短时记忆网络的滚动轴承剩余寿命预测方法 |
CN109978080A (zh) * | 2018-04-16 | 2019-07-05 | 北京工业大学 | 一种基于判别矩阵变量受限玻尔兹曼机的图像识别方法 |
CN110146293A (zh) * | 2019-06-04 | 2019-08-20 | 昆明理工大学 | 一种基于pca与elm的滚动轴承故障诊断方法 |
CN110647911A (zh) * | 2019-08-13 | 2020-01-03 | 南京航空航天大学 | 一种基于主成分分析和深度信念网络的轴承故障诊断方法 |
CN110689075A (zh) * | 2019-09-26 | 2020-01-14 | 北京工业大学 | 基于多算法融合的制冷设备的自适应阈值的故障预测方法 |
CN111259717A (zh) * | 2019-10-21 | 2020-06-09 | 杭州安脉盛智能技术有限公司 | 一种旋转设备状态异常判断方法及*** |
CN111562108A (zh) * | 2020-05-09 | 2020-08-21 | 浙江工业大学 | 一种基于cnn和fcmc的滚动轴承智能故障诊断方法 |
-
2020
- 2020-11-26 CN CN202011351795.2A patent/CN112632466B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7430546B1 (en) * | 2003-06-07 | 2008-09-30 | Roland Erwin Suri | Applications of an algorithm that mimics cortical processing |
CN109978080A (zh) * | 2018-04-16 | 2019-07-05 | 北京工业大学 | 一种基于判别矩阵变量受限玻尔兹曼机的图像识别方法 |
CN109344517A (zh) * | 2018-10-14 | 2019-02-15 | 毛述春 | 一种新能源汽车的高压绝缘故障诊断方法 |
CN109883699A (zh) * | 2018-12-20 | 2019-06-14 | 上海理工大学 | 一种基于长短时记忆网络的滚动轴承剩余寿命预测方法 |
CN110146293A (zh) * | 2019-06-04 | 2019-08-20 | 昆明理工大学 | 一种基于pca与elm的滚动轴承故障诊断方法 |
CN110647911A (zh) * | 2019-08-13 | 2020-01-03 | 南京航空航天大学 | 一种基于主成分分析和深度信念网络的轴承故障诊断方法 |
CN110689075A (zh) * | 2019-09-26 | 2020-01-14 | 北京工业大学 | 基于多算法融合的制冷设备的自适应阈值的故障预测方法 |
CN111259717A (zh) * | 2019-10-21 | 2020-06-09 | 杭州安脉盛智能技术有限公司 | 一种旋转设备状态异常判断方法及*** |
CN111562108A (zh) * | 2020-05-09 | 2020-08-21 | 浙江工业大学 | 一种基于cnn和fcmc的滚动轴承智能故障诊断方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116756881A (zh) * | 2023-08-21 | 2023-09-15 | 人工智能与数字经济广东省实验室(广州) | 一种轴承剩余使用寿命预测方法、装置及存储介质 |
CN116756881B (zh) * | 2023-08-21 | 2024-01-05 | 人工智能与数字经济广东省实验室(广州) | 一种轴承剩余使用寿命预测方法、装置及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112632466B (zh) | 2024-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Marei et al. | Transfer learning enabled convolutional neural networks for estimating health state of cutting tools | |
CN109766930B (zh) | 一种基于dcnn模型的矿井机械设备的剩余寿命预测方法 | |
Wang et al. | Temporal convolutional network with soft thresholding and attention mechanism for machinery prognostics | |
CN113255848B (zh) | 基于大数据学习的水轮机空化声信号辨识方法 | |
CN111562108A (zh) | 一种基于cnn和fcmc的滚动轴承智能故障诊断方法 | |
CN113486578B (zh) | 一种工业过程中设备剩余寿命的预测方法 | |
CN115017945A (zh) | 基于增强型卷积神经网络的机械故障诊断方法和诊断*** | |
CN110647911A (zh) | 一种基于主成分分析和深度信念网络的轴承故障诊断方法 | |
CN110561191A (zh) | 基于pca与自编码器的数控机床刀具磨损数据处理方法 | |
Tian et al. | Deep learning-based open set multi-source domain adaptation with complementary transferability metric for mechanical fault diagnosis | |
CN115358259A (zh) | 一种基于自学习的无监督跨工况轴承故障诊断方法 | |
CN114118219A (zh) | 基于数据驱动的长期加电设备健康状态实时异常检测方法 | |
Netzer et al. | Intelligent anomaly detection of machine tools based on mean shift clustering | |
CN110956331A (zh) | 数字工厂运营状态预测方法、***、装置 | |
CN112632466A (zh) | 一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法 | |
CN116383747A (zh) | 基于多时间尺度深度卷积生成对抗网络的异常检测方法 | |
Borhana et al. | Fault detection of bearing using support vector machine-SVM | |
Xiao et al. | Support evidence statistics for operation reliability assessment using running state information and its application to rolling bearing | |
CN116361723A (zh) | 一种基于多尺度特征和注意力的轴承故障诊断分类方法 | |
Wei et al. | Research on tool wear state identification method driven by multi-source information fusion and multi-dimension attention mechanism | |
Xing et al. | An improved multidimensional distance Siamese network for bearing fault diagnosis with few labelled data | |
Liu et al. | Performance similarity based method for enhanced prediction of manufacturing process performance | |
CN115556099B (zh) | 一种可持续学习的工业机器人故障诊断***及方法 | |
Joshi et al. | A Comparative Study of CNN Architectures for Remaining Useful Life Estimation | |
Agung’J et al. | A multi-domain tool state classifier model for computer numerically controlled machining |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |