CN113591638A - 一种基于卷积胶囊网络的行星齿轮箱故障诊断方法 - Google Patents
一种基于卷积胶囊网络的行星齿轮箱故障诊断方法 Download PDFInfo
- Publication number
- CN113591638A CN113591638A CN202110818877.1A CN202110818877A CN113591638A CN 113591638 A CN113591638 A CN 113591638A CN 202110818877 A CN202110818877 A CN 202110818877A CN 113591638 A CN113591638 A CN 113591638A
- Authority
- CN
- China
- Prior art keywords
- layer
- capsule
- convolution
- fault
- pooling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000002775 capsule Substances 0.000 title claims abstract description 130
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000003745 diagnosis Methods 0.000 title claims abstract description 36
- 238000011176 pooling Methods 0.000 claims abstract description 54
- 239000013598 vector Substances 0.000 claims abstract description 42
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 18
- 230000036541 health Effects 0.000 claims abstract description 13
- 238000000605 extraction Methods 0.000 claims abstract description 9
- 230000007246 mechanism Effects 0.000 claims abstract description 7
- 230000009467 reduction Effects 0.000 claims abstract description 5
- 230000006870 function Effects 0.000 claims description 36
- 238000012549 training Methods 0.000 claims description 30
- 239000011159 matrix material Substances 0.000 claims description 27
- 238000012360 testing method Methods 0.000 claims description 12
- 230000004913 activation Effects 0.000 claims description 10
- 238000009826 distribution Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 8
- 210000002569 neuron Anatomy 0.000 claims description 7
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 5
- 230000006835 compression Effects 0.000 claims description 3
- 238000007906 compression Methods 0.000 claims description 3
- 230000008878 coupling Effects 0.000 claims description 3
- 238000010168 coupling process Methods 0.000 claims description 3
- 238000005859 coupling reaction Methods 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 230000003862 health status Effects 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000011946 reduction process Methods 0.000 claims description 3
- 230000008901 benefit Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 241001391944 Commicarpus scandens Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000002759 z-score normalization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/02—Gearings; Transmission mechanisms
- G01M13/021—Gearings
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/02—Gearings; Transmission mechanisms
- G01M13/028—Acoustic or vibration analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
本发明公开了一种基于卷积胶囊网络的行星齿轮箱故障诊断方法,属于故障诊断领域,包括以下步骤,S1、获取多种健康状态下的行星齿轮箱数据,并构建样本集;S2、利用卷积池化结构实现故障特征的自动提取与降维;S3、通过胶囊结构矢量化表示特征并传递信息,同时采用动态路由机制计算不同胶囊层向量之间的相关度;S4、通过间隔损失函数与输入数据不断优化模型参数,实现对不同齿轮部件故障的精准智能诊断。本发明结合卷积神经网络和胶囊网络提出一种能提高其故障诊断能力的网络模型,效率高。
Description
技术领域
本发明属于故障诊断领域,涉及行星齿轮箱的故障诊断技术领域,尤其涉及一种基于卷积胶囊网络的行星齿轮箱故障诊断方法。
背景技术
行星齿轮箱是大型机械设备的核心传动环节,由于其服役环境的严酷性,如存在工况频繁变化、重载、极端天气等诸多因素,致使行星齿轮***内部关键部件极易发生故障,进而“牵一发而动全身”,引发灾难性事故。因此,开展行星齿轮箱的故障诊断研究,对于保障大型机械设备安全稳定运行、避免人民生命财产损失具有重要意义。
自深度学习问世以来,展现出强大的特征自动学习与提取能力,已广泛运用于图像识别、自然语言处理、语音识别、故障诊断等领域。典型的深度学习方法,如卷积神经网络(Convolution Neural Network,CNN)、生成对抗网络(Generative AdversarialNetworks,GAN)、深度信念网络(Deep Belief Network,DBN)等逐步拓展至行星齿轮箱的故障诊断方法之中:有研究人员通过CNN模型对不同健康状态的行星轮故障进行诊断;还有研究人员提出了一种采用堆叠降噪自动编码器作为判别器的GAN诊断模型,对多种不同健康状态的太阳轮进行诊断,在少量样本与噪声条件下呈现出较强的诊断能力;还有研究人员基于蝗虫算法提出了一种参数优化的DBN方法,对单个齿轮的多种故障类型进行识别。当前,以深度学习算法为核心的诊断模式正得到学者们的广泛关注,然而当前研究大多围绕单类齿轮部件的不同故障开展。鉴于行星齿轮箱中齿轮故障发生部位与形式多样,仅开展单类齿轮的故障诊断难以全面保障机械设备的安全运行。特别是以CNN为核心的深度学习模型,虽然对单一部件的故障识别取得了不错的效果,但应用于包含不同部件的故障数据时,恐难保证较高的诊断能力。
2017年胶囊网络(Capsule Network,CN)模型被首次提出,突破了传统标量神经元传递信息的片面性,以向量作为网络的输入和输出,进一步挖掘出特征的空间信息。近年来,胶囊网络表现出强大的细节特征提取能力,已在机械设备故障诊断领域中初露锋芒。然而,当前国内外少有研究人员将胶囊网络应用于行星齿轮箱的故障诊断之中。
发明内容
本部分的目的是在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述背景技术描述中存在的问题,提出了本发明,因此,本发明其中一个目的是提供一种基于卷积胶囊网络的行星齿轮箱故障诊断方法,结合卷积神经网络和胶囊网络提出一种能提高其故障诊断能力的网络模型,效率高。
为解决上述技术问题,本发明采用的技术方案是:一种基于卷积胶囊网络的行星齿轮箱故障诊断方法,包括以下步骤,
S1、获取多种健康状态下的行星齿轮箱数据,并构建样本集;
S2、利用卷积池化结构实现故障特征的自动提取与降维;
S3、通过胶囊结构矢量化表示特征并传递信息,同时采用动态路由机制计算不同胶囊层向量之间的相关度;
S4、通过间隔损失函数与输入数据不断优化模型参数,实现对不同齿轮部件故障的精准智能诊断。
进一步的,卷积胶囊网络模型包括9层:1个输入层、2个卷积层、2个池化层、1个Dropout层、1个预胶囊层、1个数字胶囊层和1个输出层,其中:
输入层:将原始数据经过z-score标准化处理后作为卷积胶囊网络输入数据,标准化公式为:
卷积层1:采用宽卷积核提取输入特征,用以降低噪声的影响;
卷积层2:采用大量窄卷积核,充分提取特征的底层特性;
池化层:每个卷积层后均附有一池化层,用于降低模型训练参数,提高训练速度,;
Dropout层:用于舍弃部分神经元防止训练阶段过拟合;
预胶囊层:包含卷积运算,同时将卷积结果以矢量形式构建胶囊作为数字胶囊层的输入;
数字胶囊层:通过动态路由机制计算胶囊层之间的相关度实现对故障特征的精确归类;
输出层:对输出向量进行二范数求解,得到不同故障类型的概率分布。
进一步的,卷积胶囊网络模型采用间隔损失函数,其表达式为:
Lk=Tkmax(0,m+-||vk||)2+λ(1-Tk)max(0,||vk||-m-)2
式中:下标k为故障类别k;Lk为类别k的间隔损失;Tk为分类指示函数(分类正确取1,否则取0);vk表示识别为故障类别k的概率;m为上界,取0.9;m为下界,取0.1;为比例系数,取0.5,总损失为各样例损失之和。
进一步的,将原始数据经过z-score标准化处理后作为卷积胶囊网络输入数据,标准化公式为:
进一步的,在S2中,原始数据z-score标准化处理后输入卷积层,通过卷积运算与激活函数实现对输入数据的特征提取:首先,通过n个维度相同的卷积核对输入数据进行卷积运算,同时附加偏置项得到卷积结果;然后,利用激活函数对卷积结果进行非线性映射,输出n个特征矩阵,计算公式如下所示:
进一步的,在S2中,提取出的初始特征输入至池化层,通过池化运算实现对特征矩阵的降维过程:将卷积层的输出数据无重叠、等宽度的划分为q个池化单元,对每个单元内的元素进行池化运算,得到池化层的输出特征矩阵。
进一步的,使用的池化运算为最大池化(Max Pooling),池化过程表达式为:
元素经过池化运算后,输入Dropout层进行处理,舍弃部分神经元防止训练阶段过拟合;
其中Dropout比率=0.25。
进一步的,数据通过Dropout层后进入预胶囊层,将卷积结果以矢量形式构建胶囊作为数字胶囊层的输入,计算公式如下所示:
其中,g1(t)是t时刻胶囊网络卷积层的输出;ei(t)为t时刻初级胶囊层的输出,是一系列的8维向量;为t时刻胶囊网络卷积层的权重矩阵和偏置向量;为t时刻初级胶囊层的权重矩阵和偏置向量;relu()为Rectified Linear Unit。
进一步的,通过压缩与动态路由算法对初级胶囊层的输出进行处理,得到数字胶囊层的输出,处理的具体公式为:
其中,vj(t)是t时刻数字胶囊层第j个胶囊的输出,j∈[0,7]它是每一种行星齿轮箱健康状态所对应的索引值;lj(t)是t时刻从初级胶囊层到数字胶囊层的总输入向量;为t时刻预测向量,通过将初级胶囊层的输出乘以一个权重矩阵Wij(t)得到,i为初级胶囊层输出8维向量的个数;aij(t)为t时刻的耦合系数;bij(t)为t时刻动态路由算法的迭代更新参数,初始值为0;r为动态路由算法的迭代次数;
计算向量vj(t)的长度,并比较当前t时刻所有向量长度的最大值,再将最长向量的索引值对应的电机状态作为当前数据所对应的行星轮或太阳轮的状态,并输出齿轮状态。
进一步的,根据数字胶囊层的输出vj(t)搭建用于优化故障诊断模型的损失函数,其计算表达式如下所示:
Lk(t)=Tk(t)max(0,m+-||vk(t)||)2+λ(1-Tk(t))max(0,||vk(t)||-m-)2
式中:下标k为故障类别k;Lk(t)为类别k的间隔损失;Tk(t)为分类指示函数(分类正确取1,否则取0);vk(t)表示识别为故障类别k的概率;m为上界,取0.9;m为下界,取0.1;为比例系数,取0.5。总损失为各样例损失之和;
计算t时刻的损失函数值Lk(t),再与t-1时刻的损失函数值Lk(t-1)进行比较,如果Lk(t)小于Lk(t-1),则利用梯度下降法直接优化卷积神经网络和胶囊网络的权重及偏置;否则,则利用Adam Optimizer优化器优化卷积神经网络和胶囊网络的权重及偏置;
判断当前迭代次数t是否达到最大迭代次数T,如果满足,则迭代停止,将本次更新后的权重及偏置作为卷积胶囊网络的参数,然后进行最后的状态输出;否则,将当前迭代次数t自加1,再返回卷积层1,继续选取下一Batch进行训练;
将采集到的行星齿轮箱振动数据按比例划分为训练集和测试集,然后输入至模型,从而输出行星齿轮箱健康状态概率分布。
与现有技术相比,本发明具有的优点和积极效果如下。
1、本发明提出一种故障诊断方法,可针对行星齿轮箱不同齿轮部件的多类故障进行诊断,实现从原始数据到故障类别的“端到端”自动诊断;
2、本发明结合了卷积池化结构对故障特征的深度提取能力,以及胶囊结构矢量化挖掘特征空间信息的特点,实现了对行星齿轮箱故障的精确智能诊断;
3、相比传统卷积神经网络与胶囊网络,本文提出的卷积胶囊网络对单类部件多故障、多类部件多故障数据混合条件下具有更高的诊断准确率,具有良好的应用前景。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本发明公开的一种基于强化胶囊网络的行星齿轮箱故障诊断方法的一种具体实施方式的流程图;
图2为本发明卷积胶囊网络模型结构图;
图3为健康状态和7种故障状态的行星齿轮箱原始振动信号波形图;
图4为本发明卷积胶囊网络对于训练集、验证集的诊断准确率、损失曲线图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸
再次,需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”等的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以通过具体情况理解上述术语在本发明中的具体含义。
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明的具体实施例做详细说明。
如图1所示,一种基于卷积胶囊网络的行星齿轮箱故障诊断方法,包括如下步骤:
S1、获取多种健康状态下的行星齿轮箱数据,并构建样本集;
S2、利用卷积池化结构实现故障特征的自动提取与降维;
S3、通过胶囊结构矢量化表示特征并传递信息,同时采用动态路由机制计算不同胶囊层向量之间的相关度;
S4、通过间隔损失函数与输入数据不断优化模型参数,实现对不同齿轮部件故障的精准智能诊断。
本发明提出的卷积胶囊网络,其主要结构如图2所示,包括:输入层,卷积层,池化层,Dropout层,预胶囊层,数字胶囊层和输出层。其中所述的输入层将原始数据经过z-score标准化处理后作为卷积胶囊网络输入数据,所述的卷积层依次采用宽卷积核提取输入特征和大量窄卷积核,所述的Dropout层用于舍弃部分神经元防止训练阶段过拟合,所述的预胶囊层将卷积结果以矢量形式构建胶囊作为数字胶囊层的输入,所述的数字胶囊层通过动态路由机制计算胶囊层之间的相关度实现对故障特征的精确归类,所述的输出层对输出向量进行二范数求解,得到不同故障类型的概率分布。
具体的:
输入层z-score标准化处理的计算公式为:
原始数据z-score标准化处理后输入卷积层,通过卷积运算与激活函数实现了对输入数据的特征提取:首先,通过n个维度相同的卷积核对输入数据进行卷积运算,同时附加偏置项得到卷积结果;然后,利用激活函数对卷积结果进行非线性映射,输出n个特征矩阵,计算公式如下所示:
提取出的初始特征输入至池化层,通过池化运算实现对特征矩阵的降维过程:将卷积层的输出数据无重叠、等宽度的划分为q个池化单元,对每个单元内的元素进行池化运算,得到池化层的输出特征矩阵。使用的池化运算为最大池化(Max Pooling),池化过程表达式为:
元素经过池化运算后,输入Dropout层进行处理,舍弃部分神经元防止训练阶段过拟合;
其中Dropout比率=0.25。
数据通过Dropout层后进入预胶囊层,将卷积结果以矢量形式构建胶囊作为数字胶囊层的输入,计算公式如下所示:
其中,g1(t)是t时刻胶囊网络卷积层的输出;ei(t)为t时刻初级胶囊层的输出,是一系列的8维向量;为t时刻胶囊网络卷积层的权重矩阵和偏置向量;为t时刻初级胶囊层的权重矩阵和偏置向量;relu()为Rectified Linear Unit;
通过压缩与动态路由算法对初级胶囊层的输出进行处理,得到数字胶囊层的输出,处理的具体公式为:
其中,vj(t)是t时刻数字胶囊层第j个胶囊的输出,j∈[0,7]它是每一种行星齿轮箱健康状态所对应的索引值;lj(t)是t时刻从初级胶囊层到数字胶囊层的总输入向量;为t时刻预测向量,通过将初级胶囊层的输出乘以一个权重矩阵Wij(t)得到,i为初级胶囊层输出8维向量的个数;aij(t)为t时刻的耦合系数;bij(t)为t时刻动态路由算法的迭代更新参数,初始值为0;r为动态路由算法的迭代次数。
计算向量vj(t)的长度,并比较当前t时刻所有向量长度的最大值,再将最长向量的索引值对应的电机状态作为当前数据所对应的行星轮或太阳轮的状态,并输出齿轮状态。
根据数字胶囊层的输出vj(t)搭建用于优化故障诊断模型的损失函数,其计算表达式如下所示:
Lk(t)=Tk(t)max(0,m+-||vk(t)||)2+λ(1-Tk(t))max(0,||vk(t)||-m-)2
式中:下标k为故障类别k;Lk(t)为类别k的间隔损失;Tk(t)为分类指示函数(分类正确取1,否则取0);vk(t)表示识别为故障类别k的概率;m为上界,取0.9;m为下界,取0.1;为比例系数,取0.5。总损失为各样例损失之和。
计算t时刻的损失函数值Lk(t),再与t-1时刻的损失函数值Lk(t-1)进行比较,如果Lk(t)小于Lk(t-1),则利用梯度下降法直接优化卷积神经网络和胶囊网络的权重及偏置;否则,则利用Adam Optimizer优化器优化卷积神经网络和胶囊网络的权重及偏置,AdamOptimizer优化器优化的具体公式为:
其中,g(t)为t时刻的梯度;mt为指数移动均值;ht为平方梯度;β1、β2为常数,β1、β2∈[0,1];∈为常数,默认为1e-8;θt表示更新后的模型参数,包括卷积神经网络和胶囊网络更新后的权重及偏置。
判断当前迭代次数t是否达到最大迭代次数T,如果满足,则迭代停止,将本次更新后的权重及偏置作为卷积胶囊网络的参数,然后进行最后的状态输出;否则,将当前迭代次数t自加1,再返回卷积层1,继续选取下一Batch进行训练;
将采集到的行星齿轮箱振动数据按比例划分为训练集和测试集,然后输入至模型,从而输出行星齿轮箱健康状态概率分布。
为了验证本发明公开的方法的有效性,使用动力故障与故障传动实验台(DynamciDrivetrian Simulator,DDS)采集行星齿轮箱不同故障下的振动信号。实验台主要包括一台伺服驱动电机;输入、输出扭矩编码器各一个;一台行星齿轮箱;水平、垂直两个方向加速度传感器(100mv/g)获取数据;一台定轴齿轮箱以及一台可编程磁力制动器。
表1 行星齿轮箱装配齿轮参数
齿轮参数 | 数值 |
太阳轮齿数 | 28 |
行星轮齿数 | 36 |
齿圈齿数 | 100 |
行星轮数 | 4 |
在电动机转速分别为1800r/min和3000r/min两种工况下,分别采集8类齿轮健康状态的振动数据,采集时间为19.2s,采样频率设置为10240Hz。将振动信号以长度为1024个数据点截取为一个样本,并按照4:1的比例划分训练集和测试集,数据分布如表2所示。
表2 训练集、测试集数据分布
上述8类故障类型样本的时域信号如图3所示。
本发明设计针对太阳轮与行星轮故障数据混合情况下的故障诊断实验分析,样本分布如表3所示。
表3 齿轮故障样本分布表
数据集的标签采用“独热(one-hot)”的编码方式:对于X种类别的故障诊断,将标签转化为X维的向量,并且其中一个值为1,其余均为0,每类故障标签互异。
本发明的卷积胶囊网络模型的输入样本维度为1024×1,输出维度为故障类型数量。激活函数采用Relu函数,损失函数采用间隔损失(Margin Loss)函数。模型具体结构参数设置如表4所示。
表4 卷积胶囊网络模型结构参数设置
利用本发明针对8类健康状态的行星齿轮箱进行故障诊断,将训练集按9:1的比例划分为训练集和验证集,两类网络设置单次处理数据量batch-size为10,共训练50个epoch,采用Adam(Adaptive moment estimation)优化函数,学习率r设置为0.001。
如图4所示,给出了在电动机转速为1800r/min(左)、3000r/min(右)工况下,卷积胶囊网络模型对8类健康状态的行星齿轮箱进行故障诊断的训练和验证过程。
为验证本发明所提方法的优势,对比分析卷积神经网络(CNN)、传统胶囊网络(CN),利用本发明针对8类健康状态的行星齿轮箱进行多类故障诊断。为使实验结果更具信服力,对比实验采用10次十折交叉验证的训练方式,将训练集等分为10份,每次不重复的选用9份用于训练,1份用于验证。设置单次训练数据量batch-size为10,每次训练5个epochs,10次共训练50个epoch。两类模型均采用Adam算法对模型参数进行优化,学***均值,3类模型的诊断结果如表5所示。
表5不同齿轮部件多类故障测试准确率(%)
正如表5所示,在电动机转速为1800r/min工况下,TC-CN模型测试准确率达到98.19%,优于CNN模型的93.01%与CN模型的92.96%;在电动机转速为3000r/min工况下TC-CN模型达到了97.36%的测试准确率,分别高于CN模型4.47%与CNN模型10.98%。
实验结果表明,本发明的卷积胶囊网络模型对于不同齿轮部件的多类故障具有更高的识别精度。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (10)
1.一种基于卷积胶囊网络的行星齿轮箱故障诊断方法,其特征在于:包括以下步骤,
S1、获取多种健康状态下的行星齿轮箱数据,并构建样本集;
S2、利用卷积池化结构实现故障特征的自动提取与降维;
S3、通过胶囊结构矢量化表示特征并传递信息,同时采用动态路由机制计算不同胶囊层向量之间的相关度;
S4、通过间隔损失函数与输入数据不断优化模型参数,实现对不同齿轮部件故障的精准智能诊断。
2.根据权利要求1所述的一种基于卷积胶囊网络的行星齿轮箱故障诊断方法,其特征在于:卷积胶囊网络模型包括9层:1个输入层、2个卷积层、2个池化层、1个Dropout层、1个预胶囊层、1个数字胶囊层和1个输出层,其中:
输入层:将原始数据经过z-score标准化处理后作为卷积胶囊网络输入数据,标准化公式为:
卷积层1:采用宽卷积核提取输入特征,用以降低噪声的影响;
卷积层2:采用大量窄卷积核,充分提取特征的底层特性;
池化层:每个卷积层后均附有一池化层,用于降低模型训练参数,提高训练速度,;
Dropout层:用于舍弃部分神经元防止训练阶段过拟合;
预胶囊层:包含卷积运算,同时将卷积结果以矢量形式构建胶囊作为数字胶囊层的输入;
数字胶囊层:通过动态路由机制计算胶囊层之间的相关度实现对故障特征的精确归类;
输出层:对输出向量进行二范数求解,得到不同故障类型的概率分布。
3.根据权利要求1所述的一种基于卷积胶囊网络的行星齿轮箱故障诊断方法,其特征在于:卷积胶囊网络模型采用间隔损失函数,其表达式为:
Lk=Tkmax(0,m+-||vk||)2+λ(1-Tk)max(0,||vk||-m-)2
式中:下标k为故障类别k;Lk为类别k的间隔损失;Tk为分类指示函数(分类正确取1,否则取0);vk表示识别为故障类别k的概率;m为上界,取0.9;m为下界,取0.1;为比例系数,取0.5,总损失为各样例损失之和。
6.根据权利要求1所述的一种基于卷积胶囊网络的行星齿轮箱故障诊断方法,其特征在于:在S2中,提取出的初始特征输入至池化层,通过池化运算实现对特征矩阵的降维过程:将卷积层的输出数据无重叠、等宽度的划分为q个池化单元,对每个单元内的元素进行池化运算,得到池化层的输出特征矩阵。
9.根据权利要求6所述的一种基于卷积胶囊网络的行星齿轮箱故障诊断方法,其特征在于:通过压缩与动态路由算法对初级胶囊层的输出进行处理,得到数字胶囊层的输出,处理的具体公式为:
其中,vj(t)是t时刻数字胶囊层第j个胶囊的输出,j∈[0,7]它是每一种行星齿轮箱健康状态所对应的索引值;lj(t)是t时刻从初级胶囊层到数字胶囊层的总输入向量;为t时刻预测向量,通过将初级胶囊层的输出乘以一个权重矩阵Wij(t)得到,i为初级胶囊层输出8维向量的个数;aij(t)为t时刻的耦合系数;bij(t)为t时刻动态路由算法的迭代更新参数,初始值为0;r为动态路由算法的迭代次数;
计算向量vj(t)的长度,并比较当前t时刻所有向量长度的最大值,再将最长向量的索引值对应的电机状态作为当前数据所对应的行星轮或太阳轮的状态,并输出齿轮状态。
10.根据权利要求1所述的一种基于卷积胶囊网络的行星齿轮箱故障诊断方法,其特征在于:根据数字胶囊层的输出vj(t)搭建用于优化故障诊断模型的损失函数,其计算表达式如下所示:
Lk(t)=Tk(t)max(0,m+-||vk(t)||)2+λ(1-Tk(t))max(0,||vk(t)||-m-)2
式中:下标k为故障类别k;Lk(t)为类别k的间隔损失;Tk(t)为分类指示函数(分类正确取1,否则取0);vk(t)表示识别为故障类别k的概率;m为上界,取0.9;m为下界,取0.1;为比例系数,取0.5。总损失为各样例损失之和;
计算t时刻的损失函数值Lk(t),再与t-1时刻的损失函数值Lk(t-1)进行比较,如果Lk(t)小于Lk(t-1),则利用梯度下降法直接优化卷积神经网络和胶囊网络的权重及偏置;否则,则利用Adam Optimizer优化器优化卷积神经网络和胶囊网络的权重及偏置;
判断当前迭代次数t是否达到最大迭代次数T,如果满足,则迭代停止,将本次更新后的权重及偏置作为卷积胶囊网络的参数,然后进行最后的状态输出;否则,将当前迭代次数t自加1,再返回卷积层1,继续选取下一Batch进行训练;
将采集到的行星齿轮箱振动数据按比例划分为训练集和测试集,然后输入至模型,从而输出行星齿轮箱健康状态概率分布。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110818877.1A CN113591638A (zh) | 2021-07-20 | 2021-07-20 | 一种基于卷积胶囊网络的行星齿轮箱故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110818877.1A CN113591638A (zh) | 2021-07-20 | 2021-07-20 | 一种基于卷积胶囊网络的行星齿轮箱故障诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113591638A true CN113591638A (zh) | 2021-11-02 |
Family
ID=78248351
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110818877.1A Pending CN113591638A (zh) | 2021-07-20 | 2021-07-20 | 一种基于卷积胶囊网络的行星齿轮箱故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113591638A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114227382A (zh) * | 2022-01-18 | 2022-03-25 | 湖北汽车工业学院 | 基于新型胶囊网络的刀具破损监测***及方法 |
CN114548153A (zh) * | 2022-01-21 | 2022-05-27 | 电子科技大学 | 基于残差-胶囊网络的行星齿轮箱故障诊断方法 |
CN114757239A (zh) * | 2022-06-15 | 2022-07-15 | 浙江大学 | 基于数据增强和胶囊神经网络的风机故障可迁移诊断方法 |
-
2021
- 2021-07-20 CN CN202110818877.1A patent/CN113591638A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114227382A (zh) * | 2022-01-18 | 2022-03-25 | 湖北汽车工业学院 | 基于新型胶囊网络的刀具破损监测***及方法 |
CN114548153A (zh) * | 2022-01-21 | 2022-05-27 | 电子科技大学 | 基于残差-胶囊网络的行星齿轮箱故障诊断方法 |
CN114757239A (zh) * | 2022-06-15 | 2022-07-15 | 浙江大学 | 基于数据增强和胶囊神经网络的风机故障可迁移诊断方法 |
CN114757239B (zh) * | 2022-06-15 | 2022-08-30 | 浙江大学 | 基于数据增强和胶囊神经网络的风机故障可迁移诊断方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113591638A (zh) | 一种基于卷积胶囊网络的行星齿轮箱故障诊断方法 | |
US20210270244A1 (en) | Method and system for fault diagnosis of gearbox of wind turbine generator | |
CN107702922B (zh) | 基于lcd与堆叠自动编码器的滚动轴承故障诊断方法 | |
CN113255078A (zh) | 一种样本不均衡条件下的轴承故障检测方法及装置 | |
CN113505655A (zh) | 面向数字孪生***的轴承故障智能诊断方法 | |
CN111810124A (zh) | 一种基于特征重标定残差卷积神经网络模型的抽油机井故障诊断方法 | |
CN112147432A (zh) | 基于注意力机制的BiLSTM模块、变压器状态诊断方法和*** | |
CN111413091A (zh) | 一种基于数据驱动的强噪声干扰下齿轮箱故障诊断方法 | |
CN116358871B (zh) | 基于图卷积网络的滚动轴承微弱信号复合故障诊断方法 | |
CN112257528A (zh) | 一种基于小波变换和密集连接扩张卷积神经网络的风电齿轮箱故障诊断方法 | |
CN112686372A (zh) | 基于深度残差gru神经网络的产品性能预测方法 | |
CN112305388B (zh) | 一种发电机定子绕组绝缘局部放电故障在线监测诊断方法 | |
CN114091504A (zh) | 一种基于生成对抗网络的旋转机械小样本故障诊断方法 | |
CN115859142A (zh) | 一种基于卷积变压器生成对抗网络的小样本滚动轴承故障诊断方法 | |
CN115204272A (zh) | 基于多采样率数据的工业***故障诊断方法与设备 | |
CN115099278A (zh) | 一种基于小波包时频图与ResNet迁移网络的设备状态诊断方法 | |
CN115290326A (zh) | 一种滚动轴承故障智能诊断方法 | |
CN116026569A (zh) | 释放源数据的机械设备无监督迁移智能故障诊断方法 | |
CN115221958A (zh) | 一种基于复合权重的机械设备选择性迁移故障诊断方法 | |
CN113758709A (zh) | 结合边缘计算和深度学习的滚动轴承故障诊断方法及*** | |
CN114354185B (zh) | 一种基于解耦网络的齿轮箱故障诊断方法 | |
CN116910645A (zh) | 基于改进型经验小波与小波包卷积神经网络相结合的电梯轴承部件故障诊断方法 | |
CN116644273A (zh) | 基于可释性乘法卷积网络的故障诊断方法及*** | |
CN113591625B (zh) | 一种不平衡样本重要性加权的齿轮箱故障诊断方法 | |
CN112414446B (zh) | 一种数据驱动的变速器传感器故障诊断方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |