CN116821762A - 一种基于多尺度图注意力融合网络的机械故障诊断方法 - Google Patents
一种基于多尺度图注意力融合网络的机械故障诊断方法 Download PDFInfo
- Publication number
- CN116821762A CN116821762A CN202310793938.2A CN202310793938A CN116821762A CN 116821762 A CN116821762 A CN 116821762A CN 202310793938 A CN202310793938 A CN 202310793938A CN 116821762 A CN116821762 A CN 116821762A
- Authority
- CN
- China
- Prior art keywords
- attention
- layer
- scale
- graph
- fault diagnosis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000004927 fusion Effects 0.000 title claims abstract description 62
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000003745 diagnosis Methods 0.000 title claims abstract description 53
- 238000012549 training Methods 0.000 claims abstract description 43
- 238000012360 testing method Methods 0.000 claims abstract description 38
- 238000010586 diagram Methods 0.000 claims abstract description 17
- 230000004913 activation Effects 0.000 claims description 14
- 230000007246 mechanism Effects 0.000 claims description 11
- 230000009466 transformation Effects 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000005096 rolling process Methods 0.000 description 25
- 230000000694 effects Effects 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 6
- 238000010276 construction Methods 0.000 description 6
- 238000005457 optimization Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 4
- 101100184147 Caenorhabditis elegans mix-1 gene Proteins 0.000 description 3
- 238000002405 diagnostic procedure Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000013178 mathematical model Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000000547 structure data Methods 0.000 description 3
- 101100238610 Mus musculus Msh3 gene Proteins 0.000 description 2
- 101100412093 Schizosaccharomyces pombe (strain 972 / ATCC 24843) rec16 gene Proteins 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010892 electric spark Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 230000036346 tooth eruption Effects 0.000 description 2
- 241000834151 Notesthes Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000003754 machining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
Landscapes
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
本发明公开了一种基于多尺度图注意力融合网络的机械故障诊断方法,包括如下步骤:收集机械振动的数据,构建样本数据集,并将数据集分成训练集和测试集;将数据集的训练集和测试集依据样本间的余弦相似度分别构造为训练集族图和测试集族图;将训练集族图输入到搭建好的多尺度图注意力融合网络中训练网络,得到最佳故障诊断模型;将测试集族图输入最佳故障诊断模型中进行测试,评估模型性能;将待诊断的机械振动的数据输入到评估后的故障诊断模型中进行故障诊断。本发明所公开的方法可以在数据不平衡和强噪声条件下获取较高的故障诊断准确率。
Description
技术领域
本发明涉及机械故障诊断技术领域,特别涉及一种基于多尺度图注意力融合网络的机械故障诊断方法。
背景技术
旋转机械作为现代制造设备的关键部件,其安全运行直接影响到工业***的稳定性。在旋转机械中,轴承将承受巨大且不断变化的载荷,这将导致失效。统计表明,由轴承引起的旋转机械故障率高达40%。为了减少设备在生产过程中的损耗,增加设备的稳定性,轴承状态监测和故障诊断技术已成为学者和工程师关注的中心问题。
目前故障诊断方法可以分为三类:基于模型的诊断方法、基于信号处理的诊断方法和数据驱动的诊断方法。基于物理模型的方法需要建立详细的数学模型来描述***的物理特征和故障模式。而基于信号处理的故障诊断方法主要采用时频域分析、小波包变换、包络谱分析、高阶统计量分析等技术对信号进行分析和处理,从而进行故障诊断。这两种方法对高质量的专业领域知识过于依赖。此外,对于复杂的机械***而言,建立数学模型变得非常困难,这需要大量的计算和时间成本同时降低了故障诊断的整体效率。
基于数据驱动技术的故障诊断方法不需要建立复杂的数学模型,而是构建特征提取模型和分类器,并利用大量历史数据对模型进行优化。这种诊断方法效果良好,可适用于复杂机械设备的故障诊断。近年来,基于数据驱动的方法在故障诊断领域变得很流行并取得了很多的研究成果。
其中,基于图神经网络的方法由于可以将信号之间的几何关系信息引入到机器故障诊断模型中,最近引起了人们的广泛关注。图神经网络可以将图的中心节点和相邻节点的特征聚合成增强的节点特征,通过注意力机制自动学习节点之间不同的权值,并根据学习到的权值对信息进行聚合,从而扩大有用信息的影响,忽略干扰信息的影响,实现节点分类。Zhang等人将收集到的声信号转换为具有几何结构的图形,应用图卷积网络实现了对滚动轴承的故障诊断。Sun等人使用提出的多通道残差网络(MCRN)来提取信号中的弱特征,通过自动编码器(AE)图形生成层生成信号和不同尺度的有限图形数据,最终实现了基于图卷积网络的故障诊断。Jiang等人使用动态时间翘曲方法将原始振动信号转化为图数据,将GAT首次应用于故障诊断领域。尽管现有的方法已经取得了较大的成功,但是上述提出的方法仍然存在很大的局限性:基于图神经网络(GNN)的传统故障诊断方法很难有效捕捉数据的局部和全局特征信息,并且大多数GNN模型未考虑相邻节点之间的固有差异,在工业场景中处理有限且带噪声的故障振动信号的能力较差。
发明内容
为解决上述技术问题,本发明提供了一种基于多尺度图注意力融合网络的机械故障诊断方法,以达到可以在数据不平衡和强噪声条件下获取较高准确率的故障诊断的目的。
为达到上述目的,本发明的技术方案如下:
一种基于多尺度图注意力融合网络的机械故障诊断方法,包括如下步骤:
步骤一,收集机械振动的数据,构建样本数据集,并将数据集分成训练集和测试集;
步骤二,将数据集的训练集和测试集依据样本间的余弦相似度分别构造为训练集族图和测试集族图;
步骤三,将训练集族图输入到搭建好的多尺度图注意力融合网络中训练网络,得到最佳故障诊断模型;
步骤四,将测试集族图输入最佳故障诊断模型中进行测试,评估模型性能;
步骤五,将待诊断的机械振动的数据输入到评估后的故障诊断模型中进行故障诊断。
上述方案中,步骤一中,将收集到的样本信号与相应的故障类型标签一起构建为样本数据集。
上述方案中,步骤二的具体方法如下:
Step1:对采集的数据进行归一化操作;
Step2:把归一化后的时间序列数据转换为频域数据;
Step3:依据样本间相似度选择相似度最高的n个节点作为族图中的祖先图Gancestor,其次,将这n个节点随机分为两组,对每一组都使用余弦相似度方法,得到各自的父图Gparent;最后,将每一个父图Gparent的n/2节点再次随机分成两组,对每一组分别使用余弦相似度方法获得各自的子图Gchild;Gancestor,Gparent,Gchild共同构成族图Gclan,并用作模型的输入。
上述方案中,步骤三中,所述多尺度图注意力融合网络包括输入层、多尺度特征融合层和节点分类输出层,所述多尺度特征融合层包括三个并行的不同注意力尺度的图注意力模块和一个特征融合模块,所述节点分类输出层包括两层全连接层以及LeakyReLU激活层和Dropout层。
上述方案中,所述图注意力模块包括图注意力层、BatchNomlization层、Dropout层和LeakyReLU激活层。
上述方案中,所述多尺度图注意力融合网络的损失函数选择交叉熵损失函数,其公式为:
Loss(p,q)=-∑p(x)log q(x)
其中,p(x)为训练集的标签,q(x)为网络预测的标签值。
上述方案中,输入层的输出尺寸为10×512×1,多尺度特征融合层输出尺寸为10×1024×3,节点分类输出层输出尺寸10×512,图注意力模块和节点分类输出层中Dropout层比率为0.6。
上述方案中,多尺度特征融合层的输出结果表示为:
其中,[·]表示连接算子;σ为Sigmoid激活函数;H1,H2,H3分别表示三个图注意力模块的图注意力层具有H1,H2,H3个相互独立的注意力机制;表示节点i与其邻域节点m在第h1,h2,h3个注意力机制下计算的归一化注意力系数;/>分别表示归一化注意力系数为/>所对应的线性变换加权矩阵;/>表示邻域节点m的节点特征,每个(·)表示来自不同尺度下的特征表示;h1,h2,h3分别表示三个图注意力模块的图注意力层的第h1,h2,h3个独立的注意力机制;/>表示图中节点i的邻域。
上述方案中,节点特征为F的图在多尺度图注意力融合网络的输出Y表示为:Y=FCL2(FCL1(Leaky_ReLU(MSFFL1(F)),
Leaky_ReLU(MSFFL2(F)),Leaky_ReLU(MSFFL3(F))))
其中,FCL1和FCL2为多尺度图注意力融合网络的全连接层,Leaky_ReLU为多尺度图注意力融合网络使用的激活函数,MSFFL1,MSFFL2,MSFFL3为多尺度图注意力融合网络搭建的多尺度特征融合层。
通过上述技术方案,本发明提供的一种基于多尺度图注意力融合网络的机械故障诊断方法具有如下有益效果:
1、针对于现有基于数据驱动的图神经网络方法仅能表示信号之间的几何关系信息,忽视了图结构数据的局部和全局特征信息的问题,本发明引入族图,通过将数据样本转换为具有多个信息尺度的族图,有效表示图结构数据的局部和全局信息,突破图结构数据的局部和全局特征信息不能同时表达的缺陷,较好的表征不同故障类型的代表性特征,提高特征提取能力。
2、针对现有大多数GNN模型未考虑相邻节点之间差异性的问题,本发明设计了多尺度图注意力融合网络(MSGAFN),将所设计的多尺度特征融合层与族图配合,在多个尺度自动学***衡和强噪声条件下的故障诊断精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例所公开的一种基于多尺度图注意力融合网络的机械故障诊断方法整体流程示意图;
图2为MSGAFN的网络结构图;
图3为族图构造流程图;
图4为图注意力模块结构图;
图5为不同尺度的注意力头数组合对MSGAFN的影响图;
图6为单尺度和多尺度构造图对模型的影响;
图7为轴承数据对比试验结果;
图8为轴承齿轮混合数据对比试验结果。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
本发明提供了一种基于多尺度图注意力融合网络的机械故障诊断方法,该方法主要用于通过检测收集到的轴承和齿轮振动信号,来判断轴承和齿轮是否故障以及故障的类型。该方法的整体流程图如图1所示。
为验证本发明所提出的MSGAFN网络结构的机械故障诊断方法在样本不平衡且存在强噪声场景下对轴承和齿轮故障诊断的效果,本次实验将采用两个数据集的数据,分别是东南大学(Southeast University,SEU)采集的齿轮箱数据集和凯斯西储大学(CaseWestern Reserve University,CWRU)轴承数据中心采集的12KHz驱动端数据。
该方法具体包括以下步骤:
S1:选择凯斯西储大学轴承数据中心采集的12KHz驱动端数据集和东南大学采集的齿轮箱数据集的部分数据。
具体地,实施例1使用的凯斯西储大学轴承数据中心采集12KHz驱动端部分数据采集包括以下步骤:
Step1:选择电动机驱动端的滚动轴承型号为SKF6205。
Step2:用电火花在电动机驱动端滚动轴承上加工单点损伤,损伤位置为滚动轴承的内圈和滚珠(损伤直径为0.007英寸、0.014英寸和0.021英寸),以及滚动轴承外圈的12点钟。
需要补充说明的是,利用电火花单点加工滚动轴承故障损伤可以模仿实际工况中的轴承损伤。常见的轴承损伤点在滚动轴承的外圈、内圈和滚珠上,而且损伤直径通常存在差异,这里设置内圈和滚珠的损伤直径为0.007英寸、0.014英寸和0.021英寸。由此一共有9种不同类型的滚动轴承故障。同时,还有一类没有任何损失的正常滚动轴承,因此一共有10类滚动轴承。
Step3:将振动传感器放置在电动机驱动端的SKF6205型号轴承座上方,并连接16通道的数据记录仪,从而构成对滚动轴承进行振动信号采集的采集***。
Step4:对同一类滚动轴承施加相同的单一负载,电动机驱动端的滚动轴承振动信号由16通道的数据记录仪在12KHZ的采样频率下进行采集。在本实施例中,为了验证本发明可以适用于不同的负载,一共设置了多种负载,分别为1HP、2HP。每一种负载下,均对10种类型的滚动轴承进行滚动轴承振动信号的采集。
Step5:针对每一种负载下采集到的10种类型的滚动轴承振动信号,分别将采集的滚动轴承振动信号按照设定的样本信号长度分割为一系列样本信号,即可将样本信号与相应的故障类型标签一起构建为样本数据集。
需要补充说明的是,本实施例中按照每个样本信号长度为1024个振动点进行分割,经过分割整理后,为了测试在不平衡样本场景,将不同类型样本设置多种数量,在每一种负载下,9类不同故障类型的滚动轴承分别有80个样本信号,正常滚动轴承有100个样本信号。为了模拟实际的工业场景,将2个负载下的样本信号进行混合,不同负载下相同故障类型看作一种标签,构成数据集Dbear,为了测试在强噪声环境下的模型诊断效果,为Dbear添加信噪比为-5,-6,-7,-8,-9,-10dB的高斯白噪声,得到数据集Dbear-5,Dbear-6,Dbear-7,Dbear-8,Dbear-9,Dbear-10;为了便于后续的模型训练和测试,将Dbear-5,Dbear-6,Dbear-7,Dbear-8,Dbear-9,Dbear-10按照相同的比例划分为训练集和测试集。
需要补充说明的是,每个负载9类不同故障类型的滚动轴承得到720个样本信号,正常滚动轴承得到100个样本信号,将两个负载下共计1640个滚动轴承振动信号进行混合得到Dbear,具体的数据集划分训练集和测试集的情况如表1所示。
表1
实施例2使用的东南大学采集的齿轮箱数据集的部分数据采集包括以下步骤:
Step1:从动力传动***动态模拟器(DDS)收集稳态信号。其中,轴承故障是由内圈、外圈,滚动体等位置的裂纹引起的。齿轮故障分为四种类型:削齿、缺齿、根部断层和表面断层;削齿和齿轮根部裂纹都是由裂纹引起的,但位置不同;缺齿故障是由于缺少轮齿引起的;表面磨损表明齿轮表面存在磨损。
收集的稳态信号包含轴承数据和齿轮数据的各五种健康状态:四种故障状态和一种健康状态。将齿轮故障和轴承故障相结合,形成一个包括四种齿轮故障、四种轴承故障,齿轮和轴承分别在健康状态的10分类混合数据集。
Step2:对轴承和齿轮施加相同的单一负载,使用动力传动***动态模拟器(DDS)进行数据采集。在本实施例中,为了验证本发明可以适用于不同的负载,一共设置了多种负载,分别为20HZ-0V和30HZ-2V。每一种负载下,均对10种类型的混合轴承和齿轮信号进行采集。
Step3:针对每一种负载下采集到的10种类型的轴承和齿轮振动信号,分别将其按照设定的样本信号长度分割为一系列样本信号,即可将样本信号与相应的故障类型标签一起构建为样本数据集。
具体地,本实施例中按照每个样本信号长度为1024个振动点进行分割,经过分割整理后,为了测试在不平衡样本场景,将不同类型样本设置多种数量,在每一种负载下,8类不同故障类型的轴承和齿轮分别有80个样本信号,2类正常类型的轴承和齿轮分别有100个样本信号。为了模拟实际的工业场景,将2个负载下的样本信号进行混合,不同负载下相同故障类型看作一种标签,构成数据集Dmix;为了测试在强噪声环境下的模型诊断效果,为Dmix添加信噪比为0,-1,-2,-3,-4,-5dB的高斯白噪声,得到数据集Dmix-0,Dmix-1,Dmix-2,Dmix-3,Dmix-4,Dmix-5;为了便于后续的模型训练和测试,将Dmix-0,Dmix-1,Dmix-2,Dmix-3,Dmix-4,Dmix-5按照相同的比例划分为训练集和测试集。
需要补充说明的是,每个负载8类不同故障类型的轴承和齿轮得到640个样本信号,2类正常类型的轴承和齿轮得到200个样本信号,将两个负载下共计1680个轴承和齿轮的振动信号进行混合得到Dmix,具体的数据集划分训练集和测试集的情况如表2所示。
表2
S2:将数据集的训练集和测试集依据样本间的余弦相似度分别构造为族图Gclan-train,Gclan-test;
具体地,构造族图的流程图如图3所示。构造族图Gclan的数据集在训练诊断轴承的神经网络时使用Dbear,在训练诊断齿轮和轴承混合的神经网络时使用Dmix。
构造Gclan的方法包括以下步骤:
Step1:对采集数据进行归一化操作;
需要补充说明的是,对采集数据进行归一化操作时使用Min-Max归一化方法。
Step2:把采集的时间序列数据转换为频域数据;
需要补充说明的是,时间序列数据转换为频域数据使用FFT(快速傅里叶变换)方法。
Step3:依据样本间相似度选择相似度最高的20个节点作为族图中的祖先图Gancestor,其次,将这20个节点随机分为两组,对每一组都使用余弦相似度方法,得到各自的父图Gparent。最后,将父图再次随机分成两组,对每一组分别使用余弦相似度方法获得各自的子图Gchild。Gancestor,Gparent,Gchild共同构成Gclan,并用作模型的输入。
需要补充说明的是,计算样本间相似度使用余弦相似度来估计节点间的距离,公式表示为:其中,/>是/>的邻域,∈是选择的半径长度。/>得到集合/>并定义阈值为0。如果相似度大于阈值,则两个节点之间将存在一条边ei。
S3:把Gclan-train输入MSGAFN网络模型进行训练,满足准确性要求后得到一个最佳的滚动轴承故障诊断模型。
具体地,搭建MSGAFN网络模型包括以下步骤:
Step1:设计一个多尺度特征融合层,将构造的Gclan用作输入进行多尺度特征提取并进行特征融合。多尺度特征融合层包括三个并行的不同注意力尺度的图注意力模块和一个特征融合模块。多尺度特征融合层对输入的Gclan进行多尺度特征提取,通过图注意力机制获得在三个尺度下输出特征的权重,将权重分别与其在各尺度下的输出特征相乘获得更具代表性的特征,记作Fearep1,Fearep2,Fearep3。通过LeakyReLU激活函数针对Fearep1,Fearep2,Fearep3完成非线性特征变换,然后所述代表性的特征在特征融合模块融合为增强的特征表示,记作Feaenhance,并将Feaenhance作为后续网络的输入。其中节点多尺度特征融合的输出结果表示为:
其中,[·]表示连接算子;σ为Sigmoid激活函数;H1,H2,H3分别表示三个图注意力模块的图注意力层具有H1,H2,H3个相互独立的注意力机制;表示节点i与其邻域节点m在第h1,h2,h3个注意力机制下计算的归一化注意力系数;/>分别表示归一化注意力系数为/>所对应的线性变换加权矩阵;/>表示邻域节点m的节点特征,每个(·)表示来自不同尺度下的特征表示;h1,h2,h3分别表示三个图注意力模块的图注意力层的第h1,h2,h3个独立的注意力机制;/>表示图中节点i的邻域。
需要补充说明的是,多尺度特征融合层的三种注意力头数设置为:H1,H2,H3的值分别为[4,8,16]。图注意力模块包括一个图注意力层,一个BatchNomlization层,一个Dropout层和一个LeakyReLU激活层组成。如图4所示,其中图注意力层计算节点之间的注意力权重决定不同节点的重要性,BatchNomlization层加速训练收敛、抑制过拟合,并改善模型的性能,Dropout层通过随机丢弃神经元来减少过拟合、提高模型鲁棒性,LeakyReLU激活层加速模型的收敛速度,增强模型的泛化能力。特征融合模块实现对三个注意力模块输出结果进行拼接以聚合多尺度特征。
Step2:设计节点分类输出层,包含两层全连接层以及LeakyReLU激活层和Dropout层。设置损失函数,完成多尺度图注意力融合网络的构建。
需要补充说明的是,损失函数选择交叉熵(Cross Entropy Loss)损失函数,其公式为:
Loss(p,q)=-∑p(x)log q(x)
其中,p(x)为训练集的标签,q(x)为网络预测的标签值,Dropout层的Dropout比率为0.6。
需要补充说明的是,本发明所提出的MSGAFN网络模型,既可以用于在故障振动信号有限且具有强噪声的工业场景下进行滚动轴承的故障诊断,也可以用于轴承和齿轮的混合故障诊断,具有较高的鲁棒性和泛化性。下面对该网络的结构进行详细说明。
如图2所示,本发明中的MSGAFN网络结构依次为输入层、多尺度特征融合层、节点分类输出层。模型输入层的输入为Gclan,模型输出层的输出为故障类型的诊断结果。
在该MSGAFN网络模型中,各层的具体网络参数可通过优化进行确定,本发明中经过优化确定各层参数如下:
模型输入层的输出尺寸为10×512×1,多尺度特征融合层输出尺寸为10×1024×3,节点分类输出层输出尺寸10×512,图注意力模块和节点分类输出层中Dropout层比率为0.6。
需要补充说明的是,在利用样本数据集对预先构建的MSGAFN网络模型进行训练时,可以按照常规的模型训练方式,将数据集被划分为训练集和测试集,训练集输入模型优化参数后再通过测试集进行验证,多次训练优化后即可得到最优模型参数。
具体地,模型训练具体包括以下步骤:
Step1:根据S3中的训练集结果对MSGAFN网络模型的网络结构和参数进行调整;
Step2:反复进行上一步过程,得到一个最佳的基于MSGAFN的机械故障诊断模型。
需要补充说明的是,在模型训练过程中,Dbear和Dmix对模型的训练是独立的,各自形成一个最佳的基于MSGAFN的故障诊断模型。
此处,经过反复多次实验,得出该层具体的网络参数如下:模型输入层的输出尺寸为10×512×1,多尺度特征融合层输出尺寸为10×1024×3,节点分类输出层输出尺寸10×512,图注意力模块和节点分类输出层中Dropout层比率为0.6,节点特征为F的图在MSGAFN网络结构的输出Y可表示为:
Y=FCL2(FCL1(Leaky_ReLU(MSFFL1(F)),
Leaky_ReLU(MSFFL2(F)),Leaky_ReLU(MSFFL3(F))))
其中,FCL1和FCL2为MSGAFN网络模型的全连接层,Leaky_ReLU为MSGAFN网络模型使用的激活函数,MSFFL1,MSFFL2,MSFFL3为MSGAFN网络模型搭建的多尺度特征融合层。
S4:将之前划分好的测试集输入到最佳的MSGAFN网络模型中进行测试,评估模型性能,此评估分为两种形式,具体如下:
Step1:使用Dbear-5,Dbear-6,Dbear-7,Dbear-8,Dbear-9,Dbear-10根据S2构造的Gclan-train对MSGAFN网络模型进行训练并通过与之对应的Gclan-test进行性能评估;
Step2:使用Dmix-0,Dmix-1,Dmix-2,Dmix-3,Dmix-4,Dmix-5根据S2构造的Gclan-train对MSGAFN网络模型进行训练并通过与之对应的Gclan-test进行性能评估;
Step3:对Step1-Step2所述过程得到的实验结果与其他方法进行比较,证明本发明所提出的方法具有较为优越的性能。具体的结果展示如下:
(1)网络参数选择
不同数量的注意力头数关注到不同的特征,为了研究不同尺度的注意力头数对MSGAFN网络模型的影响,我们使用Dmix-5的数据进行了实验比较。实验结果的准确率及训练时间曲线如图5所示。随着注意力头数尺度的增加,MSGAFN的准确性逐渐增加。但如果头数过多,则会导致过多信息融合,反而影响模型的准确性和训练效率。在保证训练效率的前提下,最终我们选择4-8-16作为注意力头数组合。
(2)性能比较
在实际工业应用中,机械设备的故障样本和正常样本数量不均衡,且存在大量噪声干扰。因此,构造包括多尺度信息的族图,充分表达图数据的局部信息和整体信息,增强了网络模型的泛化能力,单尺度和多尺度构造图对MSGAFN网络模型的准确率影响如图6所示。
MSGAFN网络模型对轴承数据和轴承齿轮混合数据在不同信噪比场景下进行实验,并与GCN、ChebyNet、MRF_GCN和MHGAT进行比较,CWRU数据集的轴承数据对比试验结果如表3和图7所示,SEU数据集的轴承齿轮混合数据对比试验结果如表4和图8所示。
表3
表4
实验结果表明本发明所提出的MSGAFN网络结构,在CWRU数据集和SEU数据集的测试准确率均高于对比方法。在信噪比为-10dB的强噪声场景下的准确率依然可以达到84.83%。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (9)
1.一种基于多尺度图注意力融合网络的机械故障诊断方法,其特征在于,包括如下步骤:
步骤一,收集机械振动的数据,构建样本数据集,并将数据集分成训练集和测试集;
步骤二,将数据集的训练集和测试集依据样本间的余弦相似度分别构造为训练集族图和测试集族图;
步骤三,将训练集族图输入到搭建好的多尺度图注意力融合网络中训练网络,得到最佳故障诊断模型;
步骤四,将测试集族图输入最佳故障诊断模型中进行测试,评估模型性能;
步骤五,将待诊断的机械振动的数据输入到评估后的故障诊断模型中进行故障诊断。
2.根据权利要求1所述的一种基于多尺度图注意力融合网络的机械故障诊断方法,其特征在于,步骤一中,将收集到的样本信号与相应的故障类型标签一起构建为样本数据集。
3.根据权利要求1所述的一种基于多尺度图注意力融合网络的机械故障诊断方法,其特征在于,步骤二的具体方法如下:
Step1:对采集的数据进行归一化操作;
Step2:把归一化后的时间序列数据转换为频域数据;
Step3:依据样本间相似度选择相似度最高的n个节点作为族图中的祖先图Gancestor,其次,将这n个节点随机分为两组,对每一组都使用余弦相似度方法,得到各自的父图Gparent;最后,将每一个父图Gparent的n/2节点再次随机分成两组,对每一组分别使用余弦相似度方法获得各自的子图Gchild;Gancestor,Gparent,Gchild共同构成族图Gclan,并用作模型的输入。
4.根据权利要求1所述的一种基于多尺度图注意力融合网络的机械故障诊断方法,其特征在于,步骤三中,所述多尺度图注意力融合网络包括输入层、多尺度特征融合层和节点分类输出层,所述多尺度特征融合层包括三个并行的不同注意力尺度的图注意力模块和一个特征融合模块,所述节点分类输出层包括两层全连接层以及LeakyReLU激活层和Dropout层。
5.根据权利要求4所述的一种基于多尺度图注意力融合网络的机械故障诊断方法,其特征在于,所述图注意力模块包括图注意力层、BatchNomlization层、Dropout层和LeakyReLU激活层。
6.根据权利要求1或4所述的一种基于多尺度图注意力融合网络的机械故障诊断方法,其特征在于,所述多尺度图注意力融合网络的损失函数选择交叉熵损失函数,其公式为:
Loss(p,q)=-∑p(x)log q(x)
其中,p(x)为训练集的标签,q(x)为网络预测的标签值。
7.根据权利要求5所述的一种基于多尺度图注意力融合网络的机械故障诊断方法,其特征在于,输入层的输出尺寸为10×512×1,多尺度特征融合层输出尺寸为10×1024×3,节点分类输出层输出尺寸10×512,图注意力模块和节点分类输出层中Dropout层比率为0.6。
8.根据权利要求5所述的一种基于多尺度图注意力融合网络的机械故障诊断方法,其特征在于,多尺度特征融合层的输出结果表示为:
其中,[·]表示连接算子;σ为Sigmoid激活函数;H1,H2,H3分别表示三个图注意力模块的图注意力层具有H1,H2,H3个相互独立的注意力机制;表示节点i与其邻域节点m在第h1,h2,h3个注意力机制下计算的归一化注意力系数;/>分别表示归一化注意力系数为/>所对应的线性变换加权矩阵;/>表示邻域节点m的节点特征,每个(·)表示来自不同尺度下的特征表示;h1,h2,h3分别表示三个图注意力模块的图注意力层的第h1,h2,h3个独立的注意力机制;/>表示图中节点i的邻域。
9.根据权利要求5所述的一种基于多尺度图注意力融合网络的机械故障诊断方法,其特征在于,节点特征为F的图在多尺度图注意力融合网络的输出Y表示为:
Y=FCL2(FCL1(Leaky_ReLU(MSFFL1(F)),Leaky_ReLU(MSFFL2(F)),Leaky_ReLU(MSFFL3(F))))
其中,FCL1和FCL2为多尺度图注意力融合网络的全连接层,Leaky_ReLU为多尺度图注意力融合网络使用的激活函数,MSFFL1,MSFFL2,MSFFL3为多尺度图注意力融合网络搭建的多尺度特征融合层。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310793938.2A CN116821762A (zh) | 2023-06-30 | 2023-06-30 | 一种基于多尺度图注意力融合网络的机械故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310793938.2A CN116821762A (zh) | 2023-06-30 | 2023-06-30 | 一种基于多尺度图注意力融合网络的机械故障诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116821762A true CN116821762A (zh) | 2023-09-29 |
Family
ID=88125527
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310793938.2A Pending CN116821762A (zh) | 2023-06-30 | 2023-06-30 | 一种基于多尺度图注意力融合网络的机械故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116821762A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117830750A (zh) * | 2024-03-04 | 2024-04-05 | 青岛大学 | 一种基于图Transformer的机械故障预测方法 |
-
2023
- 2023-06-30 CN CN202310793938.2A patent/CN116821762A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117830750A (zh) * | 2024-03-04 | 2024-04-05 | 青岛大学 | 一种基于图Transformer的机械故障预测方法 |
CN117830750B (zh) * | 2024-03-04 | 2024-06-04 | 青岛大学 | 一种基于图Transformer的机械故障预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106124212B (zh) | 基于稀疏编码器和支持向量机的滚动轴承故障诊断方法 | |
CN111709448A (zh) | 一种基于迁移关系网络的机械故障诊断方法 | |
CN110617966A (zh) | 一种基于半监督生成对抗网络的轴承故障诊断方法 | |
CN111539152B (zh) | 一种基于两级孪生卷积神经网络的滚动轴承故障自学习方法 | |
CN110297479B (zh) | 一种基于卷积神经网络信息融合的水电机组故障诊断方法 | |
CN107506710A (zh) | 一种滚动轴承复合故障提取方法 | |
CN113375941A (zh) | 高速动车组轴承的开集故障诊断方法 | |
CN116358871B (zh) | 基于图卷积网络的滚动轴承微弱信号复合故障诊断方法 | |
CN113569990B (zh) | 面向强噪声干扰环境的演艺装备故障诊断模型构建方法 | |
CN113723489A (zh) | 一种改进关系网络的滚动轴承故障识别方法 | |
Jie et al. | Spectral kurtosis based on evolutionary digital filter in the application of rolling element bearing fault diagnosis | |
CN116821762A (zh) | 一种基于多尺度图注意力融合网络的机械故障诊断方法 | |
CN112304614A (zh) | 采用多注意力机制的端到端滚动轴承智能故障诊断方法 | |
CN114970628B (zh) | 样本不均衡下基于生成对抗网络的转动部件故障诊断方法 | |
CN114169377A (zh) | 基于g-mscnn的有噪环境中滚动轴承故障诊断方法 | |
CN113537152A (zh) | 一种基于深度神经网络的流场状态故障检测方法 | |
CN115859077A (zh) | 一种变工况下多特征融合的电机小样本故障诊断方法 | |
CN114048787B (zh) | 一种基于Attention CNN模型的轴承故障实时智能诊断方法与*** | |
CN113092044B (zh) | 一种基于加权水平可见图的旋转机械故障诊断方法 | |
CN105823634A (zh) | 基于时频关联向量卷积玻尔兹曼机的轴承损伤识别方法 | |
CN110490218B (zh) | 一种基于两级dbn的滚动轴承故障自学习方法 | |
CN115356599B (zh) | 一种多模态城市电网故障诊断方法及*** | |
CN117216681A (zh) | 一种基于SAGAN-IResNet的少样本轴承故障诊断方法、***及存储介质 | |
CN116738367A (zh) | 基于多尺度图Transformer的滚动轴承故障诊断方法 | |
CN112161805A (zh) | 一种基于时间序列标度分析和cnn的轴承微小故障诊断方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |