CN116821762A

CN116821762A - 一种基于多尺度图注意力融合网络的机械故障诊断方法

Info

Publication number: CN116821762A
Application number: CN202310793938.2A
Authority: CN
Inventors: 王金龙; 倪培浩; 张媛媛; 熊晓芸; 吉爱国; 董良成
Original assignee: Qingdao University of Technology
Current assignee: Qingdao University of Technology
Priority date: 2023-06-30
Filing date: 2023-06-30
Publication date: 2023-09-29

Abstract

本发明公开了一种基于多尺度图注意力融合网络的机械故障诊断方法，包括如下步骤：收集机械振动的数据，构建样本数据集，并将数据集分成训练集和测试集；将数据集的训练集和测试集依据样本间的余弦相似度分别构造为训练集族图和测试集族图；将训练集族图输入到搭建好的多尺度图注意力融合网络中训练网络，得到最佳故障诊断模型；将测试集族图输入最佳故障诊断模型中进行测试，评估模型性能；将待诊断的机械振动的数据输入到评估后的故障诊断模型中进行故障诊断。本发明所公开的方法可以在数据不平衡和强噪声条件下获取较高的故障诊断准确率。

Description

一种基于多尺度图注意力融合网络的机械故障诊断方法

技术领域

本发明涉及机械故障诊断技术领域，特别涉及一种基于多尺度图注意力融合网络的机械故障诊断方法。

背景技术

旋转机械作为现代制造设备的关键部件，其安全运行直接影响到工业***的稳定性。在旋转机械中，轴承将承受巨大且不断变化的载荷，这将导致失效。统计表明，由轴承引起的旋转机械故障率高达40％。为了减少设备在生产过程中的损耗，增加设备的稳定性，轴承状态监测和故障诊断技术已成为学者和工程师关注的中心问题。

目前故障诊断方法可以分为三类：基于模型的诊断方法、基于信号处理的诊断方法和数据驱动的诊断方法。基于物理模型的方法需要建立详细的数学模型来描述***的物理特征和故障模式。而基于信号处理的故障诊断方法主要采用时频域分析、小波包变换、包络谱分析、高阶统计量分析等技术对信号进行分析和处理，从而进行故障诊断。这两种方法对高质量的专业领域知识过于依赖。此外，对于复杂的机械***而言，建立数学模型变得非常困难，这需要大量的计算和时间成本同时降低了故障诊断的整体效率。

基于数据驱动技术的故障诊断方法不需要建立复杂的数学模型，而是构建特征提取模型和分类器，并利用大量历史数据对模型进行优化。这种诊断方法效果良好，可适用于复杂机械设备的故障诊断。近年来，基于数据驱动的方法在故障诊断领域变得很流行并取得了很多的研究成果。

其中，基于图神经网络的方法由于可以将信号之间的几何关系信息引入到机器故障诊断模型中，最近引起了人们的广泛关注。图神经网络可以将图的中心节点和相邻节点的特征聚合成增强的节点特征，通过注意力机制自动学习节点之间不同的权值，并根据学习到的权值对信息进行聚合，从而扩大有用信息的影响，忽略干扰信息的影响，实现节点分类。Zhang等人将收集到的声信号转换为具有几何结构的图形，应用图卷积网络实现了对滚动轴承的故障诊断。Sun等人使用提出的多通道残差网络(MCRN)来提取信号中的弱特征，通过自动编码器(AE)图形生成层生成信号和不同尺度的有限图形数据，最终实现了基于图卷积网络的故障诊断。Jiang等人使用动态时间翘曲方法将原始振动信号转化为图数据，将GAT首次应用于故障诊断领域。尽管现有的方法已经取得了较大的成功，但是上述提出的方法仍然存在很大的局限性：基于图神经网络(GNN)的传统故障诊断方法很难有效捕捉数据的局部和全局特征信息，并且大多数GNN模型未考虑相邻节点之间的固有差异，在工业场景中处理有限且带噪声的故障振动信号的能力较差。

发明内容

为解决上述技术问题，本发明提供了一种基于多尺度图注意力融合网络的机械故障诊断方法，以达到可以在数据不平衡和强噪声条件下获取较高准确率的故障诊断的目的。

为达到上述目的，本发明的技术方案如下：

一种基于多尺度图注意力融合网络的机械故障诊断方法，包括如下步骤：

步骤一，收集机械振动的数据，构建样本数据集，并将数据集分成训练集和测试集；

步骤二，将数据集的训练集和测试集依据样本间的余弦相似度分别构造为训练集族图和测试集族图；

步骤三，将训练集族图输入到搭建好的多尺度图注意力融合网络中训练网络，得到最佳故障诊断模型；

步骤四，将测试集族图输入最佳故障诊断模型中进行测试，评估模型性能；

步骤五，将待诊断的机械振动的数据输入到评估后的故障诊断模型中进行故障诊断。

上述方案中，步骤一中，将收集到的样本信号与相应的故障类型标签一起构建为样本数据集。

上述方案中，步骤二的具体方法如下：

Step1：对采集的数据进行归一化操作；

Step2：把归一化后的时间序列数据转换为频域数据；

Step3：依据样本间相似度选择相似度最高的n个节点作为族图中的祖先图G_ancestor，其次，将这n个节点随机分为两组，对每一组都使用余弦相似度方法，得到各自的父图G_parent；最后，将每一个父图G_parent的n/2节点再次随机分成两组，对每一组分别使用余弦相似度方法获得各自的子图G_child；G_ancestor，G_parent，G_child共同构成族图G_clan，并用作模型的输入。

上述方案中，步骤三中，所述多尺度图注意力融合网络包括输入层、多尺度特征融合层和节点分类输出层，所述多尺度特征融合层包括三个并行的不同注意力尺度的图注意力模块和一个特征融合模块，所述节点分类输出层包括两层全连接层以及LeakyReLU激活层和Dropout层。

上述方案中，所述图注意力模块包括图注意力层、BatchNomlization层、Dropout层和LeakyReLU激活层。

上述方案中，所述多尺度图注意力融合网络的损失函数选择交叉熵损失函数，其公式为：

Loss(p,q)＝-∑p(x)log q(x)

其中，p(x)为训练集的标签，q(x)为网络预测的标签值。

上述方案中，输入层的输出尺寸为10×512×1，多尺度特征融合层输出尺寸为10×1024×3，节点分类输出层输出尺寸10×512，图注意力模块和节点分类输出层中Dropout层比率为0.6。

上述方案中，多尺度特征融合层的输出结果表示为：

其中，[·]表示连接算子；σ为Sigmoid激活函数；H₁，H₂，H₃分别表示三个图注意力模块的图注意力层具有H₁，H₂，H₃个相互独立的注意力机制；表示节点i与其邻域节点m在第h₁，h₂，h₃个注意力机制下计算的归一化注意力系数；/>分别表示归一化注意力系数为/>所对应的线性变换加权矩阵；/>表示邻域节点m的节点特征，每个(·)表示来自不同尺度下的特征表示；h₁，h₂，h₃分别表示三个图注意力模块的图注意力层的第h₁，h₂，h₃个独立的注意力机制；/>表示图中节点i的邻域。

上述方案中，节点特征为F的图在多尺度图注意力融合网络的输出Y表示为：Y＝FCL₂(FCL₁(Leaky_ReLU(MSFFL₁(F)),

Leaky_ReLU(MSFFL₂(F)),Leaky_ReLU(MSFFL₃(F))))

其中，FCL₁和FCL₂为多尺度图注意力融合网络的全连接层，Leaky_ReLU为多尺度图注意力融合网络使用的激活函数，MSFFL₁，MSFFL₂，MSFFL₃为多尺度图注意力融合网络搭建的多尺度特征融合层。

通过上述技术方案，本发明提供的一种基于多尺度图注意力融合网络的机械故障诊断方法具有如下有益效果：

1、针对于现有基于数据驱动的图神经网络方法仅能表示信号之间的几何关系信息，忽视了图结构数据的局部和全局特征信息的问题，本发明引入族图，通过将数据样本转换为具有多个信息尺度的族图，有效表示图结构数据的局部和全局信息，突破图结构数据的局部和全局特征信息不能同时表达的缺陷，较好的表征不同故障类型的代表性特征，提高特征提取能力。

2、针对现有大多数GNN模型未考虑相邻节点之间差异性的问题，本发明设计了多尺度图注意力融合网络(MSGAFN)，将所设计的多尺度特征融合层与族图配合，在多个尺度自动学***衡和强噪声条件下的故障诊断精度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为本发明实施例所公开的一种基于多尺度图注意力融合网络的机械故障诊断方法整体流程示意图；

图2为MSGAFN的网络结构图；

图3为族图构造流程图；

图4为图注意力模块结构图；

图5为不同尺度的注意力头数组合对MSGAFN的影响图；

图6为单尺度和多尺度构造图对模型的影响；

图7为轴承数据对比试验结果；

图8为轴承齿轮混合数据对比试验结果。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。

本发明提供了一种基于多尺度图注意力融合网络的机械故障诊断方法，该方法主要用于通过检测收集到的轴承和齿轮振动信号，来判断轴承和齿轮是否故障以及故障的类型。该方法的整体流程图如图1所示。

为验证本发明所提出的MSGAFN网络结构的机械故障诊断方法在样本不平衡且存在强噪声场景下对轴承和齿轮故障诊断的效果，本次实验将采用两个数据集的数据，分别是东南大学(Southeast University，SEU)采集的齿轮箱数据集和凯斯西储大学(CaseWestern Reserve University，CWRU)轴承数据中心采集的12KHz驱动端数据。

该方法具体包括以下步骤：

S1：选择凯斯西储大学轴承数据中心采集的12KHz驱动端数据集和东南大学采集的齿轮箱数据集的部分数据。

具体地，实施例1使用的凯斯西储大学轴承数据中心采集12KHz驱动端部分数据采集包括以下步骤：

Step1：选择电动机驱动端的滚动轴承型号为SKF6205。

Step2：用电火花在电动机驱动端滚动轴承上加工单点损伤，损伤位置为滚动轴承的内圈和滚珠(损伤直径为0.007英寸、0.014英寸和0.021英寸)，以及滚动轴承外圈的12点钟。

需要补充说明的是，利用电火花单点加工滚动轴承故障损伤可以模仿实际工况中的轴承损伤。常见的轴承损伤点在滚动轴承的外圈、内圈和滚珠上，而且损伤直径通常存在差异，这里设置内圈和滚珠的损伤直径为0.007英寸、0.014英寸和0.021英寸。由此一共有9种不同类型的滚动轴承故障。同时，还有一类没有任何损失的正常滚动轴承，因此一共有10类滚动轴承。

Step3：将振动传感器放置在电动机驱动端的SKF6205型号轴承座上方，并连接16通道的数据记录仪，从而构成对滚动轴承进行振动信号采集的采集***。

Step4：对同一类滚动轴承施加相同的单一负载，电动机驱动端的滚动轴承振动信号由16通道的数据记录仪在12KHZ的采样频率下进行采集。在本实施例中，为了验证本发明可以适用于不同的负载，一共设置了多种负载，分别为1HP、2HP。每一种负载下，均对10种类型的滚动轴承进行滚动轴承振动信号的采集。

Step5：针对每一种负载下采集到的10种类型的滚动轴承振动信号，分别将采集的滚动轴承振动信号按照设定的样本信号长度分割为一系列样本信号，即可将样本信号与相应的故障类型标签一起构建为样本数据集。

需要补充说明的是，本实施例中按照每个样本信号长度为1024个振动点进行分割，经过分割整理后，为了测试在不平衡样本场景，将不同类型样本设置多种数量，在每一种负载下，9类不同故障类型的滚动轴承分别有80个样本信号，正常滚动轴承有100个样本信号。为了模拟实际的工业场景，将2个负载下的样本信号进行混合，不同负载下相同故障类型看作一种标签，构成数据集D_bear，为了测试在强噪声环境下的模型诊断效果，为D_bear添加信噪比为-5，-6，-7，-8，-9，-10dB的高斯白噪声，得到数据集D_bear-5，D_bear-6，D_bear-7，D_bear-8，D_bear-9，D_bear-10；为了便于后续的模型训练和测试，将D_bear-5，D_bear-6，D_bear-7，D_bear-8，D_bear-9，D_bear-10按照相同的比例划分为训练集和测试集。

需要补充说明的是，每个负载9类不同故障类型的滚动轴承得到720个样本信号，正常滚动轴承得到100个样本信号，将两个负载下共计1640个滚动轴承振动信号进行混合得到D_bear，具体的数据集划分训练集和测试集的情况如表1所示。

表1

实施例2使用的东南大学采集的齿轮箱数据集的部分数据采集包括以下步骤：

Step1：从动力传动***动态模拟器(DDS)收集稳态信号。其中，轴承故障是由内圈、外圈，滚动体等位置的裂纹引起的。齿轮故障分为四种类型：削齿、缺齿、根部断层和表面断层；削齿和齿轮根部裂纹都是由裂纹引起的，但位置不同；缺齿故障是由于缺少轮齿引起的；表面磨损表明齿轮表面存在磨损。

收集的稳态信号包含轴承数据和齿轮数据的各五种健康状态：四种故障状态和一种健康状态。将齿轮故障和轴承故障相结合，形成一个包括四种齿轮故障、四种轴承故障，齿轮和轴承分别在健康状态的10分类混合数据集。

Step2：对轴承和齿轮施加相同的单一负载，使用动力传动***动态模拟器(DDS)进行数据采集。在本实施例中，为了验证本发明可以适用于不同的负载，一共设置了多种负载，分别为20HZ-0V和30HZ-2V。每一种负载下，均对10种类型的混合轴承和齿轮信号进行采集。

Step3：针对每一种负载下采集到的10种类型的轴承和齿轮振动信号，分别将其按照设定的样本信号长度分割为一系列样本信号，即可将样本信号与相应的故障类型标签一起构建为样本数据集。

具体地，本实施例中按照每个样本信号长度为1024个振动点进行分割，经过分割整理后，为了测试在不平衡样本场景，将不同类型样本设置多种数量，在每一种负载下，8类不同故障类型的轴承和齿轮分别有80个样本信号，2类正常类型的轴承和齿轮分别有100个样本信号。为了模拟实际的工业场景，将2个负载下的样本信号进行混合，不同负载下相同故障类型看作一种标签，构成数据集D_mix；为了测试在强噪声环境下的模型诊断效果，为D_mix添加信噪比为0，-1，-2，-3，-4，-5dB的高斯白噪声，得到数据集D_mix-0，D_mix-1，D_mix-2，D_mix-3，D_mix-4，D_mix-5；为了便于后续的模型训练和测试，将D_mix-0，D_mix-1，D_mix-2，D_mix-3，D_mix-4，D_mix-5按照相同的比例划分为训练集和测试集。

需要补充说明的是，每个负载8类不同故障类型的轴承和齿轮得到640个样本信号，2类正常类型的轴承和齿轮得到200个样本信号，将两个负载下共计1680个轴承和齿轮的振动信号进行混合得到D_mix，具体的数据集划分训练集和测试集的情况如表2所示。

表2

S2：将数据集的训练集和测试集依据样本间的余弦相似度分别构造为族图G_clan-train，G_clan-test；

具体地，构造族图的流程图如图3所示。构造族图G_clan的数据集在训练诊断轴承的神经网络时使用D_bear，在训练诊断齿轮和轴承混合的神经网络时使用D_mix。

构造G_clan的方法包括以下步骤：

Step1：对采集数据进行归一化操作；

需要补充说明的是，对采集数据进行归一化操作时使用Min-Max归一化方法。

Step2：把采集的时间序列数据转换为频域数据；

需要补充说明的是，时间序列数据转换为频域数据使用FFT(快速傅里叶变换)方法。

Step3：依据样本间相似度选择相似度最高的20个节点作为族图中的祖先图G_ancestor，其次，将这20个节点随机分为两组，对每一组都使用余弦相似度方法，得到各自的父图G_parent。最后，将父图再次随机分成两组，对每一组分别使用余弦相似度方法获得各自的子图G_child。G_ancestor，G_parent，G_child共同构成G_clan，并用作模型的输入。

需要补充说明的是，计算样本间相似度使用余弦相似度来估计节点间的距离，公式表示为：其中，/>是/>的邻域，∈是选择的半径长度。/>得到集合/>并定义阈值为0。如果相似度大于阈值，则两个节点之间将存在一条边e_i。

S3：把G_clan-train输入MSGAFN网络模型进行训练，满足准确性要求后得到一个最佳的滚动轴承故障诊断模型。

具体地，搭建MSGAFN网络模型包括以下步骤：

Step1：设计一个多尺度特征融合层，将构造的G_clan用作输入进行多尺度特征提取并进行特征融合。多尺度特征融合层包括三个并行的不同注意力尺度的图注意力模块和一个特征融合模块。多尺度特征融合层对输入的G_clan进行多尺度特征提取，通过图注意力机制获得在三个尺度下输出特征的权重，将权重分别与其在各尺度下的输出特征相乘获得更具代表性的特征，记作Fea_rep1，Fea_rep2，Fea_rep3。通过LeakyReLU激活函数针对Fea_rep1，Fea_rep2，Fea_rep3完成非线性特征变换，然后所述代表性的特征在特征融合模块融合为增强的特征表示，记作Fea_enhance，并将Fea_enhance作为后续网络的输入。其中节点多尺度特征融合的输出结果表示为：

需要补充说明的是，多尺度特征融合层的三种注意力头数设置为：H₁，H₂，H₃的值分别为[4,8,16]。图注意力模块包括一个图注意力层，一个BatchNomlization层，一个Dropout层和一个LeakyReLU激活层组成。如图4所示，其中图注意力层计算节点之间的注意力权重决定不同节点的重要性，BatchNomlization层加速训练收敛、抑制过拟合，并改善模型的性能，Dropout层通过随机丢弃神经元来减少过拟合、提高模型鲁棒性，LeakyReLU激活层加速模型的收敛速度，增强模型的泛化能力。特征融合模块实现对三个注意力模块输出结果进行拼接以聚合多尺度特征。

Step2：设计节点分类输出层，包含两层全连接层以及LeakyReLU激活层和Dropout层。设置损失函数，完成多尺度图注意力融合网络的构建。

需要补充说明的是，损失函数选择交叉熵(Cross Entropy Loss)损失函数，其公式为：

Loss(p,q)＝-∑p(x)log q(x)

其中，p(x)为训练集的标签，q(x)为网络预测的标签值，Dropout层的Dropout比率为0.6。

需要补充说明的是，本发明所提出的MSGAFN网络模型，既可以用于在故障振动信号有限且具有强噪声的工业场景下进行滚动轴承的故障诊断，也可以用于轴承和齿轮的混合故障诊断，具有较高的鲁棒性和泛化性。下面对该网络的结构进行详细说明。

如图2所示，本发明中的MSGAFN网络结构依次为输入层、多尺度特征融合层、节点分类输出层。模型输入层的输入为G_clan，模型输出层的输出为故障类型的诊断结果。

在该MSGAFN网络模型中，各层的具体网络参数可通过优化进行确定，本发明中经过优化确定各层参数如下：

模型输入层的输出尺寸为10×512×1，多尺度特征融合层输出尺寸为10×1024×3，节点分类输出层输出尺寸10×512，图注意力模块和节点分类输出层中Dropout层比率为0.6。

需要补充说明的是，在利用样本数据集对预先构建的MSGAFN网络模型进行训练时，可以按照常规的模型训练方式，将数据集被划分为训练集和测试集，训练集输入模型优化参数后再通过测试集进行验证，多次训练优化后即可得到最优模型参数。

具体地，模型训练具体包括以下步骤：

Step1：根据S3中的训练集结果对MSGAFN网络模型的网络结构和参数进行调整；

Step2：反复进行上一步过程，得到一个最佳的基于MSGAFN的机械故障诊断模型。

需要补充说明的是，在模型训练过程中，D_bear和D_mix对模型的训练是独立的，各自形成一个最佳的基于MSGAFN的故障诊断模型。

此处，经过反复多次实验，得出该层具体的网络参数如下：模型输入层的输出尺寸为10×512×1，多尺度特征融合层输出尺寸为10×1024×3，节点分类输出层输出尺寸10×512，图注意力模块和节点分类输出层中Dropout层比率为0.6，节点特征为F的图在MSGAFN网络结构的输出Y可表示为：

Y＝FCL₂(FCL₁(Leaky_ReLU(MSFFL₁(F)),

Leaky_ReLU(MSFFL₂(F)),Leaky_ReLU(MSFFL₃(F))))

其中，FCL₁和FCL₂为MSGAFN网络模型的全连接层，Leaky_ReLU为MSGAFN网络模型使用的激活函数，MSFFL₁，MSFFL₂，MSFFL₃为MSGAFN网络模型搭建的多尺度特征融合层。

S4：将之前划分好的测试集输入到最佳的MSGAFN网络模型中进行测试，评估模型性能，此评估分为两种形式，具体如下：

Step1：使用D_bear-5，D_bear-6，D_bear-7，D_bear-8，D_bear-9，D_bear-10根据S2构造的G_clan-train对MSGAFN网络模型进行训练并通过与之对应的G_clan-test进行性能评估；

Step2：使用D_mix-0，D_mix-1，D_mix-2，D_mix-3，D_mix-4，D_mix-5根据S2构造的G_clan-train对MSGAFN网络模型进行训练并通过与之对应的G_clan-test进行性能评估；

Step3：对Step1-Step2所述过程得到的实验结果与其他方法进行比较，证明本发明所提出的方法具有较为优越的性能。具体的结果展示如下：

(1)网络参数选择

不同数量的注意力头数关注到不同的特征，为了研究不同尺度的注意力头数对MSGAFN网络模型的影响，我们使用D_mix-5的数据进行了实验比较。实验结果的准确率及训练时间曲线如图5所示。随着注意力头数尺度的增加，MSGAFN的准确性逐渐增加。但如果头数过多，则会导致过多信息融合，反而影响模型的准确性和训练效率。在保证训练效率的前提下，最终我们选择4-8-16作为注意力头数组合。

(2)性能比较

在实际工业应用中，机械设备的故障样本和正常样本数量不均衡，且存在大量噪声干扰。因此，构造包括多尺度信息的族图，充分表达图数据的局部信息和整体信息，增强了网络模型的泛化能力，单尺度和多尺度构造图对MSGAFN网络模型的准确率影响如图6所示。

MSGAFN网络模型对轴承数据和轴承齿轮混合数据在不同信噪比场景下进行实验，并与GCN、ChebyNet、MRF_GCN和MHGAT进行比较，CWRU数据集的轴承数据对比试验结果如表3和图7所示，SEU数据集的轴承齿轮混合数据对比试验结果如表4和图8所示。

表3

表4

实验结果表明本发明所提出的MSGAFN网络结构，在CWRU数据集和SEU数据集的测试准确率均高于对比方法。在信噪比为-10dB的强噪声场景下的准确率依然可以达到84.83％。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种基于多尺度图注意力融合网络的机械故障诊断方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的一种基于多尺度图注意力融合网络的机械故障诊断方法，其特征在于，步骤一中，将收集到的样本信号与相应的故障类型标签一起构建为样本数据集。

3.根据权利要求1所述的一种基于多尺度图注意力融合网络的机械故障诊断方法，其特征在于，步骤二的具体方法如下：

Step1：对采集的数据进行归一化操作；

Step2：把归一化后的时间序列数据转换为频域数据；

4.根据权利要求1所述的一种基于多尺度图注意力融合网络的机械故障诊断方法，其特征在于，步骤三中，所述多尺度图注意力融合网络包括输入层、多尺度特征融合层和节点分类输出层，所述多尺度特征融合层包括三个并行的不同注意力尺度的图注意力模块和一个特征融合模块，所述节点分类输出层包括两层全连接层以及LeakyReLU激活层和Dropout层。

5.根据权利要求4所述的一种基于多尺度图注意力融合网络的机械故障诊断方法，其特征在于，所述图注意力模块包括图注意力层、BatchNomlization层、Dropout层和LeakyReLU激活层。

6.根据权利要求1或4所述的一种基于多尺度图注意力融合网络的机械故障诊断方法，其特征在于，所述多尺度图注意力融合网络的损失函数选择交叉熵损失函数，其公式为：

Loss(p，q)＝-∑p(x)log q(x)

其中，p(x)为训练集的标签，q(x)为网络预测的标签值。

7.根据权利要求5所述的一种基于多尺度图注意力融合网络的机械故障诊断方法，其特征在于，输入层的输出尺寸为10×512×1，多尺度特征融合层输出尺寸为10×1024×3，节点分类输出层输出尺寸10×512，图注意力模块和节点分类输出层中Dropout层比率为0.6。

8.根据权利要求5所述的一种基于多尺度图注意力融合网络的机械故障诊断方法，其特征在于，多尺度特征融合层的输出结果表示为：

9.根据权利要求5所述的一种基于多尺度图注意力融合网络的机械故障诊断方法，其特征在于，节点特征为F的图在多尺度图注意力融合网络的输出Y表示为：

Y＝FCL₂(FCL₁(Leaky_ReLU(MSFFL₁(F))，Leaky_ReLU(MSFFL₂(F))，Leaky_ReLU(MSFFL₃(F))))