CN117574259A

CN117574259A - 适用于高端装备的注意力孪生智能迁移可解释性诊断方法

Info

Publication number: CN117574259A
Application number: CN202311316905.5A
Authority: CN
Inventors: 缪小冬; 徐坤; 李舜酩; 江星星; 王�华; 陆建涛
Original assignee: Nanjing Tech University
Current assignee: Nanjing Tech University
Priority date: 2023-10-12
Filing date: 2023-10-12
Publication date: 2024-02-20
Anticipated expiration: 2043-10-12
Also published as: CN117574259B

Abstract

本发明公开一种适用于高端装备的注意力孪生智能迁移可解释性诊断方法，先获取轴承和齿轮不同故障件在不同负载或转速下的振动信号数据，对数据进行预处理；构建双分支架构的卷积神经网络模型，令模型可同时接受两种不同工况下的不平衡样本进行训练；模型中加入跨模块串联双注意力机制，包括通道特征注意力增强和片段特征注意力增强模块，用以合理地增强小样本特征信息，增强不平衡样本的域不变特征，并实现特征的注意力可解释性；同时引入孪生特征融合模块，更好的提取不平衡样本中的域不变特征；最后，采用各类提出的特征可视化方法实现对迁移诊断模型的特征可视化解释，并在测试数据集上完成高效的迁移诊断准确性。

Description

适用于高端装备的注意力孪生智能迁移可解释性诊断方法

技术领域

本发明涉及高端装备智能诊断技术，具体涉及一种适用于高端装备的注意力孪生智能迁移可解释性诊断方法。

背景技术

轴承或齿轮等旋转部件是高端装备进行动力传输的核心部件，其健康状态直接影响了高端装备的运行可靠性，因此，对轴承或齿轮等旋转部件进行故障监测与诊断十分重要。目前，故障监测诊断方法主要分为三大类：基于动力学模型的方法；/>基于信号处理提取机理特征的方法；/>基于人工智能的智能故障诊断方法。其中，基于动力学模型的方法是故障诊断的基础，但由于其较难模拟真实高端装备在运行中的故障动力学特性，研究人员便逐渐开始研究可提取故障机理特征的信号处理方法，根据提取到的相应机理特征，便可判断旋转部件的运行状态。近十年，由于人工智能技术的兴起，智能故障诊断方法逐渐被应用于故障诊断领域。在智能故障诊断应用过程中，经常遇到由转速或负载变化而带来的迁移工况问题；也经常遇到由正常样本多而故障样本少带来的样本不平衡问题；针对高端装备，如齿轮传动涡扇航空发动机，还经常遇到需同时对轴承和齿轮进行诊断的问题。

智能诊断工程应用中，迁移工况问题常导致故障特征发生漂移，因此常使用各类迁移学***衡问题常导致模型对小样本产生过多的误分类，而且又是也伴随迁移问题同时出现的情况，对此专利CN113469066 B中提出了一种不平衡样本多任务自由化的滚动轴承故障迁移诊断方法，虽解决了此类问题。

但是，针对类似齿轮传动涡扇航空发动机等高端装备需同时对轴承和齿轮进行不平衡样本下的迁移工况同步诊断问题，相应的专利较少；并且也缺乏针对此种情况的各类特征可视化方法。例如：CN113191215A使用的是二维时频数据，处理速度慢，并且仅在样本不平衡条件下效果较好，针对工况迁移诊断性一般；专利CN113505655A无法解决变转速或变负载迁移的工况进行同时诊断。综上所述，现有的智能诊断方法难以实现对轴承和齿轮进行不平衡样本下迁移工况的同步特征可解释性故障诊断。

发明内容

发明目的：本发明的目的在于解决现有技术中存在的不足，提供一种适用于高端装备的注意力孪生智能迁移可解释性诊断方法，可同时对轴承和齿轮进行不平衡样本下的迁移工况诊断，并且采用各类基于注意力或孪生网络的特征可视化方法对智能诊断模型学习到的特征进行可视化解释，推动智能故障诊断的实际应用进程。

技术方案：本发明的一种适用于高端装备的注意力孪生智能迁移可解释性诊断方法，包括以下步骤：

步骤S1、获取高端装备（如齿轮传动涡扇航空发动机）模拟试验台中轴承和齿轮的故障信号，得到轴承故障样本和齿轮故障样本；

步骤S2、对轴承故障样本和齿轮故障样本进行数据预处理：将三个变负载下的航空轴承数据和三个变转速下的行星齿轮数据进行顺序组合，并添加健康样本（即正常样本数据），将每类健康样本设置成不同的不平衡样本大小，并对不平衡样本做时频转换变换为频域信号（例如可采用短时傅里叶变换），同时做标准化处理；

步骤S3、构建注意力孪生智能迁移可解释性诊断模型

步骤S3.1、搭建双分支卷积神经网络模型，该双分支卷积神经网络模型共分为5个卷积层、5个池化层和一个全连接层，模型中包含批标准化层和L2正则化；

步骤S3.2、为使智能诊断模型诊断效果更好并且更具可解释性，设计跨模块串联的跨模块双注意力机制模块，并建立对应模块的特征可视化方法；

跨模块双注意力机制模块包括通道特征注意力模块CFAE和片段特征注意力模块FFAE，通过通道特征注意力模块CFAE增强不平衡样本不同通道中的特征值，通过片段特征注意力模块FFAE增强不平衡样本不同特征片段的特征值；

步骤S3.3、为更好地提取不平衡样本中的特征信息，同时也为模型可以提取出尽可能多的不同负载或转速下的融合域不变特征，引入对比损失函数来构建孪生特征融合网络模块；

步骤S3.4、将跨模块双注意力机制模块和孪生特征融合网络模块***双分支卷积神经网络模型，构建不平衡样本下的注意力孪生智能迁移可解释性诊断模型；其中通道特征注意力模块CFAE被放置于第3个池化层后，片段特征注意力模块FFAE被放置于第5个卷积层后，在全局平均池化（GAP）层应用孪生特征融合网络；

步骤S4、使用步骤S2标准化处理后的不平衡样本数据对注意力孪生智能迁移可解释性诊断模型进行训练，注意力孪生智能迁移可解释性诊断模型采用的是任意两种负载或转速下的不平衡样本数据进行训练，此处先用两个工况下的不平衡样本数据进行训练，后续再用其它工况下的数据进行测试（避免了传统迁移诊断方法需要使用与源域样本相同类别的目标域数据进行跟随训练的限制），更加满足实际的故障诊断应用要求（迁移诊断实际应用中很难获取到与源域数据相同类别并且数量尽可能一致的目标域数据）；

步骤S5、使用测试集对注意力孪生智能迁移可解释性诊断模型进行诊断效果测试；经训练完成后的注意力孪生智能迁移可解释性诊断模型内部权重和偏置等参数固定，进而使用其它转速或负载下的数据对模型的诊断效果进行验证，绘制与其它模型的诊断对比箱型图及混淆矩阵，展示模型性能；

步骤S6、借助步骤S3中的跨模块双注意力机制模块，对注意力孪生智能迁移可解释性诊断模型学习到的统计特征进行可视化展示，首先展示通道特征注意力模块CFAE对不同通道特征的增强，然后展示片段特征注意力模块FFAE对不同片段的特征增强，同时对激活权重W2进行可视化展示，进而结合频谱波形，展示模型具体学习到了哪些统计特征信息；

步骤S7、借助步骤S3孪生特征融合网络模块，对注意力孪生智能迁移可解释性诊断模型学***衡样本中的不随工况转变的跨域融合与不变特征进行展示，进一步解释智能模型学习到的特征信息。

进一步地，所述步骤S3.1中的双分支卷积神经网络模型包括5个卷积层、5个池化层和一个全连接层，还包括批标准化层和L2正则化，其公式分别如下：

式中，m代表每批次的样本总量，代表每一批次的样本，/>和/>分别代表批量数据的平均值和标准差，/>和/>分别表示修正后的样本值，/>用于避免分母标准差为0的现象，γ和β分别是尺度因子和平移因子；

式中，E _in是原始的分类损失函数，是正则化参数，w代表模型中的权重参数。

进一步地，所述步骤S3.2中跨模块双注意力机制模块的详细内容为：通道特征注意力模块CFAE的表达式为：

式中，cfae是CFAE模块的特征输出，z(Pool_3)代表第三个池化层输出的特征，z _activate代表注意力激活的特征，是校正系数，C代表故障类别数，e是常数；

片段特征注意力模块FFAE的表达式为：

式中，ffae是FFAE模块的特征输出，W2代表对应于每一样本不同片段的激活权重，z _j,m(i)是FFAE上一层的特征输出，A ₁~A ₈是样本对应于每一个特征片段激活值。

进一步地，所述步骤S3.3中损失函数的表达式为：

式中，代表对比损失层的参数，L _Siamese是孪生特征融合网络的损失，D(G ₁,G ₂)代表来自两种转速或负载(G ₁,G ₂)下的不平衡样本特征之间的距离，Q是一恒定常数，l代表网络层，n代表数量，N是指样本总数。

进一步地，所述步骤S3.4所得注意力孪生智能迁移可解释性诊断模型的总的损失函数可别表示为：

式中，N代表数量，C代表故障类别数，y是样本标签，p为标签正确的概率，L _sum代表总的损失，代表交叉熵损失的参数，/>代表正则化损失的参数，L _entropy是分类损失交叉熵损失项，L _L是正则化损失项，N代表样本总数。

进一步地，所述步骤S7中通道特征注意力模块CFAE对不同通道特征的增强后的值，其公式如下：

式中，z _activate代表特征注意力激活后的值，W1是注意力权重，是校正系数，z(Pool_3)代表第三个池化层输出的特征，z _activate代表注意力激活的特征，/>是校正系数，C代表故障类别数；

片段特征注意力模块FFAE权重的值，其公式如下：

式中，W2代表对应于每一样本不同片段的激活权重，z _j,m(i)是FFAE上一层的特征输出，A ₁~A ₈是样本对应于每一个特征片段激活值。

有益效果：本发明提出一个能够同时对轴承和齿轮的不同类型故障进行不平衡样本下的变转速或变负载迁移智能诊断方法，该方法通过本发明设计的跨模块串联双注意力机制，有效增强了不平衡样本下小样本的特征信息，使模型能够更好地提取不平衡样本中的特征；同时，在提出的孪生特征融合网络的约束下，模型提取到了不随工况变化的不平衡样本下的域不变特征，可以更好地对其它工况下的数据进行诊断；最后，分别通过注意力机制和孪生特征融合网络中的特征对模型学习到的信息进行了可视化解释，增强了智能诊断模型的内部可解释性。

附图说明

图1为本发明智能诊断的整体流程图；

图2为本发明不平衡样本下的注意力孪生智能迁移可解释性模型示意图；

图3为本发明中模型在不同迁移工况下的诊断性能；

图4为本发明中模型在D1/D2→D3工况下的混淆矩阵；

图5为本发明中CFAE模块对不同通道特征增强效果图；

图6为本发明中FFAE模块对不同片段特征增强效果图；

图7为注意力与频域特征匹配图。

图8为本发明中孪生特征融合网络层提取的不平衡样本域不变特征图。

具体实施方式

下面对本发明技术方案进行详细说明，但是本发明的保护范围不局限于所述实施例。

如图1和图2所示，本发明的适用于高端装备的注意力孪生智能迁移可解释性诊断方法，可同时对轴承和齿轮进行诊断，并且采用各类基于注意力或孪生网络的特征可视化方法对智能诊断模型学习到的特征进行可视化解释，推动智能故障诊断的实际应用进程。具体包括以下步骤：

步骤S1：获取齿轮传动涡扇航空发动机高端装备模拟试验台中轴承和齿轮的故障信号，进而得到轴承故障样本和齿轮故障样本。

本实施例采用都灵理工大学超高速航空轴承在18000r/min下变负载（1000N,1400N和1800N）的数据，由于航空行星齿轮十分昂贵，采用自有的行星齿轮在变转速（1800r/min,2000r/min和2500r/min）下的数据，将两种数据进行组合，验证模型对轴承和行星齿轮的同时诊断性能。

步骤S2：对轴承故障样本和齿轮故障样本进行数据预处理

将三个变负载下的航空轴承数据和三个变转速下的行星齿轮数据进行顺序组合，并添加健康样本，将每类健康样本设置成不同的不平衡样本大小，并对其做时频转换变换为频域信号，同时做标准化处理。

本实施例共分为七种健康状况：正常样本（NR），轴承内圈压痕150μm（IRI150），轴承内圈压痕450μm（IRI450），轴承滚柱压痕450μm（RI450），行星轮点蚀（PGP），太阳轮点蚀（SGP）和太阳轮磨损（SGW）；对于这七类健康状况，分别设置不同数量的样本大小，最低100个样本，最高500个样本。如图1所示，本实施例可将不平衡样本与工况1、工况2组成两个训练集，平衡样本与工况3组成测试集；前两个训练集同时输入未训练的诊断模型，将模型训练好后，用第三种工况下数据集进行验证。

步骤S3：构建注意力孪生智能迁移可解释性诊断模型

步骤S3.1：搭建双分支卷积神经网络模型，该双分支卷积神经网络模型共分为5个卷积层、5个池化层和一个全连接层，模型中包含批标准化层和L2正则化，其公式分别如下：

式中，和/>分别代表批量数据的平均值和标准差，/>用于避免分母标准差为0的现象，γ和β分别是尺度因子和平移因子；

式中，E _in是原始的分类损失函数，是正则化参数，w代表模型中的权重参数；

步骤S3.2：为使智能诊断模型诊断效果更好并且更具可解释性，设计跨模块双注意力机制模块，并建立对应模块的特征可视化方法。

本实施例的跨模块双注意力机制模块包括通道特征注意力模块（CFAE）和片段特征注意力模块（FFAE），通道特征注意力模块（CFAE）通过注意力增强不平衡样本不同通道中的特征值，经其注意力激活后的特征和经残差链接后的总公式分别被表示为：

式中，z _activate代表特征注意力激活后的值，W1是注意力权重，是校正系数，cfae是CFAE模块的特征输出，z(Pool_3)代表第三个池化层输出的特征，z _activate代表注意力激活的特征，/>是校正系数，C代表种类；

片段特征注意力模块（FFAE）通过注意力增强不平衡样本不同特征片段的特征值，其注意力权重W2和注意力公式分别被表示为：

式中，ffae是FFAE模块的特征输出，W2代表对应于每一样本不同片段的激活权重，z _j,m(i)是FFAE上一层的特征输出，A ₁~A ₈是样本对应于每一个特征片段激活值；

步骤S3.3：为更好地提取不平衡样本中的特征信息，同时也为模型提取出尽可能多的不同负载或转速下的融合域不变特征，引入对比损失函数来构建孪生特征融合网络模块，孪生特征融合网络模块的损失函数和距离公式分别被表示为：

式中，代表对比损失层的参数，L _Siamese是孪生特征融合网络的损失，D(G ₁,G ₂)代表来自两种转速或负载(G ₁,G ₂)下的不平衡样本特征之间的距离，Q是一恒定常数，l代表网络层，n代表数量，dim代表维度；

步骤S3.4：将双注意力机制模块和孪生特征融合网络模块***双分支卷积网络模型，构建不平衡样本下的注意力孪生智能迁移可解释性诊断模型；

在注意力孪生智能迁移可解释性诊断模型中，通道特征注意力模块CFAE被放置于第三个池化层之后，片段特征注意力模块FFAE被放置于第5个卷积层之后，在全局平均池化（GAP）层应用孪生特征融合网络；

注意力孪生智能迁移可解释性诊断模型总损失函数表示为：

式中，N代表数量，C代表故障类别数，y是样本标签，p为标签正确的概率，L _sum代表总的损失，代表交叉熵损失的参数，/>代表正则化损失的参数，L _entropy是分类损失交叉熵损失项，L _L是正则化损失项。

本实施例的注意力孪生智能迁移可解释性诊断模型的详细参数如表1所示：

表1 所提模型详细参数表

层数	层类型	核大小/步长	通道数	批标准化	激活函数
						1	Conv_1	451/31	16	Yes	Relu
2	Pool_1	21/21	16	/	/
						3	Conv_2	151/31	32	Yes	Relu
4	Pool_2	21/21	32	/	/
						5	Conv_3	31/11	48	Yes	Relu
6	Pool_3	21/21	48	/	/
						7	CFAE	/	48	/	/
8	Conv_4	31/11	64	Yes	Relu
						9	Pool_4	21/21	64	/	/
10	Conv_5	31/11	64	Yes	Relu
						11	FFAE	/	64	/
12	GAP	/	64	/	/
						13	SFF	/	/	/	/
14	Fc1	64*10	/	/	/
						15	/	/	/	/	Softmax

步骤S4：使用步骤S2中准备的不平衡样本数据（图1中的两个训练集）对注意力孪生智能迁移可解释性诊断模型进行训练，注意力孪生智能迁移可解释性诊断模型采用的是任意两种负载或转速下的不平衡样本数据进行训练，即：先用两个工况下的不平衡样本数据进行训练，再用其它工况下的数据进行测试；

步骤S5：对注意力孪生智能迁移可解释性诊断模型进行模型诊断效果测试；

经步骤S4训练后的注意力孪生智能迁移可解释性诊断模型内部权重和偏置等参数固定，进而使用其它转速或负载下的数据对模型的诊断效果进行验证，绘制图3为模型在不同迁移工况下的诊断性能和图4模型在D1/D2→D3工况下的混淆矩阵，展示模型性能。

步骤S6：借助跨模块双注意力机制模块对注意力孪生智能迁移可解释性诊断模型学习到的统计特征进行可视化展示。

首先展示CFAE模块对不同通道特征的增强，绘制图5CFAE模块对不同通道特征增强效果图；然后展示FFAE模块对不同片段的特征增强，同时对激活权重W2进行可视化展示，绘制图6 FFAE模块对不同片段特征增强效果图；进而结合频谱波形，展示模型具体学习到了哪些统计特征信息，绘制图7注意力与频域特征匹配图。

步骤S7：借助孪生特征融合网络模块对注意力孪生智能迁移可解释性诊断模型学***衡样本中的不随工况转变的跨域融合与不变特征进行展示，绘制图8孪生特征融合网络层提取的不平衡样本域不变特征图，进一步解释智能模型学习到的特征信息。

实施例：

以上述具体实施方式步骤1和2中描述的齿轮传动涡扇航空发动机模拟试验台中轴承和齿轮的智能故障诊断为例（如图2），来验证本发明的可行性。

本实施例各工况下的不平衡样本准备如表2所示：

表2 各不同工况下的轴承和齿轮不平衡样本设置样本量

表2中，D1~D3分别代表迁移工况1~3。从表中可以看出各类样本数量是参差不齐的，不平衡样本数最少的有100个样本，最多的500个样本。使用上述样本数据，同时使用两类工况下的不平衡样本数据进行训练，进而用第三类工况下的数据对模型进行测试，其在不同工况下的诊断性能如图3所示。在图3横坐标表示各工况时，为方便省略数据集符号“D”。图3中1/2→3表示D1/D2→D3工况，以此类推。从图中可以看出，所提出模型取得了相当好的诊断效果。即使在如此恶劣的条件下，使用不均匀的不平衡样本作为训练，同时针对多个检测部件，其诊断准确率均高于96%，且诊断稳定性较好。然而，对于D1/D3→D2和D3/D2→D1，模型的测试精度甚至略高于训练精度，这也在一定程度上证明了模型的自适应鲁棒性。

另外，从图4混淆矩阵中可以看出，本发明的注意力孪生智能迁移可解释性诊断模型对这些容易混淆的不平衡样本进行了正确分类，进一步证明了本发明的先进性。

从图5可以看出，CFAE模块相对于上层(Pool_3)的特征增强了CFAE层的特征。无论绝对值是大是小，这种增强都会发生。绝对值较小的特征增加幅度相对较小，绝对值较大的特征增加幅度相对较大。因为CFAE的原理是增强模型中不同通道的特征值，每个通道（通道1、通道13、通道25、通道37）都有一定的效果，所以把它放在片段特征增强网络的前面。为尽早将CFAE网络的性能应用到模型提取的更具体的特征上，将其放置在第三层池化层之后。

从图6 FFAE模型的片段特征增强效果可以看出，FFAE对选取的特征绝对值较大的片段进行了增强，忽略了特征值较小的部分，使得模型对增强显著的特征具有更好的分类效果。图6中选择的是通道1、通道20、通道38、通道54。

由图7可以看出（横坐标表示特征片段注意力也就是特征关注段，纵坐标表示不同断层类型的样本数量），对于没有任何故障的正常样本信号，FFAE网络的注意力分布几乎是均匀的，对特征段没有特别的关注。对于C1和C3这两种难以区分的故障类别，模型分别关注C1故障信号的低频部分和C3故障信号的高频部分，使模型最大限度地区分这两种特征。

图8展示了模型学***衡样本训练数据工况1和工况2。最后，从以上对各种特征的可视化分析可以得出，智能诊断模型学到的不是具有实际物理意义的故障特征频率，而是某一波形信号在统计特征上区别于其他波形信号的特征。

综上所述，本发明能够对轴承和齿轮在不平衡样本下的同步迁移诊断，同时，采用了多种特征可视化方法，使智能诊断模型内部的学习机制更具可解释性，解释了模型学习到的统计特征信息，进一步推进了智能诊断模型的应用进程。

Claims

1.一种适用于高端装备的注意力孪生智能迁移可解释性诊断方法，其特征在于，包括以下步骤：

步骤S1、获取高端装备模拟试验台中轴承和齿轮的故障信号，得到轴承故障样本和齿轮故障样本；

步骤S2、数据预处理：将三个变负载下的轴承数据和三个变转速下的齿轮数据进行顺序组合，并添加健康样本，将每类健康样本设置成不同的不平衡样本大小，并对不平衡样本做时频转换变换为频域信号，同时做标准化处理；

步骤S3、构建注意力孪生智能迁移可解释性诊断模型

步骤S3.2、设计跨模块串联的跨模块双注意力机制模块，并建立对应模块的特征可视化方法；

步骤S3.3、引入对比损失函数来构建孪生特征融合网络模块；

步骤S3.4、将跨模块双注意力机制模块和孪生特征融合网络模块***双分支卷积神经网络模型，构建不平衡样本下的注意力孪生智能迁移可解释性诊断模型；其中CFAE模块被放置于第3个池化层后，FFAE模块被放置于第5个卷积层后，在全局平均池化GAP层应用孪生特征融合网络；

步骤S4、使用步骤S2所得不平衡样本数据对注意力孪生智能迁移可解释性诊断模型进行训练，注意力孪生智能迁移可解释性诊断模型采用的是任意两种负载或转速下的不平衡样本数据进行训练，此处先用两个工况下的不平衡样本数据进行训练；

2.根据权利要求1所述的适用于高端装备的注意力孪生智能迁移可解释性诊断方法，其特征在于，所述步骤S3.1中的双分支卷积神经网络模型包括5个卷积层、5个池化层和一个全连接层，还包括批标准化层和L2正则化，其公式分别如下：

3.根据权利要求1所述的适用于高端装备的注意力孪生智能迁移可解释性诊断方法，其特征在于，所述步骤S3.2中跨模块双注意力机制模块的详细内容为：通道特征注意力模块CFAE的表达式为：

片段特征注意力模块FFAE的表达式为：

4.根据权利要求1所述的适用于高端装备的注意力孪生智能迁移可解释性诊断方法，其特征在于，所述步骤S3.3中损失函数的表达式为：

5.根据权利要求1所述的适用于高端装备的注意力孪生智能迁移可解释性诊断方法，其特征在于，所述步骤S3.4所得注意力孪生智能迁移可解释性诊断模型的总的损失函数表示为：

6.根据权利要求1所述的适用于高端装备的注意力孪生智能迁移可解释性诊断方法，其特征在于，所述步骤S7中通道特征注意力模块CFAE对不同通道特征的增强后的值，其公式如下：

；

式中，z _activate代表特征注意力激活后的值，W1是注意力权重，是校正系数， z(Pool_3)代表第三个池化层输出的特征，z _activate代表注意力激活的特征，/>是校正系数，C代表故障类别数；

片段特征注意力模块FFAE权重的值，其公式如下：