CN117574259A - 适用于高端装备的注意力孪生智能迁移可解释性诊断方法 - Google Patents
适用于高端装备的注意力孪生智能迁移可解释性诊断方法 Download PDFInfo
- Publication number
- CN117574259A CN117574259A CN202311316905.5A CN202311316905A CN117574259A CN 117574259 A CN117574259 A CN 117574259A CN 202311316905 A CN202311316905 A CN 202311316905A CN 117574259 A CN117574259 A CN 117574259A
- Authority
- CN
- China
- Prior art keywords
- attention
- module
- feature
- model
- twin
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 238000013508 migration Methods 0.000 title claims abstract description 62
- 230000005012 migration Effects 0.000 title claims abstract description 62
- 238000003745 diagnosis Methods 0.000 title abstract description 44
- 230000004927 fusion Effects 0.000 claims abstract description 26
- 230000007246 mechanism Effects 0.000 claims abstract description 22
- 238000012360 testing method Methods 0.000 claims abstract description 15
- 238000012549 training Methods 0.000 claims abstract description 15
- 238000007794 visualization technique Methods 0.000 claims abstract description 8
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 230000008569 process Effects 0.000 claims description 26
- 230000004913 activation Effects 0.000 claims description 20
- 230000000694 effects Effects 0.000 claims description 17
- 238000011176 pooling Methods 0.000 claims description 17
- 230000006870 function Effects 0.000 claims description 16
- 239000012634 fragment Substances 0.000 claims description 12
- 238000013527 convolutional neural network Methods 0.000 claims description 10
- 230000036541 health Effects 0.000 claims description 9
- 238000012937 correction Methods 0.000 claims description 8
- 238000002405 diagnostic procedure Methods 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 238000004088 simulation Methods 0.000 claims description 4
- 238000001228 spectrum Methods 0.000 claims description 3
- 238000013519 translation Methods 0.000 claims description 3
- 230000003213 activating effect Effects 0.000 claims description 2
- 230000002708 enhancing effect Effects 0.000 abstract description 4
- 238000003062 neural network model Methods 0.000 abstract 1
- 238000012800 visualization Methods 0.000 abstract 1
- 239000000284 extract Substances 0.000 description 6
- 238000010586 diagram Methods 0.000 description 3
- 238000007373 indentation Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/02—Gearings; Transmission mechanisms
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/04—Bearings
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
本发明公开一种适用于高端装备的注意力孪生智能迁移可解释性诊断方法,先获取轴承和齿轮不同故障件在不同负载或转速下的振动信号数据,对数据进行预处理;构建双分支架构的卷积神经网络模型,令模型可同时接受两种不同工况下的不平衡样本进行训练;模型中加入跨模块串联双注意力机制,包括通道特征注意力增强和片段特征注意力增强模块,用以合理地增强小样本特征信息,增强不平衡样本的域不变特征,并实现特征的注意力可解释性;同时引入孪生特征融合模块,更好的提取不平衡样本中的域不变特征;最后,采用各类提出的特征可视化方法实现对迁移诊断模型的特征可视化解释,并在测试数据集上完成高效的迁移诊断准确性。
Description
技术领域
本发明涉及高端装备智能诊断技术,具体涉及一种适用于高端装备的注意力孪生智能迁移可解释性诊断方法。
背景技术
轴承或齿轮等旋转部件是高端装备进行动力传输的核心部件,其健康状态直接影响了高端装备的运行可靠性,因此,对轴承或齿轮等旋转部件进行故障监测与诊断十分重要。目前,故障监测诊断方法主要分为三大类:基于动力学模型的方法;/>基于信号处理提取机理特征的方法;/>基于人工智能的智能故障诊断方法。其中,基于动力学模型的方法是故障诊断的基础,但由于其较难模拟真实高端装备在运行中的故障动力学特性,研究人员便逐渐开始研究可提取故障机理特征的信号处理方法,根据提取到的相应机理特征,便可判断旋转部件的运行状态。近十年,由于人工智能技术的兴起,智能故障诊断方法逐渐被应用于故障诊断领域。在智能故障诊断应用过程中,经常遇到由转速或负载变化而带来的迁移工况问题;也经常遇到由正常样本多而故障样本少带来的样本不平衡问题;针对高端装备,如齿轮传动涡扇航空发动机,还经常遇到需同时对轴承和齿轮进行诊断的问题。
智能诊断工程应用中,迁移工况问题常导致故障特征发生漂移,因此常使用各类迁移学***衡问题常导致模型对小样本产生过多的误分类,而且又是也伴随迁移问题同时出现的情况,对此专利CN113469066 B中提出了一种不平衡样本多任务自由化的滚动轴承故障迁移诊断方法,虽解决了此类问题。
但是,针对类似齿轮传动涡扇航空发动机等高端装备需同时对轴承和齿轮进行不平衡样本下的迁移工况同步诊断问题,相应的专利较少;并且也缺乏针对此种情况的各类特征可视化方法。例如:CN113191215A使用的是二维时频数据,处理速度慢,并且仅在样本不平衡条件下效果较好,针对工况迁移诊断性一般;专利CN113505655A无法解决变转速或变负载迁移的工况进行同时诊断。综上所述,现有的智能诊断方法难以实现对轴承和齿轮进行不平衡样本下迁移工况的同步特征可解释性故障诊断。
发明内容
发明目的:本发明的目的在于解决现有技术中存在的不足,提供一种适用于高端装备的注意力孪生智能迁移可解释性诊断方法,可同时对轴承和齿轮进行不平衡样本下的迁移工况诊断,并且采用各类基于注意力或孪生网络的特征可视化方法对智能诊断模型学习到的特征进行可视化解释,推动智能故障诊断的实际应用进程。
技术方案:本发明的一种适用于高端装备的注意力孪生智能迁移可解释性诊断方法,包括以下步骤:
步骤S1、获取高端装备(如齿轮传动涡扇航空发动机)模拟试验台中轴承和齿轮的故障信号,得到轴承故障样本和齿轮故障样本;
步骤S2、对轴承故障样本和齿轮故障样本进行数据预处理:将三个变负载下的航空轴承数据和三个变转速下的行星齿轮数据进行顺序组合,并添加健康样本(即正常样本数据),将每类健康样本设置成不同的不平衡样本大小,并对不平衡样本做时频转换变换为频域信号(例如可采用短时傅里叶变换),同时做标准化处理;
步骤S3、构建注意力孪生智能迁移可解释性诊断模型
步骤S3.1、搭建双分支卷积神经网络模型,该双分支卷积神经网络模型共分为5个卷积层、5个池化层和一个全连接层,模型中包含批标准化层和L2正则化;
步骤S3.2、为使智能诊断模型诊断效果更好并且更具可解释性,设计跨模块串联的跨模块双注意力机制模块,并建立对应模块的特征可视化方法;
跨模块双注意力机制模块包括通道特征注意力模块CFAE和片段特征注意力模块FFAE,通过通道特征注意力模块CFAE增强不平衡样本不同通道中的特征值,通过片段特征注意力模块FFAE增强不平衡样本不同特征片段的特征值;
步骤S3.3、为更好地提取不平衡样本中的特征信息,同时也为模型可以提取出尽可能多的不同负载或转速下的融合域不变特征,引入对比损失函数来构建孪生特征融合网络模块;
步骤S3.4、将跨模块双注意力机制模块和孪生特征融合网络模块***双分支卷积神经网络模型,构建不平衡样本下的注意力孪生智能迁移可解释性诊断模型;其中通道特征注意力模块CFAE被放置于第3个池化层后,片段特征注意力模块FFAE被放置于第5个卷积层后,在全局平均池化(GAP)层应用孪生特征融合网络;
步骤S4、使用步骤S2标准化处理后的不平衡样本数据对注意力孪生智能迁移可解释性诊断模型进行训练,注意力孪生智能迁移可解释性诊断模型采用的是任意两种负载或转速下的不平衡样本数据进行训练,此处先用两个工况下的不平衡样本数据进行训练,后续再用其它工况下的数据进行测试(避免了传统迁移诊断方法需要使用与源域样本相同类别的目标域数据进行跟随训练的限制),更加满足实际的故障诊断应用要求(迁移诊断实际应用中很难获取到与源域数据相同类别并且数量尽可能一致的目标域数据);
步骤S5、使用测试集对注意力孪生智能迁移可解释性诊断模型进行诊断效果测试;经训练完成后的注意力孪生智能迁移可解释性诊断模型内部权重和偏置等参数固定,进而使用其它转速或负载下的数据对模型的诊断效果进行验证,绘制与其它模型的诊断对比箱型图及混淆矩阵,展示模型性能;
步骤S6、借助步骤S3中的跨模块双注意力机制模块,对注意力孪生智能迁移可解释性诊断模型学习到的统计特征进行可视化展示,首先展示通道特征注意力模块CFAE对不同通道特征的增强,然后展示片段特征注意力模块FFAE对不同片段的特征增强,同时对激活权重W2进行可视化展示,进而结合频谱波形,展示模型具体学习到了哪些统计特征信息;
步骤S7、借助步骤S3孪生特征融合网络模块,对注意力孪生智能迁移可解释性诊断模型学***衡样本中的不随工况转变的跨域融合与不变特征进行展示,进一步解释智能模型学习到的特征信息。
进一步地,所述步骤S3.1中的双分支卷积神经网络模型包括5个卷积层、5个池化层和一个全连接层,还包括批标准化层和L2正则化,其公式分别如下:
式中,m代表每批次的样本总量,代表每一批次的样本,/>和/>分别代表批量数据的平均值和标准差,/>和/>分别表示修正后的样本值,/>用于避免分母标准差为0的现象,γ和β分别是尺度因子和平移因子;
式中,E in 是原始的分类损失函数,是正则化参数,w代表模型中的权重参数。
进一步地,所述步骤S3.2中跨模块双注意力机制模块的详细内容为:通道特征注意力模块CFAE的表达式为:
式中,cfae是CFAE模块的特征输出,z(Pool_3)代表第三个池化层输出的特征,z activate 代表注意力激活的特征,是校正系数,C代表故障类别数,e是常数;
片段特征注意力模块FFAE的表达式为:
式中,ffae是FFAE模块的特征输出,W2代表对应于每一样本不同片段的激活权重,z j,m (i)是FFAE上一层的特征输出,A 1~A 8是样本对应于每一个特征片段激活值。
进一步地,所述步骤S3.3中损失函数的表达式为:
式中,代表对比损失层的参数,L Siamese 是孪生特征融合网络的损失,D(G 1 ,G 2 )代表来自两种转速或负载(G 1 ,G 2 )下的不平衡样本特征之间的距离,Q是一恒定常数,l代表网络层,n代表数量,N是指样本总数。
进一步地,所述步骤S3.4所得注意力孪生智能迁移可解释性诊断模型的总的损失函数可别表示为:
式中,N代表数量,C代表故障类别数,y是样本标签,p为标签正确的概率,L sum 代表总的损失,代表交叉熵损失的参数,/>代表正则化损失的参数,L entropy 是分类损失交叉熵损失项,L L 是正则化损失项,N代表样本总数。
进一步地,所述步骤S7中通道特征注意力模块CFAE对不同通道特征的增强后的值,其公式如下:
式中,z activate 代表特征注意力激活后的值,W1是注意力权重,是校正系数,z(Pool_3)代表第三个池化层输出的特征,z activate 代表注意力激活的特征,/>是校正系数,C代表故障类别数;
片段特征注意力模块FFAE权重的值,其公式如下:
式中,W2代表对应于每一样本不同片段的激活权重,z j,m (i)是FFAE上一层的特征输出,A 1~A 8是样本对应于每一个特征片段激活值。
有益效果:本发明提出一个能够同时对轴承和齿轮的不同类型故障进行不平衡样本下的变转速或变负载迁移智能诊断方法,该方法通过本发明设计的跨模块串联双注意力机制,有效增强了不平衡样本下小样本的特征信息,使模型能够更好地提取不平衡样本中的特征;同时,在提出的孪生特征融合网络的约束下,模型提取到了不随工况变化的不平衡样本下的域不变特征,可以更好地对其它工况下的数据进行诊断;最后,分别通过注意力机制和孪生特征融合网络中的特征对模型学习到的信息进行了可视化解释,增强了智能诊断模型的内部可解释性。
附图说明
图1为本发明智能诊断的整体流程图;
图2为本发明不平衡样本下的注意力孪生智能迁移可解释性模型示意图;
图3为本发明中模型在不同迁移工况下的诊断性能;
图4为本发明中模型在D1/D2→D3工况下的混淆矩阵;
图5为本发明中CFAE模块对不同通道特征增强效果图;
图6为本发明中FFAE模块对不同片段特征增强效果图;
图7为注意力与频域特征匹配图。
图8为本发明中孪生特征融合网络层提取的不平衡样本域不变特征图。
具体实施方式
下面对本发明技术方案进行详细说明,但是本发明的保护范围不局限于所述实施例。
如图1和图2所示,本发明的适用于高端装备的注意力孪生智能迁移可解释性诊断方法,可同时对轴承和齿轮进行诊断,并且采用各类基于注意力或孪生网络的特征可视化方法对智能诊断模型学习到的特征进行可视化解释,推动智能故障诊断的实际应用进程。具体包括以下步骤:
步骤S1:获取齿轮传动涡扇航空发动机高端装备模拟试验台中轴承和齿轮的故障信号,进而得到轴承故障样本和齿轮故障样本。
本实施例采用都灵理工大学超高速航空轴承在18000r/min下变负载(1000N,1400N和1800N)的数据,由于航空行星齿轮十分昂贵,采用自有的行星齿轮在变转速(1800r/min,2000r/min和2500r/min)下的数据,将两种数据进行组合,验证模型对轴承和行星齿轮的同时诊断性能。
步骤S2:对轴承故障样本和齿轮故障样本进行数据预处理
将三个变负载下的航空轴承数据和三个变转速下的行星齿轮数据进行顺序组合,并添加健康样本,将每类健康样本设置成不同的不平衡样本大小,并对其做时频转换变换为频域信号,同时做标准化处理。
本实施例共分为七种健康状况:正常样本(NR),轴承内圈压痕150μm(IRI150),轴承内圈压痕450μm(IRI450),轴承滚柱压痕450μm(RI450),行星轮点蚀(PGP),太阳轮点蚀(SGP)和太阳轮磨损(SGW);对于这七类健康状况,分别设置不同数量的样本大小,最低100个样本,最高500个样本。如图1所示,本实施例可将不平衡样本与工况1、工况2组成两个训练集,平衡样本与工况3组成测试集;前两个训练集同时输入未训练的诊断模型,将模型训练好后,用第三种工况下数据集进行验证。
步骤S3:构建注意力孪生智能迁移可解释性诊断模型
步骤S3.1:搭建双分支卷积神经网络模型,该双分支卷积神经网络模型共分为5个卷积层、5个池化层和一个全连接层,模型中包含批标准化层和L2正则化,其公式分别如下:
式中,和/>分别代表批量数据的平均值和标准差,/>用于避免分母标准差为0的现象,γ和β分别是尺度因子和平移因子;
式中,E in 是原始的分类损失函数,是正则化参数,w代表模型中的权重参数;
步骤S3.2:为使智能诊断模型诊断效果更好并且更具可解释性,设计跨模块双注意力机制模块,并建立对应模块的特征可视化方法。
本实施例的跨模块双注意力机制模块包括通道特征注意力模块(CFAE)和片段特征注意力模块(FFAE),通道特征注意力模块(CFAE)通过注意力增强不平衡样本不同通道中的特征值,经其注意力激活后的特征和经残差链接后的总公式分别被表示为:
式中,z activate 代表特征注意力激活后的值,W1是注意力权重,是校正系数,cfae是CFAE模块的特征输出,z(Pool_3)代表第三个池化层输出的特征,z activate 代表注意力激活的特征,/>是校正系数,C代表种类;
片段特征注意力模块(FFAE)通过注意力增强不平衡样本不同特征片段的特征值,其注意力权重W2和注意力公式分别被表示为:
式中,ffae是FFAE模块的特征输出,W2代表对应于每一样本不同片段的激活权重,z j,m (i)是FFAE上一层的特征输出,A 1~A 8是样本对应于每一个特征片段激活值;
步骤S3.3:为更好地提取不平衡样本中的特征信息,同时也为模型提取出尽可能多的不同负载或转速下的融合域不变特征,引入对比损失函数来构建孪生特征融合网络模块,孪生特征融合网络模块的损失函数和距离公式分别被表示为:
式中,代表对比损失层的参数,L Siamese 是孪生特征融合网络的损失,D(G 1 ,G 2 )代表来自两种转速或负载(G 1 ,G 2 )下的不平衡样本特征之间的距离,Q是一恒定常数,l代表网络层,n代表数量,dim代表维度;
步骤S3.4:将双注意力机制模块和孪生特征融合网络模块***双分支卷积网络模型,构建不平衡样本下的注意力孪生智能迁移可解释性诊断模型;
在注意力孪生智能迁移可解释性诊断模型中,通道特征注意力模块CFAE被放置于第三个池化层之后,片段特征注意力模块FFAE被放置于第5个卷积层之后,在全局平均池化(GAP)层应用孪生特征融合网络;
注意力孪生智能迁移可解释性诊断模型总损失函数表示为:
式中,N代表数量,C代表故障类别数,y是样本标签,p为标签正确的概率,L sum 代表总的损失,代表交叉熵损失的参数,/>代表正则化损失的参数,L entropy 是分类损失交叉熵损失项,L L 是正则化损失项。
本实施例的注意力孪生智能迁移可解释性诊断模型的详细参数如表1所示:
表1 所提模型详细参数表
层数 | 层类型 | 核大小/步长 | 通道数 | 批标准化 | 激活函数 |
1 | Conv_1 | 45*1/3*1 | 16 | Yes | Relu |
2 | Pool_1 | 2*1/2*1 | 16 | / | / |
3 | Conv_2 | 15*1/3*1 | 32 | Yes | Relu |
4 | Pool_2 | 2*1/2*1 | 32 | / | / |
5 | Conv_3 | 3*1/1*1 | 48 | Yes | Relu |
6 | Pool_3 | 2*1/2*1 | 48 | / | / |
7 | CFAE | / | 48 | / | / |
8 | Conv_4 | 3*1/1*1 | 64 | Yes | Relu |
9 | Pool_4 | 2*1/2*1 | 64 | / | / |
10 | Conv_5 | 3*1/1*1 | 64 | Yes | Relu |
11 | FFAE | / | 64 | / | |
12 | GAP | / | 64 | / | / |
13 | SFF | / | / | / | / |
14 | Fc1 | 64*10 | / | / | / |
15 | / | / | / | / | Softmax |
步骤S4:使用步骤S2中准备的不平衡样本数据(图1中的两个训练集)对注意力孪生智能迁移可解释性诊断模型进行训练,注意力孪生智能迁移可解释性诊断模型采用的是任意两种负载或转速下的不平衡样本数据进行训练,即:先用两个工况下的不平衡样本数据进行训练,再用其它工况下的数据进行测试;
步骤S5:对注意力孪生智能迁移可解释性诊断模型进行模型诊断效果测试;
经步骤S4训练后的注意力孪生智能迁移可解释性诊断模型内部权重和偏置等参数固定,进而使用其它转速或负载下的数据对模型的诊断效果进行验证,绘制图3为模型在不同迁移工况下的诊断性能和图4模型在D1/D2→D3工况下的混淆矩阵,展示模型性能。
步骤S6:借助跨模块双注意力机制模块对注意力孪生智能迁移可解释性诊断模型学习到的统计特征进行可视化展示。
首先展示CFAE模块对不同通道特征的增强,绘制图5CFAE模块对不同通道特征增强效果图;然后展示FFAE模块对不同片段的特征增强,同时对激活权重W2进行可视化展示,绘制图6 FFAE模块对不同片段特征增强效果图;进而结合频谱波形,展示模型具体学习到了哪些统计特征信息,绘制图7注意力与频域特征匹配图。
步骤S7:借助孪生特征融合网络模块对注意力孪生智能迁移可解释性诊断模型学***衡样本中的不随工况转变的跨域融合与不变特征进行展示,绘制图8孪生特征融合网络层提取的不平衡样本域不变特征图,进一步解释智能模型学习到的特征信息。
实施例:
以上述具体实施方式步骤1和2中描述的齿轮传动涡扇航空发动机模拟试验台中轴承和齿轮的智能故障诊断为例(如图2),来验证本发明的可行性。
本实施例各工况下的不平衡样本准备如表2所示:
表2 各不同工况下的轴承和齿轮不平衡样本设置样本量
表2中,D1~D3分别代表迁移工况1~3。从表中可以看出各类样本数量是参差不齐的,不平衡样本数最少的有100个样本,最多的500个样本。使用上述样本数据,同时使用两类工况下的不平衡样本数据进行训练,进而用第三类工况下的数据对模型进行测试,其在不同工况下的诊断性能如图3所示。在图3横坐标表示各工况时,为方便省略数据集符号“D”。图3中1/2→3表示D1/D2→D3工况,以此类推。从图中可以看出,所提出模型取得了相当好的诊断效果。即使在如此恶劣的条件下,使用不均匀的不平衡样本作为训练,同时针对多个检测部件,其诊断准确率均高于96%,且诊断稳定性较好。然而,对于D1/D3→D2和D3/D2→D1,模型的测试精度甚至略高于训练精度,这也在一定程度上证明了模型的自适应鲁棒性。
另外,从图4混淆矩阵中可以看出,本发明的注意力孪生智能迁移可解释性诊断模型对这些容易混淆的不平衡样本进行了正确分类,进一步证明了本发明的先进性。
从图5可以看出,CFAE模块相对于上层(Pool_3)的特征增强了CFAE层的特征。无论绝对值是大是小,这种增强都会发生。绝对值较小的特征增加幅度相对较小,绝对值较大的特征增加幅度相对较大。因为CFAE的原理是增强模型中不同通道的特征值,每个通道(通道1、通道13、通道25、通道37)都有一定的效果,所以把它放在片段特征增强网络的前面。为尽早将CFAE网络的性能应用到模型提取的更具体的特征上,将其放置在第三层池化层之后。
从图6 FFAE模型的片段特征增强效果可以看出,FFAE对选取的特征绝对值较大的片段进行了增强,忽略了特征值较小的部分,使得模型对增强显著的特征具有更好的分类效果。图6中选择的是通道1、通道20、通道38、通道54。
由图7可以看出(横坐标表示特征片段注意力也就是特征关注段,纵坐标表示不同断层类型的样本数量),对于没有任何故障的正常样本信号,FFAE网络的注意力分布几乎是均匀的,对特征段没有特别的关注。对于C1和C3这两种难以区分的故障类别,模型分别关注C1故障信号的低频部分和C3故障信号的高频部分,使模型最大限度地区分这两种特征。
图8展示了模型学***衡样本训练数据工况1和工况2。最后,从以上对各种特征的可视化分析可以得出,智能诊断模型学到的不是具有实际物理意义的故障特征频率,而是某一波形信号在统计特征上区别于其他波形信号的特征。
综上所述,本发明能够对轴承和齿轮在不平衡样本下的同步迁移诊断,同时,采用了多种特征可视化方法,使智能诊断模型内部的学习机制更具可解释性,解释了模型学习到的统计特征信息,进一步推进了智能诊断模型的应用进程。
Claims (6)
1.一种适用于高端装备的注意力孪生智能迁移可解释性诊断方法,其特征在于,包括以下步骤:
步骤S1、获取高端装备模拟试验台中轴承和齿轮的故障信号,得到轴承故障样本和齿轮故障样本;
步骤S2、数据预处理:将三个变负载下的轴承数据和三个变转速下的齿轮数据进行顺序组合,并添加健康样本,将每类健康样本设置成不同的不平衡样本大小,并对不平衡样本做时频转换变换为频域信号,同时做标准化处理;
步骤S3、构建注意力孪生智能迁移可解释性诊断模型
步骤S3.1、搭建双分支卷积神经网络模型,该双分支卷积神经网络模型共分为5个卷积层、5个池化层和一个全连接层,模型中包含批标准化层和L2正则化;
步骤S3.2、设计跨模块串联的跨模块双注意力机制模块,并建立对应模块的特征可视化方法;
跨模块双注意力机制模块包括通道特征注意力模块CFAE和片段特征注意力模块FFAE,通过通道特征注意力模块CFAE增强不平衡样本不同通道中的特征值,通过片段特征注意力模块FFAE增强不平衡样本不同特征片段的特征值;
步骤S3.3、引入对比损失函数来构建孪生特征融合网络模块;
步骤S3.4、将跨模块双注意力机制模块和孪生特征融合网络模块***双分支卷积神经网络模型,构建不平衡样本下的注意力孪生智能迁移可解释性诊断模型;其中CFAE模块被放置于第3个池化层后,FFAE模块被放置于第5个卷积层后,在全局平均池化GAP层应用孪生特征融合网络;
步骤S4、使用步骤S2所得不平衡样本数据对注意力孪生智能迁移可解释性诊断模型进行训练,注意力孪生智能迁移可解释性诊断模型采用的是任意两种负载或转速下的不平衡样本数据进行训练,此处先用两个工况下的不平衡样本数据进行训练;
步骤S5、使用测试集对注意力孪生智能迁移可解释性诊断模型进行诊断效果测试;经训练完成后的注意力孪生智能迁移可解释性诊断模型内部权重和偏置等参数固定,进而使用其它转速或负载下的数据对模型的诊断效果进行验证,绘制与其它模型的诊断对比箱型图及混淆矩阵,展示模型性能;
步骤S6、借助步骤S3中的跨模块双注意力机制模块,对注意力孪生智能迁移可解释性诊断模型学习到的统计特征进行可视化展示,首先展示通道特征注意力模块CFAE对不同通道特征的增强,然后展示片段特征注意力模块FFAE对不同片段的特征增强,同时对激活权重W2进行可视化展示,进而结合频谱波形,展示模型具体学习到了哪些统计特征信息;
步骤S7、借助步骤S3孪生特征融合网络模块,对注意力孪生智能迁移可解释性诊断模型学***衡样本中的不随工况转变的跨域融合与不变特征进行展示,进一步解释智能模型学习到的特征信息。
2.根据权利要求1所述的适用于高端装备的注意力孪生智能迁移可解释性诊断方法,其特征在于,所述步骤S3.1中的双分支卷积神经网络模型包括5个卷积层、5个池化层和一个全连接层,还包括批标准化层和L2正则化,其公式分别如下:
式中,m代表每批次的样本总量,代表每一批次的样本,/>和/>分别代表批量数据的平均值和标准差,/>和/>分别表示修正后的样本值,/>用于避免分母标准差为0的现象,γ和β分别是尺度因子和平移因子;
式中,E in 是原始的分类损失函数,是正则化参数,w代表模型中的权重参数。
3.根据权利要求1所述的适用于高端装备的注意力孪生智能迁移可解释性诊断方法,其特征在于,所述步骤S3.2中跨模块双注意力机制模块的详细内容为:通道特征注意力模块CFAE的表达式为:
式中,cfae是CFAE模块的特征输出,z(Pool_3)代表第三个池化层输出的特征,z activate 代表注意力激活的特征,是校正系数,C代表故障类别数,e是常数;
片段特征注意力模块FFAE的表达式为:
式中,ffae是FFAE模块的特征输出,W2代表对应于每一样本不同片段的激活权重,z j,m (i)是FFAE上一层的特征输出,A 1~A 8是样本对应于每一个特征片段激活值。
4.根据权利要求1所述的适用于高端装备的注意力孪生智能迁移可解释性诊断方法,其特征在于,所述步骤S3.3中损失函数的表达式为:
式中,代表对比损失层的参数,L Siamese 是孪生特征融合网络的损失,D(G 1 ,G 2 )代表来自两种转速或负载(G 1 ,G 2 )下的不平衡样本特征之间的距离,Q是一恒定常数,l代表网络层,n代表数量,N是指样本总数。
5.根据权利要求1所述的适用于高端装备的注意力孪生智能迁移可解释性诊断方法,其特征在于,所述步骤S3.4所得注意力孪生智能迁移可解释性诊断模型的总的损失函数表示为:
式中,N代表数量,C代表故障类别数,y是样本标签,p为标签正确的概率,L sum 代表总的损失,代表交叉熵损失的参数,/>代表正则化损失的参数,L entropy 是分类损失交叉熵损失项,L L 是正则化损失项,N代表样本总数。
6.根据权利要求1所述的适用于高端装备的注意力孪生智能迁移可解释性诊断方法,其特征在于,所述步骤S7中通道特征注意力模块CFAE对不同通道特征的增强后的值,其公式如下:
;
式中,z activate 代表特征注意力激活后的值,W1是注意力权重,是校正系数, z(Pool_3)代表第三个池化层输出的特征,z activate 代表注意力激活的特征,/>是校正系数,C代表故障类别数;
片段特征注意力模块FFAE权重的值,其公式如下:
式中,W2代表对应于每一样本不同片段的激活权重,z j,m (i)是FFAE上一层的特征输出,A 1~A 8是样本对应于每一个特征片段激活值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311316905.5A CN117574259B (zh) | 2023-10-12 | 2023-10-12 | 适用于高端装备的注意力孪生智能迁移可解释性诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311316905.5A CN117574259B (zh) | 2023-10-12 | 2023-10-12 | 适用于高端装备的注意力孪生智能迁移可解释性诊断方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117574259A true CN117574259A (zh) | 2024-02-20 |
CN117574259B CN117574259B (zh) | 2024-05-07 |
Family
ID=89886949
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311316905.5A Active CN117574259B (zh) | 2023-10-12 | 2023-10-12 | 适用于高端装备的注意力孪生智能迁移可解释性诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117574259B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109035297A (zh) * | 2018-07-19 | 2018-12-18 | 深圳市唯特视科技有限公司 | 一种基于双重暹罗网络的实时追踪方法 |
CN111626171A (zh) * | 2020-05-21 | 2020-09-04 | 青岛科技大学 | 基于视频片段注意力机制与交互关系活动图建模的群组行为识别方法 |
CN113191215A (zh) * | 2021-04-12 | 2021-07-30 | 西安理工大学 | 融合注意力机制与孪生网络结构的滚动轴承故障诊断方法 |
CN113609896A (zh) * | 2021-06-22 | 2021-11-05 | 武汉大学 | 基于对偶相关注意力的对象级遥感变化检测方法及*** |
CN114842363A (zh) * | 2022-07-04 | 2022-08-02 | 南方电网科学研究院有限责任公司 | 一种数字孪生台区关键电力设备的识别方法及*** |
CN115545092A (zh) * | 2022-08-31 | 2022-12-30 | 哈尔滨工业大学(威海) | 一种基于深度孪生自注意力网络的航空发动机小样本故障诊断方法 |
WO2023007198A1 (en) * | 2021-07-27 | 2023-02-02 | Számítástechnikai És Automatizálási Kutatóintézet | Training method for training a change detection system, training set generating method therefor, and change detection system |
CN116106012A (zh) * | 2021-11-11 | 2023-05-12 | 中国科学院沈阳自动化研究所 | 一种基于注意力机制的滚动轴承域适应故障诊断方法 |
CN116401603A (zh) * | 2023-04-26 | 2023-07-07 | 哈尔滨工程大学 | 一种基于迁移学习的多模态轴承故障智能诊断方法 |
CN116563337A (zh) * | 2023-04-11 | 2023-08-08 | 武汉大学 | 基于双注意力机制的目标跟踪方法 |
US20230274531A1 (en) * | 2022-02-09 | 2023-08-31 | Soochow University | Global and local feature reconstruction network-based medical image segmentation method |
-
2023
- 2023-10-12 CN CN202311316905.5A patent/CN117574259B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109035297A (zh) * | 2018-07-19 | 2018-12-18 | 深圳市唯特视科技有限公司 | 一种基于双重暹罗网络的实时追踪方法 |
CN111626171A (zh) * | 2020-05-21 | 2020-09-04 | 青岛科技大学 | 基于视频片段注意力机制与交互关系活动图建模的群组行为识别方法 |
CN113191215A (zh) * | 2021-04-12 | 2021-07-30 | 西安理工大学 | 融合注意力机制与孪生网络结构的滚动轴承故障诊断方法 |
CN113609896A (zh) * | 2021-06-22 | 2021-11-05 | 武汉大学 | 基于对偶相关注意力的对象级遥感变化检测方法及*** |
WO2023007198A1 (en) * | 2021-07-27 | 2023-02-02 | Számítástechnikai És Automatizálási Kutatóintézet | Training method for training a change detection system, training set generating method therefor, and change detection system |
CN116106012A (zh) * | 2021-11-11 | 2023-05-12 | 中国科学院沈阳自动化研究所 | 一种基于注意力机制的滚动轴承域适应故障诊断方法 |
US20230274531A1 (en) * | 2022-02-09 | 2023-08-31 | Soochow University | Global and local feature reconstruction network-based medical image segmentation method |
CN114842363A (zh) * | 2022-07-04 | 2022-08-02 | 南方电网科学研究院有限责任公司 | 一种数字孪生台区关键电力设备的识别方法及*** |
CN115545092A (zh) * | 2022-08-31 | 2022-12-30 | 哈尔滨工业大学(威海) | 一种基于深度孪生自注意力网络的航空发动机小样本故障诊断方法 |
CN116563337A (zh) * | 2023-04-11 | 2023-08-08 | 武汉大学 | 基于双注意力机制的目标跟踪方法 |
CN116401603A (zh) * | 2023-04-26 | 2023-07-07 | 哈尔滨工程大学 | 一种基于迁移学习的多模态轴承故障智能诊断方法 |
Non-Patent Citations (4)
Title |
---|
KAI HUANG等: "SiamCAM: A real-time Siamese network for object tracking with compensating attention mechanism", 《APPL. SCI.》, vol. 12, no. 8, 13 April 2022 (2022-04-13), pages 1 - 16 * |
KUN XU等: "Interpretable Siamese dual attention enhancement transfer compound diagnostic model for unbalanced samples", 《STRUCTURAL HEALTH MONITORING》, 7 March 2024 (2024-03-07) * |
薛俊康: "基于双支结构深度学习模型的建筑物变化检测", 《中国优秀硕士学位论文全文数据库_工程科技Ⅱ辑》, 15 August 2023 (2023-08-15), pages 028 - 24 * |
赵文清等: "基于改进YOLOv5s的输电线路螺栓缺销检测方法", 《华北电力大学学报(自然科学版)》, 7 September 2022 (2022-09-07), pages 1 - 10 * |
Also Published As
Publication number | Publication date |
---|---|
CN117574259B (zh) | 2024-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109765053B (zh) | 利用卷积神经网络和峭度指标的滚动轴承故障诊断方法 | |
Sinitsin et al. | Intelligent bearing fault diagnosis method combining mixed input and hybrid CNN-MLP model | |
CN109186973B (zh) | 一种无监督深度学习网络的机械故障诊断方法 | |
CN112418013B (zh) | 一种小样本下基于元学习的复杂工况轴承故障诊断方法 | |
CN111914883B (zh) | 一种基于深度融合网络的主轴轴承状态评估方法及装置 | |
CN109858352B (zh) | 一种基于压缩感知与改进多尺度网络的故障诊断方法 | |
CN112036547B (zh) | 自动特征提取结合lstm的滚动轴承剩余寿命预测方法 | |
CN110108456A (zh) | 一种深度卷积神经网络的旋转机械健康评估方法 | |
CN109782603A (zh) | 旋转机械耦合故障的检测方法及监测*** | |
CN112396109A (zh) | 基于递归图与多层卷积神经网络的电机轴承故障诊断方法 | |
CN112304614B (zh) | 采用多注意力机制的端到端滚动轴承智能故障诊断方法 | |
CN111046945A (zh) | 基于组合卷积神经网络的故障类型及损坏程度诊断方法 | |
CN110595780A (zh) | 基于振动灰度图像和卷积神经网络的轴承故障识别方法 | |
CN112257528B (zh) | 一种基于小波变换和密集连接扩张卷积神经网络的风电齿轮箱故障诊断方法 | |
CN112378660A (zh) | 一种基于数据驱动的航空发动机轴承智能故障诊断方法 | |
CN110991295A (zh) | 一种基于一维卷积神经网络的自适应故障诊断方法 | |
CN114755017B (zh) | 一种跨域数据驱动无监督领域共享网络的变转速轴承故障诊断方法 | |
CN116793682A (zh) | 基于iCORAL-MMD和对抗迁移学习的轴承故障诊断方法 | |
CN114034481A (zh) | 一种轧机齿轮箱故障诊断***及方法 | |
CN112766200A (zh) | 基于一维卷积神经网络的行星齿轮箱小样本故障诊断方法 | |
CN111444871A (zh) | 一种多尺度深度卷积神经网络行星齿轮箱故障诊断方法 | |
CN114169377A (zh) | 基于g-mscnn的有噪环境中滚动轴承故障诊断方法 | |
CN113537152A (zh) | 一种基于深度神经网络的流场状态故障检测方法 | |
CN113776835A (zh) | 基于增强梅尔线性频率倒谱系数的滚动轴承故障诊断方法 | |
CN116358871A (zh) | 基于图卷积网络的滚动轴承微弱信号复合故障诊断方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |