CN116735170A - 一种基于自注意力多尺度特征提取的智能故障诊断方法 - Google Patents
一种基于自注意力多尺度特征提取的智能故障诊断方法 Download PDFInfo
- Publication number
- CN116735170A CN116735170A CN202310453026.0A CN202310453026A CN116735170A CN 116735170 A CN116735170 A CN 116735170A CN 202310453026 A CN202310453026 A CN 202310453026A CN 116735170 A CN116735170 A CN 116735170A
- Authority
- CN
- China
- Prior art keywords
- self
- attention
- feature extraction
- layer
- equipment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000000605 extraction Methods 0.000 title claims abstract description 33
- 238000003745 diagnosis Methods 0.000 title claims abstract description 27
- 238000012549 training Methods 0.000 claims abstract description 19
- 230000005236 sound signal Effects 0.000 claims abstract description 17
- 238000012795 verification Methods 0.000 claims abstract description 9
- 230000006870 function Effects 0.000 claims description 36
- 230000007246 mechanism Effects 0.000 claims description 19
- 238000012360 testing method Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 6
- 238000011176 pooling Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 230000036541 health Effects 0.000 claims description 3
- 238000001228 spectrum Methods 0.000 claims description 3
- 238000013480 data collection Methods 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 238000013527 convolutional neural network Methods 0.000 description 6
- 238000011160 research Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2131—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on a transform domain processing, e.g. wavelet transform
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/04—Bearings
- G01M13/045—Acoustic or vibration analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Acoustics & Sound (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明公开了一种基于自注意力多尺度特征提取的智能故障诊断方法,首先通过传感器采集待测设备的音频信号,建立训练集和验证集;接下来对传感器采集的待测设备运行数据进行短时傅里叶变换,获得同时带有时域特征和频域特征的频谱图;再对频谱图进行归一化;然后建立智能学习模型,提取频谱图的特征进行分类并对智能学习模型进行训练;最后对采集的信号,通过训练完成的智能学习模型,得到特征值,该特征值与数据库中特征值进行检索、匹配从而实现故障的诊断确定。本发明能够在短时间内诊断出故障类型,并且准确率优于其它模型。
Description
技术领域
本发明属于故障检测技术领域,具体涉及一种智能故障诊断方法。
背景技术
现如今,机械设备已经趋于自主化,其应用越来越广泛,并且不断向复杂化、智能化、***化的方向发展。大型机械设备的结构更加复杂,是由很多小零件组成,其中的部分零件发生损坏,对其他零件都会造成影响,很可能会降低生产效益和造成经济损失,甚至会造成人员伤亡。为了保障机械设备的正常运行以及提高其安全性能,对机械设备进行故障监测是非常有必要的。
现有技术中,通常使用机器学习方法,如支持向量机(SVM)、人工神经网络(ANN)等进行零件故障诊断,或者使用深度学习方法,如卷积神经网络(CNN)、自编码器(AE)等进行零件故障诊断。深度学习在智能故障诊断方面的研究中发挥了非常重要的作用,而卷积神经网络是非常常用的一种网络,借助其强大的特征提取能力使得诊断性能大幅提升。
但是在以往的研究中,发现卷积神经网络都是采用单尺度的卷积核,这样会导致在整个卷积过程中,对输入信号的感受野大小是固定的,提取的特征数据维度比较单一。在整个特征提取过程中对输入数据的每个部分使用一致权重,导致提取特征的过程比较耗时。
所以如何利用现有的数据,提取更多能够表征故障的特征是非常重要的问题。在现有的智能故障诊断研究中,设计出一种可以多方面、多角度提取故障特征的网络是解决问题的突破口。
发明内容
为了克服现有技术的不足,本发明提供了一种基于自注意力多尺度特征提取的智能故障诊断方法,首先通过传感器采集待测设备的音频信号,建立训练集和验证集;接下来对传感器采集的待测设备运行数据进行短时傅里叶变换,获得同时带有时域特征和频域特征的频谱图;再对频谱图进行归一化;然后建立智能学习模型,提取频谱图的特征进行分类并对智能学习模型进行训练;最后对采集的信号,通过训练完成的智能学习模型,得到特征值,该特征值与数据库中特征值进行检索、匹配从而实现故障的诊断确定。本发明能够在短时间内诊断出故障类型,并且准确率优于其它模型。
本发明解决其技术问题所采用的技术方案包括如下步骤:
步骤1:通过传感器采集待测设备的音频信号,获取带有故障标签标注的设备音频信号作为训练集和验证集,获取无标注的设备音频信号作为测试集;所述设备音频信号为用于判断待测设备是否发生故障的传感器数据;所述故障标签为目标零件发生故障的类型;
步骤2:对传感器采集的待测设备运行数据进行短时傅里叶变换,获得同时带有时域特征和频域特征的频谱图;再对频谱图进行归一化;
步骤3:建立智能学习模型,提取步骤2得到的频谱图的特征,并进行分类;特征通过加入了自注意力机制的多尺度卷积网络进行提取;
在训练过程中,当不同工作条件的设备在不同工况下的故障均被训练储存后,将生成待测设备的特征数据,不同故障类型被以不同的特征值集合形式保存;
步骤4:当模型被采集的信号拟合完成后,待测的设备经过步骤1和步骤2的数据采集和数据处理过程,然后通过步骤3训练完成的智能学习模型,得到特征值,该特征值与数据库中特征值进行检索、匹配从而实现故障的诊断确定。
进一步地,所述短时傅里叶变换是先把一个函数和窗函数进行相乘,然后再进行一维的傅里叶变换,并通过窗函数的滑动得到一系列的频谱函数,将这些结果依次拼接得到一个二维的时频图;基本运算公式如下:
式中,x(t)为时域信号,h(t-ω)为窗函数。
进一步地,所述智能学习模型具体如下:
步骤3-1:所述智能学习模型由多个隐层堆叠组成,包括多尺度卷积层、自注意力层、拼接层和全连接层,每个卷积变换层还包括BN层、池化层和非线性激活ReLU层,全连接层采用SoftMax激活函数对故障进行分类识别;智能学习模型结构见表1:
表1智能学习模型结构
上表中的n表示设备的故障类别数。
步骤3-2:特征提取流程如下:
1、将原始的音频信号X={x1,x2,…,xn}输入到短时傅里叶变换中得到其频谱图STFT(X);
2、将频谱图输入到多尺度卷积层进行特征提取,卷积计算公式如下:
其中,分别表示3个不同的卷积核,z1,z2,z3表示不同卷积核计算出的结果;
3、对卷积变换层输出的特征数据进行归一化处理,并在各个特征下进行约束;
4、通过最大池化层对归一化后的特征数据进行降维;
5、对不同通道的特征进行拼接组合,将二维特征展开成一维向量形式,采用“层间全连接,层内无连接”原则,将维度降低为设备健康状态的类别数;
6、在经过上述网络层的特征提取后,输出特征进一步输入到Softmax分类器中以实现状态识别与故障分类。
步骤3-3:在特征提取过程中,加入了自注意力机制,通过多尺度核匹配提取的特征输入到自注意力机制模型中
步骤3-4:将创建的智能学习模型在训练集上进行训练,使用Adam优化算法对目标函数进行优化,在经过多次迭代之后,使用验证集测试优化效果并调整参数,最后使用测试集来验证网络是否优化完成。
使用交叉熵损失函数作为目标函数,函数表达式如下:
C表示类别数量,p表示神经网络的输出。
进一步地,所述自注意力机制表示如下:
自注意力机制采用查询-键-值得模型,对于输入H=(h1,h2,…,hn),分别与三个矩阵Wq,Wk,Wv相乘,得到查询Q、键K、值V,具体如下:
Q=H·Wq
K=H·Qk
V=H·Wv
计算注意力函数:
其中注意力函数得结果就是经过注意力加权后的特征,进行特征提取与分类。
本发明的有益效果如下:
1、本发明所述的一种基于自注意力多尺度特征提取的智能故障诊断方法,采用音频信号作为诊断数据,采用多种工况下的设备运行数据,有利于暴露随转速和角度变化的故障特征,为特征的提取提供了基础;
2、将处理后的音频数据作为自注意多尺度特征提取模型的输入,该模型采用了多尺度卷积的方法进行特征提取,首先由三个不同尺度的卷积核并行卷积运算,可以同时兼顾局部和全局的特征,然后加入了自注意力机制,使得模型具有自主学习重要特征的能力,接下来使用单尺度卷积进一步提取特征,最后使用分类器进行故障识别。因此从频谱图中可以得到丰富的信息,这些信息包含了设备的故障情况。
3、本发明提出了一个较小的网络模型,其参数相比较其他方法而言是非常小的,从而导致收敛速度快,将训练好的模型应用于实际设备中,能够在短时间内诊断出故障类型,并且准确率优于其它模型。
附图说明
图1为本发明方法总体框架图。
图2为本发明短时傅里叶变换示意图。
图3为本发明详细网络模型图。
图4为本发明特征维度变换示意图。
图5为本发明自注意力机制框架图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
根据现有神经网络在提取特征时忽略全局特征或者局部特征的不足,本发明实施的目的在于提供一种基于自注意力多尺度特征提取的故障诊断方法,在提取特征的同时兼顾局部特征核全局特征;由于每个局部信息对图像能否被正确识别的影响力是不同的,所以需要告知模型图像中不同局部信息的重要性,因此在提取特征的过程中,加入了自注意力机制,使模型自主定位有用的信息,抑制无用的信息。实现了根据实际采集的设备音频数据,诊断其是否存在故障,并分析出故障类型,提升了实际故障诊断应用中的诊断效果。
本发明提出了一种基于自注意力多尺度特征提取的智能故障诊断的方法,该方法的整体结构如图1所示,包括:
步骤1、通过传感器采集待测设备的音频信号,根据设备的类型,对其进行一定工作条件的运转,采集不同工况下的数据;获取带有故障标签标注的设备音频信号作为训练集和验证集,获取无标注的设备音频信号作为测试集;所述设备音频信号为用于判断待测设备是否发生故障的传感器数据;所述故障标签为目标零件发生故障的类型;根据设备的类型,对其进行一定的故障信号分析;
步骤2、对传感器采集的设备运行数据进行分析,对其进行短时傅里叶变换,获得同时带有时域特征和频域特征的频谱图,如图2所示,从频谱图中可以非常清楚地看到信号时间和频率的分布,并且输入数据中的特征是多域特征,能够更加全面地表征故障状态;
短时傅里叶变换的基本思想是先把一个函数和窗函数进行相乘,然后再进行一维的傅里叶变换,并通过窗函数的滑动得到一系列的频谱函数,将这些结果依次拼接得到一个二维的时频图。基本运算公式如下:
式中,x(t)为时域信号,h(t-ω)为窗函数。
同时为了避免在特征提取过程中因为某个值过大而导致其他值被忽略的情况,需要对频谱图进行归一化,将其规定在一个合理的范围内。
步骤3、建立的智能学习模型如图3所示,自主提取步骤2得到的频谱图的特征点信息,进行特征识别,特别重要的是,采用了多尺度卷积的方法对特征进行提取,可以同时兼顾局部和全局的特征,并且加入了自注意力机制,模型可以自主提取重要的特征用于分类识别。在训练过程中,当不同工作条件的设备在不同工况下的故障均被训练储存后,将生成待测设备的特征数据,不同故障类型被以不同的特征值集合形式保存。同时为了避免在特征提取过程中因为某个值过大而导致其他值被忽略的情况,需要对每层网络的输出进行归一化,将其规定在一个合理的范围内。在整个过程中的特征维度变化如图4所示。
本发明提出的多尺度特征提取是指在卷积计算中,使用多个不同尺寸的卷积核同步进行特征提取,卷积核是对输入数据的局部感知,核越大,感知的范围越大,就能够得到相较于小核更全面的特征,将多尺度卷积提取的特征合并对于进一步提取更有益处。
智能学习模型由多个隐层堆叠组成,包括多尺度卷积层、自注意力层、拼接层和全连接层,每个卷积变换层还包括BN层、池化层和非线性激活ReLU层,全连接层采用SoftMax激活函数对故障进行分类识别。图1为本发明提出的方法的网络结构:
以下为特征提取的流程:
1、将原始的音频信号X={x1,x2,…,xn}输入到短时傅里叶变换中得到其频谱图STFT(X);
2、将频谱图输入到多尺度卷积层进行特征提取,卷积计算公式如下:
其中,k1,k2,k3分别表示3个不同的卷积核,z1,z2,z3表示不同卷积核计算出的结果;
3、由于不同尺度下特征的量值具有较大差异,为避免某一个特征量的值过大导致其余特征被忽略,对卷积变换层输出的特征数据进行归一化处理,并在各个特征下进行约束;
4、然后通过最大池化层对归一化后的特征数据进行降维,目的是使卷积层的输出特征维度保持一致;
5、对不同通道的特征进行拼接组合,将二维特征展开成一维向量形式,采用“层间全连接,层内无连接”原则,将维度降低为健康状态的类别数;
6、在经过上述网络层的特征提取后,输出特征将被进一步输入到Softmax分类器中以实现状态识别与故障分类。
步骤4、在特征提取过程中,加入了自注意力机制,通过多尺度核匹配提取的特征输入到自注意力机制模型中,目的是为了使模型自主根据重要性权重学习重要特征,自注意力机制的结构如图5所示。
其中,自注意力机制的详细原理如下:
自注意力机制一般采用查询-键-值得模型,对于输入H=(h1,h2,…,hn),分别与三个矩阵Wq,Wk,Wv相乘,得到查询Q、键K、值V,具体如下:
Q=H·Wq
K=H·Wk
V=H·Wv
接下来计算注意力函数:
其中注意力函数得结果就是经过注意力加权后得特征,可以进行后面特征提取与分类。
步骤5、将创建的网络模型在训练集上进行训练,使用Adam优化算法对目标函数进行优化,在经过多次迭代之后,使用验证集测试优化效果并微调参数,最后使用测试集来验证网络是否优化完成。
其中,由于提出的方法用于多分类问题,所以使用交叉熵损失函数作为目标函数,函数表达式如下:
C表示类别数量,p表示神经网络的输出。
步骤6、当模型被采集的信号拟合完成后,待测的设备经过完整的数据采集、数据处理以及特征提取过程,形成一套新的特征值,该特征值与数据库中特征值进行检索、匹配从而实现故障的诊断确定。
具体实施例:
为了验证本发明方法的有效性,选择了凯西斯储大学的轴承数据进行验证,取负载条件为0HP、1HP和2HP的部分轴承数据,数据的具体划分如表2。
表2
在3个数据集上训练和测试网络,在所有数据中取出70%作为训练集、20%作为验证集以及10%作为测试集。并且搭建了两个对比试验进行比较。
对比方法1:CNN(Convolutional neural network,卷积神经网络)网络结构与使用单尺度卷积。
对比方法2:SAE(Stacked Auto-Encoder,堆叠式自编码器)多层稀疏自编码器组成的深度神经网络模型。
具体的实验如表3所示。
表3
从实验结果可以看出,在数据有限的情况下,本发明提出的方法的诊断效果最好,达到了99%的正确率,而两个对比网络的准确率分别是76.7%和84.9%,充分表明了本发明提出的方法在智能故障诊断领域的有效性。
Claims (4)
1.一种基于自注意力多尺度特征提取的智能故障诊断方法,其特征在于,包括如下步骤:
步骤1:通过传感器采集待测设备的音频信号,获取带有故障标签标注的设备音频信号作为训练集和验证集,获取无标注的设备音频信号作为测试集;所述设备音频信号为用于判断待测设备是否发生故障的传感器数据;所述故障标签为目标零件发生故障的类型;
步骤2:对传感器采集的待测设备运行数据进行短时傅里叶变换,获得同时带有时域特征和频域特征的频谱图;再对频谱图进行归一化;
步骤3:建立智能学习模型,提取步骤2得到的频谱图的特征,并进行分类;特征通过加入了自注意力机制的多尺度卷积网络进行提取;
在训练过程中,当不同工作条件的设备在不同工况下的故障均被训练储存后,将生成待测设备的特征数据,不同故障类型被以不同的特征值集合形式保存;
步骤4:当模型被采集的信号拟合完成后,待测的设备经过步骤1和步骤2的数据采集和数据处理过程,然后通过步骤3训练完成的智能学习模型,得到特征值,该特征值与数据库中特征值进行检索、匹配从而实现故障的诊断确定。
2.根据权利要求1所述的一种基于自注意力多尺度特征提取的智能故障诊断方法,其特征在于,所述短时傅里叶变换是先把一个函数和窗函数进行相乘,然后再进行一维的傅里叶变换,并通过窗函数的滑动得到一系列的频谱函数,将这些结果依次拼接得到一个二维的时频图;基本运算公式如下:
式中,x(t)为时域信号,h(t-ω)为窗函数。
3.根据权利要求1所述的一种基于自注意力多尺度特征提取的智能故障诊断方法,其特征在于,所述智能学习模型具体如下:
步骤3-1:所述智能学习模型由多个隐层堆叠组成,包括多尺度卷积层、自注意力层、拼接层和全连接层,每个卷积变换层还包括BN层、池化层和非线性激活ReLU层,全连接层采用SoftMax激活函数对故障进行分类识别;智能学习模型结构见表1:
表1智能学习模型结构
上表中的n表示设备的故障类别数;
步骤3-2:特征提取流程如下:
1、将原始的音频信号X={x1,x2,…,xn}输入到短时傅里叶变换中得到其频谱图STFT(X);
2、将频谱图输入到多尺度卷积层进行特征提取,卷积计算公式如下:
其中,分别表示3个不同的卷积核,z1,z2,z3表示不同卷积核计算出的结果;
3、对卷积变换层输出的特征数据进行归一化处理,并在各个特征下进行约束;
4、通过最大池化层对归一化后的特征数据进行降维;
5、对不同通道的特征进行拼接组合,将二维特征展开成一维向量形式,采用“层间全连接,层内无连接”原则,将维度降低为设备健康状态的类别数;
6、在经过上述网络层的特征提取后,输出特征进一步输入到Softmax分类器中以实现状态识别与故障分类;
步骤3-3:在特征提取过程中,加入了自注意力机制,通过多尺度核匹配提取的特征输入到自注意力机制模型中
步骤3-4:将创建的智能学习模型在训练集上进行训练,使用Adam优化算法对目标函数进行优化,在经过多次迭代之后,使用验证集测试优化效果并调整参数,最后使用测试集来验证网络是否优化完成;
使用交叉熵损失函数作为目标函数,函数表达式如下:
C表示类别数量,p表示神经网络的输出。
4.根据权利要求1所述的一种基于自注意力多尺度特征提取的智能故障诊断方法,其特征在于,所述自注意力机制表示如下:
自注意力机制采用查询-键-值得模型,对于输入H=(h1,h2,…,hn),分别与三个矩阵Wq,Wk,Wv相乘,得到查询Q、键K、值V,具体如下:
Q=H·Wq
K=H·Wk
V=H·Wv
计算注意力函数:
其中注意力函数得结果就是经过注意力加权后的特征,进行特征提取与分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310453026.0A CN116735170A (zh) | 2023-04-25 | 2023-04-25 | 一种基于自注意力多尺度特征提取的智能故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310453026.0A CN116735170A (zh) | 2023-04-25 | 2023-04-25 | 一种基于自注意力多尺度特征提取的智能故障诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116735170A true CN116735170A (zh) | 2023-09-12 |
Family
ID=87914050
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310453026.0A Pending CN116735170A (zh) | 2023-04-25 | 2023-04-25 | 一种基于自注意力多尺度特征提取的智能故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116735170A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117591813A (zh) * | 2024-01-18 | 2024-02-23 | 广东工业大学 | 基于多维特征的复杂装备故障诊断方法及*** |
CN117972398A (zh) * | 2024-03-28 | 2024-05-03 | 北京索弗电气科技有限公司 | 一种断路器故障特征信息提取方法及*** |
-
2023
- 2023-04-25 CN CN202310453026.0A patent/CN116735170A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117591813A (zh) * | 2024-01-18 | 2024-02-23 | 广东工业大学 | 基于多维特征的复杂装备故障诊断方法及*** |
CN117591813B (zh) * | 2024-01-18 | 2024-04-19 | 广东工业大学 | 基于多维特征的复杂装备故障诊断方法及*** |
CN117972398A (zh) * | 2024-03-28 | 2024-05-03 | 北京索弗电气科技有限公司 | 一种断路器故障特征信息提取方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110132598B (zh) | 旋转设备滚动轴承故障噪声诊断算法 | |
CN116735170A (zh) | 一种基于自注意力多尺度特征提取的智能故障诊断方法 | |
CN112036301B (zh) | 一种基于类内特征迁移学习与多源信息融合的驱动电机故障诊断模型构建方法 | |
CN111273623B (zh) | 基于Stacked LSTM的故障诊断方法 | |
CN112508105B (zh) | 一种采油机故障检测与检索方法 | |
CN111721535A (zh) | 一种基于卷积多头自注意力机制的轴承故障检测方法 | |
CN112257530B (zh) | 基于盲信号分离和支持向量机的滚动轴承故障诊断方法 | |
CN110795843B (zh) | 一种识别滚动轴承故障的方法及装置 | |
CN108875772B (zh) | 一种基于堆叠稀疏高斯伯努利受限玻尔兹曼机和强化学习的故障分类模型及方法 | |
CN113865868B (zh) | 基于时频域表达的滚动轴承故障诊断方法 | |
CN111753891B (zh) | 一种无监督特征学习的滚动轴承故障诊断方法 | |
CN108509701B (zh) | 一种基于振动信号的旋转机械故障直接智能诊断方法 | |
CN110044623A (zh) | 经验模态分解剩余信号特征的滚动轴承故障智能识别方法 | |
Wu et al. | A transformer-based approach for novel fault detection and fault classification/diagnosis in manufacturing: A rotary system application | |
CN112487890B (zh) | 一种基于并行稀疏滤波的轴承声信号故障诊断方法 | |
CN114429152A (zh) | 基于动态指数对抗性自适应的滚动轴承故障诊断方法 | |
CN113158722A (zh) | 基于多尺度深度神经网络的旋转机械故障诊断方法 | |
CN115424635B (zh) | 一种基于声音特征的水泥厂设备故障诊断方法 | |
CN115758200A (zh) | 一种基于相似度度量的振动信号故障识别方法及*** | |
CN110020637A (zh) | 一种基于多粒度级联森林的模拟电路间歇故障诊断方法 | |
CN114462475A (zh) | 一种基于单分类算法的无监督机器异常声检测方法和装置 | |
CN114091525A (zh) | 一种滚动轴承退化趋势预测方法 | |
CN116935892A (zh) | 一种基于音频关键特征动态聚合的工业阀门异常检测方法 | |
CN115273791A (zh) | 一种基于声学特征驱动的工业装备故障检测方法及装置 | |
CN113792597A (zh) | 一种基于自监督特征提取的机械设备异常声音检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |