CN116735170A

CN116735170A - 一种基于自注意力多尺度特征提取的智能故障诊断方法

Info

Publication number: CN116735170A
Application number: CN202310453026.0A
Authority: CN
Inventors: 于洋; 王亚周; 王玉飞
Original assignee: Northwestern Polytechnical University
Current assignee: Northwestern Polytechnical University
Priority date: 2023-04-25
Filing date: 2023-04-25
Publication date: 2023-09-12

Abstract

本发明公开了一种基于自注意力多尺度特征提取的智能故障诊断方法，首先通过传感器采集待测设备的音频信号，建立训练集和验证集；接下来对传感器采集的待测设备运行数据进行短时傅里叶变换，获得同时带有时域特征和频域特征的频谱图；再对频谱图进行归一化；然后建立智能学习模型，提取频谱图的特征进行分类并对智能学习模型进行训练；最后对采集的信号，通过训练完成的智能学习模型，得到特征值，该特征值与数据库中特征值进行检索、匹配从而实现故障的诊断确定。本发明能够在短时间内诊断出故障类型，并且准确率优于其它模型。

Description

一种基于自注意力多尺度特征提取的智能故障诊断方法

技术领域

本发明属于故障检测技术领域，具体涉及一种智能故障诊断方法。

背景技术

现如今，机械设备已经趋于自主化，其应用越来越广泛，并且不断向复杂化、智能化、***化的方向发展。大型机械设备的结构更加复杂，是由很多小零件组成，其中的部分零件发生损坏，对其他零件都会造成影响，很可能会降低生产效益和造成经济损失，甚至会造成人员伤亡。为了保障机械设备的正常运行以及提高其安全性能，对机械设备进行故障监测是非常有必要的。

现有技术中，通常使用机器学习方法，如支持向量机(SVM)、人工神经网络(ANN)等进行零件故障诊断，或者使用深度学习方法，如卷积神经网络(CNN)、自编码器(AE)等进行零件故障诊断。深度学习在智能故障诊断方面的研究中发挥了非常重要的作用，而卷积神经网络是非常常用的一种网络，借助其强大的特征提取能力使得诊断性能大幅提升。

但是在以往的研究中，发现卷积神经网络都是采用单尺度的卷积核，这样会导致在整个卷积过程中，对输入信号的感受野大小是固定的，提取的特征数据维度比较单一。在整个特征提取过程中对输入数据的每个部分使用一致权重，导致提取特征的过程比较耗时。

所以如何利用现有的数据，提取更多能够表征故障的特征是非常重要的问题。在现有的智能故障诊断研究中，设计出一种可以多方面、多角度提取故障特征的网络是解决问题的突破口。

发明内容

为了克服现有技术的不足，本发明提供了一种基于自注意力多尺度特征提取的智能故障诊断方法，首先通过传感器采集待测设备的音频信号，建立训练集和验证集；接下来对传感器采集的待测设备运行数据进行短时傅里叶变换，获得同时带有时域特征和频域特征的频谱图；再对频谱图进行归一化；然后建立智能学习模型，提取频谱图的特征进行分类并对智能学习模型进行训练；最后对采集的信号，通过训练完成的智能学习模型，得到特征值，该特征值与数据库中特征值进行检索、匹配从而实现故障的诊断确定。本发明能够在短时间内诊断出故障类型，并且准确率优于其它模型。

本发明解决其技术问题所采用的技术方案包括如下步骤：

步骤1：通过传感器采集待测设备的音频信号，获取带有故障标签标注的设备音频信号作为训练集和验证集，获取无标注的设备音频信号作为测试集；所述设备音频信号为用于判断待测设备是否发生故障的传感器数据；所述故障标签为目标零件发生故障的类型；

步骤2：对传感器采集的待测设备运行数据进行短时傅里叶变换，获得同时带有时域特征和频域特征的频谱图；再对频谱图进行归一化；

步骤3：建立智能学习模型，提取步骤2得到的频谱图的特征，并进行分类；特征通过加入了自注意力机制的多尺度卷积网络进行提取；

在训练过程中，当不同工作条件的设备在不同工况下的故障均被训练储存后，将生成待测设备的特征数据，不同故障类型被以不同的特征值集合形式保存；

步骤4：当模型被采集的信号拟合完成后，待测的设备经过步骤1和步骤2的数据采集和数据处理过程，然后通过步骤3训练完成的智能学习模型，得到特征值，该特征值与数据库中特征值进行检索、匹配从而实现故障的诊断确定。

进一步地，所述短时傅里叶变换是先把一个函数和窗函数进行相乘，然后再进行一维的傅里叶变换，并通过窗函数的滑动得到一系列的频谱函数，将这些结果依次拼接得到一个二维的时频图；基本运算公式如下：

式中，x(t)为时域信号，h(t-ω)为窗函数。

进一步地，所述智能学习模型具体如下：

步骤3-1：所述智能学习模型由多个隐层堆叠组成，包括多尺度卷积层、自注意力层、拼接层和全连接层，每个卷积变换层还包括BN层、池化层和非线性激活ReLU层，全连接层采用SoftMax激活函数对故障进行分类识别；智能学习模型结构见表1：

表1智能学习模型结构

上表中的n表示设备的故障类别数。

步骤3-2：特征提取流程如下：

1、将原始的音频信号X＝{x₁,x₂,…,x_n}输入到短时傅里叶变换中得到其频谱图STFT(X)；

2、将频谱图输入到多尺度卷积层进行特征提取，卷积计算公式如下：

其中，分别表示3个不同的卷积核，z¹,z²,z³表示不同卷积核计算出的结果；

3、对卷积变换层输出的特征数据进行归一化处理，并在各个特征下进行约束；

4、通过最大池化层对归一化后的特征数据进行降维；

5、对不同通道的特征进行拼接组合，将二维特征展开成一维向量形式，采用“层间全连接，层内无连接”原则，将维度降低为设备健康状态的类别数；

6、在经过上述网络层的特征提取后，输出特征进一步输入到Softmax分类器中以实现状态识别与故障分类。

步骤3-3：在特征提取过程中，加入了自注意力机制，通过多尺度核匹配提取的特征输入到自注意力机制模型中

步骤3-4：将创建的智能学习模型在训练集上进行训练，使用Adam优化算法对目标函数进行优化，在经过多次迭代之后，使用验证集测试优化效果并调整参数，最后使用测试集来验证网络是否优化完成。

使用交叉熵损失函数作为目标函数，函数表达式如下：

C表示类别数量，p表示神经网络的输出。

进一步地，所述自注意力机制表示如下：

自注意力机制采用查询-键-值得模型，对于输入H＝(h₁,h₂,…,h_n)，分别与三个矩阵W_q，W_k，W_v相乘，得到查询Q、键K、值V，具体如下：

Q＝H·W_q

K＝H·Q_k

V＝H·W_v

计算注意力函数：

其中注意力函数得结果就是经过注意力加权后的特征，进行特征提取与分类。

本发明的有益效果如下：

1、本发明所述的一种基于自注意力多尺度特征提取的智能故障诊断方法，采用音频信号作为诊断数据，采用多种工况下的设备运行数据，有利于暴露随转速和角度变化的故障特征，为特征的提取提供了基础；

2、将处理后的音频数据作为自注意多尺度特征提取模型的输入，该模型采用了多尺度卷积的方法进行特征提取，首先由三个不同尺度的卷积核并行卷积运算，可以同时兼顾局部和全局的特征，然后加入了自注意力机制，使得模型具有自主学习重要特征的能力，接下来使用单尺度卷积进一步提取特征，最后使用分类器进行故障识别。因此从频谱图中可以得到丰富的信息，这些信息包含了设备的故障情况。

3、本发明提出了一个较小的网络模型，其参数相比较其他方法而言是非常小的，从而导致收敛速度快，将训练好的模型应用于实际设备中，能够在短时间内诊断出故障类型，并且准确率优于其它模型。

附图说明

图1为本发明方法总体框架图。

图2为本发明短时傅里叶变换示意图。

图3为本发明详细网络模型图。

图4为本发明特征维度变换示意图。

图5为本发明自注意力机制框架图。

具体实施方式

下面结合附图和实施例对本发明进一步说明。

根据现有神经网络在提取特征时忽略全局特征或者局部特征的不足，本发明实施的目的在于提供一种基于自注意力多尺度特征提取的故障诊断方法，在提取特征的同时兼顾局部特征核全局特征；由于每个局部信息对图像能否被正确识别的影响力是不同的，所以需要告知模型图像中不同局部信息的重要性，因此在提取特征的过程中，加入了自注意力机制，使模型自主定位有用的信息，抑制无用的信息。实现了根据实际采集的设备音频数据，诊断其是否存在故障，并分析出故障类型，提升了实际故障诊断应用中的诊断效果。

本发明提出了一种基于自注意力多尺度特征提取的智能故障诊断的方法，该方法的整体结构如图1所示，包括：

步骤1、通过传感器采集待测设备的音频信号，根据设备的类型，对其进行一定工作条件的运转，采集不同工况下的数据；获取带有故障标签标注的设备音频信号作为训练集和验证集，获取无标注的设备音频信号作为测试集；所述设备音频信号为用于判断待测设备是否发生故障的传感器数据；所述故障标签为目标零件发生故障的类型；根据设备的类型，对其进行一定的故障信号分析；

步骤2、对传感器采集的设备运行数据进行分析，对其进行短时傅里叶变换，获得同时带有时域特征和频域特征的频谱图，如图2所示，从频谱图中可以非常清楚地看到信号时间和频率的分布，并且输入数据中的特征是多域特征，能够更加全面地表征故障状态；

短时傅里叶变换的基本思想是先把一个函数和窗函数进行相乘，然后再进行一维的傅里叶变换，并通过窗函数的滑动得到一系列的频谱函数，将这些结果依次拼接得到一个二维的时频图。基本运算公式如下：

式中，x(t)为时域信号，h(t-ω)为窗函数。

同时为了避免在特征提取过程中因为某个值过大而导致其他值被忽略的情况，需要对频谱图进行归一化，将其规定在一个合理的范围内。

步骤3、建立的智能学习模型如图3所示，自主提取步骤2得到的频谱图的特征点信息，进行特征识别，特别重要的是，采用了多尺度卷积的方法对特征进行提取，可以同时兼顾局部和全局的特征，并且加入了自注意力机制，模型可以自主提取重要的特征用于分类识别。在训练过程中，当不同工作条件的设备在不同工况下的故障均被训练储存后，将生成待测设备的特征数据，不同故障类型被以不同的特征值集合形式保存。同时为了避免在特征提取过程中因为某个值过大而导致其他值被忽略的情况，需要对每层网络的输出进行归一化，将其规定在一个合理的范围内。在整个过程中的特征维度变化如图4所示。

本发明提出的多尺度特征提取是指在卷积计算中，使用多个不同尺寸的卷积核同步进行特征提取，卷积核是对输入数据的局部感知，核越大，感知的范围越大，就能够得到相较于小核更全面的特征，将多尺度卷积提取的特征合并对于进一步提取更有益处。

智能学习模型由多个隐层堆叠组成，包括多尺度卷积层、自注意力层、拼接层和全连接层，每个卷积变换层还包括BN层、池化层和非线性激活ReLU层，全连接层采用SoftMax激活函数对故障进行分类识别。图1为本发明提出的方法的网络结构：

以下为特征提取的流程：

其中，k¹,k²,k³分别表示3个不同的卷积核，z¹,z²,z³表示不同卷积核计算出的结果；

3、由于不同尺度下特征的量值具有较大差异，为避免某一个特征量的值过大导致其余特征被忽略，对卷积变换层输出的特征数据进行归一化处理，并在各个特征下进行约束；

4、然后通过最大池化层对归一化后的特征数据进行降维，目的是使卷积层的输出特征维度保持一致；

5、对不同通道的特征进行拼接组合，将二维特征展开成一维向量形式，采用“层间全连接，层内无连接”原则，将维度降低为健康状态的类别数；

6、在经过上述网络层的特征提取后，输出特征将被进一步输入到Softmax分类器中以实现状态识别与故障分类。

步骤4、在特征提取过程中，加入了自注意力机制，通过多尺度核匹配提取的特征输入到自注意力机制模型中，目的是为了使模型自主根据重要性权重学习重要特征，自注意力机制的结构如图5所示。

其中，自注意力机制的详细原理如下：

自注意力机制一般采用查询-键-值得模型，对于输入H＝(h₁,h₂,…,h_n)，分别与三个矩阵W_q，W_k，W_v相乘，得到查询Q、键K、值V，具体如下：

Q＝H·W_q

K＝H·W_k

V＝H·W_v

接下来计算注意力函数：

其中注意力函数得结果就是经过注意力加权后得特征，可以进行后面特征提取与分类。

步骤5、将创建的网络模型在训练集上进行训练，使用Adam优化算法对目标函数进行优化，在经过多次迭代之后，使用验证集测试优化效果并微调参数，最后使用测试集来验证网络是否优化完成。

其中，由于提出的方法用于多分类问题，所以使用交叉熵损失函数作为目标函数，函数表达式如下：

C表示类别数量，p表示神经网络的输出。

步骤6、当模型被采集的信号拟合完成后，待测的设备经过完整的数据采集、数据处理以及特征提取过程，形成一套新的特征值，该特征值与数据库中特征值进行检索、匹配从而实现故障的诊断确定。

具体实施例：

为了验证本发明方法的有效性，选择了凯西斯储大学的轴承数据进行验证，取负载条件为0HP、1HP和2HP的部分轴承数据，数据的具体划分如表2。

表2

在3个数据集上训练和测试网络，在所有数据中取出70％作为训练集、20％作为验证集以及10％作为测试集。并且搭建了两个对比试验进行比较。

对比方法1：CNN(Convolutional neural network，卷积神经网络)网络结构与使用单尺度卷积。

对比方法2：SAE(Stacked Auto-Encoder，堆叠式自编码器)多层稀疏自编码器组成的深度神经网络模型。

具体的实验如表3所示。

表3

从实验结果可以看出，在数据有限的情况下，本发明提出的方法的诊断效果最好，达到了99％的正确率，而两个对比网络的准确率分别是76.7％和84.9％，充分表明了本发明提出的方法在智能故障诊断领域的有效性。

Claims

1.一种基于自注意力多尺度特征提取的智能故障诊断方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的一种基于自注意力多尺度特征提取的智能故障诊断方法，其特征在于，所述短时傅里叶变换是先把一个函数和窗函数进行相乘，然后再进行一维的傅里叶变换，并通过窗函数的滑动得到一系列的频谱函数，将这些结果依次拼接得到一个二维的时频图；基本运算公式如下：

式中，x(t)为时域信号，h(t-ω)为窗函数。

3.根据权利要求1所述的一种基于自注意力多尺度特征提取的智能故障诊断方法，其特征在于，所述智能学习模型具体如下：

表1智能学习模型结构

上表中的n表示设备的故障类别数；

步骤3-2：特征提取流程如下：

4、通过最大池化层对归一化后的特征数据进行降维；

6、在经过上述网络层的特征提取后，输出特征进一步输入到Softmax分类器中以实现状态识别与故障分类；

步骤3-4：将创建的智能学习模型在训练集上进行训练，使用Adam优化算法对目标函数进行优化，在经过多次迭代之后，使用验证集测试优化效果并调整参数，最后使用测试集来验证网络是否优化完成；

使用交叉熵损失函数作为目标函数，函数表达式如下：

C表示类别数量，p表示神经网络的输出。

4.根据权利要求1所述的一种基于自注意力多尺度特征提取的智能故障诊断方法，其特征在于，所述自注意力机制表示如下：

Q＝H·W_q

K＝H·W_k

V＝H·W_v

计算注意力函数：