CN115034267A

CN115034267A - 融合通道注意力的一维卷积神经网络滚动轴承故障诊断方法

Info

Publication number: CN115034267A
Application number: CN202210667941.5A
Authority: CN
Inventors: 李贺军; 宋欣钢; 陈蕊; 蔡勇; 刘华
Original assignee: Huanghe Jiaotong University
Current assignee: Huanghe Jiaotong University
Priority date: 2022-06-14
Filing date: 2022-06-14
Publication date: 2022-09-09

Abstract

本发明公开了融合通道注意力的卷积神经网络滚动轴承故障诊断方法，包括：制作滚动轴承故障诊断训练数据集和滚动轴承故障诊断测试数据集；构建滚动轴承故障诊断网络模型，根据滚动轴承故障诊断训练数据集，对滚动轴承故障诊断网络模型进行迭代训练；根据设置的迭代更新轮数，对滚动轴承故障诊断网络模型中的训练参数进行循环迭代更新；将保存的最后一轮训练参数加载到所述滚动轴承故障诊断网络模型中，得到各个滚动轴承的故障诊断结果；该方法只采用卷积层和池化层两种基本单元即可实现滚动轴承故障端到端的检测，采用基于卷积操作的通道注意力模块，可以通过跨通道交互信息，提高重要通道权重，减小非重要的通道权重，提高了检测精度。

Description

融合通道注意力的一维卷积神经网络滚动轴承故障诊断方法

技术领域

本发明涉及轴承故障诊断领域，特别是涉及到一种融合通道注意力的一维卷积神经网络滚动轴承故障诊断方法。

背景技术

滚动轴承是机械设备中非常重要的零部件，其主要功能是支撑机械旋转体，降低运动过程中的摩擦系数，并保证其回转精度，滚动轴承的健康状态对整个机械设备的性能、稳定性和使用寿命都有着巨大的影响。随着我国工业化水平的不断提高，机械设备在各行各业中的应用越来越广泛。由于工作环境的恶劣性和复杂性，滚动轴承是机械部件中最易于损坏的元件之一；同时由于滚动轴承故障难以直接观察，其运行状态正常或故障与否也很难通过简单的方式来判断，目前工业界和学术界普遍采用基于振动信号的方法来间接评估滚动轴承的运行状态。

在实际的应用中，原始振动信号数据中由于含有大量噪声，往往不能直接反映滚动轴承的故障特征信息。为解决此问题，常用的方法是采用信号处理技术对原始振动信号进行分析、处理，从而实现降噪和特征增强的目的。主流的信号处理方法有时频分析法、谱峭度法等。该类方法的优点是简单易行，可以满足部分滚动轴承故障诊断的要求，但该类方法过于依赖于人工提取和领域内的专家知识，对待解决问题的针对性较强但是泛化能力较弱。

随着深度学习理论的迅速发展，基于深度学习的滚动轴承的故障诊断也成了炙手可热的学习方向。深度学习采用网络化的实现方式，可自主的对输入样本进行特征提取，从而摆脱了对人工特征提取和专家知识的依赖。

基于深度学习的滚动轴承故障诊断方法大致可以分为两种：一种是先将输入信号的波形图转换成视频图，然后借用二维卷积神经网络(Convolutional Neural Networks,CNN)的方法进行故障诊断；该类方法将一维时间序列信号转化为二维的视频图，破坏了信号中的空间相关性，部分故障信息存在丢失的可能。第二种是借用时序信号处理的思路，采用长短时记忆(Long Short-Term Memory,LSTM)网络先对输入信号进行预测，在此基础上通过全链接层进行故障诊断；LSTM网络采用门机制，对序列数据进行建模，具有长期记忆功能，但LSTM算法的前提是假设数据是序列相关，并在此基础上对其进行，但LSTM并行化难度大，网络计算费时，影响其在滚动轴承故障诊断领域的应用。

发明内容

为克服现有技术中的不足，解决当前采用二维卷积神经网络的方法进行故障诊断存在故障信息丢失的问题，以及采用LSTM算法并行化难度大，网络计算费时的问题，本发明提出了一种融合通道注意力的一维卷积神经网络滚动轴承故障诊断方法；该方法直接以滚动轴承的一维时序振动信号作为网络的输入，整个网络只采用了卷积层和池化层两种基本单元即可实现滚动轴承故障端到端的检测。

本发明的目的可以通过以下技术方案来实现：

融合通道注意力的卷积神经网络滚动轴承故障诊断方法，包括以下步骤；

根据采集到的待监测设备各个运行状态下滚动轴承振动信号，制作滚动轴承故障诊断数据集，所述滚动轴承故障诊断数据集包括滚动轴承故障诊断训练数据集和滚动轴承故障诊断测试数据集；

构建融合通道注意力的一维卷积神经网络滚动轴承故障诊断网络模型，所述滚动轴承故障诊断网络模型包括特征提取子网络、通道注意力子网络以及分类子网络；所述特征提取子网络由K₁个常规卷积模块以及K₂个空洞卷积模块串联而成，所述常规卷积模块由1个卷积层、1个激活层和1个池化层串联构成，所述空洞卷积模块由1个空洞卷积层和1个激活层串联构成；所述通道注意力子网络包括至少一个基于卷积的通道注意力卷积模块，所述基于卷积的通道注意力卷积模块包括全局平均池化层、K₃个不同的一维卷积核以及sigmoid激活层；

根据所述滚动轴承故障诊断训练数据集，对所述滚动轴承故障诊断网络模型进行迭代训练；

根据设置的迭代更新轮数，对所述滚动轴承故障诊断网络模型中的训练参数进行循环迭代更新，待循环结束后，对最后一轮训练参数进行保存；

将保存的最后一轮训练参数加载到所述滚动轴承故障诊断网络模型中，将待监测设备各个运行状态下滚动轴承的信号输入故障诊断网络模型中得到故障诊断结果。

进一步的，所述滚动轴承故障诊断训练数据集和滚动轴承故障诊断测试数据集制作步骤包括：

S1：通过安装在待监测设备上的加速度传感器，采集待监测设备运行状态下各个滚动轴承振动信号，获取滚动轴承振动信号集合X＝{x_i|i＜＜N,i∈Z⁺}；

S2：对S1中采集的滚动轴承振动信号进行归一化处理得到滚动轴承归一化振动信号集合

所述归一化处理的计算过程如式(1)、式(2)、式(3)所示：

式(1)～(3)中，x_i表示输入滚动轴承振动信号，μ表示所有输入滚动轴承振动信号的均值，N表示输入滚动轴承振动信号的数量，σ表示所有输入滚动轴承振动信号的标准差，

表示对x_i归一化处理后的滚动轴承振动信号；

S3：对经过归一化处理后的滚动轴承振动信号

进行标注处理，将滚动轴承故障诊断标注信息包括正常状态、内圈故障、外圈故障和滚动体故障四类，对四类滚动轴承故障诊断标注信息均采用one-hot模式进行编码标注，所述四类滚动轴承故障诊断标注信息包括：正常运行状态对应的one-hot编码标注值为[0,0,0,1]，内圈损伤故障对应的one-hot编码标注值为[0,0,1,0]，外圈损伤故障对应的one-hot编码标注值为[0,1,0,0]，滚动损伤体故障对应的one-hot编码标注值为[1,0,0,0]；

S4：对四类滚动轴承故障诊断标注信息符号化表示为

获取滚动轴承故障诊断数据集振动信号标签；

S5：对所述滚动轴承归一化振动信号集合

按一定重叠比例ρ构建滚动轴承故障诊断数据集振动信号样本，第λ个振动信号样本s_λ的计算过程如式(4)所示：

s_λ＝X^std[(λ-1)×l×ρ+1:(λ-1)×l×ρ+l] (4)

式(4)中λ表示振动信号样本序号，l表示每个样本的长度，l＝k_ln_r，n_r表示滚动轴承转动一周，加速度传感器所能采集到的振动信号的长度，

v表示滚动轴承的转动速度，单位转/秒，f表示加速度传感器的采样频率，单位千赫兹，其中k_l∈Z⁺；

S6：根据所述滚动轴承故障诊断数据集振动信号标签以及所述滚动轴承故障诊断数据集振动信号样本，构建滚动轴承故障诊断数据集

S7：对所述滚动轴承故障诊断数据集进行随机互斥取样，生成滚动轴承故障诊断训练数据集和滚动轴承故障诊断测试数据集。

进一步的，所述特征提取子网络第1常规卷积模块中的第一层卷积操作采用尺寸为1×k₁的卷积核对输入振动信号进行卷积，所述第一层卷积操作中卷积核的个数为1×c₁，采用卷积步长为1；

所述第1个常规卷积模块中的第二层激活操作用于对输入信号进行非线性变换，以增加网络的非线性表达能力，所述第1个常规卷积模块中的第二层激活操作采用线性整流函数ReLu函数来描述，所述ReLu函数表达式如式(5)所示：

式(5)中x_Relu表示ReLu函数的输入信号，

所述第1常规卷积模块中的第三层池化操作用于对输入信号进行降采样操作，压缩样本的空间尺寸，提高卷积运算的感受野，所述第1个常规卷积模块中的第三层池化操作采用尺寸为1×2的池化核对其输入信号进行池化操作，池化步长为2；

所述特征提取子网络中第2常规卷积模块到第K₁常规卷积模块的结构与第1个常规卷积模块一致，均包括第一层卷积操作、第二层激活操作以及第三层池化操作，所述特征提取子网络中第2个常规卷积模块、…第k常规卷积模块、…第K₁常规卷积模块中的第一层卷积层采用的卷积核尺寸分别为

所述特征提取子网络中第2个常规卷积模块、…第k常规卷积模块、…第K₁常规卷积模块中的第一层卷积层采用的卷积核个数分别为

将特征提取子网络的输入振动信号设为s_bλ，s_bλ∈R^1×l×c×b，其中c表示振动信号样本的通道数，即安装在待监测设备上的加速度传感器的个数，b表示第bλ批送入滚动轴承故障诊断网络模型的样本的个数，

所述特征提取子网络中第1个常规卷积模块、第2个常规卷积模块、…第k常规卷积模块、…第K₁常规卷积模块分别经过第一层卷积操作、第二层激活操作以及第三层池化操作后的输出特征图分别为

进一步的，所述特征提取子网络中第K₁+1卷积模块到第K₁+K₂卷积模块采用空洞卷积模块，所述特征提取子网络中第K₁+1空洞卷积模块到第K₁+K₂空洞卷积模块的结构均包括两层，第一层为空洞卷积操作，第二层为激活操作，所述激活操作采用ReLu激活函数；

所述特征提取子网络中第K₁+1空洞卷积模块、第K₁+k空洞卷积模块、第K₁+K₂卷积模块中的第一层空洞卷积操作采用的卷积核尺寸分别为

所述特征提取子网络中第K₁+1空洞卷积模块、…第K₁+k空洞卷积模块、…第K₁+K₂空洞卷积模块中的第一层空洞卷积操作采用的卷积核个数分别为

所述特征提取子网络中第K₁+1空洞卷积模块、…第K₁+k空洞卷积模块、…第K₁+K₂空洞卷积模块中的第一层空洞卷积操作的空洞率分别为

所述特征提取子网络中第K₁+1空洞卷积模块、…第K₁+k空洞卷积模块、…第K₁+K₂空洞卷积模块分别经过第一层空洞卷积操作以及第二层激活操作后的输出特征图分别为

其中

l_bλ表示相应卷积模块的输出特征图长度，c_bλ表示相应卷积模块的输出特征图通道数，b表示第bλ批送入故障诊断网络模型的样本个数。

所述通道注意力卷积模块用于提高所述第K₁+K₂空洞卷积模块的输出特征图

跨通道交互信息，增加重要通道的权重，减少非重要通道的权重，获取通道注意力卷积模块输出的具体步骤包括：

S1：对第K₁+K₂空洞卷积模块的输出特征图

沿着样本长度方向进行全局平均池化得到全局平均池化运算结果

所述全局平均池化运算结果

的计算过程如式(6)所示：

其中，

j表示样本中第j元素的序号；

S2：对所述全局平均池化运算结果

沿着特征图通道方向进行卷积，经过K₃个不同的一维卷积核后得到特征输出

1≤p≤K₃，对

求均值得到

的计算过程如式(7)所示：

S3：对

沿着通道c_bλ方向进行sigmoid激活运算，获取sigmoid激活输出，第γ个sigmoid激活输出

的计算过程如式(8)所示：

S4：将特征图f_bλ第γ个通道的特征

与第γ个sigmoid激活输出

相乘，得到通道注意力卷积模块输出特征图

进一步的，所述分类子网络包括全局平均池化层、K₄个相同的一维卷积核以及softmax层，所述分类子网络获取softmax层运算结果的具体步骤包括：

S1：通道注意力卷积模块输出特征图

沿着样本长度方向进行全局平均池化得到分类全局平均池化运算结果

S2：对分类全局平均池化运算结果

连续进行K₄次卷积运算后得到分类卷积输出

K₄次卷积运算所采用的卷积核尺寸均为1×1，卷积步长均为1，K₄次卷积运算的通道数从c_bλ逐步减小到4；

S3：将分类卷积输出

输入softmax层进行softmax运算获取softmax层运算结果y_bλ，softmax层运算结果y_bλ中第δ个元素的计算过程如式(9)所示：

进一步的，采用交叉熵损失函数L_bλ来计算滚动轴承故障诊断网络模型输出值和滚动轴承故障诊断网络模型标注值之间的偏差，当所述特征提取子网络的输入振动信号设为s_bλ时，其对应的滚动轴承故障诊断网络模型标注值为

滚动轴承故障诊断网络模型输出值为y_bλ，获取交叉熵损失函数L_bλ的计算过程如式(10)所示：

式(10)中

表示振动信号真实标签，

表示振动信号预测标签，b表示第bλ批送入故障诊断网络模型的样本个数，q表示one-hot编码索引。

进一步的，所述滚动轴承故障诊断训练数据集，对所述滚动轴承故障诊断网络模型进行迭代训练的具体步骤如下：

S1：根据式(10)计算交叉熵损失函数L_bλ值；

S2：设置迭代更新运算轮数epoch＝M，根据链式求导法则，如式(11)所示，对所述滚动轴承故障诊断网络模型中的训练参数进行循环迭代更新：

w_new表示更新后的故障诊断网络模型中的训练参数，w_old表示更新前的故障诊断网络模型中的训练参数，

表示网络模型中所有卷积核的待训练参数，η表示相应的学习率。

S3：待循环结束后，将第M轮训练参数进行保存。

进一步的，得到待监测设备运行状态下各个滚动轴承的故障诊断结果的具体步骤包括：

S1：将所保存的第M轮训练参数加载到所述滚动轴承故障诊断网络模型中；

S2：将待检测信号/输入所述滚动轴承故障诊断网络模型中，分别通过特征提取子网络、通道注意力子网络以及分类子网络后产生相应的输出信号，所述输出信号包括4个取值在0到1之间的正实数；

S3：将S2中4个取值在0到1之间的正实数中最大的正实数置为1，其余3个正实数置为0；

S4：将S3中得到的结果分别与所述正常状态对应的one-hot编码标注值、内圈故障对应的one-hot编码标注值、外圈故障对应的one-hot编码标注值以及滚动体故障对应的one-hot编码标注值进行匹配，获取滚筒轴承的故障诊断结果。

与现有的技术相比，本发明有益的效果为：

(1)仅采用了卷积层和池化层两种单元，网络对输入信号维度的尺寸无需进行严格限制，当输入信号的维度较大时，网络也可正常使用；

(2)网络中交替使用常规的卷积操作和空洞卷积操作，空洞卷积的利用可以在扩大卷积运算的感受野前提下，最大限度的保留样本的细节性信息，为后续的故障诊断提供了强有力的支撑；

(3)采用基于卷积操作的通道注意力模块，可以通过跨通道交互信息，提高重要通道权重，减小非重要的通道权重。

附图说明

图1为本发明故障诊断网络模型图；

图2为本发明通道注意力模块示意图；

图3为四种不同网络的检测精度对比结果；

图4为四种不同网络的损失函数曲线结果。

具体实施方式

本发明的目的可以通过以下技术方案来实现：

融合通道注意力的一维卷积神经网络滚动轴承故障诊断方法，具体包括以下步骤：

如图1所示，构建融合通道注意力的一维卷积神经网络滚动轴承故障诊断网络模型，所述滚动轴承故障诊断网络模型包括特征提取子网络、通道注意力子网络以及分类子网络；所述特征提取子网络由K₁个常规卷积模块以及K₂个空洞卷积模块串联而成，所述常规卷积模块由1个卷积层、1个激活层和1个池化层串联构成，所述空洞卷积模块由1个空洞卷积层和1个激活层串联构成；所述通道注意力子网络包括至少一个基于卷积的通道注意力卷积模块，所述基于卷积的通道注意力卷积模块包括全局平均池化层、K₃个不同的一维卷积核以及sigmoid激活层；

所述滚动轴承故障诊断训练数据集和滚动轴承故障诊断测试数据集制作步骤包括：

所述归一化处理的计算过程如式(1)、式(2)、式(3)所示：

表示对x_i归一化处理后的滚动轴承振动信号；

S3：对经过归一化处理后的滚动轴承振动信号

进行标注处理，滚动轴承故障诊断标注信息包括正常状态、内圈故障、外圈故障和滚动体故障四类，对四类滚动轴承故障诊断标注信息均采用one-hot模式进行编码标注，所述四类滚动轴承故障诊断标注信息包括：正常运行状态对应的one-hot编码标注值为[0,0,0,1]，内圈损伤故障对应的one-hot编码标注值为[0,0,1,0]，外圈损伤故障对应的one-hot编码标注值为[0,1,0,0]，滚动损伤体故障对应的one-hot编码标注值为[1,0,0,0]；

S4：对四类滚动轴承故障诊断标注信息符号化表示为

获取滚动轴承故障诊断数据集振动信号标签；

S5：对所述滚动轴承归一化振动信号集合

s_λ＝X^std[(λ-1)×l×ρ+1:(λ-1)×l×ρ+l] (4)

所述特征提取子网络第1常规卷积模块中的第一层卷积操作采用尺寸为1×k₁的卷积核对输入振动信号进行卷积，所述第一层卷积操作中卷积核的个数为1×c₁，采用卷积步长为1；

式(5)中x_Relu表示ReLu函数的输入信号，

所述第1个常规卷积模块中的第三层池化操作用于对输入信号进行降采样操作，压缩样本的空间尺寸，提高卷积运算的感受野，所述第1个常规卷积模块中的第三层池化操作采用尺寸为1×2的池化核对其输入信号进行池化操作，池化步长为2；

所述特征提取子网络中第1个常规卷积模块、第2个常规卷积模块、…第k常规卷积模块、…第K₁常规卷积模块分别经过第一层卷积操作、第二层激活操作以及第三层池化操作操作后的输出特征图分别为

所述特征提取子网络中第K₁+1卷积模块到第K₁+K₂卷积模块采用空洞卷积模块，所述特征提取子网络中第K₁+1空洞卷积模块到第K₁+K₂空洞卷积模块的结构均包括两层，第一层为空洞卷积操作，第二层为激活操作，所述激活操作采用ReLu激活函数；

所述特征提取子网络中第K₁+1空洞卷积模块、…第K₁+k空洞卷积模块、…第K₁+K₂空洞卷积模块分别经过第一层空洞卷积操作以及第二层激活操作操作后的输出特征图分别为

其中

跨通道交互信息，增加重要通道的权重，减少非重要通道的权重，如图2所示，获取通道注意力卷积模块输出的具体步骤包括：

S1：对第K₁+K₂空洞卷积模块的输出特征图

所述全局平均池化运算结果

的计算过程如式(6)所示：

其中，

j表示样本中第j元素的序号；

S2：对所述全局平均池化运算结果

1≤p≤K₃，对

求均值得到

的计算过程如式(7)所示：

S3：对

的计算过程如式(8)所示：

S4：将特征图f_bλ第γ个通道的特征

与第γ个sigmoid激活输出

相乘，得到通道注意力卷积模块输出特征图

所述分类子网络包括全局平均池化层、K₄个相同的一维卷积核以及softmax层，所述分类子网络获取softmax层运算结果的具体步骤包括：

S1：通道注意力卷积模块输出特征图

S2：对分类全局平均池化运算结果

连续进行K₄次卷积运算后得到分类卷积输出

S3：将分类卷积输出

采用交叉熵损失函数L_bλ来计算滚动轴承故障诊断网络模型输出值和滚动轴承故障诊断网络模型标注值之间的偏差，当所述特征提取子网络的输入振动信号设为s_bλ时，其对应的滚动轴承故障诊断网络模型标注值为

式(10)中，

表示振动信号真实标签，

所述滚动轴承故障诊断训练数据集，对所述滚动轴承故障诊断网络模型进行迭代训练的具体步骤如下：

S1：根据式(10)计算交叉熵损失函数L_bλ值；

S3：待循环结束后，将第M轮训练参数进行保存。

得到待监测设备运行状态下各个滚动轴承的故障诊断结果的具体步骤包括：

本发明中训练数据集和测试数据集是根据凯斯西储大学提供的滚动轴承故障数据集制作而成的，以凯斯西储大学提供的电机驱动端加速度传感器数据为基准，采样频率为12KHz，其中，滚动轴承的运行状态共包括内圈损伤故障、滚动体损伤故障、外圈损伤故障(6点方向)、正常状态样本，共4类；

实验过程中，首先对采集的滚动轴承振动信号进行归一化处理得到滚动轴承归一化振动信号集合；然后对归一化处理后的滚动轴承振动信号进行标注，标注方法采用one-hot模式，正常状态对应的one-hot编码标注值确定为[0,0,0,1]，内圈损伤故障对应的one-hot编码标注值确定为[0,0,1,0]，外圈损伤故障对应的one-hot编码标注值确定为[0,1,0,0]，滚动损伤体故障对应的one-hot编码标注值确定为[1,0,0,0]；再对归一化处理后的信号进行切分，构建滚动轴承故障诊断数据集振动信号样本，其中，每个样本的长度l＝1600；再根据得到的样本和标签，构建滚动轴承故障诊断数据集，对数据集进行随机互斥取样，生成滚动轴承故障诊断训练数据集和测试数据集，其中，训练数据集的样本数为10904个，测样数据集的样本数为4676个；

最后构建滚动轴承故障诊断网络，与不同网络进行对比，如表1所示，本发明实验部分共构建了如下4个网络：

表1

表1中，Conv1d(kernel_size＝9,in_channel＝1,out_channnel＝6,stride＝1)表示一维卷积层，其中，kernel_size＝9表示卷积核为9，in_channel＝1表示输入通道为1，out_channnel＝6表示输出通道为6，stride＝1表示步长为1；

ReLu()表示ReLu激活函数；

MaxPool1d(kernel_size＝2,stride＝2)表示一维最大池化层，其中kernel_size＝2表示池化核的大小为2，stride＝2表示步长为2；

Conv1d(kernel_size＝7,in_channel＝6,out_channnel＝16,stride＝1)表示一维卷积层，kernel_size＝7表示卷积核为7，in_channel＝6表示输入通道为6，out_channnel＝16表示输出通道为16，stride＝1表示步长为1；

Linear(in_channel＝400*16,out_channel＝120)表示全链接层，其中，in_channel＝400*16，表示输入节点数为400*16，out_channel＝120表示输出节点数为120；

Linear(in_channel＝120,out_channel＝84)表示全链接层，其中，in_channel＝120，表示输入节点数为120，out_channel＝84表示输出节点数为84；

Conv1d(kernel_size＝7,in_channel＝6,out_channnel＝16,stride＝1，dilation＝2)表示一维卷积层，其中，kernel_size＝7表示卷积核为7，in_channel＝6表示输入通道为6，out_channnel＝16表示输出通道为16，stride＝1表示步长为1；dilation＝2表示卷积核的空洞化率为2；

AdaptiveAvgPool1d(1)表示全局平均池化；

eca_layer(kernel_size＝3)表示通道注意力模块(其原理图如图1所示)，kernel_size＝3表示其卷积核的大小为3；

eca_layer1(kernel_size＝7)表示通道注意力模块(其原理图如图1所示)，kernel_size＝7表示其卷积核的大小为7；

eca_layer2(kernel_size＝9)表示通道注意力模块(其原理图如图1所示)，kernel_size＝9表示其卷积核的大小为9；

Conv1d(kernel_size＝1,in_channel＝16,out_channnel＝84,stride＝1)表示一维卷积层，其中，kernel_size＝1表示卷积核为1，in_channel＝16表示输入通道为16，out_channnel＝84表示输出通道为84，stride＝1表示步长为1；

Conv1d(kernel_size＝1,in_channel＝84,out_channnel＝4,stride＝1)表示一维卷积层，其中，kernel_size＝1表示卷积核为1，in_channel＝84表示输入通道为84，out_channnel＝4表示输出通道84，stride＝1表示步长为1；

其中，网络-1未采用空洞卷积，全连接层前未采用全局平均池化；网络-2采用空洞卷积，全连接层前采用全局平均池化；网络-3采用空洞卷积，全连接层前采用全局平均池化，采用单个通道注意力；网络-4采用空洞卷积，全连接层被卷积层替代，并采用2个通道注意力，网络-4的结构与本发明的结构完全一致。

实验中，将滚动轴承故障诊断模型的输出的4个实数中的最大值置1，其他值置0；滚动轴承故障诊断模型训练过程中，每批数据的个数为25(batch_size＝25)，迭代的轮数为50(epochs＝50)。

参数的优化器采用Adam优化器，学***方的运行平均值的系数分别设置为0.9和0.99。

对测试集的评价指标采用准确率(accuracy)指标，计算公式如式(12)所示：

式(12)中，TP(ture postive)表示将正样本判断为正样本的数目，TN(turenegative)表示将负样本判断为负样本的数目，ALL表示所有样本的数目。

如图3所示为四种不同网络的检测精度对比结果。由图可见，本发明所采用方法取得了最好的检测结果。另外，从训练参数量的角度分析，网络-1需要训练的参数为779372个，网络-2需要训练的参数为2516个，网络-3需要训练的参数为2519个，本发明需要训练的参数为2524个。从网络-1和其他方法的对比，可以看出，空洞卷积核全局平均池化可以明显的减少网络需要训练的参数量，并提高其检测精度。网络-2和网络-3需要训练的参数量与本发明所需训练的参数量基本持平，但本发明的结果要优于网络-2和网络-3，这证明了本发明所采用的融合多通道注意力方法的优势。

如图4所示为四种不同网络的损失函数曲线结果，由图4可见，本发明所采用的网络-4的收敛速度与其他方法基本持平，说明采用本发明所提出的方法并不需要额外的训练轮次，能达到较好的检测结果。

Claims

1.融合通道注意力的卷积神经网络滚动轴承故障诊断方法，其特征在于，所述滚动轴承故障诊断方法具体包括以下步骤；

2.根据权利要求1所述融合通道注意力的卷积神经网络滚动轴承故障诊断方法，其特征在于，所述滚动轴承故障诊断训练数据集和滚动轴承故障诊断测试数据集制作步骤包括：

所述归一化处理的计算过程如式(1)、式(2)、式(3)所示：

表示对x_i归一化处理后的滚动轴承振动信号；

S3：对经过归一化处理后的滚动轴承振动信号

S4：对四类滚动轴承故障诊断标注信息符号化表示为

获取滚动轴承故障诊断数据集振动信号标签；

S5：对所述滚动轴承归一化振动信号集合

s_λ＝X^std[(λ-1)×l×ρ+1:(λ-1)×l×ρ+l] (4)

3.根据权利要求2所述融合通道注意力的卷积神经网络滚动轴承故障诊断方法，其特征在于，所述特征提取子网络第1常规卷积模块中的第一层卷积操作采用尺寸为1×k₁的卷积核对输入振动信号进行卷积，所述第一层卷积操作中卷积核的个数为1×c₁，采用卷积步长为1；

式(5)中x_Relu表示ReLu函数的输入信号，

所述特征提取子网络中第2常规卷积模块到第K₁常规卷积模块的结构与第1个常规卷积模块一致，均包括第一层卷积操作、第二层激活操作以及第三层池化操作，所述特征提取子网络中第2个常规卷积模块、…第k常规卷积模块、…第K₁常规卷积模块中的第一层卷积层采用的卷积核尺寸分别为1×k₂、…1×k_k、…

所述特征提取子网络中第2个常规卷积模块、…第k常规卷积模块、…第K₁常规卷积模块中的第一层卷积层采用的卷积核个数分别为1×c₂、…1×c_k、…

4.根据权利要求3所述融合通道注意力的卷积神经网络滚动轴承故障诊断方法，其特征在于，所述特征提取子网络中第K₁+1卷积模块到第K₁+K₂卷积模块采用空洞卷积模块，所述特征提取子网络中第K₁+1空洞卷积模块到第K₁+K₂空洞卷积模块的结构均包括两层，第一层为空洞卷积操作，第二层为激活操作，所述激活操作采用ReLu激活函数；

所述特征提取子网络中第K₁+1空洞卷积模块、第K₁+k空洞卷积模块、第K₁+K₂卷积模块中的第一层空洞卷积操作采用的卷积核尺寸分别为1×k_d1、…1×k_dk、…