CN115034267A - 融合通道注意力的一维卷积神经网络滚动轴承故障诊断方法 - Google Patents
融合通道注意力的一维卷积神经网络滚动轴承故障诊断方法 Download PDFInfo
- Publication number
- CN115034267A CN115034267A CN202210667941.5A CN202210667941A CN115034267A CN 115034267 A CN115034267 A CN 115034267A CN 202210667941 A CN202210667941 A CN 202210667941A CN 115034267 A CN115034267 A CN 115034267A
- Authority
- CN
- China
- Prior art keywords
- rolling bearing
- fault diagnosis
- convolution
- layer
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/04—Bearings
- G01M13/045—Acoustic or vibration analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Acoustics & Sound (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
本发明公开了融合通道注意力的卷积神经网络滚动轴承故障诊断方法,包括:制作滚动轴承故障诊断训练数据集和滚动轴承故障诊断测试数据集;构建滚动轴承故障诊断网络模型,根据滚动轴承故障诊断训练数据集,对滚动轴承故障诊断网络模型进行迭代训练;根据设置的迭代更新轮数,对滚动轴承故障诊断网络模型中的训练参数进行循环迭代更新;将保存的最后一轮训练参数加载到所述滚动轴承故障诊断网络模型中,得到各个滚动轴承的故障诊断结果;该方法只采用卷积层和池化层两种基本单元即可实现滚动轴承故障端到端的检测,采用基于卷积操作的通道注意力模块,可以通过跨通道交互信息,提高重要通道权重,减小非重要的通道权重,提高了检测精度。
Description
技术领域
本发明涉及轴承故障诊断领域,特别是涉及到一种融合通道注意力的一维卷积神经网络滚动轴承故障诊断方法。
背景技术
滚动轴承是机械设备中非常重要的零部件,其主要功能是支撑机械旋转体,降低运动过程中的摩擦系数,并保证其回转精度,滚动轴承的健康状态对整个机械设备的性能、稳定性和使用寿命都有着巨大的影响。随着我国工业化水平的不断提高,机械设备在各行各业中的应用越来越广泛。由于工作环境的恶劣性和复杂性,滚动轴承是机械部件中最易于损坏的元件之一;同时由于滚动轴承故障难以直接观察,其运行状态正常或故障与否也很难通过简单的方式来判断,目前工业界和学术界普遍采用基于振动信号的方法来间接评估滚动轴承的运行状态。
在实际的应用中,原始振动信号数据中由于含有大量噪声,往往不能直接反映滚动轴承的故障特征信息。为解决此问题,常用的方法是采用信号处理技术对原始振动信号进行分析、处理,从而实现降噪和特征增强的目的。主流的信号处理方法有时频分析法、谱峭度法等。该类方法的优点是简单易行,可以满足部分滚动轴承故障诊断的要求,但该类方法过于依赖于人工提取和领域内的专家知识,对待解决问题的针对性较强但是泛化能力较弱。
随着深度学习理论的迅速发展,基于深度学习的滚动轴承的故障诊断也成了炙手可热的学习方向。深度学习采用网络化的实现方式,可自主的对输入样本进行特征提取,从而摆脱了对人工特征提取和专家知识的依赖。
基于深度学习的滚动轴承故障诊断方法大致可以分为两种:一种是先将输入信号的波形图转换成视频图,然后借用二维卷积神经网络(Convolutional Neural Networks,CNN)的方法进行故障诊断;该类方法将一维时间序列信号转化为二维的视频图,破坏了信号中的空间相关性,部分故障信息存在丢失的可能。第二种是借用时序信号处理的思路,采用长短时记忆(Long Short-Term Memory,LSTM)网络先对输入信号进行预测,在此基础上通过全链接层进行故障诊断;LSTM网络采用门机制,对序列数据进行建模,具有长期记忆功能,但LSTM算法的前提是假设数据是序列相关,并在此基础上对其进行,但LSTM并行化难度大,网络计算费时,影响其在滚动轴承故障诊断领域的应用。
发明内容
为克服现有技术中的不足,解决当前采用二维卷积神经网络的方法进行故障诊断存在故障信息丢失的问题,以及采用LSTM算法并行化难度大,网络计算费时的问题,本发明提出了一种融合通道注意力的一维卷积神经网络滚动轴承故障诊断方法;该方法直接以滚动轴承的一维时序振动信号作为网络的输入,整个网络只采用了卷积层和池化层两种基本单元即可实现滚动轴承故障端到端的检测。
本发明的目的可以通过以下技术方案来实现:
融合通道注意力的卷积神经网络滚动轴承故障诊断方法,包括以下步骤;
根据采集到的待监测设备各个运行状态下滚动轴承振动信号,制作滚动轴承故障诊断数据集,所述滚动轴承故障诊断数据集包括滚动轴承故障诊断训练数据集和滚动轴承故障诊断测试数据集;
构建融合通道注意力的一维卷积神经网络滚动轴承故障诊断网络模型,所述滚动轴承故障诊断网络模型包括特征提取子网络、通道注意力子网络以及分类子网络;所述特征提取子网络由K1个常规卷积模块以及K2个空洞卷积模块串联而成,所述常规卷积模块由1个卷积层、1个激活层和1个池化层串联构成,所述空洞卷积模块由1个空洞卷积层和1个激活层串联构成;所述通道注意力子网络包括至少一个基于卷积的通道注意力卷积模块,所述基于卷积的通道注意力卷积模块包括全局平均池化层、K3个不同的一维卷积核以及sigmoid激活层;
根据所述滚动轴承故障诊断训练数据集,对所述滚动轴承故障诊断网络模型进行迭代训练;
根据设置的迭代更新轮数,对所述滚动轴承故障诊断网络模型中的训练参数进行循环迭代更新,待循环结束后,对最后一轮训练参数进行保存;
将保存的最后一轮训练参数加载到所述滚动轴承故障诊断网络模型中,将待监测设备各个运行状态下滚动轴承的信号输入故障诊断网络模型中得到故障诊断结果。
进一步的,所述滚动轴承故障诊断训练数据集和滚动轴承故障诊断测试数据集制作步骤包括:
S1:通过安装在待监测设备上的加速度传感器,采集待监测设备运行状态下各个滚动轴承振动信号,获取滚动轴承振动信号集合X={xi|i<<N,i∈Z+};
式(1)~(3)中,xi表示输入滚动轴承振动信号,μ表示所有输入滚动轴承振动信号的均值,N表示输入滚动轴承振动信号的数量,σ表示所有输入滚动轴承振动信号的标准差,表示对xi归一化处理后的滚动轴承振动信号;
S3:对经过归一化处理后的滚动轴承振动信号进行标注处理,将滚动轴承故障诊断标注信息包括正常状态、内圈故障、外圈故障和滚动体故障四类,对四类滚动轴承故障诊断标注信息均采用one-hot模式进行编码标注,所述四类滚动轴承故障诊断标注信息包括:正常运行状态对应的one-hot编码标注值为[0,0,0,1],内圈损伤故障对应的one-hot编码标注值为[0,0,1,0],外圈损伤故障对应的one-hot编码标注值为[0,1,0,0],滚动损伤体故障对应的one-hot编码标注值为[1,0,0,0];
sλ=Xstd[(λ-1)×l×ρ+1:(λ-1)×l×ρ+l] (4)
式(4)中λ表示振动信号样本序号,l表示每个样本的长度,l=klnr,nr表示滚动轴承转动一周,加速度传感器所能采集到的振动信号的长度,v表示滚动轴承的转动速度,单位转/秒,f表示加速度传感器的采样频率,单位千赫兹,其中kl∈Z+;
S7:对所述滚动轴承故障诊断数据集进行随机互斥取样,生成滚动轴承故障诊断训练数据集和滚动轴承故障诊断测试数据集。
进一步的,所述特征提取子网络第1常规卷积模块中的第一层卷积操作采用尺寸为1×k1的卷积核对输入振动信号进行卷积,所述第一层卷积操作中卷积核的个数为1×c1,采用卷积步长为1;
所述第1个常规卷积模块中的第二层激活操作用于对输入信号进行非线性变换,以增加网络的非线性表达能力,所述第1个常规卷积模块中的第二层激活操作采用线性整流函数ReLu函数来描述,所述ReLu函数表达式如式(5)所示:
式(5)中xRelu表示ReLu函数的输入信号,
所述第1常规卷积模块中的第三层池化操作用于对输入信号进行降采样操作,压缩样本的空间尺寸,提高卷积运算的感受野,所述第1个常规卷积模块中的第三层池化操作采用尺寸为1×2的池化核对其输入信号进行池化操作,池化步长为2;
所述特征提取子网络中第2常规卷积模块到第K1常规卷积模块的结构与第1个常规卷积模块一致,均包括第一层卷积操作、第二层激活操作以及第三层池化操作,所述特征提取子网络中第2个常规卷积模块、…第k常规卷积模块、…第K1常规卷积模块中的第一层卷积层采用的卷积核尺寸分别为 所述特征提取子网络中第2个常规卷积模块、…第k常规卷积模块、…第K1常规卷积模块中的第一层卷积层采用的卷积核个数分别为
将特征提取子网络的输入振动信号设为sbλ,sbλ∈R1×l×c×b,其中c表示振动信号样本的通道数,即安装在待监测设备上的加速度传感器的个数,b表示第bλ批送入滚动轴承故障诊断网络模型的样本的个数,
进一步的,所述特征提取子网络中第K1+1卷积模块到第K1+K2卷积模块采用空洞卷积模块,所述特征提取子网络中第K1+1空洞卷积模块到第K1+K2空洞卷积模块的结构均包括两层,第一层为空洞卷积操作,第二层为激活操作,所述激活操作采用ReLu激活函数;
所述特征提取子网络中第K1+1空洞卷积模块、第K1+k空洞卷积模块、第K1+K2卷积模块中的第一层空洞卷积操作采用的卷积核尺寸分别为所述特征提取子网络中第K1+1空洞卷积模块、…第K1+k空洞卷积模块、…第K1+K2空洞卷积模块中的第一层空洞卷积操作采用的卷积核个数分别为所述特征提取子网络中第K1+1空洞卷积模块、…第K1+k空洞卷积模块、…第K1+K2空洞卷积模块中的第一层空洞卷积操作的空洞率分别为
进一步的,所述分类子网络包括全局平均池化层、K4个相同的一维卷积核以及softmax层,所述分类子网络获取softmax层运算结果的具体步骤包括:
进一步的,采用交叉熵损失函数Lbλ来计算滚动轴承故障诊断网络模型输出值和滚动轴承故障诊断网络模型标注值之间的偏差,当所述特征提取子网络的输入振动信号设为sbλ时,其对应的滚动轴承故障诊断网络模型标注值为滚动轴承故障诊断网络模型输出值为ybλ,获取交叉熵损失函数Lbλ的计算过程如式(10)所示:
进一步的,所述滚动轴承故障诊断训练数据集,对所述滚动轴承故障诊断网络模型进行迭代训练的具体步骤如下:
S1:根据式(10)计算交叉熵损失函数Lbλ值;
S2:设置迭代更新运算轮数epoch=M,根据链式求导法则,如式(11)所示,对所述滚动轴承故障诊断网络模型中的训练参数进行循环迭代更新:
S3:待循环结束后,将第M轮训练参数进行保存。
进一步的,得到待监测设备运行状态下各个滚动轴承的故障诊断结果的具体步骤包括:
S1:将所保存的第M轮训练参数加载到所述滚动轴承故障诊断网络模型中;
S2:将待检测信号/输入所述滚动轴承故障诊断网络模型中,分别通过特征提取子网络、通道注意力子网络以及分类子网络后产生相应的输出信号,所述输出信号包括4个取值在0到1之间的正实数;
S3:将S2中4个取值在0到1之间的正实数中最大的正实数置为1,其余3个正实数置为0;
S4:将S3中得到的结果分别与所述正常状态对应的one-hot编码标注值、内圈故障对应的one-hot编码标注值、外圈故障对应的one-hot编码标注值以及滚动体故障对应的one-hot编码标注值进行匹配,获取滚筒轴承的故障诊断结果。
与现有的技术相比,本发明有益的效果为:
(1)仅采用了卷积层和池化层两种单元,网络对输入信号维度的尺寸无需进行严格限制,当输入信号的维度较大时,网络也可正常使用;
(2)网络中交替使用常规的卷积操作和空洞卷积操作,空洞卷积的利用可以在扩大卷积运算的感受野前提下,最大限度的保留样本的细节性信息,为后续的故障诊断提供了强有力的支撑;
(3)采用基于卷积操作的通道注意力模块,可以通过跨通道交互信息,提高重要通道权重,减小非重要的通道权重。
附图说明
图1为本发明故障诊断网络模型图;
图2为本发明通道注意力模块示意图;
图3为四种不同网络的检测精度对比结果;
图4为四种不同网络的损失函数曲线结果。
具体实施方式
本发明的目的可以通过以下技术方案来实现:
融合通道注意力的一维卷积神经网络滚动轴承故障诊断方法,具体包括以下步骤:
融合通道注意力的卷积神经网络滚动轴承故障诊断方法,包括以下步骤;
根据采集到的待监测设备各个运行状态下滚动轴承振动信号,制作滚动轴承故障诊断数据集,所述滚动轴承故障诊断数据集包括滚动轴承故障诊断训练数据集和滚动轴承故障诊断测试数据集;
如图1所示,构建融合通道注意力的一维卷积神经网络滚动轴承故障诊断网络模型,所述滚动轴承故障诊断网络模型包括特征提取子网络、通道注意力子网络以及分类子网络;所述特征提取子网络由K1个常规卷积模块以及K2个空洞卷积模块串联而成,所述常规卷积模块由1个卷积层、1个激活层和1个池化层串联构成,所述空洞卷积模块由1个空洞卷积层和1个激活层串联构成;所述通道注意力子网络包括至少一个基于卷积的通道注意力卷积模块,所述基于卷积的通道注意力卷积模块包括全局平均池化层、K3个不同的一维卷积核以及sigmoid激活层;
根据所述滚动轴承故障诊断训练数据集,对所述滚动轴承故障诊断网络模型进行迭代训练;
根据设置的迭代更新轮数,对所述滚动轴承故障诊断网络模型中的训练参数进行循环迭代更新,待循环结束后,对最后一轮训练参数进行保存;
将保存的最后一轮训练参数加载到所述滚动轴承故障诊断网络模型中,将待监测设备各个运行状态下滚动轴承的信号输入故障诊断网络模型中得到故障诊断结果。
所述滚动轴承故障诊断训练数据集和滚动轴承故障诊断测试数据集制作步骤包括:
S1:通过安装在待监测设备上的加速度传感器,采集待监测设备运行状态下各个滚动轴承振动信号,获取滚动轴承振动信号集合X={xi|i<<N,i∈Z+};
式(1)~(3)中,xi表示输入滚动轴承振动信号,μ表示所有输入滚动轴承振动信号的均值,N表示输入滚动轴承振动信号的数量,σ表示所有输入滚动轴承振动信号的标准差,表示对xi归一化处理后的滚动轴承振动信号;
S3:对经过归一化处理后的滚动轴承振动信号进行标注处理,滚动轴承故障诊断标注信息包括正常状态、内圈故障、外圈故障和滚动体故障四类,对四类滚动轴承故障诊断标注信息均采用one-hot模式进行编码标注,所述四类滚动轴承故障诊断标注信息包括:正常运行状态对应的one-hot编码标注值为[0,0,0,1],内圈损伤故障对应的one-hot编码标注值为[0,0,1,0],外圈损伤故障对应的one-hot编码标注值为[0,1,0,0],滚动损伤体故障对应的one-hot编码标注值为[1,0,0,0];
sλ=Xstd[(λ-1)×l×ρ+1:(λ-1)×l×ρ+l] (4)
式(4)中λ表示振动信号样本序号,l表示每个样本的长度,l=klnr,nr表示滚动轴承转动一周,加速度传感器所能采集到的振动信号的长度,v表示滚动轴承的转动速度,单位转/秒,f表示加速度传感器的采样频率,单位千赫兹,其中kl∈Z+;
S7:对所述滚动轴承故障诊断数据集进行随机互斥取样,生成滚动轴承故障诊断训练数据集和滚动轴承故障诊断测试数据集。
所述特征提取子网络第1常规卷积模块中的第一层卷积操作采用尺寸为1×k1的卷积核对输入振动信号进行卷积,所述第一层卷积操作中卷积核的个数为1×c1,采用卷积步长为1;
所述第1个常规卷积模块中的第二层激活操作用于对输入信号进行非线性变换,以增加网络的非线性表达能力,所述第1个常规卷积模块中的第二层激活操作采用线性整流函数ReLu函数来描述,所述ReLu函数表达式如式(5)所示:
式(5)中xRelu表示ReLu函数的输入信号,
所述第1个常规卷积模块中的第三层池化操作用于对输入信号进行降采样操作,压缩样本的空间尺寸,提高卷积运算的感受野,所述第1个常规卷积模块中的第三层池化操作采用尺寸为1×2的池化核对其输入信号进行池化操作,池化步长为2;
所述特征提取子网络中第2常规卷积模块到第K1常规卷积模块的结构与第1个常规卷积模块一致,均包括第一层卷积操作、第二层激活操作以及第三层池化操作,所述特征提取子网络中第2个常规卷积模块、…第k常规卷积模块、…第K1常规卷积模块中的第一层卷积层采用的卷积核尺寸分别为 所述特征提取子网络中第2个常规卷积模块、…第k常规卷积模块、…第K1常规卷积模块中的第一层卷积层采用的卷积核个数分别为
将特征提取子网络的输入振动信号设为sbλ,sbλ∈R1×l×c×b,其中c表示振动信号样本的通道数,即安装在待监测设备上的加速度传感器的个数,b表示第bλ批送入滚动轴承故障诊断网络模型的样本的个数,
所述特征提取子网络中第K1+1卷积模块到第K1+K2卷积模块采用空洞卷积模块,所述特征提取子网络中第K1+1空洞卷积模块到第K1+K2空洞卷积模块的结构均包括两层,第一层为空洞卷积操作,第二层为激活操作,所述激活操作采用ReLu激活函数;
所述特征提取子网络中第K1+1空洞卷积模块、第K1+k空洞卷积模块、第K1+K2卷积模块中的第一层空洞卷积操作采用的卷积核尺寸分别为所述特征提取子网络中第K1+1空洞卷积模块、…第K1+k空洞卷积模块、…第K1+K2空洞卷积模块中的第一层空洞卷积操作采用的卷积核个数分别为所述特征提取子网络中第K1+1空洞卷积模块、…第K1+k空洞卷积模块、…第K1+K2空洞卷积模块中的第一层空洞卷积操作的空洞率分别为
所述分类子网络包括全局平均池化层、K4个相同的一维卷积核以及softmax层,所述分类子网络获取softmax层运算结果的具体步骤包括:
采用交叉熵损失函数Lbλ来计算滚动轴承故障诊断网络模型输出值和滚动轴承故障诊断网络模型标注值之间的偏差,当所述特征提取子网络的输入振动信号设为sbλ时,其对应的滚动轴承故障诊断网络模型标注值为滚动轴承故障诊断网络模型输出值为ybλ,获取交叉熵损失函数Lbλ的计算过程如式(10)所示:
所述滚动轴承故障诊断训练数据集,对所述滚动轴承故障诊断网络模型进行迭代训练的具体步骤如下:
S1:根据式(10)计算交叉熵损失函数Lbλ值;
S2:设置迭代更新运算轮数epoch=M,根据链式求导法则,如式(11)所示,对所述滚动轴承故障诊断网络模型中的训练参数进行循环迭代更新:
S3:待循环结束后,将第M轮训练参数进行保存。
得到待监测设备运行状态下各个滚动轴承的故障诊断结果的具体步骤包括:
S1:将所保存的第M轮训练参数加载到所述滚动轴承故障诊断网络模型中;
S2:将待检测信号/输入所述滚动轴承故障诊断网络模型中,分别通过特征提取子网络、通道注意力子网络以及分类子网络后产生相应的输出信号,所述输出信号包括4个取值在0到1之间的正实数;
S3:将S2中4个取值在0到1之间的正实数中最大的正实数置为1,其余3个正实数置为0;
S4:将S3中得到的结果分别与所述正常状态对应的one-hot编码标注值、内圈故障对应的one-hot编码标注值、外圈故障对应的one-hot编码标注值以及滚动体故障对应的one-hot编码标注值进行匹配,获取滚筒轴承的故障诊断结果。
本发明中训练数据集和测试数据集是根据凯斯西储大学提供的滚动轴承故障数据集制作而成的,以凯斯西储大学提供的电机驱动端加速度传感器数据为基准,采样频率为12KHz,其中,滚动轴承的运行状态共包括内圈损伤故障、滚动体损伤故障、外圈损伤故障(6点方向)、正常状态样本,共4类;
实验过程中,首先对采集的滚动轴承振动信号进行归一化处理得到滚动轴承归一化振动信号集合;然后对归一化处理后的滚动轴承振动信号进行标注,标注方法采用one-hot模式,正常状态对应的one-hot编码标注值确定为[0,0,0,1],内圈损伤故障对应的one-hot编码标注值确定为[0,0,1,0],外圈损伤故障对应的one-hot编码标注值确定为[0,1,0,0],滚动损伤体故障对应的one-hot编码标注值确定为[1,0,0,0];再对归一化处理后的信号进行切分,构建滚动轴承故障诊断数据集振动信号样本,其中,每个样本的长度l=1600;再根据得到的样本和标签,构建滚动轴承故障诊断数据集,对数据集进行随机互斥取样,生成滚动轴承故障诊断训练数据集和测试数据集,其中,训练数据集的样本数为10904个,测样数据集的样本数为4676个;
最后构建滚动轴承故障诊断网络,与不同网络进行对比,如表1所示,本发明实验部分共构建了如下4个网络:
表1
表1中,Conv1d(kernel_size=9,in_channel=1,out_channnel=6,stride=1)表示一维卷积层,其中,kernel_size=9表示卷积核为9,in_channel=1表示输入通道为1,out_channnel=6表示输出通道为6,stride=1表示步长为1;
ReLu()表示ReLu激活函数;
MaxPool1d(kernel_size=2,stride=2)表示一维最大池化层,其中kernel_size=2表示池化核的大小为2,stride=2表示步长为2;
Conv1d(kernel_size=7,in_channel=6,out_channnel=16,stride=1)表示一维卷积层,kernel_size=7表示卷积核为7,in_channel=6表示输入通道为6,out_channnel=16表示输出通道为16,stride=1表示步长为1;
Linear(in_channel=400*16,out_channel=120)表示全链接层,其中,in_channel=400*16,表示输入节点数为400*16,out_channel=120表示输出节点数为120;
Linear(in_channel=120,out_channel=84)表示全链接层,其中,in_channel=120,表示输入节点数为120,out_channel=84表示输出节点数为84;
Linear(in_channel=120,out_channel=84)表示全链接层,其中,in_channel=120,表示输入节点数为120,out_channel=84表示输出节点数为84;
Conv1d(kernel_size=7,in_channel=6,out_channnel=16,stride=1,dilation=2)表示一维卷积层,其中,kernel_size=7表示卷积核为7,in_channel=6表示输入通道为6,out_channnel=16表示输出通道为16,stride=1表示步长为1;dilation=2表示卷积核的空洞化率为2;
AdaptiveAvgPool1d(1)表示全局平均池化;
eca_layer(kernel_size=3)表示通道注意力模块(其原理图如图1所示),kernel_size=3表示其卷积核的大小为3;
eca_layer1(kernel_size=7)表示通道注意力模块(其原理图如图1所示),kernel_size=7表示其卷积核的大小为7;
eca_layer2(kernel_size=9)表示通道注意力模块(其原理图如图1所示),kernel_size=9表示其卷积核的大小为9;
Conv1d(kernel_size=1,in_channel=16,out_channnel=84,stride=1)表示一维卷积层,其中,kernel_size=1表示卷积核为1,in_channel=16表示输入通道为16,out_channnel=84表示输出通道为84,stride=1表示步长为1;
Conv1d(kernel_size=1,in_channel=84,out_channnel=4,stride=1)表示一维卷积层,其中,kernel_size=1表示卷积核为1,in_channel=84表示输入通道为84,out_channnel=4表示输出通道84,stride=1表示步长为1;
其中,网络-1未采用空洞卷积,全连接层前未采用全局平均池化;网络-2采用空洞卷积,全连接层前采用全局平均池化;网络-3采用空洞卷积,全连接层前采用全局平均池化,采用单个通道注意力;网络-4采用空洞卷积,全连接层被卷积层替代,并采用2个通道注意力,网络-4的结构与本发明的结构完全一致。
实验中,将滚动轴承故障诊断模型的输出的4个实数中的最大值置1,其他值置0;滚动轴承故障诊断模型训练过程中,每批数据的个数为25(batch_size=25),迭代的轮数为50(epochs=50)。
参数的优化器采用Adam优化器,学***方的运行平均值的系数分别设置为0.9和0.99。
对测试集的评价指标采用准确率(accuracy)指标,计算公式如式(12)所示:
式(12)中,TP(ture postive)表示将正样本判断为正样本的数目,TN(turenegative)表示将负样本判断为负样本的数目,ALL表示所有样本的数目。
如图3所示为四种不同网络的检测精度对比结果。由图可见,本发明所采用方法取得了最好的检测结果。另外,从训练参数量的角度分析,网络-1需要训练的参数为779372个,网络-2需要训练的参数为2516个,网络-3需要训练的参数为2519个,本发明需要训练的参数为2524个。从网络-1和其他方法的对比,可以看出,空洞卷积核全局平均池化可以明显的减少网络需要训练的参数量,并提高其检测精度。网络-2和网络-3需要训练的参数量与本发明所需训练的参数量基本持平,但本发明的结果要优于网络-2和网络-3,这证明了本发明所采用的融合多通道注意力方法的优势。
如图4所示为四种不同网络的损失函数曲线结果,由图4可见,本发明所采用的网络-4的收敛速度与其他方法基本持平,说明采用本发明所提出的方法并不需要额外的训练轮次,能达到较好的检测结果。
Claims (9)
1.融合通道注意力的卷积神经网络滚动轴承故障诊断方法,其特征在于,所述滚动轴承故障诊断方法具体包括以下步骤;
根据采集到的待监测设备各个运行状态下滚动轴承振动信号,制作滚动轴承故障诊断数据集,所述滚动轴承故障诊断数据集包括滚动轴承故障诊断训练数据集和滚动轴承故障诊断测试数据集;
构建融合通道注意力的一维卷积神经网络滚动轴承故障诊断网络模型,所述滚动轴承故障诊断网络模型包括特征提取子网络、通道注意力子网络以及分类子网络;所述特征提取子网络由K1个常规卷积模块以及K2个空洞卷积模块串联而成,所述常规卷积模块由1个卷积层、1个激活层和1个池化层串联构成,所述空洞卷积模块由1个空洞卷积层和1个激活层串联构成;所述通道注意力子网络包括至少一个基于卷积的通道注意力卷积模块,所述基于卷积的通道注意力卷积模块包括全局平均池化层、K3个不同的一维卷积核以及sigmoid激活层;
根据所述滚动轴承故障诊断训练数据集,对所述滚动轴承故障诊断网络模型进行迭代训练;
根据设置的迭代更新轮数,对所述滚动轴承故障诊断网络模型中的训练参数进行循环迭代更新,待循环结束后,对最后一轮训练参数进行保存;
将保存的最后一轮训练参数加载到所述滚动轴承故障诊断网络模型中,将待监测设备各个运行状态下滚动轴承的信号输入故障诊断网络模型中得到故障诊断结果。
2.根据权利要求1所述融合通道注意力的卷积神经网络滚动轴承故障诊断方法,其特征在于,所述滚动轴承故障诊断训练数据集和滚动轴承故障诊断测试数据集制作步骤包括:
S1:通过安装在待监测设备上的加速度传感器,采集待监测设备运行状态下各个滚动轴承振动信号,获取滚动轴承振动信号集合X={xi|i<<N,i∈Z+};
式(1)~(3)中,xi表示输入滚动轴承振动信号,μ表示所有输入滚动轴承振动信号的均值,N表示输入滚动轴承振动信号的数量,σ表示所有输入滚动轴承振动信号的标准差,表示对xi归一化处理后的滚动轴承振动信号;
S3:对经过归一化处理后的滚动轴承振动信号进行标注处理,滚动轴承故障诊断标注信息包括正常状态、内圈故障、外圈故障和滚动体故障四类,对四类滚动轴承故障诊断标注信息均采用one-hot模式进行编码标注,所述四类滚动轴承故障诊断标注信息包括:正常运行状态对应的one-hot编码标注值为[0,0,0,1],内圈损伤故障对应的one-hot编码标注值为[0,0,1,0],外圈损伤故障对应的one-hot编码标注值为[0,1,0,0],滚动损伤体故障对应的one-hot编码标注值为[1,0,0,0];
sλ=Xstd[(λ-1)×l×ρ+1:(λ-1)×l×ρ+l] (4)
式(4)中λ表示振动信号样本序号,l表示每个样本的长度,l=klnr,nr表示滚动轴承转动一周,加速度传感器所能采集到的振动信号的长度,v表示滚动轴承的转动速度,单位转/秒,f表示加速度传感器的采样频率,单位千赫兹,其中kl∈Z+;
S7:对所述滚动轴承故障诊断数据集进行随机互斥取样,生成滚动轴承故障诊断训练数据集和滚动轴承故障诊断测试数据集。
3.根据权利要求2所述融合通道注意力的卷积神经网络滚动轴承故障诊断方法,其特征在于,所述特征提取子网络第1常规卷积模块中的第一层卷积操作采用尺寸为1×k1的卷积核对输入振动信号进行卷积,所述第一层卷积操作中卷积核的个数为1×c1,采用卷积步长为1;
所述第1个常规卷积模块中的第二层激活操作用于对输入信号进行非线性变换,以增加网络的非线性表达能力,所述第1个常规卷积模块中的第二层激活操作采用线性整流函数ReLu函数来描述,所述ReLu函数表达式如式(5)所示:
式(5)中xRelu表示ReLu函数的输入信号,
所述第1个常规卷积模块中的第三层池化操作用于对输入信号进行降采样操作,压缩样本的空间尺寸,提高卷积运算的感受野,所述第1个常规卷积模块中的第三层池化操作采用尺寸为1×2的池化核对其输入信号进行池化操作,池化步长为2;
所述特征提取子网络中第2常规卷积模块到第K1常规卷积模块的结构与第1个常规卷积模块一致,均包括第一层卷积操作、第二层激活操作以及第三层池化操作,所述特征提取子网络中第2个常规卷积模块、…第k常规卷积模块、…第K1常规卷积模块中的第一层卷积层采用的卷积核尺寸分别为1×k2、…1×kk、…所述特征提取子网络中第2个常规卷积模块、…第k常规卷积模块、…第K1常规卷积模块中的第一层卷积层采用的卷积核个数分别为1×c2、…1×ck、…
将特征提取子网络的输入振动信号设为sbλ,sbλ∈R1×l×c×b,其中c表示振动信号样本的通道数,即安装在待监测设备上的加速度传感器的个数,b表示第bλ批送入滚动轴承故障诊断网络模型的样本的个数,
4.根据权利要求3所述融合通道注意力的卷积神经网络滚动轴承故障诊断方法,其特征在于,所述特征提取子网络中第K1+1卷积模块到第K1+K2卷积模块采用空洞卷积模块,所述特征提取子网络中第K1+1空洞卷积模块到第K1+K2空洞卷积模块的结构均包括两层,第一层为空洞卷积操作,第二层为激活操作,所述激活操作采用ReLu激活函数;
所述特征提取子网络中第K1+1空洞卷积模块、第K1+k空洞卷积模块、第K1+K2卷积模块中的第一层空洞卷积操作采用的卷积核尺寸分别为1×kd1、…1×kdk、…所述特征提取子网络中第K1+1空洞卷积模块、…第K1+k空洞卷积模块、…第K1+K2空洞卷积模块中的第一层空洞卷积操作采用的卷积核个数分别为1×cd1、…1×cdk、…所述特征提取子网络中第K1+1空洞卷积模块、…第K1+k空洞卷积模块、…第K1+K2空洞卷积模块中的第一层空洞卷积操作的空洞率分别为dr1、...、drk、...
5.根据权利要求4所述融合通道注意力的卷积神经网络滚动轴承故障诊断方法,其特征在于,所述通道注意力卷积模块用于提高所述第K1+K2空洞卷积模块的输出特征图跨通道交互信息,增加重要通道的权重,减少非重要通道的权重,获取通道注意力卷积模块输出的具体步骤包括:
6.根据权利要求5所述融合通道注意力的卷积神经网络滚动轴承故障诊断方法,其特征在于,所述分类子网络包括全局平均池化层、K4个相同的一维卷积核以及softmax层,所述分类子网络获取softmax运算结果的具体步骤包括:
9.根据权利要求8所述融合通道注意力的卷积神经网络滚动轴承故障诊断方法,其特征在于,得到待监测设备运行状态下各个滚动轴承的故障诊断结果的具体步骤包括:
S1:将所保存的第M轮训练参数加载到所述滚动轴承故障诊断网络模型中;
S2:将待检测信号/输入所述滚动轴承故障诊断网络模型中,分别通过特征提取子网络、通道注意力子网络以及分类子网络后产生相应的输出信号,所述输出信号包括4个取值在0到1之间的正实数;
S3:将S2中4个取值在0到1之间的正实数中最大的正实数置为1,其余3个正实数置为0;
S4:将S3中得到的结果分别与所述正常状态对应的one-hot编码标注值、内圈故障对应的one-hot编码标注值、外圈故障对应的one-hot编码标注值以及滚动体故障对应的one-hot编码标注值进行匹配,获取滚筒轴承的故障诊断结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210667941.5A CN115034267A (zh) | 2022-06-14 | 2022-06-14 | 融合通道注意力的一维卷积神经网络滚动轴承故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210667941.5A CN115034267A (zh) | 2022-06-14 | 2022-06-14 | 融合通道注意力的一维卷积神经网络滚动轴承故障诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115034267A true CN115034267A (zh) | 2022-09-09 |
Family
ID=83125606
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210667941.5A Withdrawn CN115034267A (zh) | 2022-06-14 | 2022-06-14 | 融合通道注意力的一维卷积神经网络滚动轴承故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115034267A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116416497A (zh) * | 2023-04-17 | 2023-07-11 | 广东海洋大学 | 一种轴承故障诊断***及方法 |
CN116448428A (zh) * | 2023-06-16 | 2023-07-18 | 通达电磁能股份有限公司 | 电机轴承故障诊断方法、装置、电子设备及可读存储介质 |
CN116893924A (zh) * | 2023-09-11 | 2023-10-17 | 江西南昌济生制药有限责任公司 | 设备故障处理方法、装置、电子设备和存储介质 |
CN116990648A (zh) * | 2023-09-26 | 2023-11-03 | 北京科技大学 | 基于一维空洞卷积神经网络的故障电弧检测方法 |
CN117951585A (zh) * | 2024-03-27 | 2024-04-30 | 国网山东省电力公司曲阜市供电公司 | 一种电力设备运行状态实时检测方法及*** |
-
2022
- 2022-06-14 CN CN202210667941.5A patent/CN115034267A/zh not_active Withdrawn
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116416497A (zh) * | 2023-04-17 | 2023-07-11 | 广东海洋大学 | 一种轴承故障诊断***及方法 |
CN116416497B (zh) * | 2023-04-17 | 2024-01-23 | 广东海洋大学 | 一种轴承故障诊断***及方法 |
CN116448428A (zh) * | 2023-06-16 | 2023-07-18 | 通达电磁能股份有限公司 | 电机轴承故障诊断方法、装置、电子设备及可读存储介质 |
CN116448428B (zh) * | 2023-06-16 | 2023-09-08 | 通达电磁能股份有限公司 | 电机轴承故障诊断方法、装置、电子设备及可读存储介质 |
CN116893924A (zh) * | 2023-09-11 | 2023-10-17 | 江西南昌济生制药有限责任公司 | 设备故障处理方法、装置、电子设备和存储介质 |
CN116893924B (zh) * | 2023-09-11 | 2023-12-01 | 江西南昌济生制药有限责任公司 | 设备故障处理方法、装置、电子设备和存储介质 |
CN116990648A (zh) * | 2023-09-26 | 2023-11-03 | 北京科技大学 | 基于一维空洞卷积神经网络的故障电弧检测方法 |
CN116990648B (zh) * | 2023-09-26 | 2023-12-19 | 北京科技大学 | 基于一维空洞卷积神经网络的故障电弧检测方法 |
CN117951585A (zh) * | 2024-03-27 | 2024-04-30 | 国网山东省电力公司曲阜市供电公司 | 一种电力设备运行状态实时检测方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115034267A (zh) | 融合通道注意力的一维卷积神经网络滚动轴承故障诊断方法 | |
CN112254964A (zh) | 一种基于快速多尺度卷积神经网络的滚动轴承故障诊断方法 | |
Tao et al. | Bearing fault diagnosis method based on stacked autoencoder and softmax regression | |
CN109858352B (zh) | 一种基于压缩感知与改进多尺度网络的故障诊断方法 | |
CN111046916A (zh) | 一种基于空洞卷积胶囊网络的电机故障诊断方法及*** | |
CN113111820B (zh) | 基于改进cnn与关系模块的旋转部件故障诊断方法及其装置 | |
Roy et al. | A stacked autoencoder neural network based automated feature extraction method for anomaly detection in on-line condition monitoring | |
CN111460728A (zh) | 一种工业设备剩余寿命预测方法、装置、存储介质及设备 | |
CN109946080B (zh) | 一种基于嵌入式循环网络的机械设备健康状态识别方法 | |
CN113008559B (zh) | 基于稀疏自编码器和Softmax的轴承故障诊断方法及*** | |
CN111289250A (zh) | 一种伺服电机滚动轴承剩余使用寿命预测方法 | |
CN112308147A (zh) | 基于多源域锚适配器集成迁移的旋转机械故障诊断方法 | |
CN112906892A (zh) | 一种基于深度学习与知识图谱的设备故障智能诊断方法 | |
CN111753891A (zh) | 一种无监督特征学习的滚动轴承故障诊断方法 | |
CN113139278A (zh) | 一种基于深度学习的轴承剩余寿命预测方法及*** | |
CN111832663A (zh) | 一种基于门控循环单元的胶囊网络滚动轴承故障诊断*** | |
CN111595541A (zh) | 一种海量振动传递率数据卷积神经网络处理的多维结构损伤识别方法 | |
CN114091504A (zh) | 一种基于生成对抗网络的旋转机械小样本故障诊断方法 | |
CN112541510A (zh) | 基于多通道时间序列数据的智能故障诊断方法 | |
CN113865872B (zh) | 基于小波包重构成像和cnn的轴承故障诊断方法 | |
CN115290326A (zh) | 一种滚动轴承故障智能诊断方法 | |
CN114626625B (zh) | 基于多模块U-BiLSTM网络的轴承寿命预测方法 | |
CN114091525A (zh) | 一种滚动轴承退化趋势预测方法 | |
CN111783941B (zh) | 一种基于概率置信度卷积神经网络的机械设备诊断分类方法 | |
CN112763215A (zh) | 一种基于模块化联邦深度学习的多工况在线故障诊断方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20220909 |
|
WW01 | Invention patent application withdrawn after publication |