CN117330314A - 一种基于二维灰度图和Swin-Transformer的轴承故障诊断方法 - Google Patents

一种基于二维灰度图和Swin-Transformer的轴承故障诊断方法 Download PDF

Info

Publication number
CN117330314A
CN117330314A CN202311263852.5A CN202311263852A CN117330314A CN 117330314 A CN117330314 A CN 117330314A CN 202311263852 A CN202311263852 A CN 202311263852A CN 117330314 A CN117330314 A CN 117330314A
Authority
CN
China
Prior art keywords
fault diagnosis
swin
bearing
layer
dimensional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311263852.5A
Other languages
English (en)
Inventor
向川
李伟晨
魏亮亮
韩冰
史鹏飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Maritime University
Original Assignee
Dalian Maritime University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian Maritime University filed Critical Dalian Maritime University
Priority to CN202311263852.5A priority Critical patent/CN117330314A/zh
Publication of CN117330314A publication Critical patent/CN117330314A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M13/00Testing of machine parts
    • G01M13/04Bearings
    • G01M13/045Acoustic or vibration analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Acoustics & Sound (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

本发明提供一种基于二维灰度图和Swin‑Transformer的轴承故障诊断方法,包括:将原始一维轴承振动信号经过矩阵变换,转换成二维灰度图像,作为轴承故障诊断的训练集、验证集和测试集;构建基于Swin‑Transformer的轴承故障诊断模型;将含有标签的训练集和验证集依次输入数据预处理模块和特征提取网络,获得二维灰度图的空间特征图,将空间特征图输入至分类网络,利用损失函数反向更新特征提取网络中的权重系数,直至达到预设迭代次数,由此形成训练好的轴承故障诊断模型;将测试集输入到训练好的轴承故障诊断模型中,实现轴承故障类型识别。本发明主要通过矩阵变换处理一维轴承振动信号,得到二维灰度图,采用Swin‑Transformer网络来进行故障诊断。

Description

一种基于二维灰度图和Swin-Transformer的轴承故障诊断 方法
技术领域
本发明涉及轴承故障诊断技术领域,具体而言,尤其涉及一种基于二维灰度图和Swin-Transformer的轴承故障诊断方法。
背景技术
轴承是机电设备中常见的部件之一,通常用于支撑旋转轴、减小摩擦和传递力量。然而,由于长时间使用、不良的润滑条件、过载等原因,轴承会遭受磨损、腐蚀、疲劳等故障,导致设备性能下降甚至完全失效。研究表明,约30%的旋转机械设备故障是由轴承损伤引起,因此对轴承故障进行精准、快速诊断对于避免重大安全事故、保证机电设备稳定、可靠运行具有重要意义。
轴承故障诊断过程主要分成两个步骤:故障特征提取和故障状态识别,其中故障特征提取作为故障状态识别模型的输入,对轴承故障诊断结果起决定性作用。传统的故障特征提取方法是通过人工提取信号中的故障特征,判断轴承是否发生故障。比如短时傅里叶变换和连续小波变换等方法。随着人工智能技术的快速发展,机器学习算法也被广泛用于轴承故障特征提取,比如支持向量机和卷积神经网络等。这类方法通过对大量的故障数据进行学习和分析,显著提高了故障预测和诊断的准确率及实时性,但仍存在特征提取过程比较复杂、标量神经元提取特征性能不足、池化层丢失有用特征信息等问题,导致故障诊断的准确率仍不够高,且故障诊断时间较长。此外,在实际工程应用中,轴承的运行状态会随着机械设备的负载的变化而发生变化,同种类型故障的相似特征会减少,这会导致故障诊断模型性能变差,难以很好地完成变工况下的故障诊断任务。因此进一步研究更高效的故障特征提取网络仍十分必要,以实现轴承故障的快速、精确诊断。
发明内容
根据上述提出的技术问题,提供一种基于二维灰度图和Swin-Transformer的轴承故障诊断方法。本发明主要通过矩阵变换处理一维轴承振动信号,得到二维灰度图,采用Swin-Transformer网络来进行故障诊断。
本发明采用的技术手段如下:
一种基于二维灰度图和Swin-Transformer的轴承故障诊断方法,包括:
获取故障诊断数据集;
构建故障诊断模型;
基于获取的故障诊断数据集,训练构建的故障诊断模型;
基于获取的故障诊断数据集,测试经过训练的故障诊断模型,得到轴承故障诊断结果。
进一步地,所述获取故障诊断数据集,包括:
将一维轴承振动信号通过矩阵变换转化为二维灰度图,作为轴承故障诊断的训练集、验证集和测试集。
进一步地,所述将一维轴承振动信号通过矩阵变换转化为二维灰度图,作为轴承故障诊断的训练集、验证集和测试集,具体包括:
利用矩阵变换将一维轴承振动信号转换为二维灰度图,作为原始数据集;
将原始数据集按7:2:1的比例进一步划分为训练集、验证集和测试集;
计算灰度图任意一点(i,j)的灰度p,计算公式为:
其中,round(.)为取整函数,L(i,j)为点(i,j)的实际振幅值,Lmax(i,j)和Lmin(i,j)分别为点(i,j)所能达到的振幅的最大值和最小值,点(i,j)所能取到的灰度值的范围为0~255;
将所得各点的灰度值以一定长度的步长进行切割,设步长为M,M 2为截取后的信号长度,按采样点顺序进行先行后列排列,得到二维灰度图矩阵如下:
进一步地,所述构建的故障诊断模型为基于Swin-Transformer网络的故障诊断模型,包括数据预处理模块、特征提取网络及分类网络;其中:
数据预处理模块包含图像分割层和线性嵌入层;
特征提取网络包括四个Stage模块,每个Stage模块由Swin-Transformer模块和图像下采样层堆叠而成,其中Swin-Transformer模块由窗口自注意力模块W-MSA、滑动窗口自注意力模块SW-MSA、全连接块MLP和层归一化层LN组成;
分类网络包括归一化层、全局池化层以及全连接层。
进一步地,构建基于Swin-Transformer网络的故障诊断模型,具体包括:
将二维灰度图输入图像分割层进行分块,以每4x4相邻的像素作为一个Patch,在通道方向展平;线性嵌入层LE将图片按高度H、宽度W展开,将每个Patch移动到第一维度中;将输入Patch划分为Patch tokens:
将得到的Patch tokens输入Swin-Transformer模块进行特征提取,提取过程如下:
z^l=W-MSA[LN(zl-1)]+zl-1
zl=MLP(LN(z^l))+z^l
z^l+1=SW–MSA(LN(zl))+zl
zl+1=MLP(LN(z^l+1))+z^l+1
其中,zl-1为Swin-Transformer模块的输入特征,z^l为内部窗口自注意力模块的输出特征,z^l+1为内部滑动窗口自注意力模块的输出特征,zl+1为Swin-Transformer模块的输出特征;
采用一个LN层和一个MLP块对样本进行归一化处理;
将Patch tokens输入滑动窗口自注意力模块SW-MSA中,滑动窗口自注意力模块SW-MSA对窗口进行重新划分,划分后对窗口重新合并保证所处理的窗口数不变,后隔绝不同区域之间的互相干扰,并实现对故障特征的进一步提取;
经过一个LN层和一个MLP块后,将特征图输入图像下采样层Patch Merging实现下采样,缩小分辨率,得到特征图;
将特征图输入分类网络得到故障类型。
进一步地,所述MLP块由一个全连接层、GELU激活函数和DropOut层组成,GELU激活函数公式为:
GELU(x)=0.5x×σ(1.702x)
其中,σ(·)表示sigmoid函数。
进一步地,所述将输入的Patch token通过LN层进行归一化操作,具体为:
其中,μl、σl为LN层的归一化统计量,l为MLP块的层数,H为隐层节点的数量、al为归一化后的值,ε为一个常数,用于防止除零错误。
进一步地,所述基于获取的故障诊断数据集,对构建的故障诊断模型进行训练,具体包括:
将训练集和验证集进行矩阵变换后输入至故障诊断模型的数据预处理模块和特征提取网络,得到二维灰度图的空间特征图;
将空间特征图输入至分类网络进行训练,在训练过程中,利用验证集评估模型性能,利用损失函数来反向更新特征提取网络及Swin-Transformer模块中的权重系数,直至达到预设的权重迭代次数,从而获得训练好的轴承故障诊断模型。
进一步地,所述基于获取的故障诊断数据集,对经过训练的故障诊断模型进行测试,得到轴承故障诊断结果,包括:
将测试集输入到训练好的轴承故障诊断模型,得到轴承故障诊断结果。
较现有技术相比,本发明具有以下优点:
1、本发明提供的基于二维灰度图和Swin-Transformer的轴承故障诊断方法,构建二维灰度图和Swin-Transformer的轴承故障诊断模型,该模型具有更强的特征提取能力,解决卷积神经网络等轴承故障诊断方法准确率不够高的问题,降低transformer网络的计算复杂度,缩短了训练时间。
2、本发明提供的基于二维灰度图和Swin-Transformer的轴承故障诊断方法,采用移动窗口,相邻窗口故障信息得到交互,降低了transformer模型的参数依赖性,使该模型具有良好的泛化性,适用于不同工况条件下机械设备故障的诊断研究。
基于上述理由本发明可在轴承故障诊断等领域广泛推广。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明方法流程图。
图2为本发明实施例提供的Swin-Transformer网络结构示意图。
图3为本发明实施例提供的Swin-Transformer模块结构图。
图4为本发明实施例提供的相对位置偏置工作示意图。
图5为本发明实施例提供的MLP块结构图。
图6为本发明实施例提供的滑动窗口自注意力模块工作示意图。
图7为本发明实施例提供的不同工况条件下可视化分类结果图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
如图1所示,本发明提供了一种基于二维灰度图和Swin-Transformer的轴承故障诊断方法,包括:
S1、获取故障诊断数据集;
S2、构建故障诊断模型;
S3、基于获取的故障诊断数据集,训练构建的故障诊断模型;
S4、基于获取的故障诊断数据集,测试经过训练的故障诊断模型,得到轴承故障诊断结果。
具体实施时,作为本发明优选的实施方式,所述步骤S1中,获取故障诊断数据集,包括:
将一维轴承振动信号通过矩阵变换转化为二维灰度图,作为轴承故障诊断的训练集、验证集和测试集,具体包括:
S11、利用矩阵变换将一维轴承振动信号转换为二维灰度图,作为原始数据集;
S12、将原始数据集按7:2:1的比例进一步划分为训练集、验证集和测试集;
S13、计算灰度图任意一点(i,j)的灰度p,计算公式为:
其中,round(.)为取整函数,L(i,j)为点(i,j)的实际振幅值,Lmax(i,j)和Lmin(i,j)分别为点(i,j)所能达到的振幅的最大值和最小值,点(i,j)所能取到的灰度值的范围为0~255;
S14、将所得各点的灰度值以一定长度的步长进行切割,设步长为M,M 2为截取后的信号长度,按采样点顺序进行先行后列排列,得到二维灰度图矩阵如下:
具体实施时,作为本发明优选的实施方式,所述步骤S2中,构建的故障诊断模型为基于Swin-Transformer网络的故障诊断模型,包括数据预处理模块、特征提取网络及分类网络;其中:
数据预处理模块包含图像分割层(Patch partition)和线性嵌入层(LinearEmbedding,LE);
特征提取网络包括四个Stage模块,每个Stage模块由Swin-Transformer模块和图像下采样层(Patch Merging)堆叠而成,其中Swin-Transformer模块由窗口自注意力模块(W-MSA)、滑动窗口自注意力模块(SW-MSA)、全连接块(MLP)和层归一化层(LN)组成;
分类网络包括归一化层、全局池化层以及全连接层。
具体实施时,作为本发明优选的实施方式,如图2所示,所述步骤S2中,构建基于Swin-Transformer网络的故障诊断模型,具体包括:
S21、将二维灰度图输入图像分割层进行分块,以每4x4相邻的像素作为一个Patch,在通道方向展平;线性嵌入层LE将图片按高度H、宽度W展开,将每个Patch移动到第一维度中;将输入Patch划分为Patch tokens:
其中,H,W单位为像素(Pixel)。
S22、将得到的Patch tokens输入Swin-Transformer模块进行特征提取,提取过程如下:
z^l=W-MSA[LN(zl-1)]+zl-1
zl=MLP[LN(z^l)]+z^l
z^l+1=SW–MSA(LN(zl))+zl
zl+1=MLP(LN(z^l+1))+z^l+1
其中,zl-1为Swin-Transformer模块的输入特征,z^l为内部窗口自注意力模块的输出特征,z^l+1为内部滑动窗口自注意力模块的输出特征,zl+1为Swin-Transformer模块的输出特征;W-MSA为窗口自注意力模块,SW-MSA为滑动窗口自注意力模块,MLP块为全连接块,LN为层归一化层。如图3所示,为Swin-Transformer模块结构图。
S23、采用一个LN层和一个MLP块对样本进行归一化处理;在本实施例中,如图5所示,所述MLP块由一个全连接层、GELU激活函数和DropOut层组成,GELU激活函数公式为:
GELU(x)=0.5x×σ(1.702x)
其中,σ(·)表示sigmoid函数。
在本实施例中,所述将输入的Patch token通过LN层进行归一化操作,具体为:
其中,μl、σl为LN层的归一化统计量,l为MLP块的层数,H为隐层节点的数量、al为归一化后的值,ε为一个很小的数,用于防止除零错误。
S24、将Patch tokens输入滑动窗口自注意力模块SW-MSA中,滑动窗口自注意力模块(SW-MSA)对窗口进行重新划分,并指定窗口大小,然后在指定窗口内采用多头自注意力机制计算自注意力,自注意力Attention计算公式如下:
其中,SoftMax代表归一化函数,Q,K,V分别为query矩阵,key矩阵和value矩阵,d为query矩阵和key矩阵的维度,B为相对位置偏置(该值可通过相对位置索引,查相对位置偏差表得到)。Q,K,V矩阵大小由划分窗口大小和设置的多头自注意力机制的头数决定。划分后对窗口重新合并保证所处理的窗口数不变,后隔绝不同区域之间的互相干扰,并实现对故障特征的进一步提取;如图6所示,滑动窗口自注意力模块对窗口进行重新划分,滑动距离是window_size/2,划分后通过循环移位对窗口重新合并保证所处理的窗口数不变。最终通过mask MSA算法隔绝不同区域之间的互相干扰,并实现对故障特征的进一步提取。
S25、经过一个LN层和一个MLP块后,将特征图输入图像下采样层(Patch Merging)实现下采样,缩小分辨率,得到特征图;
S26、将特征图输入分类网络得到故障类型。
具体实施时,作为本发明优选的实施方式,所述步骤S2中还包括:
S27、利用验证集对训练好的轴承故障诊断模型进行超参数调整,得到优化好的轴承故障诊断模型,所述验证集和步骤S1中训练集获取方法一样。
实施例
采用凯斯西储大学轴承故障数据集,其故障类型分为内圈、外圈和滚动体故障,工况条件分0hp、1hp、2hp和3hp等。不同工况条件下的数据集包含了正常状态和9种不同类型故障共10种,每个数据样本都被打上故障标签,表示对应的故障类型(其中正常状态标签为0)。本实施例选取工况条件为0hp、1hp、2hp和3hp,采样频率为12kHz,电机转速为1797r/min的数据集,每种故障情况选取200个样本,每种工况条件下实验样本数据集列表如表1所示。
表1每种工况条件下实验样本数据集情况(三线表)
每种工况条件下实验样本数据集经矩阵变换将一维轴承振动信号转换为二维灰度图,共获得2000张灰度图,将其按7:2:1的比例划分为训练集、验证集和测试集,由此获得1400个训练样本、400个验证样本和200个测试样本。
本实施例中,Swin-Transformer网络通过开源的软件库pytroch3.9构建,批处理次数设定为100次。利用训练集进行故障诊断模型训练,利用验证集对轴承故障诊断模型进行参数调整,实现轴承故障诊断模型优化,为使诊断模型能够迅速收敛,将所述超参数学习效率设为0.00001。
对比例1
以模型的准确率、损失值和单次批处理时间等参数评估本发明的有效性和先进性。本发明与典型故障诊断方法实验结果对比如表2所示。
表2实验结果对比
对比例2
不同工况条件下,本发明与典型故障诊断方法实验结果对比如表3所示。
表3不同工况条件下实验结果对比
不同工况条件下,本发明的故障分类效果T-SNE可视化如图7所示。由表2可知,相比于典型故障诊断方法,本发明的故障诊断准确率最高(99.31%),损失值最小(0.0198),且单次批处理时间最短(19ms/step),表明本发明对轴承故障的诊断性能明显优于其他方法。进一步由表3和图7可知,对不同工况条件下的故障,本发明相比于其他方法均保持最高的准确率,这表明本发明适用于不同工况条件下机械设备故障的诊断,具有良好的泛化性。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (9)

1.一种基于二维灰度图和Swin-Transformer的轴承故障诊断方法,其特征在于,包括:
获取故障诊断数据集;
构建故障诊断模型;
基于获取的故障诊断数据集,训练构建的故障诊断模型;
基于获取的故障诊断数据集,测试经过训练的故障诊断模型,得到轴承故障诊断结果。
2.根据权利要求1所述的基于二维灰度图和Swin-Transformer的轴承故障诊断方法,其特征在于,所述获取故障诊断数据集,包括:
将一维轴承振动信号通过矩阵变换转化为二维灰度图,作为轴承故障诊断的训练集、验证集和测试集。
3.根据权利要求2所述的基于二维灰度图和Swin-Transformer的轴承故障诊断方法,其特征在于,所述将一维轴承振动信号通过矩阵变换转化为二维灰度图,作为轴承故障诊断的训练集、验证集和测试集,具体包括:
利用矩阵变换将一维轴承振动信号转换为二维灰度图,作为原始数据集;
将原始数据集按7:2:1的比例进一步划分为训练集、验证集和测试集;
计算灰度图任意一点(i,j)的灰度p,计算公式为:
其中,round(.)为取整函数,L(i,j)为点(i,j)的实际振幅值,Lmax(i,j)和Lmin(i,j)分别为点(i,j)所能达到的振幅的最大值和最小值,点(i,j)所能取到的灰度值的范围为0~255;
将所得各点的灰度值以一定长度的步长进行切割,设步长为M,M 2为截取后的信号长度,按采样点顺序进行先行后列排列,得到二维灰度图矩阵如下:
4.根据权利要求1所述的基于二维灰度图和Swin-Transformer的轴承故障诊断方法,其特征在于,所述构建的故障诊断模型为基于Swin-Transformer网络的故障诊断模型,包括数据预处理模块、特征提取网络及分类网络;其中:
数据预处理模块包含图像分割层和线性嵌入层;
特征提取网络包括四个Stage模块,每个Stage模块由Swin-Transformer模块和图像下采样层堆叠而成,其中Swin-Transformer模块由窗口自注意力模块W-MSA、滑动窗口自注意力模块SW-MSA、全连接块MLP和层归一化层LN组成;
分类网络包括归一化层、全局池化层以及全连接层。
5.根据权利要求1所述的基于二维灰度图和Swin-Transformer的轴承故障诊断方法,其特征在于,构建基于Swin-Transformer网络的故障诊断模型,具体包括:
将二维灰度图输入图像分割层进行分块,以每4x4相邻的像素作为一个Patch,在通道方向展平;线性嵌入层LE将图片按高度H、宽度W展开,将每个Patch移动到第一维度中;将输入Patch划分为Patch tokens:
将得到的Patch tokens输入Swin-Transformer模块进行特征提取,提取过程如下:
z^l=W–MSA(LN(zl-1))+zl-1
zl=MLP(LN(z^l))+z^l
z^l+1=SW–MSA(LN(zl))+zl
zl+1=MLP(LN(z^l+1))+z^l+1
其中,zl-1为Swin-Transformer模块的输入特征,z^l为内部窗口自注意力模块的输出特征,z^l+1为内部滑动窗口自注意力模块的输出特征,zl+1为Swin-Transformer模块的输出特征;
采用一个LN层和一个MLP块对样本进行归一化处理;
将Patch tokens输入滑动窗口自注意力模块SW-MSA中,滑动窗口自注意力模块(SW-MSA)对窗口进行重新划分,划分后对窗口重新合并保证所处理的窗口数不变,后隔绝不同区域之间的互相干扰,并实现对故障特征的进一步提取;
经过一个LN层和一个MLP块后,将特征图输入图像下采样层(Patch Merging)实现下采样,缩小分辨率,得到特征图;
将特征图输入分类网络得到故障类型。
6.根据权利要求5所述的基于二维灰度图和Swin-Transformer的轴承故障诊断方法,其特征在于,所述MLP块由一个全连接层、GELU激活函数和DropOut层组成,GELU激活函数公式为:
GELU(x)=0.5x×σ(1.702x)
其中,σ(·)表示sigmoid函数。
7.根据权利要求5所述的基于二维灰度图和Swin-Transformer的轴承故障诊断方法,其特征在于,所述将输入的Patch token通过LN层进行归一化操作,具体为:
其中,μl、σl为LN层的归一化统计量,l为MLP块的层数,H为隐层节点的数量、al为归一化后的值,ε为一个常数,用于防止除零错误。
8.根据权利要求1所述的基于二维灰度图和Swin-Transformer的轴承故障诊断方法,其特征在于,所述基于获取的故障诊断数据集,对构建的故障诊断模型进行训练,具体包括:
将训练集和验证集进行矩阵变换后输入至故障诊断模型的数据预处理模块和特征提取网络,得到二维灰度图的空间特征图;
将空间特征图输入至分类网络进行训练,在训练过程中,利用验证集评估模型性能,利用损失函数来反向更新特征提取网络及Swin-Transformer模块中的权重系数,直至达到预设的权重迭代次数,从而获得训练好的轴承故障诊断模型。
9.根据权利要求1所述的基于二维灰度图和Swin-Transformer的轴承故障诊断方法,其特征在于,所述基于获取的故障诊断数据集,对经过训练的故障诊断模型进行测试,得到轴承故障诊断结果,包括:
将测试集输入到训练好的轴承故障诊断模型,得到轴承故障诊断结果。
CN202311263852.5A 2023-09-27 2023-09-27 一种基于二维灰度图和Swin-Transformer的轴承故障诊断方法 Pending CN117330314A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311263852.5A CN117330314A (zh) 2023-09-27 2023-09-27 一种基于二维灰度图和Swin-Transformer的轴承故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311263852.5A CN117330314A (zh) 2023-09-27 2023-09-27 一种基于二维灰度图和Swin-Transformer的轴承故障诊断方法

Publications (1)

Publication Number Publication Date
CN117330314A true CN117330314A (zh) 2024-01-02

Family

ID=89292495

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311263852.5A Pending CN117330314A (zh) 2023-09-27 2023-09-27 一种基于二维灰度图和Swin-Transformer的轴承故障诊断方法

Country Status (1)

Country Link
CN (1) CN117330314A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117951604A (zh) * 2024-02-26 2024-04-30 兰州理工大学 一种滚动轴承故障高效诊断方法及***

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117951604A (zh) * 2024-02-26 2024-04-30 兰州理工大学 一种滚动轴承故障高效诊断方法及***

Similar Documents

Publication Publication Date Title
Surendran et al. Deep learning based intelligent industrial fault diagnosis model.
Wang et al. A multi-scale convolution neural network for featureless fault diagnosis
CN108510153B (zh) 一种多工况旋转机械故障诊断方法
CN110705525A (zh) 一种诊断滚动轴承故障的方法及装置
CN114659790B (zh) 一种变转速风电高速轴轴承故障的识别方法
CN112665852B (zh) 一种基于深度学习的变工况行星齿轮箱故障诊断方法及装置
CN117330314A (zh) 一种基于二维灰度图和Swin-Transformer的轴承故障诊断方法
CN112836346B (zh) 基于cn和pca的电机故障诊断方法、电子设备及介质
CN116610993A (zh) 轴承故障诊断方法、***、设备及存储介质
Zhang et al. Fault diagnosis using unsupervised transfer learning based on adversarial network
Yeh et al. Using convolutional neural network for vibration fault diagnosis monitoring in machinery
CN112305388A (zh) 一种发电机定子绕组绝缘局部放电故障在线监测诊断方法
CN116842379A (zh) 一种基于DRSN-CS和BiGRU+MLP模型的机械轴承剩余使用寿命预测方法
CN113865872B (zh) 基于小波包重构成像和cnn的轴承故障诊断方法
CN113530850B (zh) 一种基于esa和堆叠胶囊自编码器的离心泵故障诊断方法
CN117556317A (zh) 一种基于时频图像的转动轴承故障诊断方法
CN113758709A (zh) 结合边缘计算和深度学习的滚动轴承故障诊断方法及***
CN115638965A (zh) 一种基于一维注意力机制和卷积神经网络的旋转机械故障诊断方法
CN115640531A (zh) 一种基于残差学习与注意力机制融合的故障诊断方法
CN115525866A (zh) 一种深度学习滚动轴承故障诊断方法及***
CN114152441A (zh) 基于移位窗口变换器网络的滚动轴承故障诊断方法及***
CN114626406A (zh) 基于类边界特征检测的轴承故障诊断方法及***
CN117708574B (zh) 一种嵌入物理信息的cnn变转速滚动轴承故障诊断方法
CN112668417B (zh) 一种基于振动信号的滚动轴承智能故障诊断方法
CN117992863B (zh) 基于可解释平稳小波包卷积网络的旋转机械故障诊断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination