CN117007685A - 一种基于迁移学习卷积神经网络的车轴故障诊断方法 - Google Patents

一种基于迁移学习卷积神经网络的车轴故障诊断方法 Download PDF

Info

Publication number
CN117007685A
CN117007685A CN202311002689.7A CN202311002689A CN117007685A CN 117007685 A CN117007685 A CN 117007685A CN 202311002689 A CN202311002689 A CN 202311002689A CN 117007685 A CN117007685 A CN 117007685A
Authority
CN
China
Prior art keywords
data
acoustic emission
axle
neural network
convolutional neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311002689.7A
Other languages
English (en)
Inventor
林丽
武祥迪
申子涵
黄进友
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Jiaotong University
Original Assignee
Dalian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian Jiaotong University filed Critical Dalian Jiaotong University
Priority to CN202311002689.7A priority Critical patent/CN117007685A/zh
Publication of CN117007685A publication Critical patent/CN117007685A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N29/00Investigating or analysing materials by the use of ultrasonic, sonic or infrasonic waves; Visualisation of the interior of objects by transmitting ultrasonic or sonic waves through the object
    • G01N29/14Investigating or analysing materials by the use of ultrasonic, sonic or infrasonic waves; Visualisation of the interior of objects by transmitting ultrasonic or sonic waves through the object using acoustic emission techniques
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M17/00Testing of vehicles
    • G01M17/08Railway vehicles
    • G01M17/10Suspensions, axles or wheels
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N29/00Investigating or analysing materials by the use of ultrasonic, sonic or infrasonic waves; Visualisation of the interior of objects by transmitting ultrasonic or sonic waves through the object
    • G01N29/44Processing the detected response signal, e.g. electronic circuits specially adapted therefor
    • G01N29/4481Neural networks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N29/00Investigating or analysing materials by the use of ultrasonic, sonic or infrasonic waves; Visualisation of the interior of objects by transmitting ultrasonic or sonic waves through the object
    • G01N29/44Processing the detected response signal, e.g. electronic circuits specially adapted therefor
    • G01N29/449Statistical methods not provided for in G01N29/4409, e.g. averaging, smoothing and interpolation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Pathology (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

本发明公开了一种基于迁移学习卷积神经网络的车轴故障诊断方法,包括:根据单工况的车轴声发射数据及其对应的声发射裂纹数据,获取训练后的卷积神经网络;将单工况的车轴声发射数据和多工况的车轴声发射数据输入至训练后的卷积神经网络,并基于迁移学习理论获取联合分布距离,得到基于迁移学习的卷积神经网络;以获取待进行故障诊断的车轴声发射数据对应的车轴声发射裂纹数据的概率的预测值,以指导待进行故障诊断的车轴进行故障诊断。本发明能够在时间较短的前提下对多工况的待进行故障诊断的车轴声发射数据的识别,能够达到了较高的准确率。方便的多工况车轴声发射裂纹数据的概率的预测值,以此来指导现场对待进行故障诊断的车轴进行故障诊断。

Description

一种基于迁移学习卷积神经网络的车轴故障诊断方法
技术领域
本发明涉及探伤检测、故障诊断领域,尤其涉及一种基于迁移学习卷积神经网络的车轴故障诊断方法。
背景技术
随着深度学习的不断发展,以卷积神经网络为代表的深度学习模型在车轴裂纹声发射信号故障诊断领域体现出了比传统手动提取信号特征更好的性能。但是传统的卷积神经网络的训练前提是必须要有数量巨大的车轴裂纹声发射标记数据,并且设计出来的模型只能够对单一工况下的裂纹声发射数据进行分类识别,如果换一种数据特征分布和源域差别很大的工况,那么之前训练出的模型对目标工况下故障信号的识别效果就不理想。
传统的卷积神经网络模型一般是分别通过卷积层和池化层来对数据进行特征提取和降维简化,对数据之间的非线性关系进行挖掘,进而对信号进行分类识别。但是传统的方法大多是对一种工况下的数据集进行标签,然后利用这种单一工况的数据集对模型进行训练。这种模型对同一工况下的信号进行识别效果很好,但当识别的数据采集自不同工况,那么识别效果就会大打折扣,面对新的工况识别就得需要重新训练一种新的模型来适应数据的需要。在实际工程中,由于外部工作环境的变化,轴类零件在各阶段的健康状况都会发生较大的变化,这就要求每次新的工作条件下都要有相应的训练样本,并且要花费很长的时间来重新训练相应工况下所需的模型。
发明内容
本发明提出一种基于迁移学习卷积神经网络的车轴故障诊断方法,以克服上述技术问题。
为了实现上述目的,本发明的技术方案是:
一种基于迁移学习卷积神经网络的车轴故障诊断方法,包括如下步骤:
S1:获取单工况的车轴声发射数据、所述单工况的车轴声发射数据对应的单工况车轴声发射裂纹数据、多工况的车轴声发射数据和所述多工况的车轴声发射数据对应的多工况车轴声发射裂纹数据;
其中,车轴声发射数据包括噪声数据、碰撞数据和车轴的疲劳裂纹数据;
S2:建立卷积神经网络,将所述单工况的车轴声发射数据作为卷积神经网络的输入,将单工况车轴声发射裂纹数据的概率作为卷积神经网络的输出,并基于卷积神经网络的损失函数对所述卷积神经网络进行训练,获取训练后的卷积神经网络;
S3:将所述单工况的车轴声发射数据和所述多工况的车轴声发射数据输入至所述训练后的卷积神经网络,并基于迁移学习理论获取单工况车轴声发射裂纹数据和多工况车轴声发射裂纹数据之间的联合分布距离;
S4:根据所述联合分布距离,获取基于迁移学习理论的损失函数,以根据基于迁移学习理论的损失函数,对所述训练后的卷积神经网络进行训练,获取基于迁移学习的卷积神经网络;所述基于迁移学习的卷积神经网络的输出为多工况车轴声发射裂纹数据的概率的预测值;
S5:根据待进行故障诊断的车轴声发射数据和基于迁移学习的卷积神经网络,获取待进行故障诊断的车轴声发射裂纹数据的概率的预测值,以指导待进行故障诊断的车轴进行故障诊断。
进一步的,所述S2中,卷积神经网络包括:输入层、第一卷积池化层、3组第二卷积池化层、3个全连接层和分类输出层;
所述输入层用于将所述单工况车轴声发射数据输入至所述第一卷积池化层中;
所述第一卷积池化层包括第一卷积层和第一池化层;所述第一卷积层分别与所述输入层和所述第一池化层连接;
3组所述第二卷积池化层依次连接;其中,所述第二卷积池化层包括第二卷积层和第二池化层;第1组第二卷积池化层中的第二卷积层与所述第一池化层连接;
其中,所述第一卷积层的卷积核大于第二卷积层的卷积核;
3个所述全连接层依次连接;且第1个全连接层与第3组第二卷积池化层中的第二池化层连接;第3个全连接层与所述分类输出层连接;
所述分类输出层与所述全连接层连接,用于获取单工况车轴声发射裂纹数据的概率。
进一步的,所述S2中的卷积神经网络的损失函数如下:
其中,M为输入的单工况的车轴声发射数据的总数量,P(xm)为真实数据,Q(xm)为预测数据;m为样本数据编号,L表示卷积神经网络的损失函数;。
进一步的,所述S3中,所述联合分布距离获取如下:
其中,表示联合分布距离;ns表示的是单工况的车轴声发射数据的样本个数;a表示的是单工况的车轴声发射数据中的样本序号;nt表示的是目标域中的样本个数;b表示的是目标域中的样本序号;l表示源域目标域数据层数的样本序号;L′表示源域目标域数据层数;/>表示源域样本序号内输出的源域数据;/>表示多工况的车轴声发射数据样本序号内输出的源域数据;/>表示源域样本序号内输出的目标域数据;/>表示多工况的车轴声发射数据样本序号内输出的目标域数据;kl(·,·)表示特征核函数。
进一步的,所述S4中,基于迁移学习理论的损失函数获取如下:
式中:L表示卷积神经网络的损失函数;L_JMMD表示基于迁移学习理论的损失函数;λ表示用于表示损失值在总损失中的权重的惩罚因子。
有益效果:本发明的一种基于迁移学习卷积神经网络的车轴故障诊断方法,通过单工况的车轴声发射数据和多工况的车轴声发射数据,共同建立基于迁移学习的卷积神经网络,使得所建立的基于迁移学习的卷积神经网络能够在时间较短的前提下对多工况的待进行故障诊断的车轴声发射数据的识别,能够达到了较高的准确率。基于迁移学习的卷积神经网络能够直接处理原始信号,无需任何费时的手工特征提取过程,方便的多工况车轴声发射裂纹数据的概率的预测值,以此来指导现场对待进行故障诊断的车轴进行故障诊断。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的基于迁移学习卷积神经网络的车轴故障诊断方法流程图;
图2为本发明实施例中的卷积神经网络结构图结构示意图;
图3为本发明实施例中的一维卷积操作过程示意图;
图4为本发明实施例中的激活函数的曲线示意图;
图5为本发明实施例中的MAX池化的操作示意图;
图6为本发明实施例中的全连接层示意图;
图7为本发明实施例中的卷积神经网络训练过程流程示意图;
图8为本发明实施例中的领域迁移自适应过程示意图;
图9为本发明实施例中的基于迁移学习的卷积神经网络结构示意图;
图10为本发明的实施例中的混淆矩阵示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本实施例提供了一种基于迁移学习卷积神经网络的车轴故障诊断方法,如图1,包括如下步骤:
具体的,在已有的声发射数据的基础上,建立最终的卷积神经网络作为声发射信号卷积神经网络故障识别模型,并将其应用于其它环境下。将单个工况下的有标记单工况车轴声发射裂纹数据作为源域,没有标记的多工况车轴声发射信号作为目标域,然后,将没有标记的目标域的声发射信号和有标记的源域的声发射信号一起输入到所述卷积神经网络中进行迁移学习。在训练时,将源域数据和没有进行标记的目标域数据一起输入进一维卷积神经网络模型中,通过多个卷积-池化层来提取源域和目标域的数据特征,在最后一个全连接层之后对源域和目标域的特征联合分布差异(JMMD)进行计算,获取单工况车轴声发射裂纹数据和多工况车轴声发射裂纹数据之间的联合分布距离,并将其与卷积神经网络模型的分类损失加起来作为最终的总损失函数。再通过反向传播更新网络参数。最后,完成领域自适应CNN-JAN模型训练。其中步骤主要包括:
S1:获取单工况的车轴声发射数据、所述单工况的车轴声发射数据对应的单工况车轴声发射裂纹数据、多工况的车轴声发射数据和所述多工况的车轴声发射数据对应的多工况车轴声发射裂纹数据;
具体的,车轴声发射数据包括噪声数据、碰撞数据和车轴的疲劳裂纹数据,其中,噪声数据的概率、碰撞数据的概率和车轴的疲劳裂纹数据的概率之和等于1;具体的,本实施例中,噪声数据是列车实际工作环境中的各种杂乱噪声信号的数据;碰撞数据指的是列车实际工作环境下车轮与轨道、异物撞击的过程中产生的信号的数据;车轴的疲劳裂纹数据指的车轴的疲劳裂纹产生的声发射信号的数据。其中的多工况包括但不限于加速工况,制动工况,高速工况,转弯工况等。
S2:建立卷积神经网络,将所述单工况的车轴声发射数据作为卷积神经网络的输入,将单工况车轴声发射裂纹数据的概率作为卷积神经网络的输出,并基于卷积神经网络的损失函数对所述卷积神经网络进行训练,获取训练后的卷积神经网络;
S3:将所述单工况的车轴声发射数据和所述多工况的车轴声发射数据输入至所述训练后的卷积神经网络,并基于迁移学习理论获取单工况车轴声发射裂纹数据和多工况车轴声发射裂纹数据之间的联合分布距离;
S4:根据所述联合分布距离,获取基于迁移学习理论的损失函数,以根据基于迁移学习理论的损失函数,对所述训练后的卷积神经网络进行训练,获取基于迁移学习的卷积神经网络;所述基于迁移学习的卷积神经网络的输出为多工况车轴声发射裂纹数据的概率的预测值;
将所述单工况的车轴声发射数据和所述多工况的车轴声发射数据作为基于迁移学习的卷积神经网络的输入,将所述单工况车轴声发射裂纹数据和多工况车轴声发射裂纹数据的概率作为基于迁移学习的卷积神经网络的输出,对所述基于迁移学习的卷积神经网络进行训练,获取训练后的基于迁移学习的卷积神经网络;
S5:根据待进行故障诊断的车轴声发射数据和基于迁移学习的卷积神经网络,获取待进行故障诊断的车轴声发射裂纹数据的概率的预测值,以指导待进行故障诊断的车轴进行故障诊断。
具体的,卷积神经网络(CNN)是属于有监督的人工神经网络,其实际上是一个包含很多个处理层的感知机,在模式分类领域有着广泛的应用。CNN的工作过程主要包括两个部分,一个是特征抽取,一个是信号分类。CNN通过独有的卷积层提取数据的深层特征,并通过池化层进行数据降维简化的一系列流程称为信号滤波,通过softmax对最后一个全连接层得到的最终特征数据进行分类的过程称为信号分类。滤波层主要由卷积层,池化层部分构成,最后由全连接层输出分类。图2所示是经典CNN网络简化后的流程框架。深层卷积神经网络会通过设计多个结构参数不同的卷积层和池化层来多次对输入数据进行特征提取,从而达到深度学习数据特征的目的。分类函数在全连接层之后,对全连接层提取到的最终特征进行概率识别。
优选地,所述S2中,卷积神经网络包括:输入层、第一卷积池化层、3组第二卷积池化层、3个全连接层和分类输出层;
所述输入层用于将所述单工况车轴声发射数据输入至所述第一卷积池化层中。具体的,用于所述输入层用于接收所述单工况的车轴声发射数据,将其传输至第一卷积池化层;
所述第一卷积池化层包括第一卷积层和第一池化层;所述第一卷积层分别与所述输入层和所述第一池化层连接;
3组所述第二卷积池化层依次连接;其中,所述第二卷积池化层包括第二卷积层和第二池化层;第1组第二卷积池化层中的第二卷积层与所述第一池化层连接;
其中,其中,所述第一卷积层的卷积核大于第二卷积层的卷积核;
具体的本实施例中,所述第一卷积层的卷积核的大小为64×1;所述第二卷积层的卷积核的大小为3×1;
3个所述全连接层依次连接;且第1个全连接层与第3组第二卷积池化层中的第二池化层连接;第3个全连接层与所述分类输出层连接;
所述分类输出层与所述全连接层连接,用于获取单工况车轴声发射裂纹数据的概率;
具体的,卷积层是卷积神经网络特征提取的核心,卷积神经网络的多数计算量在卷积层完成。卷积层使用卷积内核与上层的得到的特征进行卷积操作,以设定的步长遍历输入层的全部数据,这样逐层提取越来越高级的特征信息。由于一个卷积内核对应下一层中的一帧,所以帧数通常称为该层的深度。本实施例中的第一卷积层/第二卷积层的卷积过程如图3所示,卷积层计算公式如下:
其中,为第l+1层卷积层中与第i个卷积核进行卷积运算输出的第j个局部区域;/>表示第l层卷积层中第i个卷积核内核的权重;/>表示第l层卷积层中第i个卷积核内核的偏置;X(l)(j)表示输入源域(目标域)训练集数据在第l层卷积层中第j个局部区域。
具体的,在输入数据经过卷积运算之后,传递到激活层,由激活函数为卷积神经网络提供非线性表达能力,通过激活函数激活之后的输出值会变得更加复杂,使得卷积神经网络中线性不可分的多维特征映射到另一空间来获取信号的非线性表达,从而提升了卷积神经网络模型的表达能力,最终使学***流线性函数(ReLU),激活函数的曲线表示如图4所示,ReLU函数能够克服梯度弥散的现象,当输入值大于0时,其导数始终是1,并且可以加快模型的收敛速度。
其公式如下:
其中,为第l+1层卷积层的输出/>的激活值;
具体的,卷积神经网络中输入数据在经过卷积层的卷积核提取特征之后,后边通常会设计一个池化层来对卷积层提取到的特征数据的维度进行降低,下采样操作还可以精简优化特征参数,进一步加速模型的收敛速度,减轻计算机的计算压力。Max池化将选择感知域内的最大值作为输出值,图5为MAX池化的操作示意图,其计算方式如下,
其中,为卷积层输出/>的激活值为第l+1层第i个卷积核中的第t个神经元的值,/>为池化层感知区域宽度神经元的最大值为池化操作的第l+1层卷积层对应的池化层的神经元对应值;(j-1)ω+1≤t≤jω为池化层感知区域的宽度;。
具体的,本发明的实施例中的全连接层通常处于最后一个池化层之后,将之前的卷积层、激活层和池化层提取到的特征信息进行整合,并将接收到的数据进行简化处理,并提取更深层次的特征。如图6所示,首先将滤波阶段的最后一层的输出展开成一维形式的特征向量,将其作为全连接层的输入。
全连接层的正向传播计算方式如下:
其中,Zl+1(j)为第l+1层卷积层对应的全连接层的第j个局部区域输出值,为第l层卷积层对应的全连接层的第i个卷积核与第l+1层卷积层对应的全连接层的第j个局部区域之间的权值,/>为第l层卷积层对应的全连接层的所有神经元对第l+1层的第j个局部区域的偏置值。
优选地,所述S2中的卷积神经网络的损失函数如下:
用来衡量神经网络模型对数据的拟合程度的指标被称为损失函数(Lossfunction),一般情况下,损失函数的误差越大,说明模型训练的效果越差。常见的损失函数包括交叉熵损失函数和均方误差函数,其中交叉熵函数的数学表达式如下:
其中,M为输入的单工况的车轴声发射数据的总数量,P(xm)为真实数据,Q(xm)为预测数据;m为样本数据编号;
通过反向传播算法,根据损失函数计算梯度,进而更新模型中的参数。经过多次迭代更新训练后,模型逐渐优化稳定。
具体的,在特征迁移学习中,最重要的计算难题之一是如何有效地降低各领域间的特征分布差异,而领域适应性是其中一种。该算法可以最大限度地降低源、目标领域数据间的分布差异,并利用包含丰富信息的源域数据样本对目标域数据进行标定,然后对两个领域中的数据进行特征映射,使得新的特征处于相同的空间中,并将源域数据的特征抽取能力应用到目标领域中,以提升模型对目标领域的诊断能力。
迁移学习领域自适应JAN(Joint Adaptation Network)核心思想是通过内积操作使核函数泛化成一个联合分布。具体的改进内容为:对每一层的特征用核函数映射到希尔伯特空间中,对映射到空间的特征做一个内积,内积完之后再寻找一个映射函数,能够将变量映射到高维空间,之后求两个分布的随机变量在映射后的期望的差,这个差值便是均值差异,然后寻找这个均值
优选地,所述S3中,所述联合分布距离获取如下:
其中,表示联合分布距离;ns表示的是单工况的车轴声发射数据的样本个数;a表示的是单工况的车轴声发射数据中的样本序号;nt表示的是目标域中的样本个数;b表示的是目标域中的样本序号;l表示源域目标域数据层数的样本序号;L′表示源域目标域数据层数;/>表示源域样本序号内输出的源域数据;/>表示多工况的车轴声发射数据样本序号内输出的源域数据;/>表示源域样本序号内输出的目标域数据;/>表示多工况的车轴声发射数据样本序号内输出的目标域数据;kl(·,·)表示特征核函数。
优选的,所述S4中,基于迁移学习理论的损失函数获取如下:
式中:L表示卷积神经网络的损失函数;L_JMMD表示基于迁移学习理论的损失函数;λ表示用于表示损失值在总损失中的权重的惩罚因子;
具体的,本发明的实施例通过联合分布距离(即JMMD)对基于迁移学习理论的损失函数进行优化,使源域和目标域之间的联合分布距离更加接近,以此提高网络预测性能。基于迁移学习理论的损失函数由分类损失(卷积神经网络的损失)和分布距离组成。JMMD是对于需要进行联合分布距离约束的全连接层进行了联合建模,然后通过基于迁移学习理论的损失函数,使得最小化联合分布差距离函数,来使得基于迁移学习理论的损失达到最优,以此获得基于迁移学习的卷积神经网络。其中,联合分布差距函数为领域内的现有技术,这里不对其进行详细描述。
在减小了源域和目标域之间的差距之后,可以使用包括目标域数据在内的源域数据来训练基于迁移学习的卷积神经网络。迁移学习的目标是通过源域数据的知识帮助提升基于迁移学习的卷积神经网络在目标域数据上的性能。
具体的,卷积神经网络模型通过训练对特征进行自动提取,其过程训练分为正向传播阶段和反向传播阶段两个过程。其中正向传播又叫向前传播,主要是通过卷积、池化操作直至全连接层输出诊断结果并计算损失函数Loss值;每次正向传播后都会有一个误差用来反映本次传播后的网络状态,然后这个误差会逐层反向向前传递,使神经元根据误差逐层完成权值更新的传播过程即为反向传播过程。如图7所示。
最后,根据未知的待进行故障诊断的车轴声发射数据和基于迁移学习的卷积神经网络,将待进行故障诊断的车轴声发射数据输入至已经训练好的基于迁移学习的卷积神经网络,获取待进行故障诊断的车轴声发射裂纹数据的概率的预测值,以指导待进行故障诊断的车轴进行故障诊断。
在本发明的一个实施例中,使用CNN-JAN模型总共有13层网络,网络最开始是一个1024×1的输入层,之后使用一个64×1的第一卷积层对输入数据进行特征提取,接着是3组第二卷积池化层,最后是三个全连接层和一个分类层。第二卷积层的卷积核尺寸为3×1,卷积移动步长为2×1,第二池化层的窗口大小为2×1,步长为2×1。
具体的,首先,将单个工况下的有标记的车轴AE信号作为源域,建立基于车轴声发射信号(AE信号)的识别模型,其中,有标记的车轴AE信号是指已知所述单工况的车轴声发射数据和所述单工况的车轴声发射数据对应的单工况车轴声发射裂纹数据;然后,将没有标记的目标域AE信号和有标记的源域AE信号一起输入到基于迁移学习的卷积神经网络中进行迁移学习。在训练时,首先将已经标记好的的源域数据和没有进行标记的目标域数据一起输入进一维CNN模型(卷积神经网络)中,通过多个卷积-池化层来提取源域和目标域的数据特征,在最后一个全连接层之后对源域和目标域的特征联合分布差异(JMMD)进行计算,获取联合分布距离,并将其与卷积神经网络模型的分类损失加起来作为最终的总损失函数,如图8和图9所示。再通过反向传播更新网络参数。最后,在完成领域自适应CNN-JAN模型(基于迁移学习的卷积神经网络)训练后,将目标域中无标签的声发射信号测试集输入到模型中,对CNN-JAN模型的最终识别效果进行测试验证。
在这一部分中,所用到的单工况和多工况下的列车车轴声发射信号数据,是通过生产实践中的车轴转动模拟试验平台,对列车车轴从初始轻微开裂到最终断开的全过程声发射信号进行实时监测而采集来的。用到的车轴声声发射信号一共分为三类,第一类信号是噪声信号,是在模拟列车实际工作环境中的各种杂乱噪声而收集的信号,第二类信号分别是通过模拟列车实际工作环境下车轮与轨道、异物撞击的过程产生的信号,第三类信号是列车车轴的疲劳裂纹信号,共有三组车轴疲劳裂纹数据,分别有5060608、7130112、10602496个数据点,随机选取样本分别记为数据集A、数据集B和数据集C,具体见表1。每个数据集主要包括噪声信号、敲击信号和车轴裂纹声发射信号,这些信号数据分别包含了3种不同载荷下有标签和不含标签的车轴声发射信号。从三种声发射信号中随机选取80%的声发射信号作为训练集样本,剩余20%的三种声发射信号作为测试集样本。源域数据样本全部打标签,标签0表示裂纹信号,标签1表示敲击信号,标签2表示噪声信号,目标域数据样本不进行打标签处理。
表1
对模型分类识别性能评估;
在评估模型的鲁棒性、泛化能力等性能时,不能只以识别率为唯一的标准,还必须要有其它的统计学评估指标一起参与,才能对模型的性能进行衡量。在不同的任务需求下,采用不同的度量标准,就会得出不同的评价结论。本发明所用的识别准确率指的是模型正确识别的样本个数占识别样本总数的比例,是对诊断模型分类能力的一个整体评估,但是考虑到不同类别样本在数量上的不均衡,若单一使用准确率作为指标会忽略某一类样本的判别状况而得到一个较高的总识别率。为了更加客观的评价诊断模型的性能,分别引入了基于统计学原理的混淆矩阵、精确率(Precision)、召回率(Reacll)、F1值(F1-Measure)等四个分类模型的综合评价指标。
针对正常“正常—故障”的二分类问题的混淆列表如表2所示,可知按照不同的计算方式,分为“真正例”、“假正例”、“真反例”和“假反例”。
表2
混淆矩阵是用n行n列的矩阵形式来表达精度的一种可视化工具,若把模型对不同类别的识别结果显示在一个混淆矩阵里面,可以清晰的表达出模型的识别能力。
精确率P表达的含义是在预测结果中,在模型输出的预测为正的样本中一共有多少个是真正的正例样本,共有两种可能,一种是把输入的正例样本预测为正类(TP),另一种就是把反例样本预测为正例(FP),其计算方式如式下所示。
召回率R表达的是输入的样本中有多少个正例样本被正确的预测为正例,其中也包含两种可能性,一种是把输入的正例样本预测为正例(TP),另一种就是把输入的正例样本预测为反例(FN),其计算方式如下:
统计学上又提出了F1值,F1值通常是在精确率P与召回率R的结果出现矛盾时,作为精确率和召回率数值上的综合考量,其计算方式如下:
对一维领域自适应CNN-JAN模型(基于迁移学习的卷积神经网络)评估指标结果分析:
模型训练至最优时,将目标域测试集输入模型后可得到其预测标签,与真实标签进行混淆矩阵的计算。为了消除在某一次训练过程中可能出现的偶然性结果,将模型训练20次,并计算20次结果的平均值作为统计结果。计算测试集在模型中输出的预测结果的精确率为0.9810,召回率为0.9579,F1值为0.9695。领域自适应CNN-JAN模型(基于迁移学习的卷积神经网络)在某一次试验中测试集识别效果的混淆矩阵如图10所示。
图中横坐标表示真实标签,纵坐标表示预测标签,0、1、2分别代表裂纹信号,噪声信号和敲击信号。第二行中三个数值加和表示一共预测出100个噪声信号,其中预测正确的个数为99个,可以计算出噪声信号的预测准确率为99%。如法炮制,依次可以计算出裂纹信号和敲击信号的识别准确率分别为99%和69%。第一列三个数值加和表示有99个真实的裂纹信号,其中裂纹信号所对应的正确真确预测个数为99个,召回率为100%。依次的,可以计算出敲击信号和噪声信号的召回率分别为76.15%,97.18%。对在模型训练完成后,测试集的识别时间仅为4.7秒,以上的评估指标说明CNN-JAN模型对三类信号均具有很好的识别能力,且识别效率很高。
有益效果:本发明是针对传统的卷积神经网络需要大量的车轴裂纹声发射标记数据进行训练,并且模型只能够对单一工况下的裂纹声发射数据进行分类识别的问题,提出的一种基于迁移学习卷积神经网络的车轴故障诊断的方法。将一维卷积神经网络和迁移学习领域自适应相结合。能够通过最小化有标签源域数据和无标签目标域数据之间的分布差异,利用含有丰富信息的源域数据样本来标定目标域,再通过核函数映射方法对两个域内的数据做特征映射,使新的相似特征处在同一空间内,将对源域数据特征提取的能力用于无标签目标域任务,从而实现对源域数据模型的再利用。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (5)

1.一种基于迁移学习卷积神经网络的车轴故障诊断方法,其特征在于,包括如下步骤:
S1:获取单工况的车轴声发射数据、所述单工况的车轴声发射数据对应的单工况车轴声发射裂纹数据、多工况的车轴声发射数据和所述多工况的车轴声发射数据对应的多工况车轴声发射裂纹数据;
其中,车轴声发射数据包括噪声数据、碰撞数据和车轴的疲劳裂纹数据;
S2:建立卷积神经网络,将所述单工况的车轴声发射数据作为卷积神经网络的输入,将单工况车轴声发射裂纹数据的概率作为卷积神经网络的输出,并基于卷积神经网络的损失函数对所述卷积神经网络进行训练,获取训练后的卷积神经网络;
S3:将所述单工况的车轴声发射数据和所述多工况的车轴声发射数据输入至所述训练后的卷积神经网络,并基于迁移学习理论获取单工况车轴声发射裂纹数据和多工况车轴声发射裂纹数据之间的联合分布距离;
S4:根据所述联合分布距离,获取基于迁移学习理论的损失函数,以根据基于迁移学习理论的损失函数,对所述训练后的卷积神经网络进行训练,获取基于迁移学习的卷积神经网络;所述基于迁移学习的卷积神经网络的输出为多工况车轴声发射裂纹数据的概率的预测值;
S5:根据待进行故障诊断的车轴声发射数据和基于迁移学习的卷积神经网络,获取待进行故障诊断的车轴声发射裂纹数据的概率的预测值,以指导待进行故障诊断的车轴进行故障诊断。
2.根据权利要求1所述的一种基于迁移学习卷积神经网络的车轴故障诊断方法,其特征在于,所述S2中,卷积神经网络包括:输入层、第一卷积池化层、3组第二卷积池化层、3个全连接层和分类输出层;
所述输入层用于将所述单工况车轴声发射数据输入至所述第一卷积池化层中;
所述第一卷积池化层包括第一卷积层和第一池化层;所述第一卷积层分别与所述输入层和所述第一池化层连接;
3组所述第二卷积池化层依次连接;其中,所述第二卷积池化层包括第二卷积层和第二池化层;第1组第二卷积池化层中的第二卷积层与所述第一池化层连接;
其中,所述第一卷积层的卷积核大于第二卷积层的卷积核;
3个所述全连接层依次连接;且第1个全连接层与第3组第二卷积池化层中的第二池化层连接;第3个全连接层与所述分类输出层连接;
所述分类输出层与所述全连接层连接,用于获取单工况车轴声发射裂纹数据的概率。
3.根据权利要求1所述的一种基于迁移学习卷积神经网络的车轴故障诊断方法,其特征在于,所述S2中的卷积神经网络的损失函数如下:
其中,M为输入的单工况的车轴声发射数据的总数量,P(xm)为真实数据,Q(xm)为预测数据;m为样本数据编号,L表示卷积神经网络的损失函数;。
4.根据权利要求1所述的一种基于迁移学习卷积神经网络的车轴故障诊断方法,其特征在于,所述S3中,所述联合分布距离获取如下:
其中,表示联合分布距离;ns表示的是单工况的车轴声发射数据的样本个数;a表示的是单工况的车轴声发射数据中的样本序号;nt表示的是目标域中的样本个数;b表示的是目标域中的样本序号;l表示源域目标域数据层数的样本序号;L′表示源域目标域数据层数;/>表示源域样本序号内输出的源域数据;/>表示多工况的车轴声发射数据样本序号内输出的源域数据;/>表示源域样本序号内输出的目标域数据;/>表示多工况的车轴声发射数据样本序号内输出的目标域数据;kl(·,·)表示特征核函数。
5.根据权利要求1所述的一种基于迁移学习卷积神经网络的车轴故障诊断方法,其特征在于,所述S4中,基于迁移学习理论的损失函数获取如下:
式中:L表示卷积神经网络的损失函数;L_JMMD表示基于迁移学习理论的损失函数;λ表示用于表示损失值在总损失中的权重的惩罚因子。
CN202311002689.7A 2023-08-09 2023-08-09 一种基于迁移学习卷积神经网络的车轴故障诊断方法 Pending CN117007685A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311002689.7A CN117007685A (zh) 2023-08-09 2023-08-09 一种基于迁移学习卷积神经网络的车轴故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311002689.7A CN117007685A (zh) 2023-08-09 2023-08-09 一种基于迁移学习卷积神经网络的车轴故障诊断方法

Publications (1)

Publication Number Publication Date
CN117007685A true CN117007685A (zh) 2023-11-07

Family

ID=88572490

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311002689.7A Pending CN117007685A (zh) 2023-08-09 2023-08-09 一种基于迁移学习卷积神经网络的车轴故障诊断方法

Country Status (1)

Country Link
CN (1) CN117007685A (zh)

Similar Documents

Publication Publication Date Title
CN109765053B (zh) 利用卷积神经网络和峭度指标的滚动轴承故障诊断方法
CN112149316A (zh) 基于改进的cnn模型的航空发动机剩余寿命预测方法
CN105678332A (zh) 火焰图像cnn识别建模的转炉炼钢终点判断方法及***
CN107273924B (zh) 基于模糊聚类分析的多数据融合的电厂故障诊断方法
CN116448419A (zh) 基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法
CN114282443B (zh) 基于mlp-lstm有监督联合模型的剩余使用寿命预测方法
CN111768000A (zh) 在线自适应微调深度学习的工业过程数据建模方法
CN113743016B (zh) 基于自编码器和回声状态网络的发动机剩余寿命预测方法
CN114297918A (zh) 基于全注意力深度网络和动态集成学习的航空发动机剩余寿命预测方法
CN112147432A (zh) 基于注意力机制的BiLSTM模块、变压器状态诊断方法和***
CN112560948B (zh) 数据偏差下的眼底图分类方法及成像方法
CN108595803A (zh) 基于递归神经网络的页岩气井生产压力预测方法
CN113869563A (zh) 一种基于故障特征迁移的航空涡扇发动机剩余寿命预测方法
CN114266278A (zh) 一种基于双重注意力网络的设备剩余使用寿命预测方法
CN114015825A (zh) 基于注意力机制的高炉热负荷异常状态监测方法
CN111122811A (zh) 一种oica和rnn融合模型的污水处理过程故障监测方法
CN113919540A (zh) 一种生产过程运行状态的监测方法及相关设备
CN114548494B (zh) 一种可视化造价数据预测智能分析***
CN115982141A (zh) 一种针对时序数据预测的特征优化方法
CN113705715B (zh) 一种基于lstm和多尺度fcn的时间序列分类方法
CN114239397A (zh) 基于动态特征提取与局部加权深度学习的软测量建模方法
CN117216522A (zh) 一种基于机器学习的轴承故障类别诊断方法、装置及设备
CN116007937A (zh) 一种机械设备传动部件智能故障诊断方法及装置
CN117007685A (zh) 一种基于迁移学习卷积神经网络的车轴故障诊断方法
CN115153549A (zh) 一种基于bp神经网络的人机交互界面认知负荷预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination