CN114048568B - 一种基于多源迁移融合收缩框架的旋转机械故障诊断方法 - Google Patents
一种基于多源迁移融合收缩框架的旋转机械故障诊断方法 Download PDFInfo
- Publication number
- CN114048568B CN114048568B CN202111363881.XA CN202111363881A CN114048568B CN 114048568 B CN114048568 B CN 114048568B CN 202111363881 A CN202111363881 A CN 202111363881A CN 114048568 B CN114048568 B CN 114048568B
- Authority
- CN
- China
- Prior art keywords
- domain
- source
- feature
- data
- target domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013508 migration Methods 0.000 title claims abstract description 50
- 230000005012 migration Effects 0.000 title claims abstract description 50
- 238000003745 diagnosis Methods 0.000 title claims abstract description 45
- 230000004927 fusion Effects 0.000 title claims abstract description 43
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000012549 training Methods 0.000 claims abstract description 34
- 238000009826 distribution Methods 0.000 claims abstract description 25
- 230000002776 aggregation Effects 0.000 claims abstract description 12
- 238000004220 aggregation Methods 0.000 claims abstract description 12
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 238000012545 processing Methods 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 65
- 230000036541 health Effects 0.000 claims description 28
- 230000008602 contraction Effects 0.000 claims description 25
- 238000000605 extraction Methods 0.000 claims description 21
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 11
- 230000004913 activation Effects 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 9
- 230000006978 adaptation Effects 0.000 claims description 8
- 235000014653 Carica parviflora Nutrition 0.000 claims description 6
- 241000243321 Cnidaria Species 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 230000008859 change Effects 0.000 claims description 3
- 230000008034 disappearance Effects 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 3
- 238000002156 mixing Methods 0.000 claims description 3
- 238000011176 pooling Methods 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims description 3
- 239000000470 constituent Substances 0.000 claims 1
- 238000002372 labelling Methods 0.000 abstract description 2
- 230000008929 regeneration Effects 0.000 description 4
- 238000011069 regeneration method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/10—Geometric CAD
- G06F30/17—Mechanical parametric or variational design
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/08—Probabilistic or stochastic CAD
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/10—Noise analysis or noise optimisation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Geometry (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Hardware Design (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Medical Informatics (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Complex Calculations (AREA)
Abstract
一种基于多源迁移融合收缩框架的旋转机械故障诊断方法。对高噪声标注数据进行预处理;用源域带标签样本对模型进行预训练,通过深度残差收缩网络结构处理高噪声数据,提取出高维特征并训练好模型的分类模块;输入用于训练的目标域无标签样本,通过混合损失函数策略进行域对齐,得到对迁移后目标域数据特征的分类结果,再将所有域分类器的分类结果进行聚合决策,对未知状态新增类别标签,加权计算平均值得到最终分类结果;对目标域待测样本进行状态诊断。该模型能有效降低公共特征易受到与底层公共分布相关的噪声污染对诊断性能的影响,能将从多个源域获得的决策信息用于无标注的目标域数据实现高精度跨域故障诊断,并能够识别目标域中的未知状态。
Description
技术领域
本发明属于旋转机械智能故障诊断领域,特别涉及一种基于多源迁移融合收缩框架的旋转机械故障诊断方法。
背景技术
智能故障诊断领域中,从大型旋转机器收集的振动信号,往往会包含大量噪声,基于深度学习的方法在局部特征提取的时候容易受到噪声干扰无法监测到与故障相关的特征,从而降低诊断准确率。另一个关键问题是在实际应用中,训练和测试数据存在一定程度分布差异会降低分类模型的泛化性和准确率,考虑到故障样本数量不足且实际监测数据缺乏标签信息,近年来的广泛研究是引入深度迁移学习来解决标签缺失和样本不足问题,在不需要重新训练模型的基础上提高模型的泛化性。在滚动轴承实际工作中,常伴随着不同噪声干扰、不同工作负荷的情况,过强的噪声和有限的标签样本会使故障诊断及其困难,本发明主要针对这种复杂易变工作状况下旋转机械故障诊断问题,同时考虑到对不完备运行状态和处于工况变化的未知工况下的健康状态以及目标机器中的未知故障进行正确分类。
2019年,Liang Guo等人在论文《Deep Convolutional Transfer LearningNetwork:A New Method for Intelligent Fault Diagnosis of Machines WithUnlabeled Data》中提出一种使用深度卷积迁移网络对具有未标记数据的机器进行智能故障诊断的新方法,使用双模块结构分别进行状态识别和域适应。该方案使用一维深卷积网络来学***衡训练进度但并不一定完全适用于不平衡数据,不过对于数据样本及其有限的情况能显著提高诊断性能。此外,该方法对诊断过程中出现的未知状态缺少敏感性,容易导致边缘样本和未知状态错误分类。
综上所述,基于深度神经网络的单源迁移故障诊断技术主要有如下缺陷:(1)来自单个源机器的诊断知识不足以识别从所有健康状态中提取的目标机器样本,且模型对未知健康状态分类易出错。(2)公共特征表示容易受到与底层公共分布相关的噪声的污染,从而削弱诊断性能。不同旋转部件之间的噪声差异更大,这种情况在跨部件诊断任务中可能更为严重。(3)用于智能故障诊断的域适应方法大多考虑优化和使用更好的损失函数来减少域差异,但选取的损失函数往往不能适应会出现的所有迁移场景。针对这些缺陷,本发明提出一种多源迁移融合收缩框架来实现不同工况和不同部件之间的跨域故障诊断。
发明内容
本发明的目的是提出一种基于多源迁移融合收缩框架的旋转机械故障诊断方法,以解决单源域诊断知识不足,跨域噪声差异问题和未知状态分类问题。
为实现上述目的,本发明提供了如下方案:
基于多源迁移融合收缩框架的旋转机械故障诊断方法,其特征在于,包括以下步骤:
(1)对多源数据分别进行预处理;
旋转机械故障数据是一维的振动信号,包括健康工况、内圈故障、外圈故障和滚珠故障四种健康状态,每个源域和目标域各划分200个样本,每种健康状态各50个,各域样本在健康状态之间是平衡的;其中所有带标签源域数据和20%无标签目标域数据用作训练集,其余80%无标签目标域数据用作测试集;
(2)将源域带标签样本输入到多源迁移融合收缩模型,训练特征提取模块对高噪声信号的提取能力,并训练模型的分类模块;
所述的多源迁移融合收缩模型包括四个组件:公共特征提取器,域特征提取器,域分类器和聚合决策组件,前两个是特征提取模块的主要构成组件,后两个是分类模块的关键组件;
公共特征提取器提取将所有域样本映射到公共特征空间并全局对齐,得到公共特征表示;
域特征提取器数量为源域数量,接收公共特征提取器提取的公共特征表示,并分别将每对源域和目标域数据映射到特定的域特征空间,得到域不变特征表示;
域分类器接收到对应源域的域不变特征表示,通过全连接层和激活函数得到样本特征的诊断输出,应用混合损失函数策略得到对应标签损失;
聚合决策组件将域分类器输出集成并计算加权平均值,得到最终分类结果;
具体如下:
(2.1)将带标签源域样本输入到多源迁移融合收缩模型,随机初始化各网络层权值,将对多源数据进行预处理后生成的批量数据输入到公共特征提取器开始训练;
(2.2)针对公共特征提取器接收到的批量数据,使用深度残差收缩网络结构提取输入样本的高层特征表示,提高多源迁移融合收缩模型的特征提取能力,并将每个域的样本输入到公共特征提取器的下一层和对应的域特征提取器中;
(2.3)域特征提取器对接收到的特征进一步提取,再输出到相对应的域分类器中,公共特征提取器通过自适应层将公共特征空间中各域特征分布对齐,得到所有域的公共特征表示;
(2.4)域分类器接收到域特征提取器输出的特征表示,使用交叉熵函数作为源域训练的损失函数,优化分类器卷积层权值,保证多源迁移融合收缩模型的分类性能,其计算如下:
式中,M是类别数量,是符号函数,如果样本i的真实类别等于c则取1,否则为0,是观测样本i属于类别c的预测概率;
(3)将用于训练的无标签目标域样本输入到多源迁移融合收缩模型,通过混合损失函数策略获取公共特征提取器提取的多源数据的公共特征表示,和域特征提取器提取的各个源域对应目标域的域不变特征表示,精调多源迁移融合收缩模型的特征提取模块和分类模块;
(3.1)无标签的目标域样本输入到公共特征提取器中,特征提取阶段和步骤(2.1)、(2.2)一致,区别是在(2.2)中将公共特征提取器提取的公共特征表示和目标域数据特征输入到所有域特征提取器中;
(3.2)域特征提取器中,添加自适应层对齐目标域数据和源域数据的特征分布,在对齐过程中,使用混合损失函数作为度量,计算出域对齐损失,挑选出未见故障的目标域样本放入未知健康状态中,在多个域分类器中得到不同分类器的预测值;
(3.3)在聚合决策组件中,对不同域分类器预测结果融合诊断,当每个域分类器都认为目标域样本为未知健康状态时,则目标域样本为未知健康状态,若至少一个域分类器认为目标域来自共享的健康状态,则对多个域分类器预测概率进行加权,较大相似性的源域和目标域提供高置信度,较小相似性的源域和目标域提供低置信度,计算加权平均值为最终预测结果;
(4)将无标签目标域待测样本输入到训练好的多源迁移融合收缩模型,对目标域待测样本进行状态诊断,实现不同工况和不同部件之间的高噪声信号跨域高精度故障诊断。
进一步,步骤(2.2)具体为:
在公共特征提取器和各个域特征提取器中都分别设置一个残差块,在每层卷积层添加批归一化处理,协调内部协变偏移,使用ReLU非线性激活函数防止梯度消失,批归一化过程如下:
式中,μb和σb 2是当前批Nbatch个数据的均值和方差,是对每个数据的归一化,最后对归一化数据进行缩放和变换,xn和yn表示小批量中的n个样本的输入和输出特征,γ和β是两个用于缩放和移动分布的可训练参数,∈是一个接近0的常数;
将软阈值化作为非线性变化层分别***公共特征提取器和与特征提取器来有效消除与噪声相关的特征,残差块自适应为每个振动信号确定一组阈值;
软阈值函数计算如下:
式中,x是输入特征,y是输出特征,δ是阈值,软阈值在ReLU激活函数中将接近0的特征设置为0;残差块中,使用全局平均池化层从输入特征中获得缩放参数,在全连接层末端应用sigmoid函数将缩放参数缩放到(0,1)之间,得到阈值的计算如下:
式中,yfc是残差块中全连接层的输出,是相应的缩放参数,avg(·)是平均值函数,xw,h,c是输入特征图,w,h,c是特征图的宽度、高度和通道索引,阈值是缩放参数和输入特征的平均值的乘积。
进一步,步骤(3.2)中的混合损失函数策略具体为:
最大均值差异MMD是衡量两个域数据之间分布差异的方法,具体操作为将源域和目标域数据映射到再生核希尔伯特空间,再计算两类数据均值的距离,计算如下:
式中,Xs表示源域样本空间,Xt表示目标域样本空间,xs∈Xs为源域样本,xt∈Xt为目标域样本,Ps和Pt分别表示源域和目标域的数据分布,Φ(·)表示再生核希尔伯特空间H中的一系列函数,和/>分别表示源域分布和目标域分布的数学期望;
使用多核最大均值差异MK-MMD作为必要的损失函数应用在域特征提取器的自适应层,用多个核加权构造最终的核,计算如下:
式中,Hk表示具有特有核k的再生核希尔伯特空间,βk表示不同核函数的权重;则该部分域适应损失函数计算如下:
式中,a为添加MK-MMD领域适配的网络层数;
考虑到目标域是无标签样本,引入coral损失作为额外损失函数帮助模型在无标签情况下更好地完成对目标域数据的训练分类,计算如下:
式中,Cs和Ct是源域数据和目标域数据的协方差矩阵,d表示输入特征维度;
则模型的总体损失函数可以表示如下:
L=Lclass+λLmk-mmd+ωLcoral
式中,λ和ω分别为对应损失函数的权值。
本发明的有益效果为:本发明提出了不同部件和不同工况之间高噪声信号的多源深度收缩迁移故障诊断方法,在所发明的多源迁移融合收缩模型中,利用公共特征提取器处理所有源域数据,使用收缩结构能够有效降低噪声影响,提取出更具有代表性的高维特征;然后将提取的特征分别输入域特征提取器进行特有于领域的特征提取,再对提取特征进行分类,实现对模型的预训练;在模型中输入目标域用于训练的无标签数据,同样进行特征提取,将提取出的目标域特征输入到所有域特征提取器和域分类器,通过混合损失函数策略进行域对齐,精细的损失函数策略能够有效提高迁移性能,得到对迁移后目标域数据特征的分类结果;之后将所有域分类器的分类结果进行聚合决策,加权计算平均值得到最终分类结果;最后将测试的目标域数据输入到训练好的模型,实现最终的高噪声无标签样本高精度故障诊断。
附图说明
图1是本发明提供的不同部件和不同工况之间高噪声信号的多源深度收缩迁移故障诊断方法实现流程图;
图2是本发明提供的多源迁移融合收缩模型结构图;
图3是本发明提供的多源迁移融合收缩模型预训练阶段示意图;
图4是本发明提供的多源迁移融合收缩模型迁移学习阶段示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
一种基于多源迁移融合收缩框架的旋转机械故障诊断方法,应用于源域标记样本少时,融合多源域高噪声数据信息对无标注的另一个目标域数据进行跨域高精度故障诊断。本发明的流程如图1所示,首先,对来自多个源域收集的高噪声标注数据分别进行预处理;其次,用带标签源域样本训练特征提取模块对高噪声信号的提取能力和模型的分类模块;然后,输入用于训练的无标签目标域样本精调模型的特征提取模块和分类模块,通过混合损失函数策略获取多源数据的公共特征表示和特定于域的特征表示;最后,对目标域待测样本进行状态诊断,实现不同工况和不同部件之间的高噪声信号跨域高精度故障诊断。
具体步骤如下:
(1)对多源数据分别进行预处理;
旋转机械故障数据是一维的振动信号,包括健康工况、内圈故障、外圈故障和滚珠故障四种健康状态,每个源域和目标域各划分200个样本,每种健康状态各50个,各域样本在健康状态之间是平衡的;其中所有带标签源域数据和20%无标签目标域数据用作训练集,其余80%无标签目标域数据用作测试集;
(2)将源域带标签样本输入到多源迁移融合收缩模型,训练特征提取模块对高噪声信号的提取能力,并训练模型的分类模块;
如图2所示,所述的多源迁移融合收缩模型包括四个组件:公共特征提取器,域特征提取器,域分类器和聚合决策组件,前两个是特征提取模块的主要构成组件,后两个是分类模块的关键组件;
公共特征提取器提取将所有域样本映射到公共特征空间并全局对齐,得到公共特征表示;
域特征提取器数量为源域数量,接收公共特征提取器提取的公共特征表示,并分别将每对源域和目标域数据映射到特定的域特征空间,得到域不变特征表示;
域分类器接收到对应源域的域不变特征表示,通过全连接层和激活函数得到样本特征的诊断输出,应用混合损失函数策略得到对应标签损失;
聚合决策组件将域分类器输出集成并计算加权平均值,得到最终分类结果;
训练过程如图3所示,具体如下:
(2.1)将带标签源域样本输入到多源迁移融合收缩模型,随机初始化各网络层权值,将对多源数据进行预处理后生成的批量数据输入到公共特征提取器开始训练;
(2.2)针对公共特征提取器接收到的批量数据,使用深度残差收缩网络结构提取输入样本的高层特征表示,提高多源迁移融合收缩模型的特征提取能力,并将每个域的样本输入到公共特征提取器的下一层和对应的域特征提取器中;
(2.3)域特征提取器对接收到的特征进一步提取,再输出到相对应的域分类器中,公共特征提取器通过自适应层将公共特征空间中各域特征分布对齐,得到所有域的公共特征表示;
(2.4)域分类器接收到域特征提取器输出的特征表示,使用交叉熵函数作为源域训练的损失函数,优化分类器卷积层权值,保证多源迁移融合收缩模型的分类性能,其计算如下:
式中,M是类别数量,是符号函数,如果样本i的真实类别等于c则取1,否则为0,是观测样本i属于类别c的预测概率;
(3)将用于训练的无标签目标域样本输入到多源迁移融合收缩模型,通过混合损失函数策略获取公共特征提取器提取的多源数据的公共特征表示,和域特征提取器提取的各个源域对应目标域的域不变特征表示,精调多源迁移融合收缩模型的特征提取模块和分类模块;
(3.1)无标签的目标域样本输入到公共特征提取器中,特征提取阶段和步骤(2.1)、(2.2)一致,区别是在(2.2)中将公共特征提取器提取的公共特征表示和目标域数据特征输入到所有域特征提取器中;
(3.2)域特征提取器中,添加自适应层对齐目标域数据和源域数据的特征分布,在对齐过程中,使用混合损失函数作为度量,计算出域对齐损失,挑选出未见故障的目标域样本放入未知健康状态中,在多个域分类器中得到不同分类器的预测值;
(3.3)在聚合决策组件中,对不同域分类器预测结果融合诊断,当每个域分类器都认为目标域样本为未知健康状态时,则目标域样本为未知健康状态,若至少一个域分类器认为目标域来自共享的健康状态,则对多个域分类器预测概率进行加权,较大相似性的源域和目标域提供高置信度,较小相似性的源域和目标域提供低置信度,计算加权平均值为最终预测结果;
(4)将无标签目标域待测样本输入到训练好的多源迁移融合收缩模型,对目标域待测样本进行状态诊断,实现不同工况和不同部件之间的高噪声信号跨域高精度故障诊断。
进一步,步骤(2.2)具体为:
在公共特征提取器和各个域特征提取器中都分别设置一个残差块,在每层卷积层添加批归一化处理,协调内部协变偏移,使用ReLU非线性激活函数防止梯度消失,批归一化过程如下:
式中,μb和σb 2是当前批Nbatch个数据的均值和方差,是对每个数据的归一化,最后对归一化数据进行缩放和变换,xn和yn表示小批量中的n个样本的输入和输出特征,γ和β是两个用于缩放和移动分布的可训练参数,∈是一个接近0的常数;
将软阈值化作为非线性变化层分别***公共特征提取器和与特征提取器来有效消除与噪声相关的特征,残差块自适应为每个振动信号确定一组阈值;
软阈值函数计算如下:
式中,x是输入特征,y是输出特征,δ是阈值,软阈值在ReLU激活函数中将接近0的特征设置为0;残差块中,使用全局平均池化层从输入特征中获得缩放参数,在全连接层末端应用sigmoid函数将缩放参数缩放到(0,1)之间,得到阈值的计算如下:
式中,yfc是残差块中全连接层的输出,是相应的缩放参数,avg(·)是平均值函数,xw,h,c是输入特征图,w,h,c是特征图的宽度、高度和通道索引,阈值是缩放参数和输入特征的平均值的乘积。
进一步,如图4所示,步骤(3.2)中的混合损失函数策略具体为:
最大均值差异MMD是衡量两个域数据之间分布差异的方法,具体操作为将源域和目标域数据映射到再生核希尔伯特空间,再计算两类数据均值的距离,计算如下:
式中,Xs表示源域样本空间,Xt表示目标域样本空间,xs∈Xs为源域样本,xt∈Xt为目标域样本,Ps和Pt分别表示源域和目标域的数据分布,Φ(·)表示再生核希尔伯特空间H中的一系列函数,和/>分别表示源域分布和目标域分布的数学期望;
使用多核最大均值差异MK-MMD作为必要的损失函数应用在域特征提取器的自适应层,用多个核加权构造最终的核,计算如下:
式中,Hk表示具有特有核k的再生核希尔伯特空间,βk表示不同核函数的权重;则该部分域适应损失函数计算如下:
式中,a为添加MK-MMD领域适配的网络层数;
考虑到目标域是无标签样本,引入coral损失作为额外损失函数帮助模型在无标签情况下更好地完成对目标域数据的训练分类,计算如下:
式中,Cs和Ct是源域数据和目标域数据的协方差矩阵,d表示输入特征维度;
则模型的总体损失函数可以表示如下:
L=Lclass+λLmk-mmd+ωLcoral
式中,λ和ω分别为对应损失函数的权值。
综上所述:
本发明提出一种基于多源迁移融合收缩框架的旋转机械故障诊断方法,通过深度残差收缩网络结构处理高噪声数据,并使用多源迁移框架将多源域数据诊断结果融合决策,使得该模型能够将从多个源域获得的决策信息用于无标注的目标域数据实现跨域故障诊断,并能够识别目标域中的未知状态。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (2)
1.一种基于多源迁移融合收缩框架的旋转机械故障诊断方法,其特征在于,包括以下步骤:
(1)对多源数据分别进行预处理;
旋转机械故障数据是一维的振动信号,包括健康工况、内圈故障、外圈故障和滚珠故障四种健康状态,每个源域和目标域各划分200个样本,每种健康状态各50个,各域样本在健康状态之间是平衡的;其中所有带标签源域数据和20%无标签目标域数据用作训练集,其余80%无标签目标域数据用作测试集;
(2)将带标签源域样本输入到多源迁移融合收缩模型,训练特征提取模块对高噪声信号的提取能力,并训练多源迁移融合收缩模型的分类模块;
所述的多源迁移融合收缩模型包括四个组件:公共特征提取器、域特征提取器、域分类器和聚合决策组件;公共特征提取器和域特征提取器是特征提取模块的主要构成组件,域分类器和聚合决策组件是分类模块的关键组件;
公共特征提取器将所有域样本映射到公共特征空间并全局对齐,得到公共特征表示;
域特征提取器数量为源域数量,接受公共特征提取器提取的公共特征表示,并分别将每对源域和目标域数据映射到特定的域特征空间,得到域不变特征表示;
域分类器接收到对应源域的域不变特征表示,通过全连接层和激活函数得到样本特征的诊断输出,应用混合损失函数策略得到对应标签损失;
聚合决策组件将域分类器输出集成并计算加权平均值,得到最终分类结果;
具体如下:
(2.1)将带标签源域样本输入到多源迁移融合收缩模型,随机初始化各网络层权值,将对多源数据进行预处理后生成的批量数据输入到公共特征提取器开始训练;
(2.2)针对公共特征提取器接收到的批量数据,使用深度残差收缩网络结构提取输入样本的高层特征表示,提高多源迁移融合收缩模型的特征提取能力,并将每个域的样本分别输入到公共特征提取器的下一层和对应的域特征提取器中;
(2.3)域特征提取器对接收到的特征进一步提取,再输出到相对应的域分类器中,公共特征提取器通过自适应层将公共特征空间中各域特征分布对齐,得到所有域的公共特征表示;
(2.4)域分类器接收到域特征提取器输出的特征表示,使用交叉熵函数作为源域训练的损失函数,优化分类器卷积层权值,保证多源迁移融合收缩模型的分类性能,其计算如下:
式中,M是类别数量,是符号函数,如果样本i的真实类别等于c则取1,否则为0,/>是观测样本i属于类别c的预测概率;
(3)将用于训练的无标签目标域样本输入到多源迁移融合收缩模型,通过混合损失函数策略获取公共特征提取器提取的多源数据的公共特征表示,和域特征提取器提取的各个源域对应目标域的域不变特征表示,精调多源迁移融合收缩模型的特征提取模块和分类模块;
(3.1)无标签目标域样本输入到公共特征提取器中,特征提取阶段和步骤(2.1)、(2.2)一致,区别是在(2.2)中将公共特征提取器提取的公共特征表示和目标域数据特征输入到所有域特征提取器中;
(3.2)域特征提取器中,添加自适应层对齐目标域数据和源域数据的特征分布,在对齐过程中,使用混合损失函数作为度量,计算出域对齐损失,挑选出未见故障的目标域样本放入未知健康状态中,在多个域分类器中得到不同分类器的预测值;
(3.3)在聚合决策组件中,对不同域分类器预测结果融合诊断,若每个域分类器都认为目标域样本为未知健康状态时,则目标域样本为未知健康状态;若至少一个域分类器认为目标域来自共享的健康状态,则对多个域分类器预测概率进行加权,较大相似性的源域和目标域提供高置信度,较小相似性的源域和目标域提供低置信度,计算加权平均值为最终预测结果;
(4)将无标签目标域待测样本输入到训练好的多源迁移融合收缩模型,对目标域待测样本进行状态诊断,实现不同工况和不同部件之间的高噪声信号跨域高精度故障诊断;
步骤(3.2)中的混合损失函数策略具体为:
最大均值差异MMD是衡量两个域数据之间分布差异的方法,具体操作为将源域和目标域数据映射到再生核希尔伯特空间RKHS,再计算两类数据均值的距离,计算如下:
式中,Xs表示源域样本空间,Xt表示目标域样本空间,xs∈Xs为源域样本,xt∈Xt为目标域样本,Ps和Pt分别表示源域和目标域的数据分布,φ(·)表示再生核希尔伯特空间H中的一系列函数,和/>分别表示源域分布和目标域分布的数学期望;
使用多核最大均值差异MK-MMD作为必要的损失函数应用在域特征提取器的自适应层,用多个核加权构造最终的核,计算如下:
式中,Hk表示具有特有核k的再生核希尔伯特空间,βk表示不同核函数的权重;则该部分域适应损失函数计算如下:
式中,a为添加MK-MMD领域适配的网络层数;
考虑到目标域时无标签样本,引入coral损失作为额外损失函数帮助模型在无标签情况下完成对目标域数据的训练分类,计算如下:
式中,Cs和Ct是源域数据和目标域数据的协方差矩阵,d表示输入特征维度;
则模型的总体损失函数表示如下:
L=Lclass+λLmk-mmd+ωLcoral
式中,λ和ω分别为对应损失函数的权值。
2.根据权利要求1所述的基于多源迁移融合收缩框架的旋转机械故障诊断方法,其特征在于,步骤(2.2)具体为:
在公共特征提取器和各个域特征提取器中都分别设置一个残差块,在每层卷积层添加批归一化处理,协调内部协变偏移,使用ReLU非线性激活函数防止梯度消失,批归一化过程如下:
式中,μb和σb 2是当前批Nbatch个数据的均值和方差,是对每个数据的归一化,最后对归一化数据进行缩放和变换,xn和yn表示小批量中的n个样本的输入和输出特征,γ和β是两个用于缩放和移动分布的可训练参数,∈是一个接近0的常数;
将软阈值化作为非线性变化层分别***公共特征提取器和域特征提取器来有效消除与噪声相关的特征,残差块自适应为每个振动信号确定一组阈值;
软阈值函数计算如下:
式中,x是输入特征,y是输出特征,δ是阈值,软阈值在ReLU激活函数中将接近0的特征设置为0;残差块中,使用全局平均池化层从输入特征中获得缩放参数,在全连接层末端应用sigmoid函数将缩放参数缩放到(0,1)之间,得到阈值的计算如下:
式中,yfc是残差块中全连接层的输出,是相应的缩放参数,avg(·)是平均值函数,xw,h,c是输入特征图,w,h,c是特征图的宽度、高度和通道索引,阈值是缩放参数和输入特征的平均值的乘积。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111363881.XA CN114048568B (zh) | 2021-11-17 | 2021-11-17 | 一种基于多源迁移融合收缩框架的旋转机械故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111363881.XA CN114048568B (zh) | 2021-11-17 | 2021-11-17 | 一种基于多源迁移融合收缩框架的旋转机械故障诊断方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114048568A CN114048568A (zh) | 2022-02-15 |
CN114048568B true CN114048568B (zh) | 2024-04-09 |
Family
ID=80209960
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111363881.XA Active CN114048568B (zh) | 2021-11-17 | 2021-11-17 | 一种基于多源迁移融合收缩框架的旋转机械故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114048568B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115146675B (zh) * | 2022-06-28 | 2023-09-26 | 江苏大学 | 一种深度多特征动态对抗的变工况下旋转机械迁移诊断方法 |
CN115329853B (zh) * | 2022-08-04 | 2023-04-21 | 西南交通大学 | 一种基于多源域迁移的装备参数预测与知识转移方法 |
CN115482927B (zh) * | 2022-09-21 | 2023-05-23 | 浙江大学 | 一种基于小样本的儿童肺炎诊断*** |
CN115952408A (zh) * | 2023-01-05 | 2023-04-11 | 东北大学 | 多通道跨域少样本的冲压生产线轴承故障诊断方法 |
CN115795313A (zh) * | 2023-01-16 | 2023-03-14 | 中国科学院合肥物质科学研究院 | 核主泵故障诊断模型的训练方法、故障诊断方法和*** |
CN116383739B (zh) * | 2023-03-30 | 2024-01-30 | 东北林业大学 | 基于域自适应的多模态数据融合的智能故障诊断方法 |
CN116934304B (zh) * | 2023-08-03 | 2024-06-07 | 广东省俊耀控股有限公司 | 智能配电房设备运行维护管理***及其方法 |
CN116992954A (zh) * | 2023-09-26 | 2023-11-03 | 南京航空航天大学 | 一种基于umap数据降维的相似度度量迁移学习方法 |
CN117349749B (zh) * | 2023-10-09 | 2024-03-15 | 石家庄铁道大学 | 基于混合卷积的多源域轴承故障诊断方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104166787A (zh) * | 2014-07-17 | 2014-11-26 | 南京航空航天大学 | 一种基于多阶段信息融合的航空发动机剩余寿命预测方法 |
CN105971901A (zh) * | 2016-05-03 | 2016-09-28 | 北京航空航天大学 | 一种基于完备总体经验模态分解与随机森林的离心泵故障诊断方法 |
CN110186680A (zh) * | 2019-05-30 | 2019-08-30 | 盐城工学院 | 一种对抗判别域适应一维卷积神经网络智能故障诊断方法 |
CN111310786A (zh) * | 2020-01-15 | 2020-06-19 | 青岛海信网络科技股份有限公司 | 基于随机森林分类器的交通检测器异常诊断方法及装置 |
CN111709448A (zh) * | 2020-05-20 | 2020-09-25 | 西安交通大学 | 一种基于迁移关系网络的机械故障诊断方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109902798A (zh) * | 2018-05-31 | 2019-06-18 | 华为技术有限公司 | 深度神经网络的训练方法和装置 |
-
2021
- 2021-11-17 CN CN202111363881.XA patent/CN114048568B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104166787A (zh) * | 2014-07-17 | 2014-11-26 | 南京航空航天大学 | 一种基于多阶段信息融合的航空发动机剩余寿命预测方法 |
CN105971901A (zh) * | 2016-05-03 | 2016-09-28 | 北京航空航天大学 | 一种基于完备总体经验模态分解与随机森林的离心泵故障诊断方法 |
CN110186680A (zh) * | 2019-05-30 | 2019-08-30 | 盐城工学院 | 一种对抗判别域适应一维卷积神经网络智能故障诊断方法 |
CN111310786A (zh) * | 2020-01-15 | 2020-06-19 | 青岛海信网络科技股份有限公司 | 基于随机森林分类器的交通检测器异常诊断方法及装置 |
CN111709448A (zh) * | 2020-05-20 | 2020-09-25 | 西安交通大学 | 一种基于迁移关系网络的机械故障诊断方法 |
Non-Patent Citations (3)
Title |
---|
基于ResNet和领域自适应的轴承故障诊断研究;杨冰如;李奇;陈良;沈长青;朱忠奎;测控技术;20210407;第40卷(第012期);全文 * |
基于增强迁移卷积神经网络的机械智能故障诊断;陈祝云;钟琪;黄如意;廖奕校;李霁蒲;李巍华;机械工程学报;20210609(第021期);全文 * |
流形模糊C均值方法及其在滚动轴承性能退化评估中的应用;王奉涛;陈旭涛;闫达文;李宏坤;王雷;朱泓;;机械工程学报;20151228(第15期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114048568A (zh) | 2022-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114048568B (zh) | 一种基于多源迁移融合收缩框架的旋转机械故障诊断方法 | |
CN113792758B (zh) | 一种基于自监督学习和聚类的滚动轴承故障诊断方法 | |
CN116894187A (zh) | 一种基于深度迁移学习的齿轮箱故障诊断方法 | |
CN112883994A (zh) | 一种均衡分布适配的旋转机械变工况故障诊断方法 | |
CN114358124B (zh) | 基于深度对抗卷积神经网络的旋转机械新故障诊断方法 | |
CN107220663B (zh) | 一种基于语义场景分类的图像自动标注方法 | |
CN114417913B (zh) | 基于pc-tcn和迁移学习的轴承寿命预测方法 | |
CN115791174B (zh) | 一种滚动轴承异常诊断方法、***、电子设备及存储介质 | |
CN114118138A (zh) | 一种基于多标签领域自适应模型的轴承复合故障诊断方法 | |
CN111504680B (zh) | 一种基于wsvm和dcae的涤纶长丝生产的故障诊断方法和*** | |
CN116051479A (zh) | 融合跨域迁移和异常检测的纺织品缺陷识别方法 | |
CN114564987A (zh) | 一种基于图数据的旋转机械故障诊断方法及*** | |
CN116805051A (zh) | 基于注意力机制的双卷积动态域适应设备故障诊断方法 | |
CN117516937A (zh) | 基于多模态特征融合增强的滚动轴承未知故障检测方法 | |
CN115165366A (zh) | 一种旋转机械变工况故障诊断方法及*** | |
CN115358337A (zh) | 一种小样本故障诊断方法、装置及存储介质 | |
CN117113078A (zh) | 基于多源数据集成的小样本轴承故障模式识别方法和*** | |
CN113158878B (zh) | 一种基于子空间的异构迁移故障诊断方法、***和模型 | |
CN108898157B (zh) | 基于卷积神经网络的数值型数据的雷达图表示的分类方法 | |
CN116304941A (zh) | 一种基于多模型组合的海洋数据质量控制方法及装置 | |
CN116150635A (zh) | 基于跨域关联性表示的滚动轴承未知故障检测方法 | |
Duan | Automatic identification of conodont species using fine-grained convolutional neural networks | |
CN116089812A (zh) | 基于半监督对抗域泛化智能模型的故障诊断方法 | |
CN113310689B (zh) | 基于域自适应图卷积网络的航发传动***故障诊断方法 | |
CN114626406A (zh) | 基于类边界特征检测的轴承故障诊断方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |