CN114048568B

CN114048568B - 一种基于多源迁移融合收缩框架的旋转机械故障诊断方法

Info

Publication number: CN114048568B
Application number: CN202111363881.XA
Authority: CN
Inventors: 覃振权; 张璇; 卢炳先; 王雷; 朱明�; 孙伟峰
Original assignee: Dalian University of Technology
Current assignee: Dalian University of Technology
Priority date: 2021-11-17
Filing date: 2021-11-17
Publication date: 2024-04-09
Anticipated expiration: 2041-11-17
Also published as: CN114048568A

Abstract

一种基于多源迁移融合收缩框架的旋转机械故障诊断方法。对高噪声标注数据进行预处理；用源域带标签样本对模型进行预训练，通过深度残差收缩网络结构处理高噪声数据，提取出高维特征并训练好模型的分类模块；输入用于训练的目标域无标签样本，通过混合损失函数策略进行域对齐，得到对迁移后目标域数据特征的分类结果，再将所有域分类器的分类结果进行聚合决策，对未知状态新增类别标签，加权计算平均值得到最终分类结果；对目标域待测样本进行状态诊断。该模型能有效降低公共特征易受到与底层公共分布相关的噪声污染对诊断性能的影响，能将从多个源域获得的决策信息用于无标注的目标域数据实现高精度跨域故障诊断，并能够识别目标域中的未知状态。

Description

一种基于多源迁移融合收缩框架的旋转机械故障诊断方法

技术领域

本发明属于旋转机械智能故障诊断领域，特别涉及一种基于多源迁移融合收缩框架的旋转机械故障诊断方法。

背景技术

智能故障诊断领域中，从大型旋转机器收集的振动信号，往往会包含大量噪声，基于深度学习的方法在局部特征提取的时候容易受到噪声干扰无法监测到与故障相关的特征，从而降低诊断准确率。另一个关键问题是在实际应用中，训练和测试数据存在一定程度分布差异会降低分类模型的泛化性和准确率，考虑到故障样本数量不足且实际监测数据缺乏标签信息，近年来的广泛研究是引入深度迁移学习来解决标签缺失和样本不足问题，在不需要重新训练模型的基础上提高模型的泛化性。在滚动轴承实际工作中,常伴随着不同噪声干扰、不同工作负荷的情况，过强的噪声和有限的标签样本会使故障诊断及其困难，本发明主要针对这种复杂易变工作状况下旋转机械故障诊断问题，同时考虑到对不完备运行状态和处于工况变化的未知工况下的健康状态以及目标机器中的未知故障进行正确分类。

2019年，Liang Guo等人在论文《Deep Convolutional Transfer LearningNetwork:A New Method for Intelligent Fault Diagnosis of Machines WithUnlabeled Data》中提出一种使用深度卷积迁移网络对具有未标记数据的机器进行智能故障诊断的新方法，使用双模块结构分别进行状态识别和域适应。该方案使用一维深卷积网络来学***衡训练进度但并不一定完全适用于不平衡数据，不过对于数据样本及其有限的情况能显著提高诊断性能。此外，该方法对诊断过程中出现的未知状态缺少敏感性，容易导致边缘样本和未知状态错误分类。

综上所述，基于深度神经网络的单源迁移故障诊断技术主要有如下缺陷：(1)来自单个源机器的诊断知识不足以识别从所有健康状态中提取的目标机器样本，且模型对未知健康状态分类易出错。(2)公共特征表示容易受到与底层公共分布相关的噪声的污染，从而削弱诊断性能。不同旋转部件之间的噪声差异更大，这种情况在跨部件诊断任务中可能更为严重。(3)用于智能故障诊断的域适应方法大多考虑优化和使用更好的损失函数来减少域差异，但选取的损失函数往往不能适应会出现的所有迁移场景。针对这些缺陷，本发明提出一种多源迁移融合收缩框架来实现不同工况和不同部件之间的跨域故障诊断。

发明内容

本发明的目的是提出一种基于多源迁移融合收缩框架的旋转机械故障诊断方法，以解决单源域诊断知识不足，跨域噪声差异问题和未知状态分类问题。

为实现上述目的，本发明提供了如下方案：

基于多源迁移融合收缩框架的旋转机械故障诊断方法，其特征在于，包括以下步骤：

(1)对多源数据分别进行预处理；

旋转机械故障数据是一维的振动信号，包括健康工况、内圈故障、外圈故障和滚珠故障四种健康状态，每个源域和目标域各划分200个样本，每种健康状态各50个，各域样本在健康状态之间是平衡的；其中所有带标签源域数据和20％无标签目标域数据用作训练集，其余80％无标签目标域数据用作测试集；

(2)将源域带标签样本输入到多源迁移融合收缩模型，训练特征提取模块对高噪声信号的提取能力，并训练模型的分类模块；

所述的多源迁移融合收缩模型包括四个组件：公共特征提取器，域特征提取器，域分类器和聚合决策组件，前两个是特征提取模块的主要构成组件，后两个是分类模块的关键组件；

公共特征提取器提取将所有域样本映射到公共特征空间并全局对齐，得到公共特征表示；

域特征提取器数量为源域数量，接收公共特征提取器提取的公共特征表示，并分别将每对源域和目标域数据映射到特定的域特征空间，得到域不变特征表示；

域分类器接收到对应源域的域不变特征表示，通过全连接层和激活函数得到样本特征的诊断输出，应用混合损失函数策略得到对应标签损失；

聚合决策组件将域分类器输出集成并计算加权平均值，得到最终分类结果；

具体如下：

(2.1)将带标签源域样本输入到多源迁移融合收缩模型，随机初始化各网络层权值，将对多源数据进行预处理后生成的批量数据输入到公共特征提取器开始训练；

(2.2)针对公共特征提取器接收到的批量数据，使用深度残差收缩网络结构提取输入样本的高层特征表示，提高多源迁移融合收缩模型的特征提取能力，并将每个域的样本输入到公共特征提取器的下一层和对应的域特征提取器中；

(2.3)域特征提取器对接收到的特征进一步提取，再输出到相对应的域分类器中，公共特征提取器通过自适应层将公共特征空间中各域特征分布对齐，得到所有域的公共特征表示；

(2.4)域分类器接收到域特征提取器输出的特征表示，使用交叉熵函数作为源域训练的损失函数，优化分类器卷积层权值，保证多源迁移融合收缩模型的分类性能，其计算如下：

式中，M是类别数量，是符号函数，如果样本i的真实类别等于c则取1，否则为0，是观测样本i属于类别c的预测概率；

(3)将用于训练的无标签目标域样本输入到多源迁移融合收缩模型，通过混合损失函数策略获取公共特征提取器提取的多源数据的公共特征表示，和域特征提取器提取的各个源域对应目标域的域不变特征表示，精调多源迁移融合收缩模型的特征提取模块和分类模块；

(3.1)无标签的目标域样本输入到公共特征提取器中，特征提取阶段和步骤(2.1)、(2.2)一致，区别是在(2.2)中将公共特征提取器提取的公共特征表示和目标域数据特征输入到所有域特征提取器中；

(3.2)域特征提取器中，添加自适应层对齐目标域数据和源域数据的特征分布，在对齐过程中，使用混合损失函数作为度量，计算出域对齐损失，挑选出未见故障的目标域样本放入未知健康状态中，在多个域分类器中得到不同分类器的预测值；

(3.3)在聚合决策组件中，对不同域分类器预测结果融合诊断，当每个域分类器都认为目标域样本为未知健康状态时，则目标域样本为未知健康状态，若至少一个域分类器认为目标域来自共享的健康状态，则对多个域分类器预测概率进行加权，较大相似性的源域和目标域提供高置信度，较小相似性的源域和目标域提供低置信度，计算加权平均值为最终预测结果；

(4)将无标签目标域待测样本输入到训练好的多源迁移融合收缩模型，对目标域待测样本进行状态诊断，实现不同工况和不同部件之间的高噪声信号跨域高精度故障诊断。

进一步，步骤(2.2)具体为：

在公共特征提取器和各个域特征提取器中都分别设置一个残差块，在每层卷积层添加批归一化处理，协调内部协变偏移，使用ReLU非线性激活函数防止梯度消失，批归一化过程如下：

式中，μ_b和σ_b ²是当前批N_batch个数据的均值和方差，是对每个数据的归一化，最后对归一化数据进行缩放和变换，x_n和y_n表示小批量中的n个样本的输入和输出特征，γ和β是两个用于缩放和移动分布的可训练参数，∈是一个接近0的常数；

将软阈值化作为非线性变化层分别***公共特征提取器和与特征提取器来有效消除与噪声相关的特征，残差块自适应为每个振动信号确定一组阈值；

软阈值函数计算如下：

式中，x是输入特征，y是输出特征，δ是阈值，软阈值在ReLU激活函数中将接近0的特征设置为0；残差块中，使用全局平均池化层从输入特征中获得缩放参数，在全连接层末端应用sigmoid函数将缩放参数缩放到(0,1)之间，得到阈值的计算如下：

式中，y_fc是残差块中全连接层的输出，是相应的缩放参数，avg(·)是平均值函数，x_w,h,c是输入特征图，w,h,c是特征图的宽度、高度和通道索引，阈值是缩放参数和输入特征的平均值的乘积。

进一步，步骤(3.2)中的混合损失函数策略具体为：

最大均值差异MMD是衡量两个域数据之间分布差异的方法，具体操作为将源域和目标域数据映射到再生核希尔伯特空间，再计算两类数据均值的距离，计算如下：

式中，X^s表示源域样本空间，X^t表示目标域样本空间，x^s∈X^s为源域样本，x^t∈X^t为目标域样本，P_s和P_t分别表示源域和目标域的数据分布，Φ(·)表示再生核希尔伯特空间H中的一系列函数，和/>分别表示源域分布和目标域分布的数学期望；

使用多核最大均值差异MK-MMD作为必要的损失函数应用在域特征提取器的自适应层，用多个核加权构造最终的核，计算如下：

式中，H_k表示具有特有核k的再生核希尔伯特空间，β_k表示不同核函数的权重；则该部分域适应损失函数计算如下：

式中，a为添加MK-MMD领域适配的网络层数；

考虑到目标域是无标签样本，引入coral损失作为额外损失函数帮助模型在无标签情况下更好地完成对目标域数据的训练分类，计算如下：

式中，C_s和C_t是源域数据和目标域数据的协方差矩阵，d表示输入特征维度；

则模型的总体损失函数可以表示如下：

L＝L_class+λL_mk-mmd+ωL_coral

式中，λ和ω分别为对应损失函数的权值。

本发明的有益效果为：本发明提出了不同部件和不同工况之间高噪声信号的多源深度收缩迁移故障诊断方法，在所发明的多源迁移融合收缩模型中，利用公共特征提取器处理所有源域数据，使用收缩结构能够有效降低噪声影响，提取出更具有代表性的高维特征；然后将提取的特征分别输入域特征提取器进行特有于领域的特征提取，再对提取特征进行分类，实现对模型的预训练；在模型中输入目标域用于训练的无标签数据，同样进行特征提取，将提取出的目标域特征输入到所有域特征提取器和域分类器，通过混合损失函数策略进行域对齐，精细的损失函数策略能够有效提高迁移性能，得到对迁移后目标域数据特征的分类结果；之后将所有域分类器的分类结果进行聚合决策，加权计算平均值得到最终分类结果；最后将测试的目标域数据输入到训练好的模型，实现最终的高噪声无标签样本高精度故障诊断。

附图说明

图1是本发明提供的不同部件和不同工况之间高噪声信号的多源深度收缩迁移故障诊断方法实现流程图；

图2是本发明提供的多源迁移融合收缩模型结构图；

图3是本发明提供的多源迁移融合收缩模型预训练阶段示意图；

图4是本发明提供的多源迁移融合收缩模型迁移学习阶段示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

一种基于多源迁移融合收缩框架的旋转机械故障诊断方法，应用于源域标记样本少时，融合多源域高噪声数据信息对无标注的另一个目标域数据进行跨域高精度故障诊断。本发明的流程如图1所示，首先，对来自多个源域收集的高噪声标注数据分别进行预处理；其次，用带标签源域样本训练特征提取模块对高噪声信号的提取能力和模型的分类模块；然后，输入用于训练的无标签目标域样本精调模型的特征提取模块和分类模块，通过混合损失函数策略获取多源数据的公共特征表示和特定于域的特征表示；最后，对目标域待测样本进行状态诊断，实现不同工况和不同部件之间的高噪声信号跨域高精度故障诊断。

具体步骤如下：

(1)对多源数据分别进行预处理；

如图2所示，所述的多源迁移融合收缩模型包括四个组件：公共特征提取器，域特征提取器，域分类器和聚合决策组件，前两个是特征提取模块的主要构成组件，后两个是分类模块的关键组件；

训练过程如图3所示，具体如下：

进一步，步骤(2.2)具体为：

软阈值函数计算如下：

进一步，如图4所示，步骤(3.2)中的混合损失函数策略具体为：

式中，a为添加MK-MMD领域适配的网络层数；

则模型的总体损失函数可以表示如下：

L＝L_class+λL_mk-mmd+ωL_coral

式中，λ和ω分别为对应损失函数的权值。

综上所述：

本发明提出一种基于多源迁移融合收缩框架的旋转机械故障诊断方法，通过深度残差收缩网络结构处理高噪声数据，并使用多源迁移框架将多源域数据诊断结果融合决策，使得该模型能够将从多个源域获得的决策信息用于无标注的目标域数据实现跨域故障诊断，并能够识别目标域中的未知状态。

以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是说明本发明的原理，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims

1.一种基于多源迁移融合收缩框架的旋转机械故障诊断方法，其特征在于，包括以下步骤：

(1)对多源数据分别进行预处理；

(2)将带标签源域样本输入到多源迁移融合收缩模型，训练特征提取模块对高噪声信号的提取能力，并训练多源迁移融合收缩模型的分类模块；

所述的多源迁移融合收缩模型包括四个组件：公共特征提取器、域特征提取器、域分类器和聚合决策组件；公共特征提取器和域特征提取器是特征提取模块的主要构成组件，域分类器和聚合决策组件是分类模块的关键组件；

公共特征提取器将所有域样本映射到公共特征空间并全局对齐，得到公共特征表示；

域特征提取器数量为源域数量，接受公共特征提取器提取的公共特征表示，并分别将每对源域和目标域数据映射到特定的域特征空间，得到域不变特征表示；

具体如下：

(2.2)针对公共特征提取器接收到的批量数据，使用深度残差收缩网络结构提取输入样本的高层特征表示，提高多源迁移融合收缩模型的特征提取能力，并将每个域的样本分别输入到公共特征提取器的下一层和对应的域特征提取器中；

式中，M是类别数量，是符号函数，如果样本i的真实类别等于c则取1，否则为0，/>是观测样本i属于类别c的预测概率；

(3.1)无标签目标域样本输入到公共特征提取器中，特征提取阶段和步骤(2.1)、(2.2)一致，区别是在(2.2)中将公共特征提取器提取的公共特征表示和目标域数据特征输入到所有域特征提取器中；

(3.3)在聚合决策组件中，对不同域分类器预测结果融合诊断，若每个域分类器都认为目标域样本为未知健康状态时，则目标域样本为未知健康状态；若至少一个域分类器认为目标域来自共享的健康状态，则对多个域分类器预测概率进行加权，较大相似性的源域和目标域提供高置信度，较小相似性的源域和目标域提供低置信度，计算加权平均值为最终预测结果；

(4)将无标签目标域待测样本输入到训练好的多源迁移融合收缩模型，对目标域待测样本进行状态诊断，实现不同工况和不同部件之间的高噪声信号跨域高精度故障诊断；

步骤(3.2)中的混合损失函数策略具体为：

最大均值差异MMD是衡量两个域数据之间分布差异的方法，具体操作为将源域和目标域数据映射到再生核希尔伯特空间RKHS，再计算两类数据均值的距离，计算如下：

式中，a为添加MK-MMD领域适配的网络层数；

考虑到目标域时无标签样本，引入coral损失作为额外损失函数帮助模型在无标签情况下完成对目标域数据的训练分类，计算如下：

则模型的总体损失函数表示如下：

L＝L_class+λL_mk-mmd+ωL_coral

式中，λ和ω分别为对应损失函数的权值。

2.根据权利要求1所述的基于多源迁移融合收缩框架的旋转机械故障诊断方法，其特征在于，步骤(2.2)具体为：

将软阈值化作为非线性变化层分别***公共特征提取器和域特征提取器来有效消除与噪声相关的特征，残差块自适应为每个振动信号确定一组阈值；

软阈值函数计算如下：