CN113095179A

CN113095179A - 元度量学习驱动的直升机行星齿轮箱故障诊断方法

Info

Publication number: CN113095179A
Application number: CN202110344018.3A
Authority: CN
Inventors: 孙闯; 武靖耀; 赵志斌; 王诗彬; 同超玮; 李明; 严如强; 陈雪峰
Original assignee: Xian Jiaotong University
Current assignee: Xian Jiaotong University
Priority date: 2021-03-30
Filing date: 2021-03-30
Publication date: 2021-07-09

Abstract

本发明公开了一种元度量学习驱动的直升机行星齿轮箱故障诊断方法，方法中，元度量深度神经网络为核心，由特征编码网络和特征匹配网络两个子网络组成；通过在相关的源域中建立多个子任务来迭代训练网络参数，并使用神经网络来抽象化取代可优化更新的特征距离匹配函数，最终在目标任务域实现利用少量标签样本来进行高精度的直升机行星齿轮箱故障诊断。诊断方法包括准备阶段、元学习阶段以及迁移阶段共三个流程。在准备阶段，完成网络超参数设置以及数据集的分割。在元学习阶段，利用源域数据来训练模型学习最优的特征提取以及距离度量的网络参数。最终，在迁移阶段对检测样本与目标域多类故障样本进行特征提取与特征匹配，得到故障模式判定决策。

Description

元度量学习驱动的直升机行星齿轮箱故障诊断方法

技术领域

本发明属于直升机行星齿轮箱故障诊断技术领域，特别是一种元度量学习驱动的直升机行星齿轮箱故障诊断方法。

背景技术

与固定翼飞机相比，直升机事故高发，且严重事故比例大，这对直升机安全性和可靠性提出了很高的要求。因此开展直升机健康管理与故障诊断研究是保证直升机运行安全性与运维经济性的重要基础，长期以来备受关注。而其传动***行星齿轮箱则因其工作环境恶劣、载荷变化大等，成为故障易发的薄弱环节。针对其开展的故障诊断研究一直是直升机健康与使用监控***(HUMS)的核心任务之一。

直升机传动***故障诊断的任务是通过对某个部件进行智能诊断，给出可能的故障的类型和程度，为后续维护和健康管理提供依据。从信号处理角度出发以及从智能诊断角度出发的相关诊断方法都已经被广泛的应用。信号处理方面，包括使用振动信号的低阶条件谱矩，实现齿轮箱故障类型的实时诊断；通过小波分解和功率谱提取特征，作为后续智能诊断方法的特征输入。智能诊断方面，则包括采用人工神经网络对直升机传动***故障进行分类；基于人工神经网络的主减速器行星齿轮故障程度辨识方法；基于稀疏贝叶斯极限学习机的行星齿轮箱故障类型识别以及行星轮裂纹程度辨识；基于隐马尔可夫模型和递归神经网络(RNN)的齿轮健康监测框架等。

虽然基于传统信号处理以及以深度神经网络为代表的智能诊断方法可以在诊断分类精度上取得一定的提升，但在有限的训练样本甚至极少的训练样本下保持高诊断精度的难题依然有待解决。依然存在着在1)复杂工况任务中精度不高、鲁棒性不强，难以适应复杂多变的工况；2)对训练数据量的过度依赖，当样本数量过少时，诊断精度显著下降；3)频繁复杂的变工况运行状态所引起的故障样本稀缺等问题。

在背景技术部分中公开的上述信息仅仅用于增强对本发明背景的理解，因此可能包含不构成在本国中本领域普通技术人员公知的现有技术的信息。

发明内容

针对现有技术中的问题，本发明提出一种元度量学习驱动的直升机行星齿轮箱故障诊断方法，能够在目标域仅有少量有效故障样本的情况下实现故障形式的精准诊断。

本发明的目的是通过以下技术方案予以实现，一种元度量学习驱动的直升机行星齿轮箱故障诊断方法包括以下步骤：

基于一维卷积模块搭建元度量网络，其中，元度量网络包括对原始输入信号特征提取的特征编码网络f_θ和特征匹配网络

所述特征编码网络f_θ包括多个一维卷积模块、一维自适应池化层以及全连接层，其中

分别代表两个网络的可学习参数。

采集直升机传动***行星齿轮箱振动信号，将所述振动信号分隔成数据点长度相同的样本集，快速傅里叶变换预处理所述样本集中所有的样本以获得频谱信号，分组所述频谱信号为包含训练样本的训练类别

和包含测试样本的测试类别

测试样本少于所述训练样本，其中，训练样本包括第一支撑样本

与第一查询样本

测试样本包括第二支撑样本

和第二查询样本

确定单次训练的样本类别K，第一支撑样本数量N，第一查询样本数量M。

元度量网络在多次元学习训练循环周期中迭代更新，在每一个训练循环中，从训练集类别中随机采样K类，每一类随机采样N个第一支撑样本{x^s}，M个第一查询样本{x^q}，同时将第一支撑样本与第一查询样本输入特征编码网络中进行前向传播，使它们投影到统一的特征空间得到两组特征{z^s}，{z^q}，然后将两组特征{z^s}，{z^q}进行拼接得到组合特征{z}并输入特征匹配网络，得到两个特征的匹配度分值{g}＝[g₁，g₂，…，g_K]，分值包含K个子元素。将不同第一支撑样本与第一查询样本的匹配度分值输入到柔性最大值激活函数softmax，得到归一化后的分类概率{c}＝[c₁，c₂，…，c_K]，其中每一个子元素输出值分别为

代表该样本属于本类别的概率。

然后计算预测结果{c}与实际标签y＝[y₁，y₂，…，y_K]之间的均方误差分类损失函数

通过误差反向传播对元度量网络进行迭代更新，网络在参数更新过程中期望实现的优化目标定义如下：

其中

元度量网络在多次迁移循环周期中进行迁移测试，在每一个迁移循环中，从测试集的K种类别中进行采样，每一类随机采样N个第二支撑样本

M个第二查询样本

同时将第二支撑样本与第二查询样本输入特征编码网络中进行前向传播，使它们投影到统一的特征空间得到两组特征，然后将两组特征

进行拼接得到组合特征

并输入特征匹配网络，得到两个特征的匹配度分值，将不同第二支撑样本与第二查询样本的匹配度分值输入到柔性最大值激活函数softmax得到归一化后的分类概率，最后通过比较第二查询样本与不同第二支撑样本的匹配度分值，将该第二查询样本归类为分值最高的支撑样本类别。

所述的方法中，频谱信号的每一个样本的长度为对应振动信号的样本长度的一半。

所述的方法中，特征编码网络f_θ包括四个一维卷积模块和一个一维自适应池化层，第一个一维卷积模块的卷积核最大。

所述的方法中，特征匹配网络表示参数化距离度量函数。

所述的方法中，特征编码网络输出为一个64通道*25宽度的特征张量，特征匹配网络输入为128通道*25宽度的特征张量，输出为8通道的特征张量。

所述的方法中，匹配度分值变化范围为0-1。

有益效果

本发明所述的方法从相关域中学习有用的领域知识来共享到目标域，对目标域的样本数量依赖性小，且学习过程灵活可变，不受故障类别数量与样本数量的拘束；在数据挖掘过程中联合了不同领域之间的知识，扩充了深度神经网络的学习空间，最大程度的利用了模型的表示学习能力；同时少样本迁移学习的建模方式精准适配于直升机在线故障诊断的场景需求，是实现离线典型故障样本到在线真实故障样本之间进行特征与模型迁移的有效手段。

上述说明仅是本发明技术方案的概述，为了能够使得本发明的技术手段更加清楚明白，达到本领域技术人员可依照说明书的内容予以实施的程度，并且为了能够让本发明的上述和其它目的、特征和优点能够更明显易懂，下面以本发明的具体实施方式进行举例说明。

附图说明

通过阅读下文优选的具体实施方式中的详细描述，本发明各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。说明书附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。显而易见地，下面描述的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。而且在整个附图中，用相同的附图标记表示相同的部件。

在附图中：

图1为本公开元度量学习驱动的直升机行星齿轮箱故障诊断方法的三阶段学习策略示意图；

图2为本公开元度量学习驱动的直升机行星齿轮箱故障诊断方法的一个实施例的元度量网络训练过程示意图；

图3为本公开元度量学习驱动的直升机行星齿轮箱故障诊断方法的一个实施例的元度量网络子网络结构示意图。

以下结合附图和实施例对本发明作进一步的解释。

具体实施方式

下面将参照附图1至图3更详细地描述本发明的具体实施例。虽然附图中显示了本发明的具体实施例，然而应当理解，可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本发明，并且能够将本发明的范围完整的传达给本领域的技术人员。

需要说明的是，在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可以理解，技术人员可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名词的差异来作为区分组件的方式，而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”或“包括”为一开放式用语，故应解释成“包含但不限定于”。说明书后续描述为实施本发明的较佳实施方式，然所述描述乃以说明书的一般原则为目的，并非用以限定本发明的范围。本发明的保护范围当视所附权利要求所界定者为准。

为便于对本发明实施例的理解，下面将结合附图以具体实施例为例做进一步的解释说明，且各个附图并不构成对本发明实施例的限定。

元度量学习驱动的直升机行星齿轮箱故障诊断方法包括，

分别代表两个网络的可学习参数。

和包含测试样本的测试类别

与第一查询样本

测试样本包括第二支撑样本

和第二查询样本

代表该样本属于本类别的概率。

其中

M个第二查询样本

进行拼接得到组合特征

所述的方法的优选实施方式中，频谱信号的每一个样本的长度为对应振动信号的样本长度的一半。

所述的方法的优选实施方式中，特征编码网络f_θ包括四个一维卷积模块和一个一维自适应池化层，第一个一维卷积模块的卷积核最大。

所述的方法的优选实施方式中，特征匹配网络包括距离度量函数。

所述的方法的优选实施方式中，特征编码网络输出为一个64通道*25宽度的特征张量，特征匹配网络输入为128通道*25宽度的特征张量，输出为8通道的特征张量。

所述的方法的优选实施方式中，匹配度分值变化范围为0-1。

在一个实施方式中，方法包括，

在训练阶段，通过对源域中的数据对进行采样来生成大量少样本训练任务来模拟测试中的场景，从而使网络可以适应测试阶段中只有少量有标签样本的场景。本发明的目的是通过以下技术方案予以实现，一种元度量学习驱动的直升机行星齿轮箱少样本故障诊断方法包括准备阶段、元学习阶段以及迁移阶段共三个部分。在准备阶段，完成网络超参数设置以及数据集的分隔。在元学习阶段，利用源域数据来训练模型学习最优的特征提取以及距离度量的网络参数。最终，在迁移阶段对目标域样本进行故障诊断。

1.1在准备阶段，首先对原始输入直升机传动***行星齿轮箱相关数据进行预处理。首先将采集的振动信号统一分隔成数据点长度相同的样本集。然后使用快速傅里叶变换(FFT)对所有的样本进行预处理，以获得具有更好的特征表示能力的频谱信号，同时每一个样本的长度自动缩减为原始数据点的一半。

1.2然后对元度量网络进行随机初始化，元度量网络基于一维卷积模块而搭建，以适配振动信号的数据特性，网络包含特征编码网络f_θ与特征匹配网络

两个部分。

特征编码网络的作用是对原始输入信号进行特征提取，它包含四个一维卷积模块和一个一维自适应池化层。其中，第一个一维卷积模块具有较大的卷积核来提取输入信号中丰富的浅层信息。

特征匹配网络的输入特征为两个样本特征的拼接，它的作用是比较来自两个样本特征的相似性，进而判断其是否属于同一类别。网络结构为通过两个一维卷积模块和两层全连接层后得到输出值。该特征匹配网络可以抽象为一种复杂的距离度量函数，不同于欧氏距离等其它传统的距离度量方式，它是由神经网络构成的，可以不断学习并更新，因此它可以自适应地学习并表征样本在特征空间中的距离。

1.3最后对预处理后的数据进行分组采样，首先，数据中包含的所有类别数被分为训练类别

和测试类别

两部分。其中训练类别，又称源域类别，包含大量的训练样本；测试类别，又称目标域类别，则只包含少量的样本。训练类别中所属的样本被进一步划分为支撑样本

与查询样本

同样地，测试类别中所属的样本被划分为支撑样本

与查询样本

最终确定单次训练的样本类别K，第一支撑样本数量N，第一查询样本数量M等超参数。

2.在元学习阶段，模型在多次元学习循环周期中进行迭代更新，在每一个训练循环中，从训练集类别中随机采样K类，每一类随机采样N个支撑样本{x^s}，M个第一查询样本{x^q}，同时将支撑样本与查询样本输入特征编码网络中进行前向传播，使它们投影到统一的特征空间，然后将两组特征{z^s}，{z^q}进行拼接得到组合特征{z}并输入特征匹配网络，得到两个特征的匹配度分值。分值变化范围为0-1，代表两个样本特征的匹配程度从低到高。将不同支撑样本与查询样本的匹配分值输入到柔性最大值激活函数得到归一化后的分类概率，然后计算预测结果与实际标签之间的均方误差分类损失函数

通过误差反向传播对元度量网络进行迭代更新。网络训练的目标函数定义如下：

其中

3.在迁移阶段，模型在多次迁移循环周期中进行迁移测试，在每一个迁移循环中，从测试集K种类别中进行采样，每一类随机采样N个第二支撑样本

M个第二查询样本

同时将支撑样本与查询样本输入特征编码网络中进行前向传播，使它们投影到统一的特征空间，然后将两组特征

进行拼接得到组合特征

并输入特征匹配网络，得到两个特征的匹配度分值。将不同支撑样本与查询样本的匹配分值输入到柔性最大值激活函数得到归一化后的分类概率，最后通过比较查询样本与不同支撑样本的匹配度分值，即可将该查询样本归类为分值最高的支撑样本类别。

在一个实施例中，使用元度量学习驱动的少样本故障诊断方法进行直升机行星齿轮箱可以表示为下表所示，包括准备阶段、元学习阶段以及迁移阶段共三个部分，各阶段流程如图1所示。在准备阶段，完成网络超参数设置以及数据集的分隔。在元学习阶段，利用源域数据来训练模型学习最优的特征提取以及距离度量的网络参数。最终，在迁移阶段对目标域样本进行故障诊断。

在准备阶段，首先对原始输入直升机传动***行星齿轮箱相关数据进行预处理。首先将采集的振动信号统一分隔成数据点长度相同的样本集。然后使用快速傅里叶变换(FFT)对所有的样本进行预处理，以获得具有更好的特征表示能力的频谱信号，同时每一个样本的长度自动缩减为原始数据点的一半。

然后对元度量网络进行随机初始化，元度量网络基于一维卷积模块而搭建，以适配振动信号的数据特性，网络包含特征编码网络f_θ与特征匹配网络

两个部分。

在一个实施例中，元度量网络学习机制如图2所示，子网络具体组成结构如图3所示，其中特征编码网络输出为一个<64通道*25宽度>的特征张量，特征匹配网络输入为<128通道*25宽度>的特征张量，输出为<8通道>的特征张量。

在一个实施例中，使用SQI齿轮故障模拟试验台来模拟直升机传动***主减速器齿轮箱，试验台结构包括电机、控制器、双级行星齿轮齿轮减速器、双级平行轴齿轮减速器镜像加载装置以及磁粉制动器。它可以模拟包含直齿轮、斜齿轮、支撑滚动轴承在内的多种单一或复合故障。

在3种不同工况下开展了平行轴齿轮箱的健康、缺齿、齿根裂纹、表面磨损等四种状态的试验。3种工况分别对应30Hz、40Hz，以及0-30-0Hz(从0Hz到30Hz再到0Hz的加减速循环)。试验中包含9中不同工况下的运行数据，是为了模拟在某种工况下通过大量有标签数据进行训练，然后迁移到另一种工况下利用少量有标签数据进行测试额场景。

同时为了验证元学***性，两种方法均采用与元度量网络相同的网络结构。

共设置了16种情景下的试验对照，包括30→40(从30Hz迁移到40Hz)、40→30(从40Hz迁移到30Hz)、0-30-0→40(从0-30-0Hz迁移到40Hz)、40→0-30-0(从40Hz迁移到0-30-0Hz)，并在每种迁移场景考虑1样本、3样本、5样本、10样本共四种目标域样本数量。

实验结果如下表所示，可以看出，相较于“直接训练”以及“预训练+微调”两种方法，在大多数场景下，元度量网络都能获得较高的诊断精度，同时，模型的诊断精度随着目标域样本数的增加而提升，符合数据驱动的方法的普遍规律。

此外，在30→40，40→30，0-30-0→40这三种相对简单的迁移任务中，即使只存在一个目标域样本，模型仍然可以取得超过98％的诊断精度。而在40→0-30-0的迁移任务中，需要从单一工况迁移到变化的工况，迁移难度显著提高，因而精度大幅度降低。

尽管以上结合附图对本发明的实施方案进行了描述，但本发明并不局限于上述的具体实施方案和应用领域，上述的具体实施方案仅仅是示意性的、指导性的，而不是限制性的。本领域的普通技术人员在本说明书的启示下和在不脱离本发明权利要求所保护的范围的情况下，还可以做出很多种的形式，这些均属于本发明保护之列。

Claims

1.一种元度量学习驱动的直升机行星齿轮箱故障诊断方法，所述方法包括以下步骤：

所述特征编码网络f_θ包括多个一维卷积模块、一维自适应池化层以及全连接层，其中θ，

分别代表两个网络的可学习参数；

和包含测试样本的测试类别

测试样本少于所述训练样本，其中，

训练样本包括第一支撑样本

与第一查询样本

测试样本包括第二支撑样本

和第二查询样本

确定单次训练的样本类别K，第一支撑样本数量N，第一查询样本数量M；

元度量网络在多次元学习训练循环周期中迭代更新，在每一个训练循环中，从训练集类别中随机采样K类，每一类随机采样N个第一支撑样本{x^s}，M个第一查询样本{x^q}，同时将第一支撑样本与第一查询样本输入特征编码网络中进行前向传播，使它们投影到统一的特征空间得到两组特征{z^s}，{z^q}，然后将两组特征{z^s}，{z^q}进行拼接得到组合特征{z}并输入特征匹配网络，得到两个特征的匹配度分值{g}＝[g₁，g₂，…，g_K]，分值包含K个子元素，

将不同第一支撑样本与第一查询样本的匹配度分值输入到柔性最大值激活函数softmax，得到归一化后的分类概率{c}＝[c₁，c₂，…，c_K]，其中每一个子元素输出值分别为