CN113095179A - 元度量学习驱动的直升机行星齿轮箱故障诊断方法 - Google Patents
元度量学习驱动的直升机行星齿轮箱故障诊断方法 Download PDFInfo
- Publication number
- CN113095179A CN113095179A CN202110344018.3A CN202110344018A CN113095179A CN 113095179 A CN113095179 A CN 113095179A CN 202110344018 A CN202110344018 A CN 202110344018A CN 113095179 A CN113095179 A CN 113095179A
- Authority
- CN
- China
- Prior art keywords
- sample
- network
- samples
- feature
- query
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000003745 diagnosis Methods 0.000 title abstract description 29
- 230000006870 function Effects 0.000 claims abstract description 20
- 238000013508 migration Methods 0.000 claims abstract description 20
- 230000005012 migration Effects 0.000 claims abstract description 20
- 230000008569 process Effects 0.000 claims abstract description 7
- 238000012549 training Methods 0.000 claims description 45
- 238000012360 testing method Methods 0.000 claims description 31
- 238000001228 spectrum Methods 0.000 claims description 10
- 230000005540 biological transmission Effects 0.000 claims description 9
- 238000005259 measurement Methods 0.000 claims description 8
- 238000011176 pooling Methods 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 5
- 230000003044 adaptive effect Effects 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000013528 artificial neural network Methods 0.000 abstract description 9
- 238000002360 preparation method Methods 0.000 abstract description 8
- 238000000605 extraction Methods 0.000 abstract description 5
- 238000001514 detection method Methods 0.000 abstract 1
- 230000011218 segmentation Effects 0.000 abstract 1
- 230000036541 health Effects 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 239000003638 chemical reducing agent Substances 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 241001391944 Commicarpus scandens Species 0.000 description 1
- 238000005299 abrasion Methods 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000006249 magnetic particle Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/02—Gearings; Transmission mechanisms
- G01M13/021—Gearings
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/02—Gearings; Transmission mechanisms
- G01M13/028—Acoustic or vibration analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
本发明公开了一种元度量学习驱动的直升机行星齿轮箱故障诊断方法,方法中,元度量深度神经网络为核心,由特征编码网络和特征匹配网络两个子网络组成;通过在相关的源域中建立多个子任务来迭代训练网络参数,并使用神经网络来抽象化取代可优化更新的特征距离匹配函数,最终在目标任务域实现利用少量标签样本来进行高精度的直升机行星齿轮箱故障诊断。诊断方法包括准备阶段、元学习阶段以及迁移阶段共三个流程。在准备阶段,完成网络超参数设置以及数据集的分割。在元学习阶段,利用源域数据来训练模型学习最优的特征提取以及距离度量的网络参数。最终,在迁移阶段对检测样本与目标域多类故障样本进行特征提取与特征匹配,得到故障模式判定决策。
Description
技术领域
本发明属于直升机行星齿轮箱故障诊断技术领域,特别是一种元度量学习驱动的直升机行星齿轮箱故障诊断方法。
背景技术
与固定翼飞机相比,直升机事故高发,且严重事故比例大,这对直升机安全性和可靠性提出了很高的要求。因此开展直升机健康管理与故障诊断研究是保证直升机运行安全性与运维经济性的重要基础,长期以来备受关注。而其传动***行星齿轮箱则因其工作环境恶劣、载荷变化大等,成为故障易发的薄弱环节。针对其开展的故障诊断研究一直是直升机健康与使用监控***(HUMS)的核心任务之一。
直升机传动***故障诊断的任务是通过对某个部件进行智能诊断,给出可能的故障的类型和程度,为后续维护和健康管理提供依据。从信号处理角度出发以及从智能诊断角度出发的相关诊断方法都已经被广泛的应用。信号处理方面,包括使用振动信号的低阶条件谱矩,实现齿轮箱故障类型的实时诊断;通过小波分解和功率谱提取特征,作为后续智能诊断方法的特征输入。智能诊断方面,则包括采用人工神经网络对直升机传动***故障进行分类;基于人工神经网络的主减速器行星齿轮故障程度辨识方法;基于稀疏贝叶斯极限学习机的行星齿轮箱故障类型识别以及行星轮裂纹程度辨识;基于隐马尔可夫模型和递归神经网络(RNN)的齿轮健康监测框架等。
虽然基于传统信号处理以及以深度神经网络为代表的智能诊断方法可以在诊断分类精度上取得一定的提升,但在有限的训练样本甚至极少的训练样本下保持高诊断精度的难题依然有待解决。依然存在着在1)复杂工况任务中精度不高、鲁棒性不强,难以适应复杂多变的工况;2)对训练数据量的过度依赖,当样本数量过少时,诊断精度显著下降;3)频繁复杂的变工况运行状态所引起的故障样本稀缺等问题。
在背景技术部分中公开的上述信息仅仅用于增强对本发明背景的理解,因此可能包含不构成在本国中本领域普通技术人员公知的现有技术的信息。
发明内容
针对现有技术中的问题,本发明提出一种元度量学习驱动的直升机行星齿轮箱故障诊断方法,能够在目标域仅有少量有效故障样本的情况下实现故障形式的精准诊断。
本发明的目的是通过以下技术方案予以实现,一种元度量学习驱动的直升机行星齿轮箱故障诊断方法包括以下步骤:
基于一维卷积模块搭建元度量网络,其中,元度量网络包括对原始输入信号特征提取的特征编码网络fθ和特征匹配网络所述特征编码网络fθ包括多个一维卷积模块、一维自适应池化层以及全连接层,其中分别代表两个网络的可学习参数。
采集直升机传动***行星齿轮箱振动信号,将所述振动信号分隔成数据点长度相同的样本集,快速傅里叶变换预处理所述样本集中所有的样本以获得频谱信号,分组所述频谱信号为包含训练样本的训练类别和包含测试样本的测试类别测试样本少于所述训练样本,其中,训练样本包括第一支撑样本与第一查询样本测试样本包括第二支撑样本和第二查询样本确定单次训练的样本类别K,第一支撑样本数量N,第一查询样本数量M。
元度量网络在多次元学习训练循环周期中迭代更新,在每一个训练循环中,从训练集类别中随机采样K类,每一类随机采样N个第一支撑样本{xs},M个第一查询样本{xq},同时将第一支撑样本与第一查询样本输入特征编码网络中进行前向传播,使它们投影到统一的特征空间得到两组特征{zs},{zq},然后将两组特征{zs},{zq}进行拼接得到组合特征{z}并输入特征匹配网络,得到两个特征的匹配度分值{g}=[g1,g2,…,gK],分值包含K个子元素。将不同第一支撑样本与第一查询样本的匹配度分值输入到柔性最大值激活函数softmax,得到归一化后的分类概率{c}=[c1,c2,…,cK],其中每一个子元素输出值分别为代表该样本属于本类别的概率。
元度量网络在多次迁移循环周期中进行迁移测试,在每一个迁移循环中,从测试集的K种类别中进行采样,每一类随机采样N个第二支撑样本M个第二查询样本同时将第二支撑样本与第二查询样本输入特征编码网络中进行前向传播,使它们投影到统一的特征空间得到两组特征,然后将两组特征进行拼接得到组合特征并输入特征匹配网络,得到两个特征的匹配度分值,将不同第二支撑样本与第二查询样本的匹配度分值输入到柔性最大值激活函数softmax得到归一化后的分类概率,最后通过比较第二查询样本与不同第二支撑样本的匹配度分值,将该第二查询样本归类为分值最高的支撑样本类别。
所述的方法中,频谱信号的每一个样本的长度为对应振动信号的样本长度的一半。
所述的方法中,特征编码网络fθ包括四个一维卷积模块和一个一维自适应池化层,第一个一维卷积模块的卷积核最大。
所述的方法中,特征匹配网络表示参数化距离度量函数。
所述的方法中,特征编码网络输出为一个64通道*25宽度的特征张量,特征匹配网络输入为128通道*25宽度的特征张量,输出为8通道的特征张量。
所述的方法中,匹配度分值变化范围为0-1。
有益效果
本发明所述的方法从相关域中学习有用的领域知识来共享到目标域,对目标域的样本数量依赖性小,且学习过程灵活可变,不受故障类别数量与样本数量的拘束;在数据挖掘过程中联合了不同领域之间的知识,扩充了深度神经网络的学习空间,最大程度的利用了模型的表示学习能力;同时少样本迁移学习的建模方式精准适配于直升机在线故障诊断的场景需求,是实现离线典型故障样本到在线真实故障样本之间进行特征与模型迁移的有效手段。
上述说明仅是本发明技术方案的概述,为了能够使得本发明的技术手段更加清楚明白,达到本领域技术人员可依照说明书的内容予以实施的程度,并且为了能够让本发明的上述和其它目的、特征和优点能够更明显易懂,下面以本发明的具体实施方式进行举例说明。
附图说明
通过阅读下文优选的具体实施方式中的详细描述,本发明各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。说明书附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。显而易见地,下面描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。而且在整个附图中,用相同的附图标记表示相同的部件。
在附图中:
图1为本公开元度量学习驱动的直升机行星齿轮箱故障诊断方法的三阶段学习策略示意图;
图2为本公开元度量学习驱动的直升机行星齿轮箱故障诊断方法的一个实施例的元度量网络训练过程示意图;
图3为本公开元度量学习驱动的直升机行星齿轮箱故障诊断方法的一个实施例的元度量网络子网络结构示意图。
以下结合附图和实施例对本发明作进一步的解释。
具体实施方式
下面将参照附图1至图3更详细地描述本发明的具体实施例。虽然附图中显示了本发明的具体实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
需要说明的是,在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可以理解,技术人员可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名词的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”或“包括”为一开放式用语,故应解释成“包含但不限定于”。说明书后续描述为实施本发明的较佳实施方式,然所述描述乃以说明书的一般原则为目的,并非用以限定本发明的范围。本发明的保护范围当视所附权利要求所界定者为准。
为便于对本发明实施例的理解,下面将结合附图以具体实施例为例做进一步的解释说明,且各个附图并不构成对本发明实施例的限定。
元度量学习驱动的直升机行星齿轮箱故障诊断方法包括,
基于一维卷积模块搭建元度量网络,其中,元度量网络包括对原始输入信号特征提取的特征编码网络fθ和特征匹配网络所述特征编码网络fθ包括多个一维卷积模块、一维自适应池化层以及全连接层,其中分别代表两个网络的可学习参数。
采集直升机传动***行星齿轮箱振动信号,将所述振动信号分隔成数据点长度相同的样本集,快速傅里叶变换预处理所述样本集中所有的样本以获得频谱信号,分组所述频谱信号为包含训练样本的训练类别和包含测试样本的测试类别测试样本少于所述训练样本,其中,训练样本包括第一支撑样本与第一查询样本测试样本包括第二支撑样本和第二查询样本确定单次训练的样本类别K,第一支撑样本数量N,第一查询样本数量M。
元度量网络在多次元学习训练循环周期中迭代更新,在每一个训练循环中,从训练集类别中随机采样K类,每一类随机采样N个第一支撑样本{xs},M个第一查询样本{xq},同时将第一支撑样本与第一查询样本输入特征编码网络中进行前向传播,使它们投影到统一的特征空间得到两组特征{zs},{zq},然后将两组特征{zs},{zq}进行拼接得到组合特征{z}并输入特征匹配网络,得到两个特征的匹配度分值{g}=[g1,g2,…,gK],分值包含K个子元素。将不同第一支撑样本与第一查询样本的匹配度分值输入到柔性最大值激活函数softmax,得到归一化后的分类概率{c}=[c1,c2,…,cK],其中每一个子元素输出值分别为代表该样本属于本类别的概率。
元度量网络在多次迁移循环周期中进行迁移测试,在每一个迁移循环中,从测试集的K种类别中进行采样,每一类随机采样N个第二支撑样本M个第二查询样本同时将第二支撑样本与第二查询样本输入特征编码网络中进行前向传播,使它们投影到统一的特征空间得到两组特征,然后将两组特征进行拼接得到组合特征并输入特征匹配网络,得到两个特征的匹配度分值,将不同第二支撑样本与第二查询样本的匹配度分值输入到柔性最大值激活函数softmax得到归一化后的分类概率,最后通过比较第二查询样本与不同第二支撑样本的匹配度分值,将该第二查询样本归类为分值最高的支撑样本类别。
所述的方法的优选实施方式中,频谱信号的每一个样本的长度为对应振动信号的样本长度的一半。
所述的方法的优选实施方式中,特征编码网络fθ包括四个一维卷积模块和一个一维自适应池化层,第一个一维卷积模块的卷积核最大。
所述的方法的优选实施方式中,特征匹配网络包括距离度量函数。
所述的方法的优选实施方式中,特征编码网络输出为一个64通道*25宽度的特征张量,特征匹配网络输入为128通道*25宽度的特征张量,输出为8通道的特征张量。
所述的方法的优选实施方式中,匹配度分值变化范围为0-1。
在一个实施方式中,方法包括,
在训练阶段,通过对源域中的数据对进行采样来生成大量少样本训练任务来模拟测试中的场景,从而使网络可以适应测试阶段中只有少量有标签样本的场景。本发明的目的是通过以下技术方案予以实现,一种元度量学习驱动的直升机行星齿轮箱少样本故障诊断方法包括准备阶段、元学习阶段以及迁移阶段共三个部分。在准备阶段,完成网络超参数设置以及数据集的分隔。在元学习阶段,利用源域数据来训练模型学习最优的特征提取以及距离度量的网络参数。最终,在迁移阶段对目标域样本进行故障诊断。
1.1在准备阶段,首先对原始输入直升机传动***行星齿轮箱相关数据进行预处理。首先将采集的振动信号统一分隔成数据点长度相同的样本集。然后使用快速傅里叶变换(FFT)对所有的样本进行预处理,以获得具有更好的特征表示能力的频谱信号,同时每一个样本的长度自动缩减为原始数据点的一半。
特征编码网络的作用是对原始输入信号进行特征提取,它包含四个一维卷积模块和一个一维自适应池化层。其中,第一个一维卷积模块具有较大的卷积核来提取输入信号中丰富的浅层信息。
特征匹配网络的输入特征为两个样本特征的拼接,它的作用是比较来自两个样本特征的相似性,进而判断其是否属于同一类别。网络结构为通过两个一维卷积模块和两层全连接层后得到输出值。该特征匹配网络可以抽象为一种复杂的距离度量函数,不同于欧氏距离等其它传统的距离度量方式,它是由神经网络构成的,可以不断学习并更新,因此它可以自适应地学习并表征样本在特征空间中的距离。
1.3最后对预处理后的数据进行分组采样,首先,数据中包含的所有类别数被分为训练类别和测试类别两部分。其中训练类别,又称源域类别,包含大量的训练样本;测试类别,又称目标域类别,则只包含少量的样本。训练类别中所属的样本被进一步划分为支撑样本与查询样本同样地,测试类别中所属的样本被划分为支撑样本与查询样本最终确定单次训练的样本类别K,第一支撑样本数量N,第一查询样本数量M等超参数。
2.在元学习阶段,模型在多次元学习循环周期中进行迭代更新,在每一个训练循环中,从训练集类别中随机采样K类,每一类随机采样N个支撑样本{xs},M个第一查询样本{xq},同时将支撑样本与查询样本输入特征编码网络中进行前向传播,使它们投影到统一的特征空间,然后将两组特征{zs},{zq}进行拼接得到组合特征{z}并输入特征匹配网络,得到两个特征的匹配度分值。分值变化范围为0-1,代表两个样本特征的匹配程度从低到高。将不同支撑样本与查询样本的匹配分值输入到柔性最大值激活函数得到归一化后的分类概率,然后计算预测结果与实际标签之间的均方误差分类损失函数通过误差反向传播对元度量网络进行迭代更新。网络训练的目标函数定义如下:
3.在迁移阶段,模型在多次迁移循环周期中进行迁移测试,在每一个迁移循环中,从测试集K种类别中进行采样,每一类随机采样N个第二支撑样本M个第二查询样本同时将支撑样本与查询样本输入特征编码网络中进行前向传播,使它们投影到统一的特征空间,然后将两组特征进行拼接得到组合特征并输入特征匹配网络,得到两个特征的匹配度分值。将不同支撑样本与查询样本的匹配分值输入到柔性最大值激活函数得到归一化后的分类概率,最后通过比较查询样本与不同支撑样本的匹配度分值,即可将该查询样本归类为分值最高的支撑样本类别。
在一个实施例中,使用元度量学习驱动的少样本故障诊断方法进行直升机行星齿轮箱可以表示为下表所示,包括准备阶段、元学习阶段以及迁移阶段共三个部分,各阶段流程如图1所示。在准备阶段,完成网络超参数设置以及数据集的分隔。在元学习阶段,利用源域数据来训练模型学习最优的特征提取以及距离度量的网络参数。最终,在迁移阶段对目标域样本进行故障诊断。
在准备阶段,首先对原始输入直升机传动***行星齿轮箱相关数据进行预处理。首先将采集的振动信号统一分隔成数据点长度相同的样本集。然后使用快速傅里叶变换(FFT)对所有的样本进行预处理,以获得具有更好的特征表示能力的频谱信号,同时每一个样本的长度自动缩减为原始数据点的一半。
特征编码网络的作用是对原始输入信号进行特征提取,它包含四个一维卷积模块和一个一维自适应池化层。其中,第一个一维卷积模块具有较大的卷积核来提取输入信号中丰富的浅层信息。
特征匹配网络的输入特征为两个样本特征的拼接,它的作用是比较来自两个样本特征的相似性,进而判断其是否属于同一类别。网络结构为通过两个一维卷积模块和两层全连接层后得到输出值。该特征匹配网络可以抽象为一种复杂的距离度量函数,不同于欧氏距离等其它传统的距离度量方式,它是由神经网络构成的,可以不断学习并更新,因此它可以自适应地学习并表征样本在特征空间中的距离。
在一个实施例中,元度量网络学习机制如图2所示,子网络具体组成结构如图3所示,其中特征编码网络输出为一个<64通道*25宽度>的特征张量,特征匹配网络输入为<128通道*25宽度>的特征张量,输出为<8通道>的特征张量。
在一个实施例中,使用SQI齿轮故障模拟试验台来模拟直升机传动***主减速器齿轮箱,试验台结构包括电机、控制器、双级行星齿轮齿轮减速器、双级平行轴齿轮减速器镜像加载装置以及磁粉制动器。它可以模拟包含直齿轮、斜齿轮、支撑滚动轴承在内的多种单一或复合故障。
在3种不同工况下开展了平行轴齿轮箱的健康、缺齿、齿根裂纹、表面磨损等四种状态的试验。3种工况分别对应30Hz、40Hz,以及0-30-0Hz(从0Hz到30Hz再到0Hz的加减速循环)。试验中包含9中不同工况下的运行数据,是为了模拟在某种工况下通过大量有标签数据进行训练,然后迁移到另一种工况下利用少量有标签数据进行测试额场景。
同时为了验证元学***性,两种方法均采用与元度量网络相同的网络结构。
共设置了16种情景下的试验对照,包括30→40(从30Hz迁移到40Hz)、40→30(从40Hz迁移到30Hz)、0-30-0→40(从0-30-0Hz迁移到40Hz)、40→0-30-0(从40Hz迁移到0-30-0Hz),并在每种迁移场景考虑1样本、3样本、5样本、10样本共四种目标域样本数量。
实验结果如下表所示,可以看出,相较于“直接训练”以及“预训练+微调”两种方法,在大多数场景下,元度量网络都能获得较高的诊断精度,同时,模型的诊断精度随着目标域样本数的增加而提升,符合数据驱动的方法的普遍规律。
此外,在30→40,40→30,0-30-0→40这三种相对简单的迁移任务中,即使只存在一个目标域样本,模型仍然可以取得超过98%的诊断精度。而在40→0-30-0的迁移任务中,需要从单一工况迁移到变化的工况,迁移难度显著提高,因而精度大幅度降低。
尽管以上结合附图对本发明的实施方案进行了描述,但本发明并不局限于上述的具体实施方案和应用领域,上述的具体实施方案仅仅是示意性的、指导性的,而不是限制性的。本领域的普通技术人员在本说明书的启示下和在不脱离本发明权利要求所保护的范围的情况下,还可以做出很多种的形式,这些均属于本发明保护之列。
Claims (6)
1.一种元度量学习驱动的直升机行星齿轮箱故障诊断方法,所述方法包括以下步骤:
基于一维卷积模块搭建元度量网络,其中,元度量网络包括对原始输入信号特征提取的特征编码网络fθ和特征匹配网络所述特征编码网络fθ包括多个一维卷积模块、一维自适应池化层以及全连接层,其中θ,分别代表两个网络的可学习参数;
采集直升机传动***行星齿轮箱振动信号,将所述振动信号分隔成数据点长度相同的样本集,快速傅里叶变换预处理所述样本集中所有的样本以获得频谱信号,分组所述频谱信号为包含训练样本的训练类别和包含测试样本的测试类别测试样本少于所述训练样本,其中,
元度量网络在多次元学习训练循环周期中迭代更新,在每一个训练循环中,从训练集类别中随机采样K类,每一类随机采样N个第一支撑样本{xs},M个第一查询样本{xq},同时将第一支撑样本与第一查询样本输入特征编码网络中进行前向传播,使它们投影到统一的特征空间得到两组特征{zs},{zq},然后将两组特征{zs},{zq}进行拼接得到组合特征{z}并输入特征匹配网络,得到两个特征的匹配度分值{g}=[g1,g2,…,gK],分值包含K个子元素,
元度量网络在多次迁移循环周期中进行迁移测试,在每一个迁移循环中,从测试集的K种类别中进行采样,每一类随机采样N个第二支撑样本M个第二查询样本同时将第二支撑样本与第二查询样本输入特征编码网络中进行前向传播,使它们投影到统一的特征空间得到两组特征,然后将两组特征进行拼接得到组合特征并输入特征匹配网络,得到两个特征的匹配度分值,
将不同第二支撑样本与第二查询样本的匹配度分值输入到柔性最大值激活函数softmax得到归一化后的分类概率,最后通过比较第二查询样本与不同第二支撑样本的匹配度分值,将该第二查询样本归类为分值最高的支撑样本类别。
2.根据权利要求1所述的方法,其中,优选的,频谱信号的每一个样本的长度为对应振动信号的样本长度的一半。
3.根据权利要求1所述的方法,其中,特征编码网络fθ包括四个一维卷积模块和一个一维自适应池化层,第一个一维卷积模块的卷积核最大。
4.根据权利要求1所述的方法,其中,特征匹配网络表示参数化距离度量函数。
5.根据权利要求1所述的方法,其中,特征编码网络输出为一个64通道*25宽度的特征张量,特征匹配网络输入为128通道*25宽度的特征张量,输出为8通道的特征张量。
6.根据权利要求1所述的方法,其中,匹配度分值变化范围为0-1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110344018.3A CN113095179A (zh) | 2021-03-30 | 2021-03-30 | 元度量学习驱动的直升机行星齿轮箱故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110344018.3A CN113095179A (zh) | 2021-03-30 | 2021-03-30 | 元度量学习驱动的直升机行星齿轮箱故障诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113095179A true CN113095179A (zh) | 2021-07-09 |
Family
ID=76671968
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110344018.3A Pending CN113095179A (zh) | 2021-03-30 | 2021-03-30 | 元度量学习驱动的直升机行星齿轮箱故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113095179A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113569486A (zh) * | 2021-07-30 | 2021-10-29 | 安徽容知日新科技股份有限公司 | 一种工业设备的故障检测方法、计算设备及可读存储介质 |
CN114092747A (zh) * | 2021-11-30 | 2022-02-25 | 南通大学 | 基于深度元度量模型互学习的小样本图像分类方法 |
CN114202028A (zh) * | 2021-12-13 | 2022-03-18 | 四川大学 | 基于mamtl的滚动轴承寿命阶段识别方法 |
CN115147615A (zh) * | 2022-07-01 | 2022-10-04 | 河海大学 | 一种基于度量元学习网络的岩石图像分类方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111709448A (zh) * | 2020-05-20 | 2020-09-25 | 西安交通大学 | 一种基于迁移关系网络的机械故障诊断方法 |
CN112163640A (zh) * | 2020-10-30 | 2021-01-01 | 北京信息科技大学 | 基于深度卷积迁移学习行星齿轮箱故障诊断方法及*** |
CN112183581A (zh) * | 2020-09-07 | 2021-01-05 | 华南理工大学 | 基于自适应迁移神经网络的半监督机械故障诊断方法 |
-
2021
- 2021-03-30 CN CN202110344018.3A patent/CN113095179A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111709448A (zh) * | 2020-05-20 | 2020-09-25 | 西安交通大学 | 一种基于迁移关系网络的机械故障诊断方法 |
CN112183581A (zh) * | 2020-09-07 | 2021-01-05 | 华南理工大学 | 基于自适应迁移神经网络的半监督机械故障诊断方法 |
CN112163640A (zh) * | 2020-10-30 | 2021-01-01 | 北京信息科技大学 | 基于深度卷积迁移学习行星齿轮箱故障诊断方法及*** |
Non-Patent Citations (1)
Title |
---|
JINGYAO WU ET AL.: "Few-shot transfer learning for intelligent fault diagnosis of machine", 《MEASUREMENT》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113569486A (zh) * | 2021-07-30 | 2021-10-29 | 安徽容知日新科技股份有限公司 | 一种工业设备的故障检测方法、计算设备及可读存储介质 |
CN114092747A (zh) * | 2021-11-30 | 2022-02-25 | 南通大学 | 基于深度元度量模型互学习的小样本图像分类方法 |
CN114202028A (zh) * | 2021-12-13 | 2022-03-18 | 四川大学 | 基于mamtl的滚动轴承寿命阶段识别方法 |
CN114202028B (zh) * | 2021-12-13 | 2023-04-28 | 四川大学 | 基于mamtl的滚动轴承寿命阶段识别方法 |
CN115147615A (zh) * | 2022-07-01 | 2022-10-04 | 河海大学 | 一种基于度量元学习网络的岩石图像分类方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109635677B (zh) | 基于多标签分类卷积神经网络的复合故障诊断方法及装置 | |
CN113095179A (zh) | 元度量学习驱动的直升机行星齿轮箱故障诊断方法 | |
CN110162018B (zh) | 基于知识蒸馏与隐含层共享的增量式设备故障诊断方法 | |
CN112161784B (zh) | 基于多传感器信息融合迁移网络的机械故障诊断方法 | |
CN109186973B (zh) | 一种无监督深度学习网络的机械故障诊断方法 | |
CN110609524B (zh) | 一种工业设备剩余寿命预测模型及其构建方法和应用 | |
Zhang et al. | A method of fault diagnosis for rotary equipment based on deep learning | |
CN112149316A (zh) | 基于改进的cnn模型的航空发动机剩余寿命预测方法 | |
CN111830408A (zh) | 一种基于边缘计算和深度学习的电机故障诊断***及方法 | |
CN104714925B (zh) | 一种基于分数阶傅里叶变换和支持向量机的齿轮传动噪声分析方法 | |
CN111089720B (zh) | 一种适用于变转速下齿轮故障诊断的正则化稀疏滤波方法 | |
Kaya et al. | Classification of bearing vibration speeds under 1D-LBP based on eight local directional filters | |
CN112067294A (zh) | 基于深度学习的滚动轴承智能故障诊断方法 | |
CN111914883A (zh) | 一种基于深度融合网络的主轴轴承状态评估方法及装置 | |
CN112541233A (zh) | 基于改进卷积神经网络的旋转机械故障诊断方法 | |
CN110991295A (zh) | 一种基于一维卷积神经网络的自适应故障诊断方法 | |
CN112541511A (zh) | 基于卷积神经网络的多通道时间序列数据故障诊断方法 | |
CN114091504A (zh) | 一种基于生成对抗网络的旋转机械小样本故障诊断方法 | |
CN116358871B (zh) | 基于图卷积网络的滚动轴承微弱信号复合故障诊断方法 | |
Zheng et al. | An end-to-end CNN-BiLSTM attention model for gearbox fault diagnosis | |
CN112541510A (zh) | 基于多通道时间序列数据的智能故障诊断方法 | |
CN115290326A (zh) | 一种滚动轴承故障智能诊断方法 | |
Zhou et al. | Differentiable architecture search for aeroengine bevel gear fault diagnosis | |
CN115587290A (zh) | 基于变分自编码生成对抗网络的航空发动机故障诊断方法 | |
CN116956215A (zh) | 一种传动***故障诊断方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210709 |