CN114021285A - 基于相互局部对抗迁移学习的旋转机械故障诊断方法 - Google Patents

基于相互局部对抗迁移学习的旋转机械故障诊断方法 Download PDF

Info

Publication number
CN114021285A
CN114021285A CN202111362333.5A CN202111362333A CN114021285A CN 114021285 A CN114021285 A CN 114021285A CN 202111362333 A CN202111362333 A CN 202111362333A CN 114021285 A CN114021285 A CN 114021285A
Authority
CN
China
Prior art keywords
domain
data
mutual
classifier
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111362333.5A
Other languages
English (en)
Other versions
CN114021285B (zh
Inventor
柳春
李少杰
汪小帆
任肖强
彭艳
谢少荣
李扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Shanghai for Science and Technology
Original Assignee
University of Shanghai for Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Shanghai for Science and Technology filed Critical University of Shanghai for Science and Technology
Priority to CN202111362333.5A priority Critical patent/CN114021285B/zh
Publication of CN114021285A publication Critical patent/CN114021285A/zh
Application granted granted Critical
Publication of CN114021285B publication Critical patent/CN114021285B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/17Mechanical parametric or variational design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/04Constraint-based CAD
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/08Probabilistic or stochastic CAD

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Geometry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Hardware Design (AREA)
  • Medical Informatics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

本发明提供了一种基于相互局部对抗迁移学习的旋转机械故障诊断方法,包括:考虑到目标域数据中隐含的标签信息没有被充分利用,设计了一种相互学习的网络结构来学习可靠的伪标签,进而使得没有标签的目标域数据得以充分利用,从而提高模型性能。相比于单个网络结构来比该模型的鲁棒性更好。考虑到忽略故障的类别信息直接从全局的角度来对齐源域与目标域数据可能会出现对齐偏差的问题,提供多个局部对抗域分类器取代全局对抗域分类器,每个局部对抗域分类器分别对齐每一个类别的源域和目标域特征,以得到更好的相似特征。

Description

基于相互局部对抗迁移学习的旋转机械故障诊断方法
技术领域
本发明涉及人工智能技术领域,特别涉及一种基于相互局部对抗迁移学习的旋转机械故障诊断方法。
背景技术
传统智能故障诊断方法需要依靠足够的标记数据来训练诊断模型,但是在真实工业场景中,设备大多正常运行,故障数据难以获取。基于诊断知识可以在多个相关机器之间重用的思想,比如实验室轴承的诊断知识可能有助于识别工业场景中轴承的健康状态。因此,采用迁移学习这样一种方式可以将在数据量充足的源域数据中学到的诊断知识迁移到数据量不足的目标域数据中,很好的解决在真实工业场景下标记数据不足的问题。目前迁移学习故障诊断主要分为3类:
基于实例的方法:通过在源域中找到与目标域相似的数据,把这个数据的权值进行调整,使得新的数据与目标域的数据进行匹配,然后进行训练学习,得到适用于目标域的模型。这样的方法优点是方法简单,实现容易。缺点在于权重的选择与相似度的度量依赖经验,且源域与目标域的数据分布往往不同。该方法的弊端在于需要先验知识。
基于参数微调的方法:第一阶段使用标记的源数据构建预训练的诊断模型。在第二阶段,利用目标域中的少数标记数据进行调整预训练诊断模型的参数。得益于预训练的诊断模型,基于参数的方法可以节省处理大量数据时的大量计算资源。但是,这种基于微调的方法只能应用于监督的转移学习任务,因为对于微调预训练的模型,必须要有标记的目标样本。该方法的弊端在于需要目标域标签。
发明内容
本发明的目的在于提供一种基于相互局部对抗迁移学习的旋转机械故障诊断方法,以解决现有的迁移学习故障诊断方法具迁移效果差,模型鲁棒性弱的问题。
为解决上述技术问题,本发明提供一种基于相互局部对抗迁移学习的旋转机械故障诊断方法,包括:
利用相互学习网络结构进行故障诊断,两个网络相互指导获得更为可靠的伪标签,使得目标域数据得以充分利用,从而提升模型效果及其鲁棒性;
以及提供多个局部对抗域分类器以取代全局对抗域分类器,每个局部对抗域分类器分别对齐每一个类别的源域和目标域特征,以得到经改善的相似特征。
可选的,在所述的基于相互局部对抗迁移学习的旋转机械故障诊断方法中,其中利用相互学习网络结构进行故障诊断包括:
提供相互学习网络结构,相互学习网络结构包括至少两个网络,该至少两个网络之间互为同伴网络;
每个网络在训练过程中采用有标记的源域故障数据的同时,参考同伴网络的学习经验提升泛化能力;
两个网络之间分享学习经验,以进行互相学习,根据互相学习结果进行故障诊断。
可选的,在所述的基于相互局部对抗迁移学习的旋转机械故障诊断方法中,还包括:
类别概率估计蕴含了网络提取到的数据本质规律,可以体现数据的内在本质特性;
单一的数据标签提供的信息只有样本是否属于某一类,不能够表示不同类别之间的联系,而网络输出的类别概率估计能够一定程度上恢复该信息,设计这样一个相互学习结构进行类别概率估计交互可以使网络之间传递学习到的数据分布特性,从而使得网络改善泛化性能;
基于网络改善泛化性能,采用相互学习的结构互换每个网络传递学习到的数据分布特性,相互指导和学习直至收敛。
可选的,在所述的基于相互局部对抗迁移学习的旋转机械故障诊断方法中,还包括:
采用Wasserstein距离约束类别概率估计的分布差异达到最小,起到正则化的作用;
将其中一个网络的类别概率估计传递给另一个网络时,提供额外的类别先验约束,防止标签分类器过度拟合真值标签的0-1分布,有效降低过拟合发生概率。
可选的,在所述的基于相互局部对抗迁移学习的旋转机械故障诊断方法中,还包括:
代理分类器充当标签分类器和特征提取器之间的桥梁,确保代理分类器、标签分类器和特征提取器使用目标域中的感知信息;
代理分类器使两个标签分类器不必彼此对齐,避免让两个独立的网络彼此信服对方的预测结果,代理分类器在训练过程中将两个网络联通起来,起到一个交换两个网络学习到的信息的作用;以及
代理分类器的结构使得标签分类器和特征提取器之间执行以下动作:
指示对方如何获得伪标签,每一步的预测值必须与对方的代理分类器的预测值的分布差异最小,以避免传统相互学习结构用另一组的预测标签来指导每个组,但没有指示如何获得伪标签,因此并不强迫他们获得非常相似的特征表示,也就是说两个网络可能获取到不相似的特征表示,可能会相互影响效果变差。
可选的,在所述的基于相互局部对抗迁移学习的旋转机械故障诊断方法中,还包括:
基于一个目标域样本只与自己最相关的类别数据对齐,多个局部域判别器进行不同类别故障数据分布的细粒度对齐,减小负迁移的概率,从而避免判别结构在不同分布的错误对齐。
可选的,在所述的基于相互局部对抗迁移学习的旋转机械故障诊断方法中,还包括:
数据预处理模块对旋转机械设备上收集到的振动信号做数据预处理;
特征提取模块构建一个多层CNN卷积网络提取特征,通过设置不同的初始化参数提取不同尺度的特征;
域适应模块设计3个Loss函数以构成最终的Loss函数,3个Loss函数包括源域标签数据分类Softmax多分类Losscls、Softmax二分类域判别器Lossdom和相互学习结构的Lossml
通过最小化最终的Loss函数,训练得到源域与目标域的域不变特征,以改善迁移学习故障诊断效果;
其中Losscls为源域有标签数据的损失函数,基于损失函数有监督特性,保证整个模型的效果。
可选的,在所述的基于相互局部对抗迁移学习的旋转机械故障诊断方法中,还包括:
Lossdom由k个Softmax二分类域判别器组成,k为故障类别数,基于不同故障类型的特征不同,采用多个局部域分类器分别对齐每个类别的源域与目标域特征,以避免域对抗分类器从全局的角度对齐源域与目标域特征对齐出现偏差;
Lossml采用Wasserstein距离衡量网络1的代理分类器对伪标签的预测与网络2的标签分类器对伪标签的预测的分布差异,采用Wasserstein距离衡量网络2的代理分类器对伪标签的预测与网络2的标签分类器对伪标签的预测的分布差异,起到两个网络相互指导,相互学习的作用;
Figure BDA0003359384440000041
Figure BDA0003359384440000042
Figure BDA0003359384440000043
Loss=Losscls+Lossdom+Lossml
可选的,在所述的基于相互局部对抗迁移学习的旋转机械故障诊断方法中,还包括同种数据集在不同工况下迁移:
基于第一假设、第二假设和第三假设,将从源域数据学到的诊断知识迁移到数据量不足的工况下,以改善诊断效果;
第一假设包括:不同工况下收集到的轴承或齿轮振动信号有差别;
第二假设包括:旋转机械运行处于变工况条件下;
第三假设包括:至少一种工况下收集到的数据量不足,其中一种工况下具有足够的标记数据作为源域数据;
不同工况下收集到的轴承或齿轮振动信号有差别包括负载不同和/或转速不同。
可选的,在所述的基于相互局部对抗迁移学习的旋转机械故障诊断方法中,还包括不同数据集之间迁移:
真实工业场景中故障很少发生,收集到的数据很少,难以训练出一个效果好的模型。这时可以收集实验室模拟的轴承数据及轴承诊断知识,采用轴承数据及轴承诊断知识识别工程场景中轴承的健康状态,以用于工程场景中的轴承故障诊断。
本发明的发明人经研究发现,在现有技术中的基于特征的方法主要包括:从源域和目标域中获取两者之间的域不变特征,主要有距离度量的方式和域对抗学习的方式,距离度量的方式如果两个域中的特征的距离度量越小,说明获取到了两者之间的域不变特征,域对抗学习的方式,如果学到的特征不能够让域判别器判别,说明获取到了两者之间的域不变特征。
但发明人洞察到,尽管目前基于特征的方法已经取得了很好的诊断效果,但是这种方式目标域数据中的标签信息并没有被充分利用,忽略了目标域数据中的标签信息,而仅仅使用源域的带标签数据训练会对迁移效果有一定影响。此外,现有的方法没有考虑到故障类别信息,在对齐特征时从全局的角度去对齐源域与目标域数据,会存在不同类别之间对齐偏差导致迁移效果不好的问题。因此,在本发明中,发明人结合了相互学习和局部对抗域适应的思想,设计了一种迁移学习故障诊断算法。
在本发明提供的基于相互局部对抗迁移学习的旋转机械故障诊断方法中,设计了一种新型的相互学习的网络结构来进行故障诊断,与传统的单个网络结构相比,其大大提高了模型的鲁棒性,每个网络在训练过程中不仅采用有标记的源域故障数据,还参考同伴网络的学习经验来进一步提升泛化能力。在整个过程中,两个网络之间不断分享学习经验,实现互相学习共同进步,另外,本发明还设计了多个局部对抗域分类器取代全局对抗域分类器,分别对齐每一个类别的源域和目标域特征,可以得到更好的相似特征,以得到更好的相似特征。综上所述,本发明通过以上方案,实现了一种基于相互局部对抗迁移学习的故障诊断方法,旨在解决真实工业场景中数据量不足的场景下,通过所提方法仍能取得一个良好的诊断效果。
本发明提供的基于相互局部对抗迁移学习的旋转机械故障诊断方法还具有以下优势:
1、不需要先验知识,完全通过神经网络自动学习域不变特征。
2、目标域是不需要标签的,该方法是不依赖于目标域标签的半监督算法,可以解决数据标记不足的问题。
3、采用两个网络相互学习的结构,两个分类模型可以同步推断目标域的标签分布来相互指导。该方法在训练过程中考虑到了目标域的标签信息也可以被利用,通过生成伪标签的方式同时利用源域目标域数据来训练分类器,要比同类方案中仅采用源域有标签数据训练得到的分类器更为鲁棒,解决了现有迁移学习故障诊断算法中目标域数据没有被充分利用的问题。
4、设计了多个局部对抗域分类器取代全局对抗域分类器,分别对齐每一个类别的源域和目标域特征,可以得到更好的相似特征,解决了源域域目标域相似特征对齐效果不好的问题。
5、为在故障标记数据不足或者完全无标记的故障数据这样的场景,提供了一种诊断效果良好的故障诊断算法。
6、相比较传统的单个网络结构的故障诊断算法,该方案由于两个网络相互指导,相互合作可以获得一个更为鲁棒的模型。
7、相比较一些迁移故障诊断算法从整体的角度来对齐源域与目标域特征,本发明针对故障的每一个类别分别来进行特征的对齐,大大的减小了负迁移的概率,从而提高了迁移效果。
附图说明
图1是本发明一实施例中的基于相互局部对抗迁移学习的旋转机械故障诊断方法示意图;
图2是本发明另一实施例中的基于相互局部对抗迁移学习的旋转机械故障诊断方法示意图。
具体实施方式
下面结合具体实施方式参考附图进一步阐述本发明。
应当指出,各附图中的各组件可能为了图解说明而被夸大地示出,而不一定是比例正确的。在各附图中,给相同或功能相同的组件配备了相同的附图标记。
在本发明中,除非特别指出,“布置在…上”、“布置在…上方”以及“布置在…之上”并未排除二者之间存在中间物的情况。此外,“布置在…上或上方”仅仅表示两个部件之间的相对位置关系,而在一定情况下、如在颠倒产品方向后,也可以转换为“布置在…下或下方”,反之亦然。
在本发明中,各实施例仅仅旨在说明本发明的方案,而不应被理解为限制性的。
在本发明中,除非特别指出,量词“一个”、“一”并未排除多个元素的场景。
在此还应当指出,在本发明的实施例中,为清楚、简单起见,可能示出了仅仅一部分部件或组件,但是本领域的普通技术人员能够理解,在本发明的教导下,可根据具体场景需要添加所需的部件或组件。另外,除非另行说明,本发明的不同实施例中的特征可以相互组合。例如,可以用第二实施例中的某特征替换第一实施例中相对应或功能相同或相似的特征,所得到的实施例同样落入本申请的公开范围或记载范围。
在此还应当指出,在本发明的范围内,“相同”、“相等”、“等于”等措辞并不意味着二者数值绝对相等,而是允许一定的合理误差,也就是说,所述措辞也涵盖了“基本上相同”、“基本上相等”、“基本上等于”。以此类推,在本发明中,表方向的术语“垂直于”、“平行于”等等同样涵盖了“基本上垂直于”、“基本上平行于”的含义。
另外,本发明的各方法的步骤的编号并未限定所述方法步骤的执行顺序。除非特别指出,各方法步骤可以以不同顺序执行。
以下结合附图和具体实施例对本发明提出的基于相互局部对抗迁移学习的旋转机械故障诊断方法作进一步详细说明。根据下面说明,本发明的优点和特征将更清楚。需说明的是,附图均采用非常简化的形式且均使用非精准的比例,仅用以方便、明晰地辅助说明本发明实施例的目的。
本发明的目的在于提供一种基于相互局部对抗迁移学习的旋转机械故障诊断方法,以解决现有的迁移学习故障诊断方法具迁移效果差,模型鲁棒性弱的问题。
为实现上述目的,本发明提供了一种基于相互局部对抗迁移学习的旋转机械故障诊断方法,包括:利用相互学习网络结构进行故障诊断,两个网络相互指导获得更为可靠的伪标签,使得目标域数据得以充分利用,从而提升模型效果及其鲁棒性;以及提供多个局部对抗域分类器以取代全局对抗域分类器,每个局部对抗域分类器分别对齐每一个类别的源域和目标域特征,以得到经改善的相似特征。
针对现有技术存在的问题,发明人巧妙的构思该方案能够同时克服多个技术问题,实现意想不到的技术效果,具体如图1所示:本发明提供的一种基于相互局部对抗迁移学习的旋转机械故障诊断方法,包括:利用相互学习网络结构进行故障诊断,两个网络相互指导获得更为可靠的伪标签,使得目标域数据得以充分利用,从而提升模型效果及其鲁棒性;以及提供多个局部对抗域分类器以取代全局对抗域分类器,每个局部对抗域分类器分别对齐每一个类别的源域和目标域特征,以得到经改善的相似特征。例如:
在本发明的一个实施例中,通过基于距离度量的域适应方式需要预先定义距离函数来学习源域与目标域的相似特征,如何选取合适的距离函数需要根据具体的任务来决定。采用对抗域适应的方式可以自动的学习源域与目标域的相似特征。现有的一些采用对抗域适应的方法是通过源域与目标域看成两个整体从全局的角度来对齐特征,没有考虑故障的类别,而本发明采用局部对抗域适应的方式考虑了故障的类别,只有源域和目标域相同类别的故障,才会去对齐特征,避免了不同类别故障之间的特征对齐;
现有的方法大多采用特征对齐的方式,忽略了目标域的标签信息,因为目标域是没有标签的。本发明采用相互学习的这样一种结构,通过为目标域数据预测一个可靠的伪标签,从而利用到目标域的标签信息,在两个网络相互学习,相互指导的过程中,逐步提高伪标签的可信度,从而充分利用源域和目标域数据来训练模型;
在本发明的一个实施例中,采用Wasserstein距离来最小化其中一个网络的标签分类器对目标域数据预测的伪标签与另一个网络的代理分类器目标域数据预测的伪标签两者之间的分布差异,来指导两个网络相互学习,Wasserstein距离相比KL散度、JS散度的优越性在于,即便两个分布没有重叠,Wasserstein距离仍然能够反映它们的远近。而JS散度在此情况下是常量2log2,KL散度可能无意义,避免了网络优化过程中的梯度消失问题。
因此,本发明的改进点主要在于:
首先:设计了相互学习的网络结构来进行故障诊断,与传统的单个网络结构相比,大大提高了模型的鲁棒性。每个网络在训练过程中不仅采用有标记的源域故障数据,还参考同伴网络的学习经验来进一步提升泛化能力。在整个过程中,两个网络之间不断分享学习经验,实现互相学习共同进步;
其次:设计了多个局部对抗域分类器取代全局对抗域分类器,分别对齐每一个类别的源域和目标域特征,可以得到更好的相似特征。
具体的,相互学习结构起作用的原因在于:类别概率估计蕴含了网络挖掘到的数据本质规律,可以体现数据的内在本质特性。单一的真值标签提供的信息仅包含样本是否属于某一类,但缺少不同类别之间的联系,而网络输出的类别概率估计则能够在一定程度上恢复该信息,因此网络之间进行类别概率估计交互可以传递学习到的数据分布特性,从而帮助网络改善泛化性能。所以本发明采用这样一种相互学习的结构互换每个网络传递学习到的数据分布特性,相互指导,相互学习,直到收敛。
在本发明的一个实施例中,采用Wasserstein距离来约束类别概率分布差异达到最小起到正则化作用。本发明将其中一个网络的类别概率传递给另一个网络时,本质上也是提供额外的类别先验约束,防止标签分类器过度拟合真值标签的0-1分布,有效降低过拟合发生概率。
在本发明的一个实施例中,代理分类器充当标签分类器和特征提取器之间的桥梁,确保它们使用目标域中的感知信息。代理分类器的另一个优点是,它们使标签分类器不必彼此对齐。传统相互学习结构用另一组的预测标签来指导每个组,但没有告诉他们如何获得这些伪标签,因此并不强迫他们获得非常相似的特征表示,也就是说两个网络可能获取到不相似的特征表示,可能会相互影响效果变差。代理分类器的结构告诉了对方要如何获得这些伪标签,每一步的预测值必须与对方的代理分类器的预测值的分布差异最小。
在本发明的一个实施例中,多个局部域判别器是进行不同类别故障数据分布的细粒度对齐,减小了负迁移的概率,因为对于一个目标域样本,它只与自己最相关的类别数据对齐,从而避免了判别结构在不同分布的错误对齐。
在本发明的一个实施例中,本发明主要包括3个模块,如图2所示,数据预处理模块、特征提取模块和域适应模块。数据预处理模块对旋转机械设备上收集到的振动信号做数据预处理;特征提取模块构建一个多层CNN卷积网络提取特征,通过设置不同的初始化参数提取不同尺度的特征;域适应模块设计了3个Loss函数来构成最终的Loss函数,分别是源域标签数据分类Softmax多分类Losscls,Softmax二分类域判别器Lossdom和相互学习结构的Lossml。通过最小化最终的Loss函数,训练可以得到源域与目标域的域不变特征,实现一个好的迁移学习故障诊断效果;其中Losscls为源域有标签数据的损失函数,因为这个损失函数是有监督的,可以保证整个模型是有效果的。
在本发明的一个实施例中,Lossdom由k个Softmax二分类域判别器组成,k为故障类别数,相比较传统的域对抗分类器是从全局的角度来对齐源域与目标域特征,考虑到不同故障类型的特征是不一样的,本发明采用多个局部域分类器来分别对齐每个类别的源域与目标域特征。
在本发明的一个实施例中,Lossml是采用Wasserstein距离来衡量网络1的代理分类器对伪标签的预测与网络2的标签分类器对伪标签的预测的分布差异,同理也采用Wasserstein距离来衡量网络2的代理分类器对伪标签的预测与网络2的标签分类器对伪标签的预测的分布差异。
Figure BDA0003359384440000111
Figure BDA0003359384440000112
Figure BDA0003359384440000113
Loss=Losscls+Lossdom+Lossml
在本发明的一个实施例中,进行同种数据集不同工况下迁移,不同工况下收集到的轴承或齿轮振动信号是有差别的,比如不同的负载,不同转速,考虑到旋转机械运行多处于变工况条件下,而有些工况下收集到的数据量可能不够,假如有其中一种工况下足够的标记数据,就可以把它作为源域数据,通过该方法将从源域数据学到的诊断知识迁移到数据量不足的工况下,也能取得一个好的诊断效果。
换言之,基于第一假设、第二假设和第三假设,将从源域数据学到的诊断知识迁移到数据量不足的工况下,以改善诊断效果;第一假设包括:不同工况下收集到的轴承或齿轮振动信号有差别;第二假设包括:旋转机械运行处于变工况条件下;第三假设包括:至少一种工况下收集到的数据量不足,其中一种工况下具有足够的标记数据作为源域数据;不同工况下收集到的轴承或齿轮振动信号有差别包括负载不同和/或转速不同。
在本发明的一个实施例中,进行不同数据集之间迁移,真实工业场景中故障很少发生,收集到的数据很少难以训练一个效果好的模型。这时可以采用实验室模拟收集到的轴承数据,来自实验室轴承的诊断知识可能有助于识别工程场景中轴承的健康状态,可以使用该方案用于工程场景中的轴承故障诊断。
综上所述,本发明提出了一种基于相互局部对抗迁移学习的故障诊断方法,旨在解决真实工业场景中数据量不足的场景下,通过所提方法仍能取得一个良好的诊断效果。本方案主要结合了相互学习和局部对抗域适应的思想,设计了一种迁移学习故障诊断算法。其优点包括:
1、不需要先验知识,完全通过神经网络自动学习域不变特征。
2、目标域是不需要标签的,该方法是不依赖于目标域标签的半监督算法,可以解决数据标记不足的问题。
3、采用两个网络相互学习的结构,两个分类模型可以同步推断目标域的标签分布来相互指导。该方法在训练过程中考虑到了目标域的标签信息也可以被利用,通过生成伪标签的方式同时利用源域目标域数据来训练分类器,要比同类方案中仅采用源域有标签数据训练得到的分类器更为鲁棒,解决了现有迁移学习故障诊断算法中目标域数据没有被充分利用的问题。
4、设计了多个局部对抗域分类器取代全局对抗域分类器,分别对齐每一个类别的源域和目标域特征,可以得到更好的相似特征,解决了源域与目标域相似特征对齐效果不好的问题。
5、为在故障标记数据不足或者完全无标记的故障数据这样的场景,提供了一种诊断效果良好的故障诊断算法。
6、相比较传统的单个网络结构的故障诊断算法,本发明的方案由于两个网络相互指导,相互合作可以获得一个更为鲁棒的模型。
7、相比较一些迁移故障诊断算法从整体的角度来对齐源域与目标域特征,本发明针对故障的每一个类别分别来进行特征的对齐,大大的减小了负迁移的概率,从而提高了迁移效果。
本发明提供了一种基于相互局部对抗迁移学习的旋转机械故障诊断方法,包括:考虑到目标域数据中隐含的标签信息没有被充分利用,设计了一种相互学习的网络结构来学习可靠的伪标签,进而使得没有标签的目标域数据得以充分利用,从而提高模型性能。相比于单个网络结构来比该模型的鲁棒性更好。考虑到忽略故障的类别信息直接从全局的角度来对齐源域与目标域数据可能会出现对齐偏差的问题,提供多个局部对抗域分类器取代全局对抗域分类器,每个局部对抗域分类器分别对齐每一个类别的源域和目标域特征,以得到更好的相似特征。
综上,上述实施例对基于相互局部对抗迁移学习的旋转机械故障诊断方法的不同构型进行了详细说明,当然,本发明包括但不局限于上述实施中所列举的构型,任何在上述实施例提供的构型基础上进行变换的内容,均属于本发明所保护的范围。本领域技术人员可以根据上述实施例的内容举一反三。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的***而言,由于与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
上述描述仅是对本发明较佳实施例的描述,并非对本发明范围的任何限定,本发明领域的普通技术人员根据上述揭示内容做的任何变更、修饰,均属于权利要求书的保护范围。

Claims (10)

1.一种基于相互局部对抗迁移学习的旋转机械故障诊断方法,其特征在于,包括:
利用相互学习网络结构进行故障诊断,两个网络相互指导获得更为可靠的伪标签,使得目标域数据得以充分利用,从而提升模型效果及其鲁棒性;
以及提供多个局部对抗域分类器以取代全局对抗域分类器,每个局部对抗域分类器分别对齐每一个类别的源域和目标域特征,以得到经改善的相似特征。
2.如权利要求1所述的基于相互局部对抗迁移学习的旋转机械故障诊断方法,其特征在于,其中利用相互学习网络结构进行故障诊断包括:
提供相互学习网络结构,相互学习网络结构包括至少两个网络,该至少两个网络之间互为同伴网络;
每个网络在训练过程中采用有标记的源域故障数据的同时,参考同伴网络的学习经验提升泛化能力;以及
两个网络之间分享学习经验,以进行互相学习,根据互相学习结果进行故障诊断。
3.如权利要求2所述的基于相互局部对抗迁移学习的旋转机械故障诊断方法,其特征在于,还包括:
类别概率估计具有网络提取到的数据本质规律,体现数据的内在本质特性;
相互学习结构进行类别概率估计交互使网络之间传递学习到的数据分布特性,从而使得网络改善泛化性能;以及
基于网络改善泛化性能,采用相互学习的结构互换每个网络传递学习到的数据分布特性,相互指导和学习直至收敛。
4.如权利要求3所述的基于相互局部对抗迁移学习的旋转机械故障诊断方法,其特征在于,还包括:
采用Wasserstein距离约束类别概率估计的分布差异达到最小,起到正则化的作用;
将其中一个网络的类别概率估计传递给另一个网络时,提供额外的类别先验约束,防止标签分类器过度拟合真值标签的0-1分布,有效降低过拟合发生概率。
5.如权利要求4所述的基于相互局部对抗迁移学习的旋转机械故障诊断方法,其特征在于,还包括:
代理分类器充当标签分类器和特征提取器之间的桥梁,确保代理分类器、标签分类器和特征提取器使用目标域中的标签信息;
代理分类器使两个标签分类器不必强制彼此对齐,避免让两个独立的网络彼此信服对方的预测结果,代理分类器在训练过程中将两个网络联通起来,起到一个交换两个网络学习到的信息的作用;以及
代理分类器的结构使得标签分类器和特征提取器之间执行以下动作:
指示对方如何获得伪标签,每一步的预测值必须与对方的代理分类器的预测值的分布差异最小,以避免传统相互学习结构由于没有指示如何获得伪标签,强制两个网络信服对方的预测结果,从而导致诊断效果不好的问题。
6.如权利要求5所述的基于相互局部对抗迁移学习的旋转机械故障诊断方法,其特征在于,还包括:
基于一个目标域样本只与自己最相关的类别数据对齐,多个局部域判别器进行不同类别故障数据分布的细粒度对齐,减小负迁移的概率,从而避免判别结构在不同分布的错误对齐。
7.如权利要求3所述的基于相互局部对抗迁移学习的旋转机械故障诊断方法,其特征在于,还包括:
数据预处理模块对旋转机械设备上收集到的振动信号做数据预处理;
特征提取模块构建一个多层CNN卷积网络提取特征,通过设置不同的初始化参数提取不同尺度的特征;
域适应模块设计3个Loss函数以构成最终的Loss函数,3个Loss函数包括源域标签数据分类Softmax多分类Losscls、Softmax二分类域判别器Lossdom和相互学习结构的Lossml;以及
通过最小化最终的Loss函数,训练得到源域与目标域的域不变特征,以改善迁移学习故障诊断效果;
其中Losscls为源域有标签数据的损失函数,基于损失函数有监督特性,保证整个模型的效果。
8.如权利要求7所述的基于相互局部对抗迁移学习的旋转机械故障诊断方法,其特征在于,还包括:
Lossdom由k个Softmax二分类域判别器组成,k为故障类别数,基于不同故障类型的特征不同,采用多个局部域分类器分别对齐每个类别的源域与目标域特征,以避免域对抗分类器从全局的角度对齐源域与目标域特征对齐出现偏差;
Lossml采用Wasserstein距离衡量网络1的代理分类器对伪标签的预测与网络2的标签分类器对伪标签的预测的分布差异,采用Wasserstein距离衡量网络2的代理分类器对伪标签的预测与网络2的标签分类器对伪标签的预测的分布差异,起到两个网络相互指导,相互学习的作用;
Figure FDA0003359384430000031
Figure FDA0003359384430000032
Figure FDA0003359384430000033
Loss=Losscls+Lossdom+Lossdml
9.如权利要求3所述的基于相互局部对抗迁移学习的旋转机械故障诊断方法,其特征在于,还包括同种数据集在不同工况下迁移:
基于第一假设、第二假设和第三假设,将从源域数据学到的诊断知识迁移到数据量不足的工况下,以改善诊断效果;
第一假设包括:不同工况下收集到的轴承或齿轮振动信号有差别;
第二假设包括:旋转机械运行处于变工况条件下;
第三假设包括:至少一种工况下收集到的数据量不足,其中一种工况下具有足够的标记数据作为源域数据;
不同工况下收集到的轴承或齿轮振动信号有差别包括负载不同和/或转速不同。
10.如权利要求3所述的基于相互局部对抗迁移学习的旋转机械故障诊断方法,其特征在于,还包括不同数据集之间迁移:
收集实验室模拟的轴承数据及轴承诊断知识,采用轴承数据及轴承诊断知识识别工程场景中轴承的健康状态,以用于工程场景中的轴承故障诊断。
CN202111362333.5A 2021-11-17 2021-11-17 基于相互局部对抗迁移学习的旋转机械故障诊断方法 Active CN114021285B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111362333.5A CN114021285B (zh) 2021-11-17 2021-11-17 基于相互局部对抗迁移学习的旋转机械故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111362333.5A CN114021285B (zh) 2021-11-17 2021-11-17 基于相互局部对抗迁移学习的旋转机械故障诊断方法

Publications (2)

Publication Number Publication Date
CN114021285A true CN114021285A (zh) 2022-02-08
CN114021285B CN114021285B (zh) 2024-04-12

Family

ID=80064692

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111362333.5A Active CN114021285B (zh) 2021-11-17 2021-11-17 基于相互局部对抗迁移学习的旋转机械故障诊断方法

Country Status (1)

Country Link
CN (1) CN114021285B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114580571A (zh) * 2022-04-01 2022-06-03 南通大学 一种基于迁移互学习的小样本电力设备图像分类方法
CN117367777A (zh) * 2023-11-15 2024-01-09 苏州大学 一种scara机器人滚珠丝杠故障诊断方法

Citations (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103868692A (zh) * 2014-03-18 2014-06-18 电子科技大学 基于核密度估计和k-l散度的旋转机械故障诊断方法
CN106813921A (zh) * 2016-12-24 2017-06-09 广东石油化工学院 一种旋转机械复合故障诊断方法
CN106980822A (zh) * 2017-03-14 2017-07-25 北京航空航天大学 一种基于选择性集成学习的旋转机械故障诊断方法
CN107817787A (zh) * 2017-11-29 2018-03-20 华南理工大学 一种基于机器学习的智能产线机械手故障诊断方法
CN109918999A (zh) * 2019-01-22 2019-06-21 西安交通大学 一种小样本数据下基于生成模型的机械设备故障智能诊断方法
CN109947086A (zh) * 2019-04-11 2019-06-28 清华大学 基于对抗学习的机械故障迁移诊断方法及***
CN110189278A (zh) * 2019-06-06 2019-08-30 上海大学 一种基于生成对抗网络的双目场景图像修复方法
CN110287837A (zh) * 2019-06-17 2019-09-27 上海大学 基于先验估计网络和空间约束混合模型的海面障碍物检测方法
CN110414383A (zh) * 2019-07-11 2019-11-05 华中科技大学 基于Wasserstein距离的卷积神经网络对抗迁移学习方法及其应用
CN110428004A (zh) * 2019-07-31 2019-11-08 中南大学 数据失衡下基于深度学习的机械零部件故障诊断方法
CN110751207A (zh) * 2019-10-18 2020-02-04 四川大学 基于深度卷积域对抗迁移学习的故障诊断方法
CN110907176A (zh) * 2019-09-30 2020-03-24 合肥工业大学 一种基于Wasserstein距离的深度对抗迁移网络的故障诊断方法
CN111060318A (zh) * 2020-01-09 2020-04-24 山东科技大学 一种基于深度对抗迁移网络的轴承故障诊断方法
CN111709448A (zh) * 2020-05-20 2020-09-25 西安交通大学 一种基于迁移关系网络的机械故障诊断方法
CN111860677A (zh) * 2020-07-29 2020-10-30 湖南科技大学 一种基于部分域对抗的滚动轴承迁移学习故障诊断方法
CN111898634A (zh) * 2020-06-22 2020-11-06 西安交通大学 一种基于深度对抗域自适应的智能故障诊断方法
CN112101085A (zh) * 2020-07-22 2020-12-18 西安交通大学 一种基于重要性加权域对抗自适应的智能故障诊断方法
CN112183581A (zh) * 2020-09-07 2021-01-05 华南理工大学 基于自适应迁移神经网络的半监督机械故障诊断方法
CN112906644A (zh) * 2021-03-22 2021-06-04 重庆大学 基于深度迁移学习的机械故障智能诊断方法
CN113076834A (zh) * 2021-03-25 2021-07-06 华中科技大学 旋转机械故障信息处理方法、处理***、处理终端、介质
CN113159126A (zh) * 2021-03-22 2021-07-23 河海大学 基于通用域适应的工业物联网设备故障诊断方法
CN113176776A (zh) * 2021-03-03 2021-07-27 上海大学 基于深度强化学习的无人艇天气自适应避障方法
CN113392881A (zh) * 2021-05-27 2021-09-14 重庆大学 一种基于迁移学习的旋转机械故障诊断方法
CN113505664A (zh) * 2021-06-28 2021-10-15 上海电力大学 一种风电机组行星齿轮箱故障诊断方法

Patent Citations (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103868692A (zh) * 2014-03-18 2014-06-18 电子科技大学 基于核密度估计和k-l散度的旋转机械故障诊断方法
CN106813921A (zh) * 2016-12-24 2017-06-09 广东石油化工学院 一种旋转机械复合故障诊断方法
CN106980822A (zh) * 2017-03-14 2017-07-25 北京航空航天大学 一种基于选择性集成学习的旋转机械故障诊断方法
CN107817787A (zh) * 2017-11-29 2018-03-20 华南理工大学 一种基于机器学习的智能产线机械手故障诊断方法
CN109918999A (zh) * 2019-01-22 2019-06-21 西安交通大学 一种小样本数据下基于生成模型的机械设备故障智能诊断方法
CN109947086A (zh) * 2019-04-11 2019-06-28 清华大学 基于对抗学习的机械故障迁移诊断方法及***
CN110189278A (zh) * 2019-06-06 2019-08-30 上海大学 一种基于生成对抗网络的双目场景图像修复方法
CN110287837A (zh) * 2019-06-17 2019-09-27 上海大学 基于先验估计网络和空间约束混合模型的海面障碍物检测方法
CN110414383A (zh) * 2019-07-11 2019-11-05 华中科技大学 基于Wasserstein距离的卷积神经网络对抗迁移学习方法及其应用
CN110428004A (zh) * 2019-07-31 2019-11-08 中南大学 数据失衡下基于深度学习的机械零部件故障诊断方法
CN110907176A (zh) * 2019-09-30 2020-03-24 合肥工业大学 一种基于Wasserstein距离的深度对抗迁移网络的故障诊断方法
CN110751207A (zh) * 2019-10-18 2020-02-04 四川大学 基于深度卷积域对抗迁移学习的故障诊断方法
CN111060318A (zh) * 2020-01-09 2020-04-24 山东科技大学 一种基于深度对抗迁移网络的轴承故障诊断方法
CN111709448A (zh) * 2020-05-20 2020-09-25 西安交通大学 一种基于迁移关系网络的机械故障诊断方法
CN111898634A (zh) * 2020-06-22 2020-11-06 西安交通大学 一种基于深度对抗域自适应的智能故障诊断方法
CN112101085A (zh) * 2020-07-22 2020-12-18 西安交通大学 一种基于重要性加权域对抗自适应的智能故障诊断方法
CN111860677A (zh) * 2020-07-29 2020-10-30 湖南科技大学 一种基于部分域对抗的滚动轴承迁移学习故障诊断方法
CN112183581A (zh) * 2020-09-07 2021-01-05 华南理工大学 基于自适应迁移神经网络的半监督机械故障诊断方法
CN113176776A (zh) * 2021-03-03 2021-07-27 上海大学 基于深度强化学习的无人艇天气自适应避障方法
CN112906644A (zh) * 2021-03-22 2021-06-04 重庆大学 基于深度迁移学习的机械故障智能诊断方法
CN113159126A (zh) * 2021-03-22 2021-07-23 河海大学 基于通用域适应的工业物联网设备故障诊断方法
CN113076834A (zh) * 2021-03-25 2021-07-06 华中科技大学 旋转机械故障信息处理方法、处理***、处理终端、介质
CN113392881A (zh) * 2021-05-27 2021-09-14 重庆大学 一种基于迁移学习的旋转机械故障诊断方法
CN113505664A (zh) * 2021-06-28 2021-10-15 上海电力大学 一种风电机组行星齿轮箱故障诊断方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SHAO, JIAJIE ET AL.: "Rotating machinery fault diagnosis by deep adversarial transfer learning based on subdomain adaptation", 《ADVANCES IN MECHANICAL ENGINEERING》, vol. 13, no. 8, 29 September 2021 (2021-09-29) *
彭艳;陈加宏;李小毛;罗均;谢少荣;刘畅;蒲华燕;: "时空上下文融合的无人艇海面目标跟踪", 中国科学:技术科学, no. 12, 23 November 2018 (2018-11-23) *
文成林;吕菲亚;: "基于深度学习的故障诊断方法综述", 电子与信息学报, no. 01, 15 January 2020 (2020-01-15) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114580571A (zh) * 2022-04-01 2022-06-03 南通大学 一种基于迁移互学习的小样本电力设备图像分类方法
CN117367777A (zh) * 2023-11-15 2024-01-09 苏州大学 一种scara机器人滚珠丝杠故障诊断方法

Also Published As

Publication number Publication date
CN114021285B (zh) 2024-04-12

Similar Documents

Publication Publication Date Title
Hao et al. An end-to-end architecture for class-incremental object detection with knowledge distillation
Jenssen et al. Intelligent monitoring and inspection of power line components powered by UAVs and deep learning
CN110907176B (zh) 一种基于Wasserstein距离的深度对抗迁移网络的故障诊断方法
CN114021285A (zh) 基于相互局部对抗迁移学习的旋转机械故障诊断方法
CN101907681B (zh) 基于gsd_svdd的模拟电路动态在线故障诊断方法
WO2019221965A1 (en) Unsupervised cross-domain distance metric adaptation with feature transfer network
CN114048568B (zh) 一种基于多源迁移融合收缩框架的旋转机械故障诊断方法
Maniat et al. Deep learning-based visual crack detection using Google Street View images
CN111368690A (zh) 基于深度学习的海浪影响下视频图像船只检测方法及***
CN113076994A (zh) 一种开集域自适应图像分类方法及***
Yang et al. Detecting 11k classes: Large scale object detection without fine-grained bounding boxes
CN115392326B (zh) 基于联合多模态信息与域对抗神经网络的调制识别方法
Li et al. A review of deep learning methods for pixel-level crack detection
CN114782752B (zh) 基于自训练的小样本图像集成分类方法及装置
Realpe et al. Multi-sensor fusion module in a fault tolerant perception system for autonomous vehicles
Khan et al. Learning safe recovery trajectories with deep neural networks for unmanned aerial vehicles
CN111898528B (zh) 数据处理方法、装置、计算机可读介质及电子设备
Katsamenis et al. Evaluating YOLO transferability limitation for road infrastructures monitoring
CN115630299A (zh) 基于联合域适应网络的旋转机械故障诊断方法及***
CN110378384A (zh) 一种结合特权信息和排序支持向量机的图像分类方法
Xue Computational diagnostic classification model using deep feedforward network based semi-supervised learning
Shen et al. Car plate detection based on Yolov3
CN114626406A (zh) 基于类边界特征检测的轴承故障诊断方法及***
Li et al. A Novel Semi-supervised Adaboost Technique Based on Improved Tri-training
CN112906796B (zh) 一种针对不确定性标记数据的医学图像分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant