CN112232252A - 基于最优输运的传动链无监督域适应故障诊断方法 - Google Patents

基于最优输运的传动链无监督域适应故障诊断方法 Download PDF

Info

Publication number
CN112232252A
CN112232252A CN202011152085.7A CN202011152085A CN112232252A CN 112232252 A CN112232252 A CN 112232252A CN 202011152085 A CN202011152085 A CN 202011152085A CN 112232252 A CN112232252 A CN 112232252A
Authority
CN
China
Prior art keywords
domain
sample
target domain
fault
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011152085.7A
Other languages
English (en)
Other versions
CN112232252B (zh
Inventor
刘朝华
蒋林博
王畅通
吴亮红
陈磊
张红强
李小花
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University of Science and Technology
Original Assignee
Hunan University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University of Science and Technology filed Critical Hunan University of Science and Technology
Priority to CN202011152085.7A priority Critical patent/CN112232252B/zh
Publication of CN112232252A publication Critical patent/CN112232252A/zh
Application granted granted Critical
Publication of CN112232252B publication Critical patent/CN112232252B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Signal Processing (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明公开了一种基于最优输运的传动链无监督域适应故障诊断方法,包括以下步骤:搭建传动链故障数据库;构造无监督域适应特征提取及分类模型;建立融合最优输运的无监督域适应故障诊断模型;将目标域数据送入训练好的特征提取器和softmax分类器,得到目标域数据的预测标签,并计算其分类精度。本发明将最优输运理论与域适应理论结合在一起,通过最小化故障源域和目标域特征和标签的距离来对齐特征空间和标签空间的分布,解决了故障诊断中的源域和目标域的域适应问题,提高了故障诊断的精度。

Description

基于最优输运的传动链无监督域适应故障诊断方法
技术领域
本发明涉及一种传动链故障诊断方法,特别涉及一种基于最优输运的传动链无监督域适应故障诊断方法。
背景技术
传动链在工业应用中起着重要的作用,是许多工业***的组成部分,如高铁、飞机、风电***等,但传动链往往容易发生故障。传动链的故障诊断对于确保***的安全运行、减少机器停机时间、节约维护成本至关重要。因此,传动链的故障诊断受到了广泛的关注,大量的故障诊断方法被提出。
故障诊断方法大致可以分为基于模型的方法和数据驱动的方法。早期故障诊断主要基于物理模型,它可以准确地描述故障与相关工业***之间的联系;但这种故障诊断方法主要有两个缺点:1)高度依赖于***的先验知识;2)工业运行过程中的干扰和对***的一些假设(如噪声的形式和***的工作条件)可能不合适,这些可能导致不确定性和误诊。数据驱动故障诊断方法直接对采集到的数据进行分析,使用信号处理、机器学习等技术,可以减少对***先验知识的依赖,更适合现代工业应用;比如Hilbert变换和小波变换被广泛用于故障特征分析上。虽然这些方法可以在故障诊断任务上取得良好的性能,但它们仍然面临着从初始故障信号中自动提取故障特征的挑战。而且,人工提取故障特征是非常耗时的。
近年来,深度学习在故障诊断领域的应用取得了很大进展,像深度堆栈网络和卷积神经网络,由于具有良好的自动提取特征能力,被用以解决故障诊断问题。现有的大多数方法都能准确地检测故障,但这些方法的成功是基于两个假设:1)有大量带标签的训练数据;2)源域的训练数据和目标域的测试数据分布相同。当违反这两个假设时,这些算法的性能可能会显著下降。但在实际的工业应用中,如风力发电***,由于工作环境的变化和负载转矩的不稳定,这些假设往往不能成立。并且,收集数据是非常耗时的,所以收集大量有标签的训练数据往往比较困难。人们还普遍意识到,从原始数据中训练出来的模型可能不太可靠。即使在一定的工作条件下可以获得标签数据,但数据分布可能会随着新的工作条件而改变。
域适应是解决数据不平衡或数据稀缺问题的有效方法,可以有效缓解数据分布差异的影响,显著提高分类器的性能。然而,现有基于域适应理论的故障诊断方法主要存在两个缺点:1)当源域和目标域的分布为多模态时,这些方法使用的概率度量不能代表源域和目标域之间的差异;2)仅在高维特征空间中考虑源域和目标域的差异,而往往忽略标签空间的差异,导致适应不够。最优输运(Optimal transport,OT)理论作为一个强大的工具,可以计算概率分布之间的距离。OT距离可以根据分布的样本直接计算,不需要进行密度估计或其他非参数方法。
发明内容
为了解决上述技术问题,本发明提供一种算法简单、诊断精度高的基于最优输运的传动链无监督域适应故障诊断方法。
本发明解决上述问题的技术方案是:一种基于最优输运的传动链无监督域适应故障诊断方法,包括以下步骤:
(1)搭建传动链故障数据库:采集传动链源域和目标域故障数据,有标签源域故障样本集为
Figure BDA0002739833410000031
其对应标签为
Figure BDA0002739833410000032
其中
Figure BDA0002739833410000033
为第m个源域故障样本,
Figure BDA0002739833410000034
Figure BDA0002739833410000035
对应的标签,s表示源域,m为源域样本总数;无标签目标域故障样本集为
Figure BDA0002739833410000036
其中
Figure BDA0002739833410000037
为第n个目标域故障样本,t表示目标域,n为目标域样本总数;源域故障样本集和目标域故障样本集共同构成传动链故障数据库;
(2)构造无监督域适应特征提取及分类模型:采用自动编码器作为特征提取器f,自动提取源域和目标域故障样本的特征,并使用源域样本训练softmax分类器g,从而得到目标域故障样本的预测标签,实现目标域故障样本的无监督域适应特征提取及分类模型的构造;
(3)建立融合最优输运的无监督域适应故障诊断模型:通过无监督域适应特征提取及分类模型处理源域和目标域故障样本,获得样本特征和相应标签;将特征提取器f和softmax分类器g融入到最优输运求解器的目标函数中,通过样本特征及标签计算输运规划矩阵γ,对齐源域和目标域的分布,并将源域标签信息输运到目标域;交替优化无监督域适应特征提取及分类模型与最优输运求解器,从而获得融合最优输运的无监督域适应故障诊断模型;
(4)将目标域数据送入训练好的特征提取器f和softmax分类器g,得到目标域数据的预测标签,并计算其分类精度。
上述基于最优输运的传动链无监督域适应故障诊断方法,所述步骤(2)中,采用自动编码器作为特征提取器f,自动提取源域和目标域故障样本的特征的具体过程为:
自动编码器通过一个函数hθ把输入数据x编码为代表性特征y;这个过程表示为:
y=hθ(x)=σ(Wx+b)
其中,θ表示编码部分的参数;W表示编码过程的权重矩阵,b表示编码过程的偏置向量;σ表示激活函数;
相应地,解码部分通过函数h′θ′把代表性特征重构回输入数据:
x′=h′θ′(y)=σ′(W′y+b′)
其中,θ′表示解码部分的参数,x′为重构的输入数据,W′表示解码过程的权重矩阵,b′表示解码过程的偏置向量,σ′表示解码过程的激活函数;
整个自动编码器网络的损失函数为:
Figure BDA0002739833410000041
其中,xρ和x′ρ分别表示第ρ个输入数据和解码器重构的输入数据,ρ=1,2,…,I,I为输入数据的个数,||x′ρ-xρ||2表示x′ρ-xρ的2-范数。
上述基于最优输运的传动链无监督域适应故障诊断方法,所述步骤(2)中,softmax分类器的功能是估计每个样本属于每个类别的概率,并将概率最高的类别作为样本的类别;
给定输入数据及对应标签{(x(1),y(1)),(x(2),y(2)),…,(x(τ),y(τ))},其中,x(τ)表示第τ个输入数据,y(τ)表示x(τ)对应的标签,且y(τ)∈{1,2,…,k},k表示标签的类别数;则输入数据x(τ)的标签概率
Figure BDA0002739833410000043
为:
Figure BDA0002739833410000042
其中,
Figure BDA00027398334100000514
表示softmax分类器的参数,T表示向量的转置,
Figure BDA0002739833410000051
表示对所有
Figure BDA0002739833410000052
求和,实现概率值的归一化;
Figure BDA0002739833410000053
表示第l个参数
Figure BDA00027398334100000515
的转置;
交叉熵损失被用作softmax分类器的损失函数
Figure BDA00027398334100000517
Figure BDA0002739833410000054
其中,1{表达式为真}=1,1{表达式为假}=0,y(α)为第α个输入数据x(α)的标签,α=1,2,…,τ,β表示第β类标签,β=1,2,…,k;
Figure BDA0002739833410000055
表示第β个参数
Figure BDA00027398334100000516
的转置。
上述基于最优输运的传动链无监督域适应故障诊断方法,所述步骤(3)中,最优输运求解器用来计算源域和目标域概率分布之间的距离,域适应问题看作是离散最优输运问题的特例;
设源域和目标域样本的边缘分布分别为μs和μt,则源域和目标域特征空间和标签空间的距离为:
Figure BDA0002739833410000056
其中,C(i,j)表示将概率质量从第i个源域样本特征和标签移到第j个目标域样本特征和标签的成本;C为成本矩阵,i=1,2,…,m,j=1,2,…,n;
Figure BDA0002739833410000057
表示第i个源域样本的特征;
Figure BDA0002739833410000058
表示第j个目标域样本的特征;η表示权衡参数;
Figure BDA0002739833410000059
表示计算源域和目标域样本特征之间的L2距离;
Figure BDA00027398334100000510
表示计算源域和目标域标签之间的交叉熵损失;
由于目标域样本没有对应标签,
Figure BDA00027398334100000511
不能被直接使用,因此用源域训练的softmax分类器g生成目标域样本特征的标签
Figure BDA00027398334100000512
即:
Figure BDA00027398334100000513
求解最优输运规划的目标函数为:
Figure BDA0002739833410000061
其中,∏={γ∈(R+)m×n|γ1n=μsT1m=μt}表示所有输运规划γ的集合;γ(i,j)为第i个源域样本特征和标签转移到第j个目标域样本特征和标签的概率质量;1n表示元素为1的n×1向量;1m表示元素为1的m×1向量;(R+)m×n表示维度为m×n的正实数矩阵;<·,·>表示求Frobenius点积;
输运规划的初始值γ0按以下方法计算:
Figure BDA0002739833410000062
其中,C0为将概率质量从源域样本移到目标域样本的成本矩阵,且
Figure BDA0002739833410000063
γ0(i,j)为第i个源域样本转移到第j个目标域样本的概率质量。
上述基于最优输运的传动链无监督域适应故障诊断方法,所述步骤(3)中,整个模型要优化的目标损失函数为:
Figure BDA0002739833410000064
其中,f′表示自动编码器的解码器,
Figure BDA0002739833410000065
Figure BDA0002739833410000066
分别表示将源域特征
Figure BDA0002739833410000067
Figure BDA0002739833410000068
解码为输入数据;Lf和Lg分别表示特征提取器f和softmax分类器g的损失函数;
使用协同下降算法交替求解目标损失函数:
当特征提取器f和softmax分类器g的参数固定时,目标损失函数写成:
Figure BDA0002739833410000071
上式是一个标准的线性规划问题,用网络单纯形流算法求解;
当输运规划γ固定时,目标损失函数写成:
Figure BDA0002739833410000072
采用Adam算法求解上式。
上述基于最优输运的传动链无监督域适应故障诊断方法,所述步骤(4)中,目标域样本标签的预测精度accuracy按下式计算:
Figure BDA0002739833410000073
其中,
Figure BDA0002739833410000074
为样本
Figure BDA0002739833410000075
预测的标签,
Figure BDA0002739833410000076
为对应的真标签;1{·}是一个二值函数,当
Figure BDA0002739833410000077
时,
Figure BDA0002739833410000078
为1;当
Figure BDA0002739833410000079
时,
Figure BDA00027398334100000710
为0。
本发明的有益效果在于:
1、本发明将AE网络作为特征提取器,以提取原始数据中具有代表性的特征,并用源域样本训练的softmax分类器来对目标域故障样本进行分类,实现了目标域样本的无监督故障诊断。
2、本发明将最优传输理论融于域适应问题中,通过对齐源域和目标域的特征空间和标签空间,将源域样本训练的特征提取器和softmax分类器用于目标域样本,提高了特征提取能力和故障诊断能力。
附图说明
图1为本发明的流程图。
图2为本发明自动编码器结构示意图。
图3为本发明最优输运问题示意图。
图4为本发明对比实验柱形图。
具体实施方式
下面结合附图和实施例对本发明作进一步的说明。
如图1所示,一种基于最优输运的传动链无监督域适应故障诊断方法,包括以下步骤:
(1)搭建传动链故障数据库:采集传动链源域和目标域故障数据,有标签源域故障样本集为
Figure BDA0002739833410000081
其对应标签为
Figure BDA0002739833410000082
其中
Figure BDA0002739833410000083
为第m个源域故障样本,
Figure BDA0002739833410000084
Figure BDA0002739833410000085
对应的标签,s表示源域,m为源域样本总数;无标签目标域故障样本集为
Figure BDA0002739833410000086
其中
Figure BDA0002739833410000087
为第n个目标域故障样本,t表示目标域,n为目标域样本总数。
(2)构造无监督域适应特征提取及分类模型:采用自动编码器作为特征提取器f,自动提取源域和目标域故障样本的特征,并使用源域样本训练softmax分类器g,从而得到目标域故障样本的预测标签,实现目标域故障样本的无监督域适应特征提取及分类。
自动编码器被用来学习更加紧凑的、具有类判别的样本特征,从而加速训练过程;
如图2所示,自动编码器通过一个函数hθ把输入数据x编码为代表性特征y。这个过程被表示为:
y=hθ(x)=σ(Wx+b)
其中,θ表示编码部分的参数。W表示编码过程的权重矩阵,b表示编码过程的偏置向量。σ表示激活函数;
相应地,解码部分通过函数h′θ′把代表性特征重构回输入数据:
x′=h′θ′(y)=σ′(W′y+b′)
其中,θ′表示解码部分的参数。x′为重构的输入数据。W′表示解码过程的权重矩阵,b′表示解码过程的偏置向量。σ′表示解码过程的激活函数;
整个自动编码器网络的损失函数为:
Figure BDA0002739833410000091
其中,xρ和x′ρ分别表示第ρ个输入数据和解码器重构的输入数据,ρ=1,2,…,I,I为输入数据的个数。||x′ρ-xρ||2表示x′ρ-xρ的2-范数;
softmax分类器是解决多分类问题最常见的算法。Softmax的主要功能是估计每个样本属于每个类别的概率,并将概率最高的类别作为样本的类别;
给定输入数据及对应标签{(x(1),y(1)),(x(2),y(2)),…,(x(τ),y(τ))}。其中,x(τ)表示第τ个输入数据,y(τ)表示x(τ)对应的标签,且y(τ)∈{1,2,…,k},k表示标签的类别数。则输入数据x(τ)的标签概率为:
Figure BDA0002739833410000092
其中,
Figure BDA0002739833410000093
表示softmax分类器的参数,T表示向量的转置,
Figure BDA0002739833410000101
表示对所有
Figure BDA0002739833410000102
求和,实现概率值的归一化。
Figure BDA0002739833410000103
表示第l个参数
Figure BDA0002739833410000104
的转置;
交叉熵损失被用作softmax分类器的损失函数:
Figure BDA0002739833410000105
其中,1{表达式为真}=1,1{表达式为假}=0。y(α)为第α个输入数据x(α)的标签,α=1,2,…,τ。β表示第β类标签,β=1,2,…,k。
Figure BDA0002739833410000106
表示第β个参数
Figure BDA0002739833410000107
的转置。
(3)建立融合最优输运的无监督域适应故障诊断模型:通过无监督域适应特征提取及分类模型处理源域和目标域故障样本,获得样本特征和相应标签;将特征提取器f和softmax分类器g融入到最优输运OT求解器的目标函数中,通过样本特征及标签计算输运规划矩阵γ,来对齐源域和目标域的分布,并将源域标签信息输运到目标域;交替优化无监督域适应特征提取及分类模型与OT求解器,从而获得融合最优输运的无监督域适应故障诊断模型。
最优输运OT被用来计算源域和目标域概率分布之间的距离。域适应问题可以看作是离散OT问题的特例;
如图3所示,设源域和目标域样本的边缘分布分别为μs和μt,则源域和目标域特征空间和标签空间的距离为:
Figure BDA0002739833410000108
其中,C(i,j)表示将概率质量从第i个源域样本特征和标签移到第j个目标域样本特征和标签的成本。C为成本矩阵,i=1,2,…,m,j=1,2,…,n。
Figure BDA0002739833410000109
表示第i个源域样本的特征。
Figure BDA00027398334100001010
表示第j个目标域样本的特征。η表示权衡参数。
Figure BDA00027398334100001011
表示计算源域和目标域样本特征之间的L2距离。
Figure BDA00027398334100001012
表示计算源域和目标域标签之间的交叉熵损失;
由于目标域样本没有对应标签,
Figure BDA0002739833410000111
不能被直接使用,因此用源域训练的softmax分类器g生成目标域样本特征的标签
Figure BDA0002739833410000112
即:
Figure BDA0002739833410000113
求解最优输运规划的目标函数为:
Figure BDA0002739833410000114
其中,∏={γ∈(R+)m×n|γ1n=μsT1m=μt},表示所有输运规划γ的集合。γ(i,j)为第i个源域样本特征和标签转移到第j个目标域样本特征和标签的概率质量。1n表示元素为1的n×1向量,1m表示元素为1的m×1向量。(R+)m×n表示维度为m×n的正实数矩阵。<·,·>表示求Frobenius点积;
输运规划的初始值γ0按以下方法计算:
Figure BDA0002739833410000115
其中,C0为将概率质量从源域样本移到目标域样本的成本矩阵,且
Figure BDA0002739833410000116
γ0(i,j)为第i个源域样本转移到第j个目标域样本的概率质量;
整个模型要优化的目标损失函数为:
Figure BDA0002739833410000117
其中,f′表示自动编码器的解码器,
Figure BDA0002739833410000118
Figure BDA0002739833410000119
分别表示将源域特征
Figure BDA0002739833410000121
Figure BDA0002739833410000122
解码为输入数据。Lf和Lg分别表示特征提取器f和softmax分类器g的损失函数;
使用协同下降算法交替求解目标损失函数。当特征提取器f和softmax分类器g的参数固定时,目标损失函数可写成:
Figure BDA0002739833410000123
上式是一个标准的线性规划问题,可以用网络单纯形流算法求解;
当输运规划γ固定时,目标损失函数可写成:
Figure BDA0002739833410000124
采用Adam算法求解上式。
(4)将目标域数据送入训练好的特征提取器f和softmax分类器g,得到目标域数据的预测标签,并计算其分类精度。
目标域样本标签的预测精度按下式计算:
Figure BDA0002739833410000125
其中,
Figure BDA0002739833410000126
为样本
Figure BDA0002739833410000127
预测的标签,
Figure BDA0002739833410000128
为对应的真标签。1{·}是一个二值函数,当
Figure BDA0002739833410000129
时,
Figure BDA00027398334100001210
为1;当
Figure BDA00027398334100001211
时,
Figure BDA00027398334100001212
为0。
为了验证本发明的有效性,本发明选取传动***中真实轴承故障数据进行验证。源域样本为一种负载状态下的正常和故障样本,并带有标签。而目标域样本为另一种状态下的正常和故障样本,且无任何标签。电机负载有四种,分别为0hp、1hp、2hp和3hp,并组成6种交叉域进行实验验证:0-1hp、0-2hp、0-3hp、1-2hp、1-3hp和2-3hp。故障直径为0.007英寸和0.014英寸。实验选取支持向量机SVM、K-近邻、softmax分类器、反向传播神经网络BP、迁移成分分析TCA、联合分布适配JDA以及关联对齐方法CORAL等方法,与本发明所述方法进行对比实验。实验结果如图4所示,本发明所述方法能实现多种工况下的轴承故障诊断,且精度高于其他对比方法。
综上所述,本发明所述基于最优输运的传动链无监督域适应故障诊断方法通过最小化源域和目标域故障特征空间和标签空间的距离,来对齐源域和目标域的分布,更好地提取了目标域样本深度特征,保证源域训练的标签分类器能被很好地用于目标域数据,实现了目标域无监督域适应标签预测,提高了故障诊断的精度。

Claims (6)

1.一种基于最优输运的传动链无监督域适应故障诊断方法,其特征在于:包括以下步骤:
(1)搭建传动链故障数据库:采集传动链源域和目标域故障数据,有标签源域故障样本集为
Figure FDA0002739833400000011
其对应标签为
Figure FDA0002739833400000012
其中
Figure FDA0002739833400000013
为第m个源域故障样本,
Figure FDA0002739833400000014
Figure FDA0002739833400000015
对应的标签,s表示源域,m为源域样本总数;无标签目标域故障样本集为
Figure FDA0002739833400000016
其中
Figure FDA0002739833400000017
为第n个目标域故障样本,t表示目标域,n为目标域样本总数;源域故障样本集和目标域故障样本集共同构成传动链故障数据库;
(2)构造无监督域适应特征提取及分类模型:采用自动编码器作为特征提取器f,自动提取源域和目标域故障样本的特征,并使用源域样本训练softmax分类器g,从而得到目标域故障样本的预测标签,实现目标域故障样本的无监督域适应特征提取及分类模型的构造;
(3)建立融合最优输运的无监督域适应故障诊断模型:通过无监督域适应特征提取及分类模型处理源域和目标域故障样本,获得样本特征和相应标签;将特征提取器f和softmax分类器g融入到最优输运求解器的目标函数中,通过样本特征及标签计算输运规划矩阵γ,对齐源域和目标域的分布,并将源域标签信息输运到目标域;交替优化无监督域适应特征提取及分类模型与最优输运求解器,从而获得融合最优输运的无监督域适应故障诊断模型;
(4)将目标域数据送入训练好的特征提取器f和softmax分类器g,得到目标域数据的预测标签,并计算其分类精度。
2.根据权利要求1所述的基于最优输运的传动链无监督域适应故障诊断方法,其特征在于:所述步骤(2)中,采用自动编码器作为特征提取器f,自动提取源域和目标域故障样本的特征的具体过程为:
自动编码器通过一个函数hθ把输入数据x编码为代表性特征y;这个过程表示为:
y=hθ(x)=σ(Wx+b)
其中,θ表示编码部分的参数;W表示编码过程的权重矩阵,b表示编码过程的偏置向量;σ表示激活函数;
相应地,解码部分通过函数h′θ′把代表性特征重构回输入数据:
x′=h′θ′(y)=σ′(W′y+b′)
其中,θ′表示解码部分的参数,x′为重构的输入数据,W′表示解码过程的权重矩阵,b′表示解码过程的偏置向量,σ′表示解码过程的激活函数;
整个自动编码器网络的损失函数为:
Figure FDA0002739833400000021
其中,xρ和x′ρ分别表示第ρ个输入数据和解码器重构的输入数据,ρ=1,2,…,I,I为输入数据的个数,||x′ρ-xρ||2表示x′ρ-xρ的2-范数。
3.根据权利要求2所述的基于最优输运的传动链无监督域适应故障诊断方法,其特征在于:所述步骤(2)中,softmax分类器的功能是估计每个样本属于每个类别的概率,并将概率最高的类别作为样本的类别;
给定输入数据及对应标签{(x(1),y(1)),(x(2),y(2)),…,(x(τ),y(τ))},其中,x(τ)表示第τ个输入数据,y(τ)表示x(τ)对应的标签,且y(τ)∈{1,2,…,k},k表示标签的类别数;则输入数据x(τ)的标签概率
Figure FDA0002739833400000022
为:
Figure FDA0002739833400000031
其中,
Figure FDA00027398334000000312
表示softmax分类器的参数,T表示向量的转置,
Figure FDA0002739833400000032
表示对所有
Figure FDA0002739833400000033
求和,实现概率值的归一化;
Figure FDA0002739833400000034
表示第l个参数
Figure FDA00027398334000000313
的转置;
交叉熵损失被用作softmax分类器的损失函数
Figure FDA00027398334000000314
Figure FDA0002739833400000035
其中,1{表达式为真}=1,1{表达式为假}=0,y(α)为第α个输入数据x(α)的标签,α=1,2,…,τ,β表示第β类标签,β=1,2,…,k;
Figure FDA0002739833400000036
表示第β个参数
Figure FDA00027398334000000315
的转置。
4.根据权利要求3所述的基于最优输运的传动链无监督域适应故障诊断方法,其特征在于:所述步骤(3)中,最优输运求解器用来计算源域和目标域概率分布之间的距离,域适应问题看作是离散最优输运问题的特例;
设源域和目标域样本的边缘分布分别为μs和μt,则源域和目标域特征空间和标签空间的距离为:
Figure FDA0002739833400000037
其中,C(i,j)表示将概率质量从第i个源域样本特征和标签移到第j个目标域样本特征和标签的成本;C为成本矩阵,i=1,2,…,m,j=1,2,…,n;
Figure FDA0002739833400000038
表示第i个源域样本的特征;
Figure FDA0002739833400000039
表示第j个目标域样本的特征;η表示权衡参数;
Figure FDA00027398334000000310
表示计算源域和目标域样本特征之间的L2距离;
Figure FDA00027398334000000311
表示计算源域和目标域标签之间的交叉熵损失;
由于目标域样本没有对应标签,
Figure FDA0002739833400000041
不能被直接使用,因此用源域训练的softmax分类器g生成目标域样本特征的标签
Figure FDA0002739833400000042
即:
Figure FDA0002739833400000043
求解最优输运规划的目标函数为:
Figure FDA0002739833400000044
其中,
Figure FDA0002739833400000045
表示所有输运规划γ的集合;γ(i,j)为第i个源域样本特征和标签转移到第j个目标域样本特征和标签的概率质量;1n表示元素为1的n×1向量;1m表示元素为1的m×1向量;(R+)m×n表示维度为m×n的正实数矩阵;<·,·>表示求Frobenius点积;
输运规划的初始值γ0按以下方法计算:
Figure FDA0002739833400000046
其中,C0为将概率质量从源域样本移到目标域样本的成本矩阵,且
Figure FDA0002739833400000047
γ0(i,j)为第i个源域样本转移到第j个目标域样本的概率质量。
5.根据权利要求4所述的基于最优输运的传动链无监督域适应故障诊断方法,其特征在于:所述步骤(3)中,整个模型要优化的目标损失函数为:
Figure FDA0002739833400000048
其中,f′表示自动编码器的解码器,
Figure FDA0002739833400000051
Figure FDA0002739833400000052
分别表示将源域特征
Figure FDA0002739833400000053
Figure FDA0002739833400000054
解码为输入数据;Lf和Lg分别表示特征提取器f和softmax分类器g的损失函数;
使用协同下降算法交替求解目标损失函数:
当特征提取器f和softmax分类器g的参数固定时,目标损失函数写成:
Figure FDA0002739833400000055
上式是一个标准的线性规划问题,用网络单纯形流算法求解;
当输运规划γ固定时,目标损失函数写成:
Figure FDA0002739833400000056
采用Adam算法求解上式。
6.根据权利要求5所述的基于最优输运的传动链无监督域适应故障诊断方法,其特征在于:所述步骤(4)中,目标域样本标签的预测精度accuracy按下式计算:
Figure FDA0002739833400000057
其中,
Figure FDA0002739833400000058
为样本
Figure FDA0002739833400000059
预测的标签,
Figure FDA00027398334000000510
为对应的真标签;1{·}是一个二值函数,当
Figure FDA00027398334000000511
时,
Figure FDA00027398334000000512
为1;当
Figure FDA00027398334000000513
时,
Figure FDA00027398334000000514
为0。
CN202011152085.7A 2020-10-23 2020-10-23 基于最优输运的传动链无监督域适应故障诊断方法 Active CN112232252B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011152085.7A CN112232252B (zh) 2020-10-23 2020-10-23 基于最优输运的传动链无监督域适应故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011152085.7A CN112232252B (zh) 2020-10-23 2020-10-23 基于最优输运的传动链无监督域适应故障诊断方法

Publications (2)

Publication Number Publication Date
CN112232252A true CN112232252A (zh) 2021-01-15
CN112232252B CN112232252B (zh) 2023-12-01

Family

ID=74109601

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011152085.7A Active CN112232252B (zh) 2020-10-23 2020-10-23 基于最优输运的传动链无监督域适应故障诊断方法

Country Status (1)

Country Link
CN (1) CN112232252B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112784920A (zh) * 2021-02-03 2021-05-11 湖南科技大学 云边端协同的旋转部件对抗域自适应故障诊断方法
CN112990259A (zh) * 2021-02-04 2021-06-18 西交利物浦大学 基于改进迁移学习的旋转机械轴承的早期故障诊断方法
CN113822228A (zh) * 2021-10-27 2021-12-21 南京大学 一种基于持续学习的用户表情识别方法和***
WO2023044978A1 (zh) * 2021-09-27 2023-03-30 苏州大学 基于对抗流模型的机械设备无监督故障诊断方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109376620A (zh) * 2018-09-30 2019-02-22 华北电力大学 一种风电机组齿轮箱故障的迁移诊断方法
CN109580215A (zh) * 2018-11-30 2019-04-05 湖南科技大学 一种基于深度生成对抗网络的风电传动***故障诊断方法
CN109902393A (zh) * 2019-03-01 2019-06-18 哈尔滨理工大学 一种基于深层特征和迁移学习的变工况下滚动轴承故障诊断方法
US20190325861A1 (en) * 2018-04-18 2019-10-24 Maneesh Kumar Singh Systems and Methods for Automatic Speech Recognition Using Domain Adaptation Techniques
CN110837850A (zh) * 2019-10-23 2020-02-25 浙江大学 一种基于对抗学习损失函数的无监督域适应方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190325861A1 (en) * 2018-04-18 2019-10-24 Maneesh Kumar Singh Systems and Methods for Automatic Speech Recognition Using Domain Adaptation Techniques
CN109376620A (zh) * 2018-09-30 2019-02-22 华北电力大学 一种风电机组齿轮箱故障的迁移诊断方法
CN109580215A (zh) * 2018-11-30 2019-04-05 湖南科技大学 一种基于深度生成对抗网络的风电传动***故障诊断方法
CN109902393A (zh) * 2019-03-01 2019-06-18 哈尔滨理工大学 一种基于深层特征和迁移学习的变工况下滚动轴承故障诊断方法
CN110837850A (zh) * 2019-10-23 2020-02-25 浙江大学 一种基于对抗学习损失函数的无监督域适应方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
金余丰;刘晓锋;姚美常;黄凤良;: "基于域对抗迁移的变工况滚动轴承故障诊断模型", 自动化仪表, no. 12, pages 55 - 60 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112784920A (zh) * 2021-02-03 2021-05-11 湖南科技大学 云边端协同的旋转部件对抗域自适应故障诊断方法
CN112784920B (zh) * 2021-02-03 2024-02-13 湖南科技大学 云边端协同的旋转部件对抗域自适应故障诊断方法
CN112990259A (zh) * 2021-02-04 2021-06-18 西交利物浦大学 基于改进迁移学习的旋转机械轴承的早期故障诊断方法
CN112990259B (zh) * 2021-02-04 2023-12-26 西交利物浦大学 基于改进迁移学习的旋转机械轴承的早期故障诊断方法
WO2023044978A1 (zh) * 2021-09-27 2023-03-30 苏州大学 基于对抗流模型的机械设备无监督故障诊断方法
CN113822228A (zh) * 2021-10-27 2021-12-21 南京大学 一种基于持续学习的用户表情识别方法和***
CN113822228B (zh) * 2021-10-27 2024-03-22 南京大学 一种基于持续学习的用户表情识别方法和***

Also Published As

Publication number Publication date
CN112232252B (zh) 2023-12-01

Similar Documents

Publication Publication Date Title
CN112232252B (zh) 基于最优输运的传动链无监督域适应故障诊断方法
CN110209823B (zh) 一种多标签文本分类方法及***
Li et al. Confidence-based active learning
CN110705607A (zh) 一种基于循环重标注自助法的行业多标签降噪方法
CN116911929B (zh) 基于大数据的广告服务终端及方法
CN112560948B (zh) 数据偏差下的眼底图分类方法及成像方法
CN116929815A (zh) 基于物联网的设备工作状态监测***及其方法
CN116910013A (zh) 基于语义流图挖掘的***日志异常检测方法
CN114299326A (zh) 一种基于转换网络与自监督的小样本分类方法
CN116304905A (zh) 一种在多负载工况下的永磁同步电机退磁故障诊断方法
CN117333146A (zh) 基于人工智能的人力资源管理***及方法
CN114881173A (zh) 基于自注意力机制的简历分类方法和装置
CN114943233A (zh) 一种基于并行化改进的Transformer-CRF网络的实体命名识别方法
CN114780767A (zh) 一种基于深度卷积神经网络的大规模图像检索方法及***
CN111177010A (zh) 一种软件缺陷严重程度识别方法
Yang et al. Label propagation algorithm based on non-negative sparse representation
Li et al. Dual-source gramian angular field method and its application on fault diagnosis of drilling pump fluid end
CN112949097A (zh) 一种基于深度迁移学习的轴承剩余寿命预测模型和方法
CN116610846A (zh) 用于牛养殖的配种筛选方法及其***
Passalis et al. Deep temporal logistic bag-of-features for forecasting high frequency limit order book time series
CN109978013B (zh) 一种用于人物动作识别的深度聚类方法
CN116777183A (zh) 无人船集群智能调度方法及***
CN116502123A (zh) 一种航空发动机剩余使用寿命无监督跨域预测方法
Brønstad Data-driven detection and identification of undesirable events in subsea oil wells
CN115374943A (zh) 一种基于域对抗迁移网络的数据认知计算方法及其***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant