CN115952442A - 基于全局鲁棒加权的联邦域泛化故障诊断方法及*** - Google Patents

基于全局鲁棒加权的联邦域泛化故障诊断方法及*** Download PDF

Info

Publication number
CN115952442A
CN115952442A CN202310218371.6A CN202310218371A CN115952442A CN 115952442 A CN115952442 A CN 115952442A CN 202310218371 A CN202310218371 A CN 202310218371A CN 115952442 A CN115952442 A CN 115952442A
Authority
CN
China
Prior art keywords
model
domain
global
client
local
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310218371.6A
Other languages
English (en)
Other versions
CN115952442B (zh
Inventor
宋艳
从霄
李沂滨
贾磊
王代超
崔明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN202310218371.6A priority Critical patent/CN115952442B/zh
Publication of CN115952442A publication Critical patent/CN115952442A/zh
Application granted granted Critical
Publication of CN115952442B publication Critical patent/CN115952442B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

本发明属于故障诊断领域,提供一种基于全局鲁棒加权的联邦域泛化故障诊断方法及***,包括每个所述源域客户端利用本地源域训练数据集训练接收到全局模型,并更新参数以形成新的本地模型;源域客户端将更新后的本地模型、提取的网络特征以及标签发送给中心服务器;中心服务器基于提取的网络特征,以不同分类器对不同特征的分类结果为性能度量,并以分类损失计算权重进行模型聚合;中心服务器将聚合后的全局模型发送到目标域客户端进行故障诊断。本发明的全局鲁棒加权策略在进行本地模型聚合时,不同本地模型的分类网络对不同本地模型的特征提取网络提取的特征进行分类,每个本地模型在进行聚合时的权重与分类结果有直接关系。

Description

基于全局鲁棒加权的联邦域泛化故障诊断方法及***
技术领域
本发明属于故障诊断技术领域,具体涉及一种基于全局鲁棒加权的联邦域泛化故障诊断方法及***。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
随着工业数据数量日益增加,数据驱动的故障诊断方法得到了迅速发展。来自不同工况、不同设备之间的数据分布可能存在差异,这意味着不能保证仅依靠海量数据的堆积便能够训练出一个高鲁棒性的优秀模型,这便是迁移学习方法旨在解决的问题。
迁移学习可用于解决训练数据和测试数据存在特征空间差异的问题。域适应和域泛化是迁移学习中常用的两类方法。在域适应方法中,解决域偏移的中心思想是将源域数据和目标域数据进行特征空间对齐或对抗训练,这也就意味着在整个域适应方法的训练过程中,仍需要获取部分目标域的数据来进行上述操作。与域适应方法相比,域泛化并不需要获取目标域的任何信息,域泛化方法训练的模型可用于目标域数据不可见的情况。域泛化方法旨在综合利用多个源域之间的丰富信息以训练一个对未知测试数据具有强泛化性能力的模型,与域适应方法相比,域泛化方法更贴合实际状况下的故障诊断。近年来,域泛化的智能故障诊断方法已被广泛研究。现有技术中提出了一种对抗性相互信息引导的机械故障诊断单域泛化网络,并设计了故障诊断实验验证了其方法的可行性。还提出了一种对比域泛化方法,该方法通过最大化域相同信息,同时最小化域不同信息以提高训练模型的分类准确率。结合先验诊断知识和深度域泛化网络的故障诊断方案,从源域学习具有判别性和域不变的故障特征,并将所学知识泛化用于识别未见过的目标样本。
工业大数据为数据驱动故障诊断提供大量的样本训练数据。然而,随着人们对用户隐私和数据安全的关注度不断提高,聚合不同企业的工业数据训练深度学***均,通过不同源域和目标域之间的距离差异提出了一种加权策略,并进行了故障诊断实验。
然而目前现有的工作都只关注于提高模型在内部客户端的性能,而忽略了模型对联邦外不可见域的泛化能力。这是阻碍FL模型在实际应用中广泛应用的一个关键问题。
发明内容
为了解决上述问题,本发明提出了一种基于全局鲁棒加权的联邦域泛化故障诊断方法及***,本发明整个训练以及测试过程中只有模型的相关参数以及提取的客户端数据特征在客户端和中心服务器中间进行交互,而没有本地数据直接的直接传输,最大程度上保护用户的数据隐私。同时在整个过程中,只最大程度利用多个包含丰富信息的源域数据集,并不对目标域数据集进行任何额外操作。本发明的提出了一种全局鲁棒加权策略,提出了一种以特征提取网络提取的特征作为信息传递介质,不同分类器对不同特征的分类结果为性能度量,并以分类损失计算权重的加权策略。在中心服务器对客户端模型聚合过程中,给予表现优异的模型更高的权重,限制那些表现差的模型,以提高聚合后模型的泛化能力和分类准确率。同时,引入最大均值差异(MMD)作为损失项减小不同源域数据之间的偏差,进一步提高模型的性能。
根据一些实施例,本发明的第一方案提供了一种基于全局鲁棒加权的联邦域泛化故障诊断方法,采用如下技术方案:
基于全局鲁棒加权的联邦域泛化故障诊断方法,包括:
中心服务器初始化全局模型并将其发送给所有源域客户端;
每个所述源域客户端利用本地源域训练数据集训练接收到全局模型,并更新参数以形成新的本地模型;
所述源域客户端将更新后的本地模型、提取的网络特征以及标签发送给中心服务器;
所述中心服务器基于提取的网络特征,以不同分类器对不同特征的分类结果为性能度量,并以分类损失计算权重进行模型聚合;
所述中心服务器将聚合后的全局模型发送到目标域客户端进行故障诊断。
根据一些实施例,本发明的第二方案提供了一种基于全局鲁棒加权的联邦域泛化故障诊断***,采用如下技术方案:
基于全局鲁棒加权的联邦域泛化故障诊断***,包括:
中心服务器、多个源域客户端以及目标客户端;
所述中心服务器初始化全局模型并将其发送给所有源域客户端;
每个所述源域客户端利用本地源域训练数据集训练接收到全局模型,并更新参数以形成新的本地模型;
所述源域客户端将更新后的本地模型、提取的网络特征以及标签发送给中心服务器;
所述中心服务器基于提取的网络特征,以不同分类器对不同特征的分类结果为性能度量,并以分类损失计算权重进行模型聚合;
所述中心服务器将聚合后的全局模型发送到目标域客户端进行故障诊断。
根据一些实施例,本发明的第三方案提供了一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一个方面所述的基于全局鲁棒加权的联邦域泛化故障诊断方法中的步骤。
根据一些实施例,本发明的第四方案提供了一种计算机设备。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述第一个方面所述的基于全局鲁棒加权的联邦域泛化故障诊断方法中的步骤。
与现有技术相比,本发明的有益效果为:
本发明针对目前跨域故障诊断方法存在数据泄露这一问题,提出了一种适用于不同工况下分布式训练的全局鲁棒加权联邦域泛化智能故障诊断方法,在源域数据之间不可互通、目标域数据和标签不可见的条件下,通过充分利用多个源域的丰富信息,以特征提取网络结果作为信息传递介质,以分类器对不同源域特征的分类结果作为性能度量。在模型聚合时执行全局鲁棒加权策略以提高全局模型的泛化能力,同时引入了最大均值差异(MMD)限制源域特征之间的距离,进一步提高了本地模型和全局模型的分类性能。
本发明提出了一种在中心服务器实现的模型全局鲁棒加权策略,用于提高全局模型泛化能力,该全局鲁棒加权策略在进行本地模型聚合时,不同本地模型的分类网络对不同本地模型的特征提取网络提取的特征进行分类,每个本地模型在进行聚合时的权重与分类结果有直接关系。由于最终的权重与每个本地模型的最终分类结果直接相联系,分类正确率高的模型有更大的加权权重值,可以更快的得到对所有客户端都有效的全局模型。除此之外,本发明提出的方法在Paderborn数据集上设计了多个任务并且都取得了优异的成绩,进一步印证了本发明可以训练出具有出色的泛化能力的故障诊断模型,证明提出的全局鲁棒加权策略的有效性。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1是本发明实施例所述的基于全局鲁棒加权的联邦域泛化故障诊断方法流程图;
图2是本发明实施例所述的全局鲁棒加权策略训练流程图;
图3是本发明实施例所述的源域客户端中的网络模型结构图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例一
如图1所示,本实施例提供了一种基于全局鲁棒加权的联邦域泛化故障诊断方法,本实施例以该方法应用于服务器进行举例说明,可以理解的是,该方法也可以应用于终端,还可以应用于包括终端和服务器和***,并通过终端和服务器的交互实现。服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务器、云通信、中间件服务、域名服务、安全服务CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。本实施例中,该方法包括以下步骤:
中心服务器初始化全局模型并将其发送给所有源域客户端;
每个所述源域客户端利用本地源域训练数据集训练接收到全局模型,并更新参数以形成新的本地模型;
所述源域客户端将更新后的本地模型、提取的网络特征以及标签发送给中心服务器;
所述中心服务器基于提取的网络特征,以不同分类器对不同特征的分类结果为性能度量,并以分类损失计算权重进行模型聚合;
所述中心服务器将聚合后的全局模型发送到目标域客户端进行故障诊断。
其中,所述每个所述源域客户端利用本地源域训练数据集训练接收到全局模型,并更新参数以形成新的本地模型,具体为:
步骤1:模型下载;假设有 N个源域数据集
Figure SMS_1
,拥有这些数据集的源客户端分别表示为
Figure SMS_2
;每个客户端在开始时将全局模型下载并作为本地模型;
步骤2:前向传播;每个客户端进行前向传播,提取源域数据集的特征
Figure SMS_3
并计算
Figure SMS_4
;其中,
Figure SMS_5
代表本地客户端模型 k的分类损失;
步骤3:计算
Figure SMS_6
;由于源域数据集仅在本地模型中可见,因此在计算
Figure SMS_7
的过程中,从每个源域数据集中提取的特征需要传递到中心服务器上;考虑到域泛化问题中往往存在多个源域而不是两个源域,定义
Figure SMS_8
为:
Figure SMS_9
Figure SMS_10
其中,
Figure SMS_11
Figure SMS_12
分别代表第 st个客户端上的源域数据集,
Figure SMS_13
Figure SMS_14
分别代表第 st个客户端上的源域数据集在第 T个epoch时特征提取网络提取到的第 f 1f 2个特征, N代表总的源域客户端的个数,a、b分别代表
Figure SMS_15
Figure SMS_16
的个数。
步骤4:反向传播;
Figure SMS_17
由每个客户端下载,并按照如下公式计算
Figure SMS_18
以进行后续的本地模型反向传播;
Figure SMS_19
其中, α
Figure SMS_20
的参数,在本文中,
Figure SMS_21
Figure SMS_22
是客户端 k的本地模型损失值, k为客户端序号, T为第 T个epoch,
Figure SMS_23
的作用是约束多个源域之间的距离;
计算完成后,对本地源域客户端模型进行反向传播,得到参数更新后的本地客户端模型
Figure SMS_24
所述
Figure SMS_25
代表本地客户端模型k的分类损失,具体为:
Figure SMS_26
其中,
Figure SMS_27
代表数据样本 j的真实标签,而
Figure SMS_28
是模型的预测结果。
所述中心服务器基于提取的网络特征,以不同分类器对不同特征的分类结果为性能度量,并以分类损失计算权重进行模型聚合,具体为:
基于更新参数后的模型、特征及其对应的标签上传到中心服务器,以计算每个模型的全局鲁棒权重;
在获得每个客户端的全局鲁棒权重后,进行模型聚合,得到聚合后的全局模型。
所述全局鲁棒权重,具体为:
Figure SMS_29
Figure SMS_30
其中,
Figure SMS_32
为特征个数,
Figure SMS_35
是第 i个客户端的本地模型对第 l个本地客户端提取特征的分类损失,当只有两个客户端时,所有
Figure SMS_37
项均与每个客户端都有关,此时以
Figure SMS_33
为模型的性能度量进行加权;由于此时仅有两个客户端,故此时
Figure SMS_36
Figure SMS_38
是特征
Figure SMS_39
的真实标签,
Figure SMS_31
是第 p个模型的分类器对特征
Figure SMS_34
的分类结果, N是总的源域客户端的个数。
在获得每个客户端的全局鲁棒权重后,进行模型聚合,得到聚合后的全局模型,具体为:
Figure SMS_40
其中,
Figure SMS_41
表示第 i个客户端模型的全局鲁棒权重,本地客户端模型
Figure SMS_42
所述源域客户端中包含一个特征提取网络和一个分类网络;
所述特征提取网络包括依次连接的第一卷积层、第一组标准化层、第一最大池化层、第二卷积层、第二组标准化层、第二最大池化层、第三卷积层、第三组标准化层以及第三最大池化层;
所述分类网络包括依次连接的展平层、过拟合层、全连接层、归一化层以及全连接层。
具体地实施例中,本实施例所述的方法,包括:
A.联邦域泛化问题定义
联邦域泛化(Federated Domain Generalization,FDG)方法是联邦学习和域泛化的有机结合。因此,在问题定义中,FDG具有两者的共性,具体如下:
源域客户端和目标域客户端:在FDG中,拥有源域数据集的客户端称为源域客户端,拥有目标域数据集的客户端称为目标域客户端。
域分布差异:源域与源域数据集之间、源域与目标域数据集之间的数据分布存在分布差异,在整个训练过程中目标域数据集与标签完全不可见。
共享标签空间:假设不同客户端(包括源域客户端和目标域客户端)之间可能的故障类型相同,并且源域客户端之间的故障标签也相同。
数据与用户隐私保护:所有客户端的数据仅在本地可见,在整个训练流程中,客户端与中心服务器之间只能进行特征和模型参数的传递,而不能进行原始数据的通信。
B.全局鲁棒加权联邦域泛化
一般来说,全局鲁棒加权联邦域泛化(Federated Domain Generalization withGlobal Robust Weighting,FDG-GRW)引入一种加权思想,在原始数据不能相互传递同时目标域数据和标签不可见的情况下,在中心服务器聚合客户端模型的过程中,增加表现优异的源域客户端模型的权重,并降低较差源域客户端模型的权重以最大化聚合后全局模型的泛化能力。同时,在上述限制下,训练过程中引入最大均值差异(Maximum MeanDifference, MMD),进一步减小源域数据之间的分布差异。具体的训练流程如图2所示。下面描述了每个步骤的细节。
步骤1:模型下载。假设有N个源域数据集
Figure SMS_43
,拥有这些数据集的源客户端分别表示为
Figure SMS_44
。每个客户端在开始时将全局模型下载并作为本地模型。
步骤2:前向传播。每个客户端进行前向传播,提取源域数据集的特征
Figure SMS_45
并计算
Figure SMS_46
。其中
Figure SMS_47
代表本地客户端模型 k的分类损失,其公式为:
Figure SMS_48
(1)
其中,
Figure SMS_49
代表数据样本 j的真实标签,而
Figure SMS_50
是模型的预测结果,
Figure SMS_51
是特征个数, T代表第 T个epoch, k代表第 k个客户端。
步骤3:计算
Figure SMS_52
。为了找到一种特征变换,使所有源域数据在该特征变换空间中的分布差异最小化,从而训练出泛化能力更好的模型,本文考虑引入最大均值差异(Maximum Mean Discrepancy,MMD),其定义如下:
Figure SMS_53
(2)
其中,
Figure SMS_54
是一个核函数,其作用为将输入映射到再生核希尔伯特空间中,
Figure SMS_55
Figure SMS_56
是数据集
Figure SMS_57
Figure SMS_58
中的第 h 1h 2个元素, mn是数据集
Figure SMS_59
Figure SMS_60
中的元素总数。
由于源域数据集仅在本地模型中可见,因此在计算
Figure SMS_61
的过程中,从每个源域数据集中提取的特征需要传递到中心服务器上。考虑到域泛化问题中往往存在多个源域而不是两个源域,定义
Figure SMS_62
为:
Figure SMS_63
(3)
Figure SMS_64
(4)
其中,
Figure SMS_65
Figure SMS_66
分别代表第 st个客户端上的源域数据集,
Figure SMS_67
Figure SMS_68
分别代表第 st个客户端上的源域数据集在第 T个epoch时特征提取网络提取到的第 f 1f 2个特征,N代表总的源域客户端的个数, ab分别代表
Figure SMS_69
Figure SMS_70
的个数。
步骤4:反向传播。
Figure SMS_71
由每个客户端下载,并按照如下公式计算
Figure SMS_72
以进行后续的本地模型反向传播。
Figure SMS_73
(5)
其中, α
Figure SMS_74
的参数,在本文中,
Figure SMS_75
Figure SMS_76
是客户端 k的本地模型损失值, k为客户端序号, T为第 T个epoch,
Figure SMS_77
的作用是约束多个源域之间的距离。
计算完成后,对本地源域客户端模型进行反向传播,得到参数更新后的本地客户端模型
Figure SMS_78
步骤5:计算权重。将更新参数后的模型
Figure SMS_79
、特征
Figure SMS_80
及其对应的标签
Figure SMS_81
上传到中心服务器,以计算每个模型的全局鲁棒权重,具体的策略为:首先计算每个本地模型
Figure SMS_82
对其他特征的分类损失,然后以该损失为基准计算出全局鲁棒权重,具体公式如下所示:
Figure SMS_83
(6)
Figure SMS_84
(7)
其中,
Figure SMS_87
为特征个数,
Figure SMS_89
是第 i个客户端的本地模型对第 l个本地客户端提取特征的分类损失,当只有两个客户端时,所有
Figure SMS_91
项均与每个客户端都有关,此时以
Figure SMS_86
为模型的性能度量进行加权;由于此时仅有两个客户端,故此时
Figure SMS_90
Figure SMS_92
是特征
Figure SMS_93
的真实标签,
Figure SMS_85
是第 p个模型的分类器对特征
Figure SMS_88
的分类结果, N是总的源域客户端的个数。
容易得出结论,所有客户端的权重之和为1。
步骤6:模型聚合。在获得每个客户端的权重后,执行如下全局鲁棒加权策略:
Figure SMS_94
(8)
步骤7:将聚合后的全局模型
Figure SMS_95
发送给所有客户端,为下一轮训练做准备。
Figure SMS_96
为第 i个客户端模型的全局鲁棒权重。
C.网络基本结构
在本文中,客户端和中心服务器的模型结构是相同的。在模型传输和模型聚合过程中,只需要网络参数的传输和计算,网络的结构不需发生变化。具体的网络结构和网络层参数如图3所示。
D.总体流程
本文提出的DWFDG模型的总体流程如下:
首先在训练阶段,中心服务器初始化全局模型并将其发送给所有源域客户端;然后每个客户端使用自己的本地训练数据集训练接收到的全局模型,并更新参数以形成新的本地模型。然后,包含源域数据集的客户端将更新后的本地模型、提取的特征以及标签发送给中心服务器,由中心服务器计算权重并进行模型聚合。最后,当训练轮数达到设定值时,训练计划结束。在测试阶段,服务器将全局模型发送到目标域客户端进行故障诊断,具体步骤如图1所示。
针对目前跨域故障诊断方法存在数据泄露这一问题,本实施例提出了一种适用于不同工况下分布式训练的全局鲁棒加权联邦域泛化智能故障诊断方法,在源域数据之间不可互通、目标域数据和标签不可见的条件下,通过充分利用多个源域的丰富信息,以特征提取网络结果作为信息传递介质,以分类器对不同源域特征的分类结果作为性能度量。在模型聚合时执行全局鲁棒加权策略以提高全局模型的泛化能力,同时引入了最大均值差异(MMD)限制源域特征之间的距离,进一步提高了本地模型和全局模型的分类性能。
为了验证本发明提出方法的有效性,在Paderborn大学轴承故障数据集上进行了实验,实验结果表明了本实施例所述方法优异的泛化性能和全局鲁棒加权策略的有效性。实验过程如下:
A.对比方法
1)差异加权联邦域适应(FTL):FTL是一种联邦域适应加权方法,以最大均值差异(MMD)来衡量源域和目标域之间的距离,并以此设计不同源域的权重。对于FTL来说,所有源域和目标域数据都参加训练。
2)多源无监督域适应(MUDA):MUDA为每一个源域构造了一个域鉴别器,并且通过域对抗训练学习域不变特征并基于此完成故障诊断任务。
3)联邦平均(FedAvg):FedAvg作为一种分布式框架,是所有联邦学***均加权聚合操作得到全局模型。经过多轮训练,FedAvg得到全局优化模型。在本文中,除加权策略外,FedAvg的网络模型和超参数都与本文提出的方法完全相同。
B.案例1:Paderborn大学轴承故障数据集实验
1)Paderborn数据集:本节实验中使用的第一个数据集是Paderborn数据集[9]。在该数据集中,轴承的实际损伤是由科学实验台进行的加速寿命实验导致的。本实验中轴承使用情况以轴承代号表示,详见表1。该数据集包含三种不同状态下的轴承:内圈故障(IR)、外圈故障(OR)和健康(H)。不同客户端的数据集来自于不同转速、径向力以及负载扭矩下工作的轴承。本节使用的轴承工况详见表2。本文假设A、B、C、D分布在四个客户端中,并使用两个或者三个源域数据集,基于所提出的全局鲁棒加权方法,在不产生数据聚合的情况下协同训练模型。训练好的模型将在目标客户端上进行测试。
表1 Paderborn数据集实验轴承代号
Figure SMS_97
表2 不同工况下Paderborn数据集
Figure SMS_98
2)实验结果:在Paderborn数据集上,本方法的结果以及与其他方法的对比如表3所示。与FTL相比,FDG取得了相当乃至更好的结果。这说明本方法能够很好的完成域泛化任务,可以在完全不利用目标域数据集和标签的状况下训练出具有良好的泛化能力的模型,意味着在本方法在包含源域数据集的客户端上训练的本地模型可以适应其他领域。与FedAvg相比,本方法在所有任务中都取得了更好的效果,这也进一步证明了本方法的有效性。
表3 Paderborn数据集实验结果
Figure SMS_99
实施例二
本实施例提供了一种基于全局鲁棒加权的联邦域泛化故障诊断***,包括:
中心服务器、多个源域客户端以及目标客户端;
所述中心服务器初始化全局模型并将其发送给所有源域客户端;
每个所述源域客户端利用本地源域训练数据集训练接收到全局模型,并更新参数以形成新的本地模型;
所述源域客户端将更新后的本地模型、提取的网络特征以及标签发送给中心服务器;
所述中心服务器基于提取的网络特征,以不同分类器对不同特征的分类结果为性能度量,并以分类损失计算权重进行模型聚合;
所述中心服务器将聚合后的全局模型发送到目标域客户端进行故障诊断。
上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为***的一部分可以在诸如一组计算机可执行指令的计算机***中执行。
上述实施例中对各个实施例的描述各有侧重,某个实施例中没有详述的部分可以参见其他实施例的相关描述。
所提出的***,可以通过其他的方式实现。例如以上所描述的***实施例仅仅是示意性的,例如上述模块的划分,仅仅为一种逻辑功能划分,实际实现时,可以有另外的划分方式,例如多个模块可以结合或者可以集成到另外一个***,或一些特征可以忽略,或不执行。
实施例三
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例一所述的基于全局鲁棒加权的联邦域泛化故障诊断方法中的步骤。
实施例四
本实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述实施例一所述的基于全局鲁棒加权的联邦域泛化故障诊断方法中的步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (10)

1.基于全局鲁棒加权的联邦域泛化故障诊断方法,其特征在于,包括:
中心服务器初始化全局模型并将其发送给所有源域客户端;
每个所述源域客户端利用本地源域训练数据集训练接收到全局模型,并更新参数以形成新的本地模型;
所述源域客户端将更新后的本地模型、提取的网络特征以及标签发送给中心服务器;
所述中心服务器基于提取的网络特征,以不同分类器对不同特征的分类结果为性能度量,并以分类损失计算权重进行模型聚合;
所述中心服务器将聚合后的全局模型发送到目标域客户端进行故障诊断。
2.如权利要求1所述的基于全局鲁棒加权的联邦域泛化故障诊断方法,其特征在于,所述每个所述源域客户端利用本地源域训练数据集训练接收到全局模型,并更新参数以形成新的本地模型,具体为:
步骤1:模型下载;假设有N个源域数据集
Figure QLYQS_1
,拥有这些数据集的源客户端分别表示为
Figure QLYQS_2
;每个客户端在开始时将全局模型下载并作为本地模型;
步骤2:前向传播;每个客户端进行前向传播,提取源域数据集的特征
Figure QLYQS_3
并计算
Figure QLYQS_4
;其中,
Figure QLYQS_5
代表本地客户端模型k的分类损失;
步骤3:计算
Figure QLYQS_6
;由于源域数据集仅在本地模型中可见,因此在计算
Figure QLYQS_7
的过程中,从每个源域数据集中提取的特征需要传递到中心服务器上;考虑到域泛化问题中往往存在多个源域而不是两个源域,定义
Figure QLYQS_8
为:
Figure QLYQS_9
Figure QLYQS_10
其中,
Figure QLYQS_11
Figure QLYQS_12
分别代表第st个客户端上的源域数据集,
Figure QLYQS_13
Figure QLYQS_14
分别代表第st个客户端上的源域数据集在第T个epoch时特征提取网络提取到的第f 1f 2个特征,N代表总的源域客户端的个数,ab分别代表
Figure QLYQS_15
Figure QLYQS_16
的个数;
步骤4:反向传播;
Figure QLYQS_17
由每个客户端下载,并按照如下公式计算
Figure QLYQS_18
以进行后续的本地模型反向传播;
Figure QLYQS_19
其中,α是
Figure QLYQS_20
的参数,在本文中,
Figure QLYQS_21
Figure QLYQS_22
是客户端k的本地模型损失值,k为客户端序号,T为第T个epoch,
Figure QLYQS_23
的作用是约束多个源域之间的距离;
计算完成后,对本地源域客户端模型进行反向传播,得到参数更新后的本地客户端模型
Figure QLYQS_24
3.如权利要求2所述的基于全局鲁棒加权的联邦域泛化故障诊断方法,其特征在于,所述
Figure QLYQS_25
代表本地客户端模型k的分类损失,具体为:
Figure QLYQS_26
其中,
Figure QLYQS_27
代表数据样本j的真实标签,而
Figure QLYQS_28
是模型的预测结果。
4.如权利要求1所述的基于全局鲁棒加权的联邦域泛化故障诊断方法,其特征在于,所述中心服务器基于提取的网络特征,以不同分类器对不同特征的分类结果为性能度量,并以分类损失计算权重进行模型聚合,具体为:
基于更新参数后的模型、特征及其对应的标签上传到中心服务器,以计算每个模型的全局鲁棒权重;
在获得每个客户端的全局鲁棒权重后,进行模型聚合,得到聚合后的全局模型。
5.如权利要求4所述的基于全局鲁棒加权的联邦域泛化故障诊断方法,其特征在于,所述全局鲁棒权重,具体为:
Figure QLYQS_29
Figure QLYQS_30
其中,
Figure QLYQS_33
为特征个数,
Figure QLYQS_36
是第i个客户端的本地模型对第l个本地客户端提取特征的分类损失,当只有两个客户端时,所有
Figure QLYQS_38
项均与每个客户端都有关,此时以
Figure QLYQS_32
为模型的性能度量进行加权;由于此时仅有两个客户端,故此时
Figure QLYQS_35
Figure QLYQS_37
是特征
Figure QLYQS_39
的真实标签,
Figure QLYQS_31
是第p个模型的分类器对特征
Figure QLYQS_34
的分类结果,N是总的源域客户端的个数。
6.如权利要求4所述的基于全局鲁棒加权的联邦域泛化故障诊断方法,其特征在于,在获得每个客户端的全局鲁棒权重后,进行模型聚合,得到聚合后的全局模型,具体为:
Figure QLYQS_40
其中,
Figure QLYQS_41
表示第i个客户端模型的全局鲁棒权重,本地客户端模型
Figure QLYQS_42
7.如权利要求1所述的基于全局鲁棒加权的联邦域泛化故障诊断方法,其特征在于,所述源域客户端中包含一个特征提取网络和一个分类网络;
所述特征提取网络包括依次连接的第一卷积层、第一组标准化层、第一最大池化层、第二卷积层、第二组标准化层、第二最大池化层、第三卷积层、第三组标准化层以及第三最大池化层;
所述分类网络包括依次连接的展平层、过拟合层、全连接层、归一化层以及全连接层。
8.基于全局鲁棒加权的联邦域泛化故障诊断***,其特征在于,包括:
中心服务器、多个源域客户端以及目标客户端;
所述中心服务器初始化全局模型并将其发送给所有源域客户端;
每个所述源域客户端利用本地源域训练数据集训练接收到全局模型,并更新参数以形成新的本地模型;
所述源域客户端将更新后的本地模型、提取的网络特征以及标签发送给中心服务器;
所述中心服务器基于提取的网络特征,以不同分类器对不同特征的分类结果为性能度量,并以分类损失计算权重进行模型聚合;
所述中心服务器将聚合后的全局模型发送到目标域客户端进行故障诊断。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的基于全局鲁棒加权的联邦域泛化故障诊断方法中的步骤。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一项所述的基于全局鲁棒加权的联邦域泛化故障诊断方法中的步骤。
CN202310218371.6A 2023-03-09 2023-03-09 基于全局鲁棒加权的联邦域泛化故障诊断方法及*** Active CN115952442B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310218371.6A CN115952442B (zh) 2023-03-09 2023-03-09 基于全局鲁棒加权的联邦域泛化故障诊断方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310218371.6A CN115952442B (zh) 2023-03-09 2023-03-09 基于全局鲁棒加权的联邦域泛化故障诊断方法及***

Publications (2)

Publication Number Publication Date
CN115952442A true CN115952442A (zh) 2023-04-11
CN115952442B CN115952442B (zh) 2023-06-13

Family

ID=85891172

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310218371.6A Active CN115952442B (zh) 2023-03-09 2023-03-09 基于全局鲁棒加权的联邦域泛化故障诊断方法及***

Country Status (1)

Country Link
CN (1) CN115952442B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116992336A (zh) * 2023-09-04 2023-11-03 南京理工大学 一种基于联邦局部迁移学习的轴承故障诊断方法

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070028220A1 (en) * 2004-10-15 2007-02-01 Xerox Corporation Fault detection and root cause identification in complex systems
CN112798280A (zh) * 2021-02-05 2021-05-14 山东大学 一种滚动轴承故障诊断方法及***
US20210406780A1 (en) * 2020-06-30 2021-12-30 Intuit Inc. Training an ensemble of machine learning models for classification prediction
CN114254700A (zh) * 2021-12-06 2022-03-29 中国海洋大学 基于联邦学习的tbm滚刀故障诊断模型构建方法
CN114399055A (zh) * 2021-12-28 2022-04-26 重庆大学 一种基于联邦学习的域泛化方法
CN114818996A (zh) * 2022-06-28 2022-07-29 山东大学 基于联邦域泛化的机械故障诊断方法及***
CN115239989A (zh) * 2022-06-28 2022-10-25 浙江工业大学 一种基于数据隐私保护的油浸变压器分布式故障诊断方法
CN115328691A (zh) * 2022-10-14 2022-11-11 山东大学 基于模型差异的故障诊断方法、***、存储介质及设备
CN115438714A (zh) * 2022-08-01 2022-12-06 华南理工大学 分簇式联邦学习驱动的机械故障诊断方法、装置及介质
CN115525038A (zh) * 2022-10-26 2022-12-27 河北工业大学 一种基于联邦分层优化学习的设备故障诊断方法
CN115560983A (zh) * 2022-09-30 2023-01-03 哈尔滨理工大学 一种基于联邦特征迁移学习的不同工况下滚动轴承故障诊断方法及***
EP4120653A1 (en) * 2021-07-15 2023-01-18 EXFO Inc. Communication network performance and fault analysis using learning models with model interpretation
CN115731424A (zh) * 2022-12-03 2023-03-03 北京邮电大学 基于强化联邦域泛化的图像分类模型训练方法及***
CN115773562A (zh) * 2022-11-24 2023-03-10 杭州经纬信息技术股份有限公司 基于联邦学习的统一化暖通空调***故障检测方法
CN115905978A (zh) * 2022-11-18 2023-04-04 安徽工业大学 基于分层联邦学习的故障诊断方法及***

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070028220A1 (en) * 2004-10-15 2007-02-01 Xerox Corporation Fault detection and root cause identification in complex systems
US20210406780A1 (en) * 2020-06-30 2021-12-30 Intuit Inc. Training an ensemble of machine learning models for classification prediction
CN112798280A (zh) * 2021-02-05 2021-05-14 山东大学 一种滚动轴承故障诊断方法及***
EP4120653A1 (en) * 2021-07-15 2023-01-18 EXFO Inc. Communication network performance and fault analysis using learning models with model interpretation
CN114254700A (zh) * 2021-12-06 2022-03-29 中国海洋大学 基于联邦学习的tbm滚刀故障诊断模型构建方法
CN114399055A (zh) * 2021-12-28 2022-04-26 重庆大学 一种基于联邦学习的域泛化方法
CN115239989A (zh) * 2022-06-28 2022-10-25 浙江工业大学 一种基于数据隐私保护的油浸变压器分布式故障诊断方法
CN114818996A (zh) * 2022-06-28 2022-07-29 山东大学 基于联邦域泛化的机械故障诊断方法及***
CN115438714A (zh) * 2022-08-01 2022-12-06 华南理工大学 分簇式联邦学习驱动的机械故障诊断方法、装置及介质
CN115560983A (zh) * 2022-09-30 2023-01-03 哈尔滨理工大学 一种基于联邦特征迁移学习的不同工况下滚动轴承故障诊断方法及***
CN115328691A (zh) * 2022-10-14 2022-11-11 山东大学 基于模型差异的故障诊断方法、***、存储介质及设备
CN115525038A (zh) * 2022-10-26 2022-12-27 河北工业大学 一种基于联邦分层优化学习的设备故障诊断方法
CN115905978A (zh) * 2022-11-18 2023-04-04 安徽工业大学 基于分层联邦学习的故障诊断方法及***
CN115773562A (zh) * 2022-11-24 2023-03-10 杭州经纬信息技术股份有限公司 基于联邦学习的统一化暖通空调***故障检测方法
CN115731424A (zh) * 2022-12-03 2023-03-03 北京邮电大学 基于强化联邦域泛化的图像分类模型训练方法及***

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
QI L.等: "A PV Fault Diagnosis Framework Based on Asynchronous Federated Learning", 2022 13TH ASIAN CONTROL CONFERENCE (ASCC) *
W. ZHANG 等: "Federated learning for machinery fault diagnosis with dynamic validation and self-supervision", KNOWLEDGE-BASED SYSTEMS *
徐景硕 等: "基于惯性/组合导航***级故障诊断方法研究", 舰船电子工程 *
杜家豪 等: "基于联邦学习的多线路高速列车转向架故障诊断", 西南交通大学学报 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116992336A (zh) * 2023-09-04 2023-11-03 南京理工大学 一种基于联邦局部迁移学习的轴承故障诊断方法
CN116992336B (zh) * 2023-09-04 2024-02-13 南京理工大学 一种基于联邦局部迁移学习的轴承故障诊断方法

Also Published As

Publication number Publication date
CN115952442B (zh) 2023-06-13

Similar Documents

Publication Publication Date Title
Chen et al. Cyber security in smart cities: a review of deep learning-based applications and case studies
Martins et al. Analyzing the footprint of classifiers in adversarial denial of service contexts
CN115328691B (zh) 基于模型差异的故障诊断方法、***、存储介质及设备
CN115952442A (zh) 基于全局鲁棒加权的联邦域泛化故障诊断方法及***
Usmanova et al. Federated continual learning through distillation in pervasive computing
Pustozerova et al. Training effective neural networks on structured data with federated learning
Xiong et al. Anomaly network traffic detection based on deep transfer learning
CN111275562A (zh) 基于递归卷积神经网络和自编码器的动态社区发现方法
CN111459990B (zh) 对象处理方法、***及计算机可读存储介质和计算机设备
Zhou et al. Online nonparametric Bayesian analysis of parsimonious Gaussian mixture models and scenes clustering
Cherifi et al. Convolution neural network deployment for plant leaf diseases detection
CN113807370A (zh) 数据处理方法、装置、设备、存储介质及计算机程序产品
Zheng et al. Online streaming feature selection using sampling technique and correlations between features
Guan et al. DOS-GAN: A Distributed Over-Sampling Method Based on Generative Adversarial Networks for Distributed Class-Imbalance Learning
De Bonis et al. Deep learning techniques for visual food recognition on a mobile app
Waikhom et al. Recurrent convolution based graph neural network for node classification in graph structure data
Kompella et al. A Comparative Study of Classification Algorithms Over Images Using Machine Learning and TensorFlow
Polat Data weighting method on the basis of binary encoded output to solve multi-class pattern classification problems
Singh et al. Ensemble Methods for Learning: An approach towards handling Class Imbalance and Class Overlapping Problems
Wen et al. Clustering-based adaptive dropout for CNN-based classification
Chu et al. Imbalanced Few-Shot Learning Based on Meta-transfer Learning
Sarkar Generative adversarial network-based efficient synchronization of group of neural networks to exchange the neural key
Nguyen-Thuy et al. TL-SMOTE: Re-balancing Data in Federated Learning for Anomaly Detection
Madala et al. Federated Learning Approach for Tracking Malicious Activities in Cyber-Physical Systems
Wang et al. Blockchain-Based Secure and Efficient Federated Learning with Three-phase Consensus and Unknown Device Selection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant