CN113485863B - 基于改进生成对抗网络生成异构不平衡故障样本的方法 - Google Patents

基于改进生成对抗网络生成异构不平衡故障样本的方法 Download PDF

Info

Publication number
CN113485863B
CN113485863B CN202110796968.XA CN202110796968A CN113485863B CN 113485863 B CN113485863 B CN 113485863B CN 202110796968 A CN202110796968 A CN 202110796968A CN 113485863 B CN113485863 B CN 113485863B
Authority
CN
China
Prior art keywords
fault
data
heterogeneous
sample
continuous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110796968.XA
Other languages
English (en)
Other versions
CN113485863A (zh
Inventor
刘杰
王冲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN202110796968.XA priority Critical patent/CN113485863B/zh
Publication of CN113485863A publication Critical patent/CN113485863A/zh
Application granted granted Critical
Publication of CN113485863B publication Critical patent/CN113485863B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0736Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in functional embedded systems, i.e. in a data processing system designed as a combination of hardware and software dedicated to performing a certain function
    • G06F11/0739Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in functional embedded systems, i.e. in a data processing system designed as a combination of hardware and software dedicated to performing a certain function in a data processing system embedded in automotive or aircraft systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/26Functional testing
    • G06F11/263Generation of test inputs, e.g. test vectors, patterns or sequences ; with adaptation of the tested hardware for testability with external testers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Hardware Design (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明提供一种基于改进生成对抗网络生成异构不平衡故障样本的方法。其提供了一种混合自动编码器和双辨别器生成对抗网络MAE‑D2GAN,针对监测数据存在严重不平衡问题,将由正常状态样本训练获得的辨别器加入对抗过程中,建立具有双辨别器的改进生成对抗网络;设计包括编码器和解码器的自动编码器,通过编码器将异构监测数据编码成连续的潜在特征,输入到双辨别器生成对抗网络模型中;解码器输出层使用可微的Gumbel‑softmax处理离散变量对应的双辨别器生成对抗网络生成的连续特征,得到异构的故障样本。本发明提供的混合自动编码器和双辨别器生成对抗网络MAE‑D2GAN生成的故障样本更接近真实故障样本,能够有效降低类重叠问题的影响,更好地提高故障诊断模型的预测准确度。

Description

基于改进生成对抗网络生成异构不平衡故障样本的方法
技术领域
本申请涉及故障诊断领域,具体地涉及针对复杂***或设备故障诊断中类别不平衡问题的处理,采用改进的生成对抗网络实现对异构故障样本的数据扩充。
背景技术
随着信息技术的飞速发展,***智能化、综合化程度的逐步提升,***结构和功能也越来越复杂。复杂***内各部件交叉影响,有时一个很小的故障也会引起连锁反应,从而导致整个***的损毁。这不仅会带来巨大的经济损失,还会危及相关人员的生命安全。因此,状态监测与故障诊断技术作为一种预测性维护手段,在***健康与安全管理中显得越来越重要。当前,用于故障诊断的方法有很多,如专家***模型、物理模型、数据驱动模型等。其中,数据驱动方法在复杂***的故障诊断中得到了广泛的应用。采用数据驱动模型,只需有足够多的相关监测数据和维修数据,就可以快速廉价地得到异常检验模型,可以避免对设备先验知识的依赖。虽然这种方法需要海量数据才能得到高精度模型,但数据量的不足可以通过优化算法、仿真数据、强化学习来克服。
大多数数据驱动的故障诊断方法都假设数据集是均匀分布的,即不同类别的样本数量是接近的。然而,实际应用中的数据往往是不平衡的,特别是对于一个具有高可靠性的复杂***或设备,故障样本不可避免地要远远少于正常样本。当这些数据驱动的分类算法直接用于故障诊断时,很难获得满意的结果。预测结果往往偏向于大多数类别,使得故障诊断的准确率非常低。然而,在实际应用中,故障类数据显然更为重要。因此,面对不平衡的数据,必须克服由其带来的偏差。
目前,处理不平衡数据的方法主要有三类:
(1)重采样方法:如多数欠采样、少数过采样和综合采样;
(2)算法级方法:如修改损失函数、修改分类阈值、代价敏感学习等;
(3)集成学习:如使用增强组合进行迭代训练等。
这些方法大多都能在一定程度上提高分类精度,并在各个领域得到验证和推广。其中,合成少类样本技术(Synthetic Minority Oversampling Technique,SMOTE)是一种常用的方法,通过添加合成少数类样本来调整数据分布,从而提高分类性能。最近提出的生成对抗网络(Generative Adversarial Network,GAN)由于其高效性和灵活性,也被用于合成样本的生成。与SMOTE及其变种主要依靠专家知识设计合成少数群体的生成规则不同,GAN方法可以自动学***衡数据,基于GAN的研究近年来也逐渐发展起来。
以往的研究主要集中在连续和高采样频率的数据上,而实际数据往往同时包含低采样频率的数值变量和分类变量,即所谓的异构数据。例如,影响高速列车制动***的因素有电压、电流等数值变量,也有运行方式、制动状态等分类变量。
在现有的GAN中,常使用独热编码将类别型变量编码为数值,这里所说的类别型变量也就是通常所说的离散变量,但这使得生成的样本没有任何工程解释,取值不再离散且可能超过原始变量的取值范围。除了数据的异构性外,先前的工作大多假设有足够的故障样本可用于训练GAN模型,而对于一个复杂的***来说,故障数据是有限的。在有限的故障样本上训练得到的GAN模型常常会导致严重的过拟合问题。
发明内容
为了克服现有技术的不足,本发明的目的是提出一种具有双辨别器的改进生成对抗网络和改进的自动编码器(Auto Encoder,AE)相结合生成异构故障样本的方法。在该方法中,离散变量和连续变量可以被自动识别并分别处理。改进的AE中包含一个编码器和一个解码器,编码器用于提取有效的潜在变量并将其馈入带有双辨别器的GAN,解码器则可以将生成的连续数据转化为异构数据。
为实现上述目的,本发明一方面提供了一种基于改进生成对抗网络生成异构不平衡故障样本的方法,其包括以下步骤:
步骤1:采集机电产品***或设备的故障状态和监测数据,获得历史监测数据;
步骤2:对所述步骤1获得的历史监测数据进行数据预处理,获得预处理后的数据集[X,Y],所述X为机电产品***或设备故障状态相关变量,所述Y为机电产品***或设备故障状态,所述X为异构数据,所述X包括连续变量和离散变量;
步骤3:设置自动编码器,实现异构数据和连续特征的相互转换,在现有的经典生成对抗网络添加正常样本辨别器,建立具有双辨别器的改进生成对抗网络,将所述步骤2中获得的预处理后的数据集[X,Y]输入所述自动编码器和具有双辨别器的改进生成对抗网络,获得异构故障样本U,具体包括以下步骤:
步骤31:所述自动编码器包括编码器和解码器;所述编码器的功能是将异构监测数据编码成连续的潜在特征;所述解码器输出层使用可微的Gumbel-softmax实现连续特征的离散化,所述解码器的功能是将连续故障特征数据解码为异构故障样本,将所述步骤2中获得的预处理后的数据集[X,Y]输入所述编码器,获得故障样本特征数据x和正常样本特征数据;
步骤32:所述步骤3具有双辨别器的改进生成对抗网络包括一个生成器G和两个辨别器D和F;根据所述步骤31获得的正常样本特征数据训练所述辨别器F;将白噪声z输入所述具有双辨别器的改进生成对抗网络的生成器G中,获得潜在空间上故障样本对应的特征数据集G(z);
步骤33:根据所述故障样本特征数据x和潜在空间上故障样本对应的特征数据集G(z),训练所述生成器G和辨别器D,训练过程中所述具有双辨别器的改进生成对抗网络的损失函数V(D,G)为:
Figure BDA0003163176730000031
式中:D(x)为生成样本来自于故障样本特征数据x的概率;
Figure BDA0003163176730000032
为取遍所有x求期望值;D(G(z))为辨别器D辨别连续变量集G(z)是否真实的概率;F(G(z))为辨别器F辨别连续变量集G(z)是否正常的概率;
Figure BDA0003163176730000033
为取遍设定的所有z求期望值;
所述具有双辨别器的改进生成对抗网络的目标函数是
Figure BDA0003163176730000034
基于所述目标函数
Figure BDA0003163176730000035
迭代训练所述生成器G和辨别器D,所述迭代训练包括训练所述生成器G使所述损失函数V(D,G)最小和训练所述辨别器D使所述损失函数V(D,G)最大;当模型连续迭代训练100次中损失函数V(D,G)的最大值和最小值的差小于0.01时,迭代训练停止;所述迭代训练停止后获得训练后的生成器G;将一组白噪声z输入所述训练后的生成器G获得潜在空间上故障样本对应的特征数据集G(z);
步骤34:将所述步骤33中获得的潜在空间上故障样本对应的特征数据集G(z)输入所述自动编码器中的解码器,获得异构故障样本U;
步骤4:对所述步骤34获得的异构故障样本U添加一列故障状态I,获得异构故障样本集[U,I],所述故障状态I为元素均为1的列向量,所述故障状态I的维度与所述异构故障样本U的维度一致。
进一步,所述步骤34获得异构故障样本U的具体步骤为:将所述步骤33中获得的潜在空间上故障样本对应的特征数据集G(z)输入所述解码器,获得解码后的数据集,所述解码后的数据集包括离散变量对应的列和连续变量对应的列,利用可微的Gumbel-softmax对所述离散变量对应的列进行离散化处理,获得离散化后的列,根据所述连续变量对应的列和离散化后的列,获得异构故障样本U。
更进一步,利用所述步骤31中的编码器进行编码的过程具体为:对所述步骤2中获得的预处理后的数据集[X,Y]中的离散变量进行独热编码,获得独热编码后的变量,将所述独热编码后的变量与所述步骤2中获得的预处理后的数据集[X,Y]中的连续变量统一编码,获得故障样本特征数据x和正常样本特征数据。
可优选的是,所述步骤1中故障状态包括有故障和无故障。
可优选的是,所述步骤1中监测数据为异构数据,所述异构数据包括连续特征、离散特征和信号特征。
进一步,所述步骤2中的数据预处理包括对缺失值填充、替换异常值、处理量纲差距和数字化;所述缺失值填充采用局部均值填充法;所述处理量纲差距为数据标准化,所述数据标准化采取z-score方法。
本发明还提供一种根据前述基于改进生成对抗网络生成异构不平衡故障样本的方法进行实时故障诊断的方法,具体包括以下步骤:
步骤1:采集机电产品***或设备的故障状态和监测数据,获得历史监测数据;
步骤2:对所述步骤1获得的历史监测数据进行数据预处理,获得预处理后的数据集[X,Y],所述X为机电产品***或设备故障状态相关变量,所述Y为机电产品***或设备故障状态,所述X为异构数据,所述X包括连续变量和离散变量;
步骤3:设置自动编码器,实现异构数据和连续特征的相互转换,在现有的经典生成对抗网络添加正常样本辨别器,建立具有双辨别器的改进生成对抗网络,将所述步骤2中获得的预处理后的数据集[X,Y]输入所述自动编码器和具有双辨别器的改进生成对抗网络,获得异构故障样本U;
步骤4:对所述步骤3获得的异构故障样本U添加一列故障状态I,获得异构故障样本集[U,I],所述故障状态I为元素均为1的列向量,所述故障状态I的维度与所述异构故障样本U的维度一致;
步骤5:将所述步骤4中获得的异构故障样本集[U,I]并入所述步骤2中获得的预处理后的数据集[X,Y]中,获得新数据集
Figure BDA0003163176730000051
基于所述新数据集
Figure BDA0003163176730000052
训练人工神经网络ANN算法,获得故障诊断模型;
步骤6:采集实时监测数据,对所述实时监测数据进行与所述步骤2相同的数据预处理,获得预处理后的实时监测数据,输入所述预处理后的实时监测数据到所述步骤5获得的故障诊断模型,获得实时故障状态,完成故障诊断。
与现有技术相比,本发明提供了一种基于改进生成对抗网络生成异构不平衡故障样本的方法,其有益效果在于:
1、本发明提出的AE可以自动识别并同时处理连续变量和离散变量,并且使用可微的Gumbel-softmax还原离散变量,更易得到最优模型;
2、使用具有双辨别器的GAN进行数据扩充,能够有效减弱类重叠问题的影响;
3、通过该方法建立的混合自动编码器和双辨别器生成对抗网络(Mixed AE-2Discriminators GAN,MAE-D2GAN)用于故障诊断,其有益效果在于:生成的异构故障样本更为真实有效,符合工程实际,能够更好的提高故障诊断的精度;
4、与此同时,该方法不仅可以用于故障诊断,也可以用于其他运维场景,具有较好的使用前景。
附图说明
图1为本发明实施例的生成异构故障样本的具有双辨别器的改进生成对抗网络的结构图;
图2为本发明实施例的AE的结构图;
图3为本发明实施例中基于人工神经网络ANN算法的故障诊断模型的结构概图;
图4为本发明本实施例中10折交叉验证实验流程图;
图5为本发明本实施例中某高铁制动***故障状态监测数据的t-SNE二维投影图。
具体实施方式
以下,参照附图对本发明的实施方式进行说明。
本发明实施例提供了一种基于宽度学习的机电产品***或设备实时故障诊断方法,如图1所示,具体步骤包括:
步骤1:采集一段时间内机电产品***或设备的故障状态以及相关监测数据做为历史监测数据;
一般情况下,采集到的***或设备故障状态监测数据为异构数据,包括连续特征、离散特征和信号特征。
步骤2:对历史监测数据进行数据预处理,包括对缺失值、异常值、量纲差距和数字化处理等,得到预处理后的数据集[X,Y]。这里X为机电产品***或设备故障状态相关变量,X为异构数据,包括连续变量和离散变量;Y为机电产品***或设备故障状态,提取信号特征的关键指标并将离散特征数字化,即可将监测数据转换为数值型数据。本申请基于转换后得到的数值型数据进行研究,以包含连续特征和离散特征的数值型数据作为预处理后的数据集。
如果原始故障特征变量数据集离散数据故障特征变量中包含仅有一种状态的故障特征变量,那么对于从数据中诊断***是否故障来说是没有价值的,所以需删除这类故障特征变量,根据剩下的离散数据故障特征变量和连续数据故障特征变量来进行后续研究。
首先需要对历史监测数据进行数据清理和转换,如填充缺失值、替换异常值、处理量纲差距。这里所说的缺失值的填充采用局部均值填充法,即用与当前监测数据临近的前5行和后5行数据的均值填充当前的空缺值;处理量纲差距即数据标准化采取z-score方法,即减去均值后除以标准差。
***或设备可能会发生各种不同的故障,本发明中只区分有故障和无故障,不进行故障类型区分。
经典生成对抗网络GAN能很好地处理连续数据,通过一阶微分得到最优模型,但对于离散变量则很难更新参数,为异构的类别不平衡数据建立GAN模型则会面临更多挑战,如难以得到最优模型、生成样本不符合实际等。针对此,本发明提出了一种结合具有双辨别器的改进的GAN和AE以及可微的Gumbel-softmax函数来生成高质量的异构故障样本。具有双辨别器的改进GAN是在经典GAN的基础上增加了一个辨别器F,辨别器F用于辨别生成的样本是否正常,仅基于正常样本特征数据训练获得,在训练上述具有双辨别器的改进生成对抗网络时仅提供损失值,辨别器F自身不再进行迭代优化。
步骤3:根据预处理后的数据集[X,Y],使用AE进行编码后训练具有双辨别器的改进生成对抗网络中的双辨别器D和F,其中,F仅基于正常样本特征数据进行优化,这里的正常样本特征数据是经过预处理后的数据集[X,Y]中的正常样本经过AE编码后获得的特征数据,D和G组合基于生成的连续数据集和故障样本特征数据进行迭代优化。故障样本特征数据x是经过预处理后的数据集[X,Y]中的故障样本经过AE编码后的特征数据。向具有双辨别器的改进生成对抗网络的生成器G中输入白噪声z生成潜在特征空间的连续数据集G(z)。使用AE中的解码器将生成的连续数据集G(z)转化为异构数据集U;
通常情况下,可以用softmax函数对d维向量h进行归一化,得到向量中各个分类,采样结果为元素h1,h2,...,hi,...,hd的概率,从而将h转化为代表在h1,h2,...,hi,...,hd采样的离散变量。
h=[h1,h2,...,hi,...,hd]  (1)
y=softmax(h)=[p1,p2,...,pi,...,pd]  (2)
Figure BDA0003163176730000071
其中:y为d维向量h经过softmax函数归一化后的向量;pi为归一化后的向量中的第i个元素。
softmax倾向于使h中最大值元素的概率显著大于其他元素,但表示概率的向量p实际上没有概率意义,并且在模型训练过程中基于softmax输出的是不可微的。
可微函数Gumbel-softmax是基于softmax变换被提出的,可以使参数更新趋于最优解,从而使得生成的样本更加真实有效,向量h经过Gumbel-softmax函数归一化后的向量为:
Figure BDA0003163176730000072
其中:y′为d维向量h经过Gumbel-softmax函数归一化后的向量;g=[g1,g2,...,gi,...,gd],gi(i=1,2,…,d)相互独立并服从Gumbel分布;τ是Gumbel-softmax函数中软度的控制参数,当τ→0时,y′→y。当τ→∞时,y′近似满足均匀分布。
本发明采用一个编码器和一个解码器组成AE对采集的历史监测数据进行特征重构,即将异构监测数据编码成连续变量并进行特征提取,通过消除冗余信息来降低监测数据的维数。为了在自动编码器中同时编码和解码连续和离散变量,本发明采用如图2所示的混合模型。并且,为了防止信息丢失,离散变量基于独热编码被转换成多维向量,则为了生成离散数据,解码器输出需要是一个独热向量,这通常由输出层中的softmax函数实现。本发明使用可微的Gumbel-softmax函数,代替了经典的softmax函数。
为使得生成的故障样本与实际故障数据相似,且与实际正常数据不同,本发明中生成对抗网络的对抗器采用了二维设计,即一个对抗器判断生成样本是否真实,另一个则判断生成样本是否正常,如图1所示为生成异构故障样本的改进型生成对抗网络结构图,在经典损失函数中添加了一个额外项,以防止生成的数据加剧类重叠问题。
具有双辨别器的改进生成对抗网络的的损失函数为:
Figure BDA0003163176730000081
其中:x为故障样本特征数据,z为输入生成器G的高斯白噪声,G(z)为生成的连续数据集,即潜在空间上故障样本对应的特征数据集,D(x)是生成样本来自于故障样本特征数据x的概率,D(G(z))为D辨别G(z)是否真实的概率,F(G(z))为F辨别G(z)是否正常的概率。
Figure BDA0003163176730000082
为取遍所有x求期望值,
Figure BDA0003163176730000083
指取遍设定的所有z求期望值。
建立具有双辨别器的改进生成对抗网络的目标函数为
Figure BDA0003163176730000084
训练生成器G使损失函数趋向最小化,训练辨别器D使损失函数趋向最大化,直至损失函数V(D,G)在连续100次迭代中最大取值和最小取值的差小于0.01时停止训练,所得到的生成器G即可用于生成潜在空间上故障样本对应的特征数据集G(z)。
步骤4:使用AE解码G(z)得到异构的故障特征集U,为U添加一列故障标签则可得到生成的异构故障样本集[U,I],I为故障状态,故障状态I为元素均为1的列向量,故障状态I的维度与故障样本U的数量一致。
将步骤1-4的方法建立的混合自动编码器和双辨别器生成对抗网络(Mixed AE-2Discriminators GAN,MAE-D2GAN)用于故障诊断,具体步骤为:
将步骤4中生成的异构故障样本集[U,I]并入预处理后的数据集[X,Y]中,得到新数据集
Figure BDA0003163176730000085
基于新数据集训练人工神经网络ANN模型,得到故障诊断模型,通过该方法可以有效解决类别不均衡问题,提高故障诊断精度。
人工神经网络ANN模型结构如图3所示。其中输入层节点数与X的列数相同,在二分类故障诊断场景中输出层仅有一个节点,隐藏层的层数和节点数根据根据样本量和特征数大致设定结构复杂度,再手动调整,以得到近似的局部最优解。
采集***或设备与故障状态相关的实时监测数据,对实时监测数据进行与步骤2相同的数据预处理,获得预处理后的实时监测数据,将预处理后的实时监测数据输入故障诊断模型,获得产品***或设备的实时故障状态,完成故障诊断。
为了检验所提出方法的有效性,该部分基于为期一年的运行过程中某高速列车制动***的监测数据集,设计了一个对比实验,验证该方法比常用的过采样方法更加有效。对比方法有:随机过采样,综合过采样技术SMOTE,边际过采样技术SMOTE-borderline1,边际过采样技术SMOTE-borderline2,ADASYN,以及加入独热编码的经典GAN。实验流程如图4所示,在10折交叉验证中,每个故障诊断模型的实际训练数据都为原始训练数据和生成数据组成的数据集。
制动***是确保高速列车可以有效减速的装置,是高速列车最重要的组成部分之一。与制动***健康状态相关的数据可以通过安置传感器、捕获状态信息来收集。监测数据集包含43个可能导致制动***故障的变量,包括21个连续变量和22个离散变量,如速度、电压、电流、温度、操作模式、制动状态等。
在使用不同的方法生成新的故障样品之前,需要对传感器收集到的原始数据进行数据清理和转换,如填充缺失值、数据标准化。数据标准化是为了平衡数值变量之间的维度差异。此外,根据模型的数据要求,需要将原始数据中的一些变量转换为数值。经数据处理后,输入数据中的43个变量都变为[0,1]之间的数值型变量。
为避免受随机因素的影响,实验观测十折交叉验证的平均精度和运行时长。并且,为了得到近似的局部最优解,所有的模型都通过逐渐增加的结构复杂度和迭代次数来训练、优化,直至泛化精度基本保持稳定或下降时为止。在同样的运行环境下,通过10次交叉验证,模型输出测试结果中故障类的平均F1-score、平均G-mean和平均AUC。
图5是处理后的数据集基于t分布随机邻域嵌入t-SNE的二维投影图,1.0代表故障样本,0.0代表正常样本。t-SNE算法是分析高维数据可视化最常用和最有效的方法之一。这种方法将数据点之间的相似性转换为概率,通过将高维数据投影到二维或三维空间,可以实现高维数据的可视化。由于使用所有数据时,故障样本会完全被覆盖住,因此图中只显示了正常样本的10%。经比较,图中10%正态样本与整个数据集的t-SNE投影分布基本一致。
基于改进的生成对抗网络生成异构故障样本,我们主要对比生成样本加入训练数据后是否能有效提高故障诊断准确度。从图5中也可以看出数据严重不平衡,故障诊断模型的分类结果将严重偏向正常状态,导致故障类的预测精度非常低。显然实际场景中我们只关注故障状态的预测准确度,因此整体泛化精度不能作为对比指标,而应使用故障状态的准确率和召回率。但从图5也可看出两类数据的交叉性较强,这使得故障状态的准确率和召回率无法同时达到非常高的水平。因此,本发明中使用综合指标F1-score、G-means和AUC作为不同过采样方法的评估指标。
相同操作环境下,采用经典人工神经网络模型作为故障诊断模型,依照对比实验流程对比不同过采样方式对故障诊断结果的影响,实验结果如下所示:
表1不同生成方法的比较
F1-score G-means AUC
Untreated 0.38095 0.81494 0.63299
RandomOversampling 0.58065 0.74922 0.79879
SMOTE-regular 0.54054 0.67361 0.83125
SMOTE-borderline1 0.63636 0.69469 0.96407
SMOTE-borderline2 0.52632 0.65881 0.83108
ADASYN 0.62222 0.68301 0.96389
GAN 0.84404 0.85449 0.99705
MAE-D2GAN 0.875 0.88192 0.99723
可以看出,类别不平衡会严重影响故障诊断的结果,在这种情况下,传统的过采样方法可以提高故障诊断的精度。其中,本发明中提出的结合具有双辨别器的改进生成对抗网络和改进的自动编码器的MAE-D2GAN能进一步提高故障诊断结果,优于传统GAN。
与典型的过采样方法相比,在高速列车制动***中,MAE-D2GAN可以产生更高质量的故障样本,从而大大提高了数据驱动故障诊断模型的预测精度。此外,对于高可靠性***的其他PHM分析,MAE-D2GAN也具有故障预测和回归场景的潜在价值。
以上所述的实施例仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。

Claims (5)

1.一种基于改进生成对抗网络生成异构不平衡故障样本进行实时故障诊断的方法,其特征在于,其包括以下步骤:
步骤1:采集机电产品***或设备的故障状态和监测数据,获得历史监测数据;
步骤2:对所述步骤1获得的历史监测数据进行数据预处理,获得预处理后的数据集[X,Y],所述X为机电产品***或设备故障状态相关的变量,为异构数据,包括连续变量和离散变量;所述Y为机电产品***或设备故障状态;
步骤3:设置自动编码器,实现异构数据和连续特征的相互转换,在生成对抗网络添加正常样本辨别器,建立具有双辨别器的改进生成对抗网络,将所述步骤2中获得的预处理后的数据集[X,Y]输入所述自动编码器和具有双辨别器的改进生成对抗网络,获得异构故障样本U,所述步骤3具体包括以下子步骤:
步骤31:所述自动编码器包括编码器和解码器;所述编码器的功能是将异构监测数据编码成连续的潜在特征;所述解码器输出层使用可微的Gumbel-softmax实现连续特征的离散化,所述解码器的功能是将连续故障特征数据解码为异构故障样本,将所述步骤2中获得的预处理后的数据集[X,Y]输入所述编码器,获得故障样本特征数据x和正常样本特征数据;
步骤32:所述步骤3具有双辨别器的改进生成对抗网络包括一个生成器G和两个辨别器D和F;辨别器F用于辨别生成的样本是否正常,仅基于正常样本特征数据训练获得,在训练上述具有双辨别器的改进生成对抗网络时仅提供损失值,辨别器F自身不再进行迭代优化;根据所述步骤31获得的正常样本特征数据训练所述辨别器F;将白噪声z输入所述具有双辨别器的改进生成对抗网络的生成器G中,获得潜在空间上故障样本对应的特征数据集G(z);
步骤33:根据所述故障样本特征数据x和潜在空间上故障样本对应的特征数据集G(z),训练所述生成器G和辨别器D,训练过程中所述具有双辨别器的改进生成对抗网络的损失函数V(D,G)为:
Figure FDA0004144406730000011
式中:D(x)为生成样本来自于故障样本特征数据x的概率;
Figure FDA0004144406730000012
为取遍所有x求期望值;D(G(z))为辨别器D辨别连续变量集G(z)是否真实的概率;F(G(z))为辨别器F辨别连续变量集G(z)是否正常的概率;
Figure FDA0004144406730000013
为取遍设定的所有z求log(F(G(z))的期望值,
Figure FDA0004144406730000014
为取遍设定的所有z求log(1-D(G(z)))的期望值;
所述具有双辨别器的改进生成对抗网络的目标函数是
Figure FDA0004144406730000015
基于所述目标函数
Figure FDA0004144406730000021
迭代训练所述生成器G和辨别器D,所述迭代训练包括训练所述生成器G使所述损失函数V(D,G)最小和训练所述辨别器D使所述损失函数V(D,G)最大;当模型连续迭代训练100次中损失函数V(D,G)的最大值和最小值的差小于0.01时,迭代训练停止;所述迭代训练停止后获得训练后的生成器G;将一组白噪声z输入所述训练后的生成器G获得潜在空间上故障样本对应的特征数据集G(z);
步骤34:将所述步骤33中获得的潜在空间上故障样本对应的特征数据集G(z)输入所述自动编码器中的解码器,获得异构故障样本U;所述步骤33中获得的潜在空间上故障样本对应的特征数据集G(z)输入所述解码器,获得解码后的数据集,所述解码后的数据集包括离散变量对应的列和连续变量对应的列,利用可微的Gumbel-softmax对所述离散变量对应的列进行离散化处理,获得离散化后的列,根据所述连续变量对应的列和离散化后的列,获得异构故障样本U;
步骤4:对所述步骤34获得的异构故障样本U添加一列故障状态I,获得异构故障样本集[U,I],所述故障状态I为元素均为1的列向量,所述故障状态I的维度与所述异构故障样本U的维度一致;
步骤5:将所述步骤4中获得的异构故障样本集[U,I]并入所述步骤2中获得的预处理后的数据集[X,Y]中,获得新数据集
Figure FDA0004144406730000022
基于所述新数据集
Figure FDA0004144406730000023
训练人工神经网络ANN算法,获得故障诊断模型;
步骤6:采集实时监测数据,对所述实时监测数据进行与所述步骤2相同的数据预处理,获得预处理后的实时监测数据,输入所述预处理后的实时监测数据到所述步骤5获得的故障诊断模型,获得实时故障状态,完成故障诊断。
2.根据权利要求1所述的基于改进生成对抗网络生成异构不平衡故障样本进行实时故障诊断的方法,其特征在于,利用所述步骤31中的编码器进行编码的过程具体为:对所述步骤2中获得的预处理后的数据集[X,Y]中的离散变量进行独热编码,获得独热编码后的变量,将所述独热编码后的变量与所述步骤2中获得的预处理后的数据集[X,Y]中的连续变量统一编码,获得故障样本特征数据和正常样本特征数据。
3.根据权利要求1所述的基于改进生成对抗网络生成异构不平衡故障样本进行实时故障诊断的方法,其特征在于,所述步骤1中故障状态包括有故障和无故障。
4.根据权利要求1所述的基于改进生成对抗网络生成异构不平衡故障样本进行实时故障诊断的方法,其特征在于,所述步骤1中监测数据为异构数据,所述异构数据包括连续特征、离散特征和信号特征。
5.根据权利要求1所述的基于改进生成对抗网络生成异构不平衡故障样本进行实时故障诊断的方法,其特征在于,所述步骤2中的数据预处理包括对缺失值填充、替换异常值、处理量纲差距和数字化;所述缺失值填充采用局部均值填充法;所述处理量纲差距为数据标准化,所述数据标准化采取z-score方法。
CN202110796968.XA 2021-07-14 2021-07-14 基于改进生成对抗网络生成异构不平衡故障样本的方法 Active CN113485863B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110796968.XA CN113485863B (zh) 2021-07-14 2021-07-14 基于改进生成对抗网络生成异构不平衡故障样本的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110796968.XA CN113485863B (zh) 2021-07-14 2021-07-14 基于改进生成对抗网络生成异构不平衡故障样本的方法

Publications (2)

Publication Number Publication Date
CN113485863A CN113485863A (zh) 2021-10-08
CN113485863B true CN113485863B (zh) 2023-05-05

Family

ID=77938762

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110796968.XA Active CN113485863B (zh) 2021-07-14 2021-07-14 基于改进生成对抗网络生成异构不平衡故障样本的方法

Country Status (1)

Country Link
CN (1) CN113485863B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116821697B (zh) * 2023-08-30 2024-05-28 聊城莱柯智能机器人有限公司 一种基于小样本学习的机械设备故障诊断方法
CN117854716B (zh) * 2024-03-08 2024-06-21 长春师凯科技产业有限责任公司 基于hf-gan的心脏病诊断缺失数据填补方法及***
CN118013443B (zh) * 2024-04-08 2024-07-23 华侨大学 基于生成模型算法的在线实时真空干泵异常检测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110428004A (zh) * 2019-07-31 2019-11-08 中南大学 数据失衡下基于深度学习的机械零部件故障诊断方法
CN110567720A (zh) * 2019-08-07 2019-12-13 东北电力大学 非平衡小样本场景下风机轴承故障深度对抗诊断方法
CN110647923A (zh) * 2019-09-04 2020-01-03 西安交通大学 小样本下基于自我学习的变工况机械故障智能诊断方法
CN112039687A (zh) * 2020-07-14 2020-12-04 南京邮电大学 一种面向小样本特征的基于改进生成对抗网络的故障诊断方法
CN113032917A (zh) * 2021-03-03 2021-06-25 安徽大学 一种基于生成对抗及卷积循环神经网络的机电轴承故障检测方法及应用***

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109948117B (zh) * 2019-03-13 2023-04-07 南京航空航天大学 一种对抗网络自编码器的卫星异常检测方法
CN111006865A (zh) * 2019-11-15 2020-04-14 上海电机学院 一种电机轴承故障诊断方法
CN111767861B (zh) * 2020-06-30 2024-03-12 苏州兴钊防务研究院有限公司 一种基于多判别器生成对抗网络的sar图像目标识别方法
CN113095402B (zh) * 2021-04-12 2023-06-13 江南大学 一种基于编码输入的生成对抗网络故障检测方法及***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110428004A (zh) * 2019-07-31 2019-11-08 中南大学 数据失衡下基于深度学习的机械零部件故障诊断方法
CN110567720A (zh) * 2019-08-07 2019-12-13 东北电力大学 非平衡小样本场景下风机轴承故障深度对抗诊断方法
CN110647923A (zh) * 2019-09-04 2020-01-03 西安交通大学 小样本下基于自我学习的变工况机械故障智能诊断方法
CN112039687A (zh) * 2020-07-14 2020-12-04 南京邮电大学 一种面向小样本特征的基于改进生成对抗网络的故障诊断方法
CN113032917A (zh) * 2021-03-03 2021-06-25 安徽大学 一种基于生成对抗及卷积循环神经网络的机电轴承故障检测方法及应用***

Also Published As

Publication number Publication date
CN113485863A (zh) 2021-10-08

Similar Documents

Publication Publication Date Title
CN113485863B (zh) 基于改进生成对抗网络生成异构不平衡故障样本的方法
CN111914873B (zh) 一种两阶段云服务器无监督异常预测方法
CN107561997B (zh) 一种基于大数据决策树的电力设备状态监测方法
CN107657250B (zh) 轴承故障检测及定位方法及检测定位模型实现***和方法
CN108459955B (zh) 基于深度自编码网络的软件缺陷预测方法
CN116300691B (zh) 一种多轴联动数控加工的状态监测方法及***
CN111027615B (zh) 基于机器学习的中间件故障预警方法和***
Yacout Fault detection and diagnosis for condition based maintenance using the logical analysis of data
CN110851654A (zh) 基于张量化数据降维的工业设备故障检测分类方法
CN117421582A (zh) 一种基于多源数据驱动的设备健康分析方法
CN117131110B (zh) 一种基于关联分析的容性设备介质损耗监测方法及***
CN113064873B (zh) 一种高召回率的日志异常检测方法
Amruthnath et al. Factor analysis in fault diagnostics using random forest
CN114487673A (zh) 一种基于Transformer的电力设备故障检测模型和电子设备
CN115310837A (zh) 基于因果图注意力神经网络的复杂机电***故障检测方法
CN110779988A (zh) 一种基于深度学习的螺栓寿命预测方法
CN116467652A (zh) 一种基于卷积降噪自编码器的轴承故障预测方法及***
CN115564075B (zh) 一种城市电网主配一体故障协同诊断方法、***
CN116910559A (zh) 一种面向电网超算中心智能运维应用的指标异常检测方法
CN114781450B (zh) 一种基于参数优化momeda-mia-cnn的列车滚动轴承状态识别方法
CN115730255A (zh) 基于迁移学习和多源信息融合的电机故障诊断分析方法
CN115392710A (zh) 一种基于数据过滤的风电机组运行决策方法及***
CN116007937A (zh) 一种机械设备传动部件智能故障诊断方法及装置
CN115659135A (zh) 一种面向多源异构工业传感器数据的异常检测方法
CN115470854A (zh) 信息***故障分类方法及分类***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant