CN116089870A - 基于元学习的小样本条件下工业设备故障预测方法及装置 - Google Patents

基于元学习的小样本条件下工业设备故障预测方法及装置 Download PDF

Info

Publication number
CN116089870A
CN116089870A CN202211622060.8A CN202211622060A CN116089870A CN 116089870 A CN116089870 A CN 116089870A CN 202211622060 A CN202211622060 A CN 202211622060A CN 116089870 A CN116089870 A CN 116089870A
Authority
CN
China
Prior art keywords
training
industrial equipment
fault prediction
target domain
prediction model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211622060.8A
Other languages
English (en)
Inventor
黄必清
莫语
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202211622060.8A priority Critical patent/CN116089870A/zh
Publication of CN116089870A publication Critical patent/CN116089870A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及故障预测技术领域,特别涉及一种基于元学习的小样本条件下工业设备故障预测方法及装置,其中,包括:获取工业设备在源域和目标域的时间序列数据集;根据源域数据集构建伪任务集合;利用伪任务集合在源域进行元学习模型的训练,并在目标域进行调整,得到适用于目标域的故障预测模型,其中,目标域训练时的学习率、训练轮次和训练样本数量均小于源域;利用目标域的故障预测模型预测工业设备的故障预测值,若故障预测值大于预设阈值,则判定工业设备故障,否则判定工业设备正常。由此,解决了相关技术中由于从工业设备上所能提取的故障样本较少导致训练得到的深度模型的准确度偏低、无法满足故障预测需求等问题。

Description

基于元学习的小样本条件下工业设备故障预测方法及装置
技术领域
本申请涉及数据驱动的工业设备故障预测技术领域,特别涉及一种基于元学习的小样本条件下工业设备故障预测方法及装置。
背景技术
目前针对工业设备的故障预测方法主要分为三种,即基于物理模型的故障预测方法、基于传统机器学习的故障预测方法和基于深度学习的故障预测方法,其中,基于物理模型的故障预测是通过对设备的物理状态进行建模分析,通过物理状态的直观改变来预测;基于传统机器学习的方法是通过一些简单的数学建模或者神经网络结构来拟合时序数据与故障发生时间之间的函数关系,包括支持向量机、蒙特卡洛方法等;而由于当前计算机算力的提升和人工智能技术的快速发展,基于深度学习的故障预测方法得到了快速的发展,并且取得了令人瞩目的成果。
相关技术中,基于深度学习的故障预测方法需要大量的故障样本来训练得到有效的深度模型,而在实际工业中,往往不会等到设备出现故障再进行维修而是在设备运行一段时间后就开始维护,导致所能采集到的故障样本较少,除此之外,部分工业设备的生命周期往往很长,因此往往没有足够多的故障样本。
而目前可以通过以下两种方法来应对故障样本较少的情况,如在实验室中通过极端负载或者使用脆弱材料制成的部件来加速退化过程以及应用指数故障来模拟常规的退化过程,虽然这两种方式均在一定程度上缓解了真实样本不足的情况,但是现实的工作条件和故障模式不能被完美模拟导致会存在一定的误差,使得结果并不准确。
发明内容
本申请提供一种工业设备故障预测方法、装置、电子设备及存储介质,以解决相关技术中由于从工业设备上所能提取的故障样本较少导致训练得到的深度模型的准确度偏低、无法满足故障预测需求等问题。
本申请第一方面实施例提供一种工业设备故障预测方法,包括以下步骤:获取工业设备在源域和目标域的时间序列数据集;根据所述源域的时间序列数据集构建伪任务数据集,利用所述伪任务数据集在所述源域进行元学习训练,得到适用于所述源域的故障预测模型;利用所述目标域的时间序列数据集对所述故障预测模型进行调整,得到适用于所述目标域的故障预测模型,其中,所述目标域训练时的学习率小于所述源域训练时的学习率,所述目标域训练时的训练轮次小于所述源域训练时的训练轮次,且所述目标域的训练样本数量小于所述源域的训练样本数量;利用所述目标域的故障预测模型预测所述工业设备的故障预测值,若所述故障预测值大于预设阈值,则判定所述工业设备故障,否则判定所述工业设备正常。
可选地,所述利用所述伪任务数据集在所述源域进行元学习训练,得到适用于所述源域的故障预测模型,包括:从所述伪任务数据集中随机选择一个或多个训练任务;根据所述一个或多个训练任务对构建的故障预测模型进行元学习的内更新,并计算每个训练任务的训练损失值;根据所述每个训练任务的训练损失值的综合损失值对所述故障预测模型的参数进行外更新,将所述外更新后的参数作为一次训练的最终模型参数,直到满足所述故障预测模型的训练完成条件时,停止迭代训练,得到适用于所述源域的故障预测模型。
可选地,所述利用所述目标域的时间序列数据集对所述故障预测模型进行调整,得到适用于所述目标域的故障预测模型,包括:根据所述时间序列数据集的样本调整所述源域的故障预测模型的参数,以将所述故障预测模型从所述源域迁移至所述目标域,在参数调整完成之后,得到适用于所述目标域的故障预测模型。
可选地,所述根据所述源域的时间序列数据集构建伪任务数据集,包括:从所述时间序列数据集中随机选择故障数据作为训练任务的测试集;计算所述测试集中测试样本与所述时间序列数据集中每个时间序列的相似度衡量,选取预设个相似度衡量大于预设衡量的时间序列作为所述训练任务的训练集,基于所述测试集和所述训练集构建所述伪任务数据集。
可选地,在根据所述源域的时间序列数据集构建伪任务数据集之前,还包括:对所述目标域的时间序列数据进行归一化处理和数据增强处理,并在不同传感器数据维度中添加高斯噪声或者均匀噪声,得到处理后的时间序列数据。
本申请第二方面实施例提供一种工业设备故障预测方法,包括以下步骤:获取工业设备的运行数据;将所述运行数据输入训练完成的故障预测模型,输出所述工业设备的故障预测值,其中,所述故障预测模型基于所述工业设备在源域和目标域的时间序列数据集训练得到;若所述故障预测值大于预设阈值,则判定所述工业设备故障,否则判定所述工业设备正常。
本申请第三方面实施例提供一种工业设备故障预测装置,包括:第一获取模块,用于获取工业设备在源域和目标域的时间序列数据集;构建模块,用于根据所述源域的时间序列数据集构建伪任务数据集,利用所述伪任务数据集在所述源域进行元学习训练,得到适用于所述源域的故障预测模型;调整模块,用于利用所述目标域的时间序列数据集对所述故障预测模型进行调整,得到适用于所述目标域的故障预测模型,其中,所述目标域训练时的学习率小于所述源域训练时的学习率,所述目标域训练时的训练轮次小于所述源域训练时的训练轮次,且所述目标域的训练样本数量小于所述源域的训练样本数量;预测模块,用于利用所述目标域的故障预测模型预测所述工业设备的故障预测值,若所述故障预测值大于预设阈值,则判定所述工业设备故障,否则判定所述工业设备正常。
本申请第四方面实施例提供一种工业设备故障预测装置,包括:第二获取模块,用于获取工业设备的运行数据;输入输出模块,用于将所述运行数据输入训练完成的故障预测模型,输出所述工业设备的故障预测值,其中,所述故障预测模型基于所述工业设备在源域和目标域的时间序列数据集训练得到;判定模块,用于若所述故障预测值大于预设阈值,则判定所述工业设备故障,否则判定所述工业设备正常。
本申请第五方面实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如上述实施例所述的工业设备故障预测方法。
本申请第六方面实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以用于实现如上述实施例所述的工业设备故障预测方法。
由此,本申请至少具有如下有益效果:
(1)本申请实施例通过元学习训练方法训练的模型,不是针对某一种任务进行参数优化,而是适用于多种任务;因此该方法训练的模型参数能够在少量样本的微调下快速适应新的任务,完成小样本条件下的工业设备故障预测。
(2)本申请实施例使用了先进的元学习训练方法和伪任务集合构造方法,使得模型能够快速适应目标域工况,大大提高了深度模型在小样本条件下的故障预测准确率。
(3)本申请实施例没有对深度神经网络结构进行修改,理论上适用于大多数的梯度下降算法,可以和传统的故障预测模型无缝结合,提高了本申请实施例的适用范围。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本申请一个实施例提供的一种工业设备故障预测方法的流程图;
图2为根据本申请实施例提供的基于元学习的小样本条件下的工业设备故障预测方法训练及使用的流程图;
图3为根据本申请另一个实施例提供的一种工业设备故障预测方法的流程图;
图4为根据本申请一个实施例提供的一种工业设备故障预测装置的方框示意图;
图5为根据本申请另一个实施例提供的一种工业设备故障预测装置的方框示意图;
图6为根据本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的工业设备故障预测方法、装置、电子设备及存储介质。针对上述背景技术中提到的相关技术中由于从工业设备上所能提取的故障样本较少导致训练得到的深度模型的准确度偏低、无法满足故障预测需求等问题,本申请提供了一种工业设备故障预测方法,在该方法中,通过获取工业设备在源域和目标域的时间序列数据集,根据源域数据集构建伪任务集合;利用伪任务集合在源域进行元学习模型的训练,并在目标域进行调整,得到适用于目标域的故障预测模型,并利用目标域的故障测试模型预测工业设备的故障预测值,若故障预测值大于一定阈值则判定工业设备故障,否则判定设备正常,能够满足在故障样本较少的情况下的设备故障预测模型的训练,同时该方法不受神经网络结构的限制,能够满足当前绝大多数的梯度下降算法,实现小样本条件下的目标设备故障预测,大大提高了深度模型在小样本条件下的故障预测准确率,提高了适用范围。由此,解决了相关技术中由于从工业设备上所能提取的故障样本较少导致训练得到的深度模型的准确度偏低、无法满足故障预测需求等问题。
具体而言,图1为本申请实施例所提供的一种工业设备故障预测方法的流程示意图。
如图1所示,该工业设备故障预测方法包括以下步骤:
在步骤S101中,获取工业设备在源域和目标域的时间序列数据集。
其中,源域表示有标签的、能够训练模型的领域;目标域表示无标签或者只有少量标签的领域,在此不做具体限定。
其中,时间序列数据集可以是工业设备从生命周期开始到传感器记录时刻的全部数据,如流量传感器数据、压力传感器数据、温度传感器数据等传感器记录的能够反映工业设备状态的相关预处理后的数据和设备工况记录数据、操作状态数据等预处理后的时序数据,用于描述现象随着时间变化的情况,在此不做具体限定。
可以理解的是,本申请实施例通过不同传感器获取工业设备在源域和目标域的时间序列数据集,以便于后续对数据集进行训练得到故障预测数据模型。
在步骤S102中,根据源域的时间序列数据集构建伪任务数据集,利用伪任务数据集在源域进行元学习训练,得到适用于源域的故障预测模型。
其中,伪任务数据集可以为每个标签样本匹配最相似的时间序列数据,使标签与真实便签近似,在此不做具体限定。
其中,元学习训练可以使得模型获取一种学会学习调参的能力,使其在获取已有知识的基础上快速学习新的任务,在此不做具体限定。
可以理解的是,本申请实施例源域的时间序列数据集构建伪任务数据集,利用伪任务数据集在源域进行元学习训练,得到适用于源域的故障预测模型,以便于后续将在源域训练的元学习模型迁移至目标域。
在本申请实施例中,在根据源域的时间序列数据集构建伪任务数据集之前,还包括:对目标域的时间序列数据进行归一化处理和数据增强处理,并在不同传感器数据维度中添加高斯噪声或者均匀噪声,得到处理后的时间序列数据。
其中,归一化处理可以是将不同尺度的物理量的数值范围归一化到0-1之间,归一化处理的计算公式为:
Figure BDA0004002491640000051
其中,特征纬度中数值最大的为xmax,数值最小的为xmin,标准化后的数据为x^。
其中,数据增强处理可以是在当前传感器的数值基础上,随机选择一个在-10%到10%之间的比例,将该比例乘以当前的传感器数值后加到当前传感器数值上,在此不做具体限定。
可以理解的是,本申请实施例通过对目标域的时间序列数据进行归一化处理和数据增强处理,从而可以加快神经网络的收敛速度,加快网络的训练速度,提高深度神经网络的故障预测准确性;并在不同传感器数据维度中添加高斯噪声或者均匀噪声,得到处理后的时间序列数据,从而提高故障预测模型的泛化能力。
在本申请实施例中,根据源域的时间序列数据集构建伪任务数据集,包括:从时间序列数据集中随机选择故障数据作为训练任务的测试集;计算测试集中测试样本与时间序列数据集中每个时间序列的相似度衡量,选取预设个相似度衡量大于预设衡量的时间序列作为训练任务的训练集,基于测试集和训练集构建伪任务数据集。
其中,相似度衡量可以采用欧式距离相似度衡量或者DTW相似度衡量方式,可根据用户的实际需求进行选定,在此不做具体限定。
其中,欧式距离相似度衡量计算方式为:
Figure BDA0004002491640000061
其中
Figure BDA0004002491640000062
表示第i个时间序列的第l个时刻,同理
Figure BDA0004002491640000063
表示第j个时间序列的第l个时刻。
其中,DTW相似度衡量计算方式为:
Figure BDA0004002491640000064
其中
Figure BDA0004002491640000065
表示第i个时间序列的第p个时刻,同理
Figure BDA0004002491640000066
表示第j个时间序列的第q个时刻,
Figure BDA0004002491640000067
是针对不同长度的时间序列的变换函数,
Figure BDA0004002491640000068
是归一化因子,可以表示为两个时间序列的长度之和。
其中,预设个相似度衡量可以根据用户需求设定有数个相似度衡量,在此不做具体限定。
其中,预设衡量的时间序列可以是用户事先设定的衡量的时间序列,在此不做具体限定。
可以理解的是,本申请实施例从时间序列数据集中随机选择一定的故障数据作为训练任务的测试集,计算测试集中的测试样本与时间序列数据集中每个时间序列的相似度衡量,选取相对度大于一定值的时间序列作为训练任务的训练集,并基于测试集和训练集构建伪任务数据集,以便于后续将在源域训练一个元学习模型并迁移至目标域。
在步骤S103中,利用目标域的时间序列数据集对故障预测模型进行调整,得到适用于目标域的故障预测模型,其中,目标域训练时的学习率小于源域训练时的学习率,目标域训练时的训练轮次小于源域训练时的训练轮次,且目标域的训练样本数量小于源域的训练样本数量。
其中,故障预测模型可以是任意能够完成故障预测的深度神经网络模型,在此不做具体限定。
其中,学习率可以是作为监督学习以及深度学习中重要的超参,其决定着目标函数能否收敛到局部最小值以及何时收敛到最小值,而合适的学习率能够使目标函数在合适的时间内收敛到局部最小值,在此不做具体限定。
可以理解的是,本申请实施例利用目标域的时间序列数据集对故障预测模型进行调整,得到适用于目标域的故障预测模型,能够实现小样本条件下的目标设备故障预测,并提高了深度模型在小样本条件下的故障预测准确率。
需要说明的是,利用目标域的时间序列数据集对故障预测模型进行调整是指在深度学习中,模型首先利用大量数据在源域中进行训练,在将模型迁移到目标域时,由于不希望模型参数有太大的改变,因此利用目标域的少量样本,简单的对模型参数进行更新,提高了故障预测模型在小样本条件下的故障预测准确率。
在本申请实施例中,利用伪任务数据集在源域进行元学习训练,得到适用于源域的故障预测模型,包括:从伪任务数据集中随机选择一个或多个训练任务;根据一个或多个训练任务对构建的故障预测模型进行元学习的内更新,并计算每个训练任务的训练损失值;根据每个训练任务的训练损失值的综合损失值对故障预测模型的参数进行外更新,将外更新后的参数作为一次训练的最终模型参数,直到满足故障预测模型的训练完成条件时,停止迭代训练,得到适用于源域的故障预测模型。
可以理解的是,本申请实施例从伪任务数据集中随机选取训练任务,并对构建的故障预测模型进行元学习的内更新,并计算每个训练任务的训练损失值,并根据每个训练任务的训练损失值计算出综合损失值,并对故障预测模型的参数进行外更新,将其作为一次训练的最终模型参数,直至满足故障预测模型的训练完成条件,将传统的深度学习训练方式修改为内更新和外更新两个训练阶段,能够满足当前绝大多数的梯度下降模型,实现小样本条件下的目标设备故障预测。
在本申请实施例中,利用目标域的时间序列数据集对故障预测模型进行调整,得到适用于目标域的故障预测模型,包括:根据时间序列数据集的样本调整源域的故障预测模型的参数,以将故障预测模型从源域迁移至目标域,在参数调整完成之后,得到适用于目标域的故障预测模型。
可以理解的是,本申请实施例根据时间序列数据集的样本调整源域的故障预测模型的参数,将故障预测模型从源域迁移至目标域,并在参数调整完成之后,得到适用于目标域的故障预测模型,使得模型能够快速适应目标域工况,大大提高了深度模型在小样本条件下的故障预测准确率。
在步骤S104中,利用目标域的故障预测模型预测工业设备的故障预测值,若故障预测值大于预设阈值,则判定工业设备故障,否则判定工业设备正常。
其中,预设阈值可以是用户设定的阈值,可根据实际情况进行设定,在此不做具体限定。
可以理解的是,本申请实施例利用目标域的故障测试模型预测工业设备的故障预测值,若故障预测值大于一定值则判定工业设备故障,否则判定设备正常,根据故障测试模型提高对工业设备故障预测的准确度。
根据本申请实施例提出的工业设备故障预测方法,通过获取工业设备在源域和目标域的时间序列数据集,根据源域数据集构建伪任务集合;利用伪任务集合在源域进行元学习模型的训练,并在目标域进行调整,得到适用于目标域的故障预测模型,并利用目标域的故障测试模型预测工业设备的故障预测值,若故障预测值大于一定阈值则判定工业设备故障,否则判定设备正常,能够满足在故障样本较少的情况下的设备故障预测模型的训练,同时该方法不受神经网络结构的限制,能够满足当前绝大多数的梯度下降算法,实现小样本条件下的目标设备故障预测,大大提高了深度模型在小样本条件下的故障预测准确率,提高了适用范围。由此,解决了相关技术中由于从工业设备上所能提取的故障样本较少导致训练得到的深度模型的准确度偏低、无法满足故障预测需求等问题。
下面对工业设备故障预测方法进行详细阐述,具体步骤如下:
步骤S1:获取典型工业设备传感器数据,构造目标设备健康状态下在源域和目标域的时间序列数据集。
其中,时间序列数据集包括目标设备从生命周期开始到传感器记录时刻的全部数据。
步骤S2:利用特征评判标准从时间序列数据集中筛选能够反应目标设备健康状态退化的传感器维度。
从流量传感器数据、压力传感器数据、温度传感器数据等数据中筛选出能够反映目标设备状态的相关预处理后的数据和设备工况记录数据、操作状态数据等预处理后的时序数据。
步骤S3:对筛选的传感器特征维度进行数据预处理得到特征向量,其中数据预处理可以包括:数据标准化、数据增强等。
而预处理的目的在于将不同尺度的物理量的数值范围归一化到0-1之间,从而可以加快神经网络的收敛速度,加快网络的训练速度,提高深度神经网络的故障预测准确性。
具体而言,本申请实施例使用Max-Min归一化方式,而归一化处理的计算公式为:
Figure BDA0004002491640000081
其中,特征纬度中数值最大的为xmax,数值最小的为xmin,标准化后的数据为x^。
除此之外,针对采集的时间序列数据,可以向不同的传感器数据维度中添加幅度合适的高斯噪声或者均匀噪声,提高故障预测模型的泛化能力。其中,针对高斯噪声,采用的方式是在时间序列数据归一化之前,生成一定幅度的高斯噪声并附加到传感器的数据上,添加均匀噪声的方法是在数据归一化之前,在当前传感器的数值基础上,随机选择一个在-10%到10%之间的比例,将该比例乘以当前的传感器数值后加到当前传感器数值上。
步骤S4:根据特征向量和深度故障预测模型,对目标设备进行故障预测。
其中,对目标设备进行故障预测的前提是得到适用于目标域的故障预测模型,可以先通过时间序列相似度匹配方法进行伪任务集合构建,然后对伪任务数据集进行学习和测试训练得到对应的预测故障模型,从而满足元学习训练模型的任务量需求。
在本方法中需要在源域训练一个元学习模型并迁移至目标域,因此需要在源域和目标域构建伪任务集合。
具体构建方式为:在故障样本丰富的源域随机选择一条故障数据将其作为任务n的测试集testn,随后使用欧式距离相似度衡量或者DTW相似度衡量方式在源域选TopK个最相似的时间序列作为任务n的训练集trainn。由此任务n可以表示为testn和trainn的组合,将其表示为taskn
其中,欧式距离相似度衡量计算方式为:
Figure BDA0004002491640000091
其中
Figure BDA0004002491640000092
表示第i个时间序列的第l个时刻,同理
Figure BDA0004002491640000093
表示第j个时间序列的第l个时刻。
其中,DTW相似度衡量计算方式为:
Figure BDA0004002491640000094
其中
Figure BDA0004002491640000095
表示第i个时间序列的第p个时刻,同理
Figure BDA0004002491640000096
表示第j个时间序列的第q个时刻,
Figure BDA0004002491640000097
是针对不同长度的时间序列的变换函数,
Figure BDA0004002491640000098
是归一化因子,可以表示为两个时间序列的长度之和。
在目标域时,有少量的故障样本并通过有数个需要进行故障预测的时间序列,而这些时间序列没有标签。此时,需要类似于在源域的构建伪任务集合的方式,为每一个无标签样本在目标域匹配K个最相似的时间序列,并用匹配到的时间序列对模型进行微调后,再对该无标签样本进行故障预测。
而故障预测模型可以是任一能够完成故障预测的深度神经网络模型,针对不同的神经网络模型,可能需要不同的数据处理方式,下面将以Transformer网络为例进行具体说明:
将数据整理成b×seq×dim维度,其中dim为传感器特征维度,seq表示为传感器记录的数据长度,b表示为batch(批处理),满足神经网络并行化计算的需要;在一个batch内的seq长度应保持一致,因此可以为较短的时间序列补0,从而保证序列长度的一致性;将Transformer模型表示为Model(模型),实际上该模型可以为任一可以完成深度神经网络训练的深度模型。
而故障预测模型的训练分为两个阶段,即Inner-Update(内更新)和Outer-Update(外更新)。在Inner-Update(内更新)阶段的梯度更新方式和传统的深度学习训练方式一致,例如随机选择一个任务taskn并使用该任务训练模型,模型参数更新方式为:
Figure BDA0004002491640000101
这里为了表述简化只使用了一次梯度下降,实际上在Inner-update中可以使用多次梯度下降,然后使用更新后的模型在任务taskn的测试集testn上进行测试,得到在该任务上的损失
Figure BDA0004002491640000102
以上表述均是在一个任务上的情况,但实际上会随机选择Batch个任务进行Inner-update,在得到这些任务的损失后再进行Outer-update,其计算公式如下所示:
Figure BDA0004002491640000103
具体地,在本申请的一个实施例中,基于元学习的小样本条件下的设备故障预测模型训练的伪代码如表1所示:
表1
Figure BDA0004002491640000104
本申请实施例使用了健康评估、故障预测领域常用的评价函数即均方根误差(RMSE)来评估模型的预测准确型,其计算方式为:
Figure BDA0004002491640000111
其中m为样本数量,yt为真实标签,y*为预测标签。
具体而言,如图2所示,本申请实施例的故障预测方法具体包括以下两个阶段:
(1)元学习阶段:针对源域中每一条时间序列,将其作为任务n的测试集testn,并根据时间相似度匹配方法在源域中为每一个时间序列匹配K个最相似的时间序列,作为任务n的训练集trainn;然后随机选择batch个伪任务的训练集进行元学习的内更新,该阶段并不会直接改变模型的参数,而是计算出每一个伪任务在此时模型参数下的损失后,进行外更新,外更新后的参数作为一次训练的最终模型参数,通过多次训练后完成元学习阶段。
(2)元测试阶段:针对每一个需要进行故障预测时间序列样本通过时间相似度匹配的方式从目标源的少量样本中匹配K个相似的样本,形成此样本的训练集,并使用该训练集对模型的参数进行微调后,再对该样本进行故障预测。
本申请实施例能够适用于故障样本少的目标工业设备,并完成准确的故障预测,同时没有对深度神经网络结构进行修改,理论上适用于大多数的梯度下降算法,可以实现小样本条件下的设备健康状态的预测。
需要说明的是,上述实施例是在线状态下通过构建故障预测模型对工业设备进行故障预测,从而实现小样本条件下的目标设备故障预测;而下述实施例是离线状态下利用故障预测模型对工业设备进行故障预测,具体如下:
图3是本申请实施例的工业设备故障预测方法的流程图。
如图3所示,该工业设备故障预测方法包括以下步骤:
在步骤S201中,获取工业设备的运行数据。
可以理解的是,本申请实施例通过采集设备等获取工业设备的运行数据,以便于后续判断设备是否正常。
在步骤S202中,将运行数据输入训练完成的故障预测模型,输出工业设备的故障预测值,其中,故障预测模型基于工业设备在源域和目标域的时间序列数据集训练得到。
可以理解的是,本申请实施例将运行数据输入训练完成的故障预测模型,输出工业设备的故障预测值,以便于后续根据故障预测值判断工业设备是否故障。
在步骤S203中,若故障预测值大于预设阈值,则判定工业设备故障,否则判定工业设备正常。
可以理解的是,本申请实施例在故障预测值大于设定阈值,则判断故障设备故障,否则判断工业设备可以正常运行,从而可以实现小样本条件下的设备健康状态的预测。
根据本申请实施例提出的工业设备故障预测方法,通过获取工业设备的运行数据,将运行数据输入训练完成的故障预测模型,输出工业设备的故障预测值,在故障预测值大于设定阈值,则判断故障设备故障,否则判断工业设备可以正常运行,从而可以实现小样本条件下的设备健康状态的预测。
其次参照附图描述根据本申请实施例提出的工业设备故障预测装置。
图4是本申请实施例的工业设备故障预测装置的方框示意图。
如图4所示,该工业设备故障预测装置20包括:第一获取模块210、构建模块220、训练模块230和预测模块240。
其中,第一获取模块210用于获取工业设备在源域和目标域的时间序列数据集;构建模块220用于根据源域的时间序列数据集构建伪任务数据集,利用伪任务数据集在源域进行元学习训练,得到适用于源域的故障预测模型;调整模块230用于利用目标域的时间序列数据集对故障预测模型进行调整,得到适用于目标域的故障预测模型,其中,目标域训练时的学习率小于源域训练时的学习率,目标域训练时的训练轮次小于源域训练时的训练轮次,且目标域的训练样本数量小于源域的训练样本数量;预测模块240用于利用目标域的故障预测模型预测工业设备的故障预测值,若故障预测值大于预设阈值,则判定工业设备故障,否则判定工业设备正常。
需要说明的是,前述对工业设备故障预测方法实施例的解释说明也适用于该实施例的工业设备故障预测装置,此处不再赘述。
根据本申请实施例提出的工业设备故障预测装置,通过获取工业设备在源域和目标域的时间序列数据集,根据源域数据集构建伪任务集合;利用伪任务集合在源域进行元学习模型的训练,并在目标域进行调整,得到适用于目标域的故障预测模型,并利用目标域的故障测试模型预测工业设备的故障预测值,若故障预测值大于一定阈值则判定工业设备故障,否则判定设备正常,能够满足在故障样本较少的情况下的设备故障预测模型的训练,同时该方法不受神经网络结构的限制,能够满足当前绝大多数的梯度下降算法,实现小样本条件下的目标设备故障预测,大大提高了深度模型在小样本条件下的故障预测准确率,提高了适用范围。由此,解决了相关技术中由于从工业设备上所能提取的故障样本较少导致训练得到的深度模型的准确度偏低、无法满足故障预测需求等问题。
其次参照附图描述根据本申请实施例提出的工业设备故障预测装置。
图5是本申请实施例的工业设备故障预测装置的方框示意图。
如图5所示,该工业设备故障预测装置30包括:第二获取模块310、输入输出模块320和判定模块330。
其中,第二获取模块310用于获取工业设备的运行数据;输入输出模块320用于将运行数据输入训练完成的故障预测模型,输出工业设备的故障预测值,其中,故障预测模型基于工业设备在源域和目标域的时间序列数据集训练得到;判定模块330用于若故障预测值大于预设阈值,则判定工业设备故障,否则判定工业设备正常。
需要说明的是,前述对工业设备故障预测方法实施例的解释说明也适用于该实施例的工业设备故障预测装置,此处不再赘述。
根据本申请实施例提出的工业设备故障预测方法,通过获取工业设备的运行数据,将运行数据输入训练完成的故障预测模型,输出工业设备的故障预测值,在故障预测值大于设定阈值,则判断故障设备故障,否则判断工业设备可以正常运行,从而可以实现小样本条件下的设备健康状态的预测。
图6为本申请实施例提供的电子设备的结构示意图。该电子设备可以包括:
存储器601、处理器602及存储在存储器601上并可在处理器602上运行的计算机程序。
处理器602执行程序时实现上述实施例中提供的工业设备故障预测方法。
进一步地,电子设备还包括:
通信接口603,用于存储器601和处理器602之间的通信。
存储器601,用于存放可在处理器602上运行的计算机程序。
存储器601可能包含高速RAM(Random Access Memory,随机存取存储器)存储器,也可能还包括非易失性存储器,例如至少一个磁盘存储器。
如果存储器601、处理器602和通信接口603独立实现,则通信接口603、存储器601和处理器602可以通过总线相互连接并完成相互间的通信。总线可以是ISA(IndustryStandard Architecture,工业标准体系结构)总线、PCI(Peripheral Component,外部设备互连)总线或EISA(Extended Industry Standard Architecture,扩展工业标准体系结构)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器601、处理器602及通信接口603,集成在一块芯片上实现,则存储器601、处理器602及通信接口603可以通过内部接口完成相互间的通信。
处理器602可能是一个CPU(Central Processing Unit,中央处理器),或者是ASIC(Application Specific Integrated Circuit,特定集成电路),或者是被配置成实施本申请实施例的一个或多个集成电路。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上的工业设备故障预测方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不是必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或N个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“N个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更N个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,N个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列,现场可编程门阵列等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

Claims (10)

1.一种工业设备故障预测方法,其特征在于,包括以下步骤:
获取工业设备在源域和目标域的时间序列数据集;
根据所述源域的时间序列数据集构建伪任务数据集,利用所述伪任务数据集在所述源域进行元学习训练,得到适用于所述源域的故障预测模型;
利用所述目标域的时间序列数据集对所述故障预测模型进行调整,得到适用于所述目标域的故障预测模型,其中,所述目标域训练时的学习率小于所述源域训练时的学习率,所述目标域训练时的训练轮次小于所述源域训练时的训练轮次,且所述目标域的训练样本数量小于所述源域的训练样本数量;
利用所述目标域的故障预测模型预测所述工业设备的故障预测值,若所述故障预测值大于预设阈值,则判定所述工业设备故障,否则判定所述工业设备正常。
2.根据权利要求1所述的方法,其特征在于,所述利用所述伪任务数据集在所述源域进行元学习训练,得到适用于所述源域的故障预测模型,包括:
从所述伪任务数据集中随机选择一个或多个训练任务;
根据所述一个或多个训练任务对构建的故障预测模型进行元学习的内更新,并计算每个训练任务的训练损失值;
根据所述每个训练任务的训练损失值的综合损失值对所述故障预测模型的参数进行外更新,将所述外更新后的参数作为一次训练的最终模型参数,直到满足所述故障预测模型的训练完成条件时,停止迭代训练,得到适用于所述源域的故障预测模型。
3.根据权利要求1所述的方法,其特征在于,所述利用所述目标域的时间序列数据集对所述故障预测模型进行调整,得到适用于所述目标域的故障预测模型,包括:
根据所述时间序列数据集的样本调整所述源域的故障预测模型的参数,以将所述故障预测模型从所述源域迁移至所述目标域,在参数调整完成之后,得到适用于所述目标域的故障预测模型。
4.根据权利要求1所述的方法,其特征在于,所述根据所述源域的时间序列数据集构建伪任务数据集,包括:
从所述时间序列数据集随机选择故障数据作为训练任务的测试集;
计算所述测试集中测试样本与所述时间序列数据集中每个时间序列的相似度衡量,选取预设个相似度衡量大于预设衡量的时间序列作为所述训练任务的训练集,基于所述测试集和所述训练集构建所述伪任务数据集。
5.根据权利要求1所述的方法,其特征在于,在根据所述源域的时间序列数据集构建伪任务数据集之前,还包括:
对所述目标域的时间序列数据进行归一化处理和数据增强处理,并在不同传感器数据维度中添加高斯噪声或者均匀噪声,得到处理后的时间序列数据。
6.一种工业设备故障预测方法,其特征在于,包括以下步骤:
获取工业设备的运行数据;
将所述运行数据输入训练完成的故障预测模型,输出所述工业设备的故障预测值,其中,所述故障预测模型基于所述工业设备在源域和目标域的时间序列数据集训练得到;
若所述故障预测值大于预设阈值,则判定所述工业设备故障,否则判定所述工业设备正常。
7.一种工业设备故障预测装置,其特征在于,包括:
第一获取模块,用于获取工业设备在源域和目标域的时间序列数据集;
构建模块,用于根据所述源域的时间序列数据集构建伪任务数据集,利用所述伪任务数据集在所述源域进行元学习训练,得到适用于所述源域的故障预测模型;
调整模块,用于利用所述目标域的时间序列数据集对所述故障预测模型进行调整,得到适用于所述目标域的故障预测模型,其中,所述目标域训练时的学习率小于所述源域训练时的学习率,且所述目标域训练时的训练轮次小于所述源域训练时的训练轮次,所述目标域的训练样本数量小于所述源域的训练样本数量;
预测模块,用于利用所述目标域的故障预测模型预测所述工业设备的故障预测值,若所述故障预测值大于预设阈值,则判定所述工业设备故障,否则判定所述工业设备正常。
8.一种工业设备故障预测装置,其特征在于,包括:
第二获取模块,用于获取工业设备的运行数据;
输入输出模块,用于将所述运行数据输入训练完成的故障预测模型,输出所述工业设备的故障预测值,其中,所述故障预测模型基于所述工业设备在源域和目标域的时间序列数据集训练得到;
判定模块,用于若所述故障预测值大于预设阈值,则判定所述工业设备故障,否则判定所述工业设备正常。
9.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求1-6任一项所述的工业设备故障预测方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以用于实现如权利要求1-6任一项所述的工业设备故障预测方法。
CN202211622060.8A 2022-12-16 2022-12-16 基于元学习的小样本条件下工业设备故障预测方法及装置 Pending CN116089870A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211622060.8A CN116089870A (zh) 2022-12-16 2022-12-16 基于元学习的小样本条件下工业设备故障预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211622060.8A CN116089870A (zh) 2022-12-16 2022-12-16 基于元学习的小样本条件下工业设备故障预测方法及装置

Publications (1)

Publication Number Publication Date
CN116089870A true CN116089870A (zh) 2023-05-09

Family

ID=86198316

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211622060.8A Pending CN116089870A (zh) 2022-12-16 2022-12-16 基于元学习的小样本条件下工业设备故障预测方法及装置

Country Status (1)

Country Link
CN (1) CN116089870A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116520814A (zh) * 2023-07-03 2023-08-01 清华大学 云边协同架构下基于联邦学习的设备故障预测方法及装置
CN116956197A (zh) * 2023-09-14 2023-10-27 山东理工昊明新能源有限公司 基于深度学习的能源设施故障预测方法、装置及电子设备
CN116881672B (zh) * 2023-09-05 2023-11-21 江西南昌济生制药有限责任公司 一种故障检测模型训练方法、装置、电子设备及存储介质
CN117114087A (zh) * 2023-10-23 2023-11-24 深圳开鸿数字产业发展有限公司 故障预测方法、计算机设备和可读存储介质

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116520814A (zh) * 2023-07-03 2023-08-01 清华大学 云边协同架构下基于联邦学习的设备故障预测方法及装置
CN116520814B (zh) * 2023-07-03 2023-09-05 清华大学 云边协同架构下基于联邦学习的设备故障预测方法及装置
CN116881672B (zh) * 2023-09-05 2023-11-21 江西南昌济生制药有限责任公司 一种故障检测模型训练方法、装置、电子设备及存储介质
CN116956197A (zh) * 2023-09-14 2023-10-27 山东理工昊明新能源有限公司 基于深度学习的能源设施故障预测方法、装置及电子设备
CN116956197B (zh) * 2023-09-14 2024-01-19 山东理工昊明新能源有限公司 基于深度学习的能源设施故障预测方法、装置及电子设备
CN117114087A (zh) * 2023-10-23 2023-11-24 深圳开鸿数字产业发展有限公司 故障预测方法、计算机设备和可读存储介质
CN117114087B (zh) * 2023-10-23 2024-02-13 深圳开鸿数字产业发展有限公司 故障预测方法、计算机设备和可读存储介质

Similar Documents

Publication Publication Date Title
CN116089870A (zh) 基于元学习的小样本条件下工业设备故障预测方法及装置
Attarzadeh et al. Proposing a new software cost estimation model based on artificial neural networks
JP5005814B2 (ja) バッテリーの長期特性予測システム及び方法
JP5313250B2 (ja) バッテリーの長期特性予測システム及び方法
JP2021047854A (ja) ニューラルネットワークに対するプルーニングを行う方法及びその装置
CN108509324B (zh) 选择计算平台的***和方法
CN107977748B (zh) 一种多变量扭曲时间序列预测方法
CN114787831B (zh) 改进分类模型的准确性
CN116450486B (zh) 多元异构计算***内节点的建模方法、装置、设备及介质
CN113487019A (zh) 电路故障诊断方法、装置、计算机设备和存储介质
Zhou et al. Aero-engine prognosis strategy based on multi-scale feature fusion and multi-task parallel learning
WO2022009010A1 (en) Model fidelity monitoring and regeneration for manufacturing process decision support
Zhao et al. A neural architecture search method based on gradient descent for remaining useful life estimation
CN107463486B (zh) ***性能分析方法、装置及服务器
US10628541B2 (en) Method and apparatus for selecting integrated circuit device neural network modeling sample
CN112417463A (zh) 软件漏洞预测方法、装置、计算机设备及存储介质
WO2020055659A1 (en) Generation and utilization of self-improving data-driven models with selective simulation of 3d object design
EP4012667A2 (en) Data preparation for artificial intelligence models
CN112598259A (zh) 产能测算方法、装置及计算机可读存储介质
CN117827668A (zh) 测试覆盖率提高装置、计算机设备及存储介质
CN112925271A (zh) 数据处理方法、自动控制方法及装置
CN111310907A (zh) 一种微波组件故障诊断方法、装置及设备
CN113722975B (zh) 网络模型训练方法、室温预测方法、装置、设备及介质
CN114254764B (zh) 基于反馈的机器学习模型搜索方法、***、设备及介质
CN112861951B (zh) 一种图像神经网络参数的确定方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination