CN112561383A - 一种基于生成对抗网络的实时异常检测方法 - Google Patents

一种基于生成对抗网络的实时异常检测方法 Download PDF

Info

Publication number
CN112561383A
CN112561383A CN202011547340.8A CN202011547340A CN112561383A CN 112561383 A CN112561383 A CN 112561383A CN 202011547340 A CN202011547340 A CN 202011547340A CN 112561383 A CN112561383 A CN 112561383A
Authority
CN
China
Prior art keywords
data
time
real
network
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011547340.8A
Other languages
English (en)
Inventor
崔向阳
刘佳雯
牛慧博
王楠
孟庆磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aerospace Science And Technology Network Information Development Co ltd
Original Assignee
Aerospace Science And Technology Network Information Development Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aerospace Science And Technology Network Information Development Co ltd filed Critical Aerospace Science And Technology Network Information Development Co ltd
Priority to CN202011547340.8A priority Critical patent/CN112561383A/zh
Publication of CN112561383A publication Critical patent/CN112561383A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/219Managing data history or versioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Quality & Reliability (AREA)
  • Strategic Management (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Economics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Biology (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明涉及一种基于生成对抗网络的实时异常检测方法,其中,包括:离线训练和实时检测;离线训练包括:将从生产设备采集的批量历史正常数据经过数据清洗后输入到生成对抗网络模型,对抗网络模型生成异常数据并进行鉴别检测,训练完成后将对抗网络模型部署到实时检测环境;实时检测包括:从生产设备采集实时数据,并同步将数据存储到历史数据库,实时数据经过数据清洗后,输入到生成对抗网络模型进行异常检测;当检测结果为正常时,将实时数据标注为正常数据,并回流输入到对抗网络模型进行增量训练;当检测结果为异常时,触发异常报警,等待人工处理,确认为异常结果时,将实时数据标注为异常数据,并回流到模型的鉴别网络部分进行增量训练。

Description

一种基于生成对抗网络的实时异常检测方法
技术领域
本发明涉及数据监督检测技术,特别涉及一种基于生成对抗网络的实时异常检测方法。
背景技术
基于生产线采集的时序过程数据对产品质量的异常做预测和判断的机器学习方法,已经在生产制造企业得到了广泛应用。
通过数据标注方式可以将这些方法归类为三种:
有监督异常检测方法,首先将产线数据标注为正常和异常两种类别,再使用经过标注的产线数据输入神经网络或随机森林等有监督机器学习模型做训练,然后使用模型对新采集的产线数据做预测。中国专利“异常指标检测方法、装置、计算机设备和存储介质”中,通过聚类筛选和人工标注的方式对正常、异常数据分别进行标注,然后将标注数据输入到循环神经网络模型进行训练,实施中通过无监督方法对异常数据进行预筛选,再使用循环神经网络有模型的有监督方法对异常情况进行预测。
无监督异常检测方法,常用无监督方法有基于密度的方法和基于聚类的方法等,将产线数据表示为多维空间的数据点,通过判断特定数据点与其它数据点的距离关系,判断数据的异常情况。中国专利“一种利用时序聚类算法实现故障检测的方法”提供了一种使用DBSCAN聚类算法对故障进行无监督检测的方法,对时序数据计算聚类后的异常分数值,根据异常分数值是否超过阈值判断是否存在异常。
半监督异常检测方法,适用于历史数据没有异常数据,或只包含极少异常数据的情况,只使用正常数据输入模型进行训练。中国专利“一种基于生成对抗网络的异常检测方法”提供了一种通过生成对抗网络模型对异常图像进行检测的方法,将真实图像输入到模型,模型的生产网络部分基于真实图像生成异常图像,模型的鉴别网络部分对图像判断是否存在异常。
有监督异常检测方法需要比较多的标注数据对模型进行训练,由于在制造业生产线中,异常数据通常较为稀少,且标注数据需要专业知识,标注成本较高,在很多产线质量异常检测的实际应用时,只会有很少的标注数据,或者甚至没有异常数据,有监督方法难以找到足够的数据对模型进行训练,无法有效识别异常数据。
无监督异常检测方法中对特定场景的先验参数通常难易确定,容易造成算法偏差,很多无监督方法需要人工确定类别个数或者类别间距离阈值,在只有正常数据的情况下,无监督方法难以发挥作用。
半监督异常检测方法,在通过正常数据生成异常数据时,产线的训练数据通常无法覆盖正常数据的完整数据分布。在使用历史数据训练完成后,产线数据经常有新的变化,半监督模型受限于历史数据,容易将正常数据误检测为异常数据。
发明内容
本发明的目的在于提供一种基于生成对抗网络的实时异常检测方法,用于有监督异常检测方式无法应用到缺失标注数据场景、无监督异常检测方式无法应用到缺失异常数据场景的问题。
本发明一种基于生成对抗网络的实时异常检测方法,其中,包括:离线训练和实时检测;离线训练包括:将从生产设备采集的批量历史正常数据经过数据清洗后输入到生成对抗网络模型,对抗网络模型生成异常数据并进行鉴别检测,训练完成后将对抗网络模型部署到实时检测环境;实时检测包括:从生产设备采集实时数据,并同步将数据存储到历史数据库,实时数据经过数据清洗后,输入到生成对抗网络模型进行异常检测;当检测结果为正常时,将实时数据标注为正常数据,并回流输入到对抗网络模型进行增量训练;当检测结果为异常时,触发异常报警,等待人工处理,确认为异常结果时,将实时数据标注为异常数据,并回流到模型的鉴别网络部分进行增量训练。
根据本发明所述的基于生成对抗网络的实时异常检测方法的一实施例,其中,离线训练具体包括:从生产设备采集实时数据;从生产设备的传感器实时采集过程数据以及生产结果数据;将采集的数据存储到历史数据库;对历史数据进行数据清洗,清洗为适合输入模型的数据格式。
根据本发明所述的基于生成对抗网络的实时异常检测方法的一实施例,其中,过程数据包括:转速、温度以及每一生产步骤持续时长。
根据本发明所述的基于生成对抗网络的实时异常检测方法的一实施例,其中,数据清洗具体包括:(1)将时序数据按时间排序;(2)去除重复数据;(3)补全缺失数据;(4)进行数据转换,对于生产数据特征,根据生产经验或者依据特征和产品质量的单调区间变化,进行阈值划分;(5)对生产数据进行数据特征间的组合,并且对位于时间序列不同时间的数据特征进行组合。将未组合的离散数据和组合后的数据与拼接后,一起输入到由全连接神经网络构成的编码器。
根据本发明所述的基于生成对抗网络的实时异常检测方法的一实施例,其中,训练生成对抗网络模型包括:将训练数据输入对抗网络模型,通过生成网络生成异常数据,并与正常数据一起输入到鉴别网络进行有监督训练,生成对抗网络模型;训练数据是由生产数据经过数据处理后生成的数据集,初始训练数据由正常数据组成。
根据本发明所述的基于生成对抗网络的实时异常检测方法的一实施例,其中,在训练生成对抗网络模型过程中,将正常的带标签有监督训练数据输入到鉴别网络学习正常的数据分布;后将训练数据中时间步1和时间步2的数据字段输入到生成网络,输出为预测时间步3的数据字段;将原始时间步1、时间步2的数据字段和预测得到的时间步3数据做拼接,异常数据标签值设置为1,作为异常数据输入鉴别网络,对鉴别网络做训练;鉴别网络经过梯度下降对网络参数权重做调整,并将梯度传播到生成网络,对生成网络做调整,以生成更难以区分的异常数据。
根据本发明所述的基于生成对抗网络的实时异常检测方法的一实施例,其中,在对抗网络模型中的神经网络类型选取全连接神经网络作为基础结构。
根据本发明所述的基于生成对抗网络的实时异常检测方法的一实施例,其中,异常检测包括:
使用生成对抗网络模型进行异常检测;
将数据输入到对抗网络模型的鉴别网络部分,对数据进行异常检测,实时的生产数据与训练数据相比缺少标签数据,对一个由3层神经网络构成的鉴别网络,其中第i层第j个神经元的计算公式为
Figure BDA0002856688560000041
其中x为生产数据中各时间步的数据字段,w为已训练收敛的网络权重,y为单个神经网络节点的输出数据;第i层神经网络的输出数据,构成第i+1层神经网络的输入数据;最后一层为单个神经网络节点,取大于阈值m的输出数据为异常数据,小于等于阈值m的输出数据为正常数据;
将检测为正常的数据回流到对抗网络模型进行增量训练;
首先将正常数据加上标签数据,在最后补上标签字段0,表示数据为正常数据,将增量正常训练数据输入到鉴别网络进行训练和参数更新;然后将正常数据的前两个时间步数据提取,输入到生成网络,预测输出第三个时间步的数据字段,与前两个时间步数据拼接后,生成新的异常数据;并将异常数据,输入鉴别网络进行训练和参数更新。
根据本发明所述的基于生成对抗网络的实时异常检测方法的一实施例,其中,阈值a为0.5。
根据本发明所述的基于生成对抗网络的实时异常检测方法的一实施例,其中,检测为异常的数据触发异常报警,异常数据回流到对抗网络模型进行增量训练。
本发明的提出一种在只有正常数据的情况下,实时对训练完成的半监督模型进行更新,不断增加模型异常检测能力的异常检测方法。
本发明使用了对抗生成网络的半监督异常检测方式:使用生成网络生成异常数据,将鉴别网络训练为识别正常数据和异常数据的二分类有监督异常检测模型,避免了有监督异常检测方式无法应用到缺失标注数据场景、无监督异常检测方式无法应用到缺失异常数据场景的问题。
附图说明
图1为本发明整体方案流程图;
图2为生成对抗网络模型架构图。
具体实施方式
为使本发明的目的、内容、和优点更加清楚,下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。
本发明分为离线训练和实时检测两个部分,整体方案流程图如图1所示。离线部分首先将从生产设备采集的批量历史正常数据经过数据清洗后输入到生成对抗网络模型,模型自主生成异常数据并进行鉴别检测,训练完成后将模型部署到实时检测环境。
实时检测部分首先从生产设备采集实时数据,并同步将数据存储到历史数据库,实时数据经过数据清洗后,输入到生成对抗网络模型进行异常检测;当检测结果为正常时,将实时数据标注为正常数据,并回流输入到模型进行增量训练;当检测结果为异常时,触发异常报警,等待人工处理,确认为异常结果时,将实时数据标注为异常数据,并回流到模型的鉴别网络部分进行增量训练。
离线训练流程主要分为如下几个部分:
从生产设备采集实时数据
从生产设备的传感器实时采集转速、温度、每一生产步骤持续时长等过程数据,以及产品性状等生产结果数据。
将实时数据存储到历史数据库;
对历史数据进行数据清洗;
将数据清洗为适合输入模型的数据格式。主要包括以下方面:
(1)将时序数据按时间排序;
(2)去除重复数据;
(3)补全缺失数据;
(4)数据转换,如数值类型数据做归一化,类别数据转换为枚举数据等。对于转速、温度等生产数据特征,可根据生产经验,或者依据特征和产品质量的单调区间变化,进行阈值划分。如某种产品的生产中,温度小于10摄氏度时,产品质量随着温度升高而提升;温度大于100摄氏度时,产品质量随温度升高而降低;温度位于10到100摄氏度区间时,产品质量保持一定。可将温度的生产数据特征划分为温度小于10摄氏度、温度位于10到100摄氏度之间、温度大于100摄氏度等三个类别的枚举数据,当生产数据中温度为50摄氏度时,温度小于10摄氏度和温度大于100摄氏度的枚举类别数据值为0,温度位于10到100摄氏度之间的枚举类别数据值为1;
(5)数据特征组合。生产数据属于离散数据,且产品质量通常会依赖于生产数据特征的组合,如温度位于10到100摄氏度的区间且转速大于8000转/分时,产品质量较好。基于生产数据的这些特性,首先对生产数据进行数据特征间的组合,并且对位于时间序列不同时间的数据特征进行组合。将未组合的离散数据和组合后的数据与拼接后,一起输入到由全连接神经网络构成的编码器。
训练生成对抗网络模型,将训练数据输入模型,通过生成网络生成异常数据,并与正常数据一起输入到鉴别网络进行有监督训练。生成对抗网络模型架构图如图2所示。
其中训练数据是由生产数据经过数据处理后生成的数据集。初始训练数据由正常数据组成,设定时间序列为3,即每条训练数据由3个时间步的生产数据组成。如经过数据清洗和特征组合之后的训练数据字段为:【时间1】温度小于10摄氏度、【时间1】温度位于10到100摄氏度之间、【时间1】温度大于100摄氏度、【时间1】转速小于等于8000转/分、【时间1】转速大于8000转/分、【时间1】温度位于10到100摄氏度的区间且转速大于8000转/分、【时间2】温度小于10摄氏度、【时间2】温度位于10到100摄氏度之间、【时间2】温度大于100摄氏度、【时间2】转速小于等于8000转/分、【时间2】转速大于8000转/分、【时间2】温度位于10到100摄氏度的区间且转速大于8000转/分、【时间3】温度小于10摄氏度、【时间3】温度位于10到100摄氏度之间、【时间1】温度大于100摄氏度、【时间3】转速小于等于8000转/分、【时间3】转速大于8000转/分、【时间3】温度位于10到100摄氏度的区间且转速大于8000转/分、【标签】是否异常数据;一条训练数据的值为[0 1 0 0 1 1 0 1 0 0 1 1 0 1 0 0 1 1 0],其中每一位为对应字段的取值,如第二位取值为1意义为在时间步1生产过程温度位于10到100摄氏度之间,最后一位取值为0意义为此条训练数据不是异常数据。
在训练过程中,首先将正常的带标签有监督训练数据输入到鉴别网络学习正常的数据分布;然后将训练数据中时间步1和时间步2的数据字段输入到生成网络,输出为预测时间步3的数据字段,如输入数据为[0 1 0 0 1 1 0 1 0 0 1 1],经过神经网络计算后输出为[0 0 1 0 0 0];将原始时间步1、时间步2的数据字段,和预测得到的时间步3数据做拼接,异常数据标签值设置为1,作为异常数据输入鉴别网络,对鉴别网络做训练;鉴别网络经过梯度下降对网络参数权重做调整,并将梯度传播到生成网络,对生成网络做调整,以生成更难以区分的异常数据,加强后续生成网络对异常数据的生成能力,和鉴别网络对异常数据的检测能力。
在模型中神经网络类型的选取上,由于生产数据中各种数据特征的位置可以随意排列,通常不存在明显的局部特征,通过共享局部特征进行学习的卷积神经网络不适用于生产数据的训练;由于生产***对响应延时要求较高,不选用训练和检测时间依赖于时间序列长度的循环神经网络;同时由于产品质量常依赖于多种数据特征的组合,选用全连接神经网络作为模型中的基础结构。
在神经网络优化器的选取上,为了加速训练的收敛速度,同时适应在生成过程中的增量训练,选用适用于在线学习的FTRL技术作为神经网络的优化器。FTRL是一种优化的梯度更新技术,能根据线上实时反馈的数据,快速训练调整模型参数,使模型及时反映线上的数据变化,从而提高模型的效果。
部署完成训练的模型到实时检测环境;
实时检测流程主要分为如下几个部分:
1、从生产设备采集实时数据
从生产设备的传感器实时采集转速、温度、每一生产步骤持续时长等过程数据,以及产品性状等生产结果数据。
2、对实时数据进行数据清洗
使用和对历史数据完全一致的数据清洗方式。
使用生成对抗网络模型进行异常检测;
将数据输入到模型的鉴别网络部分,对数据进行异常检测。实时的生产数据与训练数据相比,也是由3个时间步组成的数据字段,但是缺少标签数据,如[0 1 0 0 1 1 0 10 0 1 1 0 1 0 0 1 1],其中每个数值字段表示温度范围特征、转速范围特征及温度和转速的组合特征。对一个由3层神经网络构成的鉴别网络,其中第i层第j个神经元的计算公式为
Figure BDA0002856688560000091
其中x为生产数据中各时间步的数据字段,w为已训练收敛的网络权重,y为单个神经网络节点的输出数据。第i层神经网络的输出数据,构成第i+1层神经网络的输入数据。最后一层为单个神经网络节点,取大于阈值0.5的输出数据为异常数据,小于等于阈值0.5的输出数据为正常数据。
将检测为正常的数据回流到模型进行增量训练;
首先将正常数据加上标签数据,如正常三个时间步的生成数据为[0 1 0 0 1 1 01 0 0 1 1],在最后补上标签字段0,表示数据为正常数据,将增量正常训练数据[0 1 0 01 1 0 1 0 0 1 1 0]输入到鉴别网络进行训练和参数更新;然后将正常数据的前两个时间步数据提取,输入到生成网络,预测输出时间步3的数据字段,与前两个时间步数据拼接后,生成新的异常数据;并将异常数据,输入鉴别网络进行训练和参数更新。
检测为异常的数据触发异常报警;
人工处理报警数据;
异常数据回流到模型进行增量训练;
将异常数据输入到生成对抗网络模型的鉴别网络部分,进行增量训练。
本发明使用了对抗生成网络的半监督异常检测方式:使用生成网络生成异常数据,将鉴别网络训练为识别正常数据和异常数据的二分类有监督异常检测模型,避免了有监督异常检测方式无法应用到缺失标注数据场景、无监督异常检测方式无法应用到缺失异常数据场景的问题。使用实时数据对模型进行实时增量更新:通过将检测过的数据回流输入到模型进行增量训练,实现模型的实时更新,增强了模型检测数据的有效范围,避免了数据随时间变化对模型的扰动问题。
本发明提出的技术方案在只有正常数据的异常检测场景下,实现了对半监督模型的实时更新。在这种方法中,我们使用对抗生成网络模型中的生成网络生成异常数据,输入到鉴别网络进行有监督学习,避免了有监督异常检测方法和无监督异常检测方法无法应用到没有异常训练数据场景的问题。同时,我们使用实时数据对生成对抗网络模型做实时增量更新,避免了半监督学习受限于历史训练数据,对新数据无法做出有效异常检测的问题。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (10)

1.一种基于生成对抗网络的实时异常检测方法,其特征在于,包括:
离线训练和实时检测;
离线训练包括:
将从生产设备采集的批量历史正常数据经过数据清洗后输入到生成对抗网络模型,对抗网络模型生成异常数据并进行鉴别检测,训练完成后将对抗网络模型部署到实时检测环境;
实时检测包括:
从生产设备采集实时数据,并同步将数据存储到历史数据库,实时数据经过数据清洗后,输入到生成对抗网络模型进行异常检测;当检测结果为正常时,将实时数据标注为正常数据,并回流输入到对抗网络模型进行增量训练;当检测结果为异常时,触发异常报警,等待人工处理,确认为异常结果时,将实时数据标注为异常数据,并回流到模型的鉴别网络部分进行增量训练。
2.如权利要求1所述的基于生成对抗网络的实时异常检测方法,其特征在于,离线训练具体包括:
从生产设备采集实时数据;
从生产设备的传感器实时采集过程数据以及生产结果数据;
将采集的数据存储到历史数据库;
对历史数据进行数据清洗,清洗为适合输入模型的数据格式。
3.如权利要求2所述的基于生成对抗网络的实时异常检测方法,其特征在于,过程数据包括:转速、温度以及每一生产步骤持续时长。
4.如权利要求1所述的基于生成对抗网络的实时异常检测方法,其特征在于,数据清洗具体包括:
(1)将时序数据按时间排序;
(2)去除重复数据;
(3)补全缺失数据;
(4)进行数据转换,对于生产数据特征,根据生产经验或者依据特征和产品质量的单调区间变化,进行阈值划分;
(5)对生产数据进行数据特征间的组合,并且对位于时间序列不同时间的数据特征进行组合。将未组合的离散数据和组合后的数据与拼接后,一起输入到由全连接神经网络构成的编码器。
5.如权利要求1所述的基于生成对抗网络的实时异常检测方法,其特征在于,训练生成对抗网络模型包括:
将训练数据输入对抗网络模型,通过生成网络生成异常数据,并与正常数据一起输入到鉴别网络进行有监督训练,生成对抗网络模型;
训练数据是由生产数据经过数据处理后生成的数据集,初始训练数据由正常数据组成。
6.如权利要求5所述的基于生成对抗网络的实时异常检测方法,其特征在于,在训练生成对抗网络模型过程中,将正常的带标签有监督训练数据输入到鉴别网络学习正常的数据分布;后将训练数据中时间步1和时间步2的数据字段输入到生成网络,输出为预测时间步3的数据字段;将原始时间步1、时间步2的数据字段和预测得到的时间步3数据做拼接,异常数据标签值设置为1,作为异常数据输入鉴别网络,对鉴别网络做训练;鉴别网络经过梯度下降对网络参数权重做调整,并将梯度传播到生成网络,对生成网络做调整,以生成更难以区分的异常数据。
7.如权利要求1所述的基于生成对抗网络的实时异常检测方法,其特征在于,在对抗网络模型中的神经网络类型选取全连接神经网络作为基础结构。
8.如权利要求1所述的基于生成对抗网络的实时异常检测方法,其特征在于,异常检测包括:
使用生成对抗网络模型进行异常检测;
将数据输入到对抗网络模型的鉴别网络部分,对数据进行异常检测,实时的生产数据与训练数据相比缺少标签数据,对一个由3层神经网络构成的鉴别网络,其中第i层第j个神经元的计算公式为
Figure FDA0002856688550000031
其中x为生产数据中各时间步的数据字段,w为已训练收敛的网络权重,y为单个神经网络节点的输出数据;第i层神经网络的输出数据,构成第i+1层神经网络的输入数据;最后一层为单个神经网络节点,取大于阈值m的输出数据为异常数据,小于等于阈值m的输出数据为正常数据;
将检测为正常的数据回流到对抗网络模型进行增量训练;
首先将正常数据加上标签数据,在最后补上标签字段0,表示数据为正常数据,将增量正常训练数据输入到鉴别网络进行训练和参数更新;然后将正常数据的前两个时间步数据提取,输入到生成网络,预测输出第三个时间步的数据字段,与前两个时间步数据拼接后,生成新的异常数据;并将异常数据,输入鉴别网络进行训练和参数更新。
9.如权利要求8所述的基于生成对抗网络的实时异常检测方法,其特征在于,阈值a为0.5。
10.如权利要求1所述的基于生成对抗网络的实时异常检测方法,其特征在于,检测为异常的数据触发异常报警,异常数据回流到对抗网络模型进行增量训练。
CN202011547340.8A 2020-12-24 2020-12-24 一种基于生成对抗网络的实时异常检测方法 Pending CN112561383A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011547340.8A CN112561383A (zh) 2020-12-24 2020-12-24 一种基于生成对抗网络的实时异常检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011547340.8A CN112561383A (zh) 2020-12-24 2020-12-24 一种基于生成对抗网络的实时异常检测方法

Publications (1)

Publication Number Publication Date
CN112561383A true CN112561383A (zh) 2021-03-26

Family

ID=75032452

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011547340.8A Pending CN112561383A (zh) 2020-12-24 2020-12-24 一种基于生成对抗网络的实时异常检测方法

Country Status (1)

Country Link
CN (1) CN112561383A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113114673A (zh) * 2021-04-12 2021-07-13 西北工业大学 一种基于生成对抗网络的网络入侵检测方法及***
CN113435258A (zh) * 2021-06-06 2021-09-24 西安电子科技大学 转子***异常智能检测方法、***、计算机设备、终端
CN113570566A (zh) * 2021-07-22 2021-10-29 深圳市人工智能与机器人研究院 一种产品外观缺陷发展性认知检测方法及相关装置
CN113645231A (zh) * 2021-08-10 2021-11-12 北京易通信联科技有限公司 工业控制***的入侵检测方法、存储器和处理器
CN115589608A (zh) * 2022-12-05 2023-01-10 合肥工业大学 物联网数据异常检测模型训练方法、异常检测方法和***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106779069A (zh) * 2016-12-08 2017-05-31 国家电网公司 一种基于神经网络的异常用电检测方法
CN108009628A (zh) * 2017-10-30 2018-05-08 杭州电子科技大学 一种基于生成对抗网络的异常检测方法
CN110598851A (zh) * 2019-08-29 2019-12-20 北京航空航天大学合肥创新研究院 一种融合lstm和gan的时间序列数据异常检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106779069A (zh) * 2016-12-08 2017-05-31 国家电网公司 一种基于神经网络的异常用电检测方法
CN108009628A (zh) * 2017-10-30 2018-05-08 杭州电子科技大学 一种基于生成对抗网络的异常检测方法
CN110598851A (zh) * 2019-08-29 2019-12-20 北京航空航天大学合肥创新研究院 一种融合lstm和gan的时间序列数据异常检测方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113114673A (zh) * 2021-04-12 2021-07-13 西北工业大学 一种基于生成对抗网络的网络入侵检测方法及***
CN113435258A (zh) * 2021-06-06 2021-09-24 西安电子科技大学 转子***异常智能检测方法、***、计算机设备、终端
CN113435258B (zh) * 2021-06-06 2024-04-23 西安电子科技大学 转子***异常智能检测方法、***、计算机设备、终端
CN113570566A (zh) * 2021-07-22 2021-10-29 深圳市人工智能与机器人研究院 一种产品外观缺陷发展性认知检测方法及相关装置
CN113570566B (zh) * 2021-07-22 2024-03-19 深圳市人工智能与机器人研究院 一种产品外观缺陷发展性认知检测方法及相关装置
CN113645231A (zh) * 2021-08-10 2021-11-12 北京易通信联科技有限公司 工业控制***的入侵检测方法、存储器和处理器
CN115589608A (zh) * 2022-12-05 2023-01-10 合肥工业大学 物联网数据异常检测模型训练方法、异常检测方法和***
CN115589608B (zh) * 2022-12-05 2023-03-07 合肥工业大学 物联网数据异常检测模型训练方法、异常检测方法和***

Similar Documents

Publication Publication Date Title
CN112561383A (zh) 一种基于生成对抗网络的实时异常检测方法
US11204602B2 (en) Early anomaly prediction on multi-variate time series data
CN111475804A (zh) 一种告警预测方法及***
CN111914873A (zh) 一种两阶段云服务器无监督异常预测方法
US20140046878A1 (en) Method and system for detecting sound events in a given environment
KR20230030542A (ko) 랜덤 컷 포레스트 알고리즘을 이용한 ai 기반의 설비 데이터 이상 감지 시스템과 그 방법
CN111488946A (zh) 基于信息融合的雷达伺服***故障诊断方法
US20230221684A1 (en) Explaining Machine Learning Output in Industrial Applications
CN111598179A (zh) 电力监控***用户异常行为分析方法、存储介质和设备
CN115496384A (zh) 工业设备的监控管理方法、装置和计算机设备
CN115859077A (zh) 一种变工况下多特征融合的电机小样本故障诊断方法
CN116205265A (zh) 一种基于深层神经网络的电网故障诊断方法及装置
Alfarizi et al. An extreme gradient boosting aided fault diagnosis approach: A case study of fuse test bench
Yu et al. Morstreaming: A multioutput regression system for streaming data
CN111079348A (zh) 一种缓变信号检测方法和装置
Guan et al. Application of a novel PNN evaluation algorithm to a greenhouse monitoring system
CN112861364A (zh) 一种基于状态时延转换图二次标注的工控***设备行为建模方法及装置
CN115047313B (zh) 基于oc-svm和dnn的zpw-2000r轨道电路故障诊断方法及装置
Sina et al. Intelligent fault diagnosis of manufacturing processes using extra tree classification algorithm and feature selection strategies
CN113835973B (zh) 一种模型训练方法及相关装置
CN114565051A (zh) 基于神经元影响程度的产品分类模型的测试方法
CN115169458A (zh) 基于主动学习的自适应故障诊断方法、装置及相关介质
Lopes et al. AGN simulation and validation model
Shen et al. Long-term multivariate time series forecasting in data centers based on multi-factor separation evolutionary spatial–temporal graph neural networks
Xiaozhi et al. Fault Diagnosis Based on Sparse Semi-supervised GAN Model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination