CN114757413A - 一种基于时序数列分析耦合神经网络预测的不良数据辨识方法 - Google Patents

一种基于时序数列分析耦合神经网络预测的不良数据辨识方法 Download PDF

Info

Publication number
CN114757413A
CN114757413A CN202210376902.XA CN202210376902A CN114757413A CN 114757413 A CN114757413 A CN 114757413A CN 202210376902 A CN202210376902 A CN 202210376902A CN 114757413 A CN114757413 A CN 114757413A
Authority
CN
China
Prior art keywords
data
samples
bad
neural network
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210376902.XA
Other languages
English (en)
Inventor
齐荷梅
陆强
彭兴文
唐欣
马善为
刘吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Yuanda Flue Gas Treatment Franchising Co ltd
North China Electric Power University
Original Assignee
Chongqing Yuanda Flue Gas Treatment Franchising Co ltd
North China Electric Power University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Yuanda Flue Gas Treatment Franchising Co ltd, North China Electric Power University filed Critical Chongqing Yuanda Flue Gas Treatment Franchising Co ltd
Priority to CN202210376902.XA priority Critical patent/CN114757413A/zh
Publication of CN114757413A publication Critical patent/CN114757413A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/14Force analysis or force optimisation, e.g. static or dynamic forces

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明提出了一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,主要步骤包括:获取原始数据,原始数据进行无量纲化处理,对原始样本参数序列进行平稳性测试,若不平稳则对序列进行差分处理并再次测试直至差分序列平稳,建立序列的差分自回归移动平均模型,计算模型残差,将残差值大于预设值归类至不良样本集。建立BP神经网络模型,通过神经网络模型对不良样本集进行循环测试,最终获得不良数据集。本发明通过耦合时序数列分析和神经网络模型,利用时序数列分析初步获得不良数据,然后利用神经网络模型进行检验验证,非常适合处理具有参数多、波动大等特点的脱硝***数据,辨识精度和准确性高,可广泛用于烟气脱硝领域不良数据的辨识。

Description

一种基于时序数列分析耦合神经网络预测的不良数据辨识 方法
技术领域
本发明属于氮氧化物治理领域,具体涉及一种基于时序数列分析耦合神经网络预测的不良数据辨识方法。
背景技术
随着物联网、机器学习、大数据分析等技术的发展,基于SCR脱硝***大数据分析的脱硝***智能调控、催化剂管理等研究日益增多。然而,由于SCR脱硝***大数据采集过程中存在的测量误差、设备故障、传输故障等问题,原始样本中往往包含一些不良数据。这些不良数据不仅干扰脱硝***控制,同时对于基于大数据分析的智能调控、催化剂管理造成了许多不利影响,限制这些技术的推广应用。因此,如何对不良数据进行辨识对于SCR脱硝***的稳定高效运行具有重要意义。
传统的不良数据辨识方法主要有物理判别法和数理统计法,物理判别法是基于人们对数据已知的客观认识,判断外界干扰、人为误差等对实测数据偏离正常值的方法,但由于SCR脱硝***产生的数据量大,人工判断工作量大且需要操作者具有丰富经验使得该方法实施难度较大。数理统计法是通过数理统计理论对不良数据进行鉴别,但由于SCR脱硝***大数据研究发展较晚,相关数理模型尚未建立,缺乏理论指导。利用BP神经网络进行不良数据检测是近年来发展的基于机器学习的信息处理方法,具有模型适应性广、预测精度高、模型准确性好等优点,但是目前该方法存在理论尚未完善,计算量大等缺点。实际上,SCR脱硝的数据采集***通常是在固定采样频率下对脱硝相关变量如烟气量、入口NOx浓度等参数进行监测及保存,是典型的时序数列,因此可以通过时序数列分析方法对原始数据进行初步简化分析,降低数据复杂度。由此,本发明提出了基于时序数列分析耦合神经网络预测的SCR脱硝***不良数据的检测与辨识方法。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于时序数列分析耦合神经网络预测的不良数据辨识方法。
该方法首先对SCR脱硝***收集的时序数列进行预处理,利用自回归移动平均模型对时序数列进行建模,基于残差分析初步确定异常数据集,利用剔除了异常数据的其余数据进行BP神经网络建模和学习,然后利用训练好的神经网络对初步确定的异常数据集进行测试检验,根据测试样本的预测值和初始值的相对误差大小鉴别不良样本;针对鉴别出的不良样本,进一步优化神经网络对不良样本进行检验和校正,并最终确定不良数据。
为了实现上述目的,达到上述技术效果,本发明通过以下技术方案实现:一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,其特征在于,包括以下步骤:
步骤1、获取烟气脱硝***采集的原始数据,补充原始数据中存在的样本缺失数据,然后对数据进行无量纲化处理,得到样本数据;
步骤2、对样本数据进行平稳性分析,若样本数据平稳则进行下一步分析;若样本数据不平稳,则对样本数据进行差分处理,然后对差分序列进行平稳性分析,重复此过程直至检测到序列平稳;
步骤3、构建差分自回归移动平均模型ARIMA;
步骤4、计算差分自回归移动平均模型的残差,将残差大于预设值的样本添加至异常数据集,其余样本归类至正常样本集;
步骤5、构建BP神经网络;
步骤6、将异常数据集和随机10%正常样本作为测试样本,剩余90%正常样本作为训练样本,利用学习完成的神经网络模型对测试样本进行预测,根据预设条件将测试样本重新划归至不良样本集或训练样本集,进行循环测试直至达到预设次数;
步骤7、对不良样本集进行检验和校正,确定最终不良数据。
优选的,前述一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,其特征在于,所述步骤1中的原始数据为按时间等时距采集的数据,每个数据至少包含2个以上参数;且至少包含参数出口NOx浓度、脱硝效率或催化剂活性中的至少一个作为其标签参数。
优选的,前述一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,其特征在于,所述步骤1中的无量纲化方法采用下述公式1~3中任意之一计算:
Figure BDA0003590665260000031
Figure BDA0003590665260000032
Figure BDA0003590665260000033
式中,Zni为参数Z的归一化值,Zi为参数Z的原始值,Zmax为参数Z的最大值,Zmin为参数Z的最小值,σ为参数Z的标准差,μ为参数Z的平均值。
优选的,前述一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,其特征在于,所述步骤2中的平稳性分析采用ADF检验或者KPSS检验两种方法中的至少一种。
优选的,前述一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,其特征在于,所述步骤2中的差分处理是指采用如下公式计算获得差分序列:
Figure BDA0003590665260000034
式中,
Figure BDA0003590665260000041
为所求差分序列,Zk为k时刻的参数Z,Zk-1为k-1时刻的参数Z。
优选的,前述一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,其特征在于,所述步骤3的所述ARIMA模型步骤如下:
1)计算并绘制差分序列的自相关函数图(ACF)和偏自相关函数图(PACF),根据ACF图和PACF图的拖尾或截尾性质,初步确定模型的自回归阶数p和移动平均阶数q;
2)利用赤池信息准则(AIC准则)或者贝叶斯信息准则(BIC准则)之一确定模型的阶数p和q;
3)基于上述确定的模型阶数,采用最大似然函数法或者最小二乘法对模型参数进行估算,初步确定模型:
Figure BDA0003590665260000042
式中,yt为待求差分序列,εt为白噪声残差,aj和θi为模型待估系数;
4)计算模型残差,检验残差是否为白噪声,若是则模型建立成功,若否则重复执行步骤2)~4)直至检验残差为白噪声。
优选的,前述一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,其特征在于,所述步骤4中的所述预设值为所述残差序列的标准差的2倍。
优选的,前述一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,其特征在于,所述步骤6的预设条件是指相对误差小于10%划归至训练样本,否则划归至不良样本,所述预设次数至少为3次。
优选的,前述一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,其特征在于,所述步骤7中的所述检验和校正步骤如下:
1)删除不良样本,利用优化样本构建并训练BP神经网络,利用训练好的神经网络对不良样本进行测试,计算相对误差;
2)筛选出相对误差不小于10%的样本确认为不良数据;筛选出相对误差不大于5%的样本修正为非不良数据;
3)对所述步骤2)中所述筛选后的剩余样本重复执行所述步骤1)和所述步骤2)直至满足以下任一条件:
条件Ⅰ、执行所述步骤2)之后无剩余样本;
条件Ⅱ、重复执行次数不少于3次;
4)将剩余样本全部确认为不良数据。
本发明的有益效果为:
1、SCR脱硝大数据是一种典型时序数列,具有多数时序数列存在的数据量大、短期波动频繁、噪声干扰严重等特点,使得时序数列的分析处理较为复杂和困难。差分自回归移动平均模型是一种传统有效的时序数列处理方法,具有理论成熟,计算量小,处理速度快等优点。通过时序数列分析预处理,可以有效筛选数据错误值和异常值,初步掌握不良数据分布情况,降低原始数据复杂度。
2、神经网络模型具有强大的非线性拟合和泛化能力,在模式识别、回归预测、数据鉴别等方面表现出极好的效果,但神经网络理论不成熟、计算量大且预测准确性一定程度受训练样本质量的影响。通过时序数列分析预选筛选出不良样本集可以降低神经网络建模过程中不良样本影响,利用神经网络预测对异常数据进行预测检验,可防止单纯时序数列分析的误判,提高判断的准确性。
3、通过神经网络对初步获得的不良样本集以及随机筛选的10%正常样本进行循环测试,避免仅依赖时序数列分析可能导致不良样本漏判;最后利用神经网络对两种方法耦合辨识出的不良样本进行检验和校正,避免不良样本的误判,提高辨识精度。
附图说明
图1为本发明方法的操作流程图。
具体实施方式
下面结合附图和具体实施例对本发明做进一步说明。以下实施例用于说明本发明,但不用来限制本发明的范围。
本实施例以某燃煤电厂SCR脱硝***一年的正常运行数据为例,通过人为添加不良数据,使用本发明的方法对这些样本中的不良数据进行检测。
实施例1
一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,如图1所示,其具体实施步骤如下:
步骤1、从SCR脱硝***收集的准确运行原始数据U0共计1000组,每组样本包括入口压力、入口烟气量、入口NOx浓度、喷氨量、烟气温度、出口压力、出口NOx浓度、脱硝效率、氨逃逸浓度、SCR脱硝催化剂活性共计10个参数,从原始数据U0随机选取50组作为样本数据,人为添加其值10%的误差作为不良样本,对处理后样本按以下公式(1)进行无量纲化处理,记为样本集U1:
Figure BDA0003590665260000061
式中,Zni为参数Z的归一化值,Zi为参数Z的原始值,Zmax为参数Z的最大值,Zmin为参数Z的最小值。
步骤2、采用ADF检验对前述样本进行平稳性分析,如检测到样本平稳则继续进行下一步分析,若样本不平稳,则对样本进行一阶差分,对差分序列DU进行平稳性分析,并重复该过程,直至检测到的差分序列DU平稳,将获得的差分序列DU作为后续分析的样本。
步骤3、采用如下步骤建立差分序列的自回归移动平均模型:
1)计算并绘制差分序列的自相关函数图(ACF)和偏自相关函数图(PACF),根据ACF图和PACF图的拖尾或截尾位置,初步确定模型的自回归阶数p和移动平均阶数q;
2)采用贝叶斯信息准则(BIC准则)确定模型的阶数p和q;
3)基于上述确定的模型阶数,采用最大似然函数法估算模型参数,初步确定模型。
Figure BDA0003590665260000071
式中:yt为待求差分序列,εt为白噪声残差,aj和θi为模型待估系数。
4)计算模型残差,采用LBQ检验(Ljung-Box test)残差是否为白噪声,若是则模型建立成功,若否则重复执行步骤2)~4)直至检验残差为白噪声。
步骤4、计算上述模型残差R,将残差值大于残差序列标准差2倍的样本归类至不良样本集BU,其余样本归类至正常样本集GU。
步骤5、取每组样本的前9个参数为神经网络输入值,最后1个参数为神经网络输出值,构建单隐含层的BP神经网络,隐含层和输出层采用双曲正切函数。
步骤6、将异常数据集和随机10%的正常样本集数据作为测试样本TU,其余样本作为训练样本,利用学习完成的神经网络模型对测试样本进行预测,将预测误差超过10%的样本再次划归至不良样本集BU,其余情况重新划归至训练样本集TU,重复执行该步骤3次。
步骤7、剔除原始样本中所有标记的不良样本,利用其余样本重新构建和训练BP神经网络,利用训练好的神经网络对不良样本进行检验和校正,具体步骤如下:
1)删除不良样本,利用优化样本构建并训练BP神经网络,利用训练好的神经网络对不良样本进行测试,计算相对误差;
2)筛选相对误差大于20%的样本,确定为不良数据;筛选相对误差小于5%的样本,修正为非不良数据;
3)对步骤2)中筛选后的剩余样本重复执行步骤1)和步骤2)直至满足以下任一条件:条件1、执行步骤2)之后无剩余样本;条件2、重复执行次数不少于3次;
4)将剩余样本全部确认为不良数据BD。
经以上步骤操作,该方法鉴别出47组不良数据,所鉴别出的样本全部为设定的不良样本,通过本方法得到的不良数据的辨识率为94%,准确率为100%。
实施例2
一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,如图1所示,其具体实施步骤如下:
步骤1、从SCR脱硝***收集的准确运行原始数据U0共计1000组,每组样本包括入口压力、入口烟气量、入口NOx浓度、喷氨量、烟气温度、出口压力、出口NOx浓度、脱硝效率、氨逃逸浓度、SCR脱硝催化剂活性共计10个参数,从原始数据U0随机选取50组作为样本,人为添加其值10%的误差作为不良样本,对处理后样本按以下公式(1)进行无量纲化处理,记为样本集U1:
Figure BDA0003590665260000081
式中,Zni为参数Z的归一化值,Zi为参数Z的原始值,Zmax为参数Z的最大值,Zmin为参数Z的最小值。
步骤2、采用KPSS检验对前述样本进行平稳性分析,如检测到样本平稳则继续进行下一步分析,若样本不平稳,则对样本进行一阶差分,对差分序列DU进行平稳性分析,并重复该过程,直至检测到的差分序列DU平稳,将获得的平稳差分序列DU作为后续分析的样本。
步骤3、采用如下步骤建立差分序列的自回归移动平均模型:
1)计算并绘制差分序列的自相关函数图(ACF)和偏自相关函数图(PACF),根据ACF图和PACF图的拖尾或截尾位置,初步确定模型的自回归阶数p和移动平均阶数q;
2)采用赤池信息准则(AIC准则)确定模型的阶数p和q;
3)基于上述确定的模型阶数,采用最小二乘法估算模型参数,初步确定模型。
Figure BDA0003590665260000091
式中:yt为待求差分序列,εt为白噪声残差,aj和θi为模型待估系数。
4)计算模型残差,采用LBQ检验(Ljung-Box test)残差是否为白噪声,若是则模型建立成功,若否则重复执行步骤2)~4)直至检验残差为白噪声。
步骤4、计算上述模型残差R,将残差值大于残差序列标准差2倍的样本归类至不良样本集BU,其余样本归类至正常样本集GU。
步骤5、取每组样本的前9个参数为神经网络输入值,最后1个参数为神经网络输出值,构建单隐含层的BP神经网络,隐含层和输出层采用Sigmoid函数。
步骤6、将异常数据集和随机10%的正常样本集数据作为测试样本TU,其余样本作为训练样本,利用学习完成的神经网络模型对测试样本进行预测,将预测误差超过10%的样本再次划归至不良样本集BU,其余情况重新划归至训练样本集TU,重复执行该步骤3次。
步骤7、剔除原始样本中所有标记的不良样本,利用其余样本重新构建和训练BP神经网络,利用训练好的神经网络对不良样本进行检验和校正,具体步骤如下:
1)删除不良样本,利用优化样本构建并训练BP神经网络,利用训练好的神经网络对不良样本进行测试,计算相对误差;
2)筛选相对误差大于20%的样本,确定为不良数据;筛选相对误差小于5%的样本,修正为非不良数据;
3)对步骤2)中筛选后的剩余样本重复执行步骤1)和步骤2)直至满足以下任一条件:条件1、执行步骤2)之后无剩余样本;条件2、重复执行次数不少于3次;
4)将剩余样本全部确认为不良数据BD。
经以上步骤操作,该方法鉴别出45组不良数据,所鉴别出的样本全部为设定的不良样本,通过本方法得到的不良数据的辨识率为90%,准确率为100%。

Claims (9)

1.一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,其特征在于,包括以下步骤:
步骤1、获取烟气脱硝***采集的原始数据,补充原始数据中存在的样本缺失数据,然后对数据进行无量纲化处理,得到样本数据;
步骤2、对样本数据进行平稳性分析,若样本数据平稳则进行下一步分析;若样本数据不平稳,则对样本数据进行差分处理,然后对所得的差分序列进行平稳性分析,重复此过程直至差分序列平稳;
步骤3、构建差分自回归移动平均模型ARIMA;
步骤4、计算差分自回归移动平均模型的残差,将残差大于预设值的样本添加至异常数据集,其余样本归类至正常样本集;
步骤5、构建BP神经网络;
步骤6、将异常数据集和随机10%正常样本作为测试样本,剩余90%正常样本作为训练样本,建立神经网络模型,然后对测试样本进行预测,根据预设条件将测试样本重新划归至不良样本集或训练样本集,进行循环测试直至达到预设次数;
步骤7、对不良样本集进行检验和校正,确定最终不良数据。
2.根据权利要求1所述的一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,其特征在于,所述步骤1中的原始数据为按时间等时距采集的数据,每个数据至少包含2个以上参数;且至少包含参数出口NOx浓度、脱硝效率或催化剂活性中的至少一个作为其标签参数。
3.根据权利要求1所述的一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,其特征在于,所述步骤1中的无量纲化方法采用下述公式1~3中任意之一计算:
Figure FDA0003590665250000021
Figure FDA0003590665250000022
Figure FDA0003590665250000023
式中,Zni为参数Z的归一化值,Zi为参数Z的原始值,Zmax为参数Z的最大值,Zmin为参数Z的最小值,σ为参数Z的标准差,μ为参数Z的平均值。
4.根据权利要求1所述的一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,其特征在于,所述步骤2中的平稳性分析采用ADF检验或者KPSS检验两种方法中的至少一种。
5.根据权利要求1所述的一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,其特征在于,所述步骤2中的差分处理是指采用如下公式计算获得差分序列:
Figure FDA0003590665250000024
式中,
Figure FDA0003590665250000025
为所求差分序列,Zk为k时刻的参数Z,Zk-1为k-1时刻的参数Z。
6.根据权利要求1所述的一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,其特征在于,所述步骤3的所述ARIMA模型步骤如下:
1)计算并绘制差分序列的自相关函数ACF图和偏自相关函数PACF图,根据ACF图和PACF图的拖尾或截尾性质,初步确定模型的自回归阶数p和移动平均阶数q;
2)利用赤池信息准则(AIC准则)或者贝叶斯信息准则(BIC准则)之一确定模型的阶数p和q;
3)基于上述确定的模型阶数,采用最大似然函数法或者最小二乘法对模型参数进行估算,初步确定模型:
Figure FDA0003590665250000031
式中,yt为待求差分序列,εt为白噪声残差,aj和θi为模型待估系数;
4)计算模型残差,检验残差是否为白噪声,若是则模型建立成功,若否则重复执行步骤2)~4)直至检验残差为白噪声。
7.根据权利要求1所述的一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,其特征在于,所述步骤4中的所述预设值为所述残差序列的标准差的2倍。
8.根据权利要求1所述的一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,其特征在于,所述步骤6的预设条件是指相对误差小于10%划归至训练样本,否则划归至不良样本,所述预设次数至少为3次。
9.根据权利要求1所述的一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,其特征在于,所述步骤7中的所述检验和校正步骤如下:
1)删除不良样本,利用优化样本构建并训练BP神经网络,利用训练好的神经网络对不良样本进行测试,计算相对误差;
2)筛选出相对误差不小于10%的样本确认为不良数据;筛选出相对误差不大于5%的样本修正为非不良数据;
3)对所述步骤2)中所述筛选后的剩余样本重复执行所述步骤1)和所述步骤2)直至满足以下任一条件:
条件Ⅰ、执行所述步骤2)之后无剩余样本;
条件Ⅱ、重复执行次数不少于3次;
4)将剩余样本全部确认为不良数据。
CN202210376902.XA 2022-04-11 2022-04-11 一种基于时序数列分析耦合神经网络预测的不良数据辨识方法 Pending CN114757413A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210376902.XA CN114757413A (zh) 2022-04-11 2022-04-11 一种基于时序数列分析耦合神经网络预测的不良数据辨识方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210376902.XA CN114757413A (zh) 2022-04-11 2022-04-11 一种基于时序数列分析耦合神经网络预测的不良数据辨识方法

Publications (1)

Publication Number Publication Date
CN114757413A true CN114757413A (zh) 2022-07-15

Family

ID=82329751

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210376902.XA Pending CN114757413A (zh) 2022-04-11 2022-04-11 一种基于时序数列分析耦合神经网络预测的不良数据辨识方法

Country Status (1)

Country Link
CN (1) CN114757413A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115412923A (zh) * 2022-10-28 2022-11-29 河北省科学院应用数学研究所 多源传感器数据可信融合方法、***、设备及存储介质
CN115561133A (zh) * 2022-09-20 2023-01-03 生态环境部环境工程评估中心 火电行业cems校准期间异常数据的自动识别方法和***
CN117149584A (zh) * 2023-10-31 2023-12-01 国合通用(青岛)测试评价有限公司 基于大数据的多试样标距标记设备的运行监管***

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115561133A (zh) * 2022-09-20 2023-01-03 生态环境部环境工程评估中心 火电行业cems校准期间异常数据的自动识别方法和***
CN115561133B (zh) * 2022-09-20 2023-08-29 生态环境部环境工程评估中心 火电行业cems校准期间异常数据的自动识别方法和***
CN115412923A (zh) * 2022-10-28 2022-11-29 河北省科学院应用数学研究所 多源传感器数据可信融合方法、***、设备及存储介质
CN117149584A (zh) * 2023-10-31 2023-12-01 国合通用(青岛)测试评价有限公司 基于大数据的多试样标距标记设备的运行监管***

Similar Documents

Publication Publication Date Title
CN114757413A (zh) 一种基于时序数列分析耦合神经网络预测的不良数据辨识方法
CN111914883B (zh) 一种基于深度融合网络的主轴轴承状态评估方法及装置
CN105930629B (zh) 一种基于海量运行数据的在线故障诊断方法
CN110716512A (zh) 一种基于燃煤电站运行数据的环保装备性能预测方法
CN111737909A (zh) 基于时空图卷积网络的结构健康监测数据异常识别方法
CN112287988A (zh) 一种水污染源在线监测数据异常的识别方法
CN111861272A (zh) 一种基于多源数据的复杂机电***异常状态检测方法
CN112904810B (zh) 基于有效特征选择的流程工业非线性过程监测方法
CN109934334B (zh) 一种基于扰动的叶绿素a含量相关因子敏感性分析方法
CN109240276B (zh) 基于故障敏感主元选择的多块pca故障监测方法
CN114935527B (zh) 一种基于油井天然气开采的传感器智能清洁方法及***
CN114462511A (zh) 一种基于XGBoost算法的PM2.5数据异常识别方法
CN111721834A (zh) 一种电缆局部放电在线监测缺陷辨识方法
CN112016248A (zh) 一种基于Elman神经网络SCR脱硝***不良数据辨识方法
CN117332358B (zh) 一种玉米浸泡水处理方法及***
CN114217025A (zh) 评估空气质量浓度预测中气象数据对其影响的分析方法
CN112215307B (zh) 一种应用机器学习自动检测地震仪器信号异常的方法
CN116910677A (zh) 一种工业仪表故障诊断方法及***
CN116612820B (zh) 基于数据分析的乳制品生产智能管理平台
CN116930423A (zh) 一种空气质量模型模拟效果的自动验证评估方法及***
CN114354666B (zh) 基于波长频次选择的土壤重金属光谱特征提取、优化方法
CN112699609B (zh) 一种基于振动数据的柴油机可靠性模型构建方法
CN115856264A (zh) 变压器油中溶解气体在线监测数据有效性判定方法及***
CN114757412A (zh) 一种基于聚类分析耦合神经网络预测的不良数据辨识方法
CN114819299A (zh) 一种基于邻近度分析耦合神经网络预测的不良数据辨识方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination