CN115470658A - 一种基于自回归模型的造纸清水流量预测智能预测模型 - Google Patents

一种基于自回归模型的造纸清水流量预测智能预测模型 Download PDF

Info

Publication number
CN115470658A
CN115470658A CN202211272695.XA CN202211272695A CN115470658A CN 115470658 A CN115470658 A CN 115470658A CN 202211272695 A CN202211272695 A CN 202211272695A CN 115470658 A CN115470658 A CN 115470658A
Authority
CN
China
Prior art keywords
clear water
model
water flow
data
papermaking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202211272695.XA
Other languages
English (en)
Inventor
张文
崔浩亮
高航
史成洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Zhuanzhuzhilian Technology Co ltd
Original Assignee
Zhejiang Zhuanzhuzhilian Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Zhuanzhuzhilian Technology Co ltd filed Critical Zhejiang Zhuanzhuzhilian Technology Co ltd
Priority to CN202211272695.XA priority Critical patent/CN115470658A/zh
Publication of CN115470658A publication Critical patent/CN115470658A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/10Numerical modelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Paper (AREA)

Abstract

本发明公开了一种基于自回归模型的造纸清水流量预测智能预测模型,涉及预测模型技术领域,具体包括以下步骤,流量规律分析,通过数学建模思想,首先将造纸清水流量预测实际问题转化为数学问题,围绕其周期性、波动性,对造纸清水流量数据的趋势变化进行分析,作为后面数据预处理的先行步骤。该基于自回归模型的造纸清水流量预测智能预测模型,在实时获取相关设备数据的前提下,对造纸清水流量进行实时预测,以实现动态监测实时进水量,便于异常情况及时发现以及为新水取用量的优化措施提供数据支撑,本模型采用整合移动平均自回归模型,充分考虑了造纸清水流量在实际工业生产过程中的变化规律,能够利用其存在的周期规律特性。

Description

一种基于自回归模型的造纸清水流量预测智能预测模型
技术领域
本发明涉及预测模型技术领域,具体为一种基于自回归模型的造纸清水流量预测智能预测模型。
背景技术
造纸业是国民经济基础产业之一,我国造纸总产量和消费量居世界首位。造纸工业历来是用水量大的行业,其中制浆造纸工艺过程需要大量的水作为载体。每生产一吨纸张用水量要达到数百吨甚至上千吨,但是大多数纸厂每生产一吨纸张或纸浆却只使用几吨或几十吨的新鲜水,这是因为水在各个工艺流程中是被反复循环利用的,只要在流程中必须是用清水的位置补充清水,就可以维持水的循环利用。
因此,对造纸清水流量的监测、循环使用控制是造纸行业水效提升需重点关注的问题。在生产工程中,造纸清水的流量数据是处于实时变化的状态,相关数据往往具有较细的时间粒度,但其数据周期相对较长,预测时在细粒度的时间尺度上,提取其周期性特点存在一定困难。同时,实时用水量数据波动幅度较大,峰值谷值差值大,不利于模型建模。根据整体工艺流程的特点,造纸清水流量的变化具有一定规律性,如果通过智能模型学习其规律并应用于监控中,对控制整个工艺流程的用水量具有重要意义,因此我们提出了一种基于自回归模型的造纸清水流量预测智能预测模型。
发明内容
针对现有技术的不足,本发明提供了一种基于自回归模型的造纸清水流量预测智能预测模型,解决了上述背景技术中提出的问题。
为实现以上目的,本发明通过以下技术方案予以实现:一种基于自回归模型的造纸清水流量预测智能预测模型,包括以下步骤,
S1:流量规律分析,通过数学建模思想,首先将造纸清水流量预测实际问题转化为数学问题,围绕其周期性、波动性,对造纸清水流量数据的趋势变化进行分析,作为后面数据预处理的先行步骤,
与大多数工业场景下的数据相同,造纸清水流量是一种时间序列数据,时间序列(或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列,常用单变量的预测常用回归方法和时间序列法,第二,在整个制浆造纸工艺过程中,造纸清水流量与许多设备以及这些设备的相关数据都具有相关性,采用特征工程的方法未取得较好效果,第三,由工艺流程所致,造纸清水流量整体呈现出周期性变化的特点,但是其周期性的时间粒度与工业场景下对造纸清水流量的监控采集到的数据的时间粒度往往并不一致,第四,造纸清水流量存在周期性的同时,其趋势随时间存在波动性变化,并且数据整体的波峰波谷差异较大;
S2:平稳性分析,
对时间序列的预测,较常见的有整合移动平均自回归模型(ARIMA,Autoregressive Integrated Moving Average Model),由自回归模型(AR)、移动平均模型(MA)组成,主要参数有自回归模型阶数p、差分阶数d以及移动平均模型阶数q,使用ARIMA模型对数据的平稳性有要求,通过采用ADF(Augmented Dickey-Fuller)检验(即单位根检验)的方法,ADF检验的H0假设就是存在单位根,如果得到的显著性检验统计量小于三个置信度(10%,5%,1%),则对应有(90%,95,99%)的把握来拒绝原假设;
S3:数据预处理,目的是对原始造纸清水流量数据按照一定规则进行预先处理,以使其输入模型后更易拟合,提高模型精准度,
S4:相关性分析确定模型阶数;
使用自相关函数(ACF)和偏自相关函数(PACF)测量当前序列值与过去序列值之间的相关性,通过观察ACF和PACF的截尾(某阶后均为0),可以大致确定移动平均模型阶数q和自回归模型阶数p,
S5:训练模型;根据实际历史数据输入模型,训练计算得可用于后续计算预测的模型;
S6:预测;
利用上一步得到的模型,以及当前时刻的历史数据,计算得到对目标的预测值,随机选取三个不连续的日期的数据进行测试,比较本文使用重采样&滑动平均的方法与仅采取一阶方差、二阶方差的方法,通过MAE,MSE,R2,RE指标可以直观地看出本文方法的在R2和RE指标上的优势,
所述S3的具体步骤包括,
步骤一、分析造纸清水流量的整体变化趋势规律,本案例中,造纸清水流量数值主要在两个区间内交替变化,即高水平区间和低水平区间,
步骤二、简单分析计算具体场景下造纸清水流量的周期变化特性,本案例中周期约在30分钟这个级别,
步骤三、对造纸清水流量数据进行重采样,改变了数据的时间粒度的同时,对数据的波动幅度也有一定缩小的作用,而且减少了锯齿的数量使图像更平滑,使周期性更易体现,本案例中,由秒级的数据重采样为分钟级的数据,
步骤四、对数据进行滑动窗口取平均的操作,滑动窗口一般根据具体数据情况设定,选取最优值,经过滑动平均后生成的新序列波动更小且规律表现得简单,使用这样的序建模将更高效,模型的泛化能力也更强,并且预测结果只需要逆向滑动即可还原,本案例中以阶数20为例,公式如下:
TSoriginal=[t1,t2,...,tp,...tn]
TSmoving=[m1,m2,...,mq,...,ml]
Figure BDA0003895721430000031
l=n-degree+1
式中:n是原序列长度;l是新序列长度;degree是滑动阶数。
本发明提供了一种基于自回归模型的造纸清水流量预测智能预测模型,具备以下有益效果:
1、该基于自回归模型的造纸清水流量预测智能预测模型,在实时获取相关设备数据的前提下,对造纸清水流量进行实时预测,以实现动态监测实时进水量,便于异常情况及时发现以及为新水取用量的优化措施提供数据支撑,本模型采用整合移动平均自回归模型,充分考虑了造纸清水流量在实际工业生产过程中的变化规律,能够利用其存在的周期规律特性。
2、该基于自回归模型的造纸清水流量预测智能预测模型,通过对造纸清水流量原始数据的特定预处理,大幅优化了模型的表现,具体表现为,在R2指标上,本文的方法可以至少分别提高40个百分点,在表示相对误差的RE指标上,本文的方法将误差由1以上缩小到0.01以下。由此可见,模型对数据的拟合程度大大提升,预测精度及可解释性大幅提高。便于对清水流量数据进行实时的预测和监测,对控制造纸行业新水使用量具有重要意义。
附图说明
图1为本发明造纸清水流量ACF&PACF的示意图;
图2为本发明的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
请参阅图1至图2,本发明提供一种技术方案:一种基于自回归模型的造纸清水流量预测智能预测模型,包括以下步骤,
S1:流量规律分析,通过数学建模思想,首先将造纸清水流量预测实际问题转化为数学问题,围绕其周期性、波动性,对造纸清水流量数据的趋势变化进行分析,作为后面数据预处理的先行步骤,
与大多数工业场景下的数据相同,造纸清水流量是一种时间序列数据,时间序列(或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列,常用单变量的预测常用回归方法和时间序列法。第二,在整个制浆造纸工艺过程中,造纸清水流量与许多设备以及这些设备的相关数据都具有相关性,采用特征工程的方法未取得较好效果。第三,由工艺流程所致,造纸清水流量整体呈现出周期性变化的特点,但是其周期性的时间粒度与工业场景下对造纸清水流量的监控采集到的数据的时间粒度往往并不一致。第四,造纸清水流量存在周期性的同时,其趋势随时间存在波动性变化,并且数据整体的波峰波谷差异较大;
S2:平稳性分析,
对时间序列的预测,较常见的有整合移动平均自回归模型(ARIMA,Autoregressive Integrated Moving Average Model),由自回归模型(AR)、移动平均模型(MA)组成,主要参数有自回归模型阶数p、差分阶数d以及移动平均模型阶数q,使用ARIMA模型对数据的平稳性有要求。通过采用ADF(Augmented Dickey-Fuller)检验(即单位根检验)的方法,ADF检验的H0假设就是存在单位根,如果得到的显著性检验统计量小于三个置信度(10%,5%,1%),则对应有(90%,95,99%)的把握来拒绝原假设;
S3:数据预处理,目的是对原始造纸清水流量数据按照一定规则进行预先处理,以使其输入模型后更易拟合,提高模型精准度,
S4:相关性分析确定模型阶数;
使用自相关函数(ACF)和偏自相关函数(PACF)测量当前序列值与过去序列值之间的相关性,通过观察ACF和PACF的截尾(某阶后均为0),可以大致确定移动平均模型阶数q和自回归模型阶数p,
S5:训练模型;根据实际历史数据输入模型,训练计算得可用于后续计算预测的模型;
S6:预测;
利用上一步得到的模型,以及当前时刻的历史数据,计算得到对目标的预测值。随机选取三个不连续的日期的数据进行测试,比较本文使用重采样&滑动平均的方法与仅采取一阶方差、二阶方差的方法,通过MAE,MSE,R2,RE指标可以直观地看出本文方法的在R2和RE指标上的优势。
Figure BDA0003895721430000061
所述S3的具体步骤包括,
步骤一、分析造纸清水流量的整体变化趋势规律,本案例中,造纸清水流量数值主要在两个区间内交替变化,即高水平区间和低水平区间。
步骤二、简单分析计算具体场景下造纸清水流量的周期变化特性,本案例中周期约在30分钟这个级别。
步骤三、对造纸清水流量数据进行重采样,改变了数据的时间粒度的同时,对数据的波动幅度也有一定缩小的作用,而且减少了锯齿的数量使图像更平滑,使周期性更易体现。本案例中,由秒级的数据重采样为分钟级的数据。
步骤四、对数据进行滑动窗口取平均的操作,滑动窗口一般根据具体数据情况设定,选取最优值,经过滑动平均后生成的新序列波动更小且规律表现得简单,使用这样的序建模将更高效,模型的泛化能力也更强,并且预测结果只需要逆向滑动即可还原。本案例中以阶数20为例。公式如下:
TSoriginal=[t1,t2,...,tp,...tn]
TSmoving=[m1,m2,...,mq,...,ml]
Figure BDA0003895721430000071
l=n-degree+1
式中:n是原序列长度;l是新序列长度;degree是滑动阶数。
本模型采用整合移动平均自回归模型,充分考虑了造纸清水流量在实际工业生产过程中的变化规律,能够利用其存在的周期规律特性。
通过对造纸清水流量原始数据的特定预处理,大幅优化了模型的表现,具体表现为,在R2指标上,本文的方法可以至少分别提高40个百分点,在表示相对误差的RE指标上,本文的方法将误差由1以上缩小到0.01以下。由此可见,模型对数据的拟合程度大大提升,预测精度及可解释性大幅提高。便于对清水流量数据进行实时的预测和监测,对控制造纸行业新水使用量具有重要意义。
综上所述,该基于自回归模型的造纸清水流量预测智能预测模型,使用时,在实时获取相关设备数据的前提下,对造纸清水流量进行实时预测,以实现动态监测实时进水量,便于异常情况及时发现以及为新水取用量的优化措施提供数据支撑,通过数学建模思想,首先将造纸清水流量实时预测的实际问题转化为数学问题;
从时序数据的角度对造纸清水流量数据进行预处理:
重采样。对已有造纸清水流量进行重采样,以获取不同时间粒度的数据,
滑动平均。设置滑动平均窗口,对数据按窗口大小进行取平均的操作,
利用整合移动平均自回归模型进行训练,最终得到可以满足实时预测和监控的模型。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (2)

1.一种基于自回归模型的造纸清水流量预测智能预测模型,其特征在于:包括以下步骤,
S1:流量规律分析,通过数学建模思想,首先将造纸清水流量预测实际问题转化为数学问题,围绕其周期性、波动性,对造纸清水流量数据的趋势变化进行分析,作为后面数据预处理的先行步骤,
与大多数工业场景下的数据相同,造纸清水流量是一种时间序列数据,时间序列(或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列,常用单变量的预测常用回归方法和时间序列法,第二,在整个制浆造纸工艺过程中,造纸清水流量与许多设备以及这些设备的相关数据都具有相关性,采用特征工程的方法未取得较好效果,第三,由工艺流程所致,造纸清水流量整体呈现出周期性变化的特点,但是其周期性的时间粒度与工业场景下对造纸清水流量的监控采集到的数据的时间粒度往往并不一致,第四,造纸清水流量存在周期性的同时,其趋势随时间存在波动性变化,并且数据整体的波峰波谷差异较大;
S2:平稳性分析,
对时间序列的预测,较常见的有整合移动平均自回归模型(ARIMA,AutoregressiveIntegrated Moving Average Model),由自回归模型(AR)、移动平均模型(MA)组成,主要参数有自回归模型阶数p、差分阶数d以及移动平均模型阶数q,使用ARIMA模型对数据的平稳性有要求,通过采用ADF(Augmented Dickey-Fuller)检验(即单位根检验)的方法,ADF检验的H0假设就是存在单位根,如果得到的显著性检验统计量小于三个置信度(10%,5%,1%),则对应有(90%,95,99%)的把握来拒绝原假设;
S3:数据预处理,目的是对原始造纸清水流量数据按照一定规则进行预先处理,以使其输入模型后更易拟合,提高模型精准度,
S4:相关性分析确定模型阶数;
使用自相关函数(ACF)和偏自相关函数(PACF)测量当前序列值与过去序列值之间的相关性,通过观察ACF和PACF的截尾(某阶后均为0),可以大致确定移动平均模型阶数q和自回归模型阶数p,
S5:训练模型;根据实际历史数据输入模型,训练计算得可用于后续计算预测的模型;
S6:预测,
利用上一步得到的模型,以及当前时刻的历史数据,计算得到对目标的预测值,随机选取三个不连续的日期的数据进行测试,比较本文使用重采样&滑动平均的方法与仅采取一阶方差、二阶方差的方法,通过MAE,MSE,R2,RE指标可以直观地看出本文方法的在R2和RE指标上的优势。
2.根据权利要求1所述的一种基于自回归模型的造纸清水流量预测智能预测模型,其特征在于:所述S3的具体步骤包括,
步骤一、分析造纸清水流量的整体变化趋势规律,造纸清水流量数值主要在两个区间内交替变化,即高水平区间和低水平区间,
步骤二、简单分析计算具体场景下造纸清水流量的周期变化特性,本案例中周期约在30分钟这个级别,
步骤三、对造纸清水流量数据进行重采样,改变了数据的时间粒度的同时,对数据的波动幅度也有一定缩小的作用,而且减少了锯齿的数量使图像更平滑,使周期性更易体现,本案例中,由秒级的数据重采样为分钟级的数据,
步骤四、对数据进行滑动窗口取平均的操作,滑动窗口一般根据具体数据情况设定,选取最优值,经过滑动平均后生成的新序列波动更小且规律表现得简单,使用这样的序建模将更高效,模型的泛化能力也更强,并且预测结果只需要逆向滑动即可还原,以阶数20为例,公式如下:
TSorigial=[t1,t2,...,tp,...tn]
TSmoving=[m1,m2,...,mq,...,ml]
Figure FDA0003895721420000031
l=n-degree+1
式中:n是原序列长度;l是新序列长度;degree是滑动阶数。
CN202211272695.XA 2022-10-18 2022-10-18 一种基于自回归模型的造纸清水流量预测智能预测模型 Withdrawn CN115470658A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211272695.XA CN115470658A (zh) 2022-10-18 2022-10-18 一种基于自回归模型的造纸清水流量预测智能预测模型

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211272695.XA CN115470658A (zh) 2022-10-18 2022-10-18 一种基于自回归模型的造纸清水流量预测智能预测模型

Publications (1)

Publication Number Publication Date
CN115470658A true CN115470658A (zh) 2022-12-13

Family

ID=84336536

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211272695.XA Withdrawn CN115470658A (zh) 2022-10-18 2022-10-18 一种基于自回归模型的造纸清水流量预测智能预测模型

Country Status (1)

Country Link
CN (1) CN115470658A (zh)

Similar Documents

Publication Publication Date Title
Pani et al. A survey of data treatment techniques for soft sensor design
CN104932488A (zh) 一种模型预测控制性能评估与诊断方法
Zhou et al. A study of polynomial fit-based methods for qualitative trend analysis
US20210065021A1 (en) Working condition state modeling and model correcting method
CN113065703A (zh) 一种结合多种模型的时间序列预测方法
CN113539382B (zh) 一种亚磷酸二甲酯关键工艺参数的预警定位方法及***
CN112801388B (zh) 一种基于非线性时间序列算法的电力负荷预测方法及***
CN112101439B (zh) 基于分布式贝叶斯网络的高速线材质量缺陷诊断与溯源方法
CN114155072A (zh) 基于大数据分析的财务预测模型构建方法及***
CN112363462A (zh) 一种静-动态协同感知的复杂工业过程运行状态评价方法
CN117808166A (zh) 云化plc的化工安全自动化检测监控***
CN108305002A (zh) 一种基于监控威布尔形状参数的早期失效率变点识别方法
CN116881635B (zh) 一种用于纺织品洗涤剂设备数据管理***
CN112016800B (zh) 一种基于有效性指标的特征选择方法与***
CN115470658A (zh) 一种基于自回归模型的造纸清水流量预测智能预测模型
CN116821828A (zh) 一种基于工业数据的多维时序预测方法
CN116933643A (zh) 基于偏鲁棒m回归和多重插补的智能数据监测方法
CN110855519A (zh) 一种网络流量预测方法
CN116020879A (zh) 面向工艺参数带钢热连轧时空多尺度过程监控方法及装置
Yang et al. A novel decentralized weighted ReliefF-PCA method for fault detection
CN112925290A (zh) 一种基于多变量本征chirp模态分解的厂级振荡检测方法
Fillah et al. Prediction of Water Quality Index using Deep Learning in Mining Company
CN117076260B (zh) 一种参数及设备异常检测方法及装置
CN113158552B (zh) 基于时间序列的生物反应器运行状况分级预测方法及***
CN111400284B (zh) 一种基于性能数据建立动态异常探测模型的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20221213