CN111950698A - 基于卷积-门控循环神经网络的水泥回转窑电耗预测方法 - Google Patents

基于卷积-门控循环神经网络的水泥回转窑电耗预测方法 Download PDF

Info

Publication number
CN111950698A
CN111950698A CN202010630341.2A CN202010630341A CN111950698A CN 111950698 A CN111950698 A CN 111950698A CN 202010630341 A CN202010630341 A CN 202010630341A CN 111950698 A CN111950698 A CN 111950698A
Authority
CN
China
Prior art keywords
time
input
output
power consumption
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010630341.2A
Other languages
English (en)
Inventor
孙超
王君微
郝晓辰
张宇轩
赵彦涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yanshan University
Original Assignee
Yanshan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yanshan University filed Critical Yanshan University
Priority to CN202010630341.2A priority Critical patent/CN111950698A/zh
Publication of CN111950698A publication Critical patent/CN111950698A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Economics (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Manufacturing & Machinery (AREA)
  • Primary Health Care (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种基于门控循环神经网络的水泥回转窑电耗的预测方法,属于水泥回转窑电耗预测技术领域,包括(1)根据水泥烧成过程经验和机理选取与水泥回转窑电耗相关的10个变量,充分考虑水泥生产过程的各变量之间的耦合及时延;(2)先用卷积提取相关输入的耦合特征;(3)再使用门控循环单元网络提取电耗序列的时序特征;(4)计算得到电耗的预测结果。本发明既解决了水泥回转窑复杂工况多变量、强耦合,难以建立机理模型的特点,又解决了变量数据存在的时变实延问题,并且为指导水泥烧成过程的调度和综合能耗的降低提供依据,可以为水泥烧成过程的管理提供规划调度依据。

Description

基于卷积-门控循环神经网络的水泥回转窑电耗预测方法
技术领域
本发明涉及水泥回转窑电耗预测技术领域,尤其是基于卷积-门控循环神经网络的水泥回转窑电耗预测方法。
背景技术
水泥工业是我国经济发展、生产建设和人民生活不可或缺的原材料工业,水泥烧成过程是水泥生产的重要过程,而电耗量是衡量水泥烧成过程能耗的重要参数,对电耗量进行精准预测,可以为水泥烧成过程调度的优化和综合能耗的降低提供依据,所以水泥烧成过程中电耗量预测具有重要的意义。
水泥烧成过程具有复杂性、随机性和动态时滞性等特点,难以使用传统数学方法建立一个精确的水泥能耗预测模型。针对上述问题,一些学者采用了不同的算法来研究用电量预测模型:
Aranda等人采用多元非线性回归算法对电耗进行预测,此方法用于研究水泥生产过程中的非线性问题,难以解决时滞问题;Zhao等使用卷积和长短时记忆网络建立风电功率预测;Cui等基于支持向量机建立水泥工厂电耗预测模型,但没有解决变量之间的耦合问题。
上述研究由于自身局限性难以解决时变时延和变量间的耦合问题,因此本专利申请提出了一种基于CNN-GRU的水泥回转窑电耗预测方法。
发明内容
本发明需要解决的技术问题是提供一种基于卷积-门控循环神经网络的水泥回转窑电耗预测方法,解决了水泥烧成复杂工况多变量、强耦合、难以建立机理模型的特点,又解决了变量数据与电耗之间存在的时变时延问题。
为解决上述技术问题,本发明所采用的技术方案是:
一种基于门控循环神经网络的水泥回转窑电耗预测方法,包括以下步骤:
步骤1:分析整个水泥烧成的生产工艺,选取与电耗相关的10个输入变量,将变量数据进行归一化处理,考虑水泥生产过程的时延和变量之间的耦合,将归一化后的变量数据以横向为变量,竖向为时间顺序的方式排列;每一段时间的数据设置为一组作为二维卷积的输入;
步骤2:对步骤1中整理后的数据进行二维卷积及最大池化运算,将经过二维卷积和最大池化运算后的数据按照时间顺序将其重构为时序序列;
步骤3:将步骤2中得到的部分组时序序列作为门控循环神经网络模型的输入,数据在门控循环神经网络模型的内部门控单元中进行数据信息传播,门控循环神经网络模型通过更新门和重置门来控制信息的保留和丢失,前一时刻的留存信息和当前时刻的信息共同决定当前的输出;使用反向传播算法计算误差,更新权值和偏置,得到训练好的门控循环神经网络模型;
步骤4:将步骤2中得到的其他组时序序列输入到训练好的门控循环神经网络模型,进行水泥回转窑电耗的预测。
本发明技术方案的进一步改进在于:步骤1中,所述10个输入变量分别为:喂料量反馈、窑电流平均值、EP风机转速、高温风机转速、分解炉喂煤量、窑头煤、二次风温、窑尾温度、分解炉出口温度、一级筒出口温度。
本发明技术方案的进一步改进在于:步骤2中,所述二维卷积及最大池化运算包括:
(1)二维卷积运算时使用3X3大小的卷积核以平移方式对输入数据进行卷积运算,得到特征矩阵,将卷积核设定为若干个,从而提取输入数据的不同特征信息,得到多个特征矩阵;
(2)对得到的多个特征矩阵进行池化,使用最大池化方式对数据进行处理。
本发明技术方案的进一步改进在于:由于水泥生产过程的复杂性,各输入变量之间存在耦合关系,使用二维卷积可以提取输入变量间的耦合特征,将输入变量数据以横向为变量,竖向为时间顺序的方式排列,每一段时间的数据设置为一组,使用3X3大小的卷积核对输入数据进行卷积运算,得到特征矩阵,表达公式如下所示:
Figure BDA0002564582190000031
其中,
Figure BDA0002564582190000032
为第t组数据得到的特征矩阵,wm为卷积核权重,
Figure BDA0002564582190000033
为第t组输入数据矩阵,bm为卷积核的偏置项,f为激活函数。
本发明技术方案的进一步改进在于:步骤3中,门控循环神经网络模型具体的计算过程如下:
S1:更新门的计算
更新门决定前一时刻和当前时间的信息有多少需要继续进行传递,更新门的输出由前一时刻隐藏状态输出和当前时刻输入共同决定,计算公式如下:
zt=σ(Wz·[ht-1,xt]+bz) (2)
上式(2)中,Wz是更新门的权重矩阵,[ht-1,xt]表示将前一时刻隐含层状态ht-1和当前时刻输入xt连接成一个更长的向量,σ是sigmoid激活函数,bz为更新门偏置项;
S2:重置门的计算
重置门决定有多少之前时刻的信息需要进行遗忘,重置门的输出同样由前一时刻隐藏状态输出和当前时刻输入共同决定,计算公式如下:
rt=σ(Wr·[ht-1,xt]+br) (3)
上式(3)中,Wr是重置门的权重矩阵,[ht-1,Xt]表示将前一时刻隐含层状态ht-1和当前时刻输入Xt连接成一个更长的向量,σ是sigmoid激活函数,br为重置门偏置项;
S3:当前输入的单元状态计算
Figure BDA0002564582190000041
上式(4)中,Wh是单元状态的权重矩阵,rt是重置门的输出,ht-1为前一时刻隐含层状态,xt为当前时刻的输入,tanh是双曲正切激活函数,bh为单元状态偏置项;
隐含层最终输出由上一时刻的单元状态、当前时刻候选单元状态和更新门输出共同决定:
Figure BDA0002564582190000042
上式(5)中,h为当前时刻隐含层输出,ht-1为前一时刻隐含层状态,zt为更新门的输出,
Figure BDA0002564582190000043
为候选单元状态;
序列预测输出:
Figure BDA0002564582190000044
上式(6)中,
Figure BDA0002564582190000045
为当前时刻t的预测输出,W为预测输出层权重矩阵,h为当前时刻隐含层输出,σ是sigmoid激活函数,b为预测输出层偏置项;
S4:采用反向传播反向计算每个神经元的误差和每个权重的梯度,更新权值
为了计算方便,权重矩阵Wr、Wz、Wh拆分成Wrh、Wrx、Wzh、Wzx、Whh、Whx;定义损失函数:
Figure BDA0002564582190000046
上式(7)中,
Figure BDA0002564582190000047
和yt分别为t时刻的预测输出和期望输出;
S5:权重梯度的计算
Wrh、Wzh、Whh各时刻的权重梯度为:
Figure BDA0002564582190000051
Figure BDA0002564582190000052
Figure BDA0002564582190000053
Wrx、Wzx、Whx的权重梯度:
Figure BDA0002564582190000054
Figure BDA0002564582190000055
Figure BDA0002564582190000056
与权重对应的偏置br,bz,bh梯度为:
Figure BDA0002564582190000057
Figure BDA0002564582190000058
Figure BDA0002564582190000059
S6:进行权重的更新
η为模型的学习率,为了增加公式的适用性,对公式进行泛化,W表示网络中四个节点的权重,L代表四个节点的偏置项;
Figure BDA00025645821900000510
Figure BDA00025645821900000511
S7:至此,完成一次前向和反向传播,重复上述过程,每经过一个时间步,求得误差项,若误差项小于阈值,则进行权重矩阵W和偏置项b的更新,直到误差小于设定阈值完成训练。
由于采用了上述技术方案,本发明取得的技术进步是:
1、本发明根据水泥烧成过程经验选取与水泥电耗相关的10个变量,充分考虑输入数据的结构特征,使用二维卷积提取变量间的耦合特征,为了描述电耗序列的时序依从关系,将卷积提取特征后的数据作为门控循环神经网络的输入信息,计算得到电耗的预测结果;在模型的反向传播中,采用随机梯度下降算法,通过误差项的反向传播求得权重梯度,达到权重更新的目的,模型预测精度提升的同时,训练效率得到提高。
2、本发明建立的水泥回转窑烧成过程电耗预测模型,使用二维卷积提取数据信息特征,充分考虑到了各变量之间的耦合关系。
2、本发明建立的预测模型,充分考虑了变量数据的时序特性,而且解决了长短时记忆网络参数较多,内部计算复杂的问题,使用更新门和重置门控制时时序信息的传递状态,解决时延问题。
附图说明
图1是本发明模型的结构图;
图2是本发明中二维卷积的特征提取图;
图3是本发明模型流程图。
具体实施方式
本发明是针对水泥烧成工艺流程的复杂性、随机性和动态时滞性等特点,难以用传统的数学方法建立精确的电耗预测模型,目前本技术领域现有的研究方法的自身局限性难以解决时变时延和变量间的耦合问题而研发的一种基于门控循环神经网络的水泥回转窑电耗预测方法。
下面结合附图及实施例对本发明做进一步详细说明:
如图1所示,一种基于门控循环神经网络的水泥回转窑电耗预测方法,包括以下步骤:
步骤1:分析整个水泥烧成的生产工艺,选取与电耗相关的10个输入变量,将变量数据进行归一化处理,考虑水泥生产过程的时延和变量之间的耦合,将归一化后的变量数据以横向为变量,竖向为时间顺序的方式排列;每一段时间的数据设置为一组作为二维卷积的输入;所述10个输入变量分别为:喂料量反馈、窑电流平均值、EP风机转速、高温风机转速、分解炉喂煤量、窑头煤、二次风温、窑尾温度、分解炉出口温度、一级筒出口温度。
步骤2:对步骤1中整理后的数据进行二维卷积及最大池化运算,将经过二维卷积和最大池化运算后的数据按照时间顺序将其重构为时序序列;所述二维卷积及最大池化运算包括:
(1)二维卷积运算时使用3X3大小的卷积核以平移方式对输入数据进行卷积运算,得到特征矩阵,将卷积核设定为若干个,从而提取输入数据的不同特征信息,得到多个特征矩阵;由于水泥生产过程的复杂性,各输入变量之间存在耦合关系,使用二维卷积可以提取输入变量间的耦合特征,将输入变量数据以横向为变量,竖向为时间顺序的方式排列,每一段时间的数据设置为一组,使用3X3大小的卷积核对输入数据进行卷积运算,得到特征矩阵,表达公式如下所示:
Figure BDA0002564582190000071
其中,
Figure BDA0002564582190000072
为第t组数据得到的特征矩阵,wm为卷积核权重,
Figure BDA0002564582190000073
为第t组输入数据矩阵,bm为卷积核的偏置项,f为激活函数。
(2)对得到的多个特征矩阵进行池化,使用最大池化方式对数据进行处理。
步骤3:将步骤2中得到的部分组时序序列作为门控循环神经网络模型的输入,数据在门控循环神经网络模型的内部门控单元中进行数据信息传播,门控循环神经网络模型通过更新门和重置门来控制信息的保留和丢失,前一时刻的留存信息和当前时刻的信息共同决定当前的输出;使用反向传播算法计算误差,更新权值和偏置,得到训练好的门控循环神经网络模型;
门控循环神经网络模型具体的计算过程如下:
S1:更新门的计算
更新门决定前一时刻和当前时间的信息有多少需要继续进行传递,更新门的输出由前一时刻隐藏状态输出和当前时刻输入共同决定,计算公式如下:
zt=σ(Wz·[ht-1,xt]+bz) (2)
上式(2)中,Wz是更新门的权重矩阵,[ht-1,xt]表示将前一时刻隐含层状态ht-1和当前时刻输入xt连接成一个更长的向量,σ是sigmoid激活函数,bz为更新门偏置项;
S2:重置门的计算
重置门决定有多少之前时刻的信息需要进行遗忘,重置门的输出同样由前一时刻隐藏状态输出和当前时刻输入共同决定,计算公式如下:
rt=σ(Wr·[ht-1,xt]+br) (3)
上式(3)中,Wr是重置门的权重矩阵,[ht-1,Xt]表示将前一时刻隐含层状态ht-1和当前时刻输入Xt连接成一个更长的向量,σ是sigmoid激活函数,br为重置门偏置项;
S3:当前输入的单元状态计算
Figure BDA0002564582190000081
上式(4)中,Wh是单元状态的权重矩阵,rt是重置门的输出,ht-1为前一时刻隐含层状态,xt为当前时刻的输入,tanh是双曲正切激活函数,bh为单元状态偏置项;
隐含层最终输出由上一时刻的单元状态、当前时刻候选单元状态和更新门输出共同决定:
Figure BDA0002564582190000091
上式(5)中,h为当前时刻隐含层输出,zt为更新门的输出,ht-1为前一时刻隐含层状态,
Figure BDA0002564582190000092
为候选单元状态;
序列预测输出:
Figure BDA0002564582190000093
上式(6)中,
Figure BDA0002564582190000094
为当前时刻t的预测输出,σ是sigmoid激活函数,W为预测输出层权重矩阵,h为当前时刻隐含层输出,b为预测输出层偏置项;
S4:采用反向传播反向计算每个神经元的误差和每个权重的梯度,更新权值
为了计算方便,权重矩阵Wr、Wz、Wh拆分成Wrh、Wrx、Wzh、Wzx、Whh、Whx;定义损失函数:
Figure BDA0002564582190000095
上式(7)中,
Figure BDA0002564582190000096
和yt分别为t时刻的预测输出和期望输出;
S5:权重梯度的计算
Wrh、Wzh、Whh各时刻的权重梯度为:
Figure BDA0002564582190000101
Figure BDA0002564582190000102
Figure BDA0002564582190000103
Wrx、Wzx、Whx的权重梯度:
Figure BDA0002564582190000104
Figure BDA0002564582190000105
Figure BDA0002564582190000106
与权重对应的偏置br,bz,bh梯度为:
Figure BDA0002564582190000107
Figure BDA0002564582190000108
Figure BDA0002564582190000109
S6:进行权重的更新
η为模型的学习率,为了增加公式的适用性,对公式进行泛化,W表示网络中四个节点的权重,L代表四个节点的偏置项;
Figure BDA00025645821900001010
Figure BDA00025645821900001011
S7:至此,完成一次前向和反向传播,重复上述过程,每经过一个时间步,求得误差项,若误差项小于阈值,则进行权重矩阵W和偏置项b的更新,直到误差小于设定阈值完成训练。
步骤4:将步骤2中得到的其他组时序序列输入到训练好的门控循环神经网络模型,进行水泥回转窑电耗的预测。
具体的:
“卷积”英文缩写为CNN,门控循环神经网络英文缩写为GRU。
一种基于门控循环神经网络的水泥回转窑电耗预测方法,首先从水泥烧成***的数据库中选取与电耗相关的10个输入变量,使用二维卷积和最大池化对输入数据进行特征提取,将提取的特征数据分解重构后作为GRU模型的输入,采用反向传播算法求取神经网络各节点的误差项,反复训练,获得训练好的模型。整体结构如图1所示,二维卷积的特征提取如图2所示,基于门控循环神经网络的水泥回转窑电耗预测模型流程如图3所示。
步骤1:分析整个水泥烧成的生产工艺,结合现场工程师的经验知识,选取了10种与电耗相关的过程参量作为输入变量,如图1中输入层所示,10输入变量分别为喂料量反馈X1、窑电流平均值X2、EP风机转速X3、高温风机转速X4、分解炉喂煤量X5、窑头煤X6、二次风温X7、窑尾温度X8、分解炉出口温度X9、一级筒出口温度X10。先对数据进行归一化处理,充分考虑水泥生产过程的时延和变量之间的耦合,将归一化后的变量数据以横向为变量,竖向为时间顺序的方式排列,每一段时间的数据设置为一组作为二维卷积的输入。
步骤2:对步骤1中整理后的数据进行二维卷积及最大池化运算,将经过卷积池化后的数据进行分解并重塑为顺序时间分量作为GRU模型的输入。二维卷积的特征提取如图2所示,卷积层通过设定卷积核的大小和移动步长,以平移方式,对输入数据进行卷积运算,得到特征矩阵,公式如下所示:
Figure BDA0002564582190000111
其中,
Figure BDA0002564582190000112
为第t组数据得到的特征矩阵,wm为卷积核权重,
Figure BDA0002564582190000113
为第t组输入数据矩阵,bm为卷积核的偏置项,f为激活函数。将卷积核设定为若干个,从而提取输入数据的不同特征信息,得到多个特征矩阵。池化层是非线性采样的一种方法,通过最大池方式对数据进行处理,即在邻域中选取特征点的最大值代替整个邻域的值,从而减少运算参数。经过二维卷积和最大池化运算后的数据不能直接输入到GRU模型中,要将其重构为时序序列。
步骤3:将步骤2中得到的其中一组时序序列作为GRU模型的输入,数据在GRU模型的内部门控单元中进行数据信息传播,使用反向传播算法计算误差梯度,更新权值和偏置,得到训练好的GRU模型。GRU模型具体的计算过程如下:
S1:更新门的计算
更新门来决定前一时刻和当前时间的信息有多少需要继续进行传递,更新门的输出由前一时刻隐藏状态输出和当前时刻输入共同决定,更新门的计算:
zt=σ(Wz·[ht-1,xt]+bz) (2)
上式中,Wz是更新门的权重矩阵,[ht-1,xt]表示将前一时刻隐含层状态ht-1和当前时刻输入xt连接成一个更长的向量,σ是sigmoid激活函数,bz为更新门偏置项。
S2:重置门的计算
重置门来决定有多少之前时刻的信息需要进行遗忘,重置门的输出同样由前一时刻隐藏状态输出和当前时刻输入共同决定,重置门的计算:
rt=σ(Wr·[ht-1,xt]+br) (3)
上式中,Wr是重置门的权重矩阵,[ht-1,Xt]表示将前一时刻隐含层状态ht-1和当前时刻输入Xt连接成一个更长的向量,σ是sigmoid激活函数,br为重置门偏置项。
S4:当前输入的单元状态计算
Figure BDA0002564582190000131
上式中,Wh是单元状态的权重矩阵,rt是重置门的输出,ht-1为前一时刻隐含层状态,xt为当前时刻的输入,tanh是双曲正切激活函数,bh为单元状态偏置项。隐含层最终输出由上一时刻的单元状态、当前时刻候选单元状态和更新门输出共同决定:
Figure BDA0002564582190000132
上式中,h为当前时刻隐含层输出,zt为更新门的输出,
Figure BDA0002564582190000133
为候选单元状态。序列预测输出:
Figure BDA0002564582190000134
上式中,
Figure BDA0002564582190000135
为当前时刻t的预测输出,W为预测输出层权重矩阵,b为预测输出层偏置项。
S4:采用反向传播反向计算每个神经元的误差和每个权重的梯度,更新权值。
为了计算方便,权重矩阵Wr、Wz、Wh拆分成Wrh、Wrx、Wzh、Wzx、Whh、Whx。定义损失函数:
Figure BDA0002564582190000136
上式中,
Figure BDA0002564582190000137
和yt分别为t时刻的预测输出和期望输出。
S5:权重梯度的计算
权重梯度的计算Wrh、Wzh、Whh各时刻的权重梯度为:
Figure BDA0002564582190000141
Figure BDA0002564582190000142
Figure BDA0002564582190000143
Wrx、Wzx、Whx的权重梯度:
Figure BDA0002564582190000144
Figure BDA0002564582190000145
Figure BDA0002564582190000146
与权重对应的偏置br,bz,bh梯度为:
Figure BDA0002564582190000147
Figure BDA0002564582190000148
Figure BDA0002564582190000149
S6:权重的更新
我们求出了各参数的梯度,下面进行权重的更新,η为模型的学习率,为了增加公式的适用性,对公式进行泛化,W表示网络中四个节点的权重,L代表四个节点的偏置项。
Figure BDA00025645821900001410
Figure BDA00025645821900001411
S7:至此,完成一次前向和反向传播,重复上述过程,每经过一个时间步,求得误差项,若误差项小于阈值,则进行权重矩阵W和偏置项b的更新,直到误差小于设定阈值完成训练。
步骤4:将处理后的水泥回转窑的过程变量数据输入到训练好的门控循环神经网络(GRU)模型,实现水泥回转窑电耗的预测。
在本方法中,从水泥企业生产数据库中提取2000组数据,并按所述方法进行数据处理和模型训练。选取其中1600组作为训练数据,其余400组作为预测数据以验证模型有效性。
综上所述,本发明根据水泥烧成过程经验选取与水泥电耗相关的10个变量,充分考虑输入数据的结构特征,使用二维卷积提取变量间的耦合特征,为了描述电耗序列的时序依从关系,将卷积提取特征后的数据作为门控循环神经网络的输入信息,计算得到电耗的预测结果;在模型的反向传播中,采用随机梯度下降算法,通过误差项的反向传播求得权重梯度,达到权重更新的目的,模型预测精度提升的同时,训练效率得到提高。本发明既解决了水泥回转窑复杂工况多变量、强耦合,难以建立机理模型的特点,又解决了变量数据存在的时变实延问题,可以为水泥烧成过程的管理提供规划调度依据。

Claims (5)

1.一种基于门控循环神经网络的水泥回转窑电耗预测方法,其特征在于:包括以下步骤:
步骤1:分析整个水泥烧成的生产工艺,选取与电耗相关的10个输入变量,将变量数据进行归一化处理,考虑水泥生产过程的时延和变量之间的耦合,将归一化后的变量数据以横向为变量,竖向为时间顺序的方式排列;每一段时间的数据设置为一组作为二维卷积的输入;
步骤2:对步骤1中整理后的数据进行二维卷积及最大池化运算,将经过二维卷积和最大池化运算后的数据按照时间顺序将其重构为时序序列;
步骤3:将步骤2中得到的部分组时序序列作为门控循环神经网络模型的输入,数据在门控循环神经网络模型的内部门控单元中进行数据信息传播,门控循环神经网络模型通过更新门和重置门来控制信息的保留和丢失,前一时刻的留存信息和当前时刻的信息共同决定当前的输出;使用反向传播算法计算误差,更新权值和偏置,得到训练好的门控循环神经网络模型;
步骤4:将步骤2中得到的其他组时序序列输入到训练好的门控循环神经网络模型,进行水泥回转窑电耗的预测。
2.根据权利要求1所述的一种基于门控循环神经网络的水泥回转窑电耗预测方法,其特征在于:步骤1中,所述10个输入变量分别为:喂料量反馈、窑电流平均值、EP风机转速、高温风机转速、分解炉喂煤量、窑头煤、二次风温、窑尾温度、分解炉出口温度、一级筒出口温度。
3.根据权利要求1所述的一种基于门控循环神经网络的水泥回转窑电耗预测方法,其特征在于:步骤2中,所述二维卷积及最大池化运算包括:
(1)二维卷积运算时使用3X3大小的卷积核以平移方式对输入数据进行卷积运算,得到特征矩阵,将卷积核设定为若干个,从而提取输入数据的不同特征信息,得到多个特征矩阵;
(2)对得到的多个特征矩阵进行池化,使用最大池化方式对数据进行处理。
4.根据权利要求3所述的一种基于门控循环神经网络的水泥回转窑电耗预测方法,其特征在于:由于水泥生产过程的复杂性,各输入变量之间存在耦合关系,使用二维卷积可以提取输入变量间的耦合特征,将输入变量数据以横向为变量,竖向为时间顺序的方式排列,每一段时间的数据设置为一组,使用3X3大小的卷积核对输入数据进行卷积运算,得到特征矩阵,表达公式如下所示:
Figure FDA0002564582180000021
其中,
Figure FDA0002564582180000022
为第t组数据得到的特征矩阵,wm为卷积核权重,
Figure FDA0002564582180000023
为第t组输入数据矩阵,bm为卷积核的偏置项,f为激活函数。
5.根据权利要求1所述的一种基于门控循环神经网络的水泥回转窑电耗预测方法,其特征在于:步骤3中,门控循环神经网络模型具体的计算过程如下:
S1:更新门的计算
更新门决定前一时刻和当前时间的信息有多少需要继续进行传递,更新门的输出由前一时刻隐藏状态输出和当前时刻输入共同决定,计算公式如下:
zt=σ(Wz·[ht-1,xt]+bz) (2)
上式(2)中,Wz是更新门的权重矩阵,[ht-1,xt]表示将前一时刻隐含层状态ht-1和当前时刻输入xt连接成一个更长的向量,σ是sigmoid激活函数,bz为更新门偏置项;
S2:重置门的计算
重置门决定有多少之前时刻的信息需要进行遗忘,重置门的输出同样由前一时刻隐藏状态输出和当前时刻输入共同决定,计算公式如下:
rt=σ(Wr·[ht-1,xt]+br) (3)
上式(3)中,Wr是重置门的权重矩阵,[ht-1,Xt]表示将前一时刻隐含层状态ht-1和当前时刻输入Xt连接成一个更长的向量,σ是sigmoid激活函数,br为重置门偏置项;
S3:当前输入的单元状态计算
Figure FDA0002564582180000031
上式(4)中,Wh是单元状态的权重矩阵,rt是重置门的输出,ht-1为前一时刻隐含层状态,xt为当前时刻的输入,tanh是双曲正切激活函数,bh为单元状态偏置项;
隐含层最终输出由上一时刻的单元状态、当前时刻候选单元状态和更新门输出共同决定:
Figure FDA0002564582180000032
上式(5)中,h为当前时刻隐含层输出,ht-1为前一时刻隐含层状态,zt为更新门的输出,
Figure FDA0002564582180000033
为候选单元状态;
序列预测输出:
Figure FDA0002564582180000034
上式(6)中,
Figure FDA0002564582180000035
为当前时刻t的预测输出,W为预测输出层权重矩阵,h为当前时刻隐含层输出,σ是sigmoid激活函数,b为预测输出层偏置项;
S4:采用反向传播反向计算每个神经元的误差和每个权重的梯度,更新权值
为了计算方便,权重矩阵Wr、Wz、Wh拆分成Wrh、Wrx、Wzh、Wzx、Whh、Whx;定义损失函数:
Figure FDA0002564582180000041
上式(7)中,
Figure FDA0002564582180000042
和yt分别为t时刻的预测输出和期望输出;
S5:权重梯度的计算
Wrh、Wzh、Whh各时刻的权重梯度为:
Figure FDA0002564582180000043
Figure FDA0002564582180000044
Figure FDA0002564582180000045
Wrx、Wzx、Whx的权重梯度:
Figure FDA0002564582180000046
Figure FDA0002564582180000047
Figure FDA0002564582180000048
与权重对应的偏置br,bz,bh梯度为:
Figure FDA0002564582180000049
Figure FDA00025645821800000410
Figure FDA00025645821800000411
S6:进行权重的更新
η为模型的学习率,为了增加公式的适用性,对公式进行泛化,W表示网络中四个节点的权重,L代表四个节点的偏置项;
Figure FDA0002564582180000051
Figure FDA0002564582180000052
S7:至此,完成一次前向和反向传播,重复上述过程,每经过一个时间步,求得误差项,若误差项小于阈值,则进行权重矩阵W和偏置项b的更新,直到误差小于设定阈值完成训练。
CN202010630341.2A 2020-07-01 2020-07-01 基于卷积-门控循环神经网络的水泥回转窑电耗预测方法 Pending CN111950698A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010630341.2A CN111950698A (zh) 2020-07-01 2020-07-01 基于卷积-门控循环神经网络的水泥回转窑电耗预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010630341.2A CN111950698A (zh) 2020-07-01 2020-07-01 基于卷积-门控循环神经网络的水泥回转窑电耗预测方法

Publications (1)

Publication Number Publication Date
CN111950698A true CN111950698A (zh) 2020-11-17

Family

ID=73337411

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010630341.2A Pending CN111950698A (zh) 2020-07-01 2020-07-01 基于卷积-门控循环神经网络的水泥回转窑电耗预测方法

Country Status (1)

Country Link
CN (1) CN111950698A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115392125A (zh) * 2022-08-29 2022-11-25 广东工业大学 水泥回转窑的温度预测方法
CN115440317A (zh) * 2022-07-20 2022-12-06 中南大学 一种浸出铀浓度的预测方法及装置、电子设备、存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108448610A (zh) * 2018-03-12 2018-08-24 华南理工大学 一种基于深度学习的短期风功率预测方法
CN108932567A (zh) * 2018-08-10 2018-12-04 燕山大学 一种基于卷积神经网络的水泥烧成过程多能耗指标预测方法
CN109389244A (zh) * 2018-09-06 2019-02-26 浙江鸿程计算机***有限公司 一种基于gru的多因素感知短期景区内游客人数预测方法
CN110458337A (zh) * 2019-07-23 2019-11-15 内蒙古工业大学 一种基于c-gru的网约车供需预测方法
CN111275168A (zh) * 2020-01-17 2020-06-12 南京信息工程大学 基于卷积全连接的双向门控循环单元的空气质量预测方法
CN111338002A (zh) * 2020-03-19 2020-06-26 长江大学 基于门控循环神经网络模型的孔隙度预测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108448610A (zh) * 2018-03-12 2018-08-24 华南理工大学 一种基于深度学习的短期风功率预测方法
CN108932567A (zh) * 2018-08-10 2018-12-04 燕山大学 一种基于卷积神经网络的水泥烧成过程多能耗指标预测方法
CN109389244A (zh) * 2018-09-06 2019-02-26 浙江鸿程计算机***有限公司 一种基于gru的多因素感知短期景区内游客人数预测方法
CN110458337A (zh) * 2019-07-23 2019-11-15 内蒙古工业大学 一种基于c-gru的网约车供需预测方法
CN111275168A (zh) * 2020-01-17 2020-06-12 南京信息工程大学 基于卷积全连接的双向门控循环单元的空气质量预测方法
CN111338002A (zh) * 2020-03-19 2020-06-26 长江大学 基于门控循环神经网络模型的孔隙度预测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
VINICIER: "《梯度下降法与反向传播》", 《HTTPS://BLOG.CSDN.NET/U010976453/ARTICLE/DETAILS/78493563》 *
李云兵等: "《基于门控循环神经网络的线损电量预测方法》", 《科技前沿》 *
牛哲文等: "《基于深度门控循环单元神经网络的短期风功率预测模型》", 《电力自动化设备》 *
郝晓辰等: "《基于时间序列卷积神经网络的水泥烧成过程能耗预测模型》", 《2018中国自动化大会(CAC2018)论文集》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115440317A (zh) * 2022-07-20 2022-12-06 中南大学 一种浸出铀浓度的预测方法及装置、电子设备、存储介质
CN115392125A (zh) * 2022-08-29 2022-11-25 广东工业大学 水泥回转窑的温度预测方法

Similar Documents

Publication Publication Date Title
CN108932567B (zh) 一种基于卷积神经网络的水泥烧成过程多能耗指标预测方法
CN108448610B (zh) 一种基于深度学习的短期风功率预测方法
CN113777496B (zh) 基于时间卷积神经网络的锂离子电池剩余寿命预测方法
CN108170529A (zh) 一种基于长短期记忆网络的云数据中心负载预测方法
CN110909926A (zh) 基于tcn-lstm的太阳能光伏发电预测方法
CN109342703B (zh) 一种水泥熟料游离钙含量测量方法及***
CN112232577B (zh) 用于多芯智能表的电力负荷概率预测***与方法
CN111950698A (zh) 基于卷积-门控循环神经网络的水泥回转窑电耗预测方法
Tian et al. TS fuzzy neural network predictive control for burning zone temperature in rotary kiln with improved hierarchical genetic algorithm
CN104539601B (zh) 动态网络攻击过程可靠性分析方法及***
CN114462718A (zh) 基于时间滑动窗口的cnn-gru风电功率预测方法
CN104615856B (zh) 基于热风炉组的煤气消耗量预测模型建立方法及装置
CN113591374B (zh) 基于卷积简单循环单元网络的水泥成品比表面积预测方法
CN113052214A (zh) 基于长短期时间序列网络的换热站超短期热负荷预测方法
CN116345555A (zh) 一种基于cnn-isca-lstm模型的短期光伏发电功率预测方法
CN114548591A (zh) 一种基于混合深度学习模型和Stacking的时序数据预测方法及***
Chang et al. Flexible Clockwork Recurrent Neural Network for multirate industrial soft sensor
CN114066069A (zh) 一种组合权重的副产煤气发生量预测方法
CN117748495A (zh) 一种基于残差神经网络的光伏电站短期发电功率预测方法
CN110348623A (zh) 基于设计结构矩阵的复杂产品开发时间预测及优化方法
CN113111577B (zh) 基于多目标布谷鸟搜索的水泥磨运行指标决策方法
CN108876038B (zh) 大数据、人工智能、超算协同的材料性能预测方法
Wen et al. MapReduce-based BP neural network classification of aquaculture water quality
CN114219126A (zh) 基于残差修正的小水电渗透地区网供负荷预测方法
CN113762591A (zh) 一种基于gru和多核svm对抗学习的短期电量预测方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201117