CN113537469A - 一种基于LSTM网络和Attention机制的城市需水预测方法 - Google Patents
一种基于LSTM网络和Attention机制的城市需水预测方法 Download PDFInfo
- Publication number
- CN113537469A CN113537469A CN202110815711.4A CN202110815711A CN113537469A CN 113537469 A CN113537469 A CN 113537469A CN 202110815711 A CN202110815711 A CN 202110815711A CN 113537469 A CN113537469 A CN 113537469A
- Authority
- CN
- China
- Prior art keywords
- attention
- lstm
- model
- water
- month
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 142
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000007246 mechanism Effects 0.000 title claims abstract description 22
- 238000012549 training Methods 0.000 claims description 33
- 210000002569 neuron Anatomy 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 13
- 238000001556 precipitation Methods 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 10
- 239000013598 vector Substances 0.000 claims description 10
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 238000009795 derivation Methods 0.000 claims 1
- 238000013277 forecasting method Methods 0.000 claims 1
- 238000013528 artificial neural network Methods 0.000 description 19
- 238000003062 neural network model Methods 0.000 description 8
- 210000004027 cell Anatomy 0.000 description 4
- 238000000513 principal component analysis Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 210000002364 input neuron Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000004205 output neuron Anatomy 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- General Business, Economics & Management (AREA)
- Biomedical Technology (AREA)
- Tourism & Hospitality (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于LSTM网络和Attention机制的城市需水预测方法,该方法使用Attention机制改良了一般的LSTM模型,然后使用数据集对改良后的模型进行训练,比较LSTM的输出与实际值,得出预测误差,再使用预测误差更新网络参数,如此不断迭代,使得Attention改良后的LSTM模型能够自动学习到城市需水预测数据里隐藏的城市需水规律,从而实现城市需水预测。实际使用时,将历史数据输入到Attention‑LSTM模型,得到数据的预测结果。本发明使用Attention改进了一般的LSTM模型,对城市需水预测具有更小的误差,具有良好的准确性。
Description
技术领域
本发明涉及城市供水规划技术领域,特别涉及一种基于LSTM网络和Attention机制的城市需水预测方法,属于城市供水规划技术领域。
背景技术
针对城市需水预测问题,目前需水预测模型多样,常用的方法有时间序列法、回归分析法、灰色模型预测、***动力学模型、神经网络及其变种以及组合模型法等方法。但是传统的时间序列法等方法,存在考虑不全面,准确预测时间短,逻辑解释不严谨等缺点。而神经网络虽然具有非常强大的非线性拟合能力,但是容易陷入局部最优值,且模型训练时间相对较长。近几年来,随着神经网络的不断发展,神经网络方法对时间序列数据的预测更加精准。
薛林丽等在文献《城市需水预测方法比较》(薛林丽,袁星宇,刘宗显.城市需水预测方法比较[J].人民珠江,2018,39(01):63-66)中基于多元线性回归法、灰色模型预测法和BP神经网络法对北京市的用水数据进行模拟预测,发现BP神经网络法预测模型预测精度更高。***等在文献《基于主成分分析的GA-BP模型在城市需水预测中的应用》(***,苏志伟,周华,等.基于主成分分析的GA-BP模型在城市需水预测中的应用[J].南水北调与水利科技,2017,15(06):39-44)用主成分分析(PCA)和灰色关联分析(GRA)降低数据维度的基础上,引入遗传算法(GA)和思维进化算法(MEA)提高神经网络的收敛速度,避免训练时网络陷入局部极值。但是,研究发现单一的LSTM模型往往不能达到良好的预测结果,同时,单一的LSTM模型鲁棒性不强。
发明内容
本发明要解决现有技术中单一的LSTM模型不能达到良好的预测结果、单个LSTM模型鲁棒性不强的技术问题,提供一种基于Attention和LSTM的城市需水预测方法,使用Attention机制改进LSTM模型,为城市需水预测问题提供了一种可靠的、鲁棒性更好的模型。
本发明采用以下技术方案:
一种基于LSTM网络和Attention机制的城市需水预测方法,包括如下步骤:
步骤1,获取城市每月的住宅用水数据,并按照城市邮编、年份、月份、六月前用水量、五月前用水量、四月前用水量、三月前用水量、二月前用水量、一月前用水量、温度、降水量以及当月用水量的顺序构建多元时间序列并从中选取N条数据(xi,yi)作为训练样本,i=1,2,…,N,其中,分别表示相对于某月而言,某月以前的前6个月数据的特征向量:城市邮编、年份、月份、六月前用水量、五月前用水量、四月前用水量、三月前用水量、二月前用水量、一月前用水量、温度、降水量;将某月记为第D月,yi表示该地区的第D月用水量;
步骤2,使用Attention机制改进LSTM网络模型,得到Attention-LSTM网络模型;
步骤3,利用步骤1的训练样本对Attention-LSTM网络模型进行训练,每次将xi作为该模型的输入,得到一个预测结果;将模型的输出值与实际值进行误差比较,通过损失函数对不同的输出值进行求导,用反向传播算法向所有神经元传递误差;
步骤4,根据误差值,使用随机梯度下降法对各层神经元更新权重与偏置值,每次调整幅度根据学习率进行;
步骤5,重复步骤2-4,将迭代次数设置到足够梯度下降为0;
步骤6,使用参数训练完毕的Attention-LSTM网络模型对某月某地区的当月需水量进行预测。
具体地,步骤2的具体做法如下:
1)使用Attention机制用来改良在LSTM从隐藏层得到的中间结果的注意力占比;
2)随机初始化Attention-LSTM网络模型中的参数,并通过训练样本学习调整Attention-LSTM网络模型中的参数,即将xi,yi分别作为Attention-LSTM网络的输入和输出来学习网络中的参数。
具体地,随机初始化Attention-LSTM网络模型中的参数W0,并通过训练样本学习调整Attention-LSTM网络模型中的参数,得到训练过程中的权重参数,记作为即将(xi,yi)分别作为Attention-LSTM网络的输入和输出来学习网络的最终参数w,这个过程可表示如下;
w=argminL(Attention-LSTM(x,w),y)
其中Attention-LSTM(x,w)是对基于Attention和LSTM的城市需水预测模型一般化表示,x表示模型的输入,w表示模型的所有权重;L(Ypredict,Ylabel)表示对LSTM-Attention模型的监督函数的一般化表示,实际写作如下所示:
具体地,步骤3的具体做法如下:
将xi作为Attention-LSTM网络的输入,得到Attention-LSTM网络的预测值与该地区在对应时间记录的实际需水量yi进行比较,再通过反向传播算法调整优化Attention-LSTM网络中的参数,得到优化后的Attention-LSTM网络模型,其中,分别表示相对于某月而言,某月以前的前6个月数据的特征向量:城市邮编、年份、月份、六月前用水量、五月前用水量、四月前用水量、三月前用水量、二月前用水量、一月前用水量、温度和降水量。
与现有技术相比,本发明具有以下技术效果:
1、本发明构建基于Attention和LSTM的城市需水预测模型,通过在美国政府公开数据集上的城市家庭用水实验结果,对比分析基于Attention和LSTM的城市需水预测模型与SimpleRNN模型、LSTM模型、GRU模型和BP模型在预测效果上的不同,以及研究基于Attention和LSTM的城市需水预测模型和其他模型在预测性能上的差异,有效地提高模型的预测的准确性。
2、本发明通过在结合深度学习强大的表征能力和LSTM神经网络对于时间序列模型较优的预测能力的优点基础上,使用Attention机制用来改良在LSTM从隐藏层得到的中间结果的注意力占比,提供了一种可靠的城市需水预测模型,对城市需水的预测具有良好的准确性和鲁棒性。
附图说明
图1是本发明一种基于Attention和LSTM的城市需水预测方法的整体架构图。
图2是本发明预测方法中用LSTM模型结构示意图。
图3是本发明预测方法中用Attention改进LSTM后的模型结构示意图。
图4显示了SimpleRNN神经网络拟合图,其中图4a显示了家庭用户用水数据集拟合图,4b显示了住户用水数据集拟合图;
图5显示了LSTM神经网络拟合图,其中图5a显示了家庭用户用水数据集拟合图,5b显示了住户用水数据集拟合图;
图6显示了GRU神经网络拟合图,其中图6a显示了家庭用户用水数据集拟合图,6b显示了住户用水数据集拟合图;
图7显示了BP神经网络拟合图,其中图7a显示了家庭用户用水数据集拟合图,7b显示了住户用水数据集拟合图;
图8显示了Attention-LSTM神经网络拟合图,其中图8a显示了家庭用户用水数据集拟合图,8b显示了住户用水数据集拟合图;
上述图4-图8中,灰色线条代表预测数据,黑色线条代表实测数据。
具体实施方式
下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
神经网络具有非常强大的非线性拟合能力,但是容易陷入局部最优值,且模型训练时间相对较长。近几年来,随着神经网络的不断发展,神经网络方法在时间序列数据的预测更加精准。传统的SimpleRNN,GRU,LSTM和BP神经网络对于影响城市需水预测的元素是均衡考虑的,但是实际上不同的元素对城市需水的影响能力是不一样的,因此在城市需水预测中,需要对这些影响因素分别给予不同的权重予以考虑。基于这一想法,本发明提出一种基于Attention和LSTM的城市需水方法。
如图1所示,本发明提出一种基于LSTM网络和Attention机制的城市需水预测方法,包括以下步骤:
步骤1,城市需水预测的关键参数指标数据主要有城市邮编,年份,月份,六月前用水量,五月前用水量,四月前用水量,三月前用水量,二月前用水量,一月前用水量,温度,降水量,获取城市每月的住宅用水数据,并按照城市邮编,年份,月份,六月前用水量,五月前用水量,四月前用水量,三月前用水量,二月前用水量,一月前用水量,温度,降水量以及当月用水量的顺序生成多元时间序列并从中选取N条数据(xi,yi)作为训练样本,i=1,2,…,N,其中,分别表示相对于某月而言,某月以前的前6个月数据的特征向量:城市邮编、年份、月份、六月前用水量、五月前用水量、四月前用水量、三月前用水量、二月前用水量、一月前用水量、温度、降水量;将某月记为第D月,yi表示该地区的第D月用水量;
步骤2,借助深度学习框架,实现使用Attention机制改进LSTM模型,记作Attention-LSTM。
步骤3,利用步骤1的训练样本对模型进行训练,每次将xi作为模型的输入,得到一个预测结果,将Attention改进后的LSTM网络的输出值与实际值进行误差比较,用反向传播算法向所有神经元传递误差;
步骤4,根据误差值,使用随机梯度下降法对各层神经元更新权重与偏置值,每次调整幅度根据学习率进行。
步骤5,重复上述3个步骤,将迭代次数(epoch轮数)设置到足够梯度下降为0。
步骤6,使用参数训练完毕的Attention改进的LSTM模型对某月某地区的当月需水量进行预测。
其中步骤3、步骤4的具体过程如下:
(1)初始化LSTM网络参数,包括:LSTM网络,输入神经元个数为L,隐含层神经元个数为H,输出神经元个数为O,LSTM网络学习率α,训练批次training_epochs,每训练批次的训练数据大小batch_size;
(2)利用输入向量xi训练LSTM网络,可得神经元在t时刻的输出值为ht,公式为:ht=ot*tanh(ct),式中,ot是隐藏层神经元内部输出门t时刻的输出值:ot=σ(woxxt+wohht-1+bo),其中,wox为输出门与输入层之间的权重;woh为输出门与上一个隐藏层神经元的输出ht-1之间的权重;bo为输出门与输入层之间的偏置;ct是隐藏层神经元长短时间记忆元在t时刻状态,ct=it*c't+ft*ct-1,式中c't=tanh(wcxxt+wchht-1+bc),其中,wcx是隐藏层神经元内部状态单元与输入层之间的权重;wch是为状态单元与上一个隐藏层神经元的输出ht-1之间的权重;bc为状态单元与输入层之间的偏置;it是隐藏层神经元内部输入门t时刻的输出值:it=σ(wixxt+wihht-1+bi),其中,wix为输入门与输入层之间的权重;wih为输入门与上一个隐藏层神经元的输出ht-1之间的权重;bi为输入门与输入层之间的偏置;ft是隐藏层神经元内部忘记门在t时刻的输出值:ft=σ(wfxxt+wfhht-1+bf),其中,wfx为忘记与输入层之间的权重;wfh为忘记门与上一个隐藏层神经元的输出ht-1之间的权重;bf为忘记门与输入层之间的偏置;ct-1为是上一个隐藏层神经元长短时间记忆云在t-1时刻状态值;σ(·)为sigmoid激活函数;tanh(·)为激活函数;
(3)因此,得到LSTM模型最底层隐藏层的输出向量ht作为Attention模块的输入向量,设当前的Attention层的隐藏层权重是wt,偏置为b,对t时刻LSTM的模型的输出向量ht,计算得到输出值yt:zt=wtht+b,yt=σ(zt),σ(·)为sigmoid激活函数;完成对数据的预测。
LSTM训练完成后,需要检验需水预测模型的好坏程度,城市需水预测在本质上是一种回归模型,因此不适用于分类任务的评价方式。对于回归模型的评判方式主要采用确定系数法、均方根误差、平均绝对误差和平均绝对百分误差衡量基于Attention机制改进LSTM模型模型的输出值与实际值之间的误差。
(Ⅰ)正确率(Test accuracy):确定性系数反应了预报过程与实测过程之间的吻合程度,它的取值范围为[0,1],结果越接近1.0,预报准确率越高,其计算公式为:
(Ⅱ)均方根误差(Root Mean Square Error,RMSE):线性回归L2函数在测试集上直观的观察损失值均方误差(MSE),并为了得到更好的数据描述对其做开方操作,其计算公式为:
(Ⅲ)平均绝对误差(Mean Absolute Error,MAE):体现出预测数值同真实数据之间偏离的绝对距离大小,其计算公式为:
(Ⅳ)平均绝对百分误差(Mean Absolute Percent Error,MAPE):当MAPE为0%时该模型为完美模型,当MAPE大于100%则表示该模型为劣质模型,其计算公式为:
如图2所示,本发明基于Attention和LSTM的城市需水预测模型的LSTM基础模型如下:
LSTM神经网络在进行训练时,要首先经过前向传播过程,即一条多元时序数据从数据输入到数据运算完毕产生输出的过程。
LSTM进行前向传播,输入门对数据更新的公式表达为:
it=σ(Wi·[ht-1,xt]+bi) (1.5)
当前状态Ct更新过程的公式表达为:
遗忘门进行记忆内容更新的公式表达为:
ft=σ(Wf·[ht-1,xt]+bf) (1.8)
输出门对数据更新的公式表达为:
ot=σ(Wo·[ht-1,xt]+bo) (1.9)
在t时刻,隐含层数据更新的公式表达为:
ht=ot*tanh(ct) (1.10)
其中it、ft、ot、ht分别表示输入门、遗忘门、输出门、隐含层的计算值。Wi、Wc、Wf、Wo分别表示数据到输入门、单元状态、遗忘门和输出门的权重。bi、bc、bf、bo分别表示输入门、单元状态、遗忘门和输出门的偏置值。ht-1代表在t-1时刻的隐含层输出,Ct代表在t时刻的状态值,xt代表在t时刻输入的一条多元时序数据。*号代表着矩阵之间的标量积。σ表示sigmoid函数,其公式表达如下:
表示双曲正切函数,其公式表达如下:
如图3所示,本发明基于Attention和LSTM的城市需水预测模型对LSTM模型的改进如下:
1)使用注意力机制用来改良在LSTM从隐藏层得到的中间结果的注意力占比。
2)随机初始化Attention改进的LSTM网络模型中的参数W0,并通过训练样本学习调整Attention-LSTM网络模型中的参数,得到训练过程中的权重参数,记作为即将(xi,yi)分别作为Attention-LSTM网络的输入和输出来学习网络的最终参数W,这个过程可表示如下;
w=arg minL(Attention-LSTM(x,w),y) (1.13)
其中Attention-LSTM(x,w)是对基于Attention和LSTM的城市需水预测模型一般化表示,x表示模型的输入,w表示模型的所有权重。L(Ypredict,Ylabel)表示对LSTM-Attention模型的监督函数的一般化表示,实际写作如下所示,
3)将xi作为Attention-LSTM网络的输入,得到Attention-LSTM网络的预测值与实际值yi进行比较,再通过反向传播算法调整优化Attention-LSTM网络中的参数。得到优化后的Attention-LSTM网络模型,其中,分别表示相对于某月而言,某月以前的前6个月数据的特征向量:城市邮编、年份、月份、六月前用水量、五月前用水量、四月前用水量、三月前用水量、二月前用水量、一月前用水量、温度、降水量;将某月记为第D月,yi表示该地区的第D月用水量;
预测过程:获取测试样本,包括城市邮编,年份,月份,六月前用水量,五月前用水量,四月前用水量,三月前用水量,二月前用水量,一月前用水量,温度,降水量,然后利用基于Attention和LSTM的城市需水预测模型进行预测。
将注意力机制改良LTSM模型的预测结果与已有的方法进行比较,包括:SimpleRNN神经网络模型、LSTM神经网络模型、GRU神经网络模型、BP神经网络模型。表1和表2别是上述五种模型分别在多家庭用户用水数据集与住户用水数据集上所得到的各个衡量指标的对比。
表1多家庭需水预测衡量指标实验对照表
Test Accuracy | MAE | RMSE | MAPE | |
SimpleRNN | 0.749196462 | 3643916.48 | 7847018.71 | 2.38626518 |
LSTM | 0.802174453 | 3774526.48 | 6758241.79 | 2.04172225 |
GRU | 0.796043230 | 4635015.56 | 7076311.16 | 2.11611038 |
BP | 0.473526388 | 9564349.71 | 11369102.00 | 4.31592994 |
LSTM-Attention | 0.845971484 | 3792257.54 | 6149480.44 | 1.95362441 |
表2住宅需水预测衡量指标实验对照表
通过表1、2可以直观的看出注意力机制改良LSTM模型所得到的准确率是最高的。
MAE、RMSE和MAPE只能评估模型的整体预测结果,为了更好地分析预测结果,本申请对上述五种模型分别在多个家庭用户用水数据集与住户用水数据集上进行了拟合,如图4-8,分别是SimpleRNN神经网络模型、LSTM神经网络模型、GRU神经网络模型、BP神经网络模型以及基于Attention机制改良LTSM模型的拟合图。
由图可知,无论是对于多家庭数据,还是住宅数据,本申请所述的LSTM-Attention神经网络预测方法具有更好的拟合效果,能够更加准确地预测城市的需水量。
以上实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。
Claims (4)
1.一种基于LSTM网络和Attention机制的城市需水预测方法,其特征在于,包括如下步骤:
步骤1,获取城市每月的住宅用水数据,并按照城市邮编、年份、月份、六月前用水量、五月前用水量、四月前用水量、三月前用水量、二月前用水量、一月前用水量、温度、降水量以及当月用水量的顺序构建多元时间序列并从中选取N条数据(xi,yi)作为训练样本,i=1,2,…,N,其中,分别表示相对于某月而言,某月以前的前6个月数据的特征向量:城市邮编、年份、月份、六月前用水量、五月前用水量、四月前用水量、三月前用水量、二月前用水量、一月前用水量、温度、降水量;将某月记为第D月,yi表示该地区的第D月用水量;
步骤2,使用Attention机制改进LSTM网络模型,得到Attention-LSTM网络模型;
步骤3,利用步骤1的训练样本对Attention-LSTM网络模型进行训练,每次将xi作为该模型的输入,得到一个预测结果;将模型的输出值与实际值进行误差比较,通过损失函数对不同的输出值进行求导,用反向传播算法向所有神经元传递误差;
步骤4,根据误差值,使用随机梯度下降法对各层神经元更新权重与偏置值,每次调整幅度根据学习率进行;
步骤5,重复步骤2-4,将迭代次数设置到足够梯度下降为0;
步骤6,使用参数训练完毕的Attention-LSTM网络模型对某月某地区的当月需水量进行预测。
2.根据权利要求1所述一种基于LSTM网络和Attention机制的城市需水预测方法,其特征在于,步骤2的具体做法如下:
1)使用Attention机制用来改良在LSTM从隐藏层得到的中间结果的注意力占比;
2)随机初始化Attention-LSTM网络模型中的参数,并通过训练样本学习调整Attention-LSTM网络模型中的参数,即将xi,yi分别作为Attention-LSTM网络的输入和输出来学习网络中的参数。
3.根据权利要求2所述一种基于LSTM网络和Attention机制的城市需水预测方法,其特征在于,
随机初始化Attention-LSTM网络模型中的参数W0,并通过训练样本学习调整Attention-LSTM网络模型中的参数,得到训练过程中的权重参数,记作为即将(xi,yi)分别作为Attention-LSTM网络的输入和输出来学习网络的最终参数w,这个过程可表示如下;
w=argminL(Attention-LSTM(x,w),y)
其中Attention-LSTM(x,w)是对基于Attention和LSTM的城市需水预测模型一般化表示,x表示模型的输入,w表示模型的所有权重;L(Ypredict,Ylabel)表示对LSTM-Attention模型的监督函数的一般化表示,实际写作如下所示:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110815711.4A CN113537469B (zh) | 2021-07-19 | 2021-07-19 | 一种基于LSTM网络和Attention机制的城市需水预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110815711.4A CN113537469B (zh) | 2021-07-19 | 2021-07-19 | 一种基于LSTM网络和Attention机制的城市需水预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113537469A true CN113537469A (zh) | 2021-10-22 |
CN113537469B CN113537469B (zh) | 2024-04-16 |
Family
ID=78128776
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110815711.4A Active CN113537469B (zh) | 2021-07-19 | 2021-07-19 | 一种基于LSTM网络和Attention机制的城市需水预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113537469B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114510870A (zh) * | 2022-01-07 | 2022-05-17 | 华东交通大学 | 一种城市轨道交通地下结构的剩余寿命预测方法及装置 |
CN116861192A (zh) * | 2023-07-27 | 2023-10-10 | 广东中山建筑设计院股份有限公司 | 基于satt-tcn-lstm模型的城市用水量预测方法 |
CN117094516A (zh) * | 2023-08-24 | 2023-11-21 | 中国水利水电科学研究院 | 一种基于固定效应模型的城市群月生活需水量预测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110147877A (zh) * | 2019-05-24 | 2019-08-20 | 福州大学 | 基于卷积长短时网络的pm2.5预测方法 |
CN111626518A (zh) * | 2020-05-29 | 2020-09-04 | 上海交通大学 | 基于深度学习神经网络的城市天级需水量在线预测方法 |
CN111754034A (zh) * | 2020-06-15 | 2020-10-09 | 西安工业大学 | 一种基于混沌优化神经网络模型的时间序列预测方法 |
-
2021
- 2021-07-19 CN CN202110815711.4A patent/CN113537469B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110147877A (zh) * | 2019-05-24 | 2019-08-20 | 福州大学 | 基于卷积长短时网络的pm2.5预测方法 |
CN111626518A (zh) * | 2020-05-29 | 2020-09-04 | 上海交通大学 | 基于深度学习神经网络的城市天级需水量在线预测方法 |
CN111754034A (zh) * | 2020-06-15 | 2020-10-09 | 西安工业大学 | 一种基于混沌优化神经网络模型的时间序列预测方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114510870A (zh) * | 2022-01-07 | 2022-05-17 | 华东交通大学 | 一种城市轨道交通地下结构的剩余寿命预测方法及装置 |
CN114510870B (zh) * | 2022-01-07 | 2024-04-16 | 华东交通大学 | 一种城市轨道交通地下结构的剩余寿命预测方法及装置 |
CN116861192A (zh) * | 2023-07-27 | 2023-10-10 | 广东中山建筑设计院股份有限公司 | 基于satt-tcn-lstm模型的城市用水量预测方法 |
CN117094516A (zh) * | 2023-08-24 | 2023-11-21 | 中国水利水电科学研究院 | 一种基于固定效应模型的城市群月生活需水量预测方法 |
CN117094516B (zh) * | 2023-08-24 | 2024-02-23 | 中国水利水电科学研究院 | 一种基于固定效应模型的城市群月生活需水量预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113537469B (zh) | 2024-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109492822B (zh) | 空气污染物浓度时空域关联预测方法 | |
CN112949945B (zh) | 一种改进双向长短期记忆网络的风电功率超短期预测方法 | |
CN113537469B (zh) | 一种基于LSTM网络和Attention机制的城市需水预测方法 | |
CN113537600B (zh) | 一种全过程耦合机器学习的中长期降水预报建模方法 | |
CN109583565B (zh) | 基于注意力模型长短时记忆网络的洪水预测方法 | |
CN111563706A (zh) | 一种基于lstm网络的多变量物流货运量预测方法 | |
CN111260136A (zh) | 一种基于arima-lstm组合模型的楼宇短期负荷预测方法 | |
CN108921339B (zh) | 基于分位数回归的遗传支持向量机光伏功率区间预测方法 | |
CN112149879B (zh) | 一种计及宏观波动性分类的新能源中长期电量预测方法 | |
CN112733417B (zh) | 一种基于模型优化的异常负荷数据检测与修正方法和*** | |
CN113554466B (zh) | 一种短期用电量预测模型构建方法、预测方法和装置 | |
CN116721537A (zh) | 基于gcn-ipso-lstm组合模型的城市短时交通流预测方法 | |
CN111861013A (zh) | 一种电力负荷预测方法及装置 | |
CN112418476A (zh) | 一种超短期电力负荷预测方法 | |
CN113592144A (zh) | 一种中长期径流概率预报方法及*** | |
CN114547974A (zh) | 基于输入变量选择与lstm神经网络的动态软测量建模方法 | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及*** | |
CN113393057A (zh) | 一种基于深度融合机器学习模型的小麦产量集成预测方法 | |
CN112508286A (zh) | 一种基于Kmeans-BiLSTM-DMD模型的短期负荷预测方法 | |
CN116703644A (zh) | 一种基于Attention-RNN的短期电力负荷预测方法 | |
CN115640901A (zh) | 一种基于混合神经网络和生成对抗的小样本负荷预测方法 | |
CN114819395A (zh) | 一种基于长短期记忆神经网络和支持向量回归组合模型的行业中长期负荷预测方法 | |
CN113762591A (zh) | 一种基于gru和多核svm对抗学习的短期电量预测方法及*** | |
CN117458480A (zh) | 基于改进lof的光伏发电功率短期预测方法及*** | |
CN117151770A (zh) | 一种基于注意力机制的lstm碳价预测方法和*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |