CN113537469A

CN113537469A - 一种基于LSTM网络和Attention机制的城市需水预测方法

Info

Publication number: CN113537469A
Application number: CN202110815711.4A
Authority: CN
Inventors: 李明波; 吴芋航; 陈嘉豪; 罗湘才; 王远卓; 顾克�; 何纪琛; 张轩齐
Original assignee: Hohai University HHU
Current assignee: Hohai University HHU
Priority date: 2021-07-19
Filing date: 2021-07-19
Publication date: 2021-10-22
Anticipated expiration: 2041-07-19
Also published as: CN113537469B

Abstract

本发明公开了一种基于LSTM网络和Attention机制的城市需水预测方法，该方法使用Attention机制改良了一般的LSTM模型，然后使用数据集对改良后的模型进行训练，比较LSTM的输出与实际值，得出预测误差，再使用预测误差更新网络参数，如此不断迭代，使得Attention改良后的LSTM模型能够自动学习到城市需水预测数据里隐藏的城市需水规律，从而实现城市需水预测。实际使用时，将历史数据输入到Attention‑LSTM模型，得到数据的预测结果。本发明使用Attention改进了一般的LSTM模型，对城市需水预测具有更小的误差，具有良好的准确性。

Description

一种基于LSTM网络和Attention机制的城市需水预测方法

技术领域

本发明涉及城市供水规划技术领域，特别涉及一种基于LSTM网络和Attention机制的城市需水预测方法，属于城市供水规划技术领域。

背景技术

针对城市需水预测问题，目前需水预测模型多样，常用的方法有时间序列法、回归分析法、灰色模型预测、***动力学模型、神经网络及其变种以及组合模型法等方法。但是传统的时间序列法等方法，存在考虑不全面，准确预测时间短，逻辑解释不严谨等缺点。而神经网络虽然具有非常强大的非线性拟合能力，但是容易陷入局部最优值，且模型训练时间相对较长。近几年来，随着神经网络的不断发展，神经网络方法对时间序列数据的预测更加精准。

薛林丽等在文献《城市需水预测方法比较》(薛林丽,袁星宇,刘宗显.城市需水预测方法比较[J].人民珠江,2018,39(01):63-66)中基于多元线性回归法、灰色模型预测法和BP神经网络法对北京市的用水数据进行模拟预测，发现BP神经网络法预测模型预测精度更高。***等在文献《基于主成分分析的GA-BP模型在城市需水预测中的应用》(***,苏志伟,周华,等.基于主成分分析的GA-BP模型在城市需水预测中的应用[J].南水北调与水利科技,2017,15(06):39-44)用主成分分析(PCA)和灰色关联分析(GRA)降低数据维度的基础上，引入遗传算法(GA)和思维进化算法(MEA)提高神经网络的收敛速度，避免训练时网络陷入局部极值。但是，研究发现单一的LSTM模型往往不能达到良好的预测结果，同时，单一的LSTM模型鲁棒性不强。

发明内容

本发明要解决现有技术中单一的LSTM模型不能达到良好的预测结果、单个LSTM模型鲁棒性不强的技术问题，提供一种基于Attention和LSTM的城市需水预测方法，使用Attention机制改进LSTM模型，为城市需水预测问题提供了一种可靠的、鲁棒性更好的模型。

本发明采用以下技术方案：

一种基于LSTM网络和Attention机制的城市需水预测方法，包括如下步骤：

步骤1，获取城市每月的住宅用水数据，并按照城市邮编、年份、月份、六月前用水量、五月前用水量、四月前用水量、三月前用水量、二月前用水量、一月前用水量、温度、降水量以及当月用水量的顺序构建多元时间序列

并从中选取N条数据(x_i,y_i)作为训练样本，i＝1,2,…,N，其中，

分别表示相对于某月而言，某月以前的前6个月数据的特征向量：城市邮编、年份、月份、六月前用水量、五月前用水量、四月前用水量、三月前用水量、二月前用水量、一月前用水量、温度、降水量；将某月记为第D月，y_i表示该地区的第D月用水量；

步骤2，使用Attention机制改进LSTM网络模型，得到Attention-LSTM网络模型；

步骤3，利用步骤1的训练样本对Attention-LSTM网络模型进行训练，每次将x_i作为该模型的输入，得到一个预测结果；将模型的输出值与实际值进行误差比较，通过损失函数对不同的输出值进行求导，用反向传播算法向所有神经元传递误差；

步骤4，根据误差值，使用随机梯度下降法对各层神经元更新权重与偏置值，每次调整幅度根据学习率进行；

步骤5，重复步骤2-4，将迭代次数设置到足够梯度下降为0；

步骤6，使用参数训练完毕的Attention-LSTM网络模型对某月某地区的当月需水量进行预测。

具体地，步骤2的具体做法如下：

1)使用Attention机制用来改良在LSTM从隐藏层得到的中间结果的注意力占比；

2)随机初始化Attention-LSTM网络模型中的参数，并通过训练样本学习调整Attention-LSTM网络模型中的参数，即将x_i,y_i分别作为Attention-LSTM网络的输入和输出来学习网络中的参数。

具体地，随机初始化Attention-LSTM网络模型中的参数W₀，并通过训练样本学习调整Attention-LSTM网络模型中的参数，得到训练过程中的权重参数，记作为

即将(x_i,y_i)分别作为Attention-LSTM网络的输入和输出来学习网络的最终参数w，这个过程可表示如下；

w＝argminL(Attention-LSTM(x,w),y)

其中Attention-LSTM(x,w)是对基于Attention和LSTM的城市需水预测模型一般化表示，x表示模型的输入，w表示模型的所有权重；L(Y_predict,Y_label)表示对LSTM-Attention模型的监督函数的一般化表示，实际写作如下所示：

具体地，步骤3的具体做法如下：

将x_i作为Attention-LSTM网络的输入，得到Attention-LSTM网络的预测值

与该地区在对应时间记录的实际需水量y_i进行比较，再通过反向传播算法调整优化Attention-LSTM网络中的参数，得到优化后的Attention-LSTM网络模型，其中，

分别表示相对于某月而言，某月以前的前6个月数据的特征向量：城市邮编、年份、月份、六月前用水量、五月前用水量、四月前用水量、三月前用水量、二月前用水量、一月前用水量、温度和降水量。

与现有技术相比，本发明具有以下技术效果：

1、本发明构建基于Attention和LSTM的城市需水预测模型，通过在美国政府公开数据集上的城市家庭用水实验结果，对比分析基于Attention和LSTM的城市需水预测模型与SimpleRNN模型、LSTM模型、GRU模型和BP模型在预测效果上的不同，以及研究基于Attention和LSTM的城市需水预测模型和其他模型在预测性能上的差异，有效地提高模型的预测的准确性。

2、本发明通过在结合深度学习强大的表征能力和LSTM神经网络对于时间序列模型较优的预测能力的优点基础上，使用Attention机制用来改良在LSTM从隐藏层得到的中间结果的注意力占比，提供了一种可靠的城市需水预测模型，对城市需水的预测具有良好的准确性和鲁棒性。

附图说明

图1是本发明一种基于Attention和LSTM的城市需水预测方法的整体架构图。

图2是本发明预测方法中用LSTM模型结构示意图。

图3是本发明预测方法中用Attention改进LSTM后的模型结构示意图。

图4显示了SimpleRNN神经网络拟合图，其中图4a显示了家庭用户用水数据集拟合图，4b显示了住户用水数据集拟合图；

图5显示了LSTM神经网络拟合图，其中图5a显示了家庭用户用水数据集拟合图，5b显示了住户用水数据集拟合图；

图6显示了GRU神经网络拟合图，其中图6a显示了家庭用户用水数据集拟合图，6b显示了住户用水数据集拟合图；

图7显示了BP神经网络拟合图，其中图7a显示了家庭用户用水数据集拟合图，7b显示了住户用水数据集拟合图；

图8显示了Attention-LSTM神经网络拟合图，其中图8a显示了家庭用户用水数据集拟合图，8b显示了住户用水数据集拟合图；

上述图4-图8中，灰色线条代表预测数据，黑色线条代表实测数据。

具体实施方式

下面详细描述本发明的实施方式，所述实施方式的示例在附图中示出。下面通过参考附图描述的实施方式是示例性的，仅用于解释本发明，而不能解释为对本发明的限制。

神经网络具有非常强大的非线性拟合能力，但是容易陷入局部最优值，且模型训练时间相对较长。近几年来，随着神经网络的不断发展，神经网络方法在时间序列数据的预测更加精准。传统的SimpleRNN，GRU，LSTM和BP神经网络对于影响城市需水预测的元素是均衡考虑的，但是实际上不同的元素对城市需水的影响能力是不一样的，因此在城市需水预测中，需要对这些影响因素分别给予不同的权重予以考虑。基于这一想法，本发明提出一种基于Attention和LSTM的城市需水方法。

如图1所示，本发明提出一种基于LSTM网络和Attention机制的城市需水预测方法，包括以下步骤：

步骤1，城市需水预测的关键参数指标数据主要有城市邮编，年份，月份，六月前用水量，五月前用水量，四月前用水量，三月前用水量，二月前用水量，一月前用水量，温度，降水量，获取城市每月的住宅用水数据，并按照城市邮编，年份，月份，六月前用水量，五月前用水量，四月前用水量，三月前用水量，二月前用水量，一月前用水量，温度，降水量以及当月用水量的顺序生成多元时间序列

步骤2，借助深度学习框架，实现使用Attention机制改进LSTM模型，记作Attention-LSTM。

步骤3，利用步骤1的训练样本对模型进行训练，每次将x_i作为模型的输入，得到一个预测结果，将Attention改进后的LSTM网络的输出值与实际值进行误差比较，用反向传播算法向所有神经元传递误差；

步骤4，根据误差值，使用随机梯度下降法对各层神经元更新权重与偏置值，每次调整幅度根据学习率进行。

步骤5，重复上述3个步骤，将迭代次数(epoch轮数)设置到足够梯度下降为0。

步骤6，使用参数训练完毕的Attention改进的LSTM模型对某月某地区的当月需水量进行预测。

其中步骤3、步骤4的具体过程如下：

(1)初始化LSTM网络参数，包括：LSTM网络，输入神经元个数为L，隐含层神经元个数为H，输出神经元个数为O，LSTM网络学习率α，训练批次training_epochs，每训练批次的训练数据大小batch_size；

(2)利用输入向量x_i训练LSTM网络，可得神经元在t时刻的输出值为h_t，公式为：h_t＝o_t*tanh(c_t)，式中，o_t是隐藏层神经元内部输出门t时刻的输出值：o_t＝σ(w_oxx_t+w_ohh_t-1+b_o)，其中，w_ox为输出门与输入层之间的权重；w_oh为输出门与上一个隐藏层神经元的输出h_t-1之间的权重；b_o为输出门与输入层之间的偏置；c_t是隐藏层神经元长短时间记忆元在t时刻状态，c_t＝i_t*c'_t+f_t*c_t-1，式中c'_t＝tanh(w_cxx_t+w_chh_t-1+b_c)，其中，w_cx是隐藏层神经元内部状态单元与输入层之间的权重；w_ch是为状态单元与上一个隐藏层神经元的输出h_t-1之间的权重；b_c为状态单元与输入层之间的偏置；i_t是隐藏层神经元内部输入门t时刻的输出值：i_t＝σ(w_ixx_t+w_ihh_t-1+b_i)，其中，w_ix为输入门与输入层之间的权重；w_ih为输入门与上一个隐藏层神经元的输出h_t-1之间的权重；b_i为输入门与输入层之间的偏置；f_t是隐藏层神经元内部忘记门在t时刻的输出值：f_t＝σ(w_fxx_t+w_fhh_t-1+b_f)，其中，w_fx为忘记与输入层之间的权重；w_fh为忘记门与上一个隐藏层神经元的输出h_t-1之间的权重；b_f为忘记门与输入层之间的偏置；c_t-1为是上一个隐藏层神经元长短时间记忆云在t-1时刻状态值；σ(·)为sigmoid激活函数；tanh(·)为激活函数；

(3)因此，得到LSTM模型最底层隐藏层的输出向量h_t作为Attention模块的输入向量，设当前的Attention层的隐藏层权重是w_t，偏置为b，对t时刻LSTM的模型的输出向量h_t，计算得到输出值y_t：z_t＝w_th_t+b,y_t＝σ(z_t)，σ(·)为sigmoid激活函数；完成对数据的预测。

LSTM训练完成后，需要检验需水预测模型的好坏程度，城市需水预测在本质上是一种回归模型，因此不适用于分类任务的评价方式。对于回归模型的评判方式主要采用确定系数法、均方根误差、平均绝对误差和平均绝对百分误差衡量基于Attention机制改进LSTM模型模型的输出值与实际值之间的误差。

(Ⅰ)正确率(Test accuracy):确定性系数反应了预报过程与实测过程之间的吻合程度，它的取值范围为[0,1]，结果越接近1.0，预报准确率越高，其计算公式为：

(Ⅱ)均方根误差(Root Mean Square Error,RMSE)：线性回归L2函数在测试集上直观的观察损失值均方误差(MSE)，并为了得到更好的数据描述对其做开方操作，其计算公式为：

(Ⅲ)平均绝对误差(Mean Absolute Error,MAE):体现出预测数值同真实数据之间偏离的绝对距离大小，其计算公式为：

(Ⅳ)平均绝对百分误差(Mean Absolute Percent Error,MAPE):当MAPE为0％时该模型为完美模型，当MAPE大于100％则表示该模型为劣质模型，其计算公式为：

公式(1.1)-(1.4)中，y为实测值，

为预测值，

为实测值均值，m为样本个数；

如图2所示，本发明基于Attention和LSTM的城市需水预测模型的LSTM基础模型如下：

LSTM神经网络在进行训练时，要首先经过前向传播过程，即一条多元时序数据从数据输入到数据运算完毕产生输出的过程。

LSTM进行前向传播，输入门对数据更新的公式表达为：

i_t＝σ(W_i·[h_t-1,x_t]+b_i) (1.5)

新候选值

更新的公式表达为：

当前状态C_t更新过程的公式表达为：

遗忘门进行记忆内容更新的公式表达为：

f_t＝σ(W_f·[h_t-1,x_t]+b_f) (1.8)

输出门对数据更新的公式表达为：

o_t＝σ(W_o·[h_t-1,x_t]+b_o) (1.9)

在t时刻，隐含层数据更新的公式表达为：

h_t＝o_t*tanh(c_t) (1.10)

其中i_t、f_t、o_t、h_t分别表示输入门、遗忘门、输出门、隐含层的计算值。W_i、W_c、W_f、W_o分别表示数据到输入门、单元状态、遗忘门和输出门的权重。b_i、b_c、b_f、b_o分别表示输入门、单元状态、遗忘门和输出门的偏置值。h_t-1代表在t-1时刻的隐含层输出，C_t代表在t时刻的状态值，x_t代表在t时刻输入的一条多元时序数据。*号代表着矩阵之间的标量积。σ表示sigmoid函数，其公式表达如下：

表示双曲正切函数，其公式表达如下：

如图3所示，本发明基于Attention和LSTM的城市需水预测模型对LSTM模型的改进如下：

1)使用注意力机制用来改良在LSTM从隐藏层得到的中间结果的注意力占比。

2)随机初始化Attention改进的LSTM网络模型中的参数W₀，并通过训练样本学习调整Attention-LSTM网络模型中的参数，得到训练过程中的权重参数，记作为

w＝arg minL(Attention-LSTM(x,w),y) (1.13)

其中Attention-LSTM(x,w)是对基于Attention和LSTM的城市需水预测模型一般化表示，x表示模型的输入，w表示模型的所有权重。L(Y_predict,Y_label)表示对LSTM-Attention模型的监督函数的一般化表示，实际写作如下所示，

3)将x_i作为Attention-LSTM网络的输入，得到Attention-LSTM网络的预测值

与实际值y_i进行比较，再通过反向传播算法调整优化Attention-LSTM网络中的参数。得到优化后的Attention-LSTM网络模型，其中，

预测过程：获取测试样本，包括城市邮编，年份，月份，六月前用水量，五月前用水量，四月前用水量，三月前用水量，二月前用水量，一月前用水量，温度，降水量，然后利用基于Attention和LSTM的城市需水预测模型进行预测。

将注意力机制改良LTSM模型的预测结果与已有的方法进行比较，包括：SimpleRNN神经网络模型、LSTM神经网络模型、GRU神经网络模型、BP神经网络模型。表1和表2别是上述五种模型分别在多家庭用户用水数据集与住户用水数据集上所得到的各个衡量指标的对比。

表1多家庭需水预测衡量指标实验对照表

	Test Accuracy	MAE	RMSE	MAPE
					SimpleRNN	0.749196462	3643916.48	7847018.71	2.38626518
LSTM	0.802174453	3774526.48	6758241.79	2.04172225
					GRU	0.796043230	4635015.56	7076311.16	2.11611038
BP	0.473526388	9564349.71	11369102.00	4.31592994
					LSTM-Attention	0.845971484	3792257.54	6149480.44	1.95362441

表2住宅需水预测衡量指标实验对照表

通过表1、2可以直观的看出注意力机制改良LSTM模型所得到的准确率是最高的。

MAE、RMSE和MAPE只能评估模型的整体预测结果，为了更好地分析预测结果，本申请对上述五种模型分别在多个家庭用户用水数据集与住户用水数据集上进行了拟合，如图4-8，分别是SimpleRNN神经网络模型、LSTM神经网络模型、GRU神经网络模型、BP神经网络模型以及基于Attention机制改良LTSM模型的拟合图。

由图可知，无论是对于多家庭数据，还是住宅数据，本申请所述的LSTM-Attention神经网络预测方法具有更好的拟合效果，能够更加准确地预测城市的需水量。

以上实施例仅为说明本发明的技术思想，不能以此限定本发明的保护范围，凡是按照本发明提出的技术思想，在技术方案基础上所做的任何改动，均落入本发明保护范围之内。

Claims

1.一种基于LSTM网络和Attention机制的城市需水预测方法，其特征在于，包括如下步骤：

步骤5，重复步骤2-4，将迭代次数设置到足够梯度下降为0；

2.根据权利要求1所述一种基于LSTM网络和Attention机制的城市需水预测方法，其特征在于，步骤2的具体做法如下：

3.根据权利要求2所述一种基于LSTM网络和Attention机制的城市需水预测方法，其特征在于，

随机初始化Attention-LSTM网络模型中的参数W₀，并通过训练样本学习调整Attention-LSTM网络模型中的参数，得到训练过程中的权重参数，记作为

w＝argminL(Attention-LSTM(x,w),y)

4.根据权利要求3所述一种基于LSTM网络和Attention机制的城市需水预测方法，其特征在于，步骤3的具体做法如下：