CN113191544B

CN113191544B - 一种基于多层神经网络的短期电力负荷预测方法

Info

Publication number: CN113191544B
Application number: CN202110468733.8A
Authority: CN
Inventors: 许卓明; 张嘉诚
Original assignee: Hohai University HHU
Current assignee: Hohai University HHU
Priority date: 2021-04-28
Filing date: 2021-04-28
Publication date: 2022-08-12
Anticipated expiration: 2041-04-28
Also published as: CN113191544A

Abstract

本发明公开一种基于多层神经网络的短期电力负荷预测方法，包括步骤：对包含具有相同时间间隔的多个连续的时刻、每个时刻的用电量、每个时刻的气温的电力负荷数据集中的用电量值、气温值进行归一化后表示成电力负荷特征矩阵和电力负荷真实值向量；利用所述矩阵构建一个基于多层神经网络的短期电力负荷预测模型的网络结构；将表示成所述矩阵与所述向量的数据集按7∶2∶1依次划分为训练集、验证集与测试集；使用训练集与验证集对上述预测模型进行调参，得到优化的模型SPLF‑MNN；使用测试集计算SPLF‑MNN模型的预测精度以评估模型的性能，并利用SPLF‑MNN模型预测未来一天或一周内多个时刻的电力负荷。SPLF‑MNN模型考虑气温对电力负荷的影响、预测精度高、训练速度快，应用前景广阔。

Description

一种基于多层神经网络的短期电力负荷预测方法

技术领域

本发明属于短期电力负荷预测技术领域，涉及基于神经网络的短期电力负荷预测方法，尤其是一种基于多层神经网络的短期电力负荷预测方法。

背景技术

电力负荷预测(power load forecasting)是电力***规划的重要组成部分，也是电力***经济运行的基础。电力负荷预测的基础是电力负荷数据，这样的数据是一种时间序列数据，通常包含具有相同时间间隔的多个连续的时刻(时刻含有日期与时间)、每个时刻的电力负荷(如用电量)、每个时刻的气象数据(如气温)等。一定数量的电力负荷数据构成一个电力负荷数据集。电力负荷预测能够根据与时刻有关的电力负荷、气象等历史数据，挖掘出电力负荷变化的规律，据此预测未来某段时间内多个时刻的电力负荷。按照预测时间段的长短来划分，电力负荷预测可以分为超短期、短期、中期、长期电力负荷预测。短期电力负荷预测(short-term power load forecasting)以天为单位，对未来一天或一周内多个时刻的电力负荷进行预测。气象(如大气温度)因素对短期、超短期的电力负荷变化有较大影响，因此，短期、超短期电力负荷预测方法(模型)应该考虑气象因素，否则会影响预测精度也称准确率(accuracy)。

(短期)电力负荷预测精度的小幅提升也会带来巨大的经济社会效益。为了保障电力***能安全稳定地运行，发电端通常需要在电网中存储一定的备用电力(例如，存储全网最大发电量的2％～5％的电力)。如果能提高电力负荷的预测精度，就可以减少备用电力容量，从而节省发电能源消耗、减少碳排放。下面举一个例子来说明。以国家***发布的2020年中国统计年鉴(参见：国家***编：中国统计年鉴-2020.中国统计出版社，2020年9月.http：//www.stats.gov.cn/tjsj/ndsj/2020/indexeh.htm)中的有关数据为例，江苏省2019年共消费6,264亿千瓦时的电量，假设不考虑电力传输等损耗，可以认为2019年江苏省最大发电量近似于用电量6,264亿千瓦时，全年的电力备用容量就需要125.3～313.2亿千瓦时。提高电力负荷预测精度能够减少一定的备用电力容量，如果备用电力容量减少1％，这样，全年就能够减少1.25～3.13亿千瓦时的备用电力容量，这相当于减少了1.54～3.85万吨标准煤的消耗，减少了火力发电的碳排放量。

时间序列预测方法与基于神经网络的预测方法是短期电力负荷预测的常用方法。

典型的时间序列预测方法是自回归综合移动平均(Auto Regressive IntegratedMoving Average，ARIMA)模型(参见：Subrina Noureen，Sharif Atique，Vishwajit Roy，Stephen Bayne：Analysis and application of seasonal ARIMA model in EnergyDemand Forecasting：A case study of small scale agricultural load.MWSCAS 2019：521-524.https：//doi.org/10.1109/MWSCAS.2019.8885349)。ARIMA模型的优点是原理简单，所需的电力负荷(历史)数据较少，但不足是该模型没有考虑气温等外部因素对电力负荷的影响，因此预测精度较低。

典型的基于神经网络的预测方法是基于长短期记忆网络(LSTM)的短期电力负荷预测模型(参见：Dedong Tang，Chen Li，Xiaohui Ji，Zhenyu Chen，and Fangchun Di：Power Load Forecasting Using a Refined LSTM.Proceedings of the 2019 11thInternational Conference on Machine Learning and Computing，ICMLC 2019，pp.104-108.https：//doi.org/10.1145/3318299.3318353)。基于LSTM的短期电力负荷预测模型能够考虑气温等外部影响因素，但预测精度不够高；另外，该模型的训练速度慢，因为在每轮(epoch)训练过程中LSTM单元每一步的计算都依赖上一步的计算结果。

为了克服所属技术领域中现有技术的上述不足，本发明拟利用基于神经网络的深度学习技术来构建短期电力负荷预测模型，这样的模型不仅能够考虑气温等外部因素对电力负荷的影响，而且能够提高预测精度。

基于神经网络的深度学习是新一代的机器学习技术。注意力机制(attentionmechanism)和卷积神经网络(convolutional neural network，CNN)均是典型的神经网络。深度学习技术领域中的注意力机制(参见：Dzmitry Bahdanau，Kyunghyun Cho，YoshuaBengio：Neural Machine Translation by Jointly Learning to Align andTranslate.3rd International Conference on Learning Representations，ICLR 2015，May 7-9，2015，Conference Track Proceedings.http：//arxiv.org/abs/1409.0473)和人类的选择性视觉注意力机制相似，可以从大量重要信息中忽略不重要的信息，筛选出少量重要信息并聚焦到这些重要信息上。卷积神经网络(参见：Yann Lecun，Leon Bottou，Yoshua Bengio，Patrick Haffner：Gradient-based learning applied to documentrecognition.Proceedings of the IEEE，Volume 86，Issue 11，2278-2324，Nov.1998.https：//doi.org/10.1109/5.726791)是一类包含卷积计算且具有深度结构的前馈神经网络(feed-forward network)，能够有效地提取数据中的特征。根据待解决的技术问题的特定需要，可以将注意力机制与卷积神经网络进行有机结合后形成特定的多层神经网络。

下面简要说明本发明的技术方案中采用的若干现有技术，这些现有技术只是本发明技术方案中的几个单项技术特征，它们与本发明的其他技术特征进行非显而易见的有机组合后才构成本发明的技术方案。

位置编码(positional encoding)方法(参见：Ashish Vaswani，Noam Shazeer，Niki Parmar，Jakob Uszkoreit，Llion Jones，Aidan N.Gomez，Lukasz Kaiser，IlliaPolosukhin：Attention is All you Need.NIPS 2017：5998-6008.http：//papers.nips.cc/paper/7181-attention-is-all-you-need)用于在电力负荷时间序列中添加位置信息。

二维卷积(2-D convolution)(参见：Vincent Dumoulin，Francesco Visin：Aguide to convolution arithmetic for deep learning.arXiv：1603.07285v2[stat.ML]11 Jan 2018.http：//arxiv.org/abs/1603.07285)用于在卷积网络层中提取电力负荷时间序列中的特征。

Adam优化器(参见：Diederik P.Kingma，Jimmy Ba：Adam：A Method forStochastic Optimization.3rd International Conference on LearningRepresentations，ICLR 2015，May 7-9，2015，Conference Track Proceedings.https：//arxiv.org/abs/1412.6980)用于对短期电力负荷预测模型的参数进行优化。

Min-Max归一化(Min-Max Normalization)，也称离差标准化，用于将不同变化范围的用电量值(或气温值)映射到[0，1]范围中。

本发明评价短期电力负荷预测模型的预测精度(accuracy)时使用所属技术领域中常用的两个性能评价指标：平均绝对误差(Mean Absolute Error，MAE)和平均绝对百分比误差(Mean Absolute Percentage Error，MAPE)，两者的计算公式如下：

式中，m为一次短期电力负荷预测涉及到的时刻总数，y_i为i时刻的实际用电量值，

为i时刻的预测用电量值。

综上所述，为了克服现有技术中存在的上述不足，即：短期电力负荷预测模型没有考虑气温因素对电力负荷的影响、预测精度不够高、模型的训练速度慢，本发明将注意力机制与卷积神经网络进行有机结合后形成特定的多层神经网络，由此提供一种基于多层神经网络的短期电力负荷预测方法(Short-term Power Load Forecasting Method based onMulti-layer Neural Network，简称SPLF-MNN)。

发明内容

本发明所要解决的技术问题是提供一种考虑气温因素对电力负荷的影响、预测精度高、模型训练速度快的短期电力负荷预测方法。

为解决上述技术问题，本发明是通过以下技术方案实现的：

本发明提供一种基于多层神经网络的短期电力负荷预测方法，包括下列步骤：

步骤S1：对包含具有相同时间间隔的多个连续的时刻、每个时刻的用电量、每个时刻的气温的电力负荷数据集中的用电量值、气温值进行归一化后表示成电力负荷特征矩阵和电力负荷真实值向量；

步骤S2：利用电力负荷特征矩阵构建一个基于多层神经网络的短期电力负荷预测模型的网络结构；

步骤S3：将表示成电力负荷特征矩阵与电力负荷真实值向量的电力负荷数据集按7∶2∶1的比例依次划分为训练集、验证集与测试集；

步骤S4：使用训练集与验证集对所述基于多层神经网络的短期电力负荷预测模型进行参数调节，得到优化的模型SPLF-MNN；

步骤S5：使用测试集计算SPLF-MNN模型的预测精度以评估模型的性能，并利用SPLF-MNN模型预测未来一天或一周内多个时刻的电力负荷。

在该方法中，所述步骤S1进一步包括：

步骤S11：使用Min-Max归一化方法对电力负荷数据集中的用电量值、气温值分别进行归一化；

步骤S12：从电力负荷数据集中第d+1天开始至最后一天为止，逐天、逐时间地进行如下处理：将该天的前d天中该时间的各个归一化后的用电量值和该天中该时间的归一化后的气温值组合在一起，构成一个电力负荷特征向量，所述d是一个超参数，d∈{5，6，7，8，9，10}；

步骤S13：将所有上述电力负荷特征向量以天为单位组合成一个n×(d+1)维电力负荷特征矩阵，所述n为一天内的时间数量，其取值由用电量和气温的采样间隔所确定；

步骤S14：从电力负荷数据集中第d+1天开始至最后一天为止，逐天地进行如下处理：将该天中的n个归一化后的用电量值组合成一个电力负荷真实值向量。

在该方法中，所述步骤S2进一步包括：

步骤S21：为所述基于多层神经网络的短期电力负荷预测模型的网络结构构建一个位置编码层，包括：

使用位置编码方法对所述电力负荷特征矩阵中的元素逐个地进行位置编码，得到一个位置表示矩阵PE，所述位置编码方法由下列公式定义：

式中，PE(i，j)表示矩阵PE中的一个元素，i为电力负荷特征矩阵中的某个时刻，i＝1，2，...，n，j为电力负荷特征向量中某个特征的编号，j＝1，2，...，d，d+1；进一步地，将所述位置表示矩阵与所述电力负荷特征矩阵相加，得到一个n×(d+1)维电力负荷位置矩阵S；

步骤S22：为所述基于多层神经网络的短期电力负荷预测模型的网络结构构建一个注意力层，包括：

所述注意力层的输入数据为电力负荷位置矩阵S，输出数据为电力负荷注意力矩阵A，该注意力层的计算方法由下列公式定义：

式中，归一化指数函数softmax是一个激活函数；

步骤S23：为所述基于多层神经网络的短期电力负荷预测模型的网络结构构建一个前馈神经网络层，包括：

所述前馈神经网络层包括三个子层：第一个子层为全连接层，第二个子层为ReLU激活函数层，第三个子层为全连接层；所述前馈神经网络层的输入数据为电力负荷注意力矩阵A，输出数据为电力负荷前馈矩阵F，该前馈神经网络层的计算方法由下列公式定义：

F＝max(0，(AW₁+b₁))W₂+b₂，

式中，

和

分别为所述第一个子层和所述第三个子层的权重矩阵，b₁和b₂分别为所述第一个子层和所述第三个子层的偏置；

步骤S24：为所述基于多层神经网络的短期电力负荷预测模型的网络结构构建一个卷积网络层，包括：

所述卷积网络层包括三个子层：第一个子层为二维卷积(2-D convolution)层，第二个子层为ReLU激活函数层，第三个子层为二维卷积层，其中，所述二维卷积层使用卷积核(convolution kernel)来提取电力负荷前馈矩阵F中的局部特征，第一个子层的二维卷积输入通道为1，输出通道为d+1，卷积核大小为k，步长为s，填充为p，第三个子层的二维卷积输入通道为d+1，输出通道为1，卷积核大小为k，步长为s，填充为p；所述卷积网络层的输入数据为电力负荷前馈矩阵F，输出数据为电力负荷局部特征矩阵K，其由下列公式定义：

K＝max(0，(F*W₃+b₃))*W₃+b₄，

式中，*表示卷积操作，

为所述卷积核，b₃和b₄分别为所述第一个子层和所述第三个子层的偏置；

步骤S25：为所述基于多层神经网络的短期电力负荷预测模型的网络结构构建一个输出层，包括：

所述输出层包括两个子层：第一个子层为全连接层，第二个子层为Softplus激活函数层；所述输出层的输入数据为电力负荷局部特征矩阵K，输出数据为n维的电力负荷预测值向量P，其由下列公式定义：

P＝log(1+exp(KW₄+b₅))，

式中，

和b₅分别为所述全连接层的权重矩阵和偏置。

在该方法中，所述步骤S4进一步包括：

步骤S41：为所述基于多层神经网络的短期电力负荷预测模型设置如下超参数的值：天数d、学习率η、迭代轮数e、二维卷积层的卷积核大小k、步长s、填充p，这些超参数的值域如下：d的值域为集合{5，6，7，8，9，10}，η的值域为集合{0.0005，0.001，0.0015，0.002}，e的值域为集合{200，400，600，800，1000，1200，1400}，k的值域为集合{3，5，7}，s的值域为集合{1，2，3}，p的值域为集合{1，2，3}；

步骤S42：在所述训练集上使用Adam优化器学习所述基于多层神经网络的短期电力负荷预测模型的参数；

步骤S43：在所述验证集上计算所述基于多层神经网络的短期电力负荷预测模型的预测精度，若预测精度未达到预定阈值，则依次重复执行步骤S41、S42和S43，否则结束参数调节过程。

本发明的有益技术效果主要包括三个方面：(1)本发明提供了一种有效、预测精度高的短期电力负荷预测方法；(2)本发明的技术方案比自回归综合移动平均模型ARIMA具有更高的预测精度，原因是本发明的模型考虑了气温因素对电力负荷的影响；(3)本发明的技术方案比基于长短期记忆网络(LSTM)的短期电力负荷预测模型具有更高的预测精度和更快的模型训练速度，原因是本发明的模型将注意力机制与卷积神经网络有机结合后形成了特定的多层神经网络。

下面结合附图对本发明的具体实施方式作进一步的描述。本发明附加的方面和优点将在下面的描述中部分给出，这些将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

图1示出了根据本发明技术方案的一种基于多层神经网络的短期电力负荷预测方法的流程示意图；

图2示出了根据本发明技术方案的一种基于多层神经网络的短期电力负荷预测方法中构建多层网络结构的流程示意图；

具体实施方式

下面详细描述本发明的实施方式，所述实施方式的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的概念、对象、要素等或具有相同或类似功能的概念、对象、要素等。下面通过参考附图描述的实施方式是示例性的，仅用于解释本发明，而不能解释为对本发明的限制。

本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域及相关领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样定义，不会用理想化或过于正式的含义来解释。

为了解决上述技术问题，本发明是通过以下技术方案实现的：

本发明提供了一种基于多层神经网络的短期电力负荷预测方法，如图1所示，包括下列步骤S1至S5：

步骤S1：对包含具有相同时间间隔的多个连续的时刻、每个时刻的用电量、每个时刻的气温的电力负荷数据集中的用电量值、气温值进行归一化后表示成电力负荷特征矩阵和电力负荷真实值向量；所述步骤S1进一步包括：

步骤S2：利用电力负荷特征矩阵构建一个基于多层神经网络的短期电力负荷预测模型的网络结构；如图2所示，所述步骤S2进一步包括：

式中，归一化指数函数softmax是一个激活函数；

F＝max(0，(AW₁+b₁))W₂+b₂，

式中，

和

分别为所述第一个子层和所述第三个子层的权重矩阵，b₁和b₂分别为所述第一个子层和所述第三个子层的偏置(bias)；

K＝max(0，(F*W₃+b₃))*W₃+b₄，

式中，*表示卷积操作，

P＝log(1+exp(KW₄+b₅))，

式中，

和b₅分别为所述全连接层的权重矩阵和偏置。

步骤S3：将表示成电力负荷特征矩阵与电力负荷真实值向量的电力负荷数据集按7∶2∶1的比例依次划分为训练集(training set)、验证集(validation set)与测试集(testing set)。

步骤S4：使用训练集与验证集对所述基于多层神经网络的短期电力负荷预测模型进行参数调节，得到优化的模型SPLF-MNN；所述步骤S4进一步包括：

下面以一个具体实施例来进一步说明本发明技术方案的具体实施方式，并通过实验将本发明的技术方案(即SPLF-MNN模型)与其他典型的短期电力负荷预测方法——ARIMA模型(参见：Subrina Noureen，Sharif Atique，Vishwajit Roy，Stephen Bayne：Analysisand application of seasonal ARIMA model in Energy Demand Forecasting：A casestudy of small scale agricultural load.MWSCAS 2019：521-524.https：//doi.org/10.1109/MWSCAS.2019.8885349)、基于LSTM的短期电力负荷预测模型(下文简称为基于LSTM的模型，参见：Dedong Tang，Chen Li，Xiaohui Ji，Zhenyu Chen，and Fangchun Di：Power Load Forecasting Using a Refined LSTM.Proceedings of the 2019 11thInternational Conference on Machine Learning and Computing，ICMLC 2019，pp.104-108.https：//doi.org/10.1145/3318299.3318353)进行预测精度的性能比较，使用三个性能评价指标：平均绝对百分比误差(MAPE)、平均绝对误差(MAE)与模型训练时间。

具体实施例使用江苏省电力负荷数据集作为电力负荷数据集。江苏省电力负荷数据集包含江苏省的自2018年1月1日0：15至2019年4月1日0：00的区间内用电量和气温采样间隔为15分钟的每个时刻的真实用电量和气温，其中，每天包含96个时刻，整个数据集共包含43,680个时刻。表1给出了所述江苏省电力负荷数据集中的一小部分数据。

表1.江苏省电力负荷数据集中的一小部分数据

时刻	用电量(单位：兆瓦)	气温(单位：℃)
			2018-01-01 00：15	58010.40	2.3
2018-01-01 00：30	57999.80	2.6
			2018-01-01 00：45	57436.40	2.7
…	…	…
			2018-01-08 00：15	65163.00	3.1
2018-01-08 00：30	64990.10	3.0
			2018-01-08 00：45	64862.90	2.9
2018-01-08 01：00	64072.40	2.9
			…	…	…
2019-03-31 23：30	57912.03	10.0
			2019-03-31 23：45	57333.11	10.5
2019-04-01 00：00	57291.59	10.0

针对所述具体实施例，本发明技术方案的具体实施方式如下：

如图1所示，一种基于多层神经网络的短期电力负荷预测方法，包括如下步骤：

步骤S12：从电力负荷数据集中第d+1天开始至最后一天为止，逐天、逐时间地进行如下处理：将该天的前d天中该时间的各个归一化后的用电量值和该天中该时间的归一化后的气温值组合在一起，构成一个电力负荷特征向量，所述d是一个超参数，d∈{5，6，7，8，9，10}；在本实施例中：

d取值为7；自2018年1月1日0：15至2019年4月1日0：00的区间内共得到43,008电力负荷特征向量，其中，时刻2018-01-0800：15的电力负荷特征向量为(0.5466，0.5592，0.5410，0.5346，0.4812，0.3578，0.4246，0.1843)；

步骤S13：将所有上述电力负荷特征向量以天为单位组合成一个n×(d+1)维电力负荷特征矩阵，所述n为一天内的时间数量，其取值由用电量和气温的采样间隔所确定；在本实施例中：

用电量和气温的采样间隔为15分钟，一天的时刻数n＝96，自2018年1月1日0：15至2019年4月1日0：00的区间内共得到448个电力负荷特征矩阵，其中，日期2018年1月8日的电力负荷特征矩阵如表2所示；

表2. 2018年1月8日的电力负荷特征矩阵的表格表示(部分数据，归一化后数据)

步骤S14：从电力负荷数据集中第d+1天开始至最后一天为止，逐天地进行如下处理：将该天中的n个归一化后的用电量值组合成一个电力负荷真实值向量；在本实施例中：

自2018年1月1日0：15至2019年4月1日0：00的区间内共得到448个电力负荷真实值向量，其中2018年1月8日的电力负荷真实值向量如表3所示。

表3. 2018年1月8日的电力负荷真实值向量的表格表示(部分数据，归一化后数据)

时间	真实用电量
		00：15	0.5165
00：30	0.5142
		00：45	0.5126
01：00	0.5025
		…	…
12：15	0.7319
		12：30	0.7510
12：45	0.7584
		13：00	0.7645
…	…
		23：15	0.6206
23：30	0.6047
		23：45	0.5917
24：00	0.5800

式中，归一化指数函数softmax是一个激活函数；

F＝max(0，(AW₁+b₁))W₂+b₂，

式中，

和

K＝max(0，(F*W₃+b₃))*W₃+b₄，

式中，*表示卷积操作，

P＝log(1+exp(KW₄+b₅))，

式中，

和b₅分别为所述全连接层的权重矩阵和偏置。

步骤S3：将表示成电力负荷特征矩阵与电力负荷真实值向量的电力负荷数据集按7∶2∶1的比例依次划分为训练集、验证集与测试集。

步骤S43：在所述验证集上计算所述基于多层神经网络的短期电力负荷预测模型的预测精度，若预测精度未达到预定阈值，则依次重复执行步骤S41、S42和S43，否则结束参数调节过程；在本实施例中：

将预测精度的预定阈值设置为MAPE＝0.026，经过15次重复执行步骤S41、S42和S43后完成参数调节，得到优化的SPLF-MNN模型，该模型超参数配置为：天数d＝7，学习率η＝0.002，迭代轮数e＝1200，二维卷积层的卷积核大小k＝5，步长s＝1，填充p＝2。

为了使用上述江苏省电力负荷数据集通过实验将本发明的技术方案(即SPLF-MNN模型)与ARIMA模型、基于LSTM的模型进行预测精度的性能比较，本发明人首先编程实现了这三个模型，所使用的软件开发平台为Pycharm，编程语言为Python。下面先给出相关实现技术：

SPLF-MNN模型的实现技术：实现工具为Python3.6和Pytorch1.5.0。SPLF-MNN模型的网络结构实现技术如下：搭建位置编码层与注意力层时从GitHub下载代码(参见：https：//github.com/jadore801120/attention-is-all-you-need-pytorch/blob/master/transformer)后稍作改动而实现；使用深度学习框架Pytorch(参见：https：//github.com/pytorch/pytorch)搭建前馈神经网络层、卷积网络层、输出层，其中，前馈神经网络层使用Pytorch框架中的nn模块的Linear类与functional类实现，卷积网络层使用Pytorch框架中的nn模块的Conv2d类与functional类实现，输出层使用Pytorch框架中的nn模块的Linear类与functional类实现。

ARIMA模型的实现技术：实现工具为Python3.6和statsmodels0.11.1。自相关函数(Autocorrelation Function)与偏相关函数(Partial correlation function)使用Python中的statsmodels模块的tsa类实现，ADF(augmented Dickey-Fuller)检验方法、贝叶斯信息准则(Bayesian Information Criterion)与模型拟合使用Python中的statsmodels模块的tsa类实现。

基于LSTM的模型的实现技术：实现工具为Python3.6和Keras2.2.0。该模型使用深度学习框架Keras中models模块的Sequential类和layers模块中的Dense、LSTM类实现。

实验的软件运行环境：(1)硬件平台：Intel(R)Core(TM)i5-9300H [email protected]，八核，内存16GB；(2)操作***：Windows 10；(3)软件平台：Pycharm。

实验过程如下：

SPLF-MNN模型的实验过程：(1)为SPLF-MNN模型设置超参数的值；(2)在训练集上使用Adam优化器学习模型的参数；(3)在验证集上计算SPLF-MNN模型的预测精度，若预测精度未达到预定阈值，则依次重复步骤(1)、(2)和(3)，否则结束参数调节过程；将预测精度的预定阈值设置为MAPE＝0.026，经过15次参数调节后，得到优化的SPLF-MNN模型，该模型超参数的取值如下：天数d＝7，学习率η＝0.002，迭代轮数e＝1200，二维卷积层的卷积核大小k＝5，步长s＝1，填充p＝2；(4)在测试集上计算SPLF-MNN模型的预测精度作为该模型的性能指标。

ARIMA模型的实验过程：(1)使用自相关函数、偏相关函数与ADF检验方法对训练集中的用电量时间序列进行平稳性检验后发现该序列不平稳，然后通过对该序列进行一阶差分后变为平稳；(2)使用贝叶斯信息准则得到ARIMA模型的自回归项数为3、移动平均项数为7；(3)使用ARIMA(3，1，7)模型对训练集中的用电量时间序列进行拟合，得到模型的拟合公式；(4)使用该拟合公式对验证集中的用电量进行预测，以验证模型的预测性能；(5)在测试集上计算ARIMA模型的预测精度作为该模型的性能指标。

基于LSTM的模型的实验过程：(1)使用训练集与验证集对该模型进行参数调节，得到优化的模型，模型的超参数配置为：天数d＝7，学习率η＝0.001，迭代轮数e＝1200；(2)在测试集上计算优化后的模型的预测精度，作为该模型的性能指标。

实验结果如下：

SPLF-MNN模型、ARIMA模型、基于LSTM的模型的比较实验结果如表4所示，表中给出了三个模型在评价指标平均绝对百分比误差(MAPE)、平均绝对误差(MAE)与模型训练时间上的实验结果数据，数据值越小，相应的性能越好。实验结果表明：与自回归综合移动平均模型ARIMA相比，本发明的技术方案的SPLF-MNN模型具有更高的预测精度，这可能是因为考虑了气温对电力负荷的影响(注：ARIMA模型只需拟合计算，不需训练过程，因此没有模型训练时间)；与基于LSTM的模型相比，SPLF-MNN模型具有更高的预测精度和模型训练速度。

表4.三个短期电力负荷预测模型的实验结果比较

模型	MAE	MAPE	模型训练时间(单位：分钟)
				SPLF-MNN模型	2133.2	0.0207	4.361
ARIMA模型	3806.9	0.0393	-
				基于LSTM的模型	2601.4	0.0254	7.002

总体来说，由本发明上述技术方案及其具体实施方式可以理解的是，本发明的有益技术效果主要包括三个方面：(1)本发明提供了一种有效、预测精度高的短期电力负荷预测方法；(2)本发明的技术方案比自回归综合移动平均模型ARIMA具有更高的预测精度，原因是本发明的模型考虑了气温因素对电力负荷的影响；(3)本发明的技术方案比基于长短期记忆网络(LSTM)的短期电力负荷预测模型具有更高的预测精度和更快的模型训练速度，原因是本发明的模型将注意力机制与卷积神经网络有机结合后形成了特定的多层神经网络。总之，本发明的技术方案具有广阔的应用前景，在实际应用中能够产生很大的社会经济效益。

以上所述仅是本发明的部分实施方式，应当指出，除说明书所述的技术特征外，均为本专业技术人员的已知技术。对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种基于多层神经网络的短期电力负荷预测方法，包括下列步骤：

2.根据权利要求1所述的方法，其特征在于，所述步骤S1进一步包括下列步骤：

3.根据权利要求1或2所述的方法，其特征在于，所述步骤S2进一步包括下列步骤：

式中，归一化指数函数softmax是一个激活函数；

F＝max(0，(AW₁+b₁))W₂+b₂，

式中，

和

所述卷积网络层包括三个子层：第一个子层为二维卷积层，第二个子层为ReLU激活函数层，第三个子层为二维卷积层，其中，所述二维卷积层使用卷积核来提取电力负荷前馈矩阵F中的局部特征，第一个子层的二维卷积输入通道为1，输出通道为d+1，卷积核大小为k，步长为s，填充为p，第三个子层的二维卷积输入通道为d+1，输出通道为1，卷积核大小为k，步长为s，填充为p；所述卷积网络层的输入数据为电力负荷前馈矩阵F，输出数据为电力负荷局部特征矩阵K，其由下列公式定义：

K＝max(0，(F*W₃+b₃))*W₃+b₄，

式中，*表示卷积操作，

P＝log(1+exp(KW₄+b₅))，

式中，

和b₅分别为所述全连接层的权重矩阵和偏置。

4.根据权利要求3所述的方法，其特征在于，所述步骤S4进一步包括下列步骤：