CN115238854A

CN115238854A - 一种基于tcn-lstm-am的短期负荷预测方法

Info

Publication number: CN115238854A
Application number: CN202210548873.0A
Authority: CN
Inventors: 屈昭阳; 覃少华; 熊根鑫; 凌凡; 朱新坡; 王宇坤; 孔娟; 吴博文
Original assignee: Hunan Hengruida Information Technology Co ltd; Guangxi Normal University; Beijing China Power Information Technology Co Ltd
Current assignee: Hunan Hengruida Information Technology Co ltd; Guangxi Normal University; Beijing China Power Information Technology Co Ltd
Priority date: 2022-05-20
Filing date: 2022-05-20
Publication date: 2022-10-25

Abstract

本发明公开了一种基于TCN‑LSTM‑AM的短期负荷预测方法包括如下步骤：1）数据采集；2）数据预处理；3）搭建输入模块；4）搭建TCN模块；5）搭建concatenate模块；6）搭建LSTM模块；7）搭建AM模块；8）搭建输出模块。这种方法能提高预测准确率，为电网***提供了更加精确的预测结果，为灵活调节供电量提供了更加可靠的依据。

Description

一种基于TCN-LSTM-AM的短期负荷预测方法

技术领域

本发明属于电力***负荷预测的应用领域，具体是一种基于TCN-LSTM-AM的短期负荷预测方法。

背景技术

短期电力负荷预测对保证电力***平稳高效运行具有重要意义，是推进电力***发电侧多源协调运行优化与用电侧安全保障体系建设，构建数字化、智能化新型电力***的重要基础。提高电力短期负荷预测精度能够有效帮助电力***工作人员制定合理生产计划，维持电力供需平衡、减少资源浪费并降低用电成本。在现代电力***中，随着经济社会的快速发展，构成电力负荷的大功率电器种类繁多，这些电器使用的频繁程度与气象因素(温度、湿度、降雨量等)高度相关，使气象条件成为了影响电力负荷重要因素。此外，电力负荷还与节假日、工作日等相关。因此，人们普遍认为电力负荷具有随机性、非平稳性、非线性、缺乏鲁棒性等特点，这使得对短期电力负荷预测是一项极具挑战性的工作。

短期电力负荷是指对未来几个小时、一天或几天的电力负荷值进行预测，目前常用的方法可以分为三类：经典预测法、传统机器学习预测法和深度学习预测法。经典预测法主要包括时间序列法(Time-Series Analysis)、线性回归分析法(linear regression,简称LR)、卡尔曼滤波法(Kalman filter)。基于经典预测方法的预测模型简单、训练速度快，但是对于非线性的电力短期负荷预测问题，该方法拟合能力不足，预测精度较低。传统机器学习预测法主要包括支持向量机法(support vector machines，简称SVM)、xgboost(eXtreme Gradient Boosting)和随机森林法Random Forest，简称RF)。传统机器学习法虽然具有较强的非线性拟合能力，但是大多数模型参数寻优困难，容易陷入局部最优的困境。深度学习预测法包括人工神经网络(back propagation，简称BP)、卷积神经网络(Convolutional Neural Networks，简称CNN)、长短期记忆网络(Long-Short TermMemory，简称LSTM)、时间卷积网络(Temporal convolutional network，简称TCN)和注意力机制(Attention Mechanism，简称AM)。这些方法凭借突出的特征提取能力及非线性拟合能力，能够获取数据中非常复杂的底层特征。但由于单模型是针对某一类问题而提出，它们在高维数据集上难以同时很好地解释主要影响因素和其他影响因素。通过组合多种不同的神经网络模型，充分利用它们各自的优势，提取负荷数据集中高维特征和多尺度特征，从而有望在在电力负荷数据拟合效果和预测精确度上有更大的提升。

发明内容

本发明的目的是针对现有技术中存在的不足，而提出一种基于TCN-LSTM-AM的短期负荷预测方法。这种方法能提高预测准确率，为电网***提供了更加精确的预测结果，为灵活调节供电量提供了更加可靠的依据。

实现本发明目的的技术方案是：

一种基于TCN-LSTM-AM的短期负荷预测方法，包括如下步骤：

1)数据采集：获取电力监测点负荷数据，以及包括温度、湿度和降雨量的环境影响数据，得到数据集；

2)数据预处理：采用箱线图法，清洗数据集中异常值样本；对数据集中的原始数据x进行归一化操作，数据归一化后区间为[0,1]，公式如下：

式中:X为标准化后的值；x_max为样本数据中的最大值；x_min为样本数据中的最小值；

3)搭建输入模块：

设x₁为当前预测时刻的连续前96个时刻的历史电力负荷数据，即96维样本数据[load_t,load_t-T…load_n]；x₂包括最高温度、最低温度、平均温度、相对湿度、降雨量、节假日、星期、时刻共8维样本数据，设时间步滑动窗口大小为T，在t时刻的输入序列具体表示为：

x₁＝[p_t,p_t-T...p_n]^T (2)，

p_t＝[load_t,load_t-T...load_n] (3)，

x₂＝[o_t,o_t-T...o_n]^T (4)，

o_t＝[temph_t,tempm_t,tempa_t,damp_t,rain_t,holiday_t,week_t,time_t] (5)，

式中：loadt为t时刻的日负荷量，temph_t为t时刻的日最高温度，tempm_t为t时刻的日最低温度，tempa_t为t时刻的日平均温度，damp_t为t时刻的相对湿度，rain_t为t时刻的降雨量，holiday_t表示t时刻是否是节假日，week_t表示t时刻是一周中的第几天，其中每周一为第一天，time_t为t时刻的时间；

4)搭建TCN模块：

每个残差模块由3个一维卷积层Conv0、Conv1、Conv2组成：第一个卷积层Conv0选择使用ReLU激活函数对输入做初步处理，输出为C₀；第二个卷积层Conv1的输入为C₀，通过卷积特征提取后为C₁；C₀与C₁的输入需要考虑TCN的扩张卷积参数d，并在逐步元素相乘后输入Conv2；Conv2的输出与模块输入p_t相加后即可得到另一个输出R_t，因此R_t表示为：

R_t＝ReLU(p_t+C_2,t) (9)，

式中：W₀、W₁和W₂均为卷积核矩阵；b₀、b₁、b₂为偏置；

为卷积运算；“·”为逐元素相乘；R_t中的元素个数为n,记为R_t＝[r_t1,r_t2,…r_tn]^T；

考虑到一个TCN模块由多个残差模块组成，因此在将多个残差模块堆叠时，要求第k-1个残差模块的输出R_k-1作为第k个残差模块的输入；采用ReLU激活函数进行非线性计算作为TCN模块的输出G_t，因此G_t表示为：

R_t,k＝Res(R_t,k-1) (10)，

G_t＝ReLU(R_t) (11)，

式中：R_t,k表示第k个残差模块所输出的R_t；Res表示残差模块，G_t中的元素个数为n,记为G_t＝[G_t,1，G_t,2,…G_t,n]^T；

5)搭建concatenate模块：

利用keras模型的concatenate函数将TCN模块的输出G_t与x₂进行连接，作为长短期记忆网络的输入，记为I表示为：

I＝concatenate(x₂,G_t) (12)，

式中：concatenate表示连接函数；

6)搭建LSTM模块：

在t时刻，LSTM模块对concatenate模块输出的电力负荷特征向量I进行学习，记在t时刻LSTM模块的隐层状态为H_t,i，H_t,i表示为：

H_t,i＝LSTM(H_t,i-1,I_t,C_t,i-1) (13)，

式中：H_t,i表示t时刻中第i个输入步长的隐层状态；C_t,i-1表示t时刻第i-1个输入步长的细胞状态；H_t中的元素个数为n,记为H_t＝[H_t,1,H_t,2,…H_t,n]^T；

7)搭建AM模块：

AM模块的输入为经过LSTM模块计算的隐层状态h_t，注意力权值A_t的计算如式(14)，记在t时刻AM模块的输出为S_t；通过Multiply函数将AM模块的输出S_t与LSTM模块的输出H_t完成位与位相乘输出，实现了对隐层单元的动态加权过程，记为L_t，S_t表示为：

L_t＝Multiply(S_t，H_t) (16)，

式中：A_t,i表示在t时刻，AM模块中第i个输入时间步的隐藏状态；q_t表示随机初始化的注意力权重矩阵；Multiply表示逐元素相乘；

8)搭建输出模块：

输出模块为全连接层，以linear函数作为激活函数，经处理后得到第t+1时刻电力负荷预测值，记为y，输出模块的计算公式表示为：

y＝linear(wS_t+b) (17)，

式中：w为卷积核矩阵；b为偏置。

本技术方案与现有技术相比，将TCN输出和电力负荷影响因素拼接在一起组合成高层特征构造出新的连续特征，将不同尺度的特征向量融合为LSTM的输入，利用LSTM非线性拟合能力，挖掘多维数据的相互关联，提取数据非线性特征。引入注意力机制为隐藏层中不同特征设置不同权重，优化关键特征对电力负荷的影响，从而达到对节假日和峰谷电力负荷更好的预测效果。该模型充分结合了TCN、LSTM和注意力机制各自的特点，并通过实验验证了模型的合理性和有效性。

TCN-LSTM-AM模型的短期负荷预测流程可分为数据预处理、预测模型和预测输出3部分，首先，输入数据进行数据预处理操作，即数据清洗、数据归一化、数据划分等。处理后的数据分别为负荷历史数据和外部影响因素(最高温度、最低温度、平均温度、相对湿度、降雨量、节假日、时刻和星期)。TCN模块利用因果卷积限制滑动窗口来实现严格的时间束缚，利用扩大扩张卷积结构感受野来获取更高层历史电力负荷序列的时序特征。其次，为了构造LSTM模块的输入数据，将TCN模块的输出与负荷影响子拼接。LSTM模块将整合出的负荷数据非线性特征进行记忆与筛选，并挖掘其内部的变化规律。融合AM模块优化目标特征权重，为LSTM提取的负荷数据深层特征自动计算相应的权重分配并与其合并为新的向量。输出模块通过全连接层dense和linear激活函数输出下一时刻的负荷预测结果。

针对短期负荷预测问题，将注意力机制与TCN-LSTM模型融合,提出一种基融合注意力机制改进TCN-LSTM组合预测模型(TCN-LSTM-AM)，TCN模型通过TCN卷积对历史负荷数据的时序特征提取，残差连接加快收敛速度；LSTM模型具有非线性拟合能力，有效提取天气(最高温度、最低温度、平均温度、相对湿度、降雨量)、节假日和周期(时刻、星期)多尺度的数据特征；引入注意力机制，动态挖掘电力负荷与输入特征间的潜在相关性。

这种方法能提高预测准确率，为电网***提供了更加精确的预测结果，为灵活调节供电量提供了更加可靠的依据。

附图说明

图1为实施例的流程图；

图2为实施例的模型结构图；

图3为实施例与其他负荷预测方法在测试数据集上的平均相对误差对比示意图；

图4为实施例与其他负荷预测方法在测试数据集上的均方根误差对比示意图；

图5为实施例与其他负荷预测方法在测试数据集上的平均绝对误差对比示意图；

图6为实施例与其他负荷预测方法在2014年下半年中某一工作日白天负荷曲线对比示意图；

图7为实施例与其他负荷预测方法在2014年下半年中某一节假日白天负荷曲线对比示意图。

具体实施方式

下面结合附图及具体实施例对本发明作进一步的详细描述，但不是对本发明的限定。

实施例：

实验环境配置：本例中硬件平台为工作站，处理器为Intel Xeon Gold 6226R,内存为256GB,固态硬盘容量为6T,1块GPU显卡Tesla V100S PCIE 32G，算法模型采用Python3.8作为编程语言，软件架构基于Tensorflow框架和Keras框架，绘图工具采用matplotlib绘图模块。

参照图1、图2，一种基于TCN-LSTM-AM的短期负荷预测方法，包括如下步骤：

1)数据采集：获取电力监测点负荷数据，以及包括温度、湿度和降雨量的环境影响数据，得到的电力监测点负荷数据和环境影响数据作为数据集，将数据集分为训练数据集、验证数据集和测试数据集；本例选用的数据来源为南京地区某个采集点的电力监测点负荷和环境影响数据，采集时间为2012年1月1日至2014年12月31日，每日的电力监测点负荷数据按照24h设置96个采样点，电力监测点负荷采样间隔为十五分钟，环境影响数据采样间隔为24小时，数据集共计105120条数据，如图7所示自上而下依次为2012年至2014年三年的电力监测点负荷数据，以2012年1月1日至2013年12月31日电力监测点负荷数据、环境影响数据及节假日数据作为训练数据集，以2014年的1月1日至6月31日作为验证数据集，以2014年7月1日至12月31日作为测试数据集；

2)数据预处理：采用箱线图法，清洗数据集中的异常值样本，然后对数据集中的原始数据x进行归一化操作，数据归一化后区间为[0,1]，公式如下：

3)搭建输入模块：

x₁为当前预测时刻的连续前96个时刻的历史电力负荷数据即96维样本数据[load_t,load_t-T…load_n]；x₂包括最高温度(temph)、最低温度(tempm)、平均温度(tempa)、相对湿度(damp)、降雨量(rain)、节假日(holiday)、星期(week)、时刻(time)共8维样本数据，设时间步滑动窗口大小为T，在t时刻的输入序列具体表示为：

x₁＝[p_t,p_t-T…p_n]^T (2)，

p_t＝[load_t,load_t-T...load_n] (3)，

x₂＝[o_t,o_t-T...o_n]^T (4)，

o_t＝[temph_t,tempm_t,tempa_t,damp_t,rain_t,holiday_t,week_t,time_t] (5)，

式中：loadt为t时间的日负荷量，temph_t为t时间的日最高温度，tempm_t为t时间的日最低温度，tempa_t为t时间的日平均温度，damp_t为t时间的相对湿度，rain_t为t时间的降雨量，holiday_t表示t时间是否是节假日，week_t表示t时间是一周中的第几天，其中每周一为第一天，time_t为t时间的时刻；

4)搭建TCN模块：

每个残差模块由3个一维卷积层Conv0、Conv1、Conv2组成：第一个卷积层Conv0选择使用ReLU激活函数对输入做初步处理，输出为C₀；第二个卷积层Conv1的输入为C₀，通过卷积特征提取后称之为C₁；C₀与C₁的输入需要考虑TCN的扩张卷积参数d，并在逐步元素相乘后输入Conv2；Conv2的输出与模块输入p_t相加后即可得到另一个输出R_t，因此R_t表示为：

R_t＝ReLU(p_t+C_2,t) (9)，

式中：W₀,、W₁和W₂为卷积核矩阵；b₀、b₁、b₂为偏置；

通过历史负荷数据实验TCN单模型的预测效果，发现适当地增加残差单元数量可以增加模型深度可以提高模型预测能力，但当残差单元增加到4层时训练误差率上升，表明模型过度学习；卷积核过大将大大增加神经网络参数的数量和计算量，影响算法的收敛，过小则导致特征提取不佳；TCN模块设置3层的残差单元，每层残差单元包含2个卷积单元和1个非线性映射，其中卷积单元使用ReLU函数作为激活函数，对卷积核的权重进行归一化操作，每层卷积核大小为2，扩张系数为(1，2，4，8，16，32)；

R_t,k＝Res(R_t,k-1) (10)，

G_t＝ReLU(R_t) (11)，

5)搭建concatenate模块：

I＝concatenate(x₂,G_t) (12)，

式中：concatenate表示连接函数；

6)搭建LSTM模块：

H_t,i＝LSTM(H_t,i-1,I_t,C_t,i-1) (13)，

采用控制变量法进行逐步的模型调优，在固定TCN模块提取特征不变的情况下，测试不同层数LSTM网络层对预测结果的影响，试验结果发现通过适当地增加LSTM网络层来增加模型深度可以提高模型预测能力，但当LSTM网络层增加到4层时训练误差率上升，表明模型过度学习，因此设置3层LSTM单元，每层设置Dropout系数为0.2，Dropout设置可以随机选取部分神经元失活，防止训练过拟合，同时加快模型的收敛速度；

7)搭建AM模块：

AM模块的输入为经过LSTM模块计算的隐层状态h_t，注意力权值A_t的计算如式(14)，记在t时刻AM模块的输出为S_t；通过Multiply函数将AM模块的输出S_t与LSTM模块的输出H_t完成位与位相乘输出，实现了对隐层单元的动态加权过程，记为L_t；S_t表示为：

L_t＝Multiply(S_t，H_t) (16)，

8)搭建输出模块：

y＝linear(wS_t+b) (17)，

式中：w为卷积核矩阵；b为偏置。

评价指标：

采用相对误差作为衡量标准,衡量TCN-LSTM-AM混合网络模型的预测准确性，平均绝对百分比误差(Mean Absolute Percentage Error，简称Mape)均方根误差(root meansquare error，简称RMSE)和平均绝对误差(mean absolute error，简称MAE)作为评价预测模型的预测准确度的指标，计算式分别为：

式中

为样本预测值；y_i为样本真实值；n为样本数量，MAPE表示预测值和真实值之间绝对误差的平均值，反映预测效果的精准度，RMSE表示预测值和真实值之间残差的标准偏差，反映了样本的离散程度，MAE表示预测值和真实值之间绝对误差的平均值，可以准确描述实际预测误差的大小；

预测结果分析：

利用训练数据集，对预测模型训练1000个epoch，将本例提出的TCN-LSTM-AM模型与TCN、LSTM、TCN-AM、TCN-LSTM模型在测试数据集上的MAPE、RMSE和MAE如图3～图5所示，TCN-LSTM-AM模型有着较低的MAPE、RMSE和MAE，其预测值与真实值拟合图形的分散程度较小，具有较高的预测精度。

为了更加直观地显示几种模型预测方法和TCN-LSTM-AM模型的差异，将TCN-LSTM-AM模型分别与LSTM、TCN、TCN-AM和TCN-LSTM模型预测结果评价指标的平均值对比，具体计算如一下公式所示：

ΔMAPE＝(MAPE_MODEL-MAPE_TCN-LSTM-AM)/MAPE_MODEL (22)，

ΔRMSE＝(RMSE_MODEL-RMSE_TCN-LSTM-AM)/RMSE_MODEL (23)，

ΔMAE＝(MAE_MODEL-MAE_TCN-LSTM-AM)/MAE_MODEL (24)，

TCN-LSTM-AM模型分别与LSTM、TCN、TCN-AM和TCN-LSTM模型比较，MAPE分别下降了44.58％、25.41％、17.86％、11.54％；RMSE分别下降了45.88％、18.15％、3.48％、9.73％；MAE分别下降了40.98％、19.02％、2.21％、1.15％，具体如表2所示：

表2 TCN-LSTM-AM模型与其他模型量化对比

，为了更好地评估TCN-LSTM-AM模型的预测性能，从测试数据集中任意抽取一个工作日和一个节假日的白天，将实际数据与模型的预测结果进行比较，表3～表4分别显示了工作日和节假日数据与各模型预测结果的对比情况，图6～图7为相应预测对比曲线。

表3工作日预测结果量化对比

，从图6和表3中可以明显看出：单独的LSTM和TCN预测模型都能够较好地跟踪负荷实时变化,且有不错的预测准确度，但相较于其他三个组合预测模型效果依然稍逊一筹。其原因在于，组合预测模型能更好地从多尺度去捕捉负荷变化规律，从而在一定程度上弥补了单一预测模型的不足。

表4节假日预测结果量化对比

，从图7和表4中可以看出：引入注意力机制后的TCN-AM和TCN-LSTM-AM模型在节假日上的整体预测效果较好，且在峰谷的几个时刻预测较为精准。通过以上实验表明，TCN-LSTM-AM模型相比其他预测模型，在本例数据集中具有更高的预测精度。

本例方法，利用可并发计算的时序卷积网络挖掘历史负荷数据的时序特征，长短期记忆网络拟合负荷影响因素的非线性特征，融合注意力机制优化关键特征，最后通TCN-LSTM-AM过模型的非线性拟合能力以及深度学习能力对电力负荷进行预测。通过MAPE、RMSE、MAE三个评价指标，采用负荷数据集将本例方法与其他常用的深度学习预测模型进行对比。经实验结果表明，TCN-LSTM-AM模型具有更高的预测准确率。为电网***提供了更加精确的预测结果，为灵活调节供电量提供了更加可靠的依据。