CN113344279B - 基于lstm-sam模型和池化的居民负荷预测方法 - Google Patents
基于lstm-sam模型和池化的居民负荷预测方法 Download PDFInfo
- Publication number
- CN113344279B CN113344279B CN202110684640.9A CN202110684640A CN113344279B CN 113344279 B CN113344279 B CN 113344279B CN 202110684640 A CN202110684640 A CN 202110684640A CN 113344279 B CN113344279 B CN 113344279B
- Authority
- CN
- China
- Prior art keywords
- load
- lstm
- time step
- data
- pooling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000011176 pooling Methods 0.000 title claims abstract description 64
- 238000012549 training Methods 0.000 claims abstract description 40
- 238000012360 testing method Methods 0.000 claims abstract description 34
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 239000013598 vector Substances 0.000 claims description 27
- 230000006870 function Effects 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 6
- 238000000354 decomposition reaction Methods 0.000 claims description 6
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 238000013277 forecasting method Methods 0.000 claims description 2
- 230000004927 fusion Effects 0.000 claims description 2
- 230000004044 response Effects 0.000 abstract description 4
- 210000004027 cell Anatomy 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 2
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000012407 engineering method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Strategic Management (AREA)
- Artificial Intelligence (AREA)
- Human Resources & Organizations (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了基于LSTM‑SAM模型和池化的居民负荷预测方法,属于电力***技术领域,通过获取多个居民用户的历史负荷数据和数值气象预报数据,随机选择某个用户作为目标用户;采用二阶段特征工程对每个用户的数据进行预处理;对非目标用户进行排序,选择不同数量的非目标用户为互联用户,与目标用户共同构成不同的池化组合,基于池化构建训练数据池,并保留目标用户的测试集数据;将训练数据池和目标用户的测试集数据输入LSTM‑SAM混合模型,获取各负荷分量的预测值并将其相加,输出目标用户待预测时刻的日前负荷预测结果及最佳池化用户个数。本发明提高了居民负荷的预测精度,为***调度和需求响应实施提供指导,保障了电力***的安全稳定经济运行。
Description
技术领域
本发明属于电力***技术领域,涉及基于LSTM-SAM模型和池化的居民负荷预测方法。
背景技术
电力***需要保持电力供应和电力需求间的动态平衡,负荷预测在维持电力***稳定运行及指导电力调度中具有十分重要的现实意义。由于受到外部因素的影响,电力负荷具有一定的波动性和不确定性。相较于***总负荷,用户级居民负荷由于缺少负荷平滑更加难以预测。此外,电力用户自发参与需求响应,导致居民负荷预测更加复杂。因此,研究精准的居民负荷预测方法是至关重要的。
现有负荷预测方法可分为传统统计方法和人工智能法。其中,传统的统计负荷预测方法容易实现,不需要获取额外的输入。但在很多情况下,由于只考虑了历史负荷数据,其准确性往往受到限制。基于人工智能的负荷预测方法可以将多个变量作为输入。具备非线性特征提取能力和容错能力的人工神经网络以及具有较强泛化能力的支持向量机是机器学习的常用算法,在小数据样本情况下表现性能优越。另一方面,高级量测体系的部署导致负荷数据量显著增加。大规模数据降低了机器学习的有效性,这一不足可通过采用深度学习算法进行克服,深度学习为有效处理海量数据提供了解决方案。相较于单一模型架构,混合模型集成了不同模型的优点,因而其预测性能得到改善,近年来被广泛关注并大量应用。除了开发性能更强的模型,改进模型输入是提高预测性能的另一种有效方法。特征工程作为一种构建有价值的模型输入的方法,已被深入研究,用于促进特征提取,提高模型泛化能力。在此背景下,使用基于LSTM-SAM模型和池化的居民负荷预测方法,以学习居民用户的用电行为特征,提高负荷预测的准确性,为电力***运行和调度提供更可靠的指导。
发明内容
发明目的:本发明针对目前用户级居民负荷预测方法的不足,包括预测精度低、未利用除目标用户数据以外的有用信息等问题,提出基于LSTM-SAM模型和池化的居民负荷预测方法,基于LSTM-SAM混合模型,学习训练数据池中的隐藏信息,使得预测精度进一步提升。
技术方案:本发明提供了基于LSTM-SAM模型和池化的居民负荷预测方法,包括以下步骤:
(1)获取多个居民用户的历史负荷数据和数值气象预报数据,随机选择某个用户作为目标用户;
(2)采用二阶段特征工程对每个用户的数据进行预处理;
(3)对非目标用户进行排序,选择不同数量的非目标用户为互联用户,与目标用户共同构成不同的池化组合,基于池化构建训练数据池,并保留目标用户的测试集数据;
(4)将训练数据池和目标用户的测试集数据输入LSTM-SAM混合模型,分别进行训练和预测,获取各负荷分量的预测值并将其相加,输出目标用户待预测时刻的日前负荷预测结果及最佳池化用户个数。
进一步地,步骤(2)采用二阶段特征工程对每个用户的数据进行预处理,所述二阶段特征工程方法为:
2.1历史负荷序列分解阶段,采用变分模态分解算法将观测到的负荷序列分解为多个频率分量,分别对各历史负荷分量进行后续数据预处理;
2.2多源输入维度重构阶段,分别对负荷分量和数值气象预报数据采用不同方法重构输入维度,具体方法如下:
2.2.1负荷分量输入维度重构方法:
假设待预测时刻为t,从第i个负荷分量中取一段固定长度的连续滞后负荷值,表示为:
其中,T是转置;为待预测时刻t第i个负荷分量对应的滞后负荷时间序列;是第i个负荷分量在时刻r的值,r=t-h-lag+1,t-h-lag+2,…,t-h;i是负荷分量的序号;lag是连续滞后负荷的数量;h是预测时间步长;
利用滑动窗口获取负荷数据,将获取的数据作为输入至LSTM网络一个时间步的特征向量,以一步为间隔连续滑动,获取输入至LSTM网络相邻时间步的特征向量,则第j个滑动窗口获取的向量为:
其中,T是转置;为第j个滑动窗口从待预测时刻t第i个负荷分量对应的滞后负荷时间序列中获取的向量;为第i个负荷分量在时刻q的值,q=t-h-lag+j,t-h-lag+j+1,…,t-h-lag+j+n-1;j为滑动窗口的序号;n是滑动窗口的宽度;T0是滑动窗口的总数量,T0由连续滞后负荷的数量和滑动窗口的宽度决定:
T0=lag+1-n
将T0个滑动窗口获取的向量依次进行堆叠,构成如下二维特征图:
2.2.2数值气象预报输入维度重构方法:
融合预测时刻t的温度、相对湿度和风速预报值,并将融合后的结果重复T0次,则预测时刻t对应的二维气象特征为:
其中,NWPt为维度重构后待预测时刻t对应的数值气象预报特征,其大小为T0×3,T0是滑动窗口总数量;Tt、Ht和Wt分别指预测时刻t的温度、湿度和风速。
将该特征分别与预测时刻t各负荷分量的加权隐藏特征相结合。
进一步地,步骤(3)对非目标用户进行排序,选择不同数量的非目标用户为互联用户,与目标用户共同构成不同的池化组合,基于池化构建训练数据池,并保留目标用户的测试集数据,所述训练数据池构建包括:
3.1计算目标用户负荷序列和各非目标用户负荷序列的互信息,并按照互信息降序排列非目标用户,互信息计算公式为:
其中,Xz指第z个非目标用户的负荷数据,Y指目标用户的负荷数据,No是非目标用户的数量;
3.2将池化用户数k从1依次增加至其上限K,共形成K种池化组合。对于每种池化组合,先引入目标用户的数据,再根据排序结果从最大互信息对应的互联用户开始依次引入数据,直到引入池中的用户数量等于k;
3.3在每种池化组合中,对各池化用户经特征工程处理后的数据划分训练集和测试集,通过合并组内池化用户的训练集分别构建各负荷分量和数值气象预报的训练数据池,将其用于训练LSTM-SAM混合模型;保留目标用户的测试集数据,并将其应用于模型测试阶段,最佳池化用户个数通过比较测试集基于不同池化组合的误差指标获取。
进一步地,步骤(4)将训练数据池和目标用户的测试集数据输入LSTM-SAM混合模型,分别进行训练和预测,获取各负荷分量的预测值并将其相加,输出目标用户待预测时刻的日前负荷预测结果及最佳池化用户个数,所述LSTM-SAM混合模型为:
4.1将LSTM模型作为混合模型的基础,LSTM模型中具体计算过程如下,假设LSTM的时间步数为Ts:
fp=σ(Wfxp+Vfhp-1+bf)
C′p=tanh(Wcxp+Vchp-1+bc)
ip=σ(Wixp+Vihp-1+bi)
Cp=Cp-1⊙fp+ip⊙C′p
Op=σ(Woxp+Vohp-1+bo)
hp=Op⊙tanh(Cp)
其中,p=1,2,…,Ts,p为LSTM内时间步的序号;xp为对应时间步p的输入;hp-1为对应时间步p-1的隐藏状态;fp,ip和Op分别为对应时间步p的遗忘门输出、输入门输出和输出门输出;C′p为对应时间步p的记忆单元候选值;Cp为对应时间步p的记忆单元状态,hp为对应时间步p的隐藏状态;Vf,Vc,Vi和Vo分别为LSTM遗忘门、候选值、输入门和输出门的递归权重;Wf,Wc,Wi和Wo分别表示遗忘门、候选值、输入门和输出门的权重矩阵;bf,bc,bi和bo分别表示LSTM中遗忘门、候选值、输入门和输出门的偏置;σ(·)代表sigmoid激活函数,输出介于0和1之间,0表示将信息完全遗忘,1表示将信息全部保留;tanh(·)代表双曲正切激活函数;⊙代表逐点相乘;
4.2引入SAM,帮助LSTM识别输入重要性,SAM具体计算过程如下:
假设隐藏特征维度为m,计算不同时间步的隐藏特征相关性,则隐藏特征第d维第j个时间步的得分为:
sj,d=fsco(Wj,d[h1d,h2d,…,hTsd]),d=1,…,m,j=1,…Ts
其中,hjd为第d维第j个时间步的隐藏特征值;Wj,d为对应第d维第j个时间步得分的权重向量,在训练阶段学习;函数fsco(·)为得分函数;j为LSTM内时间步的序号;Ts为LSTM的时间步数;d为隐藏特征维度的序号;
通过使用Softmax函数进行归一化,获取和为1的特定维度得分:
平均各时间步上所有维度的归一化得分,分别获取对应时间步的权重,将隐藏特征向量与权重相乘,并将加权结果作为后续层的输入:
4.3基于LSTM和SAM构建具有两个输入通道的混合模型,模型包含LSTM层、注意层、concatenate层和Dense层;LSTM层分别用于提取负荷分量中隐藏的时间相关性特征以及提取考虑气象因素后的高级特征;注意力层用于加权隐藏特征,其输出结果与数值气象预报在concatenate层进行融合,并将融合结果输入后续层;经过两Dense层输出各负荷分量对应的预测结果,将其相加获取每个池化组合对应的居民负荷预测结果,并比较各池化组合下的测试集误差指标输出最佳池化用户个数。
有益效果:与现有技术相比,本发明的技术方案基于目标用户和其互联用户的历史负荷数据和数值气象预报数据,采用二阶段特征工程对数据进行预处理,经池化构建不同池化组合及相应的训练数据池,输入LSTM-SAM混合模型,对目标用户的负荷数据进行预测,提高了居民负荷的预测精度,为***调度和需求响应实施提供指导,保障了电力***的安全稳定经济运行。
附图说明
图1为本发明基于LSTM-SAM模型和池化的居民负荷预测方法的流程示意图。
图2为本发明负荷分量输入维度重构的示意图。
图3为本发明基于池化构建训练数据池的流程图。
图4为本发明采用的LSTM-SAM混合模型结构示意图。
图5为本发明实施例中采用所提方法的最终预测结果展示图。
具体实施方式
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
本发明提供了基于LSTM-SAM模型和池化的居民负荷预测方法,如图1所示,该方法包括以下步骤:
(1)获取多个居民用户的历史负荷数据和数值气象预报数据,随机选择某个用户作为目标用户;
(2)采用二阶段特征工程对每个用户的数据进行预处理;
(3)对非目标用户进行排序,选择不同数量的非目标用户为互联用户,与目标用户共同构成不同的池化组合,基于池化构建训练数据池,并保留目标用户的测试集数据;
(4)将训练数据池和目标用户的测试集数据输入LSTM-SAM混合模型,分别进行训练和预测,获取各负荷分量的预测值并将其相加,输出目标用户待预测时刻的日前负荷预测结果及最佳池化用户个数。
下面结合具体实施例,详细说明使用本发明中的方法进行居民负荷预测的具体实施过程。以江苏某地区的居民负荷和气象站预报数据为例,按1小时的采样频率获取从2017年8月至2018年7月某27个用户的负荷数据和125个气象站的气象预报数据,为每个用户选择与之最近的气象站,获取气象变量,包括温度、相对湿度和风速,并将历史负荷数据和各气象变量作为模型输入。为测试模型泛化能力,将每月最后七天的数据作为测试集,其余数据作为训练集,提前一天预测居民负荷,所用预测误差评价指标为平均绝对百分比误差MAPE,平均绝对误差MAE和均方根误差RMSE。具体实施步骤如下:
步骤(2)采用二阶段特征工程对每个用户的数据进行预处理,所述二阶段特征工程方法为:
2.1历史负荷序列分解阶段,采用变分模态分解算法将观测到的负荷序列分解为趋势分量、周期分量和不确定性分量,分别对各历史负荷分量进行后续数据预处理;
2.2多源输入维度重构阶段,分别对负荷分量和数值气象预测数据采用不同方法重构输入维度,具体方法如下:
2.2.1负荷分量输入维度重构方法:
假设待预测时刻为t,从第i个历史负荷分量中取一段固定长度的连续滞后负荷值,如下式所示,本方法设置连续滞后负荷值数量的取值为24的整数倍,其上限为168:
其中,T是转置;为待预测时刻t第i个负荷分量对应的滞后负荷时间序列;是第i个负荷分量在时刻r的值,r=t-h-lag+1,t-h-lag+2,…,t-h;i是负荷分量的序号;lag是连续滞后负荷的数量;h是预测时间步长,本发明针对日前负荷预测,故h取24;
利用滑动窗口获取负荷数据,将获取的数据作为输入至LSTM网络一个时间步的特征向量,以一步为间隔连续滑动,获取输入至LSTM网络相邻时间步的特征向量,设置滑动窗口长度的取值为24的整数倍,其上限为144,则第j个滑动窗口获取的向量为:
其中,T是转置;为第j个滑动窗口从待预测时刻t第i个负荷分量对应的滞后负荷时间序列中获取的向量;为第i个负荷分量在时刻q的值,q=t-h-lag+j,t-h-lag+j+1,…,t-h-lag+j+n-1;j为滑动窗口的序号;n是滑动窗口的宽度;T0是滑动窗口的总数量,T0由连续滞后负荷的数量和滑动窗口的宽度决定,经计算其值为25、49、73、97、121和145:
T0=lag+1-n
将T0个滑动窗口获取的向量依次进行堆叠,构成如下二维特征图:
负荷分量输入维度重构的示意图如图2所示。经负荷分量输入维度重构后,得到21种可能的输入形式,每种输入形式中,滞后负荷值数量、时间步数及输入特征维度间的对应关系如表1所示;本方法在不同输入形式下的居民负荷预测误差如表2所示,从表2可以看出,不论在哪一种池化组合下,本方法的预测精度随输入形式变化而变化,在同一池化组合、相同滞后负荷值数量下,通常具有适中时间步数和适中输入特征维度的预测精度更高,本方法当历史负荷分量输入形式为72历史负荷值、49时间步数和24输入特征维度时,其预测误差最小。
表1滞后负荷值数量、时间步数及输入特征维度之间的对应关系
2.2.2数值气象预报输入维度重构方法:
融合预测时刻t的温度、相对湿度和风速预报值,并将融合后的结果重复T0次,则预测时刻t对应的二维气象特征为:
其中,NWPt为维度重构后待预测时刻t对应的数值气象预报特征,其大小为T0×3,T0是滑动窗口总数量;Tt、Ht和Wt分别指预测时刻t的温度、湿度和风速。
将该特征分别与预测时刻t各负荷分量的加权隐藏特征相结合。
步骤(3)对非目标用户进行排序,选择不同数量的非目标用户为互联用户,与目标用户共同构成不同的池化组合,基于池化构建训练数据池,并保留目标用户的测试集数据,具体步骤的流程图如图3所示;本方法从27个居民用户中随机选择一个用户作为目标用户,其余用户为非目标用户;考虑到计算效率,设置池化用户数上限K为5,具体实际步骤包括:
3.1计算目标用户负荷序列和各非目标用户负荷序列的互信息,并按照互信息降序排列非目标用户,鉴于池化用户数上限为5,本方法实施过程中仅需考虑前4个最相关的互联用户,其与目标用户的互信息数值分别为0.855,0.835,0.832和0.830;
3.2将池化用户数k从1依次增加至上限5,共可形成5种池化组合。对于每种池化组合,先引入目标用户的数据,再根据排序结果从最大互信息对应的互联用户开始依次引入数据,直到引入池中的用户数量等于k;
3.3在每种池化组合中,对各池化用户经特征工程处理后的数据划分训练集和测试集,将每月最后7天的数据作为测试集,其余数据作为训练集;通过沿样本维度合并组内池化用户的训练集分别构建各负荷分量和数值气象预报的训练数据池,将其用于训练LSTM-SAM混合模型;保留目标用户的测试集数据,并将其应用于模型测试阶段,最佳池化用户个数为测试集预测误差最小的池化组合用户数量。
本方法基于不同池化组合的预测结果如表2所示,从表2可以看出池化用户数量将影响预测精度,综合对比所有池化组合的误差指标,四个池化用户构成的组合的预测效果最好。
表2基于不同输入形式和不同池化组合的预测结果
步骤(4)将训练数据池和目标用户的测试集数据输入LSTM-SAM混合模型,分别进行训练和预测,获取各负荷分量的预测值并将其相加,输出目标用户待预测时刻的日前负荷预测结果及最佳池化用户个数,所述LSTM-SAM混合模型为:
4.1将LSTM模型作为混合模型的基础,LSTM模型中具体计算过程如下,假设LSTM的时间步数为Ts,由LSTM输入中的时间步数决定,即Ts=T0:
fp=σ(Wfxp+Vfhp-1+bf)
C′p=tanh(Wcxp+Vchp-1+bc)
ip=σ(Wixp+Vihp-1+bi)
Cp=Cp-1⊙fp+ip⊙C′p
Op=σ(Woxp+Vohp-1+bo)
hp=Op⊙tanh(Cp)
其中,p=1,2,…,Ts,p为LSTM内时间步的序号;xp为对应时间步p的输入;hp-1为对应时间步p-1的隐藏状态;fp,ip和Op分别为对应时间步p的遗忘门输出、输入门输出和输出门输出;C′p为对应时间步p的记忆单元候选值;Cp为对应时间步p的记忆单元状态,hp为对应时间步p的隐藏状态;Vf,Vc,Vi和Vo分别为LSTM遗忘门、候选值、输入门和输出门的递归权重;Wf,Wc,Wi和Wo分别表示遗忘门、候选值、输入门和输出门的权重矩阵;bf,bc,bi和bo分别表示LSTM中遗忘门、候选值、输入门和输出门的偏置;σ(·)代表sigmoid激活函数,输出介于0和1之间,0表示将信息完全遗忘,1表示将信息全部保留;tanh(·)代表双曲正切激活函数;⊙代表逐点相乘;
4.2引入SAM,帮助LSTM识别输入重要性,SAM具体计算过程如下:
假设隐藏特征维度为m,计算不同时间步的隐藏特征相关性,则隐藏特征第d维第j个时间步的得分为:
其中,hjd为第d维第j个时间步的隐藏特征值;Wj,d为对应第d维第j个时间步得分的权重向量,在训练阶段可学习;j为LSTM内时间步的序号;Ts为LSTM的时间步数;d为隐藏特征维度的序号;得分函数fsco(·)通过全连接层实现,其网络神经元数量等于LSTM网络的时间步数量;
通过使用Softmax函数进行归一化,获取和为1的特定维度得分:
平均各时间步上所有维度的归一化得分,分别获取对应时间步的权重,将隐藏特征向量与权重相乘,并将加权结果作为后续层的输入:
4.3基于LSTM和SAM构建具有两个输入通道的混合模型,其中,LSTM-SAM混合模型结构如图4所示:该模型由两个LSTM层,一个注意力层,一个concatenate层和两个Dense层组成,其中,SAM位于注意力层;该模型具有两个输入通道,历史负荷分量的输入通道位于第一个LSTM层,数值气象预报数据的输入通道位于concatenate层;第一个LSTM层从负荷分量中提取时间相关性,将所提隐藏特征输入注意力层,经SAM加权后输入至concatenate层,加权隐藏特征与数值气象预报在concatenate层进行融合,并将其输入第二个LSTM层,用于提取更加抽象的特征,经过两Dense层输出各负荷分量所对应的预测结果,将其相加获取每个池化组合对应的居民负荷预测结果,且根据表2中误差指标对比结果可知,本方法的最佳池化用户个数为4。将待预测时刻负荷的预测值与真实值进行比较,计算误差指标MAPE、MAE和RMSE,公式分别如下:
此外,本发明提出的基于LSTM-SAM模型和池化的居民负荷预测方法选取基于ARIMA、SVR、ANN以及普通LSTM的负荷预测法作为基准预测方法,用于验证本发明所提方法提高预测精度的有效性。不同负荷预测方法进行提前一天预测的误差比较如表3所示,结果表明,不论滞后负荷值数量的多少,本发明所提方法能进一步提高居民负荷预测的准确性。图5给出了本方法基于最佳池化用户组合在不同季节下的日负荷预测曲线以及负荷的真实值曲线,图5(a)、(c)和(d)分别对应春季、秋季和冬季某日的日负荷,可以看出,本发明所提方法的相应曲线较为准确地预测了日负荷的整体趋势以及局部变化,尤其在负荷上升和下降阶段,十分贴近真实值;图5(b)为2018年夏季7月25日负荷的真实值和预测值曲线,由于负荷受温度等气象因素的影响更为显著,导致用电不确定性增加、负荷预测难度加大、所提方法的预测准确度相较其他季节略有下降,但仍然能够预测日负荷的整体变化趋势。综上所述,本发明所提方法较好地拟合了负荷真实值,能较为准确地预测不同季节的居民负荷,具有一定的可行性和实用性。
表3不同负荷预测方法的性能
综上所述,本发明的预测方法可用于预测用户级电力负荷,对电力***调度、能量管理以及需求响应实施起到重要的指导作用。本发明的方法相较于其他基准负荷预测法,利用了通常被忽略的来自互联用户的有用信息,其预测精度得到明显提升,能更准确地预测居民用户负荷,进而为电力***调度提供有价值的参考,有利于保证电网稳定经济运行。
Claims (3)
1.基于LSTM-SAM模型和池化的居民负荷预测方法,其特征在于,包括以下步骤:
(1)获取多个居民用户的历史负荷数据和数值气象预报数据,随机选择某个用户作为目标用户;
(2)采用二阶段特征工程对每个用户的数据进行预处理;
(3)对非目标用户进行排序,选择不同数量的非目标用户为互联用户,与目标用户共同构成不同的池化组合,基于池化构建训练数据池,并保留目标用户的测试集数据;
( 4 ) 将训练数据池和目标用户的测试集数据输入LSTM-SAM混合模型,分别进行训练和预测,获取各负荷分量的预测值并将其相加,输出目标用户待预测时刻的日前负荷预测结果及最佳池化用户个数;
所述的步骤(2)中,采用二阶段特征工程对每个用户的数据进行预处理,具体包括如下步骤:
2.1)历史负荷序列分解阶段,采用变分模态分解算法将观测到的负荷序列分解为多个频率分量,分别对各历史负荷分量进行后续数据预处理;
2.2)多源输入维度重构阶段,分别对负荷分量和数值气象预报数据采用不同方法重构输入维度;
所述的步骤2.2)的具体方法如下:
2.2.1)负荷分量输入维度重构方法:
假设待预测时刻为t,从第i个负荷分量中取一段固定长度的连续滞后负荷值,表示为:
其中,T是转置;为待预测时刻t第i个负荷分量对应的滞后负荷时间序列;是第i个负荷分量在时刻r的值,r=t-h-lag+1,t-h-lag+2,…,t-h;i是负荷分量的序号;lag是连续滞后负荷的数量;h是预测时间步长;
利用滑动窗口获取负荷数据,将获取的数据作为输入至LSTM网络一个时间步的特征向量,以一步为间隔连续滑动,获取输入至LSTM网络相邻时间步的特征向量,则第j个滑动窗口获取的向量为:
其中,T是转置;为第j个滑动窗口从待预测时刻t第i个负荷分量对应的滞后负荷时间序列中获取的向量;为第i个负荷分量在时刻q的值,q=t-h-lag+j,t-h-lag+j+1,…,t-h-lag+j+n-1;j为滑动窗口的序号;n是滑动窗口的宽度;T0是滑动窗口的总数量,T0由连续滞后负荷的数量和滑动窗口的宽度决定:
T0=lag+1-n
将T0个滑动窗口获取的向量依次进行堆叠,构成如下二维特征图:
2.2.2)数值气象预报输入维度重构方法:
融合预测时刻t的温度、相对湿度和风速预报值,并将融合后的结果重复T0次,则预测时刻t对应的二维气象特征为:
其中,NWPt为维度重构后待预测时刻t对应的数值气象预报特征,其大小为T0×3,T0是滑动窗口总数量;Tt、Ht和Wt分别指预测时刻t的温度、湿度和风速;
将该特征分别与预测时刻t各负荷分量的加权隐藏特征相结合。
2.根据权利要求1所述的基于LSTM-SAM模型和池化的居民负荷预测方法,其特征在于,所述的步骤(3)中,所述的基于池化构建训练数据池包括:
3.1)计算目标用户负荷序列和各非目标用户负荷序列的互信息,并按照互信息降序排列非目标用户,互信息计算公式为:
其中,Xz指第z个非目标用户的负荷数据,Y指目标用户的负荷数据,No是非目标用户的数量;
3.2)将池化用户数k从1依次增加至其上限K,共形成K种池化组合;对于每种池化组合,先引入目标用户的数据,再根据排序结果从最大互信息对应的互联用户开始依次引入数据,直到引入池中的用户数量等于k;
3.3)在每种池化组合中,对各池化用户经特征工程处理后的数据划分训练集和测试集,通过合并组内池化用户的训练集分别构建各负荷分量和数值气象预报的训练数据池,将其用于训练LSTM-SAM混合模型;保留目标用户的测试集数据,并将其应用于模型测试阶段,最佳池化用户个数通过比较测试集基于不同池化组合的误差指标获取。
3.根据权利要求2所述的基于LSTM-SAM模型和池化的居民负荷预测方法,其特征在于,所述的步骤(4)中,所述的LSTM-SAM混合模型为:
4.1)将LSTM模型作为混合模型的基础,LSTM模型中具体计算过程如下,假设LSTM的时间步数为Ts:
fp=σ(Wfxp+Vfhp-1+bf)
C′p=tanh(Wcxp+Vchp-1+bc)
ip=σ(Wixp+Vihp-1+bi)
Cp=Cp-1⊙fp+ip⊙C′p
Op=σ(Woxp+Vohp-1+bo)
hp=Op⊙tanh(Cp)
其中,p=1,2,…,Ts,p为LSTM内时间步的序号;xp为对应时间步p的输入;hp-1为对应时间步p-1的隐藏状态;fp,ip和Op分别为对应时间步p的遗忘门输出、输入门输出和输出门输出;C’p为对应时间步p的记忆单元候选值;Cp为对应时间步p的记忆单元状态,hp为对应时间步p的隐藏状态;Vf,Vc,Vi和Vo分别为LSTM遗忘门、候选值、输入门和输出门的递归权重;Wf,Wc,Wi和Wo分别表示遗忘门、候选值、输入门和输出门的权重矩阵;bf,bc,bi和bo分别表示LSTM中遗忘门、候选值、输入门和输出门的偏置;σ(·)代表sigmoid激活函数,输出介于0和1之间,0表示将信息完全遗忘,1表示将信息全部保留;tanh(·)代表双曲正切激活函数;⊙代表逐点相乘;
4.2)引入自注意力机制(SAM),帮助LSTM识别输入重要性,SAM具体计算过程如下:
假设隐藏特征维度为m,计算不同时间步的隐藏特征相关性,则隐藏特征第d维第j个时间步的得分为:
sj,d=fsco(Wj,d[h1d,h2d,…,hTsd]),d=1,…,m,j=1,…Ts
其中,hjd为第d维第j个时间步的隐藏特征值;Wj,d为对应第d维第j个时间步得分的权重向量,在训练阶段学习;函数fsco(·)为得分函数;j为LSTM内时间步的序号;Ts为LSTM的时间步数;d为隐藏特征维度的序号;
通过使用Softmax函数进行归一化,获取和为1的特定维度得分:
平均各时间步上所有维度的归一化得分,分别获取对应时间步的权重,将隐藏特征向量与权重相乘,并将加权结果作为后续层的输入:
4.3)基于LSTM和SAM构建具有两个输入通道的混合模型,模型包含LSTM层、注意层、concatenate层和Dense层;LSTM层分别用于提取负荷分量中隐藏的时间相关性特征以及提取考虑气象因素后的高级特征;注意力层用于加权隐藏特征,其输出结果与数值气象预报数据在concatenate层进行融合,并将融合结果输入后续层;经过两Dense层输出各负荷分量对应的预测结果,将其相加获取每个池化组合对应的居民负荷预测结果,并比较各池化组合下的测试集误差指标输出最佳池化用户个数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110684640.9A CN113344279B (zh) | 2021-06-21 | 2021-06-21 | 基于lstm-sam模型和池化的居民负荷预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110684640.9A CN113344279B (zh) | 2021-06-21 | 2021-06-21 | 基于lstm-sam模型和池化的居民负荷预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113344279A CN113344279A (zh) | 2021-09-03 |
CN113344279B true CN113344279B (zh) | 2022-03-01 |
Family
ID=77478403
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110684640.9A Active CN113344279B (zh) | 2021-06-21 | 2021-06-21 | 基于lstm-sam模型和池化的居民负荷预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113344279B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113988373B (zh) * | 2021-09-27 | 2022-09-30 | 河海大学 | 基于多通道卷积神经网络的多任务海量用户负荷预测方法 |
CN116361709B (zh) * | 2023-03-31 | 2023-10-31 | 山东省计算中心(国家超级计算济南中心) | 一种自适应电力负荷识别方法与设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110188399A (zh) * | 2019-05-07 | 2019-08-30 | 河海大学 | 一种基于多相关序列的大坝安全监测单测点评价方法 |
WO2020077232A1 (en) * | 2018-10-12 | 2020-04-16 | Cambridge Cancer Genomics Limited | Methods and systems for nucleic acid variant detection and analysis |
CN111310387A (zh) * | 2020-02-19 | 2020-06-19 | 电子科技大学 | 一种燃料电池寿命预测方法 |
CN111582551A (zh) * | 2020-04-15 | 2020-08-25 | 中南大学 | 风电场短期风速预测方法、***及电子设备 |
CN112652326A (zh) * | 2020-11-18 | 2021-04-13 | 西北工业大学 | 基于伪彩色时频图像及卷积网络的环境声音识别方法 |
-
2021
- 2021-06-21 CN CN202110684640.9A patent/CN113344279B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020077232A1 (en) * | 2018-10-12 | 2020-04-16 | Cambridge Cancer Genomics Limited | Methods and systems for nucleic acid variant detection and analysis |
CN110188399A (zh) * | 2019-05-07 | 2019-08-30 | 河海大学 | 一种基于多相关序列的大坝安全监测单测点评价方法 |
CN111310387A (zh) * | 2020-02-19 | 2020-06-19 | 电子科技大学 | 一种燃料电池寿命预测方法 |
CN111582551A (zh) * | 2020-04-15 | 2020-08-25 | 中南大学 | 风电场短期风速预测方法、***及电子设备 |
CN112652326A (zh) * | 2020-11-18 | 2021-04-13 | 西北工业大学 | 基于伪彩色时频图像及卷积网络的环境声音识别方法 |
Non-Patent Citations (2)
Title |
---|
Deep Learning for Household Load Forecasting-A Novel Pooling Deep RNN;Heng Shi等;《IEEE Transactions on Smart Grid》;20180930;第9卷(第5期);第1-11页 * |
基于机器学习的时间序列分析方法研究与应用;贾明珠;《中国优秀硕士学位论文全文数据库》;20210115(第1期);第44-45,47,51,52页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113344279A (zh) | 2021-09-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109754113B (zh) | 基于动态时间规整与长短时间记忆的负荷预测方法 | |
Gao et al. | Interpretable deep learning model for building energy consumption prediction based on attention mechanism | |
CN109063911B (zh) | 一种基于门控循环单元网络的负荷聚合体分组预测方法 | |
CN111260136A (zh) | 一种基于arima-lstm组合模型的楼宇短期负荷预测方法 | |
CN113344279B (zh) | 基于lstm-sam模型和池化的居民负荷预测方法 | |
CN112215428B (zh) | 基于误差修正和模糊逻辑的光伏发电功率预测方法及*** | |
CN111753893A (zh) | 一种基于聚类和深度学习的风电机组功率集群预测方法 | |
CN114970362B (zh) | 一种多能源结构下的电网负荷调度预测方法及*** | |
CN112149890A (zh) | 基于用户用能标签的综合能源负荷预测方法及*** | |
CN113255900A (zh) | 一种考虑改进谱聚类与Bi-LSTM神经网络的冲击性负荷预测方法 | |
CN111563615A (zh) | 一种基于特征分析与组合学习的负荷预测方法 | |
CN112906956A (zh) | 一种联合bim与cim的城市能耗预测方法 | |
CN113052469A (zh) | 一种缺乏量测径流小水电地区的风光水荷互补特性的计算方法 | |
CN113516271A (zh) | 一种基于时空神经网络的风电集群功率日前预测方法 | |
CN113298318A (zh) | 一种新型的配电变压器重过载预测方法 | |
CN104915727B (zh) | 多维度同构异质bp神经网络光功率超短期预测方法 | |
CN115545333A (zh) | 一种多负荷日类型配电网负荷曲线预测方法 | |
CN115374908A (zh) | 适用于配网柔性互联实时控制的短期负荷预测方法和*** | |
CN108694475B (zh) | 基于混合模型的短时间尺度光伏电池发电量预测方法 | |
Johannesen et al. | Comparing recurrent neural networks using principal component analysis for electrical load predictions | |
Rafi et al. | An effective short-term load forecasting methodology using convolutional long short term memory network | |
CN117151770A (zh) | 一种基于注意力机制的lstm碳价预测方法和*** | |
CN115481788B (zh) | 相变储能***负荷预测方法及*** | |
CN116796892A (zh) | 一种基于复合分位数回归的短期电动汽车充电负荷概率预测方法 | |
CN116402194A (zh) | 一种基于混合神经网络的多时间尺度负荷预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |