CN115759393A - 基于集成学习的累积负荷基线预测方法 - Google Patents

基于集成学习的累积负荷基线预测方法 Download PDF

Info

Publication number
CN115759393A
CN115759393A CN202211426225.4A CN202211426225A CN115759393A CN 115759393 A CN115759393 A CN 115759393A CN 202211426225 A CN202211426225 A CN 202211426225A CN 115759393 A CN115759393 A CN 115759393A
Authority
CN
China
Prior art keywords
load
network model
cluster
day
kth
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211426225.4A
Other languages
English (en)
Inventor
艾芊
张宇帆
黄兴德
陈赟
李昭昱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
State Grid Shanghai Electric Power Co Ltd
Original Assignee
Shanghai Jiaotong University
State Grid Shanghai Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University, State Grid Shanghai Electric Power Co Ltd filed Critical Shanghai Jiaotong University
Priority to CN202211426225.4A priority Critical patent/CN115759393A/zh
Publication of CN115759393A publication Critical patent/CN115759393A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于集成学习的累积负荷基线预测方法,包含步骤:S1、基于聚类算法,为M个电力用户生成N种不同的划分方式,共得到多个集群;S2、将集群在一天中的累积负荷、累积负荷基线作为集群在该天的输入特征、标签;基于各集群在不同日期的输入特征,分别建立训练集、验证集、测试集;S3、通过训练集训练网络模型,网络模型根据单天所述多个集群的输入特征,在多个分位点预测各种划分方式下,M个电力用户的累积负荷基线;S4、将验证集中的样本输入训练好的网络模型,基于损失函数,在各分位点,为网络模型预测的N种划分方式下的累积负荷基线分别设置权重系数;S5、基于训练好的网络模型和设置的权重系数,通过测试集检验预测方法的准确性。

Description

基于集成学习的累积负荷基线预测方法
技术领域
本发明涉及电力控制技术领域,特别涉及一种基于集成学习的累积负荷基线预测方法。
背景技术
在多种商业模式中,需求响应(DemandResponse,DR)旨在通过价格信号或金融激励来改变消费模式,从而推迟新电力基础设施的建设以满足用电高峰需求。总体而言,居民负荷具有良好的需求响应潜力。根据中国国家能源局的报告,2019年,中国居民用户用电量10.25亿千瓦时,占能源消费总量的14.19%。虽然居民用电的需求响应潜力很大,但单个用户很难单独参与需求响应项目,因此需求响应聚合商(Demand Response Aggregators,DRA)是用户参与DR计划的重要工具。为了定量测量DRA在DR事件中的响应能力,获得它的聚合负荷基线(Aggregated baseline load,ABL)非常重要。因此,研究DRA层面的ABL估计具有重要意义。
虽然对于聚合商的ABL估计和对于用户的累积负荷估计/预测存在一些差异,但累积负荷预测的结果对于ABL估计具有十分重要的参考价值。通常采用完全分解方法、完全聚合方法和基于聚类的方法进行累积负荷预测。对于完全分解的方法,首先单独估计/预测单个用户的负荷;然后,将预测的所有用户的负荷相加以形成最终的累积负荷预测结果。完全聚合方法首先对用户的用电曲线进行汇总,并据此估计/预测用户的累积负荷,它被证明是比完全分解的方法更好的方法。对于基于聚类的方法,首先通过聚类算法将所有用户分为不同的组。然后,分别估计/预测每个组的负载并将所有结果直接相加以形成用户集群的累积负荷预测结果。
目前的研究多针对单一用户进行累积负荷基线的预测。尤其是随着聚合体等市场主体的出现,对用户集群进行累积负荷基线预测的需求更加紧迫。
目前用户集群的累积负荷基线的预测方法往往依赖于对单一用户的预测结果,没有考虑到可以将用户集群按不同的方式进行划分,并将各种划分方式下的累积负荷基线预测结果进行合理组合,可能会带来的预测精度的提高。
发明内容
本发明的目的是提供一种基于集成学习的累积负荷基线预测方法,首先采用聚类算法,通过不同的划分方式将电力用户划分为多个集群,然后在训练阶段通过网络模型预测各种划分方式下的,最后在集成学习阶段,为各种划分方式下预测的累积负荷基线设置权重系数,大大提高了对用户集群预测累积负荷基线的精度。
为了达到上述目的,本发明提供一种基于集成学习的累积负荷基线预测方法,包含步骤:
S1、基于聚类算法,根据电力用户一年内的负荷曲线,为M个电力用户生成N种不同的划分方式,共得到
Figure BDA0003942378420000021
个集群;Nk表示通过第k种划分方式得到的集群数量,k∈[1,N],N为设定的常数;
S2、将集群在一天中的累积负荷、累积负荷基线作为集群在该天的输入特征、标签;基于各集群在第1天
Figure BDA0003942378420000024
第Ntr天、第Ntr+1天
Figure BDA0003942378420000025
第Ntr+Nva天、第Ntr+Nva+1
Figure BDA0003942378420000026
第Ntr+Nva+Ntest天的输入特征,分别建立训练集、验证集、测试集;
S3、通过训练集训练网络模型;所述网络模型根据单天
Figure BDA0003942378420000022
个集群的输入特征,在多个分位点预测各种划分方式下,M个电力用户的累积负荷基线;
S4、将验证集中的样本输入训练好的网络模型,基于损失函数,在各分位点,为网络模型预测的N种划分方式下的累积负荷基线分别设置权值,一个权值对应一种划分方式;
S5、基于训练好的网络模型和步骤S4中设置的权值,通过测试集中的样本预测M个电力用户的累积负荷基线的最终预测结果,并基于损失函数检验所述预测方法的准确性。
可选的步骤S1中:
Figure BDA0003942378420000023
为由第i用户一年的负荷曲线组成的矩阵,Xi中的一行对应在一天内的T个时间点采集的用电负荷;第i用户的年平均负荷
Figure BDA0003942378420000031
作为聚类算法的输入,i∈[1,M];通过k-means聚类算法或层次聚类方法,对M个电力用户进行聚类分组。
可选的,通过k-means聚类算法对M个电力用户进行聚类分组时,分组结果满足;
Figure BDA0003942378420000032
其中,P*为与k-means聚类方法等效的NP-hard优化问题;K为给定集群的数量;pj表示聚类分组得到的第j个集群,j∈[1,K];cj是集群pj的质心,||·||2表示求二范数平方的运算。
可选的,通过层次聚类算法对M个电力用户进行聚类分组,包含步骤:
S11、计算M个电力用户之间的欧几里得距离矩阵,D(i,j)为所述欧几里得距离矩阵中第i行第j列的元素,表示第i用户与第j用户之间的欧几里得距离;
Figure BDA0003942378420000033
Figure BDA0003942378420000034
为第j用户的年平均负荷,j∈[1,M];若
Figure BDA0003942378420000035
将第i用户与第j用户划分为同一个簇;
S12、计算任意两个簇之间的距离,记当前的簇数为N′,N′>N1,N1为目标簇数;将与第i1簇的欧几里得距离最小的一个簇与第i1簇合并,
Figure BDA0003942378420000036
更新N′;重复步骤S12,直至N′=N1
可选的,步骤S2包含:
S21、建立训练集
Figure BDA0003942378420000037
训练集包含Ntr个样本,一次向网络模型输入训练集中的一个样本;
训练集中的第t个样本XLt为特征向量
Figure BDA0003942378420000038
表示第k种划分方式得到的第j个集群在第t天的累积负荷;agg表示累积,Tr表示训练集,
Figure BDA0003942378420000039
nk,j为第k次聚类分组得到的第j个集群中的电力用户数量;xi,t表示第k种划分方式得到的第j个集群中的第i个电力用户在第t天的用电负荷;
Figure BDA0003942378420000041
设置标签
Figure BDA0003942378420000042
为与
Figure BDA0003942378420000043
对应的累积负荷基线;
Figure BDA0003942378420000044
yi,t为第k种划分方式得到的第j个集群中的第i个电力用户在第t天的负荷基线;
S22、建立验证集
Figure BDA0003942378420000045
验证集包含Nva个样本,一次向网络模型输入验证集中的一个样本;
验证集中的第t′-Ntr个样本
Figure BDA0003942378420000046
为特征向量
Figure BDA0003942378420000047
t′∈[Ntr+1,Ntr+Nva],
Figure BDA0003942378420000048
表示第k种划分方式得到的第j个集群在第t′天的累积负荷;Vali表示验证集,
Figure BDA0003942378420000049
xi,t′表示第k种划分方式得到的第j个集群中的第i个电力用户在第t′+Ntr天的用电负荷;
Figure BDA00039423784200000410
设置标签
Figure BDA00039423784200000411
为与
Figure BDA00039423784200000412
对应的累积负荷基线;
Figure BDA00039423784200000413
yi,t′为第k种划分方式得到的第j个集群中的第i个电力用户在第t′天的负荷基线;
S23、建立测试集
Figure BDA00039423784200000414
测试集包含Ntest个样本,一次向网络模型输入测试集中的一个样本;
测试集中的第t″-Ntr-Nva个样本
Figure BDA00039423784200000415
为特征向量
Figure BDA00039423784200000416
t″∈[Ntr+Nva+1,Ntr+Nva+Ntest];Test表示测试集,
Figure BDA00039423784200000417
表示第k种划分方式得到的第j个集群在第t″天的累积负荷;
Figure BDA00039423784200000418
xi,t″表示第k种划分方式得到的第j个集群中的第i个电力用户在第t″天的用电负荷;
Figure BDA00039423784200000419
设置标签
Figure BDA00039423784200000420
为与
Figure BDA00039423784200000421
对应的累积负荷基线;
Figure BDA00039423784200000422
yi,t″为第k种划分方式得到的第j个集群中的第i个电力用户在第t″天的负荷基线。
可选的,步骤S3中,网络模型在第q个分位点预测的与
Figure BDA00039423784200000423
对应的累积负荷基线记为
Figure BDA00039423784200000424
q∈[1,Q],Q为设定的分位点的总数;
在第q个分位点,网络模型基于
Figure BDA00039423784200000425
预测的第k种划分方式下的累积负荷基线记为
Figure BDA0003942378420000051
可选的,步骤S4包含:
S41、令
Figure BDA0003942378420000052
表示网络模型基于
Figure BDA0003942378420000053
预测的,第k种划分方式下第j个集群在第q个分位点的累积负荷基线;
Figure BDA0003942378420000054
表示在第q个分位点,网络模型基于
Figure BDA0003942378420000055
预测的第k种划分方式下的累积负荷基线;
Figure BDA0003942378420000056
Figure BDA0003942378420000057
表示为各种划分方式设置权重系数之后,基于测试集,在第q个分位点预测的所有用户的累积负荷基线;
Figure BDA0003942378420000058
ωk,q为与
Figure BDA0003942378420000059
对应的权重系数;
S42、定义弹球损失函数
Figure BDA00039423784200000510
Figure BDA00039423784200000511
其中I{·}是指示函数,
Figure BDA00039423784200000512
表明验证集上对应时间t′的标签;
S43、构建优化问题以确定权重系数,所述优化问题的数学表达式如下:
Figure BDA00039423784200000513
Figure BDA00039423784200000514
Figure BDA00039423784200000515
ωq为在各种划分方式下得到权重系数的集合;
S44、引入辅助决策变量
Figure BDA0003942378420000061
将上述优化问题转化成为线性规划问题,所述线性规划问题的数学表达式如下:
Figure BDA0003942378420000062
Figure BDA0003942378420000063
Figure BDA0003942378420000064
Figure BDA0003942378420000065
可选的,步骤S5包含:
步骤S51、将验证集的样本输入训练好的网络模型;令
Figure BDA0003942378420000066
表示网络模型基于
Figure BDA0003942378420000067
预测的,第k种划分方式下的第j个集群在第q个分位点的累积负荷基线;
Figure BDA0003942378420000068
表示在第q个分位点,网络模型基于
Figure BDA0003942378420000069
预测的第k种划分方式下的累积负荷基线;
Figure BDA00039423784200000610
Figure BDA00039423784200000611
表示采用步骤S4中确定的权重系数之后,在第q个分位点,基于
Figure BDA00039423784200000612
预测的所有用户的累积负荷基线;
Figure BDA00039423784200000613
S52、基于弹球损失函数检验
Figure BDA00039423784200000614
的准确性。
可选的,网络模型为用于分位点回归的梯度提升决策树模型。
与现有技术相比,本发明的基于集成学习的累积负荷基线预测方法的有益效果在于:
现有技术中仅对单一用户预测累积负荷基线,没有考虑到可以将用户集群按不同的方式进行划分,并将各种划分方式下的累积负荷基线预测结果进行合理组合,可能会带来的预测精度的提高。
本发明中首先采用聚类算法,通过不同的划分方式将电力用户划分为多个集群,然后在训练阶段通过网络模型预测各种划分方式下的累积负荷基线,最后在集成学习阶段,为各种划分方式下预测的累积负荷基线设置权重系数,大大提高了对用户集群预测累积负荷基线的精度。
附图说明
为了更清楚地说明本发明技术方案,下面将对描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图:
图1为本发明的基于集成学习的累积负荷基线预测方法的流程图;
图2为本发明实施例中,采用不同聚类算法的预测结果在不同分位数的弹球损失排名示意图;
图3为本发明实施例中,不同聚类算法在不同分位数的权重热图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
本发明提供一种基于集成学习的累积负荷基线预测方法,包含步骤:
S1、基于聚类算法,根据电力用户一年内的负荷曲线,为M个电力用户生成N种不同的划分方式,共得到
Figure BDA0003942378420000081
个集群;Nk表示通过第k种划分方式得到的集群数量,k∈[1,N],N为设定的常数;
步骤S1中:
Figure BDA0003942378420000082
为由第i用户一年的负荷曲线组成的矩阵,Xi中的一行对应在一天内的T个时间点采集的用电负荷;第i用户的年平均负荷
Figure BDA0003942378420000083
作为聚类算法的输入,i∈[1,M];通过k-means聚类算法或层次聚类方法,对M个电力用户进行聚类分组。
在一个实施例中,通过k-means聚类算法对M个电力用户进行聚类分组时,分组结果满足;
Figure BDA0003942378420000084
其中,P*为与k-means聚类方法等效的NP-hard优化问题;K为给定集群的数量;pj表示聚类分组得到的第j个集群,j∈[1,K];cj是集群pj的质心,||·||2表示求二范数平方的运算。由于不同的集群的数量会导致不同的划分结果,本实施例中,将簇数设置为2、4和6,以获得3种不同的用户划分方式以用于随后的集成学习过程。
在另一个实施例中,通过层次聚类算法对M个电力用户进行聚类分组,包含步骤:
S11、计算M个电力用户之间的欧几里得距离矩阵,D(i,j)为所述欧几里得距离矩阵中第i行第j列的元素,表示第i用户与第j用户之间的欧几里得距离;
Figure BDA0003942378420000091
Figure BDA0003942378420000092
为第j用户的年平均负荷,j∈[1,M];若
Figure BDA0003942378420000093
将第i用户与第j用户划分为同一个簇;
S12、计算任意两个簇之间的距离,记当前的簇数为N′,N′>N1,N1为目标簇数;将与第i1簇的欧几里得距离最小的一个簇与第i1簇合并,
Figure BDA0003942378420000094
更新N′;重复步骤S12,直至N′=N1
在另一个实施例中,选择集群的数量为1、3、5和7,以获得4种不同的用户划分方式以用于随后的集成学习过程。
S2、将集群在一天中的累积负荷、累积负荷基线作为集群在该天的输入特征、标签;基于各集群在第1天
Figure BDA00039423784200000912
第Ntr天、第Ntr+1天
Figure BDA00039423784200000913
第Ntr+Nva天、第Ntr+Nva+1
Figure BDA00039423784200000914
第Ntr+Nva+Ntest天的输入特征,分别建立训练集、验证集、测试集;
步骤S2包含:
S21、建立训练集
Figure BDA0003942378420000095
训练集包含Ntr个样本,一次向网络模型输入训练集中的一个样本;本发明中使用的网络模型为用于分位点回归的梯度提升决策树模型。
训练集中的第t个样本XLt为特征向量
Figure BDA0003942378420000096
表示第k种划分方式得到的第j个集群在第t天的累积负荷;agg表示累积,Tr表示训练集,
Figure BDA0003942378420000097
nk,j为第k次聚类分组得到的第j个集群中的电力用户数量;xi,t表示第k种划分方式得到的第j个集群中的第i个电力用户在第t天的用电负荷;
Figure BDA0003942378420000098
设置标签
Figure BDA0003942378420000099
为与
Figure BDA00039423784200000910
对应的累积负荷基线;
Figure BDA00039423784200000911
yi,t为第k种划分方式得到的第j个集群中的第i个电力用户在第t天的负荷基线;
S22、建立验证集
Figure BDA0003942378420000101
验证集包含Nva个样本,一次向网络模型输入验证集中的一个样本;
验证集中的第t′-Ntr个样本
Figure BDA0003942378420000102
为特征向量
Figure BDA0003942378420000103
t′∈[Ntr+1,Ntr+Nva],
Figure BDA0003942378420000104
表示第k种划分方式得到的第j个集群在第t′天的累积负荷;Vali表示验证集,
Figure BDA0003942378420000105
xi,t′表示第k种划分方式得到的第j个集群中的第i个电力用户在第t′+Ntr天的用电负荷;
Figure BDA0003942378420000106
设置标签
Figure BDA0003942378420000107
为与
Figure BDA0003942378420000108
对应的累积负荷基线;
Figure BDA0003942378420000109
yi,t′为第k种划分方式得到的第j个集群中的第i个电力用户在第t′天的负荷基线;
S23、建立测试集
Figure BDA00039423784200001010
测试集包含Ntest个样本,一次向网络模型输入测试集中的一个样本;
测试集中的第t″-Ntr-Nva个样本
Figure BDA00039423784200001011
为特征向量
Figure BDA00039423784200001012
t″∈[Ntr+Nva+1,Ntr+Nva+Ntest];Test表示测试集,
Figure BDA00039423784200001013
表示第k种划分方式得到的第j个集群在第t″天的累积负荷;
Figure BDA00039423784200001014
xi,t″表示第k种划分方式得到的第j个集群中的第i个电力用户在第t″天的用电负荷;
Figure BDA00039423784200001015
设置标签
Figure BDA00039423784200001016
为与
Figure BDA00039423784200001017
对应的累积负荷基线;
Figure BDA00039423784200001018
yi,t″为第k种划分方式得到的第j个集群中的第i个电力用户在第t″天的负荷基线。
S3、通过训练集训练网络模型;所述网络模型根据单天
Figure BDA00039423784200001019
个集群的输入特征,在多个分位点预测各种划分方式下,M个电力用户的累积负荷基线;
步骤S3中,网络模型在第q个分位点预测的与
Figure BDA00039423784200001020
对应的累积负荷基线记为
Figure BDA00039423784200001022
q∈[1,Q],Q为设定的分位点的总数;
在第q个分位点,网络模型基于
Figure BDA00039423784200001021
预测的第k种划分方式下的累积负荷基线记为
Figure BDA0003942378420000111
Figure BDA0003942378420000112
S4、将验证集中的样本输入训练好的网络模型,基于损失函数,在各分位点,为网络模型预测的N种划分方式下的累积负荷基线分别设置权值,一个权值对应一种划分方式;
可选的,步骤S4包含:
S41、令
Figure BDA0003942378420000113
表示网络模型基于
Figure BDA0003942378420000114
预测的,第k种划分方式下第j个集群在第q个分位点的累积负荷基线;
Figure BDA0003942378420000115
表示在第q个分位点,网络模型基于
Figure BDA0003942378420000116
预测的第k种划分方式下的累积负荷基线;
Figure BDA0003942378420000117
Figure BDA0003942378420000118
表示为各种划分方式设置权重系数之后,基于测试集,在第q个分位点预测的所有用户的累积负荷基线;
Figure BDA0003942378420000119
ωk,q为与
Figure BDA00039423784200001110
对应的权重系数;
S42、定义弹球损失函数
Figure BDA00039423784200001111
Figure BDA00039423784200001112
其中I{·}是指示函数,
Figure BDA00039423784200001113
表明验证集上对应时间t′的标签;
S43、构建优化问题以确定权重系数,所述优化问题的数学表达式如下:
Figure BDA0003942378420000121
Figure BDA0003942378420000122
Figure BDA0003942378420000123
ωq为在各种划分方式下得到权重系数的集合;
S44、引入辅助决策变量
Figure BDA0003942378420000124
将上述优化问题转化成为线性规划问题,所述线性规划问题的数学表达式如下:
Figure BDA0003942378420000125
Figure BDA0003942378420000126
Figure BDA0003942378420000127
Figure BDA0003942378420000128
S5、基于训练好的网络模型和步骤S4中设置的权值,通过测试集中的样本预测M个电力用户的累积负荷基线的最终预测结果,并基于损失函数检验所述预测方法的准确性。
步骤S5包含:
步骤S51、将验证集的样本输入训练好的网络模型;令
Figure BDA0003942378420000129
表示网络模型基于
Figure BDA00039423784200001210
预测的,第k种划分方式下的第j个集群在第q个分位点的累积负荷基线;
Figure BDA00039423784200001211
表示在第q个分位点,网络模型基于
Figure BDA00039423784200001212
预测的第k种划分方式下的累积负荷基线;
Figure BDA00039423784200001213
Figure BDA00039423784200001214
表示采用步骤S4中确定的权重系数之后,在第q个分位点,基于
Figure BDA00039423784200001215
预测的所有用户的累积负荷基线;
Figure BDA0003942378420000131
S52、基于弹球损失函数检验
Figure BDA0003942378420000132
的准确性。
上述步骤中,步骤S3为训练阶段,步骤S4为集成学习阶段,步骤S5为测试检验阶段。
数据描述
本实施例中,用户的智能电表量测数据来自伦敦低碳(Low Carbon London,LCL)提供的智能电表数据集。本发明随机挑选出从2013年1月1日到2013年12月31日,441个接受固定电价用户的每半个小时一次的量测量,此外,将比较方法总结于表1中,其中3-K为基于3个子集群K-means聚类算法得到的估计结果,2-H指基于2个子集群层次聚类算法得到的估计结果,K-E是基于完全聚合的方法、3-K,5-K,7-K得到的集成学习结果,H-E是基于完全聚合的方法、2-H,4-H,6-H得到的集成学习结果.
表1比较方法
Figure BDA0003942378420000133
预测结果
对于概率估计,基于回归的方法对不同分位数估计的比较如图2所示。结果表明,对于第20和第80分位数,所提出的方法取得了最佳结果。对于第60个分位数,所提出的方法产生了第二好的结果。
此外,对于每个分位数估计,最佳的个体方法是不同的。我们将它们总结在表2中。这表明任何单独的方法都无法始终产生最佳结果。因此,在所有情况下都部署单一算法是不可靠的。相比之下,所提出的方法具有相对稳定的良好性能,可以免去为特定情况选择一种特定算法的努力。
表2不同分位数估计下的最优方法
Figure BDA0003942378420000134
此外,不同分位数估计的不同模型的权重在图3中可视化。对于每个分位数估计,模型对在验证集上具有更好性能的算法赋予更多权重。
现有技术中仅对单一用户预测累积负荷基线,没有考虑到可以将用户集群按不同的方式进行划分,并将各种划分方式下的累积负荷基线预测结果进行合理组合,可能会带来的预测精度的提高。
本发明中首先采用聚类算法,通过不同的划分方式将电力用户划分为多个集群,然后在训练阶段通过网络模型预测各种划分方式下的,最后在集成学习阶段,为各种划分方式下预测的累积负荷基线设置权重系数,大大提高了对用户集群预测累积负荷基线的精度。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (9)

1.一种基于集成学习的累积负荷基线预测方法,其特征在于,包含步骤:
S1、基于聚类算法,根据电力用户一年内的负荷曲线,为M个电力用户生成N种不同的划分方式,共得到
Figure FDA0003942378410000011
个集群;Nk表示通过第k种划分方式得到的集群数量,k∈[1,N],N为设定的常数;
S2、将集群在一天中的累积负荷、累积负荷基线作为集群在该天的输入特征、标签;基于各集群在
Figure FDA0003942378410000012
Figure FDA0003942378410000013
Figure FDA0003942378410000014
Figure FDA0003942378410000015
的输入特征,分别建立训练集、验证集、测试集;
S3、通过训练集训练网络模型;所述网络模型根据单天
Figure FDA0003942378410000016
个集群的输入特征,在多个分位点预测各种划分方式下,M个电力用户的累积负荷基线;
S4、将验证集中的样本输入训练好的网络模型,基于损失函数,在各分位点,为网络模型预测的N种划分方式下的累积负荷基线分别设置权值,一个权值对应一种划分方式;
S5、基于训练好的网络模型和步骤S4中设置的权值,通过测试集中的样本预测M个电力用户的累积负荷基线的最终预测结果,并基于损失函数检验所述预测方法的准确性。
2.如权利要求1所述的基于集成学习的累积负荷基线预测方法,其特征在于,步骤S1中:
Figure FDA0003942378410000017
为由第i用户一年的负荷曲线组成的矩阵,Xi中的一行对应在一天内的T个时间点采集的用电负荷;第i用户的年平均负荷
Figure FDA0003942378410000018
作为聚类算法的输入,i∈[1,M];通过k-means聚类算法或层次聚类方法,对M个电力用户进行聚类分组。
3.如权利要求2所述的基于集成学习的累积负荷基线预测方法,其特征在于,通过k-means聚类算法对M个电力用户进行聚类分组时,分组结果满足;
Figure FDA0003942378410000019
其中,P*为与k-means聚类方法等效的NP-hard优化问题;K为给定集群的数量;pj表示聚类分组得到的第j个集群,j∈[1,K];cj是集群pj的质心,||·||2表示求二范数平方的运算。
4.如权利要求2所述的基于集成学习的累积负荷基线预测方法,其特征在于,通过层次聚类算法对M个电力用户进行聚类分组,包含步骤:
S11、计算M个电力用户之间的欧几里得距离矩阵,D(i,j)为所述欧几里得距离矩阵中第i行第j列的元素,表示第i用户与第j用户之间的欧几里得距离;
Figure FDA0003942378410000021
Figure FDA0003942378410000022
为第j用户的年平均负荷,j∈[1,M];若
Figure FDA0003942378410000023
将第i用户与第j用户划分为同一个簇;
S12、计算任意两个簇之间的距离,记当前的簇数为N′,N′>N1,N1为目标簇数;将与第i1簇的欧几里得距离最小的一个簇与第i1簇合并,
Figure FDA00039423784100000214
更新N′;重复步骤S12,直至N′=N1
5.如权利要求1所述的基于集成学习的累积负荷基线预测方法,其特征在于,步骤S2包含:
S21、建立训练集
Figure FDA0003942378410000024
训练集包含Ntr个样本,一次向网络模型输入训练集中的一个样本;
训练集中的第t个样本XLt为特征向量
Figure FDA0003942378410000025
Figure FDA0003942378410000026
表示第k种划分方式得到的第j个集群在第t天的累积负荷;agg表示累积,Tr表示训练集,
Figure FDA0003942378410000027
nk,j为第k次聚类分组得到的第j个集群中的电力用户数量;xi,t表示第k种划分方式得到的第j个集群中的第i个电力用户在第t天的用电负荷;
Figure FDA0003942378410000028
设置标签
Figure FDA0003942378410000029
Figure FDA00039423784100000210
为与
Figure FDA00039423784100000211
对应的累积负荷基线;
Figure FDA00039423784100000212
yi,t为第k种划分方式得到的第j个集群中的第i个电力用户在第t天的负荷基线;
S22、建立验证集
Figure FDA00039423784100000213
验证集包含Nva个样本,一次向网络模型输入验证集中的一个样本;
验证集中的第t′-Ntr个样本
Figure FDA00039423784100000324
为特征向量
Figure FDA0003942378410000031
t′∈[Ntr+1,Ntr+Nva],
Figure FDA0003942378410000032
表示第k种划分方式得到的第j个集群在第t′天的累积负荷;Vali表示验证集,
Figure FDA0003942378410000033
xi,t′表示第k种划分方式得到的第j个集群中的第i个电力用户在第t′+Ntr天的用电负荷;
Figure FDA0003942378410000034
设置标签
Figure FDA0003942378410000035
Figure FDA0003942378410000036
为与
Figure FDA0003942378410000037
对应的累积负荷基线;
Figure FDA0003942378410000038
yi,t′为第k种划分方式得到的第j个集群中的第i个电力用户在第t′天的负荷基线;
S23、建立测试集
Figure FDA0003942378410000039
测试集包含Ntest个样本,一次向网络模型输入测试集中的一个样本;
测试集中的第t″-Ntr-Nva个样本
Figure FDA00039423784100000310
为特征向量
Figure FDA00039423784100000311
t″∈[Ntr+Nva+1,Ntr+Nva+Ntest];Test表示测试集,
Figure FDA00039423784100000312
表示第k种划分方式得到的第j个集群在第t″天的累积负荷;
Figure FDA00039423784100000313
xi,t″表示第k种划分方式得到的第j个集群中的第i个电力用户在第t″天的用电负荷;
Figure FDA00039423784100000314
设置标签
Figure FDA00039423784100000315
Figure FDA00039423784100000316
为与
Figure FDA00039423784100000317
对应的累积负荷基线;
Figure FDA00039423784100000318
yi,t″为第k种划分方式得到的第j个集群中的第i个电力用户在第t″天的负荷基线。
6.如权利要求5所述的基于集成学习的累积负荷基线预测方法,其特征在于,步骤S3中,网络模型在第q个分位点预测的与
Figure FDA00039423784100000319
对应的累积负荷基线记为
Figure FDA00039423784100000320
q∈[1,Q],Q为设定的分位点的总数;
在第q个分位点,网络模型基于
Figure FDA00039423784100000321
预测的第k种划分方式下的累积负荷基线记为
Figure FDA00039423784100000322
Figure FDA00039423784100000323
7.如权利要求1所述的基于集成学习的累积负荷基线预测方法,其特征在于,步骤S4包含:
S41、令
Figure FDA0003942378410000041
表示网络模型基于
Figure FDA0003942378410000042
预测的,第k种划分方式下第j个集群在第q个分位点的累积负荷基线;
Figure FDA0003942378410000043
表示在第q个分位点,网络模型基于
Figure FDA0003942378410000044
预测的第k种划分方式下的累积负荷基线;
Figure FDA0003942378410000045
Figure FDA0003942378410000046
表示为各种划分方式设置权重系数之后,基于测试集,在第q个分位点预测的所有用户的累积负荷基线;
Figure FDA0003942378410000047
ωk,q为与
Figure FDA0003942378410000048
对应的权重系数;
S42、定义弹球损失函数
Figure FDA0003942378410000049
Figure FDA00039423784100000410
其中I{·}是指示函数,
Figure FDA00039423784100000411
表明验证集上对应时间t′的标签;
S43、构建优化问题以确定权重系数,所述优化问题的数学表达式如下:
Figure FDA00039423784100000412
Figure FDA00039423784100000413
Figure FDA00039423784100000414
其中,ωq为在各种划分方式下得到权重系数的集合;
S44、引入辅助决策变量
Figure FDA00039423784100000415
将上述优化问题转化成为线性规划问题,所述线性规划问题的数学表达式如下:
Figure FDA0003942378410000051
Figure FDA0003942378410000052
Figure FDA0003942378410000053
Figure FDA0003942378410000054
8.如权利要求7所述的基于集成学习的累积负荷基线预测方法,其特征在于,步骤S5包含:
步骤S51、将验证集的样本输入训练好的网络模型;令
Figure FDA0003942378410000055
表示网络模型基于
Figure FDA0003942378410000056
预测的,第k种划分方式下的第j个集群在第q个分位点的累积负荷基线;
Figure FDA0003942378410000057
表示在第q个分位点,网络模型基于
Figure FDA0003942378410000058
预测的第k种划分方式下的累积负荷基线;
Figure FDA0003942378410000059
Figure FDA00039423784100000510
表示采用步骤S4中确定的权重系数之后,在第q个分位点,基于
Figure FDA00039423784100000511
预测的所有用户的累积负荷基线;
Figure FDA00039423784100000512
S52、基于弹球损失函数检验
Figure FDA00039423784100000513
的准确性。
9.如权利要求1所述的基于集成学习的累积负荷基线预测方法,其特征在于,网络模型为用于分位点回归的梯度提升决策树模型。
CN202211426225.4A 2022-11-14 2022-11-14 基于集成学习的累积负荷基线预测方法 Pending CN115759393A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211426225.4A CN115759393A (zh) 2022-11-14 2022-11-14 基于集成学习的累积负荷基线预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211426225.4A CN115759393A (zh) 2022-11-14 2022-11-14 基于集成学习的累积负荷基线预测方法

Publications (1)

Publication Number Publication Date
CN115759393A true CN115759393A (zh) 2023-03-07

Family

ID=85371193

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211426225.4A Pending CN115759393A (zh) 2022-11-14 2022-11-14 基于集成学习的累积负荷基线预测方法

Country Status (1)

Country Link
CN (1) CN115759393A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116153437A (zh) * 2023-04-19 2023-05-23 乐百氏(广东)饮用水有限公司 一种饮用水源的水质安全评价与水质预测方法及***
CN116485071A (zh) * 2023-04-12 2023-07-25 山东科技大学 一种基于概率基线负荷的电力用户需求响应潜力评估方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116485071A (zh) * 2023-04-12 2023-07-25 山东科技大学 一种基于概率基线负荷的电力用户需求响应潜力评估方法
CN116153437A (zh) * 2023-04-19 2023-05-23 乐百氏(广东)饮用水有限公司 一种饮用水源的水质安全评价与水质预测方法及***

Similar Documents

Publication Publication Date Title
CN110610280B (zh) 一种电力负荷短期预测方法、模型、装置及***
CN112699913B (zh) 一种台区户变关系异常诊断方法及装置
Pan et al. Data-driven estimation of building energy consumption with multi-source heterogeneous data
CN108593990B (zh) 一种基于电能用户用电行为模式的窃电检测方法和应用
Räsänen et al. Data-based method for creating electricity use load profiles using large amount of customer-specific hourly measured electricity use data
CN115759393A (zh) 基于集成学习的累积负荷基线预测方法
CN104657788B (zh) 基于行业景气指数的重点行业用电量预测方法
CN109409628A (zh) 基于计量大数据聚类模型的采集终端生产厂商评价方法
Chen et al. Day-ahead prediction of hourly subentry energy consumption in the building sector using pattern recognition algorithms
Ma et al. Topology identification of distribution networks using a split-EM based data-driven approach
Cheng et al. Enhanced state estimation and bad data identification in active power distribution networks using photovoltaic power forecasting
CN115422788B (zh) 一种配电网线损分析管理方法、装置、存储介质及***
CN117272850B (zh) 配电网安全运行调度弹性空间分析方法
CN111177216A (zh) 综合能源消费者行为特征的关联规则生成方法及装置
CN110796159A (zh) 基于k-means算法的电力数据分类方法及***
CN111144721A (zh) 电网项目需求评价模型的构建方法、装置和计算设备
Brusokas et al. HeatFlex: Machine learning based data-driven flexibility prediction for individual heat pumps
CN105488598A (zh) 一种基于模糊聚类的中长期电力负荷预测方法
KR20160074325A (ko) 기상변화에 따른 전력수요지수 예측 시스템 및 그 방법
CN112330030B (zh) 业扩物资需求预测***及方法
WO2002027616A1 (en) Energy descriptors using artificial intelligence to maximize learning from data patterns
CN115907228A (zh) 一种基于pso-lssvm的短期电力负荷预测分析方法
CN109389281A (zh) 一种基于高斯混合模型的采集终端生产厂商评价方法
Jiang et al. SRGM decision model considering cost-reliability
JP7458183B2 (ja) エネルギー需要変動パターンの分類方法及びシステム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination