CN115759393A - 基于集成学习的累积负荷基线预测方法 - Google Patents
基于集成学习的累积负荷基线预测方法 Download PDFInfo
- Publication number
- CN115759393A CN115759393A CN202211426225.4A CN202211426225A CN115759393A CN 115759393 A CN115759393 A CN 115759393A CN 202211426225 A CN202211426225 A CN 202211426225A CN 115759393 A CN115759393 A CN 115759393A
- Authority
- CN
- China
- Prior art keywords
- load
- network model
- cluster
- day
- kth
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于集成学习的累积负荷基线预测方法,包含步骤:S1、基于聚类算法,为M个电力用户生成N种不同的划分方式,共得到多个集群;S2、将集群在一天中的累积负荷、累积负荷基线作为集群在该天的输入特征、标签;基于各集群在不同日期的输入特征,分别建立训练集、验证集、测试集;S3、通过训练集训练网络模型,网络模型根据单天所述多个集群的输入特征,在多个分位点预测各种划分方式下,M个电力用户的累积负荷基线;S4、将验证集中的样本输入训练好的网络模型,基于损失函数,在各分位点,为网络模型预测的N种划分方式下的累积负荷基线分别设置权重系数;S5、基于训练好的网络模型和设置的权重系数,通过测试集检验预测方法的准确性。
Description
技术领域
本发明涉及电力控制技术领域,特别涉及一种基于集成学习的累积负荷基线预测方法。
背景技术
在多种商业模式中,需求响应(DemandResponse,DR)旨在通过价格信号或金融激励来改变消费模式,从而推迟新电力基础设施的建设以满足用电高峰需求。总体而言,居民负荷具有良好的需求响应潜力。根据中国国家能源局的报告,2019年,中国居民用户用电量10.25亿千瓦时,占能源消费总量的14.19%。虽然居民用电的需求响应潜力很大,但单个用户很难单独参与需求响应项目,因此需求响应聚合商(Demand Response Aggregators,DRA)是用户参与DR计划的重要工具。为了定量测量DRA在DR事件中的响应能力,获得它的聚合负荷基线(Aggregated baseline load,ABL)非常重要。因此,研究DRA层面的ABL估计具有重要意义。
虽然对于聚合商的ABL估计和对于用户的累积负荷估计/预测存在一些差异,但累积负荷预测的结果对于ABL估计具有十分重要的参考价值。通常采用完全分解方法、完全聚合方法和基于聚类的方法进行累积负荷预测。对于完全分解的方法,首先单独估计/预测单个用户的负荷;然后,将预测的所有用户的负荷相加以形成最终的累积负荷预测结果。完全聚合方法首先对用户的用电曲线进行汇总,并据此估计/预测用户的累积负荷,它被证明是比完全分解的方法更好的方法。对于基于聚类的方法,首先通过聚类算法将所有用户分为不同的组。然后,分别估计/预测每个组的负载并将所有结果直接相加以形成用户集群的累积负荷预测结果。
目前的研究多针对单一用户进行累积负荷基线的预测。尤其是随着聚合体等市场主体的出现,对用户集群进行累积负荷基线预测的需求更加紧迫。
目前用户集群的累积负荷基线的预测方法往往依赖于对单一用户的预测结果,没有考虑到可以将用户集群按不同的方式进行划分,并将各种划分方式下的累积负荷基线预测结果进行合理组合,可能会带来的预测精度的提高。
发明内容
本发明的目的是提供一种基于集成学习的累积负荷基线预测方法,首先采用聚类算法,通过不同的划分方式将电力用户划分为多个集群,然后在训练阶段通过网络模型预测各种划分方式下的,最后在集成学习阶段,为各种划分方式下预测的累积负荷基线设置权重系数,大大提高了对用户集群预测累积负荷基线的精度。
为了达到上述目的,本发明提供一种基于集成学习的累积负荷基线预测方法,包含步骤:
S2、将集群在一天中的累积负荷、累积负荷基线作为集群在该天的输入特征、标签;基于各集群在第1天第Ntr天、第Ntr+1天第Ntr+Nva天、第Ntr+Nva+1第Ntr+Nva+Ntest天的输入特征,分别建立训练集、验证集、测试集;
S4、将验证集中的样本输入训练好的网络模型,基于损失函数,在各分位点,为网络模型预测的N种划分方式下的累积负荷基线分别设置权值,一个权值对应一种划分方式;
S5、基于训练好的网络模型和步骤S4中设置的权值,通过测试集中的样本预测M个电力用户的累积负荷基线的最终预测结果,并基于损失函数检验所述预测方法的准确性。
可选的步骤S1中:
令为由第i用户一年的负荷曲线组成的矩阵,Xi中的一行对应在一天内的T个时间点采集的用电负荷;第i用户的年平均负荷作为聚类算法的输入,i∈[1,M];通过k-means聚类算法或层次聚类方法,对M个电力用户进行聚类分组。
可选的,通过k-means聚类算法对M个电力用户进行聚类分组时,分组结果满足;
其中,P*为与k-means聚类方法等效的NP-hard优化问题;K为给定集群的数量;pj表示聚类分组得到的第j个集群,j∈[1,K];cj是集群pj的质心,||·||2表示求二范数平方的运算。
可选的,通过层次聚类算法对M个电力用户进行聚类分组,包含步骤:
S11、计算M个电力用户之间的欧几里得距离矩阵,D(i,j)为所述欧几里得距离矩阵中第i行第j列的元素,表示第i用户与第j用户之间的欧几里得距离; 为第j用户的年平均负荷,j∈[1,M];若将第i用户与第j用户划分为同一个簇;
可选的,步骤S2包含:
训练集中的第t个样本XLt为特征向量表示第k种划分方式得到的第j个集群在第t天的累积负荷;agg表示累积,Tr表示训练集,nk,j为第k次聚类分组得到的第j个集群中的电力用户数量;xi,t表示第k种划分方式得到的第j个集群中的第i个电力用户在第t天的用电负荷;
验证集中的第t′-Ntr个样本为特征向量t′∈[Ntr+1,Ntr+Nva],表示第k种划分方式得到的第j个集群在第t′天的累积负荷;Vali表示验证集,xi,t′表示第k种划分方式得到的第j个集群中的第i个电力用户在第t′+Ntr天的用电负荷;
测试集中的第t″-Ntr-Nva个样本为特征向量t″∈[Ntr+Nva+1,Ntr+Nva+Ntest];Test表示测试集,表示第k种划分方式得到的第j个集群在第t″天的累积负荷;xi,t″表示第k种划分方式得到的第j个集群中的第i个电力用户在第t″天的用电负荷;
可选的,步骤S4包含:
S43、构建优化问题以确定权重系数,所述优化问题的数学表达式如下:
ωq为在各种划分方式下得到权重系数的集合;
可选的,步骤S5包含:
可选的,网络模型为用于分位点回归的梯度提升决策树模型。
与现有技术相比,本发明的基于集成学习的累积负荷基线预测方法的有益效果在于:
现有技术中仅对单一用户预测累积负荷基线,没有考虑到可以将用户集群按不同的方式进行划分,并将各种划分方式下的累积负荷基线预测结果进行合理组合,可能会带来的预测精度的提高。
本发明中首先采用聚类算法,通过不同的划分方式将电力用户划分为多个集群,然后在训练阶段通过网络模型预测各种划分方式下的累积负荷基线,最后在集成学习阶段,为各种划分方式下预测的累积负荷基线设置权重系数,大大提高了对用户集群预测累积负荷基线的精度。
附图说明
为了更清楚地说明本发明技术方案,下面将对描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图:
图1为本发明的基于集成学习的累积负荷基线预测方法的流程图;
图2为本发明实施例中,采用不同聚类算法的预测结果在不同分位数的弹球损失排名示意图;
图3为本发明实施例中,不同聚类算法在不同分位数的权重热图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
本发明提供一种基于集成学习的累积负荷基线预测方法,包含步骤:
步骤S1中:
令为由第i用户一年的负荷曲线组成的矩阵,Xi中的一行对应在一天内的T个时间点采集的用电负荷;第i用户的年平均负荷作为聚类算法的输入,i∈[1,M];通过k-means聚类算法或层次聚类方法,对M个电力用户进行聚类分组。
在一个实施例中,通过k-means聚类算法对M个电力用户进行聚类分组时,分组结果满足;
其中,P*为与k-means聚类方法等效的NP-hard优化问题;K为给定集群的数量;pj表示聚类分组得到的第j个集群,j∈[1,K];cj是集群pj的质心,||·||2表示求二范数平方的运算。由于不同的集群的数量会导致不同的划分结果,本实施例中,将簇数设置为2、4和6,以获得3种不同的用户划分方式以用于随后的集成学习过程。
在另一个实施例中,通过层次聚类算法对M个电力用户进行聚类分组,包含步骤:
S11、计算M个电力用户之间的欧几里得距离矩阵,D(i,j)为所述欧几里得距离矩阵中第i行第j列的元素,表示第i用户与第j用户之间的欧几里得距离; 为第j用户的年平均负荷,j∈[1,M];若将第i用户与第j用户划分为同一个簇;
在另一个实施例中,选择集群的数量为1、3、5和7,以获得4种不同的用户划分方式以用于随后的集成学习过程。
S2、将集群在一天中的累积负荷、累积负荷基线作为集群在该天的输入特征、标签;基于各集群在第1天第Ntr天、第Ntr+1天第Ntr+Nva天、第Ntr+Nva+1第Ntr+Nva+Ntest天的输入特征,分别建立训练集、验证集、测试集;
步骤S2包含:
训练集中的第t个样本XLt为特征向量表示第k种划分方式得到的第j个集群在第t天的累积负荷;agg表示累积,Tr表示训练集,nk,j为第k次聚类分组得到的第j个集群中的电力用户数量;xi,t表示第k种划分方式得到的第j个集群中的第i个电力用户在第t天的用电负荷;
验证集中的第t′-Ntr个样本为特征向量t′∈[Ntr+1,Ntr+Nva],表示第k种划分方式得到的第j个集群在第t′天的累积负荷;Vali表示验证集,xi,t′表示第k种划分方式得到的第j个集群中的第i个电力用户在第t′+Ntr天的用电负荷;
测试集中的第t″-Ntr-Nva个样本为特征向量t″∈[Ntr+Nva+1,Ntr+Nva+Ntest];Test表示测试集,表示第k种划分方式得到的第j个集群在第t″天的累积负荷;xi,t″表示第k种划分方式得到的第j个集群中的第i个电力用户在第t″天的用电负荷;
S4、将验证集中的样本输入训练好的网络模型,基于损失函数,在各分位点,为网络模型预测的N种划分方式下的累积负荷基线分别设置权值,一个权值对应一种划分方式;
可选的,步骤S4包含:
S43、构建优化问题以确定权重系数,所述优化问题的数学表达式如下:
ωq为在各种划分方式下得到权重系数的集合;
S5、基于训练好的网络模型和步骤S4中设置的权值,通过测试集中的样本预测M个电力用户的累积负荷基线的最终预测结果,并基于损失函数检验所述预测方法的准确性。
步骤S5包含:
上述步骤中,步骤S3为训练阶段,步骤S4为集成学习阶段,步骤S5为测试检验阶段。
数据描述
本实施例中,用户的智能电表量测数据来自伦敦低碳(Low Carbon London,LCL)提供的智能电表数据集。本发明随机挑选出从2013年1月1日到2013年12月31日,441个接受固定电价用户的每半个小时一次的量测量,此外,将比较方法总结于表1中,其中3-K为基于3个子集群K-means聚类算法得到的估计结果,2-H指基于2个子集群层次聚类算法得到的估计结果,K-E是基于完全聚合的方法、3-K,5-K,7-K得到的集成学习结果,H-E是基于完全聚合的方法、2-H,4-H,6-H得到的集成学习结果.
表1比较方法
预测结果
对于概率估计,基于回归的方法对不同分位数估计的比较如图2所示。结果表明,对于第20和第80分位数,所提出的方法取得了最佳结果。对于第60个分位数,所提出的方法产生了第二好的结果。
此外,对于每个分位数估计,最佳的个体方法是不同的。我们将它们总结在表2中。这表明任何单独的方法都无法始终产生最佳结果。因此,在所有情况下都部署单一算法是不可靠的。相比之下,所提出的方法具有相对稳定的良好性能,可以免去为特定情况选择一种特定算法的努力。
表2不同分位数估计下的最优方法
此外,不同分位数估计的不同模型的权重在图3中可视化。对于每个分位数估计,模型对在验证集上具有更好性能的算法赋予更多权重。
现有技术中仅对单一用户预测累积负荷基线,没有考虑到可以将用户集群按不同的方式进行划分,并将各种划分方式下的累积负荷基线预测结果进行合理组合,可能会带来的预测精度的提高。
本发明中首先采用聚类算法,通过不同的划分方式将电力用户划分为多个集群,然后在训练阶段通过网络模型预测各种划分方式下的,最后在集成学习阶段,为各种划分方式下预测的累积负荷基线设置权重系数,大大提高了对用户集群预测累积负荷基线的精度。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (9)
1.一种基于集成学习的累积负荷基线预测方法,其特征在于,包含步骤:
S4、将验证集中的样本输入训练好的网络模型,基于损失函数,在各分位点,为网络模型预测的N种划分方式下的累积负荷基线分别设置权值,一个权值对应一种划分方式;
S5、基于训练好的网络模型和步骤S4中设置的权值,通过测试集中的样本预测M个电力用户的累积负荷基线的最终预测结果,并基于损失函数检验所述预测方法的准确性。
5.如权利要求1所述的基于集成学习的累积负荷基线预测方法,其特征在于,步骤S2包含:
训练集中的第t个样本XLt为特征向量 表示第k种划分方式得到的第j个集群在第t天的累积负荷;agg表示累积,Tr表示训练集,nk,j为第k次聚类分组得到的第j个集群中的电力用户数量;xi,t表示第k种划分方式得到的第j个集群中的第i个电力用户在第t天的用电负荷;
验证集中的第t′-Ntr个样本为特征向量t′∈[Ntr+1,Ntr+Nva],表示第k种划分方式得到的第j个集群在第t′天的累积负荷;Vali表示验证集,xi,t′表示第k种划分方式得到的第j个集群中的第i个电力用户在第t′+Ntr天的用电负荷;
测试集中的第t″-Ntr-Nva个样本为特征向量t″∈[Ntr+Nva+1,Ntr+Nva+Ntest];Test表示测试集,表示第k种划分方式得到的第j个集群在第t″天的累积负荷;xi,t″表示第k种划分方式得到的第j个集群中的第i个电力用户在第t″天的用电负荷;
7.如权利要求1所述的基于集成学习的累积负荷基线预测方法,其特征在于,步骤S4包含:
S43、构建优化问题以确定权重系数,所述优化问题的数学表达式如下:
其中,ωq为在各种划分方式下得到权重系数的集合;
9.如权利要求1所述的基于集成学习的累积负荷基线预测方法,其特征在于,网络模型为用于分位点回归的梯度提升决策树模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211426225.4A CN115759393A (zh) | 2022-11-14 | 2022-11-14 | 基于集成学习的累积负荷基线预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211426225.4A CN115759393A (zh) | 2022-11-14 | 2022-11-14 | 基于集成学习的累积负荷基线预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115759393A true CN115759393A (zh) | 2023-03-07 |
Family
ID=85371193
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211426225.4A Pending CN115759393A (zh) | 2022-11-14 | 2022-11-14 | 基于集成学习的累积负荷基线预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115759393A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116153437A (zh) * | 2023-04-19 | 2023-05-23 | 乐百氏(广东)饮用水有限公司 | 一种饮用水源的水质安全评价与水质预测方法及*** |
CN116485071A (zh) * | 2023-04-12 | 2023-07-25 | 山东科技大学 | 一种基于概率基线负荷的电力用户需求响应潜力评估方法 |
-
2022
- 2022-11-14 CN CN202211426225.4A patent/CN115759393A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116485071A (zh) * | 2023-04-12 | 2023-07-25 | 山东科技大学 | 一种基于概率基线负荷的电力用户需求响应潜力评估方法 |
CN116153437A (zh) * | 2023-04-19 | 2023-05-23 | 乐百氏(广东)饮用水有限公司 | 一种饮用水源的水质安全评价与水质预测方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110610280B (zh) | 一种电力负荷短期预测方法、模型、装置及*** | |
CN112699913B (zh) | 一种台区户变关系异常诊断方法及装置 | |
Pan et al. | Data-driven estimation of building energy consumption with multi-source heterogeneous data | |
CN108593990B (zh) | 一种基于电能用户用电行为模式的窃电检测方法和应用 | |
Räsänen et al. | Data-based method for creating electricity use load profiles using large amount of customer-specific hourly measured electricity use data | |
CN115759393A (zh) | 基于集成学习的累积负荷基线预测方法 | |
CN104657788B (zh) | 基于行业景气指数的重点行业用电量预测方法 | |
CN109409628A (zh) | 基于计量大数据聚类模型的采集终端生产厂商评价方法 | |
Chen et al. | Day-ahead prediction of hourly subentry energy consumption in the building sector using pattern recognition algorithms | |
Ma et al. | Topology identification of distribution networks using a split-EM based data-driven approach | |
Cheng et al. | Enhanced state estimation and bad data identification in active power distribution networks using photovoltaic power forecasting | |
CN115422788B (zh) | 一种配电网线损分析管理方法、装置、存储介质及*** | |
CN117272850B (zh) | 配电网安全运行调度弹性空间分析方法 | |
CN111177216A (zh) | 综合能源消费者行为特征的关联规则生成方法及装置 | |
CN110796159A (zh) | 基于k-means算法的电力数据分类方法及*** | |
CN111144721A (zh) | 电网项目需求评价模型的构建方法、装置和计算设备 | |
Brusokas et al. | HeatFlex: Machine learning based data-driven flexibility prediction for individual heat pumps | |
CN105488598A (zh) | 一种基于模糊聚类的中长期电力负荷预测方法 | |
KR20160074325A (ko) | 기상변화에 따른 전력수요지수 예측 시스템 및 그 방법 | |
CN112330030B (zh) | 业扩物资需求预测***及方法 | |
WO2002027616A1 (en) | Energy descriptors using artificial intelligence to maximize learning from data patterns | |
CN115907228A (zh) | 一种基于pso-lssvm的短期电力负荷预测分析方法 | |
CN109389281A (zh) | 一种基于高斯混合模型的采集终端生产厂商评价方法 | |
Jiang et al. | SRGM decision model considering cost-reliability | |
JP7458183B2 (ja) | エネルギー需要変動パターンの分類方法及びシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |