CN116108974A - 一种考虑气象因素的需求响应基线负荷预测方法及装置 - Google Patents

一种考虑气象因素的需求响应基线负荷预测方法及装置 Download PDF

Info

Publication number
CN116108974A
CN116108974A CN202211683644.6A CN202211683644A CN116108974A CN 116108974 A CN116108974 A CN 116108974A CN 202211683644 A CN202211683644 A CN 202211683644A CN 116108974 A CN116108974 A CN 116108974A
Authority
CN
China
Prior art keywords
data
load
historical
baseline
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211683644.6A
Other languages
English (en)
Inventor
郭明星
王素
王晓晖
蓝国卉
吕冉
刘盼盼
刘莹
刘川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Smart Grid Research Institute Co ltd
State Grid Shanghai Electric Power Co Ltd
Original Assignee
State Grid Smart Grid Research Institute Co ltd
State Grid Shanghai Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Smart Grid Research Institute Co ltd, State Grid Shanghai Electric Power Co Ltd filed Critical State Grid Smart Grid Research Institute Co ltd
Priority to CN202211683644.6A priority Critical patent/CN116108974A/zh
Publication of CN116108974A publication Critical patent/CN116108974A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/003Load forecast, e.g. methods or systems for forecasting future load demand
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Power Engineering (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种考虑气象因素的需求响应基线负荷预测方法及装置,该方法包括:获取历史负荷数据;基于历史负荷数据构建的树森林确定历史负荷数据中的异常数据;基于KNN算法对历史负荷数据中将异常数据删除后的缺失数据进行填补;基于主成分分析法确定与基线负荷预测相关的气象因素中的主要气象因素;基于采用填补后的历史负荷数据以及主要气象因素数据构建的模型进行基线负荷预测。通过构建的树森林以及KNN算法实现了对异常数据的识别和缺失数据的填补;同时考虑气象因素对负荷预测的影响,使得最终获得的基线负荷预测结果更准确,运用主成分分析法分析出气象因素中贡献率较大的因素,避免了考虑所有气象因素导致算法计算速度慢的缺陷。

Description

一种考虑气象因素的需求响应基线负荷预测方法及装置
技术领域
本发明涉及负荷预测技术领域,具体涉及一种考虑气象因素的需求响应基线负荷预测方法及装置。
背景技术
用户基线负荷是用户参与需求响应项目执行效果的重要参考,受到负荷环境、用户用电行为习惯等多种因素的影响。基线负荷为定量评价用户负荷削减程度提供了数据参考,是需求响应实施机构对客户实行奖惩的依据,是评价需求响应项目实施效果的衡量指标。但需求响应实施机构只能获得用户在需求响应后的负荷数据,无法获得用户在其不进行需求响应下的基线负荷数据,因而无法得知用户具体的需求响应量。
准确的基线负荷估计对于激励型需求响应的实施非常重要,因为它直接影响需求响应实施者和参与者双方的经济利益。在激励型需求响应中,需要估计两种不同空间层级的基线负荷:个体和集群。个体层级的基线负荷是指单个用户的基线负荷,其估计结果主要用于负荷聚合商与需求响应参与者之间的补偿金结算;集群基线负荷(aggregatedbaseline load,ABL)是指负荷聚合商代理的所有CBL(用户基线负荷,customerbaselineload,)之和,其估计结果既是***运营商与负荷聚合商之间结算的依据,又是量化整个需求响应项目实施效果的基础。
传统的需求响应基线负荷预测方法一般是通过对样本负荷数据进行处理而获得预测的数据依据,如采用典型比例因子修正法来选取样本负荷数据、基于时间序列和卡尔曼滤波组合的负荷预测方法,预测时考虑的因素不够全面。即目前在进行需求响应基线负荷预测时,未考虑气象因素对负荷中可调负荷的影响,仅仅通过历史负荷数据对基线负荷进行预测,导致最终获得的基线负荷的精度不够高。
发明内容
有鉴于此,本发明实施例提供了涉及一种考虑气象因素的需求响应基线负荷预测方法及装置,以解决现有技术中基线负荷的精度不高的技术问题。
本发明提出的技术方案如下:
本发明实施例第一方面提供一种考虑气象因素的需求响应基线负荷预测方法,包括:获取历史负荷数据;基于所述历史负荷数据构建的树森林确定所述历史负荷数据中的异常数据;基于KNN算法对所述历史负荷数据中将异常数据删除后的缺失数据进行填补;基于主成分分析法确定与基线负荷预测相关的气象因素中的主要气象因素;基于采用填补后的历史负荷数据以及主要气象因素数据构建的模型进行基线负荷预测。
可选地,基于所述历史负荷数据构建的树森林确定所述历史负荷数据中的异常数据,包括:基于所述历史负荷数据以及所述历史负荷数据与预设切割点数值的关系确定树森林的根节点和叶节点;计算每个历史负荷数据在树森林中每棵树的高度;基于所有高度的平均值以及预设切割点数据计算每个历史负荷数据的异常评分;基于异常评分确定所述历史负荷数据是否为异常数据。
可选地,基于所述历史负荷数据以及所述历史负荷数据与预设切割点数值的关系确定树森林的根节点和叶节点,包括:将历史负荷数据中的样本数据作为树森林中每棵树的根节点;基于样本数据中任一维度数据与预设切割点数值的大小关系将任一维度数据置于左叶节点或右叶节点;当树森林中每棵树满足预设条件时停止生成新的叶节点。
可选地,基于KNN算法对所述历史负荷数据中将异常数据删除后的缺失数据进行填补,包括:将确定的异常数据删除,生成缺失数据;基于历史负荷数据构建的数据集矩阵计算每个缺失数据的欧式距离;基于所述欧式距离选取的k近邻数据以及其权重计算缺失数据的替代值进行填补。
可选地,基于主成分分析法确定与基线负荷预测相关的气象因素中的主要气象因素,包括:将与基线负荷预测相关的气象因素数据进行标准化处理;计算标准化处理后的气象因素数据的特征值和特征向量;基于采用特征向量计算的主成分得分以及采用特征值计算的累计贡献率确定主要气象因素。
可选地,基于采用填补后的历史负荷数据以及主要气象因素数据构建的模型进行基线负荷预测,包括:对填补后的历史负荷数据解耦得到不可调负荷数据、不包含空调负荷的可调负荷数据以及可调负荷数据;采用不可调负荷数据、不包含空调负荷的可调负荷数据、可调负荷数据以及主要气象因素数据构建的模型进行基线负荷预测。
可选地,采用不可调负荷数据、不包含空调负荷的可调负荷数据、可调负荷数据以及主要气象因素数据构建的模型进行基线负荷预测,包括:采用历史负荷中总负荷数据、不包含空调负荷的可调负荷数据以及主要气象因素数据作为输入、不可调负荷与空调负荷之和所占总负荷比例作为输出构建比例预测模型;采用不可调负荷、空调负荷以及主要气象因素数据作为输入、不可调负荷和空调负荷的基线负荷值作为输出构建负荷预测模型;基于所述负荷预测模型预测的基线负荷以及比例预测模型预测的比例的比值确定总基线负荷。
本发明实施例第二方面提供一种考虑气象因素的需求响应基线负荷预测装置,包括:数据获取模块,用于获取历史负荷数据;异常数据判断模块,用于基于所述历史负荷数据构建的树森林确定所述历史负荷数据中的异常数据;填补模块,用于基于KNN算法对所述历史负荷数据中将异常数据删除后的缺失数据进行填补;主成分分析模块,用于基于主成分分析法确定与基线负荷预测相关的气象因素中的主要气象因素;预测模块,用于基于采用填补后的历史负荷数据以及主要气象因素数据构建的模型进行基线负荷预测。
本发明实施例第三方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行如本发明实施例第一方面及第一方面任一项所述的考虑气象因素的需求响应基线负荷预测方法。
本发明实施例第四方面提供一种电子设备,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行如本发明实施例第一方面及第一方面任一项所述的考虑气象因素的需求响应基线负荷预测方法。
本发明提供的技术方案,具有如下效果:
本发明实施例提供的考虑气象因素的需求响应基线负荷预测方法及装置,通过获取历史负荷数据;基于历史负荷数据构建的树森林确定历史负荷数据中的异常数据;基于KNN算法对历史负荷数据中将异常数据删除后的缺失数据进行填补;基于主成分分析法确定与基线负荷预测相关的气象因素中的主要气象因素;基于采用填补后的历史负荷数据以及主要气象因素数据构建的模型进行基线负荷预测。由此,通过构建的树森林以及KNN算法实现了对异常数据的识别和填补,使得后续预测结果更加准确;同时在进行需求响应基线负荷预测的过程中考虑气象因素对负荷预测的影响,使得最终获得的基线负荷预测结果更准确,另外运用主成分分析法分析出影响负荷预测的气象因素中贡献率较大的因素,避免了考虑所有气象因素导致算法计算速度慢的缺陷。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的考虑气象因素的需求响应基线负荷预测方法的流程图;
图2是根据本发明实施例的气象指标主成分贡献率示意图;
图3是根据本发明另一实施例的考虑气象因素的需求响应基线负荷预测方法的流程图;
图4是根据本发明实施例的考虑气象因素的需求响应基线负荷预测装置的结构框图;
图5是根据本发明实施例提供的计算机可读存储介质的结构示意图;
图6是根据本发明实施例提供的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例,提供了一种考虑气象因素的需求响应基线负荷预测方法,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在本实施例中提供了一种考虑气象因素的需求响应基线负荷预测方法,可用于电子设备,如电脑、手机、平板电脑等,图1是根据本发明实施例考虑气象因素的需求响应基线负荷预测方法的流程图,如图1所示,该方法包括如下步骤:
步骤S101:获取历史负荷数据。具体地,当需要对商业楼宇进行基线负荷预测时,历史负荷数据可以是获取的参与需求响应的商业楼宇用户的历史负荷数据,在获取数据时,可以直接从对应商业楼宇用户的负荷数据库中直接获取。例如,获取的历史负荷数据可以包括多天的负荷数据,作为样本数据,每天的负荷数据中包括多个时刻的负荷数据,其中,若每隔15min获得一个负荷数据,则每个样本数据中包括96个负荷数据。
步骤S102:基于所述历史负荷数据构建的树森林确定所述历史负荷数据中的异常数据。具体地,采用历史负荷数据中每个样本数据包含的每个时刻的负荷数据构建树森林,即采用每个时刻的负荷数据作为树森林中每棵树的节点;然后通过判断每个负荷数据在每棵树上的高度确定历史负荷数据是否为异常数据。
步骤S103:基于KNN算法对所述历史负荷数据中将异常数据删除后的缺失数据进行填补。具体地,KNN算法(K最邻近分类算法,K-NearestNeighbor)是指如果一个样本在特征空间中的K个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。因此,通过KNN算法能够确定异常数据的k近邻数据,对k近邻数据进行加权计算确定缺失数据的替代值对缺失数据进行填补。
步骤S104:基于主成分分析法确定与基线负荷预测相关的气象因素中的主要气象因素。具体地,与基线负荷预测相关的气象因素具体包括气压、气温、湿度、风速、降水和日照,通过对这些气象因素进行主成分分析,确定其中的主要气象因素。即可以通过主成分分析法,能够在气象因素中选出对基线负荷贡献度大于80%的气象指标作为基线负荷预测的参考数据。
步骤S105:基于采用填补后的历史负荷数据以及主要气象因素数据构建的模型进行基线负荷预测。具体地,可以采用填补后的历史负荷数据以及主要气象因素数据对神经网络模型如BP神经网络模型进行训练,调整神经网络的参数,由此得到的模型能够实现对基线负荷的预测。
本发明实施例提供的考虑气象因素的需求响应基线负荷预测方法,通过获取历史负荷数据;基于历史负荷数据构建的树森林确定历史负荷数据中的异常数据;基于KNN算法对历史负荷数据中将异常数据删除后的缺失数据进行填补;基于主成分分析法确定与基线负荷预测相关的气象因素中的主要气象因素;基于采用填补后的历史负荷数据以及主要气象因素数据构建的模型进行基线负荷预测。由此,通过构建的树森林以及KNN算法实现了对异常数据的识别和填补,使得后续预测结果更加准确;同时在进行需求响应基线负荷预测的过程中考虑气象因素对负荷预测的影响,使得最终获得的基线负荷预测结果更准确,另外运用主成分分析法分析出影响负荷预测的气象因素中贡献率较大的因素,避免了考虑所有气象因素导致算法计算速度慢的缺陷。
在一实施方式中,基于所述历史负荷数据构建的树森林确定所述历史负荷数据中的异常数据,包括如下步骤:
步骤S201:基于所述历史负荷数据以及所述历史负荷数据与预设切割点数值的关系确定树森林的根节点和叶节点;具体地,树森林的构建过程如下:将历史负荷数据中的样本数据作为树森林中每棵树的根节点;基于样本数据中任一维度数据与预设切割点数值的大小关系将任一维度数据置于左叶节点或右叶节点;当树森林中每棵树满足预设条件时停止生成新的叶节点。
其中,当获取的历史负荷数据包括多天的负荷数据时,则从多天的负荷数据中随机选择u天的负荷数据构建u棵初始树,u棵初始树的根节点分别为从历史负荷数据中随机选取的u天的负荷数据。由于每天的负荷数据中包括多个时刻的负荷数据,则每个时刻负荷数据可以看做一个维度。然后随机选取一个属性维度m,例如选取每天9:15时刻获取的负荷数据作为属性维度m,并在当前节点中的所有数据中随机产生一个切割点数值n(要求n小于当前节点中属性维度m的最大值,且大于其最小值,其最大值和最小值具体为获取的每天的第m个负荷数据(如每天9:15时刻获取的负荷数据)中组成的集合中的最大值和最小值)。之后以切割点数值n作为分割面,将当前节点的数据空间划分为两个子空间。把每天的第m个负荷数据组成的集合中的值小于n的数据项放入当前树节点的左叶节点中;反之,放入右叶节点中。重复执行上述过程,直到根节点中只有一个负荷数据(即无法继续切割)或者初始树已经达到初始设定好的限定高度时停止,得到最终的树森林。
步骤S202:计算每个历史负荷数据在树森林中每棵树的高度。确定树森林之后,依次将获取的历史负荷数据作为测试数据x,将其带入到树森林的每一颗树上,判断测试数据在树中的位置,确定其落在每棵树的高度,记为h(x),该测试数据对应的所有树高度的平均值为E(h(x)),因为初始树的结构和二叉搜索树相似,所以设置标准平均搜索长度为:
l(n)=2H(n-1)-[2(n-1)/n] (1)
H(i)=ln(i)+0.5772 (2)
其中,n为切割点数值,l(n)为标准平均搜索长度,H(i)为调和数。
步骤S203:基于所有高度的平均值以及预设切割点数据计算每个历史负荷数据的异常评分;其中异常评分采用如下公式计算:
u(x,n)=2E(h(x))l(n) (3)
式中,x为待测数据,n为切割点数值,E(h(x))为所有深度h(x)的平均值
步骤S204:基于异常评分确定所述历史负荷数据是否为异常数据。具体地,将异常评分接近1时,该数据为异常数据。由此,可以将异常评分和1作差值,当差值小于阈值时,判断为异常数据。
在一实施方式中,基于KNN算法对所述历史负荷数据中将异常数据删除后的缺失数据进行填补,包括如下步骤:
步骤S301:将确定的异常数据删除,生成缺失数据;当判断出异常数据后,对所有异常数据进行删除处理,从而将异常数据转化为缺失数据。
步骤S302:基于历史负荷数据构建的数据集矩阵计算每个缺失数据的欧式距离;具体地,数据集矩阵表示为:(x1,x2,…,xn)T,其中[X]y是数据的第y个属性,y≤w,n为样本数量,w为数据维数。其中,数据集矩阵中包含n个样本(列向量,若采用u天的负荷数据构建数据集矩阵时,则n=u),每个样本中包含w个数据(属性);[X]y为数据集矩阵中的某一样本的第y个数据。
计算欧式距离时,将所有缺失数据依次作为缺失实例xiy,计算其欧氏距离:
Figure BDA0004019912520000101
式中,xiy为缺失实例,xjy为未缺失实例。其中,xi为缺失数据xiy所在的样本编号,xj为未缺失数据xjy所在的样本编号;计算的是所有未缺失数据与xjy之间的欧氏距离,是每一个未缺失数据都有一个对应该缺失数据的欧式距离。
步骤S303:基于所述欧式距离选取的k近邻数据以及其权重计算缺失数据的替代值进行填补。具体地,计算欧式距离之后,选出距离最小的K个距离对应的数据记录作为目标数据的K近邻数据。然后计算采用如下公式计算目标数据的K个最近邻目标的权值:
Figure BDA0004019912520000102
式中,di为第i个邻点与目标点xiy之间的距离。
通过计算的权重进行加权平均值计算,作为缺失数据的替代值:
Figure BDA0004019912520000103
其中,xky表示最近邻相应属性的数值,即选出的与xiy之间欧式距离最小的K个数据,wky为加权平均值。
在一实施方式中,基于主成分分析法确定与基线负荷预测相关的气象因素中的主要气象因素,包括如下步骤:
步骤S401:将与基线负荷预测相关的气象因素数据进行标准化处理;具体地,为消除量纲的影响,先对数据进行标准化处理,其处理公式如下:
yi,j=(xij-xj)/Sj (7)
式中,xij为原数据中i分区第j个指标值;xj为原数据中第j个指标的样本均值,Sj为该指标的样本标准差,i=1,2,…,n,j=1,2,…,n。其中,i分区指的是选择的某个指标的第i个数据,指标值是指该指标的具体气象因素数据;具体到本实施例中,j指六个指标气压、气温、湿度、风速、降水和日照中的某一个,i指一天96个数据(间隔15min获取一次负荷数据)中的某一个。
步骤S402:计算标准化处理后的气象因素数据的特征值和特征向量;具体地,先构建标准化处理后相关矩阵,然后采用线性代数相关知识求解相关距离的特征值和特征向量。其中,在确定标准化数据的相关矩阵之后进行KMO校验和巴特利特校验,用于检验自变量和因变量之间的相关性。对于计算的特征值和特征向量分别表示为λ1≥λ2≥…≥λn和特征向量μ12,…,μn,这些特征向量两两正交。
步骤S403:基于采用特征向量计算的主成分得分以及采用特征值计算的累计贡献率确定主要气象因素。其中主成分得分采用如下公式计算:
Figure BDA0004019912520000111
式中,k=1,2,…,n,xj为原数据中第j个指标的样本均值,μj为对应的特征向量。
然后采用计算的特征值计算各个主成分对基线负荷预测的累计贡献率,其计算公式如下:
Figure BDA0004019912520000112
式中,α为分析累计贡献率时的主成分个数,λ为特征值。其中,λj是所有特征值中的某一个,λk是从累计的前α个特征值选取。
如图2所示,在确定主要气象因素时,对各主成分的得分及其对应的主成分进行降序排列,选取累加贡献率超80%的前p(p<q)个主成分作为后续基线负荷预测的参考因素,q指气象因素指标的个数,在本实施例中,q=6。
在一实施方式中,基于采用填补后的历史负荷数据以及主要气象因素数据构建的模型进行基线负荷预测,包括如下步骤:
步骤S501:对填补后的历史负荷数据解耦得到不可调负荷数据、不包含空调负荷的可调负荷数据以及可调负荷数据;具体地,由于空调负荷解耦不便,因此,将负荷数据部分结构,将可调负荷(不包含空调负荷)从总负荷或者说所有负荷中剥离,实现将空调负荷和不可调负荷合并进行负荷预测。其中,在剥离时,将商业楼宇用户中分布式充电桩、分布式储能等处的电表实际值相加,其和即为不包含空调负荷的可调负荷实际值。
步骤S502:采用不可调负荷数据、不包含空调负荷的可调负荷数据、可调负荷数据以及主要气象因素数据构建的模型进行基线负荷预测。具体地,负荷预测过程如下:采用历史负荷中总负荷数据、不包含空调负荷的可调负荷数据以及主要气象因素数据作为输入、不可调负荷与空调负荷之和所占总负荷比例作为输出构建比例预测模型;采用不可调负荷、空调负荷以及主要气象因素数据作为输入、不可调负荷和空调负荷的基线负荷值作为输出构建负荷预测模型;基于所述负荷预测模型预测的基线负荷以及比例预测模型预测的比例的比值确定总基线负荷。
其中,采用历史负荷中总负荷数据、不包含空调负荷的可调负荷数据以及主要气象因素数据作为输入时,神经网络的输入层节点数为3,即分别为总负荷数据、除空调负荷以外的其他可调负荷数据以及主要气象因素数据,该神经网络用于预测不可调负荷与空调负荷之和所占总负荷比例;因此,通过输入输出对神经网络进行训练,对神经网络的参数进行调整,能够实现对比例k的预测。
同理,进行基线负荷预测时,输入为不可调负荷、空调负荷以及主要气象因素数据,输出为不可调负荷和空调负荷的基线负荷,通过该输入输出对神经网络进行训练,对神经网络的参数进行调整,能够实现对基线负荷Pb的预测。
在进行预测日的总基线负荷预测时,选取与预测日属性相同(同为工作日或同为休息日),且无异常数据、缺失数据或者异常数据与缺失数据已修复的典型日,将典型日的相关数据分别输入至两个训练好的模型中,分别得到预测的需求响应日的不可调负荷与空调负荷的基线负荷值以及不可调负荷和空调负荷之和在总负荷中所占比例,由此,总基线负荷的计算采用如下公式表示:
P=Pb/k (10)
式中,Pb为预测的需求响应日的不可调负荷与空调负荷的基线负荷值,k为预测的需求响应日的不可调负荷与空调负荷在总负荷中的比例。
在一实施方式中,如图3所示,该考虑气象因素的需求响应基线负荷预测方法采用如下流程实现:获取负荷数据以及对应的气象因素数据;对负荷数据进行异常数据识别以及缺失数据填补;采用主成分分析法对气象因素数据计算,确定主要气象因素;对负荷数据进行部分解耦,将可调数据剥离;基于解耦后的负荷数据以及确定的主要气象因素进行模型训练以及预测,其中训练的模型主要用于预测不可调负荷与空调负荷在总负荷中的比例k以及预测不可调负荷与空调负荷的基线负荷值,在训练时,通过输入和相应输出调整神经网络参数,在预测时,通过选取的和预测日属性相同的典型日,输入至训练好的模型中,输出需求响应日的比例以及基线负荷值;然后通过二者的比值确定需求响应日的基线负荷。
本发明实施例还提供一种考虑气象因素的需求响应基线负荷预测装置,如图4所示,该装置包括:
数据获取模块,用于获取历史负荷数据;具体内容参见上述方法实施例对应部分,在此不再赘述。
异常数据判断模块,用于基于所述历史负荷数据构建的树森林确定所述历史负荷数据中的异常数据;具体内容参见上述方法实施例对应部分,在此不再赘述。
填补模块,用于基于KNN算法对所述历史负荷数据中将异常数据删除后的缺失数据进行填补;具体内容参见上述方法实施例对应部分,在此不再赘述。
主成分分析模块,用于基于主成分分析法确定与基线负荷预测相关的气象因素中的主要气象因素;具体内容参见上述方法实施例对应部分,在此不再赘述。
预测模块,用于基于采用填补后的历史负荷数据以及主要气象因素数据构建的模型进行基线负荷预测。具体内容参见上述方法实施例对应部分,在此不再赘述。
本发明实施例提供的考虑气象因素的需求响应基线负荷预测装置,通过获取历史负荷数据;基于历史负荷数据构建的树森林确定历史负荷数据中的异常数据;基于KNN算法对历史负荷数据中将异常数据删除后的缺失数据进行填补;基于主成分分析法确定与基线负荷预测相关的气象因素中的主要气象因素;基于采用填补后的历史负荷数据以及主要气象因素数据构建的模型进行基线负荷预测。由此,通过构建的树森林以及KNN算法实现了对异常数据的识别和填补,使得后续预测结果更加准确;同时在进行需求响应基线负荷预测的过程中考虑气象因素对负荷预测的影响,使得最终获得的基线负荷预测结果更准确,另外运用主成分分析法分析出影响负荷预测的气象因素中贡献率较大的因素,避免了考虑所有气象因素导致算法计算速度慢的缺陷。
本发明实施例提供的考虑气象因素的需求响应基线负荷预测装置的功能描述详细参见上述实施例中考虑气象因素的需求响应基线负荷预测方法描述。
本发明实施例还提供一种存储介质,如图5所示,其上存储有计算机程序601,该指令被处理器执行时实现上述实施例中考虑气象因素的需求响应基线负荷预测方法的步骤。该存储介质上还存储有音视频流数据,特征帧数据、交互请求信令、加密数据以及预设数据大小等。其中,存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random AccessMemory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard DiskDrive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(RandomAccessMemory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
本发明实施例还提供了一种电子设备,如图6所示,该电子设备可以包括处理器51和存储器52,其中处理器51和存储器52可以通过总线或者其他方式连接,图6中以通过总线连接为例。
处理器51可以为中央处理器(Central Processing Unit,CPU)。处理器51还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器52作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例中的对应的程序指令/模块。处理器51通过运行存储在存储器52中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例中的考虑气象因素的需求响应基线负荷预测方法。
存储器52可以包括存储程序区和存储数据区,其中,存储程序区可存储操作装置、至少一个功能所需要的应用程序;存储数据区可存储处理器51所创建的数据等。此外,存储器52可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器52可选包括相对于处理器51远程设置的存储器,这些远程存储器可以通过网络连接至处理器51。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器52中,当被所述处理器51执行时,执行如图1-3所示实施例中的考虑气象因素的需求响应基线负荷预测方法。
上述电子设备具体细节可以对应参阅图1至图3所示的实施例中对应的相关描述和效果进行理解,此处不再赘述。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (10)

1.一种考虑气象因素的需求响应基线负荷预测方法,其特征在于,包括:
获取历史负荷数据;
基于所述历史负荷数据构建的树森林确定所述历史负荷数据中的异常数据;
基于KNN算法对所述历史负荷数据中将异常数据删除后的缺失数据进行填补;
基于主成分分析法确定与基线负荷预测相关的气象因素中的主要气象因素;
基于采用填补后的历史负荷数据以及主要气象因素数据构建的模型进行基线负荷预测。
2.根据权利要求1所述的考虑气象因素的需求响应基线负荷预测方法,其特征在于,基于所述历史负荷数据构建的树森林确定所述历史负荷数据中的异常数据,包括:
基于所述历史负荷数据以及所述历史负荷数据与预设切割点数值的关系确定树森林的根节点和叶节点;
计算每个历史负荷数据在树森林中每棵树的高度;
基于所有高度的平均值以及预设切割点数据计算每个历史负荷数据的异常评分;
基于异常评分确定所述历史负荷数据是否为异常数据。
3.根据权利要求2所述的考虑气象因素的需求响应基线负荷预测方法,其特征在于,基于所述历史负荷数据以及所述历史负荷数据与预设切割点数值的关系确定树森林的根节点和叶节点,包括:
将历史负荷数据中的样本数据作为树森林中每棵树的根节点;
基于样本数据中任一维度数据与预设切割点数值的大小关系将任一维度数据置于左叶节点或右叶节点;
当树森林中每棵树满足预设条件时停止生成新的叶节点。
4.根据权利要求1所述的考虑气象因素的需求响应基线负荷预测方法,其特征在于,基于KNN算法对所述历史负荷数据中将异常数据删除后的缺失数据进行填补,包括:
将确定的异常数据删除,生成缺失数据;
基于历史负荷数据构建的数据集矩阵计算每个缺失数据的欧式距离;
基于所述欧式距离选取的k近邻数据以及其权重计算缺失数据的替代值进行填补。
5.根据权利要求1所述的考虑气象因素的需求响应基线负荷预测方法,其特征在于,基于主成分分析法确定与基线负荷预测相关的气象因素中的主要气象因素,包括:
将与基线负荷预测相关的气象因素数据进行标准化处理;
计算标准化处理后的气象因素数据的特征值和特征向量;
基于采用特征向量计算的主成分得分以及采用特征值计算的累计贡献率确定主要气象因素。
6.根据权利要求1所述的考虑气象因素的需求响应基线负荷预测方法,其特征在于,基于采用填补后的历史负荷数据以及主要气象因素数据构建的模型进行基线负荷预测,包括:
对填补后的历史负荷数据解耦得到不可调负荷数据、不包含空调负荷的可调负荷数据以及可调负荷数据;
采用不可调负荷数据、不包含空调负荷的可调负荷数据、可调负荷数据以及主要气象因素数据构建的模型进行基线负荷预测。
7.根据权利要求6所述的考虑气象因素的需求响应基线负荷预测方法,其特征在于,采用不可调负荷数据、不包含空调负荷的可调负荷数据、可调负荷数据以及主要气象因素数据构建的模型进行基线负荷预测,包括:
采用历史负荷中总负荷数据、不包含空调负荷的可调负荷数据以及主要气象因素数据作为输入、不可调负荷与空调负荷之和所占总负荷比例作为输出构建比例预测模型;
采用不可调负荷、空调负荷以及主要气象因素数据作为输入、不可调负荷和空调负荷的基线负荷值作为输出构建负荷预测模型;
基于所述负荷预测模型预测的基线负荷以及比例预测模型预测的比例的比值确定总基线负荷。
8.一种考虑气象因素的需求响应基线负荷预测装置,其特征在于,包括:
数据获取模块,用于获取历史负荷数据;
异常数据判断模块,用于基于所述历史负荷数据构建的树森林确定所述历史负荷数据中的异常数据;
填补模块,用于基于KNN算法对所述历史负荷数据中将异常数据删除后的缺失数据进行填补;
主成分分析模块,用于基于主成分分析法确定与基线负荷预测相关的气象因素中的主要气象因素;
预测模块,用于基于采用填补后的历史负荷数据以及主要气象因素数据构建的模型进行基线负荷预测。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行如权利要求1-7任一项所述的考虑气象因素的需求响应基线负荷预测方法。
10.一种电子设备,其特征在于,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行如权利要求1-7任一项所述的考虑气象因素的需求响应基线负荷预测方法。
CN202211683644.6A 2022-12-27 2022-12-27 一种考虑气象因素的需求响应基线负荷预测方法及装置 Pending CN116108974A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211683644.6A CN116108974A (zh) 2022-12-27 2022-12-27 一种考虑气象因素的需求响应基线负荷预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211683644.6A CN116108974A (zh) 2022-12-27 2022-12-27 一种考虑气象因素的需求响应基线负荷预测方法及装置

Publications (1)

Publication Number Publication Date
CN116108974A true CN116108974A (zh) 2023-05-12

Family

ID=86259021

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211683644.6A Pending CN116108974A (zh) 2022-12-27 2022-12-27 一种考虑气象因素的需求响应基线负荷预测方法及装置

Country Status (1)

Country Link
CN (1) CN116108974A (zh)

Similar Documents

Publication Publication Date Title
CN109615129B (zh) 房地产客户成交概率预测方法、服务器及计算机存储介质
CN107506868B (zh) 一种短时电力负荷预测的方法及装置
CN111080117A (zh) 设备风险标签的构建方法、装置、电子设备及存储介质
CN111625516A (zh) 检测数据状态的方法、装置、计算机设备和存储介质
CN113468034A (zh) 数据质量评估方法、装置、存储介质和电子设备
CN111797320A (zh) 数据处理方法、装置、设备及存储介质
CN111598457B (zh) 一种电力无线网络质量的确定方法及装置
CN113988441A (zh) 电力无线网络链路质量预测、模型训练方法及装置
CN113469570A (zh) 信息质量评价模型构建方法、装置、设备及存储介质
CN112070559A (zh) 状态获取方法和装置、电子设备和存储介质
CN110765351A (zh) 目标用户识别方法、装置、计算机设备和存储介质
CN113887866A (zh) 一种人居环境评价指数的生成方法以及装置
CN112883267A (zh) 基于深度学习的数据热度统计方法及装置
CN110852322B (zh) 感兴趣区域的确定方法及装置
CN113537693A (zh) 人员风险等级获取方法、终端、存储装置
CN111783883A (zh) 一种异常数据的检测方法及装置
CN109615018B (zh) 用户个性化行为评价方法、装置、计算机设备和存储介质
CN111612648A (zh) 光伏发电预测模型的训练方法、装置和计算机设备
CN116680567A (zh) 一种风力发电机的缺失状态变量填补方法及装置
CN116431346A (zh) 一种用于电子设备主存储器容量的补偿方法
CN116108974A (zh) 一种考虑气象因素的需求响应基线负荷预测方法及装置
CN111026661B (zh) 一种软件易用性全面测试方法及***
CN111754103A (zh) 企业风险画像方法、装置、计算机设备和可读存储介质
Grottke et al. How the distribution of the number of items rated per user influences the quality of recommendations
CN117237053B (zh) 一种机票分销平台及其控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination