CN112232593A - 一种基于相空间重构和数据驱动的电力负荷预测方法 - Google Patents

一种基于相空间重构和数据驱动的电力负荷预测方法 Download PDF

Info

Publication number
CN112232593A
CN112232593A CN202011217056.4A CN202011217056A CN112232593A CN 112232593 A CN112232593 A CN 112232593A CN 202011217056 A CN202011217056 A CN 202011217056A CN 112232593 A CN112232593 A CN 112232593A
Authority
CN
China
Prior art keywords
data
model
models
load
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011217056.4A
Other languages
English (en)
Inventor
侯慧
王晴
吴细秀
张清勇
王建建
唐金锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University of Technology WUT
Original Assignee
Wuhan University of Technology WUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University of Technology WUT filed Critical Wuhan University of Technology WUT
Priority to CN202011217056.4A priority Critical patent/CN112232593A/zh
Publication of CN112232593A publication Critical patent/CN112232593A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Primary Health Care (AREA)
  • Artificial Intelligence (AREA)
  • Water Supply & Treatment (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于相空间重构和数据驱动的电力负荷预测方法,首先计算历史负荷数据的延迟时间和嵌入维数,划分数据集为训练集和测试集,依据延迟时间和嵌入维数分别对训练集和测试集进行相空间重构,并进行归一化处理。其次,在相同数据集下对比十二种数据驱动模型的预测精度,得到XGBoost为统计学习模型中的最优模型,LSTM和极限学习机为神经网络模型中的最优模型,分别对上述三种模型进行日、周、半月、月负荷预测,均能保持较高的预测精度。最后,利用灰色关联度法对XGBoost、LSTM和极限学习机进行不等权组合,构建组合数据驱动模型。本发明可以提高预测的精度。

Description

一种基于相空间重构和数据驱动的电力负荷预测方法
技术领域
本发明涉及电力***负荷预测技术领域,具体涉及一种基于相空间重构和数据驱动的电力负荷预测方法。
背景技术
准确的负荷预测可以保持电网运行的安全稳定性,减少不必要的旋转储备容量,合理安排机组检修计划,有效地降低发电成本,提高经济效益和社会效益。电力负荷大小受多种因素影响:天气、温度、节假日、地区GDP等。然而,通常情况下难以获得所有影响因素的准确数据。因此,若能在缺乏多因素数据情况下实施较为准确的电力负荷预测方法,则可以省去收集和处理多种数据的繁琐过程,简化电力负荷预测步骤。
本申请发明人在实施本发明的过程中,发现现有技术的方法,至少存在如下技术问题:
目前,国内外对考虑多因素数据条件下的负荷预测研究较多,但一般情况下难以获得准确的多因素数据,且处理多因素数据需要耗费大量时间,因此基于单一负荷历史数据下的研究尤为重要。在现有基于相空间重构的负荷预测研究中,一般采用BP神经网络或BP神经网络的变式进行预测,其预测精度较低。
发明内容
本发明提出一种基于相空间重构和数据驱动的电力负荷预测方法,用于解决或者至少部分解决现有技术的方法存在的预测精度较低的技术问题。
为了解决上述技术问题,本发明提供了一种基于相空间重构和数据驱动的电力负荷预测方法,包括:
S1:计算历史负荷数据的延迟时间和嵌入维数,将历史负荷数据划分为训练集和测试集,依据延迟时间和嵌入维数分别对训练集和测试集进行相空间重构,并进行最大最小归一化处理;
S2:将进行最大最小归一化处理后的训练集和测试集输入至少两种类型的数据驱动模型,其中,每种类型的数据驱动模型包含一个或者多个,数据驱动模型用以自主学习输入数据集的数据特征并输出预测结果,对比所有数据驱动模型的预测精度,并采用预设评价指标从中筛选出不同类型数据驱动模型对应的最优模型;
S3:采用灰色关联度法建立相空间重构条件下不同类型数据驱动模型对应的最优模型的组合模型,利用建立的组合模型对电力负荷进行预测。
在一种实施方式中,步骤S1包括:
S1.1:采用自相关法计算历史负荷数据的延迟时间,混沌时间序列为x1,x2,…,xN-1,xN,对于N个数据点,时间跨度为τ的自相关函数为
Figure BDA0002760746730000021
根据上述自相关函数得到关于延迟时间τ的图像,当自相关函数的值下降到初值的1-1/e倍时,对应的τ为重构相空间的延迟时间;
S1.2:采用伪近邻法计算历史负荷数据的嵌入维数,对混沌时间序列数据,从嵌入维数m=2开始,计算伪最近邻点的比值Sm或者伪最近邻点的个数,增加嵌入维数,重新计算伪最近邻点的比值Sm或者伪最近邻点的个数,当伪最近邻点的比值Sm小于预设比例或者伪最近邻点个数不再减少时,将此时的嵌入维数作为历史负荷数据的嵌入维数,其中,
Figure BDA0002760746730000022
若Sm>S,那么X(t)与Xj(t)为伪最近邻点,其中S为阈值,Rm(t)为X(t)和Xj(t)在嵌入维数为m的空间中的距离,Rm+1(t)为X(t)和Xj(t)在嵌入维数为m+1的空间中的距离;
S1.3:依据延迟时间和嵌入维数分别对训练集和测试集进行相空间重构,具体为:混沌时间序列为x1,x2,…,xN-1,xN,对xt(t=1,2,…,N-(m-1)τ),做如下变换:
xt=(xt,x(t+τ),x(t+2τ),…,x[t+(m-1)τ])T
其中,τ为延迟时间,m为嵌入维数;
根据相空间重构法,将混沌时间序列x1,x2,…,xN-1,xN转换为延时为τ,维数为m的新数据空间,即
Figure BDA0002760746730000031
其中,每一列表示一个向量或相点;
S1.4:利用最大最小归一化算法对负荷数据进行归一化处理:
Figure BDA0002760746730000032
其中,xmin为负荷数据中的最小值,xmax为负荷数据中的最大值,xi为负荷数据中第i个值。
在一种实施方式中,步骤S2中的不同类型的数据模型包括三种,分别为基准模型、神经网络模型以及统计学习模型,其中,数据驱动模型自主学习数据特征的方式为:基准模型将t-1时刻的负荷值作为t时刻的负荷预测值,不经过训练,直接输出,神经网络模型依据测试集数据不断反馈和调整网络权值,利用梯度下降算法寻求网络的最优权值,最后输出测试集的预测结果;统计学习模型根据各自的目标函数求得残差,同样利用梯度下降算法不断优化超参数,最后输出测试集的预测结果。
在一种实施方式中,采用的数据驱动模型包括12个,其中,1个基准模型、5个神经网络模型和6个统计学习模型,
基准模型使可持久化算法:Persistence算法,Persistence算法将t-1时刻的负荷值作为t时刻的负荷预测值;
神经网络模型包括BP神经网络、Elman神经网络、小波神经网络、极限学习机和长短期记忆网络;
统计学习模型包括线性回归、Lasso回归、Ridge回归、ElasticNet回归、支持向量回归和极端梯度提升。
在一种实施方式中,将均方根误差的变异系数和对称平均绝对百分比误差两个评价指标作为预设评价指标,根据预设评价指标得出极限学习机和长短期记忆网络为神经网络模型中的最优模型,极端梯度提升为统计学习模型中的最优模型。
在一种实施方式中,均方根误差的变异系数CVRMSE和对称平均绝对百分比误差SMAPE公式如下:
Figure BDA0002760746730000041
Figure BDA0002760746730000042
其中,yi
Figure BDA0002760746730000043
分别为第i个样本的实际值和预测值,N为样本总数。
在一种实施方式中,步骤S3包括:
S3.1:获得某一长度为N的时间序列在M种预测模型下的预测值xmn,其中,m=1,2,3,...,M,n=1,2,3,...,N,则其组合模型为:
Figure BDA0002760746730000044
其中,lm为第m种模型的权值,且满足
Figure BDA0002760746730000045
采用灰色关联度法求解权值,等价于求解
Figure BDA0002760746730000046
其中,emn为第m种预测模型在n时刻的预测误差;
S3.2:利用建立的组合模型对电力负荷进行日负荷预测和周负荷预测。
本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:
本发明提供的方法,首先计算历史负荷数据的延迟时间和嵌入维数,划分数据集为训练集和测试集,并依据延迟时间和嵌入维数分别对训练集和测试集进行相空间重构,然后进行归一化处理;并在相同数据集下对比所有数据驱动模型的预测精度,得到不同类型数据驱动模型对应的最优模型,最后,利用灰色关联度法对不同类型数据驱动模型对应的最优模型进行不等权组合,构建组合模型,则可以利用建立的组合模型对电力负荷进行预测。由于采用相空间重构技术处理历史负荷数据,可以省去收集和处理多因素数据的繁琐步骤;通过应用多种数据驱动模型来进行负荷预测,相比于传统数据驱动模型,具有更强的非线性能力来进行预测;采用灰色关联度法进行组合集成了深度学习和统计学习,从而获得了比单个学习器更好的效果,故而提升了电力负荷预测的精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明具体实施例中负荷预测基本流程图;
图2为本发明具体实施例中对月历史数据采用自相关法求延迟时间结果图;
图3为本发明具体实施例中对年历史数据采用自相关法求延迟时间结果图;
图4为本发明具体实施例中对月历史数据采用伪近邻法求嵌入维数结果图;
图5为本发明具体实施例中对年历史数据采用伪近邻法求嵌入维数结果图;
图6为本发明具体实施例中所选用数据驱动模型概览图;
图7为本发明具体实施例中不同预测时间长度下CVRMSE对比图;
图8为本发明具体实施例中不同预测时间长度下SMAPE对比图;
图9为本发明具体实施例中组合模型日负荷预测结果图;
图10为本发明具体实施例中组合模型周负荷预测结果图。
具体实施方式
本申请发明人通过大量的研究与实践发现,在现有基于相空间重构的负荷预测研究中,一般采用BP神经网络或BP神经网络的变式进行预测,其预测精度较低,对于近年来预测精度高且热门的深度学习和机器学习算法,鲜有将其与相空间重构进行结合。因此,基于相空间重构和数据驱动算法的电力负荷预测在简化负荷预测步骤及提高负荷预测精度方面具有重要的现实意义。
基于此,本发明提供了一种基于相空间重构和数据驱动的电力负荷预测方法,用于改善现有技术的方法存在的预测精度较低的技术问题。
本发明的主要发明构思如下:
提出一种基于相空间重构和组合数据驱动模型的电力负荷预测方法。首先计算历史负荷数据的延迟时间和嵌入维数,划分数据集为训练集和测试集,依据延迟时间和嵌入维数分别对训练集和测试集进行相空间重构,并进行归一化处理。其次,在相同数据集下对比不同数据驱动模型的预测精度,得到不同类型数据驱动模型对应的最优模型,最后,利用灰色关联度法对不同类型数据驱动模型对应的最优模型进行不等权组合,构建组合模型,则可以利用建立的组合模型对电力负荷进行预测。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
请参见图1~图10,本发明实施例提供了一种基于相空间重构和数据驱动的电力负荷预测方法,包括:
S1:计算历史负荷数据的延迟时间和嵌入维数,将历史负荷数据划分为训练集和测试集,依据延迟时间和嵌入维数分别对训练集和测试集进行相空间重构,并进行最大最小归一化处理;
S2:将进行最大最小归一化处理后的训练集和测试集输入至少两种类型的数据驱动模型,其中,每种类型的数据驱动模型包含一个或者多个,数据驱动模型用以自主学习输入数据集的数据特征并输出预测结果,对比所有数据驱动模型的预测精度,并采用预设评价指标从中筛选出不同类型数据驱动模型对应的最优模型;
S3:采用灰色关联度法建立相空间重构条件下不同类型数据驱动模型对应的最优模型的组合模型,利用建立的组合模型对电力负荷进行预测。
具体来说,数据驱动模型的类型可以根据实际情况选取,例如2种、3种、5种等。每一种类型的数据驱动模型可以包含一个或者多个。
在一种实施方式中,步骤S1包括:
S1.1:采用自相关法计算历史负荷数据的延迟时间,混沌时间序列为x1,x2,…,xN-1,xN,对于N个数据点,时间跨度为τ的自相关函数为
Figure BDA0002760746730000071
根据上述自相关函数得到关于延迟时间τ的图像,当自相关函数的值下降到初值的1-1/e倍时,对应的τ为重构相空间的延迟时间;
S1.2:采用伪近邻法计算历史负荷数据的嵌入维数,对混沌时间序列数据,从嵌入维数m=2开始,计算伪最近邻点的比值Sm或者伪最近邻点的个数,增加嵌入维数,重新计算伪最近邻点的比值Sm或者伪最近邻点的个数,当伪最近邻点的比值Sm小于预设比例或者伪最近邻点个数不再减少时,将此时的嵌入维数作为历史负荷数据的嵌入维数,其中,
Figure BDA0002760746730000072
若Sm>S,那么X(t)与Xj(t)为伪最近邻点,其中S为阈值,Rm(t)为X(t)和Xj(t)在嵌入维数为m的空间中的距离,Rm+1(t)为X(t)和Xj(t)在嵌入维数为m+1的空间中的距离;
S1.3:依据延迟时间和嵌入维数分别对训练集和测试集进行相空间重构,具体为:混沌时间序列为x1,x2,…,xN-1,xN,对xt(t=1,2,…,N-(m-1)τ),做如下变换:
xt=(xt,x(t+τ),x(t+2τ),…,x[t+(m-1)τ])T
其中,τ为延迟时间,m为嵌入维数;
根据相空间重构法,将混沌时间序列x1,x2,…,xN-1,xN转换为延时为τ,维数为m的新数据空间,即
Figure BDA0002760746730000081
其中,每一列表示一个向量或相点;
S1.4:利用最大最小归一化算法对负荷数据进行归一化处理:
Figure BDA0002760746730000082
其中,xmin为负荷数据中的最小值,xmax为负荷数据中的最大值,xi为负荷数据中第i个值。
具体来说,步骤S1.1中,对于一个时间序列,自相关法是根据自相关函数做出函数值关于延迟时间τ的图像,当自相关函数的值下降到初始值的1-1/e倍时,所对应的时间就是重构相空间的延迟时间τ,通过步骤S1.1中的自相关函数可以得到自相关函数关于延迟时间τ的图像,当自相关函数的值下降到初值的1-1/e倍时,对应的τ即为重构相空间的延迟时间。
图2和图3分别为月历史数据和年历史数据采用自相关法求延迟时间的结果图,由图2和图3可知,当自相关函数的值下降到初值的1-1/e倍时,即自相关函数值为0.6321时,对应月历史数据和年历史数据的延迟时间均为4。
步骤S1.2中,使用伪近邻法计算嵌入维数。对于空间中的相点X(t)=(xt,x(t+τ),x(t+2τ),…,x[t+(m-1)τ]),都存在一个最近的邻点。在m维空间中,令Rm(t)=||X(t)-Xj(t)||,X(t)和Xj(t)为两个不同的相点,Rm(t)为X(t)和Xj(t)在m维空间中的距离。当维数增加到m+1时,这两点之间的距离会产生变化,变化后的距离为
Figure BDA0002760746730000083
如果Rm+1比Rm大很多,则认为这是由于在高维相空间中原本并不相邻的两个点投影到低维空间中变为相邻点所造成的。于是得到伪最近邻点的比值Sm的计算公式,若Sm>S,那么X(t)与Xj(t)就是伪最近邻点,其中S为阈值。
具体实施过程中,对混沌时间序列数据,从嵌入维数m=2开始,计算伪最近邻点的比值Sm或者伪最近邻点的个数。增加嵌入维数,重新计算直到伪最近邻点的比值Sm小于5%或者伪最近邻点个数不再减少,此时的嵌入维数可以认为能够使得混沌的运动轨迹被全部展开,也即为最合适的嵌入维数,将其作为历史负荷数据的嵌入维数。
图4和图5分别为月历史数据和年历史数据采用伪近邻法求嵌入维数结果图,由图4和图5可知,对于月历史数据,当嵌入维数增加到4时,伪近邻率下降至0%,对于年历史数据,当嵌入维数增加至5时,伪近邻率下降至0%。因此,取月历史负荷数据的嵌入维数为4,取年历史负荷数据的嵌入维数为5。
步骤S1.3中,给出了将混沌时间序列进行相空间重构的方法,即转换到延时为τ,维数为m的新数据空间。相空间重构的过程可以采用Matlab实现。
在一种实施方式中,步骤S2中的不同类型的数据模型包括三种,分别为基准模型、神经网络模型以及统计学习模型,其中,数据驱动模型自主学习数据特征的方式为:基准模型将t-1时刻的负荷值作为t时刻的负荷预测值,不经过训练,直接输出,神经网络模型依据测试集数据不断反馈和调整网络权值,利用梯度下降算法寻求网络的最优权值,最后输出测试集的预测结果;统计学习模型根据各自的目标函数求得残差,同样利用梯度下降算法不断优化超参数,最后输出测试集的预测结果。
在一种实施方式中,采用的数据驱动模型包括12个,其中,1个基准模型、5个神经网络模型和6个统计学习模型,
基准模型使可持久化算法:Persistence算法,Persistence算法将时刻的负荷值作为时刻的负荷预测值;
神经网络模型包括BP神经网络、Elman神经网络、小波神经网络、极限学习机和长短期记忆网络;
统计学习模型包括线性回归、Lasso回归、Ridge回归、ElasticNet回归、支持向量回归和极端梯度提升。
具体来说,12种数据驱动模型包括1种基准模型、5种神经网络模型和6种统计学习模型。基准模型、LSTM及统计学习模型使用Python语言实现,除LSTM外的神经网络模型使用Matlab实现。
具体实施过程中,采用均方根误差的变异系数和对称平均绝对百分比误差两个评价指标作为预设评价指标,则可得到极限学习机和长短期记忆网络为神经网络模型中的最优模型,极端梯度提升为统计学习模型中的最优模型。分别对上述三种模型进行日、周、半月、月负荷预测,均能保持较高的预测精度。图6为所选用数据驱动模型概览图。
基准模型使用Persistence算法。Persistence算法将t-1时刻的负荷值作为t时刻的负荷预测值。
5种神经网络模型包括BP神经网络、Elman神经网络、小波神经网络、极限学习机和长短期记忆网络。
(1)BP神经网络。BP神经网络(Back Propagation Neural Network,BPNN)是一种按误差反向传播训练的多层前馈网络,它的基本思想是梯度下降法,利用梯度搜索技术,使网络的实际输出值和期望输出值的误差均方差为最小,包括输入层、隐藏层和输出层。对于回归问题来说,输出层神经元个数一般为1。超参数设置为:最大训练次数net.trainparam.epochs=500,训练要求精度net.trainparam.goal=0.01,学习速率net.trainParam.lr=0.01。
(2)Elman神经网络。Elman神经网络(Elman Neural Network,ENN)在BP神经网络的基础上增加了承接层(Context Layer),承接层从隐含层接收反馈信号,用来记忆隐含层神经元前一时刻的输出值,承接层神经元的输出经延迟与存储,再输入到隐含层。这样就使其对历史数据具有敏感性,增加了网络自身处理动态信息的能力。超参数设置为:最大训练次数net.trainparam.epochs=500,训练要求精度net.trainparam.goal=0.01,学习速率net.trainParam.lr=0.01。
(3)小波神经网络。小波神经网络(Wavelet Neural Network,WNN)是一种以BP神经网络拓扑结构为基础,将小波基函数作为隐含层神经元激活函数的神经网络。超参数设置为:迭代次数maxgen=50,学习速率net.trainParam.lr=0.01。小波基函数为
Figure BDA0002760746730000111
其中,x为隐含层神经元的输入值。
(4)极限学习机。极限学习机(Extreme Learning Machine,ELM)为求解单隐层神经网络算法。当激活函数无限可微时,单隐含层前馈神经网络的参数并不需要全部进行调整,输入层到隐含层之间的权值和偏置在训练前可以随机选择。隐含层和输出层之间的连接权值β为
β=H+D′
其中,H+为隐含层输出矩阵的广义逆,D′为网络理想输出的转置矩阵。
(5)长短期记忆网络。长短期记忆网络(Long ShortTerm Memory,LSTM)是一种特殊的循环神经网络。LSTM网络的基本组成单元主要包括遗忘门、输入门、输出门和记忆单元。超参数设置为:LSTM单元的数量units=1,用平均绝对误差作损失函数,即loss='mae',采用随机梯度下降法优化,即optimizer='sgd',训练代数epochs=50,每隔一个样本打印一次当前的损失函数,即batch_size=1,每一次迭代输出一行记录,即verbose=2。
6种统计学习模型为线性回归、Lasso回归、Ridge回归、Elastic Net回归、支持向量回归和极端梯度提升。
(1)线性回归。线性回归(Linear Regression,LR)假设目标值与特征之间线性相关,即对于每个样本点均满足多元一次方程
yi=θTxii
其中,i表示第i个样本点,θT为系数向量,εi为第i个样本点的回归误差。xi和yi分别为特征值和目标值。
误差近似服从正态分布:
Figure BDA0002760746730000112
其中,σ为误差εi的方差,默认误差εi的期望为0。
对数似然函数为
Figure BDA0002760746730000121
其中,m为样本数。
当样本确定后,式中唯一的变量为θT,因此最大似然函数maxl(θ)可转化为
Figure BDA0002760746730000122
将θTxi写为以xi为自变量的函数hθ(xi),可进一步转化为
Figure BDA0002760746730000123
因此,线性回归的目标函数为
Figure BDA0002760746730000124
(2)Lasso回归。在目标函数中加入对系数向量θ大小的约束可以防止过拟合。加入L1-norm正则项为Lasso回归,Lasso回归的目标函数为
Figure BDA0002760746730000125
其中,λ为约束项的系数,n为系数向量θ的长度。设置λ=0.5。
(3)Ridge回归。加入L2-norm正则项为Ridge回归,Ridge回归的目标函数为
Figure BDA0002760746730000126
设置λ=0.5。
(4)Elastic Net回归。同时加入L1-norm正则项和L2-norm正则项,即为ElasticNet回归,Elastic Net回归的目标函数为
Figure BDA0002760746730000127
其中,ρ为L1-norm正则项的权重,1-ρ为L2-norm正则项的权重。设置λ=ρ=0.5。
(5)支持向量回归。支持向量回归(Support Vector Regression,SVR)是支持向量机(Support Vector Machines,SVM)的回归推广形式。SVR通过构造一个超平面来解决回归预测问题。当所有样本点与该超平面的距离最小时,即为最优超平面。超平面的公式和距离可以分别表示为
f(x)=wTx+b
d=yi-f(x)
SVR模型可写为
Figure BDA0002760746730000131
Figure BDA0002760746730000132
其中,w为权重向量,b为偏移量,yi为样本目标值,x为样本特征向量,ξi
Figure BDA0002760746730000133
为对上下边界引入的松弛变量,C为目标函数的惩罚系数,ε为样本数据与超平面的最大距离,即dmax。超参数设置为:采用线性核函数,即kernel='linear',目标函数的惩罚系数C=1.25。
(6)极端梯度提升。使用分类回归树(CART)作为XGBoost(eXtreme GradientBoosting,XGBoost)的基学习器。假设样本集合为D={(xi,yi)},其中样本数量为n,样本维度为m,xi表示第i个样本,yi表示第i个类别标签,XGBoost模型为
Figure BDA0002760746730000134
其中,
Figure BDA0002760746730000135
为预测值,K为树的数目,fk为函数空间F中的一个函数,F为所有可能的CART集合。
构造带正则项的损失函数为
Figure BDA0002760746730000136
损失函数式中第一项
Figure BDA0002760746730000137
为损失误差计算,计算每个样本的预测值与实际值之差并求和;第二项∑Ω(fk)为正则项,计算每个样本的正则项值并求和,用于控制模型复杂度,防止过拟合。对于单个样本,其正则项值为
Ω(fk)=γT+λ||w||2
正则项中T表示每棵树的叶子节点数量,w为每棵树叶子节点的分数向量,γ和λ分别为叶子节点数量约束系数和叶子节点分数向量约束系数。
超参数设置为:采用均方误差作为损失函数,即objective='reg:squarederror',树的数目n_estimators=1000。
对比结果可得,在神经网络模型中,ELM和LSTM在测试集上表现最优;在统计学习模型中,XGBoost精度最高。
在一种实施方式中,将均方根误差的变异系数和对称平均绝对百分比误差两个评价指标作为预设评价指标,根据预设评价指标得出极限学习机和长短期记忆网络为神经网络模型中的最优模型,极端梯度提升为统计学习模型中的最优模型。
在一种实施方式中,均方根误差的变异系数CVRMSE和对称平均绝对百分比误差SMAPE公式如下:
Figure BDA0002760746730000141
Figure BDA0002760746730000142
其中,yi
Figure BDA0002760746730000143
分别为第i个样本的实际值和预测值,N为样本总数。
图7和图8分别为不同预测时间长度下CVRMSE和SMAPE的对比图。
在一种实施方式中,步骤S3包括:
S3.1:获得某一长度为N的时间序列在M种预测模型下的预测值xmn,其中,m=1,2,3,...,M,n=1,2,3,...,N,则其组合模型为
Figure BDA0002760746730000144
其中,lm为第m种模型的权值,且满足
Figure BDA0002760746730000151
采用灰色关联度法求解权值,等价于求解
Figure BDA0002760746730000152
其中,emn为第m种预测模型在n时刻的预测误差;
S3.2:利用建立的组合模型对电力负荷进行日负荷预测和周负荷预测。
求解结果为:在日负荷预测中,极限学习机、极端梯度提升和长短期记忆网络的权值分别为0.171、0.544和0.284;在周负荷预测中,极限学习机、极端梯度提升和长短期记忆网络的权值分别为0.641、0.275和0.110。对组合模型分别进行日负荷预测和周负荷预测。图9和图10分别为组合模型日负荷预测结果图和周负荷预测结果图。
与现有的方法相比,本发明具有以下积极效果和优点:
(1)采用相空间重构技术处理历史负荷数据,可减少收集和处理多因素数据的繁琐步骤;
(2)通过应用多种数据驱动模型来进行负荷预测,其中包括深度学习和统计学习模型,相比于传统数据驱动模型,具有更强的非线性能力来进行预测;
(3)采用灰色关联度法进行组合集成了深度学习和统计学习,从而获得了比单个学习器更好的效果。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

Claims (7)

1.一种基于相空间重构和数据驱动的电力负荷预测方法,其特征在于,包括:
S1:计算历史负荷数据的延迟时间和嵌入维数,将历史负荷数据划分为训练集和测试集,依据延迟时间和嵌入维数分别对训练集和测试集进行相空间重构,并进行最大最小归一化处理;
S2:将进行最大最小归一化处理后的训练集和测试集输入至少两种类型的数据驱动模型,其中,每种类型的数据驱动模型包含一个或者多个,数据驱动模型用以自主学习输入数据集的数据特征并输出预测结果,对比所有数据驱动模型的预测精度,并采用预设评价指标从中筛选出不同类型数据驱动模型对应的最优模型;
S3:采用灰色关联度法建立相空间重构条件下不同类型数据驱动模型对应的最优模型的组合模型,利用建立的组合模型对电力负荷进行预测。
2.如权利要求1所述的电力负荷预测方法,其特征在于,步骤S1包括:
S1.1:采用自相关法计算历史负荷数据的延迟时间,混沌时间序列为x1,x2,…,xN-1,xN,对于N个数据点,时间跨度为τ的自相关函数为
Figure FDA0002760746720000011
根据上述自相关函数得到关于延迟时间τ的图像,当自相关函数的值下降到初值的1-1/e倍时,对应的τ为重构相空间的延迟时间;
S1.2:采用伪近邻法计算历史负荷数据的嵌入维数,对混沌时间序列数据,从嵌入维数m=2开始,计算伪最近邻点的比值Sm或者伪最近邻点的个数,增加嵌入维数,重新计算伪最近邻点的比值Sm或者伪最近邻点的个数,当伪最近邻点的比值Sm小于预设比例或者伪最近邻点个数不再减少时,将此时的嵌入维数作为历史负荷数据的嵌入维数,其中,
Figure FDA0002760746720000012
若Sm>S,那么X(t)与Xj(t)为伪最近邻点,其中S为阈值,Rm(t)为X(t)和Xj(t)在嵌入维数为m的空间中的距离,Rm+1(t)为X(t)和Xj(t)在嵌入维数为m+1的空间中的距离;
S1.3:依据延迟时间和嵌入维数分别对训练集和测试集进行相空间重构,具体为:混沌时间序列为x1,x2,…,xN-1,xN,对xt(t=1,2,…,N-(m-1)τ),做如下变换:
xt=(xt,x(t+τ),x(t+2τ),…,x[t+(m-1)τ])T
其中,τ为延迟时间,m为嵌入维数;
根据相空间重构法,将混沌时间序列x1,x2,…,xN-1,xN转换为延时为τ,维数为m的新数据空间,即
Figure FDA0002760746720000021
其中,每一列表示一个向量或相点;
S1.4:利用最大最小归一化算法对负荷数据进行归一化处理:
Figure FDA0002760746720000022
其中,xmin为负荷数据中的最小值,xmax为负荷数据中的最大值,xi为负荷数据中第i个值。
3.如权利要求1所述的电力负荷预测方法,其特征在于,步骤S2中的不同类型的数据模型包括三种,分别为基准模型、神经网络模型以及统计学习模型,其中,数据驱动模型自主学习数据特征的方式为:基准模型将t-1时刻的负荷值作为t时刻的负荷预测值,不经过训练,直接输出,神经网络模型依据测试集数据不断反馈和调整网络权值,利用梯度下降算法寻求网络的最优权值,最后输出测试集的预测结果;统计学习模型根据各自的目标函数求得残差,同样利用梯度下降算法不断优化超参数,最后输出测试集的预测结果。
4.如权利要求3所述的电力负荷预测方法,其特征在于,采用的数据驱动模型包括12个,其中,1个基准模型、5个神经网络模型和6个统计学习模型,
基准模型使可持久化算法:Persistence算法,Persistence算法将t-1时刻的负荷值作为t时刻的负荷预测值;
神经网络模型包括BP神经网络、Elman神经网络、小波神经网络、极限学习机和长短期记忆网络;
统计学习模型包括线性回归、Lasso回归、Ridge回归、Elastic Net回归、支持向量回归和极端梯度提升。
5.如权利要求4所述的电力负荷预测方法,其特征在于,将均方根误差的变异系数和对称平均绝对百分比误差两个评价指标作为预设评价指标,根据预设评价指标得出极限学习机和长短期记忆网络为神经网络模型中的最优模型,极端梯度提升为统计学习模型中的最优模型。
6.如权利要求5所述的电力负荷预测方法,其特征在于,均方根误差的变异系数CVRMSE和对称平均绝对百分比误差SMAPE公式如下:
Figure FDA0002760746720000031
Figure FDA0002760746720000032
其中,yi
Figure FDA0002760746720000033
分别为第i个样本的实际值和预测值,N为样本总数。
7.如权利要求1所述的电力负荷预测方法,其特征在于,步骤S3包括:
S3.1:获得某一长度为N的时间序列在M种预测模型下的预测值xmn,其中,m=1,2,3,...,M,n=1,2,3,...,N,则其组合模型为:
Figure FDA0002760746720000034
其中,lm为第m种模型的权值,且满足
Figure FDA0002760746720000035
采用灰色关联度法求解权值,等价于求解
Figure FDA0002760746720000041
其中,emn为第m种预测模型在n时刻的预测误差;
S3.2:利用建立的组合模型对电力负荷进行日负荷预测和周负荷预测。
CN202011217056.4A 2020-11-04 2020-11-04 一种基于相空间重构和数据驱动的电力负荷预测方法 Pending CN112232593A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011217056.4A CN112232593A (zh) 2020-11-04 2020-11-04 一种基于相空间重构和数据驱动的电力负荷预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011217056.4A CN112232593A (zh) 2020-11-04 2020-11-04 一种基于相空间重构和数据驱动的电力负荷预测方法

Publications (1)

Publication Number Publication Date
CN112232593A true CN112232593A (zh) 2021-01-15

Family

ID=74121968

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011217056.4A Pending CN112232593A (zh) 2020-11-04 2020-11-04 一种基于相空间重构和数据驱动的电力负荷预测方法

Country Status (1)

Country Link
CN (1) CN112232593A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112990557A (zh) * 2021-02-25 2021-06-18 国网河北省电力有限公司保定供电分公司 基于数据驱动集合卡尔曼滤波的电力负荷预测方法和装置
CN113193551A (zh) * 2021-04-27 2021-07-30 长安大学 基于多因素和改进特征筛选策略的短期电力负荷预测方法
CN113505938A (zh) * 2021-07-26 2021-10-15 中国电力科学研究院有限公司 一种超短期风电功率组合预测方法及***
CN113762534A (zh) * 2021-09-10 2021-12-07 广东电网有限责任公司 一种建筑冷热负荷预测方法、装置、设备及存储介质
CN114169730A (zh) * 2021-11-30 2022-03-11 温州科技职业学院 一种基于机器学习的城市垃圾分类工作的评估方法及***
CN114744612A (zh) * 2022-03-30 2022-07-12 国网湖北省电力有限公司荆门供电公司 一种离网型微电网两阶段日前经济调度方法
CN115034426A (zh) * 2022-03-18 2022-09-09 武汉理工大学 一种基于相空间重构与多模型融合Stacking集成学习方式的滚动负荷预测方法
CN116995673A (zh) * 2023-09-26 2023-11-03 宁德时代新能源科技股份有限公司 电力负荷预测方法、电力负荷预测模型训练方法和装置
CN117407675A (zh) * 2023-10-26 2024-01-16 国网青海省电力公司海北供电公司 基于多变量重构联合动态权重的避雷器泄漏电流预测方法
CN117744878A (zh) * 2023-12-26 2024-03-22 国网吉林省电力有限公司经济技术研究院 基于数字化电力***的多中台***构建方法及其***
CN117829207A (zh) * 2024-01-04 2024-04-05 昆明理工大学 一种基于多源传感数据和ga-lstm磨机负荷预测方法
CN117875138A (zh) * 2024-03-12 2024-04-12 大连理工大学 一种机理与数据融合驱动的飞行器结构寿命预测方法
CN117937464A (zh) * 2024-01-09 2024-04-26 广东电网有限责任公司广州供电局 基于psr-dbn组合模型短期电力负荷预测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102915511A (zh) * 2012-09-21 2013-02-06 四川大学 一种电力负荷的混沌相空间神经网络模型安全监测方法
CN104820783A (zh) * 2015-05-08 2015-08-05 重庆科创职业学院 一种短期风速数据的处理方法
CN110006526A (zh) * 2019-01-31 2019-07-12 华北水利水电大学 一种多测点多权重的信息融合算法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102915511A (zh) * 2012-09-21 2013-02-06 四川大学 一种电力负荷的混沌相空间神经网络模型安全监测方法
CN104820783A (zh) * 2015-05-08 2015-08-05 重庆科创职业学院 一种短期风速数据的处理方法
CN110006526A (zh) * 2019-01-31 2019-07-12 华北水利水电大学 一种多测点多权重的信息融合算法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘鑫: ""基于机器学习的短期电力负荷预测方法研究"", 《中国优秀硕士学位论文全文数据库工程科技Ⅱ辑》, no. 8, pages 5 *
赵冬梅等: ""基于相空间重构和长短期记忆算法的电力***无功负荷预测模型"", 《现代电力》, no. 5, pages 1 - 5 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112990557A (zh) * 2021-02-25 2021-06-18 国网河北省电力有限公司保定供电分公司 基于数据驱动集合卡尔曼滤波的电力负荷预测方法和装置
CN113193551A (zh) * 2021-04-27 2021-07-30 长安大学 基于多因素和改进特征筛选策略的短期电力负荷预测方法
CN113505938A (zh) * 2021-07-26 2021-10-15 中国电力科学研究院有限公司 一种超短期风电功率组合预测方法及***
CN113762534A (zh) * 2021-09-10 2021-12-07 广东电网有限责任公司 一种建筑冷热负荷预测方法、装置、设备及存储介质
CN113762534B (zh) * 2021-09-10 2024-08-02 广东电网有限责任公司 一种建筑冷热负荷预测方法、装置、设备及存储介质
CN114169730A (zh) * 2021-11-30 2022-03-11 温州科技职业学院 一种基于机器学习的城市垃圾分类工作的评估方法及***
CN115034426B (zh) * 2022-03-18 2024-07-02 武汉理工大学 一种基于相空间重构与多模型融合Stacking集成学习方式的滚动负荷预测方法
CN115034426A (zh) * 2022-03-18 2022-09-09 武汉理工大学 一种基于相空间重构与多模型融合Stacking集成学习方式的滚动负荷预测方法
CN114744612A (zh) * 2022-03-30 2022-07-12 国网湖北省电力有限公司荆门供电公司 一种离网型微电网两阶段日前经济调度方法
CN116995673A (zh) * 2023-09-26 2023-11-03 宁德时代新能源科技股份有限公司 电力负荷预测方法、电力负荷预测模型训练方法和装置
CN116995673B (zh) * 2023-09-26 2024-02-20 宁德时代新能源科技股份有限公司 电力负荷预测方法、电力负荷预测模型训练方法和装置
CN117407675A (zh) * 2023-10-26 2024-01-16 国网青海省电力公司海北供电公司 基于多变量重构联合动态权重的避雷器泄漏电流预测方法
CN117744878A (zh) * 2023-12-26 2024-03-22 国网吉林省电力有限公司经济技术研究院 基于数字化电力***的多中台***构建方法及其***
CN117829207A (zh) * 2024-01-04 2024-04-05 昆明理工大学 一种基于多源传感数据和ga-lstm磨机负荷预测方法
CN117937464A (zh) * 2024-01-09 2024-04-26 广东电网有限责任公司广州供电局 基于psr-dbn组合模型短期电力负荷预测方法
CN117875138A (zh) * 2024-03-12 2024-04-12 大连理工大学 一种机理与数据融合驱动的飞行器结构寿命预测方法
CN117875138B (zh) * 2024-03-12 2024-06-14 大连理工大学 一种机理与数据融合驱动的飞行器结构寿命预测方法

Similar Documents

Publication Publication Date Title
CN112232593A (zh) 一种基于相空间重构和数据驱动的电力负荷预测方法
Niu et al. Wind power forecasting using attention-based gated recurrent unit network
Liang et al. A novel wind speed prediction strategy based on Bi-LSTM, MOOFADA and transfer learning for centralized control centers
Limouni et al. Accurate one step and multistep forecasting of very short-term PV power using LSTM-TCN model
Tian et al. LSTM-based traffic flow prediction with missing data
Zhang et al. Short-term wind speed forecasting using empirical mode decomposition and feature selection
Dasgupta et al. Nonlinear dynamic Boltzmann machines for time-series prediction
Platt A resource-allocating network for function interpolation
Ding et al. Point and interval forecasting for wind speed based on linear component extraction
Lin et al. Deep belief networks with genetic algorithms in forecasting wind speed
Reunanen et al. Unsupervised online detection and prediction of outliers in streams of sensor data
He et al. CLeaR: An adaptive continual learning framework for regression tasks
US20210342691A1 (en) System and method for neural time series preprocessing
CN115018193A (zh) 基于lstm-ga模型的时间序列风能数据预测方法
CN112734106A (zh) 用于预测能源负荷的方法及装置
CN114694379B (zh) 一种基于自适应动态图卷积的交通流预测方法及***
Song et al. Multi-dimensional evaluation of temporal neural networks on solar irradiance forecasting
Alharbi et al. Short-term solar irradiance forecasting model based on bidirectional long short-term memory deep learning
Zhu et al. EnsP KDE &IncL KDE: a hybrid time series prediction algorithm integrating dynamic ensemble pruning, incremental learning, and kernel density estimation
Cai et al. Hybrid variational autoencoder for time series forecasting
Lin et al. Hybrid water quality prediction with graph attention and spatio-temporal fusion
Arroyo et al. Exponential smoothing methods for interval time series
CN117196105A (zh) 人数预测方法、装置、计算机设备、存储介质
CN116822722A (zh) 水位预测方法、***、装置、电子设备及介质
CN114267422B (zh) 地表水质参数预测方法、***、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination