CN101551884A - 面向大规模样本的cvr电力负荷快速预测方法 - Google Patents

面向大规模样本的cvr电力负荷快速预测方法 Download PDF

Info

Publication number
CN101551884A
CN101551884A CNA200910083727XA CN200910083727A CN101551884A CN 101551884 A CN101551884 A CN 101551884A CN A200910083727X A CNA200910083727X A CN A200910083727XA CN 200910083727 A CN200910083727 A CN 200910083727A CN 101551884 A CN101551884 A CN 101551884A
Authority
CN
China
Prior art keywords
data
sample
load
prediction
temperature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA200910083727XA
Other languages
English (en)
Other versions
CN101551884B (zh
Inventor
李元诚
刘克文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North China Electric Power University
Original Assignee
North China Electric Power University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North China Electric Power University filed Critical North China Electric Power University
Priority to CN200910083727XA priority Critical patent/CN101551884B/zh
Publication of CN101551884A publication Critical patent/CN101551884A/zh
Application granted granted Critical
Publication of CN101551884B publication Critical patent/CN101551884B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了短期电力负荷预测技术领域中的一种面向大规模样本的CVR电力负荷快速预测方法。技术方案是,首先对缺损的历史数据进行填补,并使用水平校验法和垂直校验法对数据进行校验和平滑处理;然后按照时间流分别对温度和负荷样本集数据进行重组;通过两个CVR分别对以上两个大规模样本数据进行快速训练;最后利用一个CVR对未来时间段内的温度信息进行连续滚动预测生成所要预测时间范围内所有预测点的温度值,利用其结果使用另一个CVR对负荷进行连续的滚动预测直到得到所有预测点的预测值。本发明在超大规模样本下既提高了预测速度又保证了预测精度,能够有效支持对超大规模电力负荷样本的准确、快速预测。

Description

面向大规模样本的CVR电力负荷快速预测方法
技术领域
本发明属于短期电力负荷预测技术领域,尤其涉及一种面向大规模样本的CVR电力负荷快速预测方法。
背景技术
短期电力负荷预测技术可以用于预测电力***未来几小时至几天内的负荷变化趋势情况。它是保障整个电力***安全运行和经济运行的最为重要的环节,同时也是制定发电计划和潮流计算的重要依据。目前基于知识自学习方法在电力负荷预测应用中多采用原始数据的一部分作为训练样本数据,以防止样本数据集过大造成训练时间过长的问题,但其所带来的缺陷是:只能进行局部预测,而且由于样本不完全导致精度降低,并且无法或很难解决特殊情况下的预测需求。例如,传统知识学习方法一般可以预测未来一天n点负荷值或未来一个月每天最大负荷值,而对于预测未来一个月中每天n点的负荷这样的问题,无论是样本选取和构造、训练、验证精度、预测都是非常复杂的。为了解决这些问题,需要构造大规模或超大规模样本集,然而传统方法对大规模样本下训练速度过于缓慢甚至瘫痪,这对于实时性要求较高的电力***是致命的。
为此,本发明通过构造大规模样本集并结合CVR(CORE VECTORREGRESSION:核向量回归)预测算法解决上述问题,并通过一种基于迭代策略的滚动预测方法大大简化从样本生成到输出结果的中间过程,在大幅度降低时空开销的同时保证了预测精度。
对于机器学习在负荷预测领域应用而言,预测过程实际上是通过对已知的负荷数据进行统计分析,找出影响负荷变化的因素并生成训练样本,通过找出样本结构的输入与输出之间的映射关系进而推算出未知的负荷输出量,因此,负荷预测其实质就是一个回归迭代过程。
目前越来越多的机器学习方法开始逐渐引入到短期负荷预测领域,而核方法最为成功地解决了机器学习问题。其中,SVM(SUPPORT VECTORMANCHINE:支持向量机)及SVR(SUPPORT VECTOR REGRESSION:支持向量回归)尤为突出。许多核方法可以归结为QP(QuadraticProgramming:二次规划)问题。在SVR的训练过程中,若m表示训练样本集容量,则QP的时间复杂度为O(m3),空间复杂度至少为O(m2)。因此,当负荷训练样本集规模较大,维数较高时,SVM(或SVR)的主要问题就在于难以克服大规模样本集训练的时空开销过大的问题。
为了降低时空复杂度,常用的方法是得到低阶近似核矩阵或通过矩阵分解。但在大规模样本集下,其结果仍不能满足效率要求。另外可以通过程序分块或矩阵高精度分解近似提高核方法。其中最为常用的SMO(SequentialMinimal Optimization:序贯最小化方法)将原QP分解为一系列尽可能小的QP,其中每一个只包含2个输入变量。采用类似思想的分解算法是使用大量局部SVM组合代替原SVM。此外,还可以简单地利用核矩阵的一个子阵进行替换来对SVM进行降维。
CVM(CORE VECTOR MACHINE:核向量机)是通过MEB(MinimumEnclosing Ball:最小内附球体)算法对SVM执行过程进行近似。观察数据表明SVM的实际执行过程同许多数值演算中所做的类似,通过MEB迭代策略近似得到最优解。在训练过程中,其训练停止判别准则取决于拉格朗日乘子和二元差。实验结果表明近似最优解在实际应用中已经可以满足要求。通过引入计算几何中的MEB近似算法,CVM的时间复杂度可以降到O(m),而空间复杂度不依赖于m。
但是,CVM需要满足以下两个条件:
1)核函数k需满足k(x,x)是一个常数;条件1
2)核方法的QP需要是形如下式的特殊式:
max-α′Kα:α≥0,α′1=1      条件2
尤其是其中不能包含线性关系。其中核函数与SVR中的核函数类似。由此,由于SVR中存在的一个线性关系使其不能满足条件2。
在这种情况下,通过引入一种基于扩展CVM的算法CVR应用于短期负荷预测的训练与预测过程当中,其可以适应于更加广泛的QP形式,同时可以解除核条件约束,换句话说,无论是线性核还是非线性核,都可以利用CVR对数据样本进行训练。
在短期负荷大规模样本集条件下,时空开销将主要体现在训练过程中。因此一种好的回归方法必须考虑在训练过程中所能达到的预测精度和时空复杂度的关系问题,同时能够有效克服样本维数大所带来的训练效能剧降的问题。SVR很好地解决了预测精度的问题,但在大规模和高维训练样本下的训练时空复杂度增长剧烈。另外,CVM可以很好的解决大样本训练时空开销大的问题,但是电力负荷预测的回归特性不能满足其应用条件。为此,本发明的解决思路是:根据前两者的优势,特别是CVM的理论思想,利用在其算法理论基础上扩展而来CVR(核向量回归),通过调整样本集结构和核参数获得CVR回归训练模型,使其最大化地降低时空开销,实现了一种在大规模、高容量训练样本和预测样本下的快速高效且准确度与SVM相当的预测方法。本方法并不针对某一具体应用实例,在电力***的在线和离线负荷预测中都可以应用。
发明内容
本发明的目的在于,针对目前普遍使用的短期电力负荷预测方法时空开销大的问题,提出一种面向大规模样本的CVR电力负荷快速预测方法,用以降低短期电力负荷预测的时空开销,并提高预测精度。
本发明的技术方案是,一种面向大规模样本的CVR电力负荷快速预测方法,其特征在于,所述方法包括下列步骤:
步骤1:对实测数据进行分析处理,包括:
剔除或修正实测数据中的异常点或者干扰、填补缺损数据、对不良数据进行平滑处理;
然后,直接计算与输出量相关系数大于设定值的输入属性;
之后,建立训练样本集和预测样本集,按照时间流排列并使其符合向量机要求的样本格式;
步骤2:构造核函数,选取CVR训练测试参数,根据步骤1生成的测试训练样本,分别将温度训练样本和负荷训练样本投入CVR进行训练并生成训练模型;
步骤3:验证步骤2生成的训练模型,选择统计误差率最小的模型作为最优模型;
步骤4:利用步骤3选择的最优模型对预测样本进行预测。
所述填补缺损数据是采用同一种日期类型的负荷数据作为填补原则,并利用其前后相邻日期的历史数据进行填补;用方程表示如下:
L(d,t)=α1*L(d1,t)+α2*L(d2,t)
其中,L(d,t)为第d天某t时刻的缺损数据,L(d1,t)和L(d2,t)分别为与该日相邻的相同日期类型t时刻负荷数据,α1、α2为前两者各自对应的数据权重。
所述不良数据的判断方法为:以待处理数据相邻的前后两个时刻的负荷数据作为基准并设定阀值,当待处理的数据与其相邻的前后两个时刻的负荷数据的绝对差值各大于所述设定阀值时,则待处理的数据为不良数据。
所述平滑处理是指,将不良数据用其相邻的前后两个时刻的负荷数据的平均值代替。
所述时间流是指样本数据按照时间先后依次流入一个定长的数据队列,使每一条样本记录按照时间点顺序排列,当数据队列满时,自动将最早流入的数据删除。
所述步骤4包括:
步骤41:初始化属性队列,将用于保存将要预测的第一个时间点的前n天同一时刻的温度数据的属性队列T1:{t(dn),t(dn-1),...,t(d1)},以及用于保存第一个预测时间点的前m时刻的温度值的属性队列T2:{t(dm),t(dm-1),...,t(d1)}和前一天最高温度、最低温度组合为第一条温度预测样本记录;
步骤42:利用生成的温度训练模型对温度预测样本进行预测,输出下一时段温度预测值;然后,更新队列T1、T2,对于T1,将下一预测时刻的相应数据填入,若数据不足,则使用已得到的相应点的预测值代替;对于T2,将最近一次的温度预测输出值作为真实值***到队尾,并将队首的数据移出;最后,依据更新后的T1、T2生成新的预测样本记录;并反复迭代这一过程,直到求出所有温度负荷数据;
步骤43:利用温度预测结果对负荷预测样本初始化,其中,将用于保存第一个预测时间点前n天在该时刻的负荷值的属性队列
L1:{l1(dn),l1(dn-1),...,l1(d1)}、
用于保存预测日及前n天在第一个预测时间点的前m时段的负荷数据的属性队列
L2:{l2(dn,tm),l2(dn,tm-1),...,l2(dn,t1),l2(dn-1,tm),l2(dn-1,tm-1),...,l2(dn-1,t1)
,..,l2(d1,tm),l2(d1,tm-1),...,l2(d1,t1),...,l2(d0,tm),l2(d0,tm-1),...,l2(d0,t1)}
和用于保存第一个预测时间点所在日期的星期属性的属性队列W:{w(1),w(2),..,w(7)}与步骤42所得的相应温度预测值组合成第一条负荷预测样本记录;其中,l2(d0,tm),l2(d0,tm-1),...,l2(d0,t1)表示当前预测点的前m个时刻负荷值;
步骤44:利用生成的负荷训练模型对负荷预测样本进行预测,输出下一个时段的负荷预测值;然后,更新队列L1、L2、W,对于L1,将下一预测时刻的相应数据填入,若数据不足,则使用已得到的相应点的预测值代替;对于L2的更新,是将预测结果***到队尾后,删除L2中l2(d0,tm)对应的数据,并将L2中预测日前n天的数据更新,保证每一天所表示的数据对应的时间段一致,若数据不足,使用相应的预测数据代替;依据更新后的L1、L2、W生成新的预测样本记录,并反复迭代这一过程,直到求出所有负荷预测数据。
本发明的效果在于:本发明所提供的用于电力***负荷预测的CVR快速预测方法可以有效减小训练样本规模超大时的时间和空间复杂度,并对于样本维数较高的情况具有较好的抑制时空开销扩大的效果,明显提高了电力短期负荷样本大规模和超大规模情形下的训练速度并保证了和SVM具有相同的预测准确度。
附图说明
图1是本方法提供的面向大规模样本的CVR电力负荷快速预测方法总体流程图;
图2是本方法提供的面向大规模样本的CVR电力负荷快速预测方法中滚动预测流程图;
图3是采用本方法的实施例进行的一个实际应用试验的预测结果局部图。
具体实施方式
下面结合附图,对优选实施例作详细说明。应该强调的是,下述说明仅仅是示例性的,而不是为了限制本发明的范围及其应用。
图1是本方法提供的面向大规模样本的CVR电力负荷快速预测方法总体流程图。图1中,本发明的方法包括如下步骤:
第一步,数据分析处理,包括如下步骤:
(1)进行实测的历史数据预处理。根据数据的一些统计特征量可以找出原始数据的一些可能的异常点并加以剔除或修正。对于数据缺损的处理,如果某一天的数据出现大量的失真数据或没有数据,采用同一种日期类型的负荷数据作为填补原则并利用其前后几天的历史数据进行填补。例如:公休日的缺损数据要用公休日的数据来填补等。用方程表示如下:
L(d,t)=α1*L(d1,t)+α2*L(d2,t)
其中,L(d,t)为第d天某t时刻的缺损数据,L(d1,t)和L(d2,t)分别为与该日相邻的相同日期类型的t时刻负荷数据,α1、α2为前两者各自对应的数据权重。然后通过水平处理和垂直处理法减除数据噪声。在研究历史负荷数据时,将相邻的前后两个时刻的负荷数据作为基准,设定一个待处理数据的最大变化区间(即设定阀值)。这样,只要待处理的负荷数据超出此区间就认为是不良数据,然后对此类数据做出相应的平滑处理,常采用取平均值的方法来纠正。当待处理的负荷数据与其前后值的绝对差值各大于某一设定的阀值时则将当前点的数据用其前后点的数据平均值代替。由于电力负荷具有周期性,若以天为周期,则认为不同日期的同一时刻的负荷数据是具有相似度的,其两者的差距应该维持在一定的范围内(即设定阀值)。如果超出此范围的也可以视为不良数据,当待处理的数据与近几天同一时刻的负荷平均值之差超过设定阀值时,则用后者与阀值的和代替该点的负荷值。
(2)计算和统计相关数据。为减少训练时间以及不必要的样本维数复杂度,可以直接计算与输出量相关系数大于设定值的输入属性,如天最高负荷值、平均负荷值、最低负荷值、统计最高温度、最低温度以及节假日信息等。与输出量相关系数大于设定值的输入属性,是指该输入属性影响预测精度达到某一可接受的误差率的上限,那么就是相关系数较大。比如,我们设定:若影响预测精度2%以上,就必须作为一个属性输入。举个例子,天最大负荷值若不输入,则误差会从98%降到96%以下,那么“天最大负荷值”就是对“输出量相关系数大于设定值的输入属性”。通过我们的反复实验发现,这些输入量相关的包括:天最大负荷值、平均负荷值、最小负荷值、天最高温度、最低温度以及节假日信息等。这里要说明:加入这些量会造成样本维数增高,所以并不是越多越好,我们可以通过一些维数约减的方法处理,也可以在实际应用中灵活取舍。
(3)对温度数据进行样本分析,按照时间序列分别选取当前分析点的历史上n天同一时刻的数据以及该点前m时段的各个温度值,此外还包括:历史上n天每天的最高温度、最低温度、年月日信息、地域差异,结合以上信息构造针对温度的训练样本集。
(4)对负荷数据进行样本分析。本实施例中,设数据采集策略为每天48点,在应用CVR之前首先分析这些数据。其中对预测值影响较大的数据属性如下:
(41)负荷数据。对训练样本集{(xi,yi)},输出yi为某日某一时刻t的负荷值L(d,t),输入xi包含对该负荷值有较大影响的相邻日期历史负荷数据和相同日期类型的同时段负荷数据,具体如下:
(411)预测日前n天在该预测时段的负荷数据:L(d-n,t),…,L(d-1,t);
(412)预测日及前n天在该预测时段前m时段的负荷数据:
L(d-n,t-m),…,L(d-n,t-1),
......
L(d-1,t-m),…,L(d-1,t-1),
L(d,t-m),…,L(d,t-1);
历史负荷数据是影响负荷变化规律最直接的因素,这里设每天48点共两年的数据可构成3万5千条样本记录。每条记录除需要保存(411)、(412)中所列属性外,还需要保存预测点当天最大负荷、平均负荷、最小负荷以及(2)、(3)及(4)当中的属性数据。
(42)节假日因素。研究表明节假日因素很大程度上影响负荷变化。处在节假日日期的负荷明显低于正常日负荷,为使预测值输出更加准确,不但需判断该负荷点所在日是否为节假日而且需判断节假日的类型,主要包括:本日是星期几、是否是周末、是否是重大节日(五一、十一、元旦、春节等)。节假日因素包括星期属性7个,是否重大事件1个,是否重大节日1个。
(43)天气影响。天气会很大程度上影响负荷变化,因此需要将晴、雨、雪等状态数值化并作为一个属性***到训练样本记录中。
(44)温度影响。与天气影响类似,需将平均气温,最高气温,最低气温等温度数据作为属性***样本记录中。
分析数据后,将数据按照时间流排列并使其符合向量机要求的样本格式。按照时间流的顺序,将数据时间流是指样本数据按照时间先后依次流入一个定长的数据队列,使每一条样本记录按照时间点顺序排列,当数据队列满时,自动将最早流入的数据删除。
由以上分析可见,样本规模较大,记录维数较高。
第二步,通过CVR分别对温度训练样本数据和负荷样本数据进行训练并得到相应的回归训练模型。其具体计算步骤如下:
(1)首先将温度训练样本投入CVR进行训练。其具体训练过程参考计算步骤(2)。
(2)将负荷训练样本投入CVR进行训练。其具体过程如下:
(21)核函数的构造与训练参数的选取:
由于向量机首先通过用内积函数定义的非线性变换将输入空间变换到一个高维空间,在这个空间中求广义最优分类面,这样,核函数就反映了高维特征空间中任意两个样本点之间的位置关系。除了选择核函数,还需要预先确定相关的三个参数:平衡系数C、误差ε和核函数的参数γ。对于各参数值的选取,主要通过测试训练样本在某个固定参数值上的错误率,然后不断修正参数以使算法相应的错误率最小。
(211)核函数的选取。不同核函数构造的向量机,预测精度是不相同的。在样本数量较少的情况下,选取不同的核函数,计算时间基本相同。例如:当训练样本选择用2003年3月13,14日两天的负荷作输入,输出为15日负荷数据时样本集中包含96对数据,此时几种核函数构造的CVR计算时间差基本只有1到2秒。但在大规模样本下,试验表明,径向基函数具有绝对的训练速度优势。在实际应用中可以针对具体情况灵活选取。
(212)训练参数的选取:本实施例的样本规模为两年每天48点共3万5千余条记录:
当γ=1,ε=0.1时,随着C的增大,训练时间将变长,训练样本集的标准均方差变小,并且当C∈(0,20000)时,标准均方差随C的增大迅速减小;当C∈[20000,∞]时,标准均方差基本维持不变。
当C=20000,ε=0.1时,标准均方差随γ的增大而变大,并且,当ε∈(0,0.1)时,标准均方差基本维持不变;γ∈[0.1,1]时,标准均方差以很小的幅度随着γ增大;γ∈(1,∞)时,标准均方差迅速增大。
当C=20000,γ=1时,随ε的增大,支持向量数目减少,标准均方差增大,并且,当ε∈[0,0.1]时,随ε增大,支持向量数目逐渐减少,标准均方差几乎不变;当ε∈(0.1,∞)时,随ε增大,支持向量数目迅速减少,标准均方差急剧增大。
基于以上结论,针对以上大规模样本数据可选取径向基函数作为核函数,并将参数初选为C=20000,γ=1,ε=0.1。为进行测试可在以上参数周围区间内选取多个参数作为测试参数。在实际应用中可根据具体情况参考以上分析灵活选取。
(22)使用步骤(21)所确定的参数利用CVR对样本集进行训练。其训练过程如下:
(221)计算生成最小附入球MEB。
样本集S={x1,…,xk},其中xi∈RD表示每一条样本记录,则最小附入球(表示为MEB(S))表示包含S中所有点的最小球。设B(c,R)表示球心为c,半径为R的球,给出ξ>0,则当满足R≤rMEB(S) S ⋐ B ( c , ( 1 + ξ ) R ) 时球B(c,(1+ξ)R)成为MEB(S)的一个关于(1+ξ)的近似球。
(222)找出S的核子集。
令B(c,R)=MEB(δ),当 S ⋐ B ( c , ( 1 + ξ ) R ) 时,子集 δ ⊆ S 表示S的核子集。为此可通过一种简单迭代方法求得:
在第t次迭代时,将当前估计所得球B(ct,Rt)扩展,使其包含落于(1+ξ)球B(ct,(1+ξ)Rt)外最远的点,并重复这一过程直到S中所有的点都被B(ct,(1+ξ)Rt)所覆盖。通过这一迭代策略,则无论是迭代次数和最后生成的核集合的大小都只依赖于ξ而不依赖于样本规模k和样本维数d。
(223)将核方法映射为MEB问题。
考虑支持向量域描述中的硬差值公式:
Figure A20091008372700161
其中
Figure A20091008372700162
表示与已知核k关联的特征映射。B(c,R)表示引入核特征空间中所要求的MEB。则其对偶是一个QP问题max α′diag(K)-α′Kα:α≥0,α′1=1,其中α=[αi,...,αm]′为拉格朗日乘子,0=[0,...,0]′,1=[1,...,1]′,
Figure A20091008372700163
为核矩阵。当k满足:
k(x,x)=κ(常数)                       (2)
将QP中的这一常数关联丢掉则得到约减后的优化问题:
max-α′Kα:α≥0,α′1=1            (3)
相对的,只要核k满足条件(2),则任何形如(3)的QP问题都可被当作MEB问题。
(224)中心约束的MEB问题转换
在SVR中,训练集合{zi=(xi,yi)}i=1 m中xi,yi∈R分别表示输入量和输出量。然后在核特征空间中构造线性函数
Figure A20091008372700164
依据ε-intensive损失函数,其与原始训练数据产生少许偏离。采用如下公式:
min | | w | | 2 + b 2 + C μm Σ i = 1 m ( ξ i 2 + ξ i * 2 ) + 2 C ϵ ‾
约束于:
Figure A20091008372700167
这里μ>0参数用于控制ε尺寸,偏移量b决定惩罚系数,其中自然满足条件ξi ξ i * ≥ 0 . 则相应的对偶形式为:
max Λ ′ Λ * ′ 2 C y - 2 C y - Λ ′ Λ * ′ K ~ Λ Λ *
约束于:|Λ′Λ*′|1=1,Λ,Λ*≥0,        (5)
其中y=[y1,...,ym]′,Λ=[λ1...λm]′, Λ * = [ λ 1 * . . . λ m * ] ′ , 另外
K ~ = [ k ~ ( z i , z j ) ] = K + 11 ′ + μm C I - ( K + 11 ′ ) - ( K + 11 ′ ) K + 11 ′ + μm C I , - - - ( 6 )
(1)式的MEB表示找到一个包含S中所有
Figure A20091008372700173
的最小球。现在添加一个附加参数Δi∈R将每一个
Figure A20091008372700174
扩大为形式
Figure A20091008372700175
,然后找到这些扩大后的点对应的MEB,并将球心最后一个坐标限制为0,则(1)化为:
Δ = [ Δ 1 2 , . . . , Δ m 2 ] ′ ≥ 0 , 则其新的对偶化为:
max α′(diag(K)+Δ)-α′Kα:α≥0,α′1=1            (8)
通过(8)分别计算出:
R = α ′ ( diag ( K ) + Δ ) - α ′ Kα ,
Figure A20091008372700179
由此可得球心c到任意一点的距离表示为:
因为约束α′1=1,所以在目标函数中加入α′1的任意倍数都不会影响α的值。取任意值η∈R,则(8)化为:
max α′(diag(K)+Δ-η1)-α′Kα:α≥0,α′1=1        (11)
α ~ = Λ ′ Λ * ′ 并且
Δ = - diag ( K ~ ) + η 1 + 2 C y - y - - - ( 12 )
当η足够大且Δ≥0时,(5)可化为:
max α ~ ′ ( diag ( K ~ ) + Δ - η 1 ) - α ~ ′ K ~ α ~ : α ~ ≥ 0 , α ~ ′ 1 = 1
至此,已经通过CVR将原QP问题转换为了MEB问题。其中在目标函数中允许包含一个线性关系,同时,核函数既可以选择线性核,也可以选择非线性核。
第三步,对前面生成的多个模型(每个模型可能选取不同参数或将不同时期的数据作为训练样本)进行验证。从历史数据中取出一部分(尽量是时间上较新的数据)作为测试预测样本分别利用各模型进行预测,计算并统计误差信息,最终选取最优的模型作为第四步的预测模型。
第四步,通过第三步所产生的最优模型,对未来负荷进行滚动预测。
图2是本方法提供的面向大规模样本的CVR电力负荷快速预测方法中滚动预测流程图。图2中,面向大规模样本的CVR电力负荷快速预测方法的滚动预测具体过程是:
(1)初始化属性队列构造第一条温度预测样本记录。其中包括:
(11)属性队列T1:{t(dn),t(dn-1),..,t(d1)}用于保存将要预测的第一个时间点的前n天同一时刻的温度数据。
(12)属性队列T2:{t(dm),t(dm-1),..,t(d1)}用于保存第一个预测时间点前m时刻的温度。
(13)将队列T1、T2以及前一天最高温度、最低温度、预测日期、地域差异系数等组合为第一条预测样本记录。地域差异系数是对具体电力企业而言的,在某些地域跨度很大的电网中是有用的,虽然是同一季节,但可能因地处不同地域从而导致用电量不同。举个例子,同样是夏季8月,广州和哈尔滨两个地域因使用空调所增加的用电量肯定是不同的。若不考虑地域因素,将此位全部置0就可以了。具体内容是:我们可以将一些地域划分并用一个数字表示。如:北京、天津等城市是1,上海、南京是2,广州、深圳是3...等等。
(2)进行各时间段的温度预测,其步骤如下:
(21)利用生成的温度训练模型对温度预测样本进行预测,输出下一个时段的温度预测值。
(22)为预测下一个时段更新队列T1、T2
对于T1,将下一预测时刻的相应数据填入,若数据不足,则使用已得到的相应点的预测值代替。当遇到需要将还没有到来时刻的负荷作为输入量构造新的预测样本记录时,我们将前面预测的结果作为真实负荷***。举个例子:当前时间是1月1日,经过几次连续预测后得到了1月2日全天各点的预测值,此时继续预测1月3日的负荷,然而根据样本记录构成可知预测1月3日的负荷需要1月2口的数据作为输入量,但实际上1月2日还没有到来,真实数据还没有产生,为了连续预测,我们将前面1月2口的预测值作为真实值作为输入量***到预测样本记录中。
对于T2,将最近一次的温度预测输出值作为真实值***到队尾,并将队首的数据移出。
(23)更新其他属性值并依据更新后的T1、T2生成新的预测样本记录。包括前一天最高温度、最低温度、预测日期、地域差异系数等等。更新策略是:若下一预测点与当前点在同一天则不更新直接使用上一条样本的相应数据,若下一点是新一天的开始则更新。如:若当前预测时刻是某天的24点,下一预测时刻是次日的00:30(按半小时一点一天48点来说),则需要更新,否则不更新。而后回到步骤(21)反复迭代这一过程,直到求出所有温度负荷数据。
(3)对于负荷预测样本的初始化:
(31)属性队列L1:{l1(dn),l1(dn-1),...,l1(d1)}用于保存第一个预测时间点前n天在该时刻的负荷值。
(32)属性队列
L2:{l2(dn,tm),l2(dn,tm-1),...,l2(dn,t1),l2(dn-1,tm),l2(dn-1,tm-1),...,l2(dn-1,t1)
,...,l2(d1,tm),l2(d1,tm-1),...,l2(d1,t1),..,l2(d0,tm),l2(d0,tm-1),...,l2(d0,t1)}
保存预测日及前n天在第一个预测时间点的前m时段的负荷数据。其中,l2(d0,tm),l2(d0,tm-1),..,l2(d0,t1)表示当前预测点的前m个时刻负荷值。
(33)属性队列W:{w(1),w(2),...,w(7)}用于保存第一个预测时间点所在日期的星期属性,将相应位置1,其余置0。
(34)将队列L1,L2,W与步骤(2)所得的相应温度预测值及其他相关属性组合成第一条负荷预测样本记录。其他相关属性是指除了L1,L2,W与步骤(2)所得的相应温度预测值外,还包括前面几个问题中谈到的例如“节假日属性”、“天气属性”、“区域属性”。
(4)进行各时段的负荷预测,具体过程如下:
(41)利用生成的负荷训练模型对负荷预测样本进行预测,输出下一个时段的负荷预测值。
(42)为预测下一个时段更新队列L1、L2、W。对于L1,将下一预测时刻的相应数据填入,若数据不足,则使用已得到的相应点的预测值代替。L1的更新策略同(22)的T1。需注意的是,对于L2的更新,是将预测结果***到队尾后,删除L2中l2(d0,tm)对应的数据,并将L2中预测日前n天的数据更新,保证每一天所表示的数据对应的时间段一致,若数据不足,使用相应的预测数据代替。
(43)更新其他属性值并依据更新后的L1、L2、W生成新的预测样本记录。其他属性值的更新同(34),而后回到步骤(41)反复迭代这一过程,直到求出所有负荷预测数据。
图3是采用本方法的实施例进行的一个实际应用试验的预测结果局部图。图3只截取了其中一百点,原图为每天48点共一个月的预测结果比较图。
如图3所示,试验环境为:
硬件配置:Intel core25450双核1.6GHz 2GB ram
操作平台环境:windows平台语言版本:c版本
选取参数:c=20000u=0.001
训练时间为:
SVR:约46分,崩溃2次,取8次平均;
CVR:约24分,取10次平均。
误差:
SVR:
均方根误差:26.14;
平均绝对误差:20.09;
中间点绝对误差:17.06;
稀疏相关参数:0.396。
CVR:
均方根误差:14.7;
平均绝对误差:11.5;
中间点绝对误差:9.59;
稀疏相关参数:0.935。
预测时间:
CVR:2.57秒,取10次平均;
SVR:4.672秒,取10次平均。
从图3不难看出,本发明在处理大规模数据样本时,其处理效果接近于真实值,在处理速度提高的同时,其准确度并没有降低。
本发明利用CVR满足一定线性关系并可应用于QP形式的问题的特性,找出数据样本中的一个子集,其成员是对回归贡献最大的向量,即核向量。通过对这个子集进行统计分析从而得出预测结果。子集的容量小,训练速度自然快。然后通过对样本集进行特殊构造和处理来进行一段时期的连续负荷预测。这样构造每次进行训练和预测中间环节少,速度快,效率高,并能保证很好的预测精度。从而解决了SVR在对大容量样本训练时所遇到的训练时间将非常长、过程非常繁琐、并极易出错等问题。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (6)

1.一种面向大规模样本的CVR电力负荷快速预测方法,其特征在于,所述方法包括下列步骤:
步骤1:对实测数据进行分析处理,包括:
剔除或修正实测数据中的异常点或者干扰、填补缺损数据、对不良数据进行平滑处理;
然后,直接计算与输出量相关系数大于设定值的输入属性;
之后,建立训练样本集和预测样本集,按照时间流排列并使其符合向量机要求的样本格式;
步骤2:构造核函数,选取CVR训练测试参数,根据步骤1生成的测试训练样本,分别将温度训练样本和负荷训练样本投入CVR进行训练并生成训练模型;
步骤3:验证步骤2生成的训练模型,选择统计误差率最小的模型作为最优模型;
步骤4:利用步骤3选择的最优模型对预测样本进行预测。
2.根据权利要求1所述的一种面向大规模样本的CVR电力负荷快速预测方法,其特征在于,所述填补缺损数据是采用同一种日期类型的负荷数据作为填补原则,并利用其前后相邻日期的历史数据进行填补;用方程表示如下:
L(d,t)=α1*L(d1,t)+α2*L(d2,t)
其中,L(d,t)为第d天某t时刻的缺损数据,L(d1,t)和L(d2,t)分别为与该日相邻的相同口期类型t时刻负荷数据,α1、α2为前两者各自对应的数据权重。
3.根据权利要求1所述的一种面向大规模样本的CVR电力负荷快速预测方法,其特征在于,所述不良数据的判断方法为:以待处理数据相邻的前后两个时刻的负荷数据作为基准并设定阀值,当待处理的数据与其相邻的前后两个时刻的负荷数据的绝对差值各大于所述设定阀值时,则待处理的数据为不良数据。
4.根据权利要求1所述的一种面向大规模样本的CVR电力负荷快速预测方法,其特征在于,所述平滑处理是指,将不良数据用其相邻的前后两个时刻的负荷数据的平均值代替。
5.根据权利要求1所述的一种面向大规模样本的CVR电力负荷快速预测方法,其特征在于,所述时间流是指样本数据按照时间先后依次流入一个定长的数据队列,使每一条样本记录按照时间点顺序排列,当数据队列满时,自动将最早流入的数据删除。
6.根据权利要求1所述的一种面向大规模样本的CVR电力负荷快速预测方法,其特征在于,所述步骤4包括:
步骤41:初始化属性队列,将用于保存将要预测的第一个时间点的前n天同一时刻的温度数据的属性队列T1:{t(dn),t(dn-1),...,t(d1)},以及用于保存第一个预测时间点的前m时刻的温度值的属性队列T2:{t(dm),t(dm-1),...,t(d1)}和前一天最高温度、最低温度组合为第一条温度预测样本记录;
步骤42:利用生成的温度训练模型对温度预测样本进行预测,输出下一时段温度预测值;然后,更新队列T1、T2,对于T1,将下一预测时刻的相应数据填入,若数据不足,则使用已得到的相应点的预测值代替;对于T2,将最近一次的温度预测输出值作为真实值***到队尾,并将队首的数据移出;最后,依据更新后的T1、T2生成新的预测样本记录;并反复迭代这一过程,直到求出所有温度负荷数据;
步骤43:利用温度预测结果对负荷预测样本初始化,其中,将用于保存第一个预测时间点前n天在该时刻的负荷值的属性队列
L1:{l1(dn),l1(dn-1),...,l1(d1)}、
用于保存预测日及前n天在第一个预测时间点的前m时段的负荷数据的属性队列
L2:{l2(dn,tm),l2(dn,tm-1),...,l2(dn,t1),l2(dn-1,tm),l2(dn-1,tm-1),...,l2(dn-1,t1)
,...,l2(d1,tm),l2(d1,tm-1),...,l2(d1,t1),...,l2(d0,tm),l2(d0,tm-1),...,l2(d0,t1)}
和用于保存第一个预测时间点所在日期的星期属性的属性队列W:{w(1),w(2),...,(7)}与步骤42所得的相应温度预测值组合成第一条负荷预测样本记录;其中,l2(d0,tm),l2(d0,tm-1),...,l2(d0,t1)表示当前预测点的前m个时刻负荷值;
步骤44:利用生成的负荷训练模型对负荷预测样本进行预测,输出下一个时段的负荷预测值;然后,更新队列L1、L2、W,对于L1,将下一预测时刻的相应数据填入,若数据不足,则使用已得到的相应点的预测值代替;对于L2的更新,是将预测结果***到队尾后,删除L2中l2(d0,tm)对应的数据,并将L2中预测日前n天的数据更新,保证每一天所表示的数据对应的时间段一致,若数据不足,使用相应的预测数据代替;依据更新后的L1、L2、W生成新的预测样本记录,并反复迭代这一过程,直到求出所有负荷预测数据。
CN200910083727XA 2009-05-08 2009-05-08 面向大规模样本的cvr电力负荷快速预测方法 Expired - Fee Related CN101551884B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910083727XA CN101551884B (zh) 2009-05-08 2009-05-08 面向大规模样本的cvr电力负荷快速预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910083727XA CN101551884B (zh) 2009-05-08 2009-05-08 面向大规模样本的cvr电力负荷快速预测方法

Publications (2)

Publication Number Publication Date
CN101551884A true CN101551884A (zh) 2009-10-07
CN101551884B CN101551884B (zh) 2011-07-27

Family

ID=41156116

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910083727XA Expired - Fee Related CN101551884B (zh) 2009-05-08 2009-05-08 面向大规模样本的cvr电力负荷快速预测方法

Country Status (1)

Country Link
CN (1) CN101551884B (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101976301A (zh) * 2010-10-09 2011-02-16 广东省电力设计研究院 逐年负荷预测中历史数据预处理的方法与装置
CN102074955A (zh) * 2011-01-20 2011-05-25 中国电力科学研究院 基于知识发现技术的电力***稳定评估及控制方法
CN102156814A (zh) * 2011-04-06 2011-08-17 广东省电力设计研究院 基于聚类的典型日负荷曲线选取方法及装置
CN102426674A (zh) * 2011-10-28 2012-04-25 山东电力集团公司青岛供电公司 一种基于马尔科夫链的电力***负荷预测方法
CN102509173A (zh) * 2011-10-28 2012-06-20 山东电力集团公司青岛供电公司 一种基于马尔科夫链的电力***负荷准确预测方法
CN102567412A (zh) * 2010-12-31 2012-07-11 上海久隆信息工程有限公司 一种计算机辅助电网负荷分析的信息处理方法
CN102682346A (zh) * 2012-05-04 2012-09-19 中国电力科学研究院 一种配电网层次负荷预测模型的修正方法
CN103646351A (zh) * 2013-11-08 2014-03-19 安徽科蓝智能技术有限公司 一种基于电、水、气计量变化而甄别窃取事件的检测方法
CN104636829A (zh) * 2015-02-06 2015-05-20 河海大学 一种提高电力***温度最优潮流计算效率的解耦算法
CN105184424A (zh) * 2015-10-19 2015-12-23 国网山东省电力公司菏泽供电公司 实现多源异构数据融合的多核函数学习SVM的Mapreduce化短期负荷预测方法
CN107092637A (zh) * 2017-02-16 2017-08-25 北京小度信息科技有限公司 数据处理方法及装置
CN107248740A (zh) * 2017-06-15 2017-10-13 贵州电网有限责任公司电力科学研究院 一种家庭用电设备负荷预测方法
CN107316093A (zh) * 2016-04-26 2017-11-03 华为技术有限公司 一种滚动预测的方法、及装置
CN107578124A (zh) * 2017-08-28 2018-01-12 国网山东省电力公司电力科学研究院 基于多层改进gru神经网络的短期电力负荷预测方法
CN108427658A (zh) * 2018-03-12 2018-08-21 北京奇艺世纪科技有限公司 一种数据预测方法、装置及电子设备
CN108539738A (zh) * 2018-05-10 2018-09-14 国网山东省电力公司电力科学研究院 一种基于梯度提升决策树的短期负荷预测方法
WO2019184263A1 (zh) * 2018-03-28 2019-10-03 北京大米科技有限公司 网络线路故障判定方法及服务器
CN110707816A (zh) * 2019-10-16 2020-01-17 佳源科技有限公司 一种分布式配网终端
CN111796523A (zh) * 2020-07-30 2020-10-20 武汉大学 一种基于微扰动法的柔性负荷可控特性在线建模方法
CN112884042A (zh) * 2021-02-23 2021-06-01 新疆大学 一种基于关联向量机的输配电线路最大负荷辨识方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101145225A (zh) * 2007-10-16 2008-03-19 刘吉成 中长期电力负荷预测及预警***
CN101299251A (zh) * 2008-05-07 2008-11-05 天津理工大学 基于概率逆换算法的中长期电力负荷的预测方法
CN101383023B (zh) * 2008-10-22 2011-04-06 西安交通大学 基于样本动态组织与温度补偿的神经网络短期电力负荷预测
CN101425158A (zh) * 2008-12-04 2009-05-06 清华大学 基于新息的短期负荷预测方法

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101976301A (zh) * 2010-10-09 2011-02-16 广东省电力设计研究院 逐年负荷预测中历史数据预处理的方法与装置
CN102567412A (zh) * 2010-12-31 2012-07-11 上海久隆信息工程有限公司 一种计算机辅助电网负荷分析的信息处理方法
CN102074955A (zh) * 2011-01-20 2011-05-25 中国电力科学研究院 基于知识发现技术的电力***稳定评估及控制方法
CN102074955B (zh) * 2011-01-20 2015-06-10 中国电力科学研究院 基于知识发现技术的电力***稳定评估及控制方法
CN102156814B (zh) * 2011-04-06 2014-05-21 中国能源建设集团广东省电力设计研究院 基于聚类的典型日负荷曲线选取方法及装置
CN102156814A (zh) * 2011-04-06 2011-08-17 广东省电力设计研究院 基于聚类的典型日负荷曲线选取方法及装置
CN102509173B (zh) * 2011-10-28 2016-03-02 山东电力集团公司青岛供电公司 一种基于马尔科夫链的电力***负荷准确预测方法
CN102426674B (zh) * 2011-10-28 2015-06-10 山东电力集团公司青岛供电公司 一种基于马尔科夫链的电力***负荷预测方法
CN102426674A (zh) * 2011-10-28 2012-04-25 山东电力集团公司青岛供电公司 一种基于马尔科夫链的电力***负荷预测方法
CN102509173A (zh) * 2011-10-28 2012-06-20 山东电力集团公司青岛供电公司 一种基于马尔科夫链的电力***负荷准确预测方法
CN102682346B (zh) * 2012-05-04 2015-03-25 中国电力科学研究院 一种配电网层次负荷预测模型的修正方法
CN102682346A (zh) * 2012-05-04 2012-09-19 中国电力科学研究院 一种配电网层次负荷预测模型的修正方法
CN103646351A (zh) * 2013-11-08 2014-03-19 安徽科蓝智能技术有限公司 一种基于电、水、气计量变化而甄别窃取事件的检测方法
CN104636829B (zh) * 2015-02-06 2019-05-31 河海大学 一种提高电力***温度最优潮流计算效率的解耦算法
CN104636829A (zh) * 2015-02-06 2015-05-20 河海大学 一种提高电力***温度最优潮流计算效率的解耦算法
CN105184424A (zh) * 2015-10-19 2015-12-23 国网山东省电力公司菏泽供电公司 实现多源异构数据融合的多核函数学习SVM的Mapreduce化短期负荷预测方法
CN107316093B (zh) * 2016-04-26 2021-01-05 华为技术有限公司 一种滚动预测的方法、及装置
CN107316093A (zh) * 2016-04-26 2017-11-03 华为技术有限公司 一种滚动预测的方法、及装置
CN107092637B (zh) * 2017-02-16 2020-01-31 北京星选科技有限公司 数据处理方法及装置
CN107092637A (zh) * 2017-02-16 2017-08-25 北京小度信息科技有限公司 数据处理方法及装置
CN107248740B (zh) * 2017-06-15 2020-03-24 贵州电网有限责任公司电力科学研究院 一种家庭用电设备负荷预测方法
CN107248740A (zh) * 2017-06-15 2017-10-13 贵州电网有限责任公司电力科学研究院 一种家庭用电设备负荷预测方法
CN107578124B (zh) * 2017-08-28 2024-05-17 国网山东省电力公司电力科学研究院 基于多层改进gru神经网络的短期电力负荷预测方法
CN107578124A (zh) * 2017-08-28 2018-01-12 国网山东省电力公司电力科学研究院 基于多层改进gru神经网络的短期电力负荷预测方法
CN108427658A (zh) * 2018-03-12 2018-08-21 北京奇艺世纪科技有限公司 一种数据预测方法、装置及电子设备
WO2019184263A1 (zh) * 2018-03-28 2019-10-03 北京大米科技有限公司 网络线路故障判定方法及服务器
CN108539738B (zh) * 2018-05-10 2020-04-21 国网山东省电力公司电力科学研究院 一种基于梯度提升决策树的短期负荷预测方法
CN108539738A (zh) * 2018-05-10 2018-09-14 国网山东省电力公司电力科学研究院 一种基于梯度提升决策树的短期负荷预测方法
CN110707816B (zh) * 2019-10-16 2020-08-14 佳源科技有限公司 一种分布式配网终端
CN110707816A (zh) * 2019-10-16 2020-01-17 佳源科技有限公司 一种分布式配网终端
CN111796523A (zh) * 2020-07-30 2020-10-20 武汉大学 一种基于微扰动法的柔性负荷可控特性在线建模方法
CN112884042A (zh) * 2021-02-23 2021-06-01 新疆大学 一种基于关联向量机的输配电线路最大负荷辨识方法

Also Published As

Publication number Publication date
CN101551884B (zh) 2011-07-27

Similar Documents

Publication Publication Date Title
CN101551884B (zh) 面向大规模样本的cvr电力负荷快速预测方法
CN107578124B (zh) 基于多层改进gru神经网络的短期电力负荷预测方法
CN113962364B (zh) 一种基于深度学习的多因素用电负荷预测方法
Wang et al. China’s natural gas production and consumption analysis based on the multicycle Hubbert model and rolling Grey model
CN107730054B (zh) 一种基于支持向量回归的燃气负荷组合预测方法
CN110969290B (zh) 一种基于深度学习的径流概率预测方法及***
Xiao et al. Impacts of data preprocessing and selection on energy consumption prediction model of HVAC systems based on deep learning
CN104715292A (zh) 基于最小二乘支持向量机模型的城市短期用水量预测方法
CN105303262A (zh) 一种基于核主成分分析和随机森林的短期负荷预测方法
CN104699890B (zh) 一种城网配变重过载短期预警模型的建模方法
CN109800898A (zh) 一种智能短期负荷预测方法及***
CN106503851A (zh) 一种改进的基于小波分析的短期电力负荷预测方法
CN102231144A (zh) 一种基于Boosting算法的配电网理论线损预测方法
CN108596242A (zh) 基于小波神经网络和支持向量机的电网气象负荷预测方法
CN105184398A (zh) 一种电力最大负荷小样本预测方法
CN115130741A (zh) 基于多模型融合的多因素电力需求中短期预测方法
CN105846425A (zh) 一种基于通用风电预测误差模型的经济调度方法
CN111832839B (zh) 基于充分增量学习的能耗预测方法
CN115358461A (zh) 天然气负荷预测方法、装置、设备、介质
Zeng et al. Forecasting the total energy consumption in China using a new-structure grey system model
CN111680939A (zh) 基于人工智能的企业复工复产程度监控方法
CN114154716B (zh) 一种基于图神经网络的企业能耗预测方法及装置
Mostafaei et al. Hybrid grey forecasting model for Iran’s energy consumption and supply
CN110570041A (zh) 一种基于ap聚类的远景年典型日负荷预测方法
Ran et al. EMD-based gray combined forecasting model-Application to long-term forecasting of wind power generation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110727

Termination date: 20140508