CN111582567B - 一种基于递阶集成的风电功率概率预测方法 - Google Patents
一种基于递阶集成的风电功率概率预测方法 Download PDFInfo
- Publication number
- CN111582567B CN111582567B CN202010348291.9A CN202010348291A CN111582567B CN 111582567 B CN111582567 B CN 111582567B CN 202010348291 A CN202010348291 A CN 202010348291A CN 111582567 B CN111582567 B CN 111582567B
- Authority
- CN
- China
- Prior art keywords
- model
- prediction
- egpr
- gpr
- subspace
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 230000010354 integration Effects 0.000 title claims abstract description 33
- 230000008569 process Effects 0.000 claims abstract description 31
- 230000002068 genetic effect Effects 0.000 claims abstract description 6
- 230000007246 mechanism Effects 0.000 claims abstract description 6
- 238000012952 Resampling Methods 0.000 claims abstract description 4
- 238000012549 training Methods 0.000 claims description 22
- 238000012795 verification Methods 0.000 claims description 15
- 238000012360 testing method Methods 0.000 claims description 14
- 239000000203 mixture Substances 0.000 claims description 11
- 238000005457 optimization Methods 0.000 claims description 11
- 239000011159 matrix material Substances 0.000 claims description 10
- 238000013507 mapping Methods 0.000 claims description 9
- 239000000126 substance Substances 0.000 claims description 6
- 239000011541 reaction mixture Substances 0.000 claims description 4
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 2
- 230000002123 temporal effect Effects 0.000 claims description 2
- 230000006866 deterioration Effects 0.000 abstract 1
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 3
- 230000002688 persistence Effects 0.000 description 3
- 238000010248 power generation Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000002759 z-score normalization Methods 0.000 description 2
- 102000020897 Formins Human genes 0.000 description 1
- 108091022623 Formins Proteins 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011437 continuous method Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于递阶集成的风电功率概率预测方法。所述方法通过重采样和偏最小二乘法构建子空间集,在每个子空间上利用GMM聚类得到多个局部区域,并建立相应的局部GPR模型,利用贝叶斯推理策略和有限混合机制融合局部模型建立第一层集成模型。采用遗传算法挑选出适合的第一层集成模型进行选择性自适应集成,得到选择性递阶集成高斯过程回归概率预测模型。为了解决风电数据特征的变化导致的性能恶化问题,通过引入自适更新策略,使预测模型有自适应更新的能力。本发明将选择性递阶集成学习框架用于超短期的风电功率预测,与传统集成学习预测方法相比,本发明具有更高的预测精度和稳定性,而且产生的预测区间能为电力调度提供有效参考。
Description
技术领域
本发明涉及风电功率预测技术领域,尤其涉及一种基于递阶集成的风电功率概率预测方法。
背景技术
风能是一种无污染、分布广泛的可再生能源,风力发电技术在近些年得到了迅速发展。但是由于风能的随机性和波动性,不稳定的风电入网会对电力***的安全、稳定产生冲击,从而会影响电网的设备的稳定运行。因此,准确高效的风电功率预测,可以有效促进安排合理的电力调度,为电网安排发电计划、停机检修提供可靠参考,有利于保证***的安全可靠和经济运行。风电功率预测对于发电行业朝着环保、清洁方向发展起着至关重要的作用,有很大的工程应用价值。
集成学习是一种通过构建并结合多个子模型来完成学习任务的策略,常可获得比单一模型更好的性能,从而在风电功率预测领域有着广泛应用。正如我们所知道的,高性能且具有丰富多样性的子模型才能集成出更好的性能。然而,大部分针对于集成学习的风电功率预测研究忽视了从输入数据上来构建子模型的多样性,这不利于得到具有丰富多样性子模型。此外,随着模型的预测时间变长,由于模型是利用历史的数据来建立的,概念漂移现象会不可避免的发生,所以模型应该拥有一定的自适应能力。对于集成模型的自适应有两部分组成,一是子模型要有一定的自适应更新能力,二是集成子模型的权值应不应该是固定的,应是自适应变化的。然而,集成模型的自适应问题在最近的研究中鲜有探讨。
最后,由于风能的随机性强、不确定性高的特点,传统的单点预测不能对风的不确定性做出较好的估计,对于电力***的稳定来说,风电的并网需要对风电的波动范围有比较精确的估计,仅有单点的预测是远远不够的。因此,能够产生概率预测区间的概率建模方法应该被应用于子模型。
发明内容
针对现有技术的不足,本发明提供一种基于递阶集成的风电功率概率预测方法,有效提高了预测模型的准确性和稳定性。
本发明为解决技术问题采用如下技术方案:一种基于递阶集成的风电功率概率预测方法,所述方法包括以下步骤:
步骤(1)选取一段风电场的历史气象数据D作为建模的样本集,将样本集划分为训练集Dtrain、验证集Dval和测试集Dtest,利用Bootstrapping的方式对Dtrain进行多次重采样,得到L个子样本集{(X1,y1),...,(XL,yL)},利用偏最小二乘法(PLS)对子样本集的输入特征变量进行选择并进行重要性排序,删除相同的样本子集,构建出N个子空间{S1,...,SN},保存N个子空间对应训练集样本的输入特征变量索引;
步骤(2)将子空间的索引映射到训练集Dtrain,得到N个子空间训练数据集{Dtra,1,...,Dtra,N},然后利用高斯混合模型GMM在每个子空间上进行聚类,则假设在第i个子空间训练数据集Dtra,i上得到z个局部区域{LD1,LD2,...,LDz},在每个局部区域上利用高斯过程回归进行建模,得到GPR模型集{GPR1,GPR2,...,GPRz};对于一个新样本x*,利用贝叶斯推理策略和有限混合机制得到第i个子空间上第一层集成EGPR模型的预测输出;同理,有N个子空间,可以得到N个第一层集成EGPR模型{EGPR1,EGPR2,...,EGPRN}的预测输出;
步骤(3)根据步骤(2),计算出验证集Dval上N个第一层集成EGPR模型的预测精度RMSE与标准差STD,并将RMSE和STD加权混合后作为模型选择的优化目标,利用遗传算法选择出性能好且稳定的第一层集成EGPR模型,假定选择了M个第一层集成EGPR模型并作为第二层集成的子模型;
步骤(4)利用一种自适应集成的方式将第二层集成的子模型集成获得最终的SHEGPR模型;
步骤(5)随着预测时间的增加,对局部区域LD、GPR模型和GMM模型进行更新。
进一步地,所述步骤(1)中历史气象数据D为风电场过去2~4个月内的气象数据和运行数据,D={X,y},其中p为样本个数,q=f×l,其中f为输入特征的数目,l为延迟变量数;y为预测功率;输入特征包括历史的风速WS、历史的功率P和历史的风向WD。
进一步地,步骤(1)中偏最小二乘法(PLS)对子样本集进行特征选择的具体过程为:
②对βr中的数据从大到小排序,得到{b1,b2,b3,...,bq},根据式(1)判断:
式(1)中,bi为βr中第i个数据,th为设定为0.8~0.9;如果式(1)成立,则将前i个特征对应的索引保存下来;
③重复②直至在L个样本子集上选出L个子空间,删除重复的子空间得到最终的N个子空间。
进一步地,步骤(2)中利用高斯混合模型GMM对子空间聚类后并建立第一层集成EGPR模型的过程如下:
在训练集Dtrain上,设产生的第n个子空间,其中p为样本的个数,c为此子空间上的特征数;设置最大聚类个数v,第n个子空间建立GMM模型,设第n个子空间数据聚为z类,z≤v,即z个局部区域{LD1,LD2,...,LDz};随后,利用高斯过程回归对z个局部区域建立局部模型,得到z个GPR模型,记为{GPR1,GPR2,...,GPRz};
详细地说,对于一个新的样本x*,第i个局部区域GPR模型可描述为
式(4)中,i∈{1,2,3,...,z},LDi代表第i个局部区域;P(x*|LDi)为条件概率,P(LDi)为先验概率;则通过有限混合机制可以得到在第n个子空间上预测输出为:
同理,可计算出混合方差为:
则对于一个新的样本x*,在第n个子空间上,第一层预测EGPR模型的预测输出和预测方差为:
进一步地,所述步骤(3)详细过程如下:
①将子空间的索引映射到验证集Dval,得到在N个子空间上的验证数据集{Dval,1,...,Dval,N},根据步骤(2)获得了N个EGPR模型,在验证集Dval上,得到了N个EGPR模型的预测输出为
②设置遗传算法的初始种群数和迭代数,将EGPR模型的预测精度和混合标准差和加权和作为目标函数:
fobj=λRMSE+(1-λ)σ (8)
式(8)中,λ为一个0-1之间的参数,σ为预测的混合标准差,RMSE代表的是优化过程中的均方根误差;
式(9)中,m为当前被选择的EGPR模型个数;则与真实值对比得到的RMSE为:
式(10)中,Nval为验证集Dval中样本的个数;
通过多次迭代去寻找min{fobj},在验证集Dval将性能好的模型挑选出来,并保存模型的索引。
进一步地,所述步骤(4)详细过程如下:
其中,γ为一个控制权值的参数。
进一步地,所述步骤(5)详细过程如下:
当一个新的样本(xt+1,yt+1)到来时,首先估计新样本(xt+1,yt+1)属于不同局部区域的后验概率,然后选择后验概率值最大对EGPR模型进行更新,假设新样本点xt+1在LDk上具有最大的后验概率(LDk|xt+1),则更新操作包括两个步骤:
①利用移动窗口的方式对第k个局部区域的GPR模型中的协方差矩阵ΣGPR进行更新;
②利用增量更新的方式第k个局部区域中的均值向量μk、协方差矩阵∑k和GMM的混合系数πk进行更新:
πk (t+1)=πk (t)+α(P(k|xt+1)-πk (t)) (17)
本发明的特点如下:本发明提供的基于递阶集成的风电功率概率预测方法,首先,从样本信息和特征信息两个扰动角度产生数据的多样性,通过特征的选择建立多样性的子空间,利用GMM将子空间聚类后建模不仅加快了训练的速度,而且子空间在混合建模后的性能得到了显著的提升。随后,以优化的方式修剪第一层集成后的子模型,这样不仅提升第二层集成模型的性能,而且降低了自适应更新时的运算复杂度。最后,利用自适应集成方式对第二层子模型进行加权融合,使得最终的SHEGPR模型有一定的自适应能力。由于本发明采用GPR作为建模的子模型,使得集成后的SHEGPR模型不仅有较好的预测性能,而且能给出预测区间。
与现有技术相比,本发明的有益效果是:本发明将选择性递阶集成学习框架用于超短期的风电功率预测,与传统的集成学习预测方法相比,所提方法具有更高的预测精度和稳定性,而且产生的预测区间能为电力调度提供有效参考。
附图说明
图1为SHEGPR风电功率预测流程图;
图2为风电场功率和风速、风向之间的映射关系三维图;
图3为4h风电功率预测子空间上GPR和EGPR对比图;
图4为预测间隔为15min、1h、2h和4h的风电功率预测趋势曲线图;
具体实施方式
以下结合附图和具体实施例对本发明的技术方案作进一步详细说明。
实施例1
如图1所示,在本实施例中,以美国可再生能源实验室(NREL)的某风电场的风电功率数据为例,选用其中历史风速、历史功率、历史风向数据作为输入,延迟变量设置为8,功率作为SHEGPR的输出。
步骤1:选取美国可再生能源实验室(NREL)某风电场1-3月的时间分辨率为15分钟的风电功率、风速和风向的历史数据(1天96个数据点),将数据按照顺序划分为训练集Dtrain(3000)、验证集Dval(1000)和测试集Dtest(4000),具体的风电场功率和风速、风向之间的映射关系如图2所示。
步骤2:利用Bootstrapping的方式对Dtrain进行多次重采样,得到L个子样本集{(X1,y1),...,(XL,yL)},利用偏最小二乘法(PLS)对样本的特征进行重要性排序,重复R次并删除重复子空间,得到N个Dtrain的子空间{S1,...,SN},并保存N个子空间对应训练样本的特征索引。
偏最小二乘法(PLS)对子样本集进行特征选择的过程为:
①对训练集Dtrain进行Z-score归一化,利用PLS对L子集进行训练,PLS的主成分个数由交叉验证确定,得到子集回归系数βr,其中r∈{1,...,L},代表着在此子集上输入X中的特征对于y的重要程度。
②对βr中的数据从大到小排序,得到{b1,b2,b3,...,bq},判断
其中,bi为βr中第i个数据,th设定为0.85。如果上式成立,则将前i个特征对应的索引保存下来。
③重复②直至在L个样本子集上选出L个子空间,删除重复的子空间得到最终的N个子空间。
步骤3:①将子空间的索引映射到Dtrain,得到N个子空间训练数据集{Dtra,1,...,Dtra,N},设置GMM的最大聚类数为v,然后对每一个子空间训练数据集建立高斯混合模型(GMM),并保存每一个子空间上GMM模型得到N个GMM模型。假设在第i个子空间训练数据集Dtra,i上进行聚类,得到z个局部区域{LD1,LD2,...,LDz}。上述的GMM算法为:
②对Dtra,i上的z个局部区域{LD1,LD2,...,LDz}中的每一个LD利用高斯过程回归(GPR)进行建模,得到一个GPR模型集,记为{GPR1,GPR2,...,GPRz}。详细的说,对于一个新的样本x*,第i个局部区域GPR模型可描述为:
③重复②N次,对N个子空间训练数据集都建立GPR模型集。
步骤4:将子空间的索引映射到Dval,得到N个子空间验证数据集{Dval,1,...,Dval,N},将每个子空间上的数据进行Z-score归一化。随后,根据步骤3建好的N个GMM模型、GPR模型集和贝叶斯推断策略和有限混合机制得到N个EGPR模型在{Dval,1,...,Dval,N}的预测输出和方差分别为其具体建立EGPR模型如下的过程如下:
其中,i∈{1,2,3,...,z},LDi代表第i个局部区域。P(x*|LDi)为条件概率,P(LDi)为先验概率。则通过有限混合机制可以得到在第n个子空间上预测输出为:
同理,可计算出混合方差为:
则对于一个新的样本x*,在第n个子空间上,第一层预测EGPR模型的预测输出和预测方差为:
步骤5:此步骤构建一个优化问题来选择第二层集成的EGPR模型;首先,已知第一层集成获得了N个EGPR模型,即{EGPR1,EGPR2,...,EGPRN},对所有EGPR模型的索引进行二进制编码,其中1表示选中该模型,0表示未选中;然后,将步骤4得到的EGPR模型在验证集上的预测精度和混合标准差和加权和作为目标函数,采用遗传算法(GA)作为优化算法,通过多次迭代去寻找min{fobj},将性能和差异性好的模型挑选出来,并保存模型的索引,假设最终选出M个优异的EGPR模型用于第二层集成。
优化目标的构建具体如下:
fobj=λRMSE+(1-λ)σ (8)
其中,λ为一个0-1之间的参数,σ为预测的混合标准差,RMSE代表的是优化过程中的均方根误差,详细介绍如下:
其中m为当前被选择的EGPR模型个数,则与真实值对比得到的RMSE为:
其中,Nval为验证集Dval中样本的个数;
步骤6:对于在线预测阶段,对测试集Dtest的样本x*进行预测,预测过程如下:
①将子空间的索引映射到x*,得到N个子空间训练数据集将每个子空间上的数据进行Z-score归一化;同步骤4的理,根据步骤3建好的N个GMM模型、GPR模型集和贝叶斯推断策略和有限混合机制得到N个EGPR模型在的预测输出和方差分别为
其中,γ为一个控制权值的参数。
步骤7:当预测的时间变长,模型的性能无可厚非的会发生退化,所以对模型的进行自适应更新变得非常有必要。当一个新的样本(xt+1,yt+1)到来时,首先估计新样本(xt+1,yt+1)属于不同局部区域的后验概率,然后选择后验概率值最大对EGPR模型进行更新,假设新样本点xt+1在LDk上具有最大的后验概率(LDk|xt+1),则更新操作包括两个步骤:
①利用移动窗口的方式对第k个局部区域的GPR模型中的协方差矩阵ΣGPR进行更新。
②利用增量更新的方式第k个局部区域中的均值向量μk、协方差矩阵∑k和GMM的混合系数πk进行更新:
πk (t+1)=πk (t)+α(P(k|xt+1)-πk (t)) (17)
本发明实施案例采用均方根误差RMSE和决定系数R2对预测效果进行评价,其定义为:
本发明比较了如下方法:(1)GPR全局模型;(2)持续法;(3)基于选择性递阶集成的高斯过程回归(SHEGPR)模型。(4)带自适应更新的基于选择性递阶集成的高斯过程回归SHEGPR(With update)模型(实施例1),比较结果如表1和表2所示。
表1不同预测方法在2小时***性能比较
表2不同预测方法在4小时***性能比较
从表1、表2可以看出,本实施例提出的方法相比于GPR全局和持续法都有较大的改进,从RMSE和R2显著提升都可证明了本发明的有效性和普适性。遗憾的是,GPR全局模型只与持续法性能相当,这是因为GPR建模数据用的是历史样本,由于发生概念漂移,测试集中的性能会下降,而持续法的预测思路是将最近的前一个样本输出作为下一个的预测,此方法利用的是最近的样本信息。所以说,为了对功率进行更准确的预测,模型的自适应更新是风电功率预测中关键的一部分。
从图3中可以看出,在子空间上利用GMM聚类后再利用GPR建模得到EGPR模型与子空间上GPR模型性能有着显著的差异。所以说,本发明提出的GMM聚类后再按类建子模型的做法不仅速度更快,而且性能更好。图4从上到下分别为基于SHEGPR(With update)方法的15min、1h、2h和4h的风电功率预测趋势曲线图,可以看出预测值和实际值拟合的较好。毫无疑问的是,预测时间越短,拟合程度越好。值得一提的是,本发明不仅能对风电功率的趋势进行预测,而且可以得到预测区间来评估风电功率的不确定性,预测区间为电力***的稳定调度提供了强有力的保障。从图4中可以看出,预测时间越短,95%置信区间越窄,说明区间预测的效果越好,越有利于电力***的稳定调度。
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。
Claims (5)
1.一种基于递阶集成的风电功率概率预测方法,其特征在于,所述方法包括以下步骤:
步骤(1)选取一段风电场的历史气象数据D作为建模的样本集,将样本集划分为训练集Dtrain、验证集Dval和测试集Dtest,利用Bootstrapping的方式对Dtrain进行多次重采样,得到L个子样本集{(X1,y1),...,(XL,yL)},利用偏最小二乘法PLS对子样本集的输入特征变量进行选择并进行重要性排序,删除相同的样本子集,构建出N个子空间{S1,...,SN},保存N个子空间对应训练集样本的输入特征变量索引;
所述步骤(1)中历史气象数据D为风电场过去2~4个月内的气象数据和运行数据, 其中p为样本个数,q=f×l,其中f为输入特征的数目,l为延迟变量数;y为预测功率;输入特征包括历史的风速WS、历史的功率P和历史的风向WD;
步骤(2)将子空间的索引映射到训练集Dtrain,得到N个子空间训练数据集{Dtra,1,...,Dtra,N},然后利用高斯混合模型GMM在每个子空间上进行聚类,则设在第i个子空间训练数据集Dtra,i上得到z个局部区域{LD1,LD2,...,LDz},在每个局部区域上利用高斯过程回归进行建模,得到GPR模型集{GPR1,GPR2,...,GPRz};对于一个新样本x*,利用贝叶斯推理策略和有限混合机制得到第i个子空间上第一层集成EGPR模型的预测输出;同理,有N个子空间,可以得到N个第一层集成EGPR模型{EGPR1,EGPR2,...,EGPRN}的预测输出;
步骤(3)根据步骤(2),计算出验证集Dval上N个第一层集成EGPR模型的预测精度RMSE与标准差STD,并将RMSE和STD加权混合后作为模型选择的优化目标,利用遗传算法选择出性能好且稳定的第一层集成EGPR模型,选择了M个第一层集成EGPR模型并作为第二层集成的子模型;
所述步骤(3)详细过程如下:
①将子空间的索引映射到验证集Dval,得到在N个子空间上的验证数据集{Dval,1,...,Dval,N},根据步骤(2)获得了N个EGPR模型,在验证集Dval上,得到了N个EGPR模型的预测输出为
②设置遗传算法的初始种群数和迭代数,将EGPR模型的预测精度和混合标准差和加权和作为目标函数:
fobj=λRMSE+(1-λ)σ (8)
式(8)中,λ为一个0-1之间的参数,σ为预测的混合标准差,RMSE代表的是优化过程中的均方根误差;
式(9)中,m为当前被选择的EGPR模型个数;则与真实值对比得到的RMSE为:
式(10)中,Nval为验证集Dval中样本的个数;
通过多次迭代去寻找min{fobj},在验证集Dval将性能好的模型挑选出来,并保存模型的索引;
步骤(4)利用一种自适应集成的方式将第二层集成的子模型集成获得最终的SHEGPR模型;
步骤(5)随着预测时间的增加,对局部区域LD、GPR模型和GMM模型进行更新。
3.根据权利要求1所述的基于递阶集成的风电功率概率预测方法,其特征在于,步骤(2)中利用高斯混合模型GMM对子空间聚类后并建立第一层集成EGPR模型的过程如下:
在训练集Dtrain上,设产生的第n个子空间,其中p为样本的个数,c为此子空间上的特征数;设置最大聚类个数v,第n个子空间建立GMM模型,设第n个子空间数据聚为z类,z≤v,即z个局部区域{LD1,LD2,...,LDz};随后利用高斯过程回归对z个局部区域建立局部模型,得到z个GPR模型,记为{GPR1,GPR2,...,GPRz};
对于一个新的样本x*,第i个局部区域GPR模型可描述为
式(4)中,i∈{1,2,3,...,z},LDi代表第i个局部区域;P(x*|LDi)为条件概率,P(LDi)为先验概率;则通过有限混合机制可以得到在第n个子空间上预测输出为:
同理,可计算出混合方差为:
则对于一个新的样本x*,在第n个子空间上,第一层预测EGPR模型的预测输出和预测方差为:
5.根据权利要求1所述的基于递阶集成的风电功率概率预测方法,其特征在于,所述步骤(5)详细过程如下:
当一个新的样本(xt+1,yt+1)到来时,首先估计新样本(xt+1,yt+1)属于不同局部区域的后验概率,然后选择后验概率值最大对EGPR模型进行更新,设新样本点xt+1在LDk上具有最大的后验概率(LDk|xt+1),则更新操作包括两个步骤:
①利用移动窗口的方式对第k个局部区域的GPR模型中的协方差矩阵∑GPR进行更新;
②利用增量更新的方式第k个局部区域中的均值向量μk、协方差矩阵∑k和GMM的混合系数πk进行更新:
πk (t+1)=πk (t)+α(P(k|xt+1)-πk (t)) (17)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010348291.9A CN111582567B (zh) | 2020-04-28 | 2020-04-28 | 一种基于递阶集成的风电功率概率预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010348291.9A CN111582567B (zh) | 2020-04-28 | 2020-04-28 | 一种基于递阶集成的风电功率概率预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111582567A CN111582567A (zh) | 2020-08-25 |
CN111582567B true CN111582567B (zh) | 2022-07-01 |
Family
ID=72112613
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010348291.9A Active CN111582567B (zh) | 2020-04-28 | 2020-04-28 | 一种基于递阶集成的风电功率概率预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111582567B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113012766B (zh) * | 2021-04-27 | 2022-07-19 | 昆明理工大学 | 一种基于在线选择性集成的自适应软测量建模方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103793887A (zh) * | 2014-02-17 | 2014-05-14 | 华北电力大学 | 基于自适应增强算法的短期电力负荷在线预测方法 |
CN106505631A (zh) * | 2016-10-29 | 2017-03-15 | 塞壬智能科技(北京)有限公司 | 智能风电风功率预测*** |
CN107451101A (zh) * | 2017-07-21 | 2017-12-08 | 江南大学 | 一种分层集成的高斯过程回归软测量建模方法 |
CN109145949A (zh) * | 2018-07-19 | 2019-01-04 | 山东师范大学 | 基于集成学习的非侵入式电力负荷监测与分解方法及*** |
CN110046378A (zh) * | 2019-02-28 | 2019-07-23 | 昆明理工大学 | 一种基于进化多目标优化的选择性分层集成高斯过程回归软测量建模方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2544324A1 (en) * | 2005-06-10 | 2006-12-10 | Unicru, Inc. | Employee selection via adaptive assessment |
JP6742894B2 (ja) * | 2016-06-09 | 2020-08-19 | 株式会社日立製作所 | データ予測システムおよびデータ予測方法 |
-
2020
- 2020-04-28 CN CN202010348291.9A patent/CN111582567B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103793887A (zh) * | 2014-02-17 | 2014-05-14 | 华北电力大学 | 基于自适应增强算法的短期电力负荷在线预测方法 |
CN106505631A (zh) * | 2016-10-29 | 2017-03-15 | 塞壬智能科技(北京)有限公司 | 智能风电风功率预测*** |
CN107451101A (zh) * | 2017-07-21 | 2017-12-08 | 江南大学 | 一种分层集成的高斯过程回归软测量建模方法 |
CN109145949A (zh) * | 2018-07-19 | 2019-01-04 | 山东师范大学 | 基于集成学习的非侵入式电力负荷监测与分解方法及*** |
CN110046378A (zh) * | 2019-02-28 | 2019-07-23 | 昆明理工大学 | 一种基于进化多目标优化的选择性分层集成高斯过程回归软测量建模方法 |
Non-Patent Citations (6)
Title |
---|
Semi-Supervised Feature Selection via Sparse Rescaled Linear Square Regression;X. Chen 等;《IEEE Transactions on Knowledge and Data Engineering》;20200131;第32卷(第1期);165-176 * |
基于BIM技术的弱电***集成控制平台设计;吕朋朋 等;《自动化与仪器仪表》;20200425(第4期);129-132 * |
基于K均值聚类及高斯过程回归集成的铅酸电池荷电状态预测;田明光等;《软件》;20180115(第01期);140-145 * |
基于实时学习的高斯过程回归多模型融合建模;张伟等;《信息与控制》;20150815(第04期);487-492 * |
基于局部学习和多目标优化的选择性异质集成超短期风电功率预测方法;石立贤 等;《电网技术》;20220107;第46卷(第2期);568-577 * |
基于特征子集相关度和偏最小二乘法的特征选择策略;刘蕾 等;《江西中医药大学学报》;20190122;第31卷(第2期);88-91+124 * |
Also Published As
Publication number | Publication date |
---|---|
CN111582567A (zh) | 2020-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110942205B (zh) | 一种基于himvo-svm的短期光伏发电功率预测方法 | |
CN111929748B (zh) | 一种气象要素预报方法和*** | |
CN112348271A (zh) | 基于vmd-ipso-gru的短期光伏功率预测方法 | |
CN109558975B (zh) | 一种电力负荷概率密度多种预测结果的集成方法 | |
CN110942194A (zh) | 一种基于tcn的风电预测误差区间评估方法 | |
CN110059867B (zh) | 一种swlstm结合gpr的风速预测方法 | |
CN109920248B (zh) | 一种基于gru神经网络的公交到站时间预测方法 | |
CN107346459B (zh) | 一种基于遗传算法改进的多模式污染物集成预报方法 | |
CN115130741A (zh) | 基于多模型融合的多因素电力需求中短期预测方法 | |
CN106649479A (zh) | 一种基于概率图的变压器状态关联规则挖掘方法 | |
CN113469426A (zh) | 基于改进bp神经网络的光伏输出功率预测方法及*** | |
CN106778838A (zh) | 一种预测空气质量的方法 | |
CN110674965A (zh) | 基于动态特征选取的多时间步长风功率预测方法 | |
CN112819238A (zh) | 基于混沌鸡群优化算法的短期风电功率预测方法 | |
CN113722980A (zh) | 海洋浪高预测方法、***、计算机设备、存储介质、终端 | |
CN111582567B (zh) | 一种基于递阶集成的风电功率概率预测方法 | |
CN108694475B (zh) | 基于混合模型的短时间尺度光伏电池发电量预测方法 | |
CN113762591A (zh) | 一种基于gru和多核svm对抗学习的短期电量预测方法及*** | |
CN111310974A (zh) | 一种基于ga-elm的短期需水预测方法 | |
CN116865232A (zh) | 一种基于风速误差修正的中长期风电功率预测方法及*** | |
CN116911459A (zh) | 适应于虚拟电厂的多输入多输出超短期电力负荷预测方法 | |
CN114372615A (zh) | 一种考虑空间相关性的短期光伏功率预测方法及*** | |
CN115545316A (zh) | 基于深度学习混合模型的大气臭氧预测方法 | |
CN115392387A (zh) | 一种低压分布式光伏发电出力预测方法 | |
CN111985692B (zh) | 一种基于ceemdan的用电负荷预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |