CN116777039A - 基于训练集分段和误差修正的双层神经网络风速预测方法 - Google Patents
基于训练集分段和误差修正的双层神经网络风速预测方法 Download PDFInfo
- Publication number
- CN116777039A CN116777039A CN202310448917.7A CN202310448917A CN116777039A CN 116777039 A CN116777039 A CN 116777039A CN 202310448917 A CN202310448917 A CN 202310448917A CN 116777039 A CN116777039 A CN 116777039A
- Authority
- CN
- China
- Prior art keywords
- neural network
- layer neural
- model
- layer
- wind speed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 76
- 238000012549 training Methods 0.000 title claims abstract description 74
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000012937 correction Methods 0.000 title claims abstract description 22
- 230000011218 segmentation Effects 0.000 title claims abstract description 19
- 238000003062 neural network model Methods 0.000 claims abstract description 49
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 11
- 230000002068 genetic effect Effects 0.000 claims abstract description 10
- 239000010410 layer Substances 0.000 claims description 128
- 238000012360 testing method Methods 0.000 claims description 10
- 239000013598 vector Substances 0.000 claims description 10
- 239000002355 dual-layer Substances 0.000 claims description 9
- 210000002569 neuron Anatomy 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 5
- 238000010200 validation analysis Methods 0.000 claims description 5
- 238000012795 verification Methods 0.000 claims description 5
- 241000218220 Ulmaceae Species 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 description 9
- 230000008901 benefit Effects 0.000 description 6
- 238000013179 statistical model Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000013480 data collection Methods 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000000306 recurrent effect Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于训练集分段和误差修正的双层神经网络风速预测方法,该方法主要包括数据集处理步骤、模型训练与优化步骤、模型预测步骤。本方法在双层神经网络模型中加入了改进的误差修正方法,使用第一层网络的预测误差做为第二层网络的训练集,这种方法使第一层网络的预测误差得到修正,提升了双层神经网络的整体预测精度;同时虑第一层神经网络和第二层神经网络参数之间的相互影响,使用遗传算法寻找模型中的每层神经网络之间的最佳平衡点,确定其合理的超参数,提升了模型在不同地区不同风电场中的适用性。
Description
技术领域
本发明涉及风速预测技术领域,具体涉及一种基于训练集分段和误差修正的双层神经网络风速预测方法。
背景技术
到目前为止,清洁和可再生风能已经为缓解能源危机做出了突出贡献,成为世界上最具成本竞争力的能源之一。虽然风能的优点明显,但其波动性和间歇性的特点给风电并网运行带来了巨大的挑战。准确的风速预测既可以提高电网消纳风电能力,也可以缓解电力***调峰调频压力,保证并入电网后***的安全运行。此外,准确的风电预测还有助于制定调度方案,降低电网运行成本,提高经济效益,为风力发电行业提供有利的支持。因此,实现风速的精准预测,从而实现对风电的科学调度和控制,是推动风电大规模并网的重要手段之一。虽然目前风速预测模型复杂多样,但总体上可以分为4大类:物理模型,统计模型,人工智能模型和组合模型。
物理模型主利用与风速有关的信息,如风向、温度、湿度、气压等,建立多因素预测模型。常见物理模型为数值天气预报(Numerical Weather Prediction,NWP),但是此类模型在数据收集和计算上需要耗费大量的人力物力。目前在NWP的基础上发展了许多相关模型,但一般情况下,此类物理模型适用的范围是长期预测。
统计模型是一种基于相关性原理的因果预测模型。由于短期风速数据自相关性较高,因此在短期预测中能产生较高的预测精度。典型的统计模型包括自回归、自回归移动平均、自回归综合移动平均和分数阶自回归综合移动平均。但是,此类统计模型擅长捕捉线性关系,对高度非线性的风速的预测能力有限。
人工智能模型利用神经网络具有强大的非线性特征的捕捉能力。最早流行预测风速的人工智能模型为反向传播神经网络(Back Propagation Neural Network,BPNN),这是一种典型的多层前馈神经网络。而回声状态网络(Echo State Network,ESN)属于一种特殊的循环神经网络(Recurrent Neural Network,RNN),该模型在时间序列相关的研究领域具有非常优异的预测性能。还有一些神经网络,如极限学习机(Extreme Learning Machine,ELM),长短期记忆网络(Long Short-Term Memory,LSTM)和门控循环单元(GatedRecurrent Unit,GRU)网络等都对风速序列的预测具有良好的能力,特别是LSTM和GRU引入门控机制来控制信息的传递,避免了RNN存在的“梯度消失/***”问题。它们在超短期风速序列方面的预测精度普遍高于统计模型。
组合模型是将多种方法组合形成的一类模型。它能够将不同种类模型所具有的某些优点集合在一起,形成一个预测精度更高的模型。例如,将统计模型对平稳序列有更好的预测能力以及神经网络对非线性序列具有更强的预测能力结合在一起,使得组合模型对更多的序列预测都有很好的适应性。组合模型还经常使用数据预处理和集成学习的思想提升了模型的鲁棒性。除了不同类型的方法结合,还有单层模型向多层模型的发展,应用多层模型具有更强的非线性特征捕捉能力可以进一步提高预测的精度。
尽管有许多类型的预测模型可用,但局限性仍然存在。在预测多个不同地区的风速时,目前还无法确定哪种模型是最好的,因为大部分模型在不同场景下的适应度较差。许多研究证明,由多个基模型组成的组合模型可以获得更好的预测性能。虽然组合模型的预测精度一般高于单一模型,但是组合模型结构复杂,需要消耗大量的训练时间。而且使用模态分解等风速预处理的技术也会使得训练时间大幅度增加。
发明内容
本发明的目的在于克服上述现有技术的不足,提供一种基于训练集分段和误差修正的双层神经网络风速预测方法,以在降低训练时间的同时可提高风速单步短期预测精度,且该方法对于不同地区波动幅度大小区别较大的风速序列都能保持良好和稳定的预测精度。
为实现上述目的,本发明的技术方案是:
一种基于训练集分段和误差修正的双层神经网络风速预测方法,所述双层神经网络的第一层神经网络定义为NN1,第二层神经网络定义为NN2,所述方法包括如下步骤:
数据集处理步骤:
对原始历史风速数据集进行重构,将一维风速序列构造为能输入双层神经网络的维数;
模型训练与优化步骤:
模型训练子步骤:首先构造长度为n1的数据集来作为NN1的训练数据集,并输入NN1进行训练,得到model-NN1;然后使用model-NN1以长度为n2的数据集进行预测,从NN1的预测结果中提取预测误差并进行数据集重构生成NN2的训练集;最后将所生成NN2的训练集输入NN2进行训练,得到model-NN2;经过对长度为n1和n2的数据集的利用,初步得到训练好的双层神经网络模型;
模型优化子步骤:将双层神经网络模型验证集阶段的预测值uvii与真值uvi之间的最大绝对值误差作为遗传算法的适应度函数,采用遗传算法进行超参数搜索,以获得第一层神经网络NN1的训练集的长度n1和第一层神经网络和第二层神经网络的基本超参数,得到最终的双层神经网络模型;
模型预测步骤:将测试集的数据uti输入到最终的双层神经网络模型中,得到最终的预测结果u′ti。
进一步地,所述NN1的训练数据集通过如下方式构造:
初始时刻按顺序取k-1个风速值[u1,u2,...,uk-1]T做为双层神经网络模型的特征值输入,第k个风速值uk做为标签值;下一时刻同样取k-1个风速值[u2,u3,...,uk]T做为双层神经网络模型的特征值输入,第k+1个风速值uk+1做为标签值;以此类推,最后一个特征向量为[ui-k+1,ui-k+2,...,ui-1]T,标签值为ui;从而将原始数据集[u1,u2,...,ui-1,ui]T构造为i-1个特征向量和i-1个特征标签的数据集。
进一步地,使用两个相同的ELM或ESN作为双层神经网络模型的基础学习器。
进一步地,当双层神经网络模型由两个ELM模型叠加组合而成时,每一层ELM隐藏层的神经元数量L设置为[30,500]之间的整数,设置关键参数n1和n2满足两个约束条件n1+n2=1800和n1≥0.1(n1+n2)。
进一步地,当双层神经网络模型由两个ESN模型叠加组合而成时,每一层ESN的输入尺度IS取值范围为[-0.5,0.5]区间的实数,储备池矩阵Wres的稀疏度s取值为0.01,漏积分率α为区间[0,1]的实数,储备池尺寸N的大小取区间[300,1000]的整数。
进一步地,将验证集的实际值定义为uvi,将model-NN1的预测值定义为y′vi,将model-NN1的预测误差定义为evi。这三个值之间存在如下关系:
evi=uvi-y′vi (1)
将NN1的预测结果y′vi与NN2的预测结果e′vi叠加得到双层神经网络的预测值。
进一步地,若构成双层神经网络模型的基本模型为ELM,则基本超参数分别为输入特征数据维数k-1,以及NN1和NN2的隐藏层神经元个数L1和L2,还有第一层网络的训练集长度n1。
进一步地,若构成双层神经网络的基本模型为ESN,则基本超参数分别为输入特征数据维数k-1,以及NN1和NN2的参数IS1,SR1,s1,α1,N1,IS2,SR2,s2,α2,N2和n1。
本发明与现有技术相比,其有益效果在于:
1)所提方法利用历史运行数据进行预测,无需额外采集数据预处理或者模态分解等方法,减少了模型训练的时间。
2)所提方法属于单步预测,但是其高精度和较短的训练时间是其相比于其它复杂组合模型的优势。
3)所提方法预测精度高、稳定性强,在4个数据集上超前15分钟单步预测任务中的性能较好,预测误差远低于常用的BPNN和GRU模型的误差。
4)考虑了单一模型会产生较大的误差,在双层神经网络模型中加入了改进的误差修正方法,使用第一层网络的预测误差做为第二层网络的训练集。这种方法使第一层网络的预测误差得到修正,提升了双层神经网络的整体预测精度。
5)考虑第一层神经网络和第二层神经网络参数之间的相互影响,使用遗传算法寻找模型中的每层神经网络之间的最佳平衡点,确定其合理的超参数,提升了模型在不同地区不同风电场中的适用性。
附图说明
图1为本发明实施例提供的基于训练集分段和误差修正的双层神经网络风速预测方法的总体流程图;
图2为数据集的重构与划分流程图;
图3为双层神经网络模型的训练和预测流程图;
图4为基础学习器的结构图;
图5为不同预测方法在4组数据集的预测曲线对比图。
具体实施方式
实施例:
下面结合附图和实施例对本发明的技术方案做进一步的说明。
在本申请中,缩略语和关键术语定义如下:
数值天气预报:Numerical Weather Prediction,NWP
循环神经网络:Recurrent Neural Network,RNN
回声状态网络:Echo State Network,ESN
极限学习机:Extreme Learning Machine,ELM
反向传播神经网络:BackPropagationNeural Network,BPNN
长短期记忆网络:Long Short-Term Memory,LSTM
均方根误差:Root Mean Square Error,RMSE
平均绝对误差:MeanAbsolute Error,MAE
参阅图1所示,本实施例提供的提供的基于训练集分段和误差修正的双层神经网络风速预测方法主要包括3部分:
1)数据集处理步骤,包括两个子模块:(1)数据集重构,对原始历史风速数据集进行重构,将一维风速序列构造为可以输入双层神经网络的维数;(2)数据集划分,将数据分为训练集、验证集和测试集三部分。
2)模型训练与优化步骤:双层神经网络模型的训练和超参数相互影响,通过验证集对神经网络和超参数进行优化调整,得到最终的优质双层神经网络模型模型。
3)模型预测步骤:将原始测试数据经过处理,然后输入最终的优质双层神经网络模型,得到预测结果用于测试模型性能。
在一具体实施例中,上述的数据集处理步骤主要包括:
原始数据为间隔15min的一维风速序列,为了使数据能够输入到双层神经网络模型中进行训练,需要将数据转换为一组可输入模型的特征向量和相应的标签值。数据集重构和数据集划分的具体方法如图2所示。将双层神经网络模型中的第一层神经网络定义为NN1,第二层神经网络定义为NN2。
首先,按照图2(a),构造第一层神经网络NN1的训练集。初始时刻按顺序取k-1个风速值[u1,u2,...,uk-1]T做为双层神经网络模型的特征值输入,第k个风速值uk做为标签值;下一时刻同样取k-1个风速值[u2,u3,...,uk]T做为双层神经网络模型的特征值输入,第k+1个风速值uk+1做为标签值。以此类推,最后一个特征向量为[ui-k+1,ui-k+2,...,ui-1]T,标签值为ui;从而将原始数据集[u1,u2,...,ui-1,ui]T构造为i-1个特征向量和i-1个特征标签的数据集。
然后,按照图2(b)所示,将NN1的预测误差作为第二层神经网络NN2的输入数据。由于在训练阶段,神经网络并不是完全能拟合真实值达到零误差,因此第一层神经网络NN1从训练阶段到预测阶段的每个时刻均存在误差。从图2(b)中可以看出,从NN1的预测结果中可以提取出预测误差ei作为NN2的训练数据集,将ei构建为NN2训练集的方式与NN1中的方法相似。
图2(c)给出了NN2和NN1的各类数据划分细节,对于长度为n的数据序列[u1,u2,...,un-1,un]T,可以将其切分为长度为n1,n2,n3和n4数据段,其中,n1+n2=0.8n,n3=n4=0.1n。再借助图2(a)和2(b)中的数据集重构和误差提取方法,可以为NN2和NN1构建训练集、验证集和测试集。
在一具体实施例中,上述的模型训练与优化步骤主要包括:
图3左边部分详细展示了双层神经网络模型的训练流程。为便于直观地理解,将图2(a)所示数据的构造模块作为双层神经网络模型训练和预测的子模块。在图3中,将已经训练好的神经网络NN1和NN2分别标示为model-NN1和model-NN2。
首先,构造长度为n1的数据集,并输入NN1进行训练,得到model-NN1;然后,使用model-NN1以长度为n2集进行预测,按照图2(b)中的方式从预测结果中提取预测误差,并按照图2(a)中的数据集重构方式生成NN2的训练集;最后,将构造的误差训练集输入NN2进行训练,得到model-NN2。因此,经过对长度为n1和n2的数据集的利用,可以初步得到训练好的双层神经网络模型。
图3中部详细展示了双层神经网络模型的超参数优化流程。将验证集的实际值定义为uvi,将model-NN1的预测值定义为y′vi,将model-NN1的预测误差定义为evi。这三个值之间存在如下关系:
evi=uvi-y′vi (1)
将NN1的预测结果y′vi与NN2的预测结果e′vi叠加得到双层神经网络的预测值。除了NN1和NN2本身的超参数需要调整外,双层神经网络模型中还有一个非常重要的参数第一层神经网络NN1的训练集的长度n1需要确定。这个参数决定了NN1和NN2训练集的长度。经验证,对于不同区域的不同风速序列,n1的最优值是不同的,每个不同的数据集都有其合适的长度。为了获得每个数据集合适的n1值,遗传算法在对双层神经网络模型的每一层基础学习器进行超参数优化时会自动搜索n1的长度。将双层神经网络模型验证集阶段的预测值u′vi与真值uvi之间的最大绝对值误差(MeanAbsolute Error,MAE)作为遗传算法的适应度函数,采用遗传算法进行超参数搜索,最终会获得合理的第一层和第二层网络的基本超参数,进而得到最得到最终的双层神经网络模型。此处分两种情况对基本超参数进行说明:(1)若构成双层神经网络模型的基本模型为ELM,则超参数分别为输入特征数据维数k-1,以及NN1和NN2的隐藏层神经元个数L1和L2,还有第一层网络的训练集长度n1;(2)若构成双层神经网络的基本模型为ESN,则超参数分别为输入特征数据维数k-1,以及NN1和NN2的参数IS1,SR1,s1,α1,N1,IS2,SR2,s2,α2,N2和n1。
在一具体实施例中,上述的模型预测步骤主要包括:
图3右边部分详细展示了基于双层神经网络模型的预测流程。经过模型训练和超参数优化后,得到最终的双层神经网络模型。此时将NN1和NN2的预测结果分别定义为y′ti和e′ti,将测试阶段NN1的真值和预测误差分别定义为uti和eti。因此,将测试集的数据uti输入到已经优化训练好的双层神经网络模型中,就可以输出最终的预测结果u′ti。
在一具体实施例中,使用两个相同的ELM(或ESN)作为双层神经网络模型的基础学习器,没有进行其它的多种组合。图4给出了这两种神经网络的基本结构。
ELM是一种前馈神经网络,结构简单,训练时间非常短。如图3(a)所示,ELM由输入层、隐藏层和输出层三部分组成。与传统BPNN相比,ELM没有误差反向传播过程,避免了过多迭代产生的复杂数学运算,不仅大幅提高了训练效率,而且满足了隐藏层中非线性运算的需要。对于ELM,给出一个包含任意样本{[χj,oj]∈Rn×Rm}的数据集,其中j=1,2,…,N。如果隐藏层有L个神经元,ELM的输出为:
其中,wi=[wi1,wi2,...,win]T和βi=[βi1,βi2,...,βim]T分别表示输入权重和输出权重;bi为隐含层神经偏置矩阵,Q(.)是激活函数。为了求解β,有如下式子(3):
Hβ=O (3)
其中,O为训练标签;矩阵H、β和O有具体形式,即:
式中,H为ELM隐藏层的输出矩阵;系数β可通过求解最小二乘问题得到,表示为:
式(5)的特解为:
其中,H+为隐藏层输出矩阵的Moore-Penrose广义逆。式(2)-(6)为多输入多输出的ELM模型,但是本发明是一个标签值对应多个特征值的超前一步预测,因此每个时间步的最终输出值为常数yj。
ESN是一种特殊类型的RNN,它使用一个储备池作为信息处理单元,取代了传统的RNN隐藏层。ESN的核心思想是生成一个复杂的状态空间来线性表示输出。通过线性回归方法对回声状态网络进行优化,极大缩短了训练时间。回声状态网络的基本结构如图3(b)所示。储备池状态更新函数如下:
x(t+1)=(1-α)x(t)+αtanh(Wresx(t)+Winu(t)) (7)
其中,t时刻模型的输入为向量u(t)=[u1(t),u2(t),...,uM(t)]T;储备池的状态向量为x(t)=[x1(t),x2(t),...,xN(t)]T;α为ESN的漏积分率;储备池连接权重矩阵Wres是一个维数为N×N的稀疏矩阵;输入矩阵Win维数为N×M,其将输入数据转换为与储备池相等的维数;储备池状态向量x按时间顺序记录在矩阵R中。使用岭回归训练R和Ytarget得到输出权重矩阵Wout,即:
Wout=YtargetRT(RRT+βI)-1 (8)
其中,I是单位矩阵;β是输出正则化因子;Wout维数为P×N。用y′表示预测值,当t时刻输入u(t)时,x(t+1)可由式(6)得到,t+1时刻的预测值y′(t+1)由训练得到的Wout计算得到:
y′(t+1)=Woutx(t+1) (9)
由于只考虑单步预测,因此预测值y′(t+1)应该为是常数,所以表示为y′(t+1)。ESN状态信息会随着时间的推移而变化,并且会添加新的观测数据。
当双层神经网络模型由两个ELM模型叠加组合而成时,每一层ELM隐藏层的神经元数量L设置为[30,500]之间的整数,设置关键参数n1满足两个约束条件n1+n2=1800和n1≥0.1(n1+n2)。约束是为了防止双层神经网络模型在优化过程中陷入局部最优,从而导致双层神经网络模型的某一层神经网络停止运行。
ESN对超参数的变化非常敏感,其5个核心超参数分别是输入尺度IS、谱半径SR、稀疏度s、漏积分率α和储备池尺寸N×N。IS的取值范围为[-0.5,0.5]。当双层神经网络模型由两个ESN模型叠加组合而成时,每一层ESN的IS取值范围为[-0.5,0.5]区间的实数,储备池矩阵Wres的稀疏度s取值为0.01,漏积分率α为区间[0,1]的实数,储备池尺寸N的大小取区间[300,1000]的整数。
下面结合一个算例仿真来对本基于训练集分段和误差修正的双层神经网络风速预测方法进行验证说明:
数据来源
采用中国西北4个不同地区风电场的四组真实风速数据进行测试,每个风速序列长度为2000,时间分辨率为15分钟。采用matlab 2020b作为编程语言,运行***为Windows10,Intel i5-12500H处理器,Nvidia GeForce RTX 3050显卡。
算例结果
将每组数据集按照8:1:1的比例划分为训练集、验证集和测试集。使用前8个数据作为模型的输入预测下一时刻风速,这样会得到较高的预测精度。因此,假设当前时刻为t,利用用t-7到t这8个时刻的历史风速作为模型的输入序列,来预测t+1时刻的风速。同时将预测结果同传统的基于BPNN模型和GRU模型的预测方法进行对比。将两个ELM组合而成的双层神经网络模型定义为D-NN1,两个ESN模型组合而成的双层神经网络模型定义为D-NN2。
评价指标对比结果如表1所示,各个模型在4组数据集上的预测表现分别如图5(a)-(d)所示。表1将每组数据预测最好的指标用加粗标出。由表1中的主要预测指标-根均方误差(Root Mean Square Error,RMSE)可以得到,由双层神经网络模型设计的模型D-NN1和D-NN2的预测结果明显好于BPNN和GRU。BPNN仅有个别指标在数据集1中达到最好,例如MAE等于0.1001,但是这个指标仅作为辅助指标参考。其图5(a)中显示的数据集1的预测结果,BPNN模型和GRU的预测结果在在放大的虚线框中很明显低于本文所提出的模型D-NN1和D-NN2。图5(b)中数据集2的波动明显大于数据集1,因此,截取的80到100这段预测结果放大图中,很明显,BPNN和GRU模型的预测结果误差较大,已经产生了一定的预测滞后现象。因此,这说明了单一模型在序列波动较大的情况下无法准确的捕捉其所蕴含的信息。图5(c)和图5(d)也类似,因为单一的基础模型BPNN和GRU在波动较大的数据段中,都会产生一定的滞后现象,造成了较大的误差。虽然从表1的预测指标R2和ρx,y来看,BPNN和GRU与本发明所提出的模型差距不是很大,但是这仅能说明它们的结果曲线走势很相似。对于主要衡量模型指标RMSE的结果来看,最好的预测结果在四组数据集中分别是D-NN2、D-NN2、D-NN1和D-NN2,它们的大小仅有BPNN的一半左右。模型的预测性能通过这4个指标可以很好的体现出来,因为好的模型基本上它所有的指标都能保持在一个较好的水平,且在不同地区的数据集中也有比较稳定的预测结果,而不是因为换了数据而产生较大的预测误差。
表1不同预测方法的预测误差对比
注:R2:coefficient ofdetermination),ρx,y:Pearson correlationcoefficient.
综上,与现有技术相比,本发明具有以下优点
1)所提方法利用历史运行数据进行预测,无需额外采集数据预处理或者模态分解等方法,减少了模型训练的时间。
2)所提方法属于单步预测,但是其高精度和较短的训练时间是其相比于其它复杂组合模型的优势。
3)所提方法预测精度高、稳定性强,在4个数据集上超前15分钟单步预测任务中的性能较好,预测误差远低于常用的BPNN和GRU模型的误差。
6)考虑了单一模型会产生较大的误差,在双层神经网络模型中加入了改进的误差修正方法,使用第一层网络的预测误差做为第二层网络的训练集。这种方法使第一层网络的预测误差得到修正,提升了双层神经网络的整体预测精度。
7)考虑第一层神经网络和第二层神经网络参数之间的相互影响,使用遗传算法寻找模型中的每层神经网络之间的最佳平衡点,确定其合理的超参数,提升了模型在不同地区不同风电场中的适用性。
上述实施例只是为了说明本发明的技术构思及特点,其目的是在于让本领域内的普通技术人员能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡是根据本发明内容的实质所做出的等效的变化或修饰,都应涵盖在本发明的保护范围内。
Claims (10)
1.一种基于训练集分段和误差修正的双层神经网络风速预测方法,所述双层神经网络的第一层神经网络定义为NN1,第二层神经网络定义为NN2,其特征在于,所述方法包括如下步骤:
数据集处理步骤:
对原始历史风速数据集进行重构,将一维风速序列构造为能输入双层神经网络的维数;
模型训练与优化步骤:
模型训练子步骤:首先构造长度为n1的数据集来作为NN1的训练数据集,并输入NN1进行训练,得到model-NN1;然后使用model-NN1以长度为n2的数据集进行预测,从NN1的预测结果中提取预测误差并进行数据集重构生成NN2的训练集;最后将所生成NN2的训练集输入NN2进行训练,得到model-NN2;经过对长度为n1和n2的数据集的利用,初步得到训练好的双层神经网络模型;
模型优化子步骤:将双层神经网络模型在验证集上预测得到的值u′vi与真值uvi之间的最大绝对值误差作为遗传算法的适应度函数,采用遗传算法进行超参数搜索,以获得第一层神经网络NN1的训练集的长度n1和第一层神经网络和第二层神经网络的基本超参数,得到最终的双层神经网络模型;
模型预测步骤:将测试集的数据uti输入到最终的双层神经网络模型中,得到最终的预测结果u′ti。
2.如权利要求1所述的基于训练集分段和误差修正的双层神经网络风速预测方法,其特征在于,所述NN1的训练数据集通过如下方式构造:
初始时刻按顺序取k-1个风速值[u1,u2,...,uk-1]T做为双层神经网络模型的特征值输入,第k个风速值uk做为标签值;下一时刻同样取k-1个风速值[u2,u3,...,uk]T做为双层神经网络模型的特征值输入,第k+1个风速值uk+1做为标签值;以此类推,最后一个特征向量为[ui-k+1,ui-k+2,...,ui-1]T,标签值为ui;从而将原始数据集[u1,u2,...,ui-1,ui]T构造为i-1个特征向量和i-1个特征标签的数据集。
3.如权利要求1所述的基于训练集分段和误差修正的双层神经网络风速预测方法,其特征在于,使用两个相同的ELM作为双层神经网络模型的基础学习器。
4.如权利要求1所述的基于训练集分段和误差修正的双层神经网络风速预测方法,其特征在于,使用两个相同的ESN作为双层神经网络模型的基础学习器。
5.如权利要求3所述的基于训练集分段和误差修正的双层神经网络风速预测方法,其特征在于,当双层神经网络模型由两个ELM模型叠加组合而成时,每一层ELM隐藏层的神经元数量L设置为[30,500]之间的整数,设置关键参数n1和n2满足两个约束条件。
6.如权利要求5所述的基于训练集分段和误差修正的双层神经网络风速预测方法,其特征在于,所述两个约束条件为n1+n2=1800和n1≥0.1(n1+n2)。
7.如权利要求4所述的基于训练集分段和误差修正的双层神经网络风速预测方法,其特征在于,当双层神经网络模型由两个ESN模型叠加组合而成时,每一层ESN的输入尺度IS取值范围为[-0.5,0.5]区间的实数,储备池矩阵Wres的稀疏度s取值为0.01,漏积分率α为区间[0,1]的实数,储备池尺寸N的大小取区间[300,1000]的整数。
8.如权利要求1所述的基于训练集分段和误差修正的双层神经网络风速预测方法,其特征在于,将验证集的实际值定义为uvi,将model-NN1的预测值定义为y′vi,将model-NN1的预测误差定义为evi,这三个值之间存在如下关系:
evi=uvi-y′vi (1)
将NN1的预测结果y′vi与NN2的预测结果e′vi叠加得到双层神经网络的预测值。
9.如权利要求5所述的基于训练集分段和误差修正的双层神经网络风速预测方法,其特征在于,若构成双层神经网络模型的基本模型为ELM,则基本超参数分别为输入特征数据维数k-1,以及NN1和NN2的隐藏层神经元个数L1和L2,还有第一层网络的训练集长度n1。
10.如权利要求7所述的基于训练集分段和误差修正的双层神经网络风速预测方法,其特征在于,若构成双层神经网络的基本模型为ESN,则基本超参数分别为输入特征数据维数k-1,以及NN1和NN2的参数IS1,SR1,s1,α1,N1,IS2,SR2,s2,α2,N2和n1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310448917.7A CN116777039A (zh) | 2023-04-24 | 2023-04-24 | 基于训练集分段和误差修正的双层神经网络风速预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310448917.7A CN116777039A (zh) | 2023-04-24 | 2023-04-24 | 基于训练集分段和误差修正的双层神经网络风速预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116777039A true CN116777039A (zh) | 2023-09-19 |
Family
ID=87984942
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310448917.7A Pending CN116777039A (zh) | 2023-04-24 | 2023-04-24 | 基于训练集分段和误差修正的双层神经网络风速预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116777039A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116992222A (zh) * | 2023-09-27 | 2023-11-03 | 长江三峡集团实业发展(北京)有限公司 | 一种风要素修正模型的迁移学习方法、装置、设备及介质 |
-
2023
- 2023-04-24 CN CN202310448917.7A patent/CN116777039A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116992222A (zh) * | 2023-09-27 | 2023-11-03 | 长江三峡集团实业发展(北京)有限公司 | 一种风要素修正模型的迁移学习方法、装置、设备及介质 |
CN116992222B (zh) * | 2023-09-27 | 2024-01-26 | 长江三峡集团实业发展(北京)有限公司 | 一种风要素修正模型的迁移学习方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hu et al. | Forecasting energy consumption and wind power generation using deep echo state network | |
Ma et al. | A hybrid attention-based deep learning approach for wind power prediction | |
CN111860982A (zh) | 一种基于vmd-fcm-gru的风电场短期风电功率预测方法 | |
CN108022001A (zh) | 基于pca和分位数回归森林的短期负荷概率密度预测方法 | |
US11831505B2 (en) | Method and system of hybrid data-and-model-driven hierarchical network reconfiguration | |
Chen et al. | NeuCast: Seasonal Neural Forecast of Power Grid Time Series. | |
Chang et al. | A lightweight short-term photovoltaic power prediction for edge computing | |
Li et al. | Deep spatio-temporal wind power forecasting | |
CN116777039A (zh) | 基于训练集分段和误差修正的双层神经网络风速预测方法 | |
CN117114160A (zh) | 一种短期光伏功率预测方法 | |
CN115759389A (zh) | 基于天气类型的相似日组合策略的日前光伏功率预测方法 | |
CN116307211A (zh) | 一种风电消纳能力预测及优化方法及*** | |
CN115995810A (zh) | 一种考虑气象波动自适应匹配的风电功率预测方法及*** | |
CN116014722A (zh) | 基于季节分解和卷积网络的次日光伏发电预测方法及*** | |
Phan et al. | An approach using transformer-based model for short-term PV generation forecasting | |
CN114298132A (zh) | 风电功率预测方法及装置、电子设备 | |
Yu et al. | Short-term load forecasting using deep belief network with empirical mode decomposition and local predictor | |
CN117132132A (zh) | 基于气象数据的光伏发电功率预测方法 | |
Wei et al. | An instance based multi-source transfer learning strategy for building’s short-term electricity loads prediction under sparse data scenarios | |
CN115481788B (zh) | 相变储能***负荷预测方法及*** | |
CN111563631A (zh) | 基于变分模态分解的风力发电功率预测方法及设备 | |
Jiang et al. | Convolutional transformer for fast and accurate gravitational wave detection | |
CN115759343A (zh) | 一种基于e-lstm的用户电量预测方法和装置 | |
Ogawa et al. | PV output forecasting by deep Boltzmann machines with SS‐PPBSO | |
Zhang et al. | A Hybrid Neural Network-Based Intelligent Forecasting Approach for Capacity of Photovoltaic Electricity Generation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |