CN112365033B - 一种风电功率区间预测方法、***及存储介质 - Google Patents
一种风电功率区间预测方法、***及存储介质 Download PDFInfo
- Publication number
- CN112365033B CN112365033B CN202011156336.9A CN202011156336A CN112365033B CN 112365033 B CN112365033 B CN 112365033B CN 202011156336 A CN202011156336 A CN 202011156336A CN 112365033 B CN112365033 B CN 112365033B
- Authority
- CN
- China
- Prior art keywords
- interval
- prediction
- wind power
- neural network
- gru
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 230000006870 function Effects 0.000 claims abstract description 84
- 238000013528 artificial neural network Methods 0.000 claims abstract description 64
- 238000011156 evaluation Methods 0.000 claims abstract description 35
- 210000002569 neuron Anatomy 0.000 claims abstract description 10
- 238000010276 construction Methods 0.000 claims abstract description 7
- 238000012549 training Methods 0.000 claims description 36
- 238000010248 power generation Methods 0.000 claims description 26
- 108090000672 Annexin A5 Proteins 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 12
- 238000012360 testing method Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 7
- 230000010354 integration Effects 0.000 claims description 4
- 238000012795 verification Methods 0.000 claims description 4
- 238000009499 grossing Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 238000013135 deep learning Methods 0.000 abstract description 10
- 238000004364 calculation method Methods 0.000 abstract description 8
- 238000004422 calculation algorithm Methods 0.000 abstract description 7
- 238000011478 gradient descent method Methods 0.000 abstract description 5
- 230000007547 defect Effects 0.000 abstract description 4
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000000306 recurrent effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 1
- 238000004146 energy storage Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Evolutionary Computation (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Wind Motors (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明实施例提供一种风电功率区间预测方法、***及存储介质,综合利用LUBE边界估值理论的一步式预测区间构造特性和GRU神经网络的时间序列建模能力,基于LUBE边界估值理论,建立基于神经网络的区间预测模型,其输出层包含两个神经元,根据输入张量直接生成预测区间;所述神经网络包含GRU循环神经网络与全连接神经网络,GRU对多变量时间序列进行时间依赖性建模,全连接神经网络用于获取预测区间的上下界;其次,针对预测区间的评估函数不可微分的缺点,改进了预测区间评估函数,克服传统LUBE无法采用梯度下降法的难点,有效将GRU深度学习算法整合进LUBE模型体系,在减少计算步骤的情况下,提升预测精度。
Description
技术领域
本发明实施例涉及风力发电技术领域,尤其涉及一种风电功率区间预测方法、***及存储介质。
背景技术
近年来,为应对气候变化和传统能源枯竭,可再生能源发电得到了迅速发展。其中,风力发电作为一种清洁无污染的能源形式,日益融入到电力***中。然而,风速的不确定性及不稳定性给风电***的安全可靠运行带来一定困难,限制了风力发电的快速推广应用。因此,高质量的风电功率预测对于制定最优电力***规划、合理布置储能***具有重要意义。
风电功率预测方法主要分为确定性点预测和概率区间预测两大类。在风电功率预测中,点预测不能完全消除误差,且点预测不揭示任何相关的不确定性;与确定性点预测相比,风力发电的区间预测可以为每个预测目标提供一个预测区间,量化不确定性的程度,为电力***的规划和运行提供更全面的参考。风电功率区间预测方法可分有两种,一种是基于概率分布的方法,另一种是基于LUBE(Lower Upper Bound Estimation)的边界估计方法。概率分布法基于对数据的先验假设,通常先得到点预测,然后根据特定的误差分布假设得到预测区间,常用的预测模型有Delta、贝叶斯、Bootstrap、均值方差估计等。但是,数据假设通常与现实不一致,所得结果存在一定偏差,此外,上述方法实现困难,计算量大。相比之下,LUBE通过一个神经网络,不需要对原始数据进行任何分布假设就能直接得到预测区间,在时间序列预测领域得到了快速发展,但当前LUBE模型的优化方向仍集中在核心预测器的改进、训练方式的改进等层面。
门控循环单元(Gated Recurrent Unit,GRU)神经网络作为一种新兴的数据驱动深度学习方法,在时间序列预测领域得到了广泛关注;就风电功率区间预测而言,由于现有的针对预测区间的损失函数不适用于梯度下降,深度学习算法无法与LUBE模型进行有效结合。如何改进区间预测模型的损失函数,并整合先进的核心预测器,学习到风力发电多变量时间序列数据的深层次的特征、提高预测精度仍然是一个重大难题。
发明内容
本发明实施例提供一种风电功率区间预测方法、***及存储介质,克服传统LUBE无法采用梯度下降法的难点,有效将GRU深度学习算法整合进LUBE模型体系,在减少计算步骤的情况下,提升预测精度。
第一方面,本发明实施例提供一种风电功率区间预测方法,包括:
基于LUBE边界估值理论与GRU神经网络构建风电功率区间预测模型;
基于预测区间覆盖概率和平均预测宽度构建风电功率区间预测损失函数;
基于实际风电场的风力发电时间序列数据构建样本集,所述样本集中每个样本张量包括变量数、滞后窗口和批量大小,每个输出张量对应一个输出预测区间的上下边界;
基于所述样本集进行风电功率区间预测模型训练,基于训练后的风电功率区间预测模型进行风电功率区间预测。
作为优选的,所述基于LUBE边界估值理论与GRU神经网络构建风电功率区间预测模型,具体包括:
基于神经网络构建核心预测器,所述神经网络包括GRU循环神经网络和全连接神经网络;
所述GRU循环神经网络的输出连接全连接神经网络的输入,所述全连接神经网络的输出层仅包括两个神经元,两个神经元用于输出预测区间的上下边界。
作为优选的,所述基于预测区间覆盖概率和平均预测宽度构建风电功率区间预测损失函数,具体包括:
在每个预测批量中,基于预测区间捕获的功率点数推导出预测区间覆盖概率的负对数似然函数;
基于加权系数法结合预测区间覆盖概率和平均预测宽度,以构成风电功率区间预测评估函数;
将预测区间是否捕获功率值表示为0-1二进制量,在风电功率区间预测评估函数中,基于sigmoid函数和软化因子对所述二进制量进行连续化处理,所得梯度连续化的评估函数作为风电功率区间预测模型的损失函数。
作为优选的,所述损失函数的输入为预测区间的上下边界点和目标功率点,训练中在每设定小批量上根据损失函数值进行反向传播运算。
作为优选的,所述风力发电时间序列数据包括风电功率、理论功率曲线、风向和风速。
作为优选的,所述基于所述样本集进行风电功率区间预测模型训练具体包括:
迭代器方式迭代生成数据批量作为输入供风电功率区间预测模型进行学习和预测,设定预测的每个批量的输入包含的特征变量个数、每个变量的时间滞后窗口、每个批量包含样本组数,返回是一个元组,对应输入批量的预测结果。
作为优选的,所述基于实际风电场的风力发电时间序列数据构建样本集,具体包括:
对所述风力发电时间序列数据进行缺失值插补、噪声平滑和数据标准化处理,得到样本集,并将所述样本集划分为训练集、验证集和测试集。
第二方面,本发明实施例提供一种风电功率区间预测***,包括:
模型构建模块,用于基于LUBE边界估值理论与GRU神经网络构建风电功率区间预测模型;
损失函数模块,基于预测区间覆盖概率和平均预测宽度构建风电功率区间预测损失函数;
样本模块,基于实际风电场的风力发电时间序列数据构建样本集,所述样本集中每个样本张量包括变量数、滞后窗口和批量大小,每个输出张量对应一个输出预测区间的上下边界;
训练模块,基于所述样本集进行风电功率区间预测模型训练,基于训练后的风电功率区间预测模型进行风电功率区间预测。
第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明第一方面实施例所述风电功率区间预测方法的步骤。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如本发明第一方面实施例所述风电功率区间预测方法的步骤。
本发明实施例提供的一种风电功率区间预测方法、***及存储介质,综合利用LUBE边界估值理论的一步式预测区间构造特性和GRU神经网络的时间序列建模能力,基于LUBE边界估值理论,建立基于神经网络的区间预测模型,其输出层包含两个神经元,根据输入张量直接生成预测区间;所述神经网络包含GRU循环神经网络与全连接神经网络,GRU对多变量时间序列进行时间依赖性建模,全连接神经网络用于获取预测区间的上下界;其次,针对预测区间的评估函数不可微分的缺点,改进了预测区间评估函数,采用新的风电功率区间预测模型训练方式,克服传统LUBE无法采用梯度下降法的难点,有效将GRU深度学习算法整合进LUBE模型体系,在减少计算步骤的情况下,提升预测精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为根据本发明实施例的风电功率区间预测方法流程框图;
图2为根据本发明实施例的风电功率区间预测模型结构示意图;
图3为根据本发明实施例的GRU神经网络工作原理图;
图4为根据本发明实施例的区间预测效果对比图;
图5为根据本发明实施例的服务器示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请实施例中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
本申请实施例中的术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。本申请的描述中,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列部件或单元的***、产品或设备没有限定于已列出的部件或单元,而是可选地还包括没有列出的部件或单元,或可选地还包括对于这些产品或设备固有的其它部件或单元。本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
门控循环单元(Gated Recurrent Unit,GRU)神经网络作为一种新兴的数据驱动深度学习方法,在时间序列预测领域得到了广泛关注;就风电功率区间预测而言,由于现有的针对预测区间的损失函数不适用于梯度下降优化,深度学习算法无法与LUBE模型进行有效结合。如何改进区间预测模型的损失函数,并整合先进的核心预测器,学习到风力发电多变量时间序列数据的深层次的特征、提高预测精度仍然是一个重大难题。
因此,本发明实施例提供一种风电功率区间预测方法、***及存储介质,针对预测区间的评估函数不可微分的缺点,改进了预测区间评估函数,采用新的风电功率区间预测模型训练方式,克服传统LUBE无法采用梯度下降法的难点,有效将GRU深度学习算法整合进LUBE模型体系,在减少计算步骤的情况下,提升预测精度。以下将通过多个实施例进行展开说明和介绍。
图1为本发明实施例提供一种风电功率区间预测方法,包括:
步骤S1、基于LUBE边界估值理论与GRU神经网络构建风电功率区间预测模型;
具体地,以GRU神经网络作为LUBE预测模型的核心预测器,充分利用GRU神经网络的时间序列建模能力,从多变量时间序列数据中捕捉到未来功率的变化趋势,提高预测性能。
LUBE边界估值理论采用一个神经网络作为核心预测器(核心预测器是可替换的,可针对特定场景选择不同的网络结构),该神经网络的输出层仅含2个神经元,根据输入张量直接得到预测区间的上下界;所述神经网络包括GRU循环神经网络与全连接神经网络两部分,GRU对输入样本进行时间依赖性建模,得到的特征经过全连接神经网络拟合成预测区间的上下边界值;
本发明实施例中,核心预测器含1层GRU神经网络与2层全连接神经网络,GRU层含64个神经元,全连接层的神经元数分别为16和2。
步骤S2、基于预测区间覆盖概率和平均预测宽度构建风电功率区间预测损失函数;
具体地,风电功率区间预测模型不能基于误差进行评估,需要综合衡量预测区间覆盖概率与平均预测宽度;假设在每个预测批量中,预测区间捕获的功率点数服从二项分布,推导出预测区间覆盖概率的负对数似然形式,基于加权系数法有效结合预测区间覆盖概率与平均预测宽度,形成风电功率区间预测评估指标;预测区间是否捕获功率值表示为0-1二进制量,基于sigmoid函数对其作软化处理,使得预测区间评估函数可梯度优化,并作为风电功率区间预测模型的损失函数。
步骤S3、基于实际风电场的风力发电时间序列数据构建样本集,所述样本集中每个样本张量包括变量数、滞后窗口和批量大小,每个输出张量对应一个输出预测区间的上下边界;
具体地,由原始数据集生成满足本发明实施例的样本集,该样本集为三维张量到一维张量的映射的集合,输入含变量数、滞后窗口、批量大小三个维度,输出为对应批量的功率预测区间的上下界。在模型训练和测试过程中,以迭代器方式不断迭代生成数据批量作为输入供预测模型进行学习和预测,该生成器指定预测的输入包含多少个特征变量、每个变量的时间滞后窗口、每个批量包含多少组样本,其返回是一个元组,对应输入批量的预测结果(预测区间的上下界);在本发明实施例中,设定每个训练批量包含100组样本、滞后窗口为3、预测目标在未来1个时间步,即:根据过去3个时刻的风电功率、风速等4个属性的历史信息,预测下一个时刻的风电功率值所落在的范围。
步骤S4、基于所述样本集进行风电功率区间预测模型训练,基于训练后的风电功率区间预测模型进行风电功率区间预测。
具体地,损失函数的输入为预测区间的上、下边界点与目标功率点,训练中在每个小批量上根据损失函数值进行反向传播运算,并选择预测区间覆盖概率(predictioninterval coverage probability,PICP)、平均预测区间宽度(mean prediction intervalwidth,MPIW)、组合指标CWC(combinational coverage width-based criterion)、区间分数Score作为模型的误差评价指标,衡量预测的优劣。
在上述各实施例的基础上,步骤S3、基于实际风电场的风力发电时间序列数据构建样本集,具体包括:
S301、风力发电时间序列数据采集与预处理;
对所述风力发电时间序列数据进行缺失值插补、噪声平滑和数据标准化处理,得到样本集,并将所述样本集划分为训练集、验证集和测试集。
在本发明实施例中,数据集来源于某风电场,该数据集包含2018年1月1日至2018年12月31日期间每十分钟的风电功率数据与气象数据,包含:有功功率、理论功率曲线、风向、风速等4个特征,总数据量为50530行数据,将前35000行数据作为训练集,35001-45000行作为验证集,45001-50530行作为测试集。最后,将整个数据集作标准化处理,即减去每个特征的均值,再除以各个特征的方差:
其中,xi mean为第i个特征变量的均值;σi x表示第i个特征变量的方差;xi std为第i个特征变量标准化后的数据;xi为第i个特征变量的原始数据;
S302、训练样本集构建;
由原始数据集生成满足本发明实施例的训练样本集,该样本集为三维张量到一维张量的映射的集合,输入含变量数、滞后窗口、批量大小三个维度,输出为对应批量的功率预测区间的上下界。在模型训练和测试过程中,以迭代器方式不断迭代生成数据批量作为输入供预测模型进行学习和预测,该生成器指定预测的输入包含多少个特征变量、每个变量的时间滞后窗口、每个批量包含多少组样本,其返回是一个元组,对应输入批量的预测结果(预测区间的上下界);在本发明实施例中,设定每个训练批量包含100组样本、滞后窗口为3、预测目标在未来1个时间步,即:根据过去3个时刻的风电功率、风速等4个属性的历史信息,预测下一个时刻的风电功率值所落在的范围;
图3是GRU的工作原理,GRU是循环神经网络(Recurrent Neural Network,RNN)的一种改进版本,其目的是学习输入样本的长期依赖关系,并解决反向传播中的梯度相关问题。GRU将当前输入与上一时刻传递下来的隐状态(其包含了过去的信息)相结合,得到当前时刻的输出并传递到下一时刻的隐状态。如图3所示,首先,重置门和更新门的控制信号由前一时刻的隐状态ht-1和当前输入xt决定:
rt=σ(Wr⊙[ht-1,xt]) (2)
zt=σ(Wz⊙[ht-1,xt]) (3)
其中Wr和Wz分别为每个门控的权重,σ为sigmoid激活函数,⊙表示卷积运算;rt为重置门的控制信号,zt为更新门的控制信号。
然后,通过重置门计算重置后的隐状态信息,将其与输入拼接,并通过双曲正切函数缩放到-1与1之间的候选状态:
其中,Wh为权重矩阵。
最后,通过更新门综合隐状态和候选状态,表示对过去的遗忘和对当前的记忆,生成新的隐状态和输出:
在全连接网络模块中,隐藏层使用线性整流函数ReLU函数激活,输出层的两个神经元使用线性函数Linear激活。
在上述各实施例的基础上,作为一种优选的实施方式,所述基于预测区间覆盖概率和平均预测宽度构建风电功率区间预测损失函数,具体包括:
在每个预测批量中,基于预测区间捕获的功率点数推导出预测区间覆盖概率的负对数似然函数;
基于加权系数法结合预测区间覆盖概率和平均预测宽度,以构成风电功率区间预测评估函数;
将预测区间是否捕获功率值表示为0-1二进制量,在风电功率区间预测评估函数中,基于sigmoid函数和软化因子对所述二进制量进行连续化处理,所得梯度连续化的评估函数作为风电功率区间预测模型的损失函数。
具体地,在本实施例中,步骤S2具体包括:
S201、风电功率区间预测评估指标;
所述预测模型不能基于误差进行评估,需要综合衡量预测区间覆盖概率与平均预测宽度,为此,选择预测区间覆盖概率(prediction interval coverage probability,PICP)、平均预测区间宽度(mean prediction interval width,MPIW)、组合指标CWC(combinational coverage width-based criterion)、区间分数Score作为模型的误差评价指标,衡量预测的优劣;
定义PICP和MPIW如下:
其中,X和y分别表示输入与输出,n个样本数量,其中ci揭示第i个目标值yi是否落在上边界U(Xi)与下边界L(Xi)之间:
PICP是预测区间质量的关键指标,衡量预测区间的可靠性。PICP越高,越多真实值是包含在区间内。一般来说,PICP要大于一定的置信水平,才能得到高质量的区间预测结果。
CL=(1-α)×100% (10)
其中,α为置信度。
为了同时评价预测区间的覆盖概率和平均宽度,定义组合指标CWC(combinationalcoverage width-based criterion)如下:
其中,R为目标区间的宽度,μ设置为置信水平CL,λ用来放大PICP与μ之间的差异,γ是一个阶跃函数:
此外,采用区间评分综合指标评价预测区间的校准和锐度,假设一个区间的宽度为:
wi=U(Xi)-L(Xi) (13)
综合预测区间得分为:
其中,Si为单个区间的得分,定义如下:
S202、风电功率区间预测损失函数推导;
假设在每个预测批量中,预测区间捕获的功率点数服从二项分布,推导出预测区间覆盖概率的负对数似然形式,基于加权系数法有效结合预测区间覆盖概率与平均预测宽度,形成新的风电功率区间预测评估指标;预测区间是否捕获功率值表示为0-1二进制量,基于sigmoid函数对其作软化处理,使得预测区间评估函数可梯度优化,并作为区间预测模型的损失函数;
具体为:
设k为批量为n的样本中区间捕获到目标值的数量:
其中,ci为一个伯努利随机变量,其取值为1的概率为(1-α),假设每个ci是独立同分布的,则总捕获数k服从二项分布:
k~B(n,1-α) (17)
对模型参数θ的似然函数为:
其中,
根据棣莫弗—拉普拉斯中心极限定理,二项分布可以进一步近似为正态分布。当n足够大时,
求得该问题的负对数似然(NLL)为:
在S201中,MPIW的计算覆盖了所有样本,而本实施例只需要优化捕捉到的数据点,因此,定义MPIWcap如下:
结合以上两式,引入平衡因子λ1和λ2,得到新的评估函数被:
值得注意的是,该评估函数中的c是二进制量,在实际计算中,用其作软化处理,保证评估函数是梯度光滑的,并将该评估函数作为预测模型的损失函数:
ci=σ(s(yi-L(Xi)))⊙σ(s(U(Xi)-yi)) (24)
其中,为sigmoid激活函数,s为软化因子。
所述损失函数的输入为预测区间的上、下边界点与目标功率点,训练中在每个小批量上根据损失函数值进行反向传播运算。
在上述各实施例的基础上,作为一种优选的实施方式,所述损失函数的输入为预测区间的上下边界点和目标功率点,训练中在每设定小批量上根据损失函数值进行反向传播运算。
在上述各实施例的基础上,作为一种优选的实施方式,所述风力发电时间序列数据包括风电功率、理论功率曲线、风向和风速。
步骤S4、基于所述样本集进行风电功率区间预测模型训练;
本发明实施例中,区间预测模型通过Python语言和Keras深度学习框架实现,本发明实施例对比了传统LUBE方法、均值方差估计方法(Mean-variance estimation,MVE)两种经典方法与新兴的EGD(Efficient Gradient Descent)方法。训练过程中的相关参数见表1。
表1模型训练方法记录各预测模型在测试集上的评估结果,如表2所示,最优值加粗。
表2不同模型评估结果
在本发明与其他三种方法的比较中发现,在所有方法均满足95%置信水平的覆盖概率下,本发明得到最小的平均预测区间宽度、最低的组合指标CWC和最优的区间分数Score;此外,图4展示了各方法在风电预测测试集上的预测结果,可知本发明具有最优的预测区间,充分说明了本发明具有更好的预测效果。
本发明实施例还提供一种风电功率区间预测***,基于上述各实施例中的风电功率区间预测方法,包括:
模型构建模块,用于基于LUBE边界估值理论与GRU神经网络构建风电功率区间预测模型;
损失函数模块,基于预测区间覆盖概率和平均预测宽度构建风电功率区间预测损失函数;
样本模块,基于实际风电场的风力发电时间序列数据构建样本集,所述样本集中每个样本张量包括变量数、滞后窗口和批量大小,每个输出张量对应一个输出预测区间的上下边界;
训练模块,基于所述样本集进行风电功率区间预测模型训练,基于训练后的风电功率区间预测模型进行风电功率区间预测。
基于相同的构思,本发明实施例还提供了一种服务器示意图,如图5所示,该服务器可以包括:处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行如上述各实施例所述风电功率区间预测方法的步骤。例如包括:
基于LUBE边界估值理论与GRU神经网络构建风电功率区间预测模型;
基于预测区间覆盖概率和平均预测宽度构建风电功率区间预测损失函数;
基于实际风电场的风力发电时间序列数据构建样本集,所述样本集中每个样本张量包括变量数、滞后窗口和批量大小,每个输出张量对应一个输出预测区间的上下边界;
基于所述样本集进行风电功率区间预测模型训练,基于训练后的风电功率区间预测模型进行风电功率区间预测。
此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
基于相同的构思,本发明实施例还提供一种非暂态计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序包含至少一段代码,该至少一段代码可由主控设备执行,以控制主控设备用以实现如上述各实施例所述风电功率区间预测方法的步骤。例如包括:
基于LUBE边界估值理论与GRU神经网络构建风电功率区间预测模型;
基于预测区间覆盖概率和平均预测宽度构建风电功率区间预测损失函数;
基于实际风电场的风力发电时间序列数据构建样本集,所述样本集中每个样本张量包括变量数、滞后窗口和批量大小,每个输出张量对应一个输出预测区间的上下边界;
基于所述样本集进行风电功率区间预测模型训练,基于训练后的风电功率区间预测模型进行风电功率区间预测。
基于相同的技术构思,本申请实施例还提供一种计算机程序,当该计算机程序被主控设备执行时,用以实现上述方法实施例。
所述程序可以全部或者部分存储在与处理器封装在一起的存储介质上,也可以部分或者全部存储在不与处理器封装在一起的存储器上。
基于相同的技术构思,本申请实施例还提供一种处理器,该处理器用以实现上述方法实施例。上述处理器可以为芯片。
综上所述,本发明实施例提供的一种风电功率区间预测方法、***及存储介质,综合利用LUBE边界估值理论的一步式预测区间构造特性和GRU神经网络的时间序列建模能力,基于LUBE边界估值理论,建立基于神经网络的区间预测模型,其输出层包含两个神经元,根据输入张量直接生成预测区间;所述神经网络包含GRU循环神经网络与全连接神经网络,GRU对多变量时间序列进行时间依赖性建模,全连接神经网络用于获取预测区间的上下界;其次,针对预测区间的评估函数不可微分的缺点,改进了预测区间评估函数,采用新的风电功率区间预测模型训练方式,克服传统LUBE无法采用梯度下降法的难点,有效将GRU深度学习算法整合进LUBE模型体系,在减少计算步骤的情况下,提升预测精度。
本发明的各实施方式可以任意进行组合,以实现不同的技术效果。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘SolidStateDisk)等。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,该流程可以由计算机程序来指令相关的硬件完成,该程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。而前述的存储介质包括:ROM或随机存储记忆体RAM、磁碟或者光盘等各种可存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (6)
1.一种风电功率区间预测方法,其特征在于,包括:
基于LUBE边界估值理论与GRU神经网络构建风电功率区间预测模型,具体包括:
基于神经网络构建核心预测器,所述神经网络包括GRU循环神经网络和全连接神经网络;
所述GRU循环神经网络的输出连接全连接神经网络的输入,所述全连接神经网络的输出层仅包括两个神经元,两个神经元用于输出预测区间的上下边界;
基于预测区间覆盖概率和平均预测宽度构建风电功率区间预测损失函数,具体包括:
在每个预测批量中,基于预测区间捕获的功率点数推导出预测区间覆盖概率的负对数似然函数;
基于加权系数法结合预测区间覆盖概率和平均预测宽度,以构成风电功率区间预测评估函数,具体包括:
选择预测区间覆盖概率PICP、平均预测区间宽度MPIW、组合指标CWC、区间分数Score作为模型的误差评价指标,衡量预测的优劣;
定义PICP和MPIW如下:
其中,X和y分别表示输入与输出,n个样本数量,其中ci揭示第i个目标值yi是否落在上边界U(Xi)与下边界L(Xi)之间:
PICP是预测区间质量的关键指标,衡量预测区间的可靠性,PICP越高,越多真实值是包含在区间内,PICP要大于一定的置信水平,才能得到高质量的区间预测结果;
CL=(1-α)×100% (10)
其中,α为置信度;
为了同时评价预测区间的覆盖概率和平均宽度,定义组合指标CWC如下:
其中,R为目标区间的宽度,μ设置为置信水平CL,λ用来放大PICP与μ之间的差异,γ是一个阶跃函数:
此外,采用区间评分综合指标评价预测区间的校准和锐度,假设一个区间的宽度为:
wi=U(Xi)-L(Xi) (13)
综合预测区间得分为:
其中,Si为单个区间的得分,定义如下:
将预测区间是否捕获功率值表示为0-1二进制量,在风电功率区间预测评估函数中,基于sigmoid函数和软化因子对所述二进制量进行连续化处理,所得梯度连续化的评估函数作为风电功率区间预测模型的损失函数;所述损失函数的输入为预测区间的上下边界点和目标功率点,训练中在每设定小批量上根据损失函数值进行反向传播运算;
定义MPIWcap如下:
引入平衡因子λ1和λ2,得到新的评估函数为:
基于实际风电场的风力发电时间序列数据构建样本集,所述样本集中每个样本张量包括变量数、滞后窗口和批量大小,每个输出张量对应一个输出预测区间的上下边界;所述风力发电时间序列数据包括风电功率、理论功率曲线、风向和风速;
基于所述样本集进行风电功率区间预测模型训练,基于训练后的风电功率区间预测模型进行风电功率区间预测。
2.根据权利要求1所述的风电功率区间预测方法,其特征在于,所述基于所述样本集进行风电功率区间预测模型训练具体包括:
迭代器方式迭代生成数据批量作为输入供风电功率区间预测模型进行学习和预测,设定预测的每个批量的输入包含的特征变量个数、每个变量的时间滞后窗口、每个批量包含样本组数,返回是一个元组,对应输入批量的预测结果。
3.根据权利要求1所述的风电功率区间预测方法,其特征在于,所述基于实际风电场的风力发电时间序列数据构建样本集,具体包括:
对所述风力发电时间序列数据进行缺失值插补、噪声平滑和数据标准化处理,得到样本集,并将所述样本集划分为训练集、验证集和测试集。
4.一种风电功率区间预测***,其特征在于,包括:
模型构建模块,用于基于LUBE边界估值理论与GRU神经网络构建风电功率区间预测模型,具体包括:
基于神经网络构建核心预测器,所述神经网络包括GRU循环神经网络和全连接神经网络;
所述GRU循环神经网络的输出连接全连接神经网络的输入,所述全连接神经网络的输出层仅包括两个神经元,两个神经元用于输出预测区间的上下边界;
损失函数模块,基于预测区间覆盖概率和平均预测宽度构建风电功率区间预测损失函数,具体包括:
在每个预测批量中,基于预测区间捕获的功率点数推导出预测区间覆盖概率的负对数似然函数;
基于加权系数法结合预测区间覆盖概率和平均预测宽度,以构成风电功率区间预测评估函数,具体包括:
选择预测区间覆盖概率PICP、平均预测区间宽度MPIW、组合指标CWC、区间分数Score作为模型的误差评价指标,衡量预测的优劣;
定义PICP和MPIW如下:
其中,X和y分别表示输入与输出,n个样本数量,其中ci揭示第i个目标值yi是否落在上边界U(Xi)与下边界L(Xi)之间:
PICP是预测区间质量的关键指标,衡量预测区间的可靠性,PICP越高,越多真实值是包含在区间内,PICP要大于一定的置信水平,才能得到高质量的区间预测结果;
CL=(1-α)×100% (10)
其中,α为置信度;
为了同时评价预测区间的覆盖概率和平均宽度,定义组合指标CWC如下:
其中,R为目标区间的宽度,μ设置为置信水平CL,λ用来放大PICP与μ之间的差异,γ是一个阶跃函数:
此外,采用区间评分综合指标评价预测区间的校准和锐度,假设一个区间的宽度为:
wi=U(Xi)-L(Xi) (13)
综合预测区间得分为:
其中,Si为单个区间的得分,定义如下:
将预测区间是否捕获功率值表示为0-1二进制量,在风电功率区间预测评估函数中,基于sigmoid函数和软化因子对所述二进制量进行连续化处理,所得梯度连续化的评估函数作为风电功率区间预测模型的损失函数;所述损失函数的输入为预测区间的上下边界点和目标功率点,训练中在每设定小批量上根据损失函数值进行反向传播运算;
定义MPIWcap如下:
引入平衡因子λ1和λ2,得到新的评估函数为:
样本模块,基于实际风电场的风力发电时间序列数据构建样本集,所述样本集中每个样本张量包括变量数、滞后窗口和批量大小,每个输出张量对应一个输出预测区间的上下边界;所述风力发电时间序列数据包括风电功率、理论功率曲线、风向和风速;
训练模块,基于所述样本集进行风电功率区间预测模型训练,基于训练后的风电功率区间预测模型进行风电功率区间预测。
5.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至3任一项所述风电功率区间预测方法的步骤。
6.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至3任一项所述风电功率区间预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011156336.9A CN112365033B (zh) | 2020-10-26 | 2020-10-26 | 一种风电功率区间预测方法、***及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011156336.9A CN112365033B (zh) | 2020-10-26 | 2020-10-26 | 一种风电功率区间预测方法、***及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112365033A CN112365033A (zh) | 2021-02-12 |
CN112365033B true CN112365033B (zh) | 2024-03-22 |
Family
ID=74510387
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011156336.9A Active CN112365033B (zh) | 2020-10-26 | 2020-10-26 | 一种风电功率区间预测方法、***及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112365033B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112949201B (zh) * | 2021-03-17 | 2023-03-21 | 华翔翔能科技股份有限公司 | 一种风速预测方法、装置、电子设备及存储介质 |
CN113516315B (zh) * | 2021-07-23 | 2023-02-03 | 中南大学 | 风力发电功率区间预测方法、设备及介质 |
CN113723712B (zh) * | 2021-10-15 | 2023-08-18 | 中南大学 | 风电功率预测方法、***、设备及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4031407A (en) * | 1970-12-18 | 1977-06-21 | Westinghouse Electric Corporation | System and method employing a digital computer with improved programmed operation for automatically synchronizing a gas turbine or other electric power plant generator with a power system |
CN111353652A (zh) * | 2020-03-13 | 2020-06-30 | 大连理工大学 | 一种风电出力短期区间预测方法 |
CN111461404A (zh) * | 2020-03-09 | 2020-07-28 | 华能四川水电有限公司 | 一种基于神经网络预测区间的短期负荷和水电预测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170091615A1 (en) * | 2015-09-28 | 2017-03-30 | Siemens Aktiengesellschaft | System and method for predicting power plant operational parameters utilizing artificial neural network deep learning methodologies |
-
2020
- 2020-10-26 CN CN202011156336.9A patent/CN112365033B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4031407A (en) * | 1970-12-18 | 1977-06-21 | Westinghouse Electric Corporation | System and method employing a digital computer with improved programmed operation for automatically synchronizing a gas turbine or other electric power plant generator with a power system |
CN111461404A (zh) * | 2020-03-09 | 2020-07-28 | 华能四川水电有限公司 | 一种基于神经网络预测区间的短期负荷和水电预测方法 |
CN111353652A (zh) * | 2020-03-13 | 2020-06-30 | 大连理工大学 | 一种风电出力短期区间预测方法 |
Non-Patent Citations (1)
Title |
---|
基于LSTM的风电功率区间预测研究;王若恒;《中国优秀硕士学位论文全文数据库 工程科技II辑》(第第06期期);C042-238 * |
Also Published As
Publication number | Publication date |
---|---|
CN112365033A (zh) | 2021-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112365033B (zh) | 一种风电功率区间预测方法、***及存储介质 | |
CN109902222B (zh) | 一种推荐方法及装置 | |
US11650968B2 (en) | Systems and methods for predictive early stopping in neural network training | |
CN111461463B (zh) | 一种基于tcn-bp的短期负荷预测方法、***及设备 | |
CN108879732B (zh) | 电力***暂态稳定评估方法及装置 | |
CN112766078A (zh) | 基于emd-svr-mlr与注意力机制的gru-nn的电力负荷层次预测方法 | |
CN112990444B (zh) | 一种混合式神经网络训练方法、***、设备及存储介质 | |
CN113592144A (zh) | 一种中长期径流概率预报方法及*** | |
CN112884236B (zh) | 一种基于vdm分解与lstm改进的短期负荷预测方法及*** | |
CN114490065A (zh) | 一种负载预测方法、装置及设备 | |
CN111191823A (zh) | 一种基于深度学习的生产物流预测方法 | |
CN114707712A (zh) | 一种发电机组备件需求的预测方法 | |
CN110738363B (zh) | 一种光伏发电功率预测方法 | |
CN113298131B (zh) | 一种基于注意力机制的时序数据缺失值插补方法 | |
CN114372558A (zh) | 基于多模型融合的居民用电负荷预测方法、介质及设备 | |
CN112990598A (zh) | 一种水库水位时间序列预测方法与*** | |
CN115759343A (zh) | 一种基于e-lstm的用户电量预测方法和装置 | |
CN115619449A (zh) | 基于深度学习模型的化肥价格预测方法、设备及存储介质 | |
CN116090618A (zh) | 一种电力通信网的运行态势感知方法和装置 | |
CN115423091A (zh) | 一种条件对抗神经网络训练方法、场景生成方法和*** | |
CN114638421A (zh) | 一种发电机组备件需求的预测方法 | |
CN112183814A (zh) | 一种短期风速预测方法 | |
CN114781747B (zh) | 基于融合多源nwp的tpa-tcnmdn的超短期风电功率概率预测方法 | |
CN115577769B (zh) | 一种基于双向神经网络自回归模型的量测数据拟合方法 | |
CN113688774B (zh) | 基于深度学习的高层建筑风致响应预测、训练方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |