CN110648014B - 一种基于时空分位数回归的区域风电预测方法及*** - Google Patents
一种基于时空分位数回归的区域风电预测方法及*** Download PDFInfo
- Publication number
- CN110648014B CN110648014B CN201910802636.0A CN201910802636A CN110648014B CN 110648014 B CN110648014 B CN 110648014B CN 201910802636 A CN201910802636 A CN 201910802636A CN 110648014 B CN110648014 B CN 110648014B
- Authority
- CN
- China
- Prior art keywords
- wind power
- model
- quantile regression
- regional
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000010248 power generation Methods 0.000 claims abstract description 30
- 238000010586 diagram Methods 0.000 claims abstract description 25
- 238000012549 training Methods 0.000 claims abstract description 25
- 238000012360 testing method Methods 0.000 claims abstract description 20
- 238000012795 verification Methods 0.000 claims abstract description 14
- 238000013528 artificial neural network Methods 0.000 claims description 32
- 238000011176 pooling Methods 0.000 claims description 25
- 238000013527 convolutional neural network Methods 0.000 claims description 22
- 230000015654 memory Effects 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 claims description 7
- 230000007787 long-term memory Effects 0.000 claims description 6
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 3
- 238000003860 storage Methods 0.000 claims description 3
- 238000012417 linear regression Methods 0.000 claims 1
- 230000006403 short-term memory Effects 0.000 claims 1
- 238000009826 distribution Methods 0.000 description 23
- 230000008569 process Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 8
- 238000000605 extraction Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 230000007774 longterm Effects 0.000 description 5
- 230000000306 recurrent effect Effects 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 3
- 238000005315 distribution function Methods 0.000 description 3
- 108090000672 Annexin A5 Proteins 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 241000039077 Copula Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A30/00—Adapting or protecting infrastructure or their operation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Operations Research (AREA)
- Computational Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Pure & Applied Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Mathematical Optimization (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Mathematical Analysis (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Marketing (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Algebra (AREA)
- Water Supply & Treatment (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Probability & Statistics with Applications (AREA)
- Databases & Information Systems (AREA)
- Development Economics (AREA)
Abstract
本公开提供了一种基于时空分位数回归的区域风电预测方法及***,采集多个风电场预设时间段内的运行和数值天气预报数据,将采集到的数据转换为特征图,建立训练集、验证集和测试集;建立时空分位数回归模型,利用训练集训练集、验证集和测试集对模型进行训练和优化;实时采集各个风电场的运行数据和环境数据,根据优化好的时空分位数回归模型进行未来一定时间段内的区域风力发电预测;本公开通过时空分位数回归模型对区域风电进行短期非参数化的概率预测,解决了在进行具有较大的输入信息时的区域风电风电预测中解释变量的选择问题,极大的提高预测的准确性和可靠性,为具有大数据的区域风力发电概率预测提供了一种具体的解决方案。
Description
技术领域
本公开涉及风电预测技术领域,特别涉及一种基于时空分位数回归的区域风电预测方法及***。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术,并不必然构成现有技术。
由于风力发电具有间歇性和波动性的特点,高比例风电将对电力***的安全稳定运行构成严峻挑战。而准确的短期风电预测可以有效地缓解风电的不利影响。以往的研究主要集中在风力发电的点预测方面。然而,由于风的固有间歇性和波动性,预测误差不可避免地存在。作为替代,概率预测可以量化风的不确定性信息,例如置信区间,概率分布函数和分位数等。根据是否假定概率的分布类型,可将概率风电预测方法分为参数预测和非参数预测。
本公开发明人发现,目前对风电进行预测主要是利用参数化概率预测通常假设随机变量服从一定的函数分布,例如贝塔分布、对数正态分布和高斯分布。然而,实际风电可能不满足假定的分布,甚至不满足任何已知分布,不合理的分布假设可能直接导致概率预测结果的偏差。
而且,目前大多数的风电概率预测方法将目光投向单个风电场,很少考虑区域风电场,有学者提出了一种基于copula函数的方法来预测多个风电场风电总功率的误差分布,然而,这种方法是基于每个单个风电场的点预测结果,这可能造成累积预测误差并导致分布预测结果失真;同时由于风资源的具有的典型区域特征,风资源丰富的地区,可以分布成多个风电场,因此多个风电场间存在强烈的时空性和非线性的相关性,而由于大数据的集合和复杂的相关性,区域风电预测比单个风电场更复杂,从而给区域风力预测的准确度和可靠性带来了巨大的困难。
发明内容
为了解决现有技术的不足,本公开提供了一种基于时空分位数回归的区域风电预测方法及***,解决了在进行具有较大的输入信息时的区域风电风电预测中解释变量的选择问题,极大的提高风电预测的准确性和可靠性,为具有大数据特点的区域风力发电概率预测提供了一种具体的解决方案。
为了实现上述目的,本公开采用如下技术方案:
第一方面,本公开提供了一种基于时空分位数回归的区域风电预测方法;
一种基于时空分位数回归的区域风电预测方法,步骤如下:
采集多个风电场预设时间段内的运行和数值天气预报数据,将采集到的数据转换为特征图,建立训练集、验证集和测试集;
建立时空分位数回归模型,利用训练集对模型进行训练,利用验证集诊断模型适应性并优化模型超参数,利用测试集对模型进行可靠度和锐度评价,根据评价结果进一步优化模型;
实时采集各个风电场的运行数据和数值天气预报数据,根据优化好的时空分位数回归模型进行未来一定时间段内的区域风力发电预测。
作为可能的一些实现方式,所述多个风电场预设时间段内的运行和历史数值天气预报数据为任何与风力发电相关的数据,包括但不限于各个风电场的发电功率、风向、风速、温度、湿度和气压。
作为可能的一些实现方式,将采集到的数据转换为特征图,具体为:计算每个风电场与区域风电之间的相关性,选择相关系数最大的风电场作为基础,并根据每个风电场与基础风电场之间的距离按降序排列,生成特征图。
作为进一步的限定,一系列连续时间的特征图作为一组输入特征图,用时间连续的特征图反映风电场之间空间的相对位置和时间的相关性。
作为可能的一些实现方式,时空分位数回归模型包括混合神经网络和分数位回归算法,利用混合神经网络提取具有关键特征,构建非线性回归模型;根据分位数回归算法使构建的非线性回归模型获得相应分位数,通过梯度下降法估计出时空分位数回归模型,实现对区域风力发电进行概率预测。
作为进一步的限定,所述混合神经网络为卷积神经网络与长短时记忆神经网络相结合的串行神经网络,所述卷积神经网络包括输入层、卷积层、池化层、全连接层和输出层;
特征图通过输入层进入卷积层,与卷积核进行卷积,卷积层输出卷积结果到池化层,所述池化层采用最大池法对卷积结果通过采样进一步降维和特征提取;
经过卷积层和池化层的处理,将输入特征提取转化为高级信息特征,利用连接层对高级信息特征进行分类,通过输出层将分类后的高级信息特征输出到长短时记忆神经网络进行优化,得到最终识别结果。
作为更进一步的限定,所述卷积神经网络由两个卷积层和两个池化层建模,两个卷积层的卷积核数依次为16和32,格式为4×4,池化层内核设计为2×2,通过卷积和池化,将高级信息特征提取到长短时记忆神经网络中,进行优化后得到最终预测结果。
第二方面,本公开提供了一种基于时空分位数回归的区域风电预测***;
一种基于时空分位数回归的区域风电预测***,包括:
数据采集和预处理模块,被配置为:采集多个风电场预设时间段内的运行和数值天气预报数据,将采集到的数据转换为特征图,建立训练集、验证集和测试集;
模型构建模块,被配置为:建立时空分位数回归模型,利用训练集对模型进行训练,利用验证集诊断模型适应性并优化模型超参数,利用测试集对模型进行可靠度和锐度评价,根据评价结果进一步优化模型;
预测模块,被配置为:实时采集各个风电场的运行数据和数值天气预报数据,根据训练和优化好的时空分位数回归模型进行未来一定时间段内的区域风力发电预测。
第三方面,本公开提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本公开所述的基于时空分位数回归的区域风电预测方法中的步骤。
第四方面,本公开提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现本公开所述的基于时空分位数回归的区域风电预测方法中的步骤。
与现有技术相比,本公开的有益效果是:
1、本公开结合混合神经网络和分位数回归的优点,提出了一种时空分位数回归模型(SQR)对区域风电进行短期非参数化的概率预测方法,该方法将输入的高维数据重新组织成特征图,由混合神经网络(HNN)进行特征提取,并利用混合神经网络的优势提取具有代表性的特征,构建非线性回归模型,同时,根据分位数回归(QR)的规则,使该模型获得分位数,并对区域风力发电进行概率预测,该方法解决了在具有较大的输入信息时解释变量的选择问题,为具有大数据的区域风力发电概率预测提供了一种具体的解决方案。
2、本公开实现的是区域风电预测,与单个风电场的预测不同,它可以更好的实现对整个区域内的风电发电的预测,减少了整个区域的风电场由于风力发电的间歇性和波动性以及风电的高渗透度将对电力***的安全稳定运行带来的影响,从而能够引导运营商从电网运行的宏观角度有效地做出决策,提高电力***的稳定性。
3、本公开通过利用SQR这一新的区域风电预测非参数化概率方法,利用QR和HNN的优点,提取具有代表性的特征,记录长期相关信息,得到不同的分位数,能够准确、全面地描述区域风电预测的不确定性,进而实现区域风电的精准和可靠预测。
4、本公开通过对高维的输入数据构造时间序列特征图,反映了各风电场之间空间的相对位置和时间相关性,为HNN的特征提取做好了准备,从而进一步提高了该方法的有效性和灵活性。
5、本公开采用的SQR方法中,HNN是由CNN和LSTM之间的串行连接形成的,即HNN可以分为两层,即CNN层和LSTM层,因此,HNN不仅能够有效地处理高维数据,而且具有长期记忆能力,QR与HNN组合的SQR能够更好的进行区域风力发电的非参数概率预测。
附图说明
图1为本公开实施例1所述的基于时空分位数回归的区域风电预测方法流程图。
图2为本公开实施例1所述的输入数据的特征模式的时间序列
图3为本公开实施例1所述的CNN的结构示意图图。
图4为本公开实施例1所述的RNN的递归结构示意图。
图5为本公开实施例1所述的LSTM网络的基本单元示意图。
图6为本公开实施例1所述的SQR的结构示意图。
图7为本公开实施例1所述的某一地区10个风电场的位置分布示意图。
图8为本公开实施例1所述的标准化区域风电场时间序列示意图。
图9为本公开实施例1所述的单一风电与区域风电的相关性示意图。
图10为本公开实施例1所述的其中一个特征图的特征模式。
图11为本公开实施例1所述的区域风电场可靠性预测模型的时变结果示意图。
图12为本公开实施例1所述的区域风电场锐度预测模型的时变结果示意图。
图13为本公开实施例1所述的利用QRNN预测未来72小时区域风电的结果示意图。
图14为本公开实施例1所述的利用SQR预测未来72小时区域风电的结果示意图。
具体实施方式
应该指出,以下详细说明都是例示性的,旨在对本公开提供进一步的说明。除非另有指明,本实施例使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例1:
如图1所示,本公开实施例1提供了一种基于时空分位数回归的区域风电预测方法,步骤如下:
采集多个风电场预设时间段内的运行和数值天气预报数据,将采集到的数据转换为特征图,建立训练集、验证集和测试集;
建立时空分位数回归模型,利用训练集对模型进行训练,利用验证集诊断模型适应性并优化模型超参数,利用测试集对模型进行可靠度和锐度评价,根据评价结果进一步优化模型;
实时采集各个风电场的运行数据和环境数据,根据优化好的时空分位数回归模型进行未来一定时间段内的区域风力发电预测。
本实施例结合混合神经网络(HNN)和分位数回归(QR)的优点,提出了一种时空分位数回归模型(SQR)对区域风电进行短期非参数化的概率预测,该方法将输入的高维数据重新组织成特征图,由混合神经网络进行特征提取,并利用混合神经网络的优势提取具有代表性的特征,构建非线性回归模型,同时,根据分位数回归的规则,使该模型获得分位数,并对区域风力发电进行概率预测,该方法解决了在具有较大的输入信息时解释变量的选择问题,为具有大数据的区域风力发电概率预测提供了一种具体的解决方案。
如背景技术中所述,目前对风电进行预测主要是利用参数化概率预测通常假设随机变量服从一定的函数分布,例如贝塔分布、对数正态分布和高斯分布。然而,实际风电可能不满足假定分布,甚至不满足任何已知分布,不合理的分布假设可能直接导致概率预测结果的偏差。本实施例针对参数概率预测的不足,提出了一种非参数化的概率预测方法来估计概率密度函数、置信区间和分位数,不需要对概率分布类型作任何的假设。
分位数回归(QR)是一种常用的非参数化概率预测方法,能够有效地实现风力发电的非参数化概率预测,在风电非参数化概率预测中得到了广泛的应用。
HNN是一种将CNN与LSTM(长短时记忆递归神经网络)相结合的串行神经网络,能够处理海量的数据集,记录长期依赖的信息。
本实施例提出了一种基于SQR的非参数化概率区域风电预测方法,该方法可以认为典型的QR模型是由基于梯度增强的HNN估计的,QR可以得到不同的比例,完全描述因变量的分布,HNN可以根据CNN和LSTM层的结构提取具有代表性的时空特征。
因此,SQR的独特的优点在于,其有效性仅取决于HNN的框架,它可以克服典型的QR只能适合线性相关性和失去处理大数据的能力的缺点。此外,特征图的构造是基于高维输入的数据,能够通过HNN进行特征提取。在此基础上,本实施例提出了SQR方法在非参数化概率预测中的应用,并将其应用于区域风电预测的不确定性行为估计中,综合得到不同的分位数和因变量分布。
详细方法如下:
(1)输入格式的设计
HNN的CNN层是一个多层神经网络,擅长处理较大的图像,通过CNN神经网络成功地解决了数据量大的高维图像难以识别的问题。鉴于HNN善于处理这些问题,将高维输入数据重新组织成特征图。通过计算风电场之间的相关关系,排列风电场的位置,体现了潜在的空间相关性。此外,LSTM是一个循环神经网络,可以学习长期依赖的信息。利用时间序列内的经验,适用于重大事件之间存在较长时间滞后的未知信息的分类、处理和预测。因此,有必要用特征图来反映时间相关性,每组输入的特征图在时间上必须是连续的,本实施例通过建立特征图,提高了风电预测的预测精度。
假设一个地区有m个风电场,W=(w1,w2,…,wm),然后计算每个风电场与区域风电之间的相关性,选择相关系数最大的风电场作为基础,并根据每个风电场与基础风电场之间的距离按降序排列,可以生成特征图。一系列时间连续特征图形成一组输入特征图,如图2所示(m=10)。这些列族表示风电场,等级族表示变量类型,数值天气预报(NWP)需要提前15分钟的历史数据,图2中的缩写的具体含义如表1中所示。
表1:图2中的缩写的具体含义
(2)分位数回归
在传统条件均值回归的基础上,发展了分位数回归。分位数回归算法是一种非参数化模型,不假设观测值的分布,对样本中的异常数据具有较强的鲁棒性。它涵盖了所有的特征,除了包括不同分位数的均值回归。
设Y为响应变量,X为实值参数(可能是高维数据)。给定条件分布函数F(y|X=x),方程可表示为:
F(y|X=x)=P(Y≤y|X=x) (1)
对于分布函数F,可以定义α的分位数为qα(x):
qα(x)=inf{y:|F(y|X=x)≥α} (2)
传统上,α的分位数qα(x)可转化为线性优化问题:
qα(x)=βX′ (3)
其中,β=[β1,β1,…,βn],,X=[x1,x2,…,xn]。
与条件均值回归的最小二乘估计一样,分位数回归可以通过最小化一个平方误差检验函数来实现。给出了如下测试功能:
其中,y是实值响应变量,α的分位数为q。
因此,条件分位数使期望损失函数E(Lα)最小化:
然后利用分位数回归结果建立预测区间,如给出90%的预测区间:
PI(x)=[q0.05(x),q0.95(x)] (6)
(3)卷积神经网络
CNN作为一种深度结构的前馈网络,是通过卷积运算来计算的。一般来说,CNN由输入层、特征提取层和全连通层组成,特征提取层由卷积层和池化层组成,全连通层由全链接多层感知器分类器组成。
普通的神经网络应用于区域风电预测,会导致参数过多、模型过大、消耗计算资源等问题。与普通神经网络相比,CNN的特征层由卷积层和池化层组成,通过在特征层中共享传统内核,克服了普通的神经网络所存在的问题,卷积和池化过程如图3所示。
特征图穿过输入层进入卷积层,与卷积核进行卷积,这是一个权值共享的过程。卷积的结果是卷积层的输出。这个过程可以描述如下:
其中,Ci是卷积层的输出,X是输入数据,W是卷积核,B是偏置,f是主动函数。
池化层是通过采样进一步降维和特征提取的过程,通常,下层采样包括最大池和平均池。本实施例采用最大池法:
Pj=max Ci (8)
其中,P是池化层的输出。
经过之前的卷积层和池化层的处理,将输入数据提取转化为高级信息特征,连接层对高级信息特征进行分类,得到最终的识别结果。
(4)长短时记忆递归神经网络
与传统神经网络不同的是,RNN(循环神经网络)作为一种递归网络,可以通过隐层中的一系列单元环来记录历史信息,通过历史经验来预测未来的信息。但是,当历史信息与当前信息距离较远,时间间隔越来越大时,会导致RNN失去与长期信息的链接能力,梯度消失或***,RNN的递归结构如图4所示,当数据输入单元循环A时,经过一定的计算,可以输出h,然后进入下一个单元循环。显然,随着单元数的增加,RNN的学习能力会越来越差。
LSTM(长短时记忆递归神经网络)是一种改进的RNN,它克服了RNN在学习长期关联信息方面的不足,LSTM在1997年由Hochreiter和Schmidhuber提出。通过设置遗忘门,LSTM解决了RNN在时间轴上梯度消失或***的问题。如图5所示,LSTM网络由输入门、遗忘门和输出门组成,三个阈值协同处理特征选择、遗忘和记忆。
遗忘门决定选择一些信息服务于后一种信息,而另一种则被抛弃。
ft由一个s状函数来完成:
ft=σ(Wf·[ht-1,xt]+bf) (9)
这个过程可以描述如下:
it=σ(Wi·[ht-1,xt]+bi) (10)
最终在输出门中实现了预期的输出:
ot=σ(Wo·[ht-1,xt]+b0) (13)
ht=ot·tanh(Ct) (14)
(5)时空的分位数回归
本实施例提出了一种基于QR和HNN的区域风力发电非参数化概率预测的SQR方法,HNN是由CNN和LSTM之间的串行连接形成的。也就是说,HNN可以分为两层,CNN层和LSTM层。因此,HNN不仅能够有效地处理高维数据,而且具有长期记忆能力。因此,QR与HNN组合的SQR能够较好地进行区域风力发电的非参数概率预测,SQR结构如图6所示。
(6)评价
1)可靠性
一般认为,覆盖概率是评价预测区间可靠性的最重要指标。如果概率预测区间为[Li,Ui],则模型预测的覆盖概率可表示为:
2)锐度
模型的锐度可以通过预测区间归一化平均宽度(PINAW)来评价,具体如下:
其中R为目标值的最大值与最小值之差.
下面通过对江苏省10个风电场的试验,验证了提出的SQR在区域风电场预测中的有效性。
(一)数据预处理
数据集包含10个风电场的运行数据和数值天气预报,时间范围为2016年1月1日至2016年12月31日,时间分辨率为15分钟,这10个风电场的空间分布如图7所示。
由于大气环境的影响,风力发电呈现出较强的不确定性和波动性,风力发电非线性明显。72小时的归一化区域风电时间序列如图8所示,可以看到,区域风电呈现出明显的不确定性、波动性和非线性。
为了在区域风电场中找到基础,计算了单次风电与区域风电的关系,如图9所示。选取相关系数最大的风电场作为基础,同时,作为一种数据驱动的方法,SQR强调输入数据的连续性,以确保模型能够对***产生更详细的描述,从而提高模型的准确性。因此,合理的解释变量可以进一步提高准确性。从理论上讲,任何与风电有关的状态变量(如温度、湿度、气压、风速、风向)都可以作为解释变量添加到模型中,但与风电相关性强的解释变量更有价值,本实施例除功率外,还利用风向、风速、温度、大气和压力的正弦和余弦值作为解释变量;使用Excel工具生成特征图,如图10所示。
(二)模型构建与描述
严格地说,SQR由三个部分组成:CNN层、LSTM层和QR。它由CNN层和LSTM层构成特征提取和时间记忆的预测器,并通过梯度增强估计出分位数回归模型,得到概率预测结果。CNN层由两个卷积层和两个池化层建模。卷积核数依次为16和32,格式为4×4。在池化层,内核设计为2×2。通过卷积和池化,将关键特征提取到LSTM层中,然后进行优化,最终得到结果。
(三)算例结果分析
为了验证所提出的区域风电预测SQR模型的预测性能,利用QRNN模型(分数位回归+循环神经网络)基于相同的原始数据估计预测区间进行基准测试对比。为了充分估计区域风电波动,本实施例计算了0.025、0.05、0.09和0.975分位数,可以构成95%和85%的预测区间。
为了验证所提模型的可靠性,分别利用SQR模型和QRNN模型对11月份的风电测试集进行了预测,预测时间为72小时。图11为SQR模型和QRNN模型在95%和85%置信水平下的可靠性指数PICP,用于评价模型的可靠性,其中PICP越小,可靠性越高。从图11中可以看出,SQR模型的可靠性指标小于QRNN模型,结果表明,在85%和95%置信水平下的预测区间内,SQR模型比QRNN模型更可靠。
图12显示了在85%和95%置信水平下,SQR模型和QRNN模型在72小时前的锐度。它被用来评估模型的清晰度,在模型中,锐度越小,清晰度越好。与QRNN模型相比,SQR得到的分位数具有更高的锐度水平,这表明在两个置信区间内,对于不同的前瞻时间,SQR具有更好的分辨率。SQR的锐度数平均比QRNN小4.5%左右。
图13和图14分别为QRNN模型和SQR模型应用于11月份区域风电测试集的预测结果。可以看出,实际风电功率可以很好地被预测的区间所包围,85%的预测区间可以被95%的预测区间所封装,证明了该方法的高可靠性。图13和图14相比,SQR模型预测的置信区间更窄,说明SQR具有更好的清晰度性能。结果与图11和图12的对比分析结果一致。此外,随着预测时间的增加,预测区间越来越宽,证明了不确定性的增加。SQR作为一种具有较高学习能力的概率预测模型,对区域风电场的特性具有较强的自适应能力。
本实施例研究了提出的SQR和QRNN的计算速度,如表2所示。这两种方法都是在配备Intel(R)Core(TM)i7-8550U CPU@1和8GHz 2.00GHz和8GB RAM的电脑上执行的。本实施例所述的各个模型的平均训练时间是基于上述2016年1月1日至2016年6月1日的训练集进行统计的。从表2可以看出,SQR是QRNN训练速度的7倍以上。SQR模型构建速度较快,只需要2.2小时左右的训练时间。结果表明,SQR预测模型具有较高的计算效率。因此,本实施例提出的基于SQR模型的方法在区域风电概率预测***中具有较高的实际应用潜力。
表2:计算模型的建设
由于风电的高穿透性和高波动性,准确预测风电是提高新能源效率和电力***经济安全运行的关键。与单个风电场相比,将区域风电预测合理地集成到决策模型中,可以使运营商有效地做出决策,如制定发电计划、储备电量等。区域风电预测对电力***运行和控制的影响较大。此外,随着风电预测误差的不可避免性,风电概率预测越来越受欢迎。本实施例提出了由QR和HNN组成的SQR作为区域风力发电的非参数概率预测,它可以探索区域风力发电场之间的时空和非线性关系,得到不同的预测分位数,为了进一步提高精度,构造了特征图的时间序列,最终得到了较为准确的预测结果。
以江苏省10个风电场的实测数据为基础,验证了SQR在未来72小时内的有效性。通过与QRNN的综合比较,证明了SQR比QRNN更有效、更先进。实验结果表明,SQR具有较好的全局和局部自适应能力,计算效率较高。因此,提出的SQR为区域风电概率预测提供了一个高效、灵活的框架,具有较高的可靠性。
实施例2:
本公开实施例2提供了一种基于时空分位数回归的区域风电预测***,包括:
数据采集和预处理模块,被配置为:采集多个风电场预设时间段内的运行和数值天气预报数据,将采集到的数据转换为特征图,建立训练集、验证集和测试集;
模型构建模块,被配置为:建立时空分位数回归模型,利用训练集对模型进行训练,利用验证集诊断模型适应性并优化模型超参数,利用测试集对模型进行可靠度和锐度评价,根据评价结果进一步优化模型;
预测模块,被配置为:实时采集各个风电场的运行数据和环境数据,根据训练和优化好的时空分位数回归模型进行未来一定时间段内的区域风力发电预测。
实施例3:
本公开实施例3提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本公开实施例1所述的基于时空分位数回归的区域风电预测方法中的步骤。
实施例4:
本公开实施例4提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现本公开实施例1所述的基于时空分位数回归的区域风电预测方法中的步骤。
以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
Claims (9)
1.一种基于时空分位数回归的区域风电预测方法,其特征在于,步骤如下:
采集多个风电场预设时间段内的运行数据和天气预报数据,将采集到的数据转换为特征图,建立训练集、验证集和测试集;其中,将采集到的数据转换为特征图,具体为:计算每个风电场与区域风电之间的相关性,选择相关系数最大的风电场作为基础,并根据每个风电场与基础风电场之间的距离按降序排列,生成特征图;
建立时空分位数回归模型,利用训练集对模型进行训练,利用验证集诊断模型适应性并优化模型超参数,利用测试集对模型进行可靠度和锐度评价,根据评价结果进一步优化模型;
实时采集各个风电场的运行数据和环境数据,根据优化好的时空分位数回归模型进行未来一定时间段内的区域风力发电预测。
2.如权利要求1所述的基于时空分位数回归的区域风电预测方法,其特征在于,所述多个风电场预设时间段内的运行数据和天气预报数据为任何与风力发电相关的数据,包括各个风电场的发电功率、风向、风速、温度、湿度和气压。
3.如权利要求1所述的基于时空分位数回归的区域风电预测方法,其特征在于,一系列连续时间的特征图作为一组输入特征图,用时间连续的特征图反映风电场之间空间的相对位置和时间的相关性。
4.如权利要求1所述的基于时空分位数回归的区域风电预测方法,其特征在于,时空分位数回归模型包括混合神经网络和分数位回归算法,利用混合神经网络提取具有代表性的特征图,构建非线性回归模型;根据分位数回归算法使构建的非线性回归模型获得分位数,通过梯度增强估计出时空分位数回归模型,实现对区域风力发电进行概率预测。
5.如权利要求4所述的基于时空分位数回归的区域风电预测方法,其特征在于,所述混合神经网络为卷积神经网络与长短时记忆神经网络相结合的串行神经网络,所述卷积神经网络包括输入层、卷积层、池化层、连接层和输出层;
特征图穿过输入层进入卷积层,与卷积核进行卷积,卷积层输出卷积结果到池化层,所述池化层采用最大池法对卷积结果通过采样进一步降维和特征提取;
经过卷积层和池化层的处理,将输入特征提取转化为高级信息特征,利用连接层对高级信息特征进行分类,通过输出层将分类后的高级信息特征输出到长短时记忆神经网络进行优化,得到最终识别结果。
6.如权利要求5所述的基于时空分位数回归的区域风电预测方法,其特征在于,所述卷积神经网络由两个卷积层和两个池化层建模,两个卷积层的卷积核数依次为16和32,格式为4×4,池化层内核设计为2×2,通过卷积和池化,将高级信息特征提取到长短时记忆神经网络中,进行优化后得到最终预测结果。
7.一种基于时空分位数回归的区域风电预测***,其特征在于,包括:
数据采集和预处理模块,被配置为:采集多个风电场预设时间段内的运行数据和天气预报数据,将采集到的数据转换为特征图,建立训练集、验证集和测试集;其中,将采集到的数据转换为特征图,具体为:计算每个风电场与区域风电之间的相关性,选择相关系数最大的风电场作为基础,并根据每个风电场与基础风电场之间的距离按降序排列,生成特征图;
模型构建模块,被配置为:建立时空分位数回归模型,利用训练集对模型进行训练,利用验证集诊断模型适应性并优化模型超参数,利用测试集对模型进行可靠度和锐度评价,根据评价结果进一步优化模型;
预测模块,被配置为:实时采集各个风电场的运行数据和环境数据,根据训练和优化好的时空分位数回归模型进行未来一定时间段内的区域风力发电预测。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6任一项所述的基于时空分位数回归的区域风电预测方法中的步骤。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-6任一项所述的基于时空分位数回归的区域风电预测方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910802636.0A CN110648014B (zh) | 2019-08-28 | 2019-08-28 | 一种基于时空分位数回归的区域风电预测方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910802636.0A CN110648014B (zh) | 2019-08-28 | 2019-08-28 | 一种基于时空分位数回归的区域风电预测方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110648014A CN110648014A (zh) | 2020-01-03 |
CN110648014B true CN110648014B (zh) | 2022-04-15 |
Family
ID=68991053
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910802636.0A Active CN110648014B (zh) | 2019-08-28 | 2019-08-28 | 一种基于时空分位数回归的区域风电预测方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110648014B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111612262A (zh) * | 2020-01-15 | 2020-09-01 | 长沙理工大学 | 一种基于分位数回归的风电功率概率预测方法 |
CN112037106B (zh) * | 2020-08-07 | 2023-12-15 | 汉威科技集团股份有限公司 | 一种基于特征互相关性和概率密度的数据异常分析方法 |
CN114186469A (zh) * | 2020-09-14 | 2022-03-15 | 青岛海信日立空调***有限公司 | 空调***能效预测方法及空调*** |
CN112257928A (zh) * | 2020-10-22 | 2021-01-22 | 国网山东省电力公司潍坊供电公司 | 一种基于cnn和分位数回归的短期电力负荷概率预测方法 |
CN112308322B (zh) * | 2020-11-03 | 2023-11-24 | 华翔翔能科技股份有限公司 | 一种多风场时空风速预测方法、装置及电子设备 |
CN112990536B (zh) * | 2021-01-27 | 2022-06-03 | 广东工业大学 | 一种基于分位数卷积网络的公交到站时间预测方法 |
CN112580899A (zh) * | 2021-02-23 | 2021-03-30 | 国能日新科技股份有限公司 | 一种融合机器学习模型的中长期风力发电预测方法及*** |
CN114021853A (zh) * | 2021-11-26 | 2022-02-08 | 广东电网有限责任公司广州供电局 | 一种风力预测方法、装置、电子设备及存储介质 |
CN114298444B (zh) * | 2022-03-09 | 2022-05-27 | 广东电网有限责任公司佛山供电局 | 一种风速概率预测方法、装置、设备及存储介质 |
CN115907233B (zh) * | 2023-01-06 | 2023-05-09 | 北京科技大学 | 基于机器心智模型和自注意力的风力发电分位数预测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106803129A (zh) * | 2015-11-26 | 2017-06-06 | 中国电力科学研究院 | 一种基于多源数值天气预报的风电功率集合预测方法 |
CN109657839A (zh) * | 2018-11-22 | 2019-04-19 | 天津大学 | 一种基于深度卷积神经网络的风电功率预测方法 |
CN109840308A (zh) * | 2017-11-29 | 2019-06-04 | 中国电力科学研究院有限公司 | 一种区域风电功率概率预报方法及*** |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010016110A1 (ja) * | 2008-08-05 | 2010-02-11 | 富士通株式会社 | 重回帰分析による予測モデルの作成方法、作成システムおよび作成プログラム |
-
2019
- 2019-08-28 CN CN201910802636.0A patent/CN110648014B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106803129A (zh) * | 2015-11-26 | 2017-06-06 | 中国电力科学研究院 | 一种基于多源数值天气预报的风电功率集合预测方法 |
CN109840308A (zh) * | 2017-11-29 | 2019-06-04 | 中国电力科学研究院有限公司 | 一种区域风电功率概率预报方法及*** |
CN109657839A (zh) * | 2018-11-22 | 2019-04-19 | 天津大学 | 一种基于深度卷积神经网络的风电功率预测方法 |
Non-Patent Citations (2)
Title |
---|
基于时空关联混合模型的交通流预测方法研究;朱勇;《中国优秀博硕士学位论文全文数据库(电子期刊) 工程科技II辑》;20190215;第8-15、26-32页 * |
考虑时空相关性的源荷功率概率建模和概率预测方法;李丹;《中国优秀博硕士学位论文全文数据库(电子期刊) 工程科技II辑》;20180615;第47、96-104页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110648014A (zh) | 2020-01-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110648014B (zh) | 一种基于时空分位数回归的区域风电预测方法及*** | |
CN109508360B (zh) | 一种基于元胞自动机的地理多元流数据时空自相关分析方法 | |
CN110348624B (zh) | 一种基于Stacking集成策略的沙尘暴等级预测方法 | |
CN108445752B (zh) | 一种自适应选择深度特征的随机权神经网络集成建模方法 | |
Hu et al. | Research and application of a hybrid model based on Meta learning strategy for wind power deterministic and probabilistic forecasting | |
CN112598248B (zh) | 负荷预测方法、装置、计算机设备和存储介质 | |
CN110689183B (zh) | 一种集群光伏功率概率预测方法、***、介质及电子设备 | |
CN113554466B (zh) | 一种短期用电量预测模型构建方法、预测方法和装置 | |
Chen et al. | Probabilistic forecasting of drought: a hidden Markov model aggregated with the RCP 8.5 precipitation projection | |
CN113449919B (zh) | 一种基于特征和趋势感知的用电量预测方法及*** | |
CN113507118B (zh) | 一种风电功率预测方法及*** | |
CN115220133B (zh) | 一种多气象要素降雨预测方法、装置、设备及存储介质 | |
CN114065996A (zh) | 基于变分自编码学习的交通流预测方法 | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及*** | |
CN117494034A (zh) | 基于交通拥堵指数和多源数据融合的空气质量预测方法 | |
CN114357670A (zh) | 一种基于bls和自编码器的配电网用电数据异常预警方法 | |
CN108830405B (zh) | 基于多指标动态匹配的实时电力负荷预测***及其方法 | |
Uğuz et al. | A hybrid CNN-LSTM model for traffic accident frequency forecasting during the tourist season | |
CN116663404A (zh) | 一种耦合人工智能和贝叶斯理论的洪水预报方法及*** | |
CN116561569A (zh) | 一种基于EO特征选择结合AdaBoost算法的工业电力负荷辨识方法 | |
CN115423146A (zh) | 一种基于多因子最近邻抽样回归和支持向量机的自适应径流预报方法 | |
CN112446550A (zh) | 一种短期建筑负荷概率密度预测方法 | |
CN114254828B (zh) | 一种基于混合卷积特征提取器和gru的电力负荷预测方法 | |
CN113610302B (zh) | 一种基于逐步聚类与循环神经网络的地表温度降尺度方法 | |
CN109858695B (zh) | 基于模糊逻辑预测统计人口总数的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |