CN114399021A - 一种基于多尺度信息的概率风速预测方法和*** - Google Patents

一种基于多尺度信息的概率风速预测方法和*** Download PDF

Info

Publication number
CN114399021A
CN114399021A CN202111451691.3A CN202111451691A CN114399021A CN 114399021 A CN114399021 A CN 114399021A CN 202111451691 A CN202111451691 A CN 202111451691A CN 114399021 A CN114399021 A CN 114399021A
Authority
CN
China
Prior art keywords
quantile
conditional
quantiles
wind speed
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111451691.3A
Other languages
English (en)
Inventor
汪运
宋萌萌
邹润民
何道广
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN202111451691.3A priority Critical patent/CN114399021A/zh
Publication of CN114399021A publication Critical patent/CN114399021A/zh
Priority to US17/902,946 priority patent/US20230169230A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01WMETEOROLOGY
    • G01W1/00Meteorology
    • G01W1/10Devices for predicting weather conditions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Algebra (AREA)
  • Operations Research (AREA)
  • Environmental & Geological Engineering (AREA)
  • Databases & Information Systems (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)

Abstract

本发明实施例提供一种基于多尺度信息的概率风速预测方法和***,使用多层卷积神经网络从输入样本中提取充分的多尺度特征,使用基于长短期记忆(LSTM)与注意力机制进一步提取时序特征并将其编码成低维的特征向量;然后借助所提出的非交叉损失得到相邻分位点间的条件分位数差值,并通过累加累减得到所有给定分位点的条件分位数;不仅可以从有限的数据提取充分的多尺度特征,还可以提供高质量且可靠的概率预测结果,同时解决分位数模型的交叉问题。

Description

一种基于多尺度信息的概率风速预测方法和***
技术领域
本发明实施例涉及可再生能源开发利用技术领域,尤其涉及一种基于多尺度信息的概率风速预测方法和***。
背景技术
随着世界经济的快速发展,人类对能源的需求不断增加,不可再生的化石能源面临枯竭。同时,化石能源的燃烧还伴随着大量有毒物质和温室气体的排放,严重污染生态环境。因此,寻找新型能源迫在眉睫。作为一种清洁、可再生的能源,风能近年来受到广泛的关注并发展迅速。然而,风的间歇性和随机性给风电大规模并网带来困难,准确且有效的风功率预测是应对这一挑战的有效手段。此外,风功率预测还有助于制定调度方案、计算旋转备用容量、降低***运行成本、进行调峰调频工作、维护***功率平衡和安排检修工作。
目前的风功率预测方法可以分为两类:直接预测与间接预测。直接预测是以功率预测值作为模型的输出;间接预测则是先预测风速,再通过风功率曲线将其转换成功率预测值。目前各种各样的风速预测方法被相继提出,这些模型大致可分为物理模型、统计模型、人工智能模型和混合模型。
物理模型根据气温、气压和湿度等气象因子来预测未来风速。数值天气预报是一种常见的物理模型,它通过求解反映大气过程和大气随时间变化的方程来预测风速。物理模型需要大量的计算量和计算时间,一般只用于长期风速预测。统计模型通常以历史风速作为输入,典型的统计模型包括自回归模型、自回归滑动平均模型、自回归积分滑动平均模型。该类模型可用于短期风速预测,但处理非线性数据的能力有限。人工智能模型具有更好的非线性拟合能力,预测性能优于统计模型,在风速预测领域应用广泛。常见的人工智能模型包括反向传播神经网络、埃尔曼神经网络、极限学习机、回声状态网络、广义回归神经网络、径向基函数神经网络、支持向量机、深度学习模型等。混合模型则是组合不同类别的预测模型,综合其优势以提高预测准确度。
上述方法均为确定性预测,其目的是提供与观测值接近的预测值。然而风速的不确定性会导致预测值与真实值存在偏差,在不提供偏差的相关信息时,根据具有较大误差的确定性预测值进行调度与决策将对电力***的运行带来风险。因此,风速概率预测成为近年来的研究热点。这种方法可以生成不同置信水平的波动区间或未来风速的概率密度曲线,以反映不确定性水平,为电力***的调度和运行提供全面的参考。
通常概率风速预测模型分为两类:参数模型和非参数模型。典型的参数模型包括delta方法,MVE,高斯过程回归(Gaussian Process Regression,GPR)。但由于很难保证风速严格服从某种特定的分布,因此参数法缺乏足够的可靠性。非参数方法无分布假设,主要包括下上限估计与分位数回归。其中分位数回归可以一次生成多个分位点的条件分位数,以提供多个不同置信水平的预测区间。为了弥补分位数回归在处理非线性数据的局限性,近年来基于人工智能模型与分位数损失的混合模型被相继提出,虽然这种方式可以很大程度上提升了模型的预测性能,但条件分位数的估计值往往出现交叉,违背不同分位点的条件分位数单调递增的性质。与离散的预测区间相比,概率密度函数(Probability DensityFunction,PDF)可以提供更全面、直观和详细的信息。核密度估计可以将离散的条件分位数转换为连续的PDF,而无需对分布的形状进行任何假设。
目前的预测模型存在三个不足之处。第一,特征的不充分性会降低模型的预测性能。卷积神经网络被广泛用作特征提取器,在多层卷积神经网络中,不同层提取的特征具有不同层次。然而以往的大多数研究只使用最后一层卷积层的特征而忽略其余卷积层的多尺度特征(MSFs)。由于MSFs没有得到充分利用,可能会导致信息丢失进而限制模型的预测性能。第二,以往的研究总是关注确定性预测,而风速的不确定性使得预测结果的可靠性无法得到保证。相比之下,概率预测可以量化相关的不确定性,提供的信息更加可靠和全面。在现有方法中,使用基于分位数的模型是一种有效的策略,可以同时提供多个置信水平的预测区间。第三,分位数模型往往伴随分位数交叉问题,其限制了概率预测结果的可靠性,然而这个问题在诸多研究中总被忽略。
发明内容
本发明实施例提供一种基于多尺度信息的概率风速预测方法和***,不仅可以从有限的数据提取充分的多尺度特征,还可以提供高质量且可靠的概率预测结果,同时解决分位数模型的交叉问题。
第一方面,本发明实施例提供一种基于多尺度信息的概率风速预测方法,包括:
步骤S1、获取历史风速时序数据,将所述风速时序数据划分为训练集和测试集;
步骤S2、构建神经网络模型,所述神经网络模型包括多尺度特征提取模块和LSTM网络模块;所述多尺度特征提取模块用于提取输入向量的一维特征向量,以并行拼接得到多组不同层次的特征子序列;所述LSTM网络模块用于提取所述特征子序列的时序特征,基于所述时序特征的局部特征进行加权组合以确定所述特征子序列的低维特征向量,根据所有所述特征子序列的低维特征向量连接成用于预测的预测特征向量;
步骤S3、构建用于训练所述神经网络模型的分位数损失函数,确定任意两个相邻分位点的条件分位数初始差值,以通过近似绝对差值转换将所述条件分位数初始差值转换为一组大于0的条件分位数差值;基于条件分位数与两个相邻分位点的条件分位数差值确定其余分位点的条件分位数预测值;
步骤S4、基于所述训练集、测试集进行神经网络模型训练、验证,基于训练好的所述神经网络模型确定风速概率预测值,以将所述风速概率预测值转换为所有分位点的条件分位数预测值,组合两个不同分位点的条件分位数预测值,可以得到相应置信水平的预测区间;以所有的条件分位数为输入,通过KDE将离散的条件分位数预测值转换为连续的概率密度曲线。
作为优选的,所述步骤S1具体包括:
采集历史风速时序数据,并对所述历史风速时序数据进行归一化处理:
Figure BDA0003386315210000031
上式中,x为历史风速时序数据中的风速时序,xmax和xmin分别为所述历史风速时序数据中的最大值和最小值,xnormal为归一化后的数据;
按预设比例将所述历史风速时序数据划分为训练集和测试集,练集用于神经网络的训练,测试集用于神经网络模型预测性能的测试。
作为优选的,步骤S2中,所述多尺度特征提取模块包括三层堆叠的一维卷积层,每个卷积层包括多个卷积核,卷积核操作的公式为:
Figure BDA0003386315210000041
上式中,其中
Figure BDA0003386315210000042
为第k-1层卷积层的第h个神经元的输出,Mj为第j个神经元的输入特征向量集,
Figure BDA0003386315210000043
Figure BDA0003386315210000044
分别为第k层卷积层的第j个神经元的偏置与输出,
Figure BDA0003386315210000045
为第k-1层的第h个神经元至第k层的第j个神经元的权值矩阵,f(·)为激活函数,*代表卷积操作;
每个所述卷积核用于将从输入样本中提取的一维特征向量并行拼接成一个多维子序列,以根据输入向量得到三组不同层次的特征子序列{ci}i=1,2,3
作为优选的,步骤S2中,所述LSTM网络模块具体用于:
对特征子序列ci,基于LSTM网络模块提取时序特征
Figure BDA0003386315210000046
其对应第i个LSTM的所有单元的隐状态;Li为第i个LSTM网络模块的单元的个数;通过全连接操作将hi转化成hi’,并通过hi′
Figure BDA0003386315210000047
相加得到hi″
Figure BDA0003386315210000048
其中,hi″为新得到的特征向量,hi′为通过全连接操作得到的特征向量,
Figure BDA0003386315210000049
为第i个LSTM网络模块的最后一个单元的隐状态;基于注意力机制为hi″中的特征向量分配权重:
Figure BDA00033863152100000410
其中,
Figure BDA00033863152100000411
Figure BDA00033863152100000412
分别为hi″的第l与第k个特征向量,
Figure BDA00033863152100000413
为特征向量
Figure BDA00033863152100000414
的注意力概率;根据求得的注意力概率对hi″中的特征向量进行加权,得到一个低维的特征向量:
Figure BDA00033863152100000415
其中vi为特征子序列ci对应的低维特征向量,将所有特征子序列对应的特征向量连接成用于预测的预测特征向量V。
作为优选的,所述分位数损失函数为:
QY(τ|X)=f1(X,β(τ))
上式中,QY(τ│X)为输入向量X在分位点τ的估计值,X=(x1,x2,…,xN);目标变量Y=(y1,y2,…,yN);f1(·)为非线性函数,β(τ)为模型的回归系数,其估计值可以通过最小化如下损失函数值得到:
Figure BDA0003386315210000051
其中,
Figure BDA0003386315210000052
为β(τ)的估计值,N为输入样本的个数,yi为输入向量xi对应的目标变量的值,
Figure BDA0003386315210000053
为分位点τ的条件分位数,
Figure BDA0003386315210000054
为分位数损失:
Figure BDA0003386315210000055
作为优选的,所述条件分位数
Figure BDA0003386315210000056
的输出包括中间分位点的条件分位数
Figure BDA0003386315210000057
与任意两个相邻分位点的条件分位数初始差值
Figure BDA0003386315210000058
τ={τk}k=1,2,…,K,0<τ12<…<τk0<…<τK<1,τk0=0.5;其中:
Figure BDA0003386315210000059
Figure BDA00033863152100000510
Figure BDA00033863152100000511
Figure BDA00033863152100000512
转换成一组大于0的条件分位数差值:
Figure BDA00033863152100000513
其中,θ为一个正数;
Figure BDA00033863152100000514
为相邻两个分位点的条件分位数正数差值;
Figure BDA00033863152100000515
基于得到的条件分位数
Figure BDA00033863152100000516
与条件分位数差值
Figure BDA00033863152100000517
通过累加累减可以得到其余分位点的条件分位数估计值:
Figure BDA00033863152100000518
其中,
Figure BDA00033863152100000519
为分位点τk的条件分位数估计值;
计算用于训练神经网络模型的总分位数损失值:
Figure BDA0003386315210000061
上式中,L表示损失的值。
作为优选的,所述概率密度曲线为:
Figure BDA0003386315210000062
Figure BDA0003386315210000063
上式中,
Figure BDA0003386315210000064
为得到的概率密度方程,B为带宽,KE(α)为Epanechnikov核方程。
第二方面,本发明实施例提供一种基于多尺度信息的概率风速预测***,包括:
数据采集模块,获取历史风速时序数据,将所述风速时序数据划分为训练集和测试集;
模型构建模块,构建神经网络模型,所述神经网络模型包括多尺度特征提取模块和LSTM网络模块;所述多尺度特征提取模块用于提取输入向量的一维特征向量,以并行拼接得到多组不同层次的特征子序列;所述LSTM网络模块用于提取所述特征子序列的时序特征,基于所述时序特征的局部特征进行加权组合以确定所述特征子序列的低维特征向量,根据所有所述特征子序列的低维特征向量连接成用于预测的预测特征向量;
损失函数构建模块,构建用于训练所述神经网络模型的分位数损失函数,确定任意两个相邻分位点的条件分位数初始差值,以通过近似绝对差值转换将所述条件分位数初始差值转换为一组大于0的条件分位数差值;基于条件分位数与两个相邻分位点的条件分位数差值确定其余分位点的条件分位数预测值;
预测模块,基于所述训练集、测试集进行神经网络模型训练、验证,基于训练好的所述神经网络模型确定风速概率预测值,以将所述风速概率预测值转换为所有分位点的条件分位数预测值,组合两个不同分位点的条件分位数预测值,可以得到相应置信水平的预测区间;以所有的条件分位数为输入,通过KDE将离散的条件分位数预测值转换为连续的概率密度曲线。
第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明第一方面实施例所述基于多尺度信息的概率风速预测方法的步骤。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如本发明第一方面实施例所述基于多尺度信息的概率风速预测方法的步骤。
本发明实施例提供的一种基于多尺度信息的概率风速预测方法和***,使用多层卷积神经网络从输入样本中提取充分的多尺度特征,使用基于长短期记忆(LSTM)与注意力机制进一步提取时序特征并将其编码成低维的特征向量;然后借助所提出的非交叉损失得到相邻分位点间的条件分位数差值,并通过累加累减得到所有给定分位点的条件分位数;不仅可以从有限的数据提取充分的多尺度特征,还可以提供高质量且可靠的概率预测结果,同时解决分位数模型的交叉问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为根据本发明实施例的基于多尺度信息的概率风速预测方法流程框图;
图2为根据本发明实施例的近似绝对值转换的原理示意图;
图3为根据本发明实施例的模型MSF-DNQR在Dataset A与Dataset B上的区间预测结果示意图;
图4为根据本发明实施例的实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请实施例中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
本申请实施例中的术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。本申请的描述中,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列部件或单元的***、产品或设备没有限定于已列出的部件或单元,而是可选地还包括没有列出的部件或单元,或可选地还包括对于这些产品或设备固有的其它部件或单元。本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
目前的概率风速预测模型存在三个不足之处。第一,特征的不充分性会降低模型的预测性能。卷积神经网络被广泛用作特征提取器,在多层卷积神经网络中,不同层提取的特征具有不同层次。然而以往的大多数研究只使用最后一层卷积层的特征而忽略其余卷积层的多尺度特征(MSFs)。由于MSFs没有得到充分利用,可能会导致信息丢失进而限制模型的预测性能。第二,以往的研究总是关注确定性预测,而风速的不确定性使得预测结果的可靠性无法得到保证。相比之下,概率预测可以量化相关的不确定性,提供的信息更加可靠和全面。在现有方法中,使用基于分位数的模型是一种有效的策略,可以同时提供多个置信水平的预测区间。第三,分位数模型往往伴随分位数交叉问题,其限制了概率预测结果的可靠性,然而这个问题在诸多研究中总被忽略。
因此,本发明实施例提供一种基于多尺度信息的概率风速预测方法和***,使用多层卷积神经网络从输入样本中提取充分的多尺度特征,使用基于长短期记忆(LSTM)与注意力机制进一步提取时序特征并将其编码成低维的特征向量;然后借助所提出的非交叉损失得到相邻分位点间的条件分位数差值,并通过累加累减得到所有给定分位点的条件分位数;不仅可以从有限的数据提取充分的多尺度特征,还可以提供高质量且可靠的概率预测结果,同时解决分位数模型的交叉问题以下将通过多个实施例进行展开说明和介绍。
图1为本发明实施例提供一种基于多尺度信息的概率风速预测方法,包括:
步骤S1、获取历史风速时序数据,将所述风速时序数据划分为训练集和测试集;
采集历史风速时序数据,并对所述历史风速时序数据进行归一化处理:
Figure BDA0003386315210000091
上式中,x为历史风速时序数据中的风速时序,xmax和xmin分别为所述历史风速时序数据中的最大值和最小值,xnormal为归一化后的数据;
按预设比例将所述历史风速时序数据划分为训练集和测试集,练集用于神经网络的训练,测试集用于神经网络模型预测性能的测试。
步骤S2、构建神经网络模型,所述神经网络模型包括多尺度特征提取模块和LSTM网络模块;所述多尺度特征提取模块用于提取输入向量的一维特征向量,以并行拼接得到多组不同层次的特征子序列;所述LSTM网络模块用于提取所述特征子序列的时序特征,基于所述时序特征的局部特征进行加权组合以确定所述特征子序列的低维特征向量,根据所有所述特征子序列的低维特征向量连接成用于预测的预测特征向量;
本发明实施例构建的模型命名为基于多尺度特征的深度非交叉分位数回归模型,即MSF-DNQR,具体的模型实现步骤如下:
在多层卷积神经网络中,不同层具有不同层次的特征。以往的大多数研究只使用最后一层卷积层的特征而忽略其余卷积层的MSFs,这可能会导致信息丢失并限制模型的预测性能。本发明实施例设计一种多尺度特征提取模块,实现从有限的数据提取充分的信息,并将其压缩成低维特征向量以降低计算成本。模块的处理步骤可分为以下两步:
一、多尺度特征提取;构建一个由三层一维卷积堆叠而成的神经网络模型,每个卷积层包含多个卷积核,卷积核操作的公式为:
Figure BDA0003386315210000101
上式中,其中
Figure BDA0003386315210000102
为第k-1层卷积层的第h个神经元的输出,Mj为第j个神经元的输入特征向量集,
Figure BDA0003386315210000103
Figure BDA0003386315210000104
分别为第k层卷积层的第j个神经元的偏置与输出,
Figure BDA0003386315210000105
为第k-1层的第h个神经元至第k层的第j个神经元的权值矩阵,f(·)为激活函数,*代表卷积操作;
每个所述卷积核用于将从输入样本中提取的一维特征向量并行拼接成一个多维子序列,以根据输入向量得到三组不同层次的特征子序列{ci}i=1,2,3
二、时序特征提取与编码;对每个特征子序列ci,基于LSTM网络模块提取时序特征
Figure BDA0003386315210000106
其对应第i个LSTM的所有单元的隐状态;Li为第i个LSTM网络模块的单元的个数;通过全连接操作将hi转化成hi’,并通过hi′
Figure BDA0003386315210000107
相加得到hi″
Figure BDA0003386315210000108
其中,hi″为新得到的特征向量,hi′为通过全连接操作得到的特征向量,
Figure BDA0003386315210000109
为第i个LSTM网络模块的最后一个单元的隐状态;基于注意力机制为hi″中的特征向量分配权重:
Figure BDA00033863152100001010
其中,
Figure BDA00033863152100001011
Figure BDA00033863152100001012
分别为hi″的第l与第k个特征向量,
Figure BDA00033863152100001013
为特征向量
Figure BDA00033863152100001014
的注意力概率;根据求得的注意力概率对hi″中的特征向量进行加权,得到一个低维的特征向量:
Figure BDA00033863152100001015
其中vi为特征子序列ci对应的低维特征向量,将所有特征子序列对应的特征向量连接成用于预测的预测特征向量V。
步骤S3、构建用于训练所述神经网络模型的分位数损失函数,确定任意两个相邻分位点的条件分位数初始差值,以通过近似绝对差值转换将所述条件分位数初始差值转换为一组大于0的条件分位数差值;基于条件分位数与两个相邻分位点的条件分位数差值确定其余分位点的条件分位数预测值;
本发明实施例构建的是无交叉分位数损失函数;给定一组输入向量X=(x1,x2,…,xN)与目标变量Y=(y1,y2,…,yN),分位数回归用于在输入与目标变量的条件分位数之间建立映射关系。人工智能模型与分位数损失相组合还可以处理非线性问题:
QY(τ|X)=f1(X,β(τ)) (6)
上式中,QY(τ│X)为输入向量X在分位点τ的估计值,X=(x1,x2,…,xN);目标变量Y=(y1,y2,…,yN);f1(·)为非线性函数,β(τ)为模型的回归系数,其估计值可以通过最小化如下损失函数值得到:
Figure BDA0003386315210000111
其中,
Figure BDA0003386315210000112
为β(τ)的估计值,N为输入样本的个数,yi为输入样本xi对应的目标变量的值,Qyi(τ|xi)为分位点τ的条件分位数,
Figure BDA0003386315210000113
为分位数损失:
Figure BDA0003386315210000114
为构建多个预测区间及目标变量的概率密度函数,需要估计多个分位点的条件分位数。然而得到的估计值总是出现交叉问题,即任意给定两个分位点τ12,0<τ12<1,τ1的条件分位数的估计值大于等于τ2的条件分位数的估计值。这一问题违背了条件分位数的单调性,使得预测结果不可靠,因此本发明实施例提出一种无交叉的分位数损失以解决这一问题,具体可分为如下几步:
假定有K个分位点τ={τk}k=1,2,…,K,0<τ12<…<τk0<…<τK<1,τk0=0.5;需要同时估计条件分位数
Figure BDA0003386315210000115
的输出包括中间分位点τk0的条件分位数
Figure BDA0003386315210000116
与任意两个相邻分位点的条件分位数初始差值
Figure BDA0003386315210000117
如图2中所示,通过近似绝对值转换将将
Figure BDA0003386315210000118
转换成一组大于0的条件分位数差值:
Figure BDA0003386315210000121
其中,θ为一个正数;
Figure BDA0003386315210000122
为相邻两个分位点的条件分位数正数差值;
Figure BDA0003386315210000123
基于得到的条件分位数
Figure BDA0003386315210000124
与条件分位数差值
Figure BDA0003386315210000125
通过累加累减可以得到其余分位点的条件分位数估计值:
Figure BDA0003386315210000126
其中,
Figure BDA0003386315210000127
为分位点τk的条件分位数估计值;
计算用于训练神经网络模型的总分位数损失值:
Figure BDA0003386315210000128
上式中,L表示损失的值。由于相邻分位点的条件分位数差值为正数,因此不同分位点的条件分位数单调递增,交叉问题得以消除。
步骤S4、基于所述训练集、测试集进行神经网络模型训练、验证,基于训练好的所述神经网络模型确定风速概率预测值,以将所述风速概率预测值转换为所有分位点的条件分位数预测值,组合两个不同分位点的条件分位数预测值,可以得到相应置信水平的预测区间;以所有的条件分位数为输入,通过KDE将离散的条件分位数预测值转换为连续的概率密度曲线。
将测试样本输入至训练好的模型,并将模型的输出结果反归一化:
Figure BDA0003386315210000129
其中f是反归一化的预测值。通过公式(9)、公式(10)将预测值转化成所有分位点的条件分位数估计值。通过组合两个不同分位点的条件分位数,可以得到相应置信水平的预测区间。以所有的条件分位数为输入,通过KDE可将离散的条件分位数预测值转换为连续的概率密度曲线,进而直观地反映相关的不确定性:所述概率密度曲线为:
Figure BDA00033863152100001210
Figure BDA0003386315210000131
上式中,
Figure BDA0003386315210000132
为得到的概率密度方程,B为带宽,KE(α)为Epanechnikov核方程。
通过以上操作,可以从有限的数据提取并充分利用多尺度特征,获得不同置信度下多个预测区间及连续的概率密度曲线,同时解决分位数交叉问题。
为了验证本发明实施例方案的可靠性,本发明实施例采用南达科他州的两个风速数据集来评估所提出模型的有效性。数据集的时间尺度为1小时,时间跨度为2012一整年,其中前八个月的数据用于生成训练样本集,余下四个月的数据用于生成测试样本集。为方便描述,将这两个数据集分别命名为Dataset A和Dataset B。为度量不同模型的概率预测性能,采用7项评价指标,即预测区间覆盖率(PICP)、平均覆盖误差(ACE)、预测区间归一化平均宽度(PINAW)、平均预测区间宽度(MPIW)、基于覆盖宽度的标准(CWC)、区间分数(SC)、Pinball损失(PL)。
为评估所提出模型的概率预测性能,本发明实施例中引入多种概率预测对比模型,可分为传统概率预测模型与基于人工智能的概率预测模型。传统概率预测模型包括GPR、线性分位数回归(LQR)。人工智能模型包括上下界估计(LUBE)与基于分位数损失的模型。LUBE可以同时生成给定置信水平的预测区间的上界与下界。基于人工智能的分位数损失模型则是通过组合人工智能技术与分位数损失生成目标变量的条件分位数,包括基于反向传播神经网络的分位数损失模型(QR-BP)、基于卷积神经网络的分位数损失模型(QR-CNN)、基于长短时记忆的分位数损失模型(QR-LSTM)、基于CNN与LSTM混合模型的分位数损失模型(QR-CNN-LSTM)。在验证所提出的MSF模块的性能时,基于分位数损失模型的损失函数应保持一致以保证对比的公平性,因此将MSF模块和分位数损失相结合引入一种新的对比模型MSF-DQR。
对比模型的参数设置遵循相关的文献,深度学习模型的参数值通过Adam优化器训练得到。本发明实施例在0.05至0.995等间隔选取199个分位点,输入节点个数及输入样本的滞后时间长度均设为12。另外,在所提出的损失函数中,θ的值被设为1×10-8。为了说明概率风速预测的性能,本发明实施例对比了85%、90%与95%置信度下的预测区间,结果如表1与表2所示。
表1 数据集Dataset A上不同模型的概率预测结果
Figure BDA0003386315210000141
表2 数据集Dataset B上不同模型的概率预测结果
Figure BDA0003386315210000142
Figure BDA0003386315210000151
首先通过对比GPR、LUBE、LQR、QR-NN、QR-CNN、QR-LSTM、QR-CNN-LSTM、MSF-DQR在不同数据集中不同置信水平的概率预测度量指标结果可以看出所提出的模型MSF-DQR的性能要优于其他7种对比模型。除LUBE以外的深度学习模型优于传统概率预测模型GPR、LQR。在深度学习模型中,基于分位数损失的模型要优于LUBE。在深度学习对比模型中基于卷积神经网络的模型QR-CNN性能最佳,但仍劣于基于多尺度特征提取技术的深度学习模型MSF-DQR。由于QR-NN、QR-CNN、QR-LSTM、QR-CNN-LSTM、MSF-DQR具有相同的损失函数,因此其原因可能是多尺度特征提取模块对样本特征的充分性提取与利用可以提升模型的预测性能。
其次通过对比MSF-DQR与MSF-DNQR的预测结果可发现二者具有相似的预测性能,由于模型结构相同,MSF-DNQR较MSF-DQR只在损失函数做出改进,说明引入无交叉损失函数对模型的预测性能没有负面的影响。
由于除MSF-DQR以外,MSF-DNQR在可靠度(PICP、ACE)、区间宽度(MPIW、PINAW)、综合指标(CWC、SC)以及准确性(PL)方面均优于其他概率预测对比模型,因此可以认为所提出的模型可以生成质量与准确性更高的概率预测结果。
图3所示为MSF-DNQR在85%、90%和95%置信水平下的预测区间.可观察到,预测区间的上下边界随观测值上下波动,区间在覆盖了绝大多数观测值的同时可保持较窄的宽度,这进一步表明MSF-DNQR可以提供高质量与准确的概率预测值。
为将神经网络的输出转换为相邻两个分位点间的条件分位数差值,除了公式(9)所示的近似绝对值转换,本发明实施例还提出如公式(15)、公式(16)、公式(17)所示的三种基于softmax、softplus与ReLU激活函数的转换策略:
Figure BDA0003386315210000161
Figure BDA0003386315210000162
Figure BDA0003386315210000163
其中θ为一正数,以保证得到的差值大于0。保持神经网络的结构不变,将MSF-DNQR的损失函数替换为上述的三个方程,可以得到三种不同的模型,记为MSF-DNQR-SM,MSF-DNQR-SP与MSF-DNQR-ReLU。如表3至表4所示为以上三种模型与MSF-DNQR在不同数据集上的概率预测结果。
表3 数据集Dataset A上基于不同无交叉损失函数的概率预测结果
Figure BDA0003386315210000164
表4 数据集Dataset B上基于不同无交叉损失函数的概率预测结果
Figure BDA0003386315210000165
首先,MSF-DNQR在所有模型中性能最好。该模型的PICP不仅均满足给定的置信水平,其ACE、MPIW、PINAW、CWC、PL的值及SC的绝对值在绝大多数情况下均为最小。其次,MSF-DNQR-ReLU的性能与MSF-DNQR相近,但由于其PICP有时低于指定的置信水平因而缺乏足够的可靠性。MSF-DNQR-SM与MSF-DNQR-SP表现最差,通过表3、表4可以发现虽然该两种模型的PICP较MSF-DNQR-ReLU可满足所有指定的置信水平,但PINAW、MPIW的值却比较大,因此其可靠性的保证是以牺牲区间的宽度为代价。同时还可以发现该两种模型的CWC、SC、PL的值均较差,表明其区间的综合质量与预测结果的准确性较低。综上所述,与三种基于softmax、softplus、ReLU激活函数的无交叉策略相比,本发明实施例提出的MSF-DNQR具有最佳的概率预测性能。
本发明实施例还提供一种基于多尺度信息的概率风速预测***,基于上述各实施例中的基于多尺度信息的概率风速预测方法,包括:
数据采集模块,获取历史风速时序数据,将所述风速时序数据划分为训练集和测试集;
模型构建模块,构建神经网络模型,所述神经网络模型包括多尺度特征提取模块和LSTM网络模块;所述多尺度特征提取模块用于提取输入向量的一维特征向量,以并行拼接得到多组不同层次的特征子序列;所述LSTM网络模块用于提取所述特征子序列的时序特征,基于所述时序特征的局部特征进行加权组合以确定所述特征子序列的低维特征向量,根据所有所述特征子序列的低维特征向量连接成用于预测的预测特征向量;
损失函数构建模块,构建用于训练所述神经网络模型的分位数损失函数,确定任意两个相邻分位点的条件分位数初始差值,以通过近似绝对差值转换将所述条件分位数初始差值转换为一组大于0的条件分位数差值;基于条件分位数与两个相邻分位点的条件分位数差值确定其余分位点的条件分位数预测值;
预测模块,基于所述训练集、测试集进行神经网络模型训练、验证,基于训练好的所述神经网络模型确定风速概率预测值,以将所述风速概率预测值转换为所有分位点的条件分位数预测值,组合两个不同分位点的条件分位数预测值,可以得到相应置信水平的预测区间;以所有的条件分位数为输入,通过KDE将离散的条件分位数预测值转换为连续的概率密度曲线。
基于相同的构思,本发明实施例还提供了一种实体结构示意图,如图4所示,该服务器可以包括:处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行如上述各实施例所述基于多尺度信息的概率风速预测方法的步骤。例如包括:
步骤S1、获取历史风速时序数据,将所述风速时序数据划分为训练集和测试集;
步骤S2、构建神经网络模型,所述神经网络模型包括多尺度特征提取模块和LSTM网络模块;所述多尺度特征提取模块用于提取输入向量的一维特征向量,以并行拼接得到多组不同层次的特征子序列;所述LSTM网络模块用于提取所述特征子序列的时序特征,基于所述时序特征的局部特征进行加权组合以确定所述特征子序列的低维特征向量,根据所有所述特征子序列的低维特征向量连接成用于预测的预测特征向量;
步骤S3、构建用于训练所述神经网络模型的分位数损失函数,确定任意两个相邻分位点的条件分位数初始差值,以通过近似绝对差值转换将所述条件分位数初始差值转换为一组大于0的条件分位数差值;基于条件分位数与两个相邻分位点的条件分位数差值确定其余分位点的条件分位数预测值;
步骤S4、基于所述训练集、测试集进行神经网络模型训练、验证,基于训练好的所述神经网络模型确定风速概率预测值,以将所述风速概率预测值转换为所有分位点的条件分位数预测值,组合两个不同分位点的条件分位数预测值,可以得到相应置信水平的预测区间;以所有的条件分位数为输入,通过KDE将离散的条件分位数预测值转换为连续的概率密度曲线。
此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
基于相同的构思,本发明实施例还提供一种非暂态计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序包含至少一段代码,该至少一段代码可由主控设备执行,以控制主控设备用以实现如上述各实施例所述基于多尺度信息的概率风速预测方法的步骤。例如包括:
步骤S1、获取历史风速时序数据,将所述风速时序数据划分为训练集和测试集;
步骤S2、构建神经网络模型,所述神经网络模型包括多尺度特征提取模块和LSTM网络模块;所述多尺度特征提取模块用于提取输入向量的一维特征向量,以并行拼接得到多组不同层次的特征子序列;所述LSTM网络模块用于提取所述特征子序列的时序特征,基于所述时序特征的局部特征进行加权组合以确定所述特征子序列的低维特征向量,根据所有所述特征子序列的低维特征向量连接成用于预测的预测特征向量;
步骤S3、构建用于训练所述神经网络模型的分位数损失函数,确定任意两个相邻分位点的条件分位数初始差值,以通过近似绝对差值转换将所述条件分位数初始差值转换为一组大于0的条件分位数差值;基于条件分位数与两个相邻分位点的条件分位数差值确定其余分位点的条件分位数预测值;
步骤S4、基于所述训练集、测试集进行神经网络模型训练、验证,基于训练好的所述神经网络模型确定风速概率预测值,以将所述风速概率预测值转换为所有分位点的条件分位数预测值,组合两个不同分位点的条件分位数预测值,可以得到相应置信水平的预测区间;以所有的条件分位数为输入,通过KDE将离散的条件分位数预测值转换为连续的概率密度曲线。
基于相同的技术构思,本申请实施例还提供一种计算机程序,当该计算机程序被主控设备执行时,用以实现上述方法实施例。
所述程序可以全部或者部分存储在与处理器封装在一起的存储介质上,也可以部分或者全部存储在不与处理器封装在一起的存储器上。
基于相同的技术构思,本申请实施例还提供一种处理器,该处理器用以实现上述方法实施例。上述处理器可以为芯片。
综上所述,本发明实施例提供的一种基于多尺度信息的概率风速预测方法和***,使用多层卷积神经网络从输入样本中提取充分的多尺度特征,使用基于长短期记忆(LSTM)与注意力机制进一步提取时序特征并将其编码成低维的特征向量;然后借助所提出的非交叉损失得到相邻分位点间的条件分位数差值,并通过累加累减得到所有给定分位点的条件分位数;不仅可以从有限的数据提取充分的多尺度特征,还可以提供高质量且可靠的概率预测结果,同时解决分位数模型的交叉问题。
本发明的各实施方式可以任意进行组合,以实现不同的技术效果。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘SolidStateDisk)等。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,该流程可以由计算机程序来指令相关的硬件完成,该程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。而前述的存储介质包括:ROM或随机存储记忆体RAM、磁碟或者光盘等各种可存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种基于多尺度信息的概率风速预测方法,其特征在于,包括:
步骤S1、获取历史风速时序数据,将所述风速时序数据划分为训练集和测试集;
步骤S2、构建神经网络模型,所述神经网络模型包括多尺度特征提取模块和LSTM网络模块;所述多尺度特征提取模块用于提取输入向量的一维特征向量,以并行拼接得到多组不同层次的特征子序列;所述LSTM网络模块用于提取所述特征子序列的时序特征,基于所述时序特征的局部特征进行加权组合以确定所述特征子序列的低维特征向量,根据所有所述特征子序列的低维特征向量连接成用于预测的预测特征向量;
步骤S3、构建用于训练所述神经网络模型的分位数损失函数,确定任意两个相邻分位点的条件分位数初始差值,以通过近似绝对差值转换将所述条件分位数初始差值转换为一组大于0的条件分位数差值;基于条件分位数与两个相邻分位点的条件分位数差值确定其余分位点的条件分位数预测值;
步骤S4、基于所述训练集、测试集进行神经网络模型训练、验证,基于训练好的所述神经网络模型确定风速概率预测值,以将所述风速概率预测值转换为所有分位点的条件分位数预测值,组合两个不同分位点的条件分位数预测值,可以得到相应置信水平的预测区间;以所有的条件分位数为输入,通过KDE将离散的条件分位数预测值转换为连续的概率密度曲线。
2.根据权利要求1所述的基于多尺度信息的概率风速预测方法,其特征在于,所述步骤S1具体包括:
采集历史风速时序数据,并对所述历史风速时序数据进行归一化处理:
Figure FDA0003386315200000011
上式中,x为历史风速时序数据中的风速时序,xmax和xmin分别为所述历史风速时序数据中的最大值和最小值,xnormal为归一化后的数据;
按预设比例将所述历史风速时序数据划分为训练集和测试集,练集用于神经网络的训练,测试集用于神经网络模型预测性能的测试。
3.根据权利要求1所述的基于多尺度信息的概率风速预测方法,其特征在于,步骤S2中,所述多尺度特征提取模块包括三层堆叠的一维卷积层,每个卷积层包括多个卷积核,卷积核操作的公式为:
Figure FDA0003386315200000021
上式中,其中
Figure FDA0003386315200000022
为第k-1层卷积层的第h个神经元的输出,Mj为第j个神经元的输入特征向量集,
Figure FDA0003386315200000023
Figure FDA0003386315200000024
分别为第k层卷积层的第j个神经元的偏置与输出,
Figure FDA0003386315200000025
为第k-1层的第h个神经元至第k层的第j个神经元的权值矩阵,f(·)为激活函数,*代表卷积操作;
每个所述卷积核用于将从输入样本中提取的一维特征向量并行拼接成一个多维子序列,以根据输入向量得到三组不同层次的特征子序列{ci}i=1,2,3
4.根据权利要求3所述的基于多尺度信息的概率风速预测方法,其特征在于,步骤S2中,所述LSTM网络模块具体用于:
对特征子序列ci,基于LSTM网络模块提取时序特征
Figure FDA0003386315200000026
其对应第i个LSTM的所有单元的隐状态;Li为第i个LSTM网络模块的单元的个数;通过全连接操作将hi转化成hi’,并通过hi′
Figure FDA0003386315200000027
相加得到hi″
Figure FDA0003386315200000028
其中,hi″为新得到的特征向量,hi′为通过全连接操作得到的特征向量,
Figure FDA0003386315200000029
为第i个LSTM网络模块的最后一个单元的隐状态;基于注意力机制为hi″中的特征向量分配权重:
Figure FDA00033863152000000210
其中,
Figure FDA00033863152000000211
Figure FDA00033863152000000212
分别为hi″的第l与第k个特征向量,
Figure FDA00033863152000000213
为特征向量
Figure FDA00033863152000000214
的注意力概率;根据求得的注意力概率对hi″中的特征向量进行加权,得到一个低维的特征向量:
Figure FDA00033863152000000215
其中vi为特征子序列ci对应的低维特征向量,将所有特征子序列对应的特征向量连接成用于预测的预测特征向量V。
5.根据权利要求2所述的基于多尺度信息的概率风速预测方法,其特征在于,所述分位数损失函数为:
QY(τ|X)=f1(X,β(τ))
上式中,QY(τ│X)为输入向量X在分位点τ的估计值,X=(x1,x2,…,xN);目标变量Y=(y1,y2,…,yN);f1(·)为非线性函数,β(τ)为模型的回归系数,其估计值可以通过最小化如下损失函数值得到:
Figure FDA0003386315200000031
其中,
Figure FDA0003386315200000032
为β(τ)的估计值,N为输入样本的个数,yi为输入向量xi对应的目标变量的值,
Figure FDA0003386315200000033
为分位点τ的条件分位数,
Figure FDA0003386315200000034
为分位数损失:
Figure FDA0003386315200000035
6.根据权利要求5所述的基于多尺度信息的概率风速预测方法,其特征在于,所述条件分位数
Figure FDA0003386315200000036
的输出包括中间分位点的条件分位数
Figure FDA0003386315200000037
与任意两个相邻分位点的条件分位数初始差值
Figure FDA0003386315200000038
τ={τk}k=1,2,…,K,0<τ12<…<τk0<…<τK<1,τk0=0.5;其中:
Figure FDA0003386315200000039
Figure FDA00033863152000000310
Figure FDA00033863152000000311
Figure FDA00033863152000000312
转换成一组大于0的条件分位数差值:
Figure FDA00033863152000000313
其中,θ为一个正数;
Figure FDA00033863152000000314
为相邻两个分位点的条件分位数正数差值;
Figure FDA00033863152000000315
基于得到的条件分位数
Figure FDA00033863152000000316
与条件分位数差值
Figure FDA00033863152000000317
通过累加累减可以得到其余分位点的条件分位数估计值:
Figure FDA00033863152000000318
其中,
Figure FDA00033863152000000319
为分位点τk的条件分位数估计值;
计算用于训练神经网络模型的总分位数损失值:
Figure FDA0003386315200000041
上式中,L表示损失的值。
7.根据权利要求6所述的基于多尺度信息的概率风速预测方法,其特征在于,所述概率密度曲线为:
Figure FDA0003386315200000042
Figure FDA0003386315200000043
上式中,
Figure FDA0003386315200000044
为得到的概率密度方程,B为带宽,KE(α)为Epanechnikov核方程。
8.一种基于多尺度信息的概率风速预测***,其特征在于,包括:
数据采集模块,获取历史风速时序数据,将所述风速时序数据划分为训练集和测试集;
模型构建模块,构建神经网络模型,所述神经网络模型包括多尺度特征提取模块和LSTM网络模块;所述多尺度特征提取模块用于提取输入向量的一维特征向量,以并行拼接得到多组不同层次的特征子序列;所述LSTM网络模块用于提取所述特征子序列的时序特征,基于所述时序特征的局部特征进行加权组合以确定所述特征子序列的低维特征向量,根据所有所述特征子序列的低维特征向量连接成用于预测的预测特征向量;
损失函数构建模块,构建用于训练所述神经网络模型的分位数损失函数,确定任意两个相邻分位点的条件分位数初始差值,以通过近似绝对差值转换将所述条件分位数初始差值转换为一组大于0的条件分位数差值;基于条件分位数与两个相邻分位点的条件分位数差值确定其余分位点的条件分位数预测值;
预测模块,基于所述训练集、测试集进行神经网络模型训练、验证,基于训练好的所述神经网络模型确定风速概率预测值,以将所述风速概率预测值转换为所有分位点的条件分位数预测值,组合两个不同分位点的条件分位数预测值,可以得到相应置信水平的预测区间;以所有的条件分位数为输入,通过KDE将离散的条件分位数预测值转换为连续的概率密度曲线。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述基于多尺度信息的概率风速预测方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述基于多尺度信息的概率风速预测方法的步骤。
CN202111451691.3A 2021-12-01 2021-12-01 一种基于多尺度信息的概率风速预测方法和*** Pending CN114399021A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202111451691.3A CN114399021A (zh) 2021-12-01 2021-12-01 一种基于多尺度信息的概率风速预测方法和***
US17/902,946 US20230169230A1 (en) 2021-12-01 2022-09-05 Probabilistic wind speed forecasting method and system based on multi-scale information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111451691.3A CN114399021A (zh) 2021-12-01 2021-12-01 一种基于多尺度信息的概率风速预测方法和***

Publications (1)

Publication Number Publication Date
CN114399021A true CN114399021A (zh) 2022-04-26

Family

ID=81225889

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111451691.3A Pending CN114399021A (zh) 2021-12-01 2021-12-01 一种基于多尺度信息的概率风速预测方法和***

Country Status (2)

Country Link
US (1) US20230169230A1 (zh)
CN (1) CN114399021A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116188462A (zh) * 2023-04-24 2023-05-30 深圳市翠绿贵金属材料科技有限公司 一种基于视觉鉴定的贵金属质量检测方法及***

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116662766B (zh) * 2023-08-01 2023-10-03 浙江大学 基于数据二维重构的风速预测方法及装置、电子设备
CN116911467A (zh) * 2023-09-12 2023-10-20 浙江华云电力工程设计咨询有限公司 一种可再生能源出力的预测方法、装置及存储介质
CN117174219B (zh) * 2023-11-02 2024-02-02 济南大学 基于隐变量模型的水泥强度条件概率分布估计方法及***
CN117634930B (zh) * 2024-01-24 2024-03-29 南京信息工程大学 一种台风云图预测方法、***及存储介质
CN117829383B (zh) * 2024-03-06 2024-07-05 山东高速新能源开发有限公司 一种零碳隧道能源优化配置方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116188462A (zh) * 2023-04-24 2023-05-30 深圳市翠绿贵金属材料科技有限公司 一种基于视觉鉴定的贵金属质量检测方法及***
CN116188462B (zh) * 2023-04-24 2023-08-11 深圳市翠绿贵金属材料科技有限公司 一种基于视觉鉴定的贵金属质量检测方法及***

Also Published As

Publication number Publication date
US20230169230A1 (en) 2023-06-01

Similar Documents

Publication Publication Date Title
Tang et al. Short‐term power load forecasting based on multi‐layer bidirectional recurrent neural network
CN114399021A (zh) 一种基于多尺度信息的概率风速预测方法和***
CN110969290B (zh) 一种基于深度学习的径流概率预测方法及***
CN110619420B (zh) 一种基于Attention-GRU的短期住宅负荷预测方法
CN112488395A (zh) 一种配电网线损预测方法及***
Rai et al. Analysis of classical and machine learning based short-term and mid-term load forecasting for smart grid
CN112712203B (zh) 一种配电网日最高负荷预测方法和***
CN112215442B (zh) 电力***短期负荷预测方法、***、设备及介质
Heng et al. Probabilistic and deterministic wind speed forecasting based on non-parametric approaches and wind characteristics information
Zhang et al. A novel power-driven fractional accumulated grey model and its application in forecasting wind energy consumption of China
CN112163715A (zh) 生成式对抗网络的训练方法及装置、电力负荷预测方法
CN111882157A (zh) 一种基于深度时空神经网络的需求预测方法、***及计算机可读存储介质
CN115186923A (zh) 光伏发电功率的预测方法、装置及电子设备
CN114154716B (zh) 一种基于图神经网络的企业能耗预测方法及装置
Widodo et al. Model selection using dimensionality reduction of time series characteristics
CN114118570A (zh) 业务数据预测方法及装置、电子设备和存储介质
CN113886454A (zh) 一种基于lstm-rbf的云资源预测方法
CN116404637A (zh) 电力***短期负荷预测方法和电力***短期负荷预测装置
CN115952928A (zh) 一种短期电力负荷预测方法、装置、设备及存储介质
Yan et al. Transferability and robustness of a data-driven model built on a large number of buildings
CN115622034A (zh) 一种基于改进遗传神经网络的物联表电力负荷识别方法
CN113591391A (zh) 一种电力负荷控制装置、控制方法、终端、介质及应用
CN112614006A (zh) 负荷预测方法、装置、计算机可读存储介质以及处理器
CN112183814A (zh) 一种短期风速预测方法
CN116632842B (zh) 基于聚类特性的台区分布式光伏负荷概率预测方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination