CN107292446A - 一种基于考虑分量关联性小波分解的混合风速预测方法 - Google Patents

一种基于考虑分量关联性小波分解的混合风速预测方法 Download PDF

Info

Publication number
CN107292446A
CN107292446A CN201710532532.3A CN201710532532A CN107292446A CN 107292446 A CN107292446 A CN 107292446A CN 201710532532 A CN201710532532 A CN 201710532532A CN 107292446 A CN107292446 A CN 107292446A
Authority
CN
China
Prior art keywords
mrow
msub
subsequence
data
models
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710532532.3A
Other languages
English (en)
Other versions
CN107292446B (zh
Inventor
黄国庆
姜言
彭新艳
宋淳宸
李永乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Jiaotong University
Original Assignee
Southwest Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Jiaotong University filed Critical Southwest Jiaotong University
Priority to CN201710532532.3A priority Critical patent/CN107292446B/zh
Publication of CN107292446A publication Critical patent/CN107292446A/zh
Application granted granted Critical
Publication of CN107292446B publication Critical patent/CN107292446B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于考虑分量关联性小波分解的混合风速预测方法,将原始数据分为训练集和测试集;将训练集分解为若干子序列,根据子序列和原始数据的相关系数识别虚假子序列,并将其剔除相应,对剩余子序列建预测模型,通过子序列中第1至n个数据来预测第n+1个数据;叠加各个子序列预测得的第n+1个数据1,获得最终预测结果;更新训练集,并将更新后的训集分解为若干新的子序列,建立LSSVM模型预测第n+2数据,叠加各个子序列的预测得第n+2个数据获得预测值;继续进行超前一步预测,直到完成所有预测。本发明降低了子序列虚假成分的影响,提高了预测的性能,及预测的准确性和稳定性。

Description

一种基于考虑分量关联性小波分解的混合风速预测方法
技术领域
本发明涉及风速预测技术领域,具体为一种基于考虑分量关联性小波分解的混合风速预 测方法。
背景技术
由于风能可再生,无污染和丰富大量的特点,其在温室气体减排和取代化石燃料中起着 重要作用。全球风能委员会预计,在全球电力供应中风能占比将在2020年达到12%,2030 年达到22%。然而由于风速时间序列的随机性,非线性和非平稳性,如何完全实现将风力发 电应用于多源能源网络仍有很大的困难,如产能计划和风机维护等。
为了提高风速预测的准确性,大量的预测方法发展了起来。主要分为三类:物理方法, 时间序列方法和基于人工智能的方法。物理方法预测风速时考虑了气象因素如地形,大气压 和环境温度。数值天气预报(Numerical Weather Prediction NWP)作为物理法的代表而被广泛 应用。但它通常是用于长期风速预测不适于短期风速预测。时间序列的方法利用历史数据来 预测风速,包括自回归模型(AR Autoregressive),自回归移动平均模型(Autoregressive Moving Average ARMA),差分自回归移动平均模型(AutoregressiveIntegrated Moving Average Model ARIMA)和分数差分自回归移动平均模型(FractionalAutoregressive Integrated Moving Average Model FARIMA)。尽管这些方法可以很好地捕捉到风速数据中的线性关系,但不能很好的揭 示其中的非线性特征。基于人工智能的方法能够的揭示风速时间序列中的非线性特征,建立 输入值和输出值之间的非线性关系。其包括人工神经网络(Artificial Neural Network ANN),支 持向量机(Support VectorMachine SVM),最小二乘支持向量机(Least Square Support Vector Machine LSSVM)和模糊逻辑方法。由于风速序列具有极强的非线性特征,总的来说基于人 工智能的预测准确性优于时间序列法。但是其模型参数需要更多的调整,也存在着着效率低 下和过度拟合的问题。
近年来基于分解的混合模型发展了起来,典型的分解法有经验模态分解(Empirical Mode Decomposition EMD),集合经验模态分解(Ensemble Empirical ModeDecomposition EEMD), 快速集合经验模态分解(Fast Ensemble Empirical ModeDecomposition FEEMD),离散小波变 换(Discrete Wavelet Transform DWT)和小波包分解(Wavelet Packet Decomposition WPD), 对分解后的子序列建立的风速预测模型如ARIMA,ANN,SVM和LSSVM模型。如采用递 归ARIMA模型来预测EMD分解后的风速时间序列的各个子序列;如应用FEEMD可以提高 EEMD在风速预测时的计算性能;再如结合两种分解方法(如DWT和WPD)和两种预测方 法(时间序列和ANN)发展了三种不同的混合模型。其将DWT,WPD,EMD和FEEMD同 极限学***稳的风速时间序列分解成更加稳定和正规的子序列,优化预测结果。 许多研究表明基于分解的混合方法优于没有分解的方法。
然而上述结论来自一次性分解所有的数据,包括已知数据(训练数据)和未知数据(测 试数据)。这意味着假设所求的未来的数据为已知的,有违风速预测的目的。为了避免这个问 题,多项研究建议将原始数据分为训练集和测试集,对训练集进行实时分解。更具体地说, 只能获得训练集中的数据,测试集的数据是未知的。每当获得新的数据,不断更新训练数据 再重新分解。基于EMD的混合方法预测性能甚至不及未分解的方法。尽管这些研究提升了 对基于分解法的认识,但其结论值得深入复审。
发明内容
基于上述问题,本发明的目的在于提供一种基于实时分解的在准确性和稳定性方面更优 的基于考虑分量关联性小波分解的混合风速预测方法,技术方案如下:
一种基于考虑分量关联性小波分解的混合风速预测方法,包括以下步骤:
步骤1:将原始数据分为两部分,包括训练集:{x(1),…,x(n)};测试集{x(n+1),…,x(n+N)};
步骤2:测试集视为未知,建立DWT或EMD模型将训练集分解为若干子序列{cj(1),…, cj(n)},j=1…M+1;
步骤3:进行子序列和原始序列的相关性分析,根据子序列和原始数据的相关系数识别虚 假子序列:若相关系数超过所选阈值,则剔除相应的子系列,否则应保留相应的子系列;
步骤4:对剩余子序列建立LSSVM或LSSVM-GARCH预测模型,通过子序列中第1至n个数据来预测第n+1个数据:叠加各个子序列预测得的第n+1个数据 j=1…M+1,获得最终预测结果:
步骤5:更新训练集为{x(2),…,x(n+1)},将更新后的训集分解为若干新的子序列({cj(2),…, cj(n+1)},j=1…M+1);建立LSSVM模型预测第n+2数据,叠加各个子序列的预测得第n+2 个数据获得预测值
步骤6:遵循步骤5过程继续进行超前一步预测,直到完成所有预测;
步骤7:评估预测误差。
进一步的,根据DWT模型将训练集分解为若干子序列的具体方法包括:利用DWT在指 定的小波基函数的基础上将信号{x(t)}分解成若干频率带分量:
其中,M是分量层数,cj(t)(i=1,2,…,M)表示第j层细节分量,cM+1(t)表示逼近分量, 且随着层数的增加,频率逐渐降低。
更进一步的,根据EMD模型将训练集分解为若干子序列的具体方法包括:通过一个迭代 筛选过程可将信号x(t)分解成若干个本征模态方程和一个残量:
其中,M是分量层数,cj(t)(j=1,2,…,M)表示第j层的本征模态函数,cM+1(t)表示残量。
更进一步的,所述步骤3中子序列和原始序列的相关系数表达如下:
其中,x(t),t=1,2…n为训练数据点;cj(t)是第j个子序列。
更进一步的,所述超过所选阈值表示相关系数小于最大相关系数的绝对值的1/10
更进一步的,所述步骤4中建立预测模型前,采用拉格朗日乘数LM检验误差项的异方
差性,即
其中,r2是拟合优度,H0是零假设,H1是备择假设;χ2(q)为服从q阶卡方分布;η12…ηq
为非负系数;式中残差遵循p阶和q阶的GARCH模型,记作GARCH(p,q),p为ARCH
项的阶数,q为GARCH项的阶数;
若LM的统计值大于χ2(q),则舍去零假设采用备择假设;表示误差成分存在异方差性, 应建立LSSVM-GARCH预测模型,否则建立LSSVM预测模型。
更进一步的,所述LSSVM-GARCH预测模型的建立方法包括:
在LSSVM模型中,i时刻真值表达式为:
其中yi和ξi分别为真值,预测值和i时刻残差;
如果ξi随时间而变化,则不能忽略其对预测结果的影响,GARCH模型的结构为:
其中,υi是一个均值为0方差为1的白噪声序列,ηl为非负系数;hi为i时刻条件方
差,为系数,hi-k为i-k时刻条件方差;ξi-l为i-l时刻残差。
本发明的有益效果是:本发明根据子序列和原始序列的相关性,识别并剔除虚假序列, 降低了子序列虚假成分的影响,提高了预测的性能;通过建立GARCH模型模拟子序列的波 动性,大大提高预测的准确性和稳定性。
附图说明
图1为本方法的流程图。
图2为基于分解预测方法的流程图。
图3a为基于一次性分解预处理预测方法的流程图。
图3b为基于实时分解预处理预测方法的流程图。
图4为风速数据样本1。
图5为超前一步预测中不同分解层数误差项的MAE和RMSE。
图6为原始风速数据全部值和前225个值分解的子序列。
图7为基于两个连续训练集第1-225个风速数据和第2-226个风速数据的实时分解结果。
图8为从连续训练集获得的残量c10的变化情况。
图9为第224个数据点在一次性分解和实时分解的不同值。
图10为一次性分解和实时分解的子序列。
图11为数据样本1采用本方法和LSSVM的预测结果。
图12为风速样本2。
图13为数据样本2采用本方法和LSSVM的预测结果。
具体实施方式
下面结合附图和具体实施例对本发明做进一步向详细说明。本方法流程见图1具体流程为:
步骤1:将原始数据分为两部分,包括训练集({x(1),…,x(n)})和测试集({x(n+1),…, x(n+N)})。
步骤2:假定预测部分未知,建立离散小波变换DWT模型将训练集分解为若干子序列 (cj(1),...,cj(n)},j=1…M+1)。
步骤3:相关性分析,根据子序列和原始数据的相关系数识别虚假子序列。如果一些相 关系数小于所选阈值,也就是最大相关系数的绝对值的1/10,剔除相应的子系列,否则应保 留相应的子系列。
步骤4:对剩余子序列用拉格朗日乘数(LM)测试LSSVM残差的异方差性。基于测试结果对剩余子序列建立LSSVM或LSSVM-GARCH模型,根据第1至n个数据来预测第n+1 个数据,
步骤5:叠加各个子序列的预测值获得最终预测结果,
步骤6:用实际数据更新训练集。如更新训练集为{x(2),…,x(n+1)},重复步骤2-5,可 以获得相应的预测结果,继续进行超前一步预测直到完成预测。
步骤7:进行误差分析,评估预测误差。
本发明所涉及的基本理论如下:
1)基于DWT/EMD的混合方法
离散小波变换DWT和经验模态分解EMD作为时频域分析手段,可将一组时间序列分解 为按高频率到低频率排列的若干子系列,通常应用于处理非平稳非线性数据。其中,DWT在 指定的小波基函数的基础上将信号{x(t)}分解成若干频率带分量,
其中M是分量层数,cj(t)(j=1,2,…,M)表示第j层细节分量,cM+1(t)表示逼近分量,且随着 层数的增加,频率逐渐降低。目前一些DWT的变体,例如EWT和WPD,也被应用于风速 预测中。在本发明中取Daubechies 10为小波基函数。
EMD算法不同于DWT算法,其没有基函数且分解的结果具有数据导向和自适应性。其 通过一个迭代筛选过程可将信号x(t)分解成若干个本征模态方程(IMFs)和一个残量。分解结果 在方程(1)中,其中cj(t)(j=1,2,…,M)表示第j层的IMF,cM+1(t)表示残量。此外,EMD 也发展了一些变异模型,例如EEMD,FEEMD和多元EMD(MEMD)。
利用DWT或EMD将风速序列分解成不同子序列后,采用LSSVM对每个子序列建立预测模型。相较于SVM而言,LSSVM可以在保证足够的准确性同时减少模型的计算时间。这 里将简单回顾LSSVM模型。
假设训练集每个子序列由n-m维的数列组成,(x1,y1),(x2,y2),…,(xn-m,yn-m),xi∈Rm(R表示实数)是输入向量,yi∈Rm是输出向量,即,
其中m是xi维数,其值通过训练集输出值获得,同时满足根均方误差应为最小值。
基于SVM的理论,采用非线性映射函数φ(xi)将xi映射到更高维数的线性特征空间G中。 递归函数为:
y=wTφ(xi)+b,w∈G,b∈R ⑶
其中y是拟合值;w表示权向量,b是偏差,通过优化下列函数计算得到:
Subject to:yi=w·φ(xi)+b+ξi,i=1,2,...,n-m
其中γ是用于平衡模型的复杂性和准确性的正规化参数;ξi是样本点i真值和拟合值的残差。
为了解决方程(4)中优化的问题,建立拉格朗日函数:
其中αi(i=1,2,…,n-m)是拉格朗日乘数。
方程(5)的解通过分别对L(w,b,ξ,α)求关于w,b,ξi和αi的偏导数得到。则得到的函数 为:
其中为预测值;x为最新的输入向量(x∈Rm);
K(x,xi)=φ(x)T×φ(xi)(i=1,2,…,n-m)是核密度函数,满足Mercer条件
传统基于分解的预测方法的具体流程见图2。大体包括三步:建立DWT或EMD模型分解风速数据;对分解后的子序列建立LSSVM模型进行预测;叠加预测所得的子序列获得最终预测结果。同样的,遵循上述步骤可以建立EEMD,FEEMD和WPD模型分解原始风速序 列,然后建立ARIMA,ANN,SVM模型进行风速预测。
2)数据预处理方案
目前有两种数据预处理方案:一次性分解和实时分解。其中一次性分解假定未来数据为 已知,将全部原始序列一次性分解。再将分解后的子序列划分为训练集和测试集,并对其建 立预测模型。而实际上进行风速预测时,未来数据是未知的,因此该假设是不合理的。基于 一次性分解预处理方案的流程图如图3a所示,具体的步骤为:
步骤1:建立DWT或EMD模型将原始风速序列分解为若干子序列。
步骤2:将各个子序列划分训练集和测试集,分别为({cj(1),...,cj(n)})和({cj(n+1),…, cj(n+N)},j=1…M+1)。
步骤3:建立LSSVM模型,通过子序列中第1至n个数据预测第n+1个数据,叠加各个子序列的第n+1个数据获得预测值
步骤4:用新数据cj(n+1),j=1…M+1更新训练集,对更新后训练集建立LSSVM模型, 通过第2至n个数据预测第n+2个数据叠加各个子序列的第n+2个数据获得预测 值
步骤5:遵循步骤4过程继续进行超前一步预测直到完成所有预测。
步骤6:评估预测误差。
实际上未来数据是未知的。必须首先将原始数据划分为训练集和测试集。再将训练集的 数据分解为若干子序列。获得新数据更新训练集后,再次分解更新后的训练集。基于这种实 时分解预处理的方案流程图见图3b,具体步骤为:
步骤1:将原始数据为训练集({x(1),…,x(n)})和测试集({x(n+1),…,x(n+N)})。
步骤2:测试集视为未知,对训练集建立DWT或EMD模型分解为若干子序列({cj(1),…, cj(n)},j=1…M+1)。
步骤3:建立LSSVM模型,通过子序列中第1至n个数据预测第n+1个数据,叠加各个子序列的第n+1个数据获得预测值
步骤4:更新训练集为{x(2),…,x(n+1)},将更新后的训集分解为若干新的子序列({cj(2),…,cj(n+1)},j=1…M+1)。建立LSSVM模型预测第n+2数据,叠加各 个子序列的第n+2个数据获得预测值
步骤5:遵循步骤4过程继续进行超前一步预测直到完成所有预测。
步骤6:评估预测误差。
3)子序列和原始序列相关性分析
DWT被广泛应用于分析非平稳非线性数据,然而其产生的虚假成分[31]可能影响预测准 确性。为了降低虚假成分的影响,引入了子序列和原始数据的相关系数。子序列和原始数据 的相关系数表达式如下:
其中x(t),t=1,2…n为训练数据点;cj(t)是第j个子序列。
同样采用风速样本1用来阐释本方法。图5中为最初训练集(第1-225个数据)的部分 分解结果。表2汇总了最初训练集和各个子序列的相关性系数。最大绝对值是0.600(最初训 练集和c4之间相关性系数),阈值取0.600。因此c4为虚假成分将其剔除。基于残差的异方差 性测试,对剩余的子序列建立LSSVM或LSSVM-GARCH模型。
4)GARCH模型
GARCH模型用于模拟和评估波动。在LSSVM模型中,i时刻真值表达式为:
其中yi和ξi分别为真值,预测值和i时刻残差。
如果ξi随时间而变化,则不能忽略其对预测结果的影响,GARCH模型的结构为:
其中υt是一个均值为0方差为1的白噪声序列,ηl为非负系数。在公式(11)中残差遵循p阶和q阶的GARCH模型,记作GARCH(p,q),其中p为ARCH项的阶数,q为GARCH 项的阶数。也就是说当前的条件方差取决于前一个的条件方差。如果上一个为q阶误差,ξt将遵循一个q阶自回归条件异方差的过程,记为ARCH(q)。特别的,当p和q都等于1时, GARCH(1,1)是一个标准的GARCH模型,本发明中均采用GARCH(1,1)模型。
建立GARCH模型之前,应检验误差项是否具有ARCH效应(即异方差性)。通常采用拉格朗日乘数(LM)检验误差项的异方差性[32],即:
其中r2是拟合优度,H0是零假设,H1是备择假设。如果LM的统计值大于χ2(q),则舍去零假设采用备择假设,这意味着误差成分存在异方差性而应建立GARCH模型。
为了说明本方法的有效性和稳定性,建立了四种预测模型,包括LSSVM,DWT-LSSVM, DWT-LSSVM-GARCH和本发明中的模型。首先采用数据样本1演示本方法的预测性能。然 后采用另一组风速数据样本更进一步说明本方法预测性能。
实施例1:
采用一组从美国明尼苏达州(包括300个样本点)测得的风速数据(数据样本1)来检 验混合模型的有效性和可靠性。图4为风速数据样本1,其存在轻微的非平稳性。在基于一 次性分解的的预测方法中,分解产生的子序列被分为两个部分:前225个样本为训练集,剩 余75个样本为测试集。在实时分解预测中,将原始风速序列分为两部分:采样点第1至第225个数据为训练集,第226到300个数据为测试集。训练集用于建立预测模型,测试集用 来检验模型性能。实时分解会产生端点效应,但其影响难以完全抑制。
为了量化所涉及预测模型的准确性和稳定性,这里采用四种准则。分别为平均绝对误差 (MAE),平均相对百分比误差(MRPE),均方根误差(RMSE),均方根相对误差(RMSRE),即:
其中{x(t)}和分别表示t时刻的测量数据和预测数据;N’表示所评估数据的个数(对 于超前一步预测,N’等于测试集数据个数N)。
i)分解层数的选择
研究表明分解层数对预测准确性有很大的影响。分解层数太多,会扭曲原始数据中的信 息,使得子序列中出现虚假成分。分解层数太少,就不能有效降低原始数据中的非平稳和非 线性,可能会提高预测难度,导致预测精确度降低。
鉴于DWT模型能够指定分解层数,因此采用该模型。为了选定合适的分解层数,进行 了基于DWT-LSSVM实时分解的超前一步预测的25个实验,实验中将第1至225划分训练集和测试集,其中前200个数据为训练集剩余25个为测试集。图5标出分解层数(3-10)不 同时的MAE和RMSE的结果。在本研究中,选取数据样本1分解层数为9层。
ii)两种现存分解方案的分解结果
这部分通过数据样本1的研究演示了一次性分解和实时分解的区别,并分析了一次性分 解的不足之处以及实时分解存在的困难。
①基于DWT分解结果
图6中给出了两种方法的分解结果(c6-c10)。黑线代表分解300个风速样本点得到的子 序列,蓝线表示分解前225训练数据得到的子序列。如图6所示,蓝线明显偏离黑线。这说 明当获得新数据后,新分解产生子序列明显不同于原来子序列。
在实时分解预测中,每次获取新数据后需更新训练集再重新分解,即总是将最新的225 个数据作为训练集分解成若干子序列。在图7中表示两组不同数据点分解后产生的c1-c4和 c10。蓝线表示分解第1至225个原始数据点产生的子序列,红线表示分解第2至226原始数 据点产生的子序列。这说明训练集中即使只变动一个样本点也会导致子序列会发生明显变化。 图8中更新训练集中连续的四个样本点产生的的同一逼近分量c10,其明显的变化情况也证实 了以上结论。
在图9中,红线表示子序列c1-c3,c8和c10的第224个数据点在75次实时分解中的情况。 从图中可以看出更新训练集后同一个数据点在分解产生子序列中的值产生了明显变化。从图 9中红线可以看出每个子序列靠近左端点数据趋势(用蓝线标注)明显不同于其余子序列的 趋势,这可能是由端点效应引起的。图8中的黑线为第224个数据点在一次性分解中的分解 结果(即总原始数据分解只有一次)。可以看出该点在在分解的子序列中为定值且端点效应不 明显,这就使得一次性分解结果比实时分解更平滑。
图10进一步说明了一次性分解和实时分解的不同之处。黑线表示原始数据在一次性分解 中的结果。红线表示第226至300数据点在实时分解中结果。通过分解第2至225个训练数 据加上一个新数据(即第2到226个)得到红线第一个数据(第226个)。同理,通过分解第 3至225个训练数据加上两个新数据(即第3到227)得到每个子序列的第二个数据。遵循这 个过程,可以获得红线全部数据。通过比较黑线和红线可得,红线极大地不同于黑线,特别 是低频成分红线比黑线波动更明显。
基于上述结果,尽管一次性分解结果比实时分解更光滑,但一次性分解假设未来数据为 已知是不合理的。实际上实时分解中未来数据也是未知的。
实时分解中面临的困难:(i)随着获取的新数据,应更新训练集,分解产生新的子序列 可能会极大地不同于之前的子序列;(ii)相较于一次性分解,实时分解中每个子序列端点效 应和数据的波动性影响增强了。
4)关于预测结果的讨论
为了演示基于分解预测方法的性能,建立了五种预测模型:基于DWT-LSSVM和EMD-LSSVM的一次性分解模型,基于DWT-LSSVM和EMD-LSSVM实时分解模型,单独 的LSSVM模型。基于这五种模型进行了超前一步预测,评估结果见表1。从表1中观察可得:
(1)任何基于一次性分解的混合模型比单一或者基于实时分解的模型有更好的性能。然 而一次性分解的方法是不合理的,因为他们假设未来数据是已知的。因此只着眼于基于实时 分解的预测方法。
(2)相比于单一LSSVM模型,基于EMD的方法预测性能反而更差,基于DWT的方 法总体预测性能轻微下降。因此考虑到预测的准确性和计算时间,上述混合方法是无效的。 原因一可能是尽管原始数据的非平稳性明显降低了,但实时分解可能会提高每个子序列的波动性。另一个原因可能是分解产生了虚假成分。
(3)基于DWT的混合模型性能大大优于基于EMD的混合模型。基于DWT的方法比 基于EMD的方法预测准确性提升约30%。原因一可能是EMD中存在的模态混叠,二是基于 EMD的方法可能会受到不断变化分解层数的影响。因此本研究采用基于DWT的方法。
表1五种模型评估结果
需要注意的是,尽管每个子系列的预测误差相对较小,最终预测结果可能有很大误差。 相反,特定的子系列存在较大的预测误差,总误差可能会不大。因此应关注最终的预测结果 而不是每一个子序列的预测结果。
为了提高DWT-LSSVM的预测性能,本发明提出的风速预测的方法,结合了子序列和原 始数据相关性分析,降低子序列中的虚假成分,运用GARCH模型模拟子序列的波动。
表2第1-225个原始数据与其子序列的相关性系数
采用数据样本1来检验本方法的预测性能。表3给出了4种模型的预测性能。相较其他 3种模型,本方法预测性能的提升百分比在表4中。图11为第226-300个数据基于本方法和 单独LSSVM模型的预测结果。从表4-5和图11中可以看出:
(1)相较于单独LSSVM模型,DWT-LSSVM模型预测性能更差。
(2)比较DWT-LSSVM-GARCH和DWT-LSSVM可得,GARCH模型在提升预测准确 性上是有效的。原因是GARCH模型有助于模拟和预测数据波动。
(3)然而单一的采用GARCH模型不能很好的提高预测性能。如相较单一的LSSVM模型,DWT-LSSVM-GARCH模型性能只有轻微的提高。
(4)本发明中的方法比其他三种方法具有更高的预测性能。如说相较于 DWT-LSSVM-GARCH,其MAE,RMSE,MRPE和RMSE分别提高了11.724%,18.231%, 8.562%和8.223%。原因可能是本方法降低了子序列中虚假成分的干扰。LSSVM和本方法也 进行了相同的比较。可以看出无论是GARCH模型还是剔除虚假成分都能有效提高预测准确 性。
表3四种预测模型的性能
表4本发明方法提高程度
实施例2:
另一案例(数据样本2)用于进一步探究本方法的预测性能。来自美国路易斯安那州的风速 数据样本2如图12所示。显然数据样本2的非平稳性高于数据样本1。为了提高预测准确性, 选取样本2分解层数为8层。评估结果在表5-6中,预测结果在图13中。这组数据具有很强 的非平稳性,因此结论与不同于上一组稍有区别。
从表6和图13中可以看出:
(1)与数据样本1的结论相反,数据样本2在基于DWT的方法上预测性能显著提高。原因可能是虽然实时分解会使得预测的准确性轻微降低,但是同时能够有效降低原始数据中 的非平稳性,从而使得预测的准确性显著提高。
(2)与数据样本1相同,GARCH模型是有效的。
(3)本方法优于LSSVM,DWT-LSSVM和DWT-LSSVM-GARCH。
除此之外,值得一提的是分解层数过少时本方法可能是无效的。显然当分解层数过少或 适中时,虚假成分可能是不存在的。
表5四种预测模型的性能
表6本发明方法提高程度

Claims (7)

1.一种基于考虑分量关联性小波分解的混合风速预测方法,其特征在于,包括以下步骤:
步骤1:将原始数据分为两部分,包括训练集:{x(1),…,x(n)};测试集{x(n+1),…,x(n+N)};
步骤2:测试集视为未知,建立DWT或EMD模型将训练集分解为若干子序列{cj(1),…,cj(n)},j=1…M+1;
步骤3:进行子序列和原始序列的相关性分析,根据子序列和原始数据的相关系数识别虚假子序列:若相关系数超过所选阈值,则剔除相应的子系列,否则应保留相应的子系列;
步骤4:对剩余子序列建立LSSVM或LSSVM-GARCH预测模型,通过子序列中第1至n个数据来预测第n+1个数据:叠加各个子序列预测得的第n+1个数据获得最终预测结果:
步骤5:更新训练集为{x(2),…,x(n+1)},将更新后的训集分解为若干新的子序列({cj(2),…,cj(n+1)},j=1…M+1);建立LSSVM模型预测第n+2数据,叠加各个子序列的预测得第n+2个数据获得预测值
步骤6:遵循步骤5过程继续进行超前一步预测,直到完成所有预测;
步骤7:评估预测误差。
2.根据权利要求1所述的基于考虑分量关联性小波分解的混合风速预测方法,其特征在于,根据DWT模型将训练集分解为若干子序列的具体方法包括:利用DWT在指定的小波基函数的基础上将信号{x(t)}分解成若干频率带分量:
<mrow> <mi>x</mi> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mi>M</mi> <mo>+</mo> <mn>1</mn> </mrow> </munderover> <msub> <mi>c</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> </mrow>
其中,M是分量层数,cj(t)(i=1,2,…,M)表示第j层细节分量,cM+1(t)表示逼近分量,
且随着层数的增加,频率逐渐降低。
3.根据权利要求1所述的基于考虑分量关联性小波分解的混合风速预测方法,其特征在于,根据EMD模型将训练集分解为若干子序列的具体方法包括:通过一个迭代筛选过程可将信号x(t)分解成若干个本征模态方程和一个残量:
<mrow> <mi>x</mi> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mi>M</mi> <mo>+</mo> <mn>1</mn> </mrow> </munderover> <msub> <mi>c</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> </mrow>
其中,M是分量层数,cj(t)(j=1,2,…,M)表示第j层的本征模态函数,cM+1(t)表示残量。
4.根据权利要求1所述的基于考虑分量关联性小波分解的混合风速预测方法,其特征在于,
所述步骤3中子序列和原始序列的相关系数表达如下:
<mrow> <msub> <mi>&amp;rho;</mi> <mi>j</mi> </msub> <mo>=</mo> <mfrac> <mrow> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>t</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <mi>x</mi> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <msub> <mi>c</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> </mrow> <msqrt> <mrow> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>t</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msup> <mi>x</mi> <mn>2</mn> </msup> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>t</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msubsup> <mi>c</mi> <mi>j</mi> <mn>2</mn> </msubsup> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> </mrow> </msqrt> </mfrac> </mrow>
其中,x(t),t=1,2…n为训练数据点;cj(t)是第j个子序列。
5.根据权利要求1所述的基于考虑分量关联性小波分解的混合风速预测方法,其特征在于,所述超过所选阈值表示相关系数小于最大的相关系数的绝对值的1/10。
6.根据权利要求1所述的基于考虑分量关联性小波分解的混合风速预测方法,其特征在于,所述步骤4中建立预测模型前,采用拉格朗日乘数LM检验误差项的异方差性,即
<mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mi>L</mi> <mi>M</mi> <mo>=</mo> <msup> <mi>nr</mi> <mn>2</mn> </msup> <mo>~</mo> <msup> <mi>&amp;chi;</mi> <mn>2</mn> </msup> <mrow> <mo>(</mo> <mi>q</mi> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>H</mi> <mn>0</mn> </msub> <mo>:</mo> <msub> <mi>&amp;eta;</mi> <mn>1</mn> </msub> <mo>=</mo> <msub> <mi>&amp;eta;</mi> <mn>2</mn> </msub> <mo>=</mo> <mo>...</mo> <mo>=</mo> <msub> <mi>&amp;eta;</mi> <mi>q</mi> </msub> <mo>=</mo> <mn>0</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mtable> <mtr> <mtd> <mrow> <msub> <mi>H</mi> <mn>1</mn> </msub> <mo>:</mo> <mi>s</mi> <mi>o</mi> <mi>m</mi> <mi>e</mi> </mrow> </mtd> <mtd> <mrow> <msub> <mi>&amp;eta;</mi> <mi>i</mi> </msub> <mo>&amp;NotEqual;</mo> <mn>0</mn> </mrow> </mtd> <mtd> <mrow> <mo>(</mo> <mi>i</mi> <mo>=</mo> <mn>1</mn> <mo>...</mo> <mi>q</mi> <mo>)</mo> </mrow> </mtd> </mtr> </mtable> </mtd> </mtr> </mtable> </mfenced>
其中,r2是拟合优度,H0是零假设,H1是备择假设;χ2(q)为服从q阶卡方分布;η12…ηq为非负系数;式中残差遵循p阶和q阶的GARCH模型,记作GARCH(p,q),p为ARCH项的阶数,q为GARCH项的阶数;
若LM的统计值大于χ2(q),则舍去零假设采用备择假设;表示误差成分存在异方差性,
应建立LSSVM-GARCH预测模型,否则建立LSSVM预测模型。
7.根据权利要求6所述的基于考虑分量关联性小波分解的混合风速预测方法,其特征在于,所述LSSVM-GARCH预测模型的建立方法包括:
在LSSVM模型中,i时刻真值表达式为:
<mrow> <msub> <mi>y</mi> <mi>i</mi> </msub> <mo>=</mo> <mover> <mi>y</mi> <mo>^</mo> </mover> <mo>+</mo> <msub> <mi>&amp;xi;</mi> <mi>i</mi> </msub> </mrow>
其中yi和ξi分别为真值,预测值和i时刻残差;
如果ξi随时间而变化,则不能忽略其对预测结果的影响,GARCH模型的结构为:
<mrow> <msub> <mi>&amp;xi;</mi> <mi>i</mi> </msub> <mo>=</mo> <msqrt> <msub> <mi>h</mi> <mi>i</mi> </msub> </msqrt> <msub> <mi>&amp;upsi;</mi> <mi>i</mi> </msub> </mrow>
其中,υi是一个均值为0方差为1的白噪声序列,ηl为非负系数;hi为i时刻条件方差,为系数,hi-k为i-k时刻条件方差;ξi-l为i-l时刻残差。
CN201710532532.3A 2017-07-03 2017-07-03 一种基于考虑分量关联性小波分解的混合风速预测方法 Expired - Fee Related CN107292446B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710532532.3A CN107292446B (zh) 2017-07-03 2017-07-03 一种基于考虑分量关联性小波分解的混合风速预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710532532.3A CN107292446B (zh) 2017-07-03 2017-07-03 一种基于考虑分量关联性小波分解的混合风速预测方法

Publications (2)

Publication Number Publication Date
CN107292446A true CN107292446A (zh) 2017-10-24
CN107292446B CN107292446B (zh) 2021-01-29

Family

ID=60099319

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710532532.3A Expired - Fee Related CN107292446B (zh) 2017-07-03 2017-07-03 一种基于考虑分量关联性小波分解的混合风速预测方法

Country Status (1)

Country Link
CN (1) CN107292446B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110633844A (zh) * 2019-08-25 2019-12-31 天津大学 基于emd和ann的建筑能源***模拟预测方法及应用
CN110796303A (zh) * 2019-10-24 2020-02-14 国网安徽省电力有限公司电力科学研究院 一种基于ewt和odbscan的短期电力负荷预测方法
CN111047083A (zh) * 2019-12-05 2020-04-21 青岛海洋地质研究所 一种步进式涡度协方差观测数据处理方法
CN111368392A (zh) * 2019-12-31 2020-07-03 重庆大学 一种基于memd与srm的单样本非平稳风速模拟方法
CN111414354A (zh) * 2020-03-12 2020-07-14 广西电网有限责任公司 一种风电场数据的处理方法、装置及计算机可读存储介质
CN111967653A (zh) * 2020-07-22 2020-11-20 易天气(北京)科技有限公司 一种构建机场跑道风预报模型的方法及预报方法、***
CN112348255A (zh) * 2020-11-06 2021-02-09 湖南大学 基于小波时频图像化的超短期风电功率预测方法
CN114609410A (zh) * 2022-03-25 2022-06-10 西南交通大学 一种基于声学信号的便携式风特性测量设备及智能算法
JP2023075072A (ja) * 2021-11-18 2023-05-30 北京華能新鋭控制技術有限公司 ローリング時系列及びサポートベクトルマシンに基づく短期風速の予測方法及びシステム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103699800A (zh) * 2013-12-31 2014-04-02 哈尔滨工业大学 基于频域多尺度风速信号可预报性的超短期风速预测方法
US20160169202A1 (en) * 2013-05-03 2016-06-16 State Grid Corporation Of China Short-term operation optimization method of electric power system including large-scale wind power
CN106446494A (zh) * 2016-05-11 2017-02-22 新疆大学 基于小波包‑神经网络的风光功率预测方法
CN106447063A (zh) * 2015-08-11 2017-02-22 华北电力大学(保定) 一种并网型风电场短期风速组合预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160169202A1 (en) * 2013-05-03 2016-06-16 State Grid Corporation Of China Short-term operation optimization method of electric power system including large-scale wind power
CN103699800A (zh) * 2013-12-31 2014-04-02 哈尔滨工业大学 基于频域多尺度风速信号可预报性的超短期风速预测方法
CN106447063A (zh) * 2015-08-11 2017-02-22 华北电力大学(保定) 一种并网型风电场短期风速组合预测方法
CN106446494A (zh) * 2016-05-11 2017-02-22 新疆大学 基于小波包‑神经网络的风光功率预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
姜言 等: ""基于GARCH的短时风速预测方法"", 《西南交通大学学报》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110633844B (zh) * 2019-08-25 2023-02-24 天津大学 基于emd和ann的建筑能源***模拟预测方法及应用
CN110633844A (zh) * 2019-08-25 2019-12-31 天津大学 基于emd和ann的建筑能源***模拟预测方法及应用
CN110796303A (zh) * 2019-10-24 2020-02-14 国网安徽省电力有限公司电力科学研究院 一种基于ewt和odbscan的短期电力负荷预测方法
CN110796303B (zh) * 2019-10-24 2023-11-07 国网安徽省电力有限公司电力科学研究院 一种基于ewt和odbscan的短期电力负荷预测方法
CN111047083A (zh) * 2019-12-05 2020-04-21 青岛海洋地质研究所 一种步进式涡度协方差观测数据处理方法
CN111368392A (zh) * 2019-12-31 2020-07-03 重庆大学 一种基于memd与srm的单样本非平稳风速模拟方法
CN111368392B (zh) * 2019-12-31 2024-04-05 重庆大学 一种基于memd与srm的单样本非平稳风速模拟方法
CN111414354A (zh) * 2020-03-12 2020-07-14 广西电网有限责任公司 一种风电场数据的处理方法、装置及计算机可读存储介质
CN111967653A (zh) * 2020-07-22 2020-11-20 易天气(北京)科技有限公司 一种构建机场跑道风预报模型的方法及预报方法、***
CN112348255A (zh) * 2020-11-06 2021-02-09 湖南大学 基于小波时频图像化的超短期风电功率预测方法
CN112348255B (zh) * 2020-11-06 2024-04-09 湖南大学 基于小波时频图像化的超短期风电功率预测方法
JP2023075072A (ja) * 2021-11-18 2023-05-30 北京華能新鋭控制技術有限公司 ローリング時系列及びサポートベクトルマシンに基づく短期風速の予測方法及びシステム
JP7441553B2 (ja) 2021-11-18 2024-03-01 北京華能新鋭控制技術有限公司 ローリング時系列及びサポートベクトルマシンに基づく短期風速の予測方法及びシステム
CN114609410A (zh) * 2022-03-25 2022-06-10 西南交通大学 一种基于声学信号的便携式风特性测量设备及智能算法
CN114609410B (zh) * 2022-03-25 2022-11-18 西南交通大学 一种基于声学信号的便携式风特性测量设备及智能算法

Also Published As

Publication number Publication date
CN107292446B (zh) 2021-01-29

Similar Documents

Publication Publication Date Title
CN107292446A (zh) 一种基于考虑分量关联性小波分解的混合风速预测方法
Tian Short-term wind speed prediction based on LMD and improved FA optimized combined kernel function LSSVM
US11436395B2 (en) Method for prediction of key performance parameter of an aero-engine transition state acceleration process based on space reconstruction
Zhang et al. A comprehensive wind speed prediction system based on Monte Carlo and artificial intelligence algorithms
CN108320016B (zh) 一种建筑能耗短期预测方法
CN111860982A (zh) 一种基于vmd-fcm-gru的风电场短期风电功率预测方法
CN108197648A (zh) 一种基于lstm深度学习模型的水电机组故障诊断方法与***
CN112434848B (zh) 基于深度信念网络的非线性加权组合风电功率预测方法
CN114676822B (zh) 一种基于深度学习的多属性融合空气质量预报方法
CN102609612B (zh) 一种用于多参数仪表检定的数据融合方法
CN112116162A (zh) 基于ceemdan-qfoa-lstm的输电线覆冰厚度预测方法
CN114912077B (zh) 一种融合随机搜索与混合分解误差订正的海浪预报方法
Lv et al. Novel deterministic and probabilistic combined system based on deep learning and self-improved optimization algorithm for wind speed forecasting
US20230237316A1 (en) Forecast method and system of wind power probability density
Dong et al. Ensemble wind speed forecasting system based on optimal model adaptive selection strategy: Case study in China
CN105956722A (zh) 一种短期风电功率的预测方法及装置
CN114580545A (zh) 一种基于融合模型的风电机组齿轮箱故障预警方法
Li et al. An innovative combined model based on multi-objective optimization approach for forecasting short-term wind speed: A case study in China
CN116187835A (zh) 一种基于数据驱动的台区理论线损区间估算方法及***
CN112069666A (zh) 一种基于概率潮流法的电网短期可靠性评估方法
CN115096357A (zh) 一种基于ceemdan-pca-lstm的室内环境质量预测方法
Yun et al. Research on gas pressure regulator fault diagnosis based on deep confidence network (DBN) theory
CN115239029B (zh) 考虑功率时序及气象相依特性的风电功率预测方法及***
CN111697560A (zh) 一种基于lstm预测电力***负荷的方法及***
CN115496264A (zh) 一种风电机组发电功率的预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210129

Termination date: 20210703