CN103838979A - 一种基于支持向量机算法的统计降尺度方法 - Google Patents

一种基于支持向量机算法的统计降尺度方法 Download PDF

Info

Publication number
CN103838979A
CN103838979A CN201410116120.8A CN201410116120A CN103838979A CN 103838979 A CN103838979 A CN 103838979A CN 201410116120 A CN201410116120 A CN 201410116120A CN 103838979 A CN103838979 A CN 103838979A
Authority
CN
China
Prior art keywords
rainfall
data
statistics
vector machine
support vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410116120.8A
Other languages
English (en)
Inventor
陈华
侯雨坤
黄逍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201410116120.8A priority Critical patent/CN103838979A/zh
Publication of CN103838979A publication Critical patent/CN103838979A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于支持向量机算法的统计降尺度方法,包括如下步骤:⑴对大尺度气象预报因子筛选,得出代表性的因子;⑵判断已有逐日降雨数据干湿天状态,处理数据。运用支持向量机,先构建降雨状态与对应气象因子分类关系,再对湿天降雨与气象因子构建统计关系;⑶使用已有分类关系,通过气象预报因子,对未来日降雨状态分类;⑷使用已有统计关系,通过气象预报因子,拟合出未来有雨日降雨数据;⑸对数据还原处理,得到预报的降雨序列。其优点是:本发明方法效果优于传统统计降尺度方法,尤其在进行温度降尺度时,优势明显;本发明方法效果优于传统统计降尺度方法;运算量较小,使用方便,擅于处理大量多批次数据;可进行有无雨日的区分,具有更高精度;对降雨加入随机值,对暴雨的拟合精度更好。

Description

一种基于支持向量机算法的统计降尺度方法
技术领域
本发明涉及统计降尺度方法,具体的说是一种基于支持向量机算法的统计降尺度方法。
背景技术
降尺度方法就是将大尺度的预报因子经过一系列处理,降解到小尺度区域上,使之能够与水文模型输入的尺度匹配。降尺度方法主要分为动力降尺度与统计降尺度两种。相较于动力降尺度,统计降尺度方法的计算量较小,并且模型算法的构建相对简单,有众多形式较为灵活的模型可供选择。
现有统计降尺度方法存在以下不足:(1)回归精度不够,拟合能力不强,运算量不精简;(2)在少量样本下,传统的统计方法难以取得理想的回归效果。
发明内容
本发明的目的是针对现有技术的不足,研究一种以支持向量机(SupportVector Machine,SVM)作为回归核心、主成分分析法作为筛选大尺度预报因子的基于支持向量机算法的统计降尺度方法。
一种基于支持向量机算法的统计降尺度方法,包括如下步骤:
⑴对大尺度气象预报因子进行筛选降维,处理得出预报因子中代表性较强的因子;
⑵使用给定降雨阈值判断降雨状态,大于阈值为湿天,即为有雨状态,小于阈值为干天,即为无雨状态;处理实测降雨数据,使用支持向量机构建实测的降雨状态与当天气象因子的分类关系,对湿天降雨数据与使用主成分分析法筛选后的大尺度气象预报因子应用支持向量机建立统计关系;
⑶使用已有分类关系,对未来气候变化情景下的每日降雨状态应用支持向量机通过大尺度预报因子进行分类,判断干湿天;
⑷使用已有统计关系,对有雨日降雨通过预测大尺度预报因子进行拟合,得出未来气候变化情景下的模拟降雨资料;
⑸对降雨数据进行还原处理,得到预报的降雨序列。
所述步骤⑵中的处理数据是指利用自然对数函数进行处理,以减小阶数关系产生的误差影响。
所述步骤⑸中的处理是指利用自然指数函数进行处理,将序列数还原。
一种基于支持向量机算法的统计降尺度方法,包括如下步骤:
⑴对大尺度气象预报因子进行筛选降维,处理得出预报因子中代表性较强的因子;
⑵处理实测温度数据,对温度数据与使用主成分分析法筛选后的大尺度气象预报因子应用支持向量机建立统计关系;
⑶使用已有统计关系,通过预测大尺度预报因子进行拟合,得出未来气候变化情景下的模拟温度资料;
⑷对温度数据进行还原处理,得到预报的温度序列。
所述步骤⑵中的处理数据是指利用自然对数函数进行处理,以减小阶数关系产生的误差影响。
所述步骤⑷中的处理是指利用自然指数函数进行处理,将序列数还原。
由于降雨的特殊性,降雨降尺度较温度降尺度多一步判别有无雨日的步骤。所以其余气象要素的降尺度方式,一般皆采用温度降尺度的方法进行降尺度。
本发明基于支持向量机算法的统计降尺度方法的优点是:
1、本发明方法效果优于传统统计降尺度方法,尤其在进行温度降尺度时,优势明显;
2、本发明方法运算量较为简单,使用方便,擅于处理大量多批次数据,实用性较强。
3、本发明方法可以进行有雨天与无雨天的区分,具有更高的运算效率与拟合精度。
4、本发明方法可以对降雨进行随机强化,使对暴雨的拟合精度更好。
附图说明
图1为本发明方法中降雨降尺度的流程框图。
图2为本发明方法中温度降尺度的流程框图。
具体实施方式
本发明基于支持向量机(SVM)回归模型对大尺度气象因子与降水、温度等水文气候进行耦合,建立统计降尺度模型,在现有统计降尺度模型下,对统计降尺度模型进行算法优化,寻求更高的耦合效果与高效的运算过程。
下面通过实例,并结合附图,对本发明的技术方案做进一步具体说明。
步骤1,预报因子的选择:
主成分分析法(Principal Component Analysis,简称PCA)是一种掌握事物主要矛盾的统计分析方法,它可以从多元事物中解析出主要影响因素,揭示事物的本质,简化复杂的问题。计算主成分的目的是将高维数据投影到较低维空间。PCA已经被广泛应用在统计降尺度预测因子的降维和压缩上,能够将原来较多的预测因子简化为少数几个新的综合指标因子。给定n个预测因子的m个观察值,形成一个m×n数据矩阵。对于由多个预测因子描述的大气环流模式,很难分清每个因子的主次性。在一般情况下,并不能直接找出这样的关键引子,这时可以用原有变量的线性组合来表示大气环流模式的主要方面,PCA就是这样一种分析方法。
应用主成分分析法(Principal Component Analysis,简称PCA)对美国国家环境预报中心(National Centers for Environmental Prediction,简称NCEP)预报因子X进行主分量分析步骤:
(1)计算矩阵X的协方差矩阵S:
S = 1 m - 1 Σ j = 1 m ( x j - x ‾ ) ( x j - x ‾ ) T , x ‾ = 1 m Σ j = 1 m x j - - - ( 1 )
式中,S为协方差矩阵,m为矩阵列数,xj为矩阵对应行第j列的数值,
Figure BDA0000482287840000042
为矩阵对应行均值,T为转置符号;
(2)计算协方差矩阵的特征向量矩阵E和特征值λi,i=1,2,…N。特征值按大到小排序:λ1>λ2>…>λN
(3)称
Figure BDA0000482287840000043
为第一主成分的贡献率。称为前m个主成分的累计贡献率。若前m个主成分的累计贡献率超过85%,认为前m个主成分基本包含了原来指标信息。
步骤2,区分湿天与干天,对湿天降雨数据进行自然对数处理,在后续降水处理中只针对湿天降雨数据建立统计关系;率定期为降雨状态模型率定;
对于率定期的降雨数据,规定一个降雨状态的判断阈值threshold,认为雨量大于该阈值的状态为湿天,小于该阈值的状态为干天,如下所示。
w t = 1 R t > threshold 0 R t ≤ threshold - - - ( 2 )
式中,t代表天数;Rt为第t天的实测降雨量;Wt为第t天的降雨状态,Wt为0代表无雨,Wt为1代表有雨。
采用最小二乘支持向量机(Least Square Support Vector Machine,简称LS-SVM)回归,构建降雨状态与大尺度气象因子间的统计关系:
w t = F 1 t ( u ^ t 1 , u ^ t 2 , . . . , u ^ t j ) + ϵ - - - ( 3 )
式中,ε为服从标准正态分布的随机误差项,用以衡量由于降雨状态阈值设置而带来的降雨状态划分误差;
Figure BDA0000482287840000053
为挑选出来的j个大尺度气象因子;F1t为LS-SVM回归得到的预报因子与降雨状态之间的多元非线性回归关系。最终率定期通过实测降雨资料与对应时段的大尺度气象因子,获得降雨状态的LS-SVM回归关系。
模拟期:降雨状态模拟
利用模拟期大尺度因子与率定期获得的回归关系,结合随机天气发生器原理,进行模拟期降雨状态的模拟,如下:
W t sim = 1 rand ≤ F 1 ( u ^ t 1 , u ^ t 2 , . . . , u ^ t j ) 0 rand > F 1 ( u ^ t 1 , u ^ t 2 , . . . , u ^ t j ) - - - ( 4 )
式中,
Figure BDA0000482287840000055
为模拟期t天回归模拟得到的降雨状态;rand为服从[0,1]均匀分布的随机项;为挑选出来的j个大尺度气象因子。
步骤3,处理实测降雨数据,对湿天降雨数据与使用主成分分析法筛选后的大尺度气象预报因子应用支持向量机建立统计关系;
首先,依据经验习惯,对实测降雨数据进行转换,如下:
R t * = ln ( R t ) , R t > threshold - - - ( 5 )
式中,Rt为t天的实测降雨量;
Figure BDA0000482287840000061
为实测雨量的转化形式。
然后采用最小二乘支持向量机(Least Square Support Vector Machine,简称LS-SVM)进行回归,构建降雨雨量与大尺度气象因子间的统计关系:
R t * = F 2 t ( u ^ t 1 , u ^ t 2 , . . . , u ^ t j ) + ϵ - - - ( 6 )
式中,ε为服从标准正态分布的随机误差项,用以衡量在数据转换过程中降雨状态阈值设置而带来的误差;F2t为LS-SVM回归得到的预报因子与降雨雨量之间的多元非线性回归关系。
步骤4,使用已有统计关系对未来气候变化情景下的预测大尺度预报因子进行拟合,对降雨进行随机强化,得出未来气候变化情景下的模拟降雨资料;
利用模拟期大尺度因子与率定期获得的回归关系,进行模拟期降雨雨量的模拟,最终得到完整的降雨时间序列,如下:
R t * = F 2 ( u ^ t 1 , u ^ t 2 , . . . , u ^ t j ) + e , w t = 1 - - - ( 7 )
式中,
Figure BDA0000482287840000064
为模拟期t天回归模拟得到的降雨雨量转换量;
Figure BDA0000482287840000065
为挑选出来的j个大尺度气象因子;e为一个假设服从高斯分布的误差随机项,参照降尺度模型ASD(Automated Statistical Downscaling)算法,其计算如下:
e = V obs - V calibration · ϵ + b - - - ( 8 )
式中,Vobs为率定期实测
Figure BDA0000482287840000067
的方差;Vcalibration为率定期通过回归得到的
Figure BDA0000482287840000068
确定性部分方差;ε为服从标准正态分布的随机数;b值在使用NCEP数据进行检验时,一般取值为0,当采用大气环流模式(General Circulation Model,简称GCM)数据生成未来情景时,b值计算如下:
b=Mobs-Mcalibration   (9)
式中,Mobs率定期实测
Figure BDA0000482287840000071
的均值;Mcalibration为率定期通过回归得到的
Figure BDA0000482287840000072
确定性部分均值。
步骤5,对降雨数据进行还原处理,得到预报的降雨序列。
Figure BDA0000482287840000074
值还原,得到完整的时间序列,如下:
R t = 0 w t = 0 exp ( R t * ) w t = 1 - - - ( 10 )
对于温度等连续变量,不用对其进行状态的模拟,可直接跳入步骤3进行数量的模拟。

Claims (6)

1.一种基于支持向量机算法的统计降尺度方法,其特征在于包括如下步骤:
⑴对大尺度气象预报因子进行筛选降维,处理得出预报因子中代表性较强的因子;
⑵使用给定降雨阈值判断降雨状态,大于阈值为湿天,即为有雨状态,小于阈值为干天,即为无雨状态;处理实测降雨数据,使用支持向量机构建实测的降雨状态与当天气象因子的分类关系,对湿天降雨数据与使用主成分分析法筛选后的大尺度气象预报因子应用支持向量机建立统计关系;
⑶使用已有分类关系,对未来气候变化情景下的每日降雨状态应用支持向量机通过大尺度预报因子进行分类,判断干湿天;
⑷使用已有统计关系,对有雨日降雨通过预测大尺度预报因子进行拟合,得出未来气候变化情景下的模拟降雨资料;
Figure 2014101161208100001DEST_PATH_IMAGE002
对降雨数据进行还原处理,得到预报的降雨序列。
2.如权利要求1所述的基于支持向量机算法的统计降尺度方法,其特征在于:所述步骤⑵中的处理数据是指利用自然对数函数进行处理。
3.如权利要求1所述的基于支持向量机算法的统计降尺度方法,其特征在于:所述步骤⑸中的处理是指利用自然指数函数进行处理,将序列数还原。
4.一种基于支持向量机算法的统计降尺度方法,其特征在于包括如下步骤:
⑴对大尺度气象预报因子进行筛选降维,处理得出预报因子中代表性较强的因子;
⑵处理实测温度数据,对温度数据与使用主成分分析法筛选后的大尺度气象预报因子应用支持向量机建立统计关系;
⑶使用已有统计关系,通过预测大尺度预报因子进行拟合,得出未来气候变化情景下的模拟温度资料;
⑷对温度数据进行还原处理,得到预报的温度序列。
5.如权利要求4所述的基于支持向量机算法的统计降尺度方法,其特征在于:所述步骤⑵中的处理数据是指利用自然对数函数进行处理。
6.如权利要求4所述的基于支持向量机算法的统计降尺度方法,其特征在于:所述步骤⑷中的处理是指利用自然指数函数进行处理,将序列数还原。
CN201410116120.8A 2014-03-26 2014-03-26 一种基于支持向量机算法的统计降尺度方法 Pending CN103838979A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410116120.8A CN103838979A (zh) 2014-03-26 2014-03-26 一种基于支持向量机算法的统计降尺度方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410116120.8A CN103838979A (zh) 2014-03-26 2014-03-26 一种基于支持向量机算法的统计降尺度方法

Publications (1)

Publication Number Publication Date
CN103838979A true CN103838979A (zh) 2014-06-04

Family

ID=50802467

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410116120.8A Pending CN103838979A (zh) 2014-03-26 2014-03-26 一种基于支持向量机算法的统计降尺度方法

Country Status (1)

Country Link
CN (1) CN103838979A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104392097A (zh) * 2014-10-24 2015-03-04 封国林 一种基于季节预报模式的季节降水相似预报方法
CN105740991A (zh) * 2016-02-26 2016-07-06 河海大学 基于改进bp神经网络拟合多种气候模式的气候变化预测方法及***
CN107563554A (zh) * 2017-08-30 2018-01-09 三峡大学 一种统计降尺度模型预报因子的筛选方法
CN110738252B (zh) * 2019-10-14 2020-08-14 广州地理研究所 空间自相关的机器学习卫星降水数据降尺度方法、***
CN112232574A (zh) * 2020-10-21 2021-01-15 成都理工大学 一种基于支持向量机的泥石流灾害降雨阈值自动划分方法
CN112749510A (zh) * 2021-01-15 2021-05-04 河海大学 一种结合支持向量机和交互式因子选取的降水降尺度方法
CN113219555A (zh) * 2020-09-30 2021-08-06 国家气候中心 一种基于统计降尺度技术的短期气候预测方法
CN113221464A (zh) * 2021-05-21 2021-08-06 广东省科学院广州地理研究所 一种地面站点与遥感观测降水数据融合方法和装置
CN113313290A (zh) * 2021-05-06 2021-08-27 国网河南省电力公司电力科学研究院 一种基于动力降尺度的电网区域气象预报方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103400039A (zh) * 2013-07-31 2013-11-20 武汉大学 一种基于大风气象分类的风功率爬坡预测模型切换方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103400039A (zh) * 2013-07-31 2013-11-20 武汉大学 一种基于大风气象分类的风功率爬坡预测模型切换方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘向培,王汉杰,何明元: "应用统计降尺度方法预估江淮流域未来降水", 《水科学进展》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104392097A (zh) * 2014-10-24 2015-03-04 封国林 一种基于季节预报模式的季节降水相似预报方法
CN105740991A (zh) * 2016-02-26 2016-07-06 河海大学 基于改进bp神经网络拟合多种气候模式的气候变化预测方法及***
CN107563554A (zh) * 2017-08-30 2018-01-09 三峡大学 一种统计降尺度模型预报因子的筛选方法
CN107563554B (zh) * 2017-08-30 2022-01-18 三峡大学 一种统计降尺度模型预报因子的筛选方法
CN110738252B (zh) * 2019-10-14 2020-08-14 广州地理研究所 空间自相关的机器学习卫星降水数据降尺度方法、***
CN113219555A (zh) * 2020-09-30 2021-08-06 国家气候中心 一种基于统计降尺度技术的短期气候预测方法
CN113219555B (zh) * 2020-09-30 2021-10-26 国家气候中心 一种基于统计降尺度技术的短期气候预测方法
CN112232574A (zh) * 2020-10-21 2021-01-15 成都理工大学 一种基于支持向量机的泥石流灾害降雨阈值自动划分方法
CN112749510A (zh) * 2021-01-15 2021-05-04 河海大学 一种结合支持向量机和交互式因子选取的降水降尺度方法
CN113313290A (zh) * 2021-05-06 2021-08-27 国网河南省电力公司电力科学研究院 一种基于动力降尺度的电网区域气象预报方法
CN113221464A (zh) * 2021-05-21 2021-08-06 广东省科学院广州地理研究所 一种地面站点与遥感观测降水数据融合方法和装置
CN113221464B (zh) * 2021-05-21 2023-04-07 广东省科学院广州地理研究所 一种地面站点与遥感观测降水数据融合方法和装置

Similar Documents

Publication Publication Date Title
CN103838979A (zh) 一种基于支持向量机算法的统计降尺度方法
CN103679263B (zh) 基于粒子群支持向量机的雷电临近预测方法
Bouzgou et al. Minimum redundancy–maximum relevance with extreme learning machines for global solar radiation forecasting: Toward an optimized dimensionality reduction for solar time series
CN107728234B (zh) 一种基于大气电场数据的雷电强度值预测方法
Huang et al. An analytical comparison of four approaches to modelling the daily variability of solar irradiance using meteorological records
KR102340258B1 (ko) 시계열의 데이터를 예측 하는 방법 및 그 장치
CN103488869A (zh) 一种最小二乘支持向量机的风力发电短期负荷预测方法
CN103295081A (zh) 基于bp神经网络的电力***负荷预测方法
CN104318332A (zh) 一种电力负荷预测方法和装置
CN105760970A (zh) 空气质量指数的预测方法
CN105809321A (zh) 地面气象观测站采集气温数据的质量控制方法
CN103514369A (zh) 一种基于主动学习的回归分析***及方法
Yang Reconciling solar forecasts: Probabilistic forecast reconciliation in a nonparametric framework
CN107730097B (zh) 一种母线负荷预测方法、装置及计算设备
CN108062720A (zh) 一种基于相似日选取及随机森林算法的负荷预测方法
CN104809532A (zh) 一种光伏***发电量的预测方法
CN106600037A (zh) 一种基于主成分分析的多参量辅助负荷预测方法
KR20140021179A (ko) 일사량 예측 방법 및 장치
CN113592132B (zh) 一种基于数值天气预报和人工智能的降水客观预报方法
CN105447593A (zh) 基于时间滞后集合的快速更新混合同化方法
CN106600029A (zh) 一种基于电力数据的宏观经济预测量化修正方法
CN115545333A (zh) 一种多负荷日类型配电网负荷曲线预测方法
CN104866930A (zh) 一种基于定量筛选时间序列预测模型的时间序列预测方法
CN115310648A (zh) 一种基于多气象变量模型识别的中长期风电功率组合预测方法
CN117909888A (zh) 智慧人工智能气候预测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140604