CN107622322B - 中长期径流的预报因子识别方法、中长期径流的预测方法 - Google Patents

中长期径流的预报因子识别方法、中长期径流的预测方法 Download PDF

Info

Publication number
CN107622322B
CN107622322B CN201710701183.3A CN201710701183A CN107622322B CN 107622322 B CN107622322 B CN 107622322B CN 201710701183 A CN201710701183 A CN 201710701183A CN 107622322 B CN107622322 B CN 107622322B
Authority
CN
China
Prior art keywords
factor
runoff
forecast
forecasting
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710701183.3A
Other languages
English (en)
Other versions
CN107622322A (zh
Inventor
苗淼
魏加华
黄跃飞
李铁键
谢帅
田旭
白左霞
马雪
刘飞
彭飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
State Grid Qinghai Electric Power Co Ltd
Economic and Technological Research Institute of State Grid Qianghai Electric Power Co Ltd
Original Assignee
Tsinghua University
State Grid Qinghai Electric Power Co Ltd
Economic and Technological Research Institute of State Grid Qianghai Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University, State Grid Qinghai Electric Power Co Ltd, Economic and Technological Research Institute of State Grid Qianghai Electric Power Co Ltd filed Critical Tsinghua University
Priority to CN201710701183.3A priority Critical patent/CN107622322B/zh
Publication of CN107622322A publication Critical patent/CN107622322A/zh
Application granted granted Critical
Publication of CN107622322B publication Critical patent/CN107622322B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出了中长期径流的预报因子识别方法、中长期径流的预测方法。该中长期径流的预报因子的识别方法包括:(1)标准化处理;(2)设定预见期,将一系列不同滞后期的标准化后的径流序列Q和气候因子集序列F组成的备选预报因子集合X,并将对应标准化后的径流序列Q作为Lasso回归中的集合Y;(3)给定一个参数λ,交叉验证并计算出预报集合Y’,将集合Y’与集合Y进行对比获得参数λ的第一评价指标;(4)选取M个不同的参数λ,对其第一评价指标进行归一化处理并对其结果相加作为评分;(5)统计每个参数λ的总评分,选出总评分最高的参数λ作为最优参数;(6)根据最优参数在步骤(3)中获得的各个气候因子的回归系数,非零的回归系数对应的气候因子被识别为预报因子。

Description

中长期径流的预报因子识别方法、中长期径流的预测方法
技术领域
本发明涉及中长期水文预报技术领域,具体的,本发明涉及中长期径流的预报因子识别方法、中长期径流的预测方法。
背景技术
中长期水文预报,是指预见期在3天到1年之间,且预见期超过流域汇流时间的水文预报,其预报变量包括水位、径流、降雨等。由于径流和水库调度直接相关,中长期径流预报最为常见也最受关注,在防洪抗旱、水库发电计划制定、水资源综合管理等水库调度决策领域发挥着重要的作用。并且,一般而言,中长期径流预报的预见期越长,就越能支持水库调度决策。
在当前的研究中,由于缺乏相应预见期的可靠的气象预报,水文预报中大都采用基于数据分析的模型,滑动平均自回归(ARMA)模型、人工神经网络(ANN)和支持向量回归(SVR)等众多数据驱动模型都依次被应用到中长期水文预报中,并取得了较好的结果。其中,由于径流时间序列的非线性,ANN、SVR等非线性模型的预报效果要比ARMA模型更好。除了这些单一的模型之外,一些方法结合了不同的模型对径流时间序列进行预报并且取得了比单一模型更好的效果。
但是,现有的研究大都在模型和输出结果的集合方面进行研究,而很少考虑改变模型的输入数据。当前的大多数研究的输入数据都是前期径流,并且在预见期较短时(小于1个月)能够取得较好的结果,这是由于预见期较短时前期径流和当前径流有很强的相关关系,而当预见期变长时,这种相关关系迅速变弱,预报可靠性迅速降低,这也是导致当前中长期径流预报的预见期大都是1个月的主要原因。
事实上,预见期更长的可靠的中长期水文预报对水库调度决策更有用,并且一些外部因子如大气环流因子、海温等也被应用到中长期径流预报中以提高预报精度和预见期。然而这些气候因子众多,并且考虑到气候因子对径流的影响具有滞后性,可以作为备选预报因子的时间序列就更多,如果不进行选择,无法得到有益的预报因子,而当前的预报大都是通过先验知识确定部分预报因子,没有一种稳定的方法用于在众多的因子中挑选合适的中长期径流预报因子作为模型的输入。
因此,现阶段对中长期径流预报的预报因子的识别方法有待改确定。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
本发明是基于发明人的下列发现而完成的:
本发明人在研究过程中发现,当前的中长期径流预报中,模型输入大都是前期径流或者基于经验选取的气候因子。以前期径流作为预报因子对径流预报的预见期会有限制,而当采用对径流的影响比较滞后的气候因子时,考虑到遥相关,有众多的气候因子会对径流产生影响,并且这些气候因子对某地径流的影响的滞后期并不能确定,因此有不同滞后期的众多的气候因子作为备选预报因子,目前在中长期水文预报领域并没有进行过相应的研究,而本发明的目的就在于解决这个问题。
本发明的发明人经过深入研究发现,为了实现上述目的,本发明引入一种中长期径流预报领域的新方法——至少绝对的收缩和选择算子(Least Absolute Shrinkage andSelection Operator,缩写为Lasso)回归方法——来从气候因子中选择合适的预报因子。lasso回归是Tibshirani在1996年在岭回归和子集选择两种方法的基础上提出的,结合了子集选择的可解释性以及岭回归的稳定性两种优点。自从lasso提出之后,在多个领域得到了广泛的应用,但是在水文预报领域并未得到应用,而本文则将其应用到径流预报因子的识别中。
有鉴于此,本发明的一个目的在于提出一种根据Lasso回归方法有效筛选出预报因子、不同预报因子的滞后期也可不同的中长期径流的预报因子的识别方法。
在本发明的第一方面,本发明提出了一种中长期径流的预报因子的识别方法。
根据本发明的实施例,所述识别方法包括:(1)对径流序列和气候因子序列进行标准化处理,以便获得标准化后的径流序列Q和气候因子序列F;(2)设定并根据预见期,将包含一系列不同滞后期的所述标准化后的径流序列Q和气候因子集序列F组成的备选预报因子集合X,并将对应标准化后的径流序列Q作为Lasso回归中的集合Y;(3)给定一个参数λ,交叉验证并计算出预报集合Y’,并将所述预报集合Y’与所述集合Y进行对比,以便获得所述参数λ的第一评价指标;(4)选取M个不同的所述参数λ,对其所述第一评价指标进行归一化处理,并对所述归一化处理的结果相加后作为评分;(5)统计每个所述参数λ的所述评分的总和作为所述参数λ的总评分,选出所述总评分最高的所述参数λ作为最优参数;(6)根据所述最优参数在步骤(3)中获得的各个所述气候因子的回归系数,其中,非零的回归系数对应的所述气候因子被识别为所述预报因子。
发明人意外地发现,采用本发明实施例的识别方法,可根据Lasso回归方法可有效地从众多滞后期不同的气候因子中,筛选出合适的中长期(预报期长于5个月)径流的预报因子,并且还可确定出不同的预报因子各自不同的滞后期。
另外,根据本发明上述实施例的识别方法,还可以具有如下附加的技术特征:
根据本发明的实施例,步骤(1)和(2)中,所述径流序列为每月的当前径流数据组成的序列,所述气候因子序列为每月的74项气候因子数据组成的矩阵;所述预见期设定为1~12个月中的任一个,所述滞后期为1~24个月。
根据本发明的实施例,步骤(2)中,所述备选预报因子集合X和所述集合Y的形式如下:
Figure BDA0001380393680000031
其中,LT为预见期,t为相对月数,Q为标准化后的径流序列,F为标准化后的气候因子序列。
根据本发明的实施例,步骤(3)中,所述交叉验证并计算出预报集合Y’的步骤包括:(3-1)将所述备选预报因子集合X和所述集合Y按照同样的顺序随机打乱并分为多段数据;(3-2)从所述多段数据中任选一段作为待预报数据,将所述多段数据的其他数据作为Lasso的训练数据,根据所述参数λ计算出所述气候因子及径流因子的回归系数;(3-3)根据所述多段数据的其他数据中各段的X分依次与所述回归系数进行计算,并结合出所述预报集合Y’。
根据本发明的实施例,所述多段数据为26段数据。
根据本发明的实施例,步骤(3)进一步包括:重复100次所述交叉验证并计算出预报集合Y’并将所述预报集合Y’与所述集合Y进行对比的步骤,将100个均方误差作为所述参数λ的第一评价指标。
根据本发明的实施例,步骤(4)中,所述对其所述第一评价指标进行归一化处理的步骤包括:将所述100个均方误差的均值和标准差作为第二评价指标,再对所述M个不同的参数λ的所述第二评价指标进行归一化处理。
根据本发明的实施例,步骤(5)中,所述最优参数为0.14。
根据本发明的实施例,步骤(6)中,所述非零的回归系数对应的所述气候因子被识别为所述预报因子的步骤包括:将所述100次交叉验证的计算中的非零回归系数进行统计,并获得各个所述气候因子的回归系数为非零值的频率,将所述频率大于0.95的所述气候因子作为所述预报因子。
在本发明的第二方面,本发明提出了一种中长期径流的预测方法。
根据本发明的实施例,所述预测方法输入的数据包括上述方法识别出的预报因子。
发明人意外地发现,采用本发明实施例的预测方法,其数据包括增加了和中长期径流遥相关的预报因子,所以该预测方法获得中长期径流的预报精度更高且预见期更长。本领域技术人员能够理解的是,前面针对中长期径流的预报因子的识别方法所描述的特征和优点,仍适用于该中长期径流的预报方法,在此不再赘述。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明一个实施例的中长期径流的预报因子的识别方法的流程示意图;
图2是本发明另一个实施例的中长期径流的预报因子的识别方法的流程示意图;
图3是本发明一个实施例的不同参数λ对应的MSE的箱型统计图;
图4是本发明一个实施例的含有74项气候因子和不含74项气候因子的效果对比图。
具体实施方式
下面详细描述本发明的实施例,本技术领域人员会理解,下面实施例旨在用于解释本发明,而不应视为对本发明的限制。除非特别说明,在下面实施例中没有明确描述具体技术或条件的,本领域技术人员可以按照本领域内的常用的技术或条件或按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可通过市购到的常规产品。
在本发明的一个方面,本发明提出了一种中长期径流的预报因子的识别方法。参照图1~4,对本发明的识别方法进行详细的描述。
根据本发明的实施例,参照图1,该识别方法包括:
S100:对径流序列和气候因子序列进行标准化处理。
在该步骤中,对径流序列和气候因子序列进行标准化处理,以便获得标准化后的径流序列Q和气候因子序列F。如此,可保证各个气候因子在后续的Lasso回归分析中,不会因为数值差异而出现影响识别出预报因子的情况。
根据本发明的实施例,径流序列可为每月的当前径流数据组成的序列,而气候因子序列可为每月的74项气候因子数据组成的矩阵。如此选取径流序列和气候因子序列,便于后续进行Lasso回归分析以及延长中长期径流预报的预见期,分别对径流序列和气候因子序列进行标准化处理以后,可获得标准化后的径流序列Q和气候因子序列F。在本发明的一些具体示例中,本申请的发明人选用龙羊峡水库1987年1月至2012年12月的入库径流数据作为径流序列,并分月进行标准化处理,而且将同期的由国家气候中心发布的74项气候因子的数据作为气候因子序列,也进行标准化处理。
S200:设定并根据预见期,将包含一系列不同滞后期的标准化后的径流序列Q和气候因子集序列F组成备选预报因子集合X,并将对应标准化后的径流序列Q作为Lasso回归中的集合Y。
在该步骤中,设定预见期,并根据预见期形成选预报因子集合X,其中,备选预报因子集合X包含一系列不同滞后期的标准化后的径流序列Q和气候因子集序列F,并且,还将与备选预报因子集合X对应的标准化后的径流序列Q作为Lasso回归中的集合Y。
需要说明的是,Lasso回归方法的具体公式为
Figure BDA0001380393680000051
其类似于岭回归,在最小二乘法的基础上增加了对回归系数的惩罚项,但是lasso回归是对回归系数的绝对值大小进行惩罚。本申请的发明人经过长期的研究发现,lasso回归能够有效地把自变量的回归系数收缩,并且能够把部分自变量的回归系数收缩为0,并且其结果具有稳定性,因此,能够利用Lasso回归方法进行预报因子的识别。
根据本发明的实施例,预见期和滞后期的具体月数不受特别的限制,本领域技术人员可根据中长期径流预报的预报结果的精度来调整预见期的具体月数、而根据后续Lasso回归的各气候因子的回归系数来调整滞后期的具体月数。在本发明的一些具体示例中,预见期可设定为1~12个月中的任一个,滞后期可选择1~24个月。如此,可同时满足中长期径流预报的预见期长于1个月、各个气候因子与当前径流的遥相关性的条件,从而可有效地从众多滞后期不同的气候因子中筛选出合适的中长期径流的预报因子。
根据本发明的实施例,备选预报因子集合X和集合Y的具体形式可如下所示:
Figure BDA0001380393680000052
其中,LT为预见期,t为相对月数,Q为标准化后的径流序列,F为标准化后的气候因子序列。如此,采用上述表达形式的备选预报因子集合X和集合Y,可更充分地考虑到各个气候因子与当前径流的遥相关性。需要说明的是,相对月数t具体指该月份与径流序列中初始月份的差值,按照时间排序为1、2、3……,以本申请的一些具体示例为例,1987年1月为径流序列中初始月份,则1989年2月的相对月数t为25,以此类推。
S300:给定一个参数λ,交叉验证并计算出预报集合Y’,并将预报集合Y’与集合Y进行对比,以便获得参数λ的第一评价指标。
在该步骤中,给定一个参数λ,通过交叉验证的方法可计算出预报集合Y’,再预报集合Y’与集合Y进行对比,以便获得参数λ的第一评价指标。在本发明的一些具体示例中,参数λ可设定为0.1。
根据本发明的实施例,参照图2,步骤S300(图2中未标出)中的交叉验证并计算出预报集合Y’的步骤可进一步包括:
S310:将备选预报因子集合X和集合Y按照同样的顺序随机打乱并分为多段数据。
在该步骤中,将备选预报因子集合X和集合Y按照同样的顺序随机打乱,并分为多段数据,如此将原本按时间顺序排列的数据打乱后重排,从而可评估因子在不同数据划分情况下的表现,对其预报的稳定性进行评估。
根据本发明的实施例,多段数据的具体段数不受特别的限制,只要能保证用于后续Lasso回归计算的训练数据充足即可,本领域技术人员可根据数据量减小设定。在本发明的一些具体示例中,多段数据可以具体为26段数据,如此,本申请的发明人在后续可获得稳定性更高的不同的参数λ的模型。
S320:从多段数据中任选一段作为待预报数据,将多段数据的其他数据作为Lasso的训练数据,根据参数λ计算出气候因子及径流因子的回归系数。
在该步骤中,以本发明的一些具体示例为例,从26段数据中任选一段作为待预报数据,而其他25段数据作为Lasso的训练数据,再根据参数λ可计算出各个气候因子及径流因子对应的回归系数。
S330:根据多段数据的其他数据中各段的X分依次与回归系数进行计算,并结合出预报集合
在该步骤中,以本发明的一些具体示例为例,根据步骤S320获得的各个气候因子及径流因子对应的回归系数,分别对其他25段数据进行计算,并按照时间顺序与待预报数据部分的Y组合出预报集合Y’。如此,通过交叉验证获得的预报集合Y’,可以集合Y进行对比,以便获得参数λ的第一评价指标。
根据本发明的实施例,以本发明的一些具体示例为例,为了提高步骤S310~S330的预报精度,步骤S330后可进一步具体包括:重复100次交叉验证(S310)并计算出预报集合Y’(S320)并将预报集合Y’与集合Y进行对比(S330)的步骤,可获得100组Y’,再将这100组Y’与Y相比的均方误差(MSE=||Y’-Y||2,即两者差的二范数的平方)作为参数λ=0.1的第一评价指标,如此,进行100次重复可消除交叉验证步骤中将数据随机打乱的影响,从进一步提高该识别方法的有效性。
S400:选取M个不同的参数λ,对其第一评价指标进行归一化处理,并对归一化处理的结果相加后作为评分。
在该步骤中,参考图2,如果用于回归系数计算的参数λ的数目不够,则可改变参数λ的值后再重复步骤S300,从而可获得M个不同的参数λ,并进一步对M个不同的参数λ获得的第一评价指标进行归一化处理,并对归一化处理后的结果按照参数λ进行相加作为该参数λ的评分。
根据本发明的实施例,步骤S400中,对其第一评价指标进行归一化处理的步骤可具体包括:将100个均方误差的均值和标准差作为第二评价指标,再对M个不同的参数λ的第二评价指标进行归一化处理。
在本发明的一些示例中,参数λ分别还取了0.11、0.12、……、0.2、0.22、0.24、……、0.3,总共16个不同的参数λ,得到的16组MSE的箱形统计图如附图3所示,从图2中可知,在参数λ(Lambda)变小时MSE变小,但是由于易出现过拟合,MSE的变化幅度变大,模型更不稳定,为了能够同时考虑模型的精度和稳定性,以100个MSE的均值和标准差作为评价指标;再将100个MSE的均值和标准差作为评价指标,然后对16个参数的评价指标进行归一化处理,其中,MSE均值最小和标准差最小的第二评价指标都为1分,MSE均值最大和标准差最大的第二评价指标都为0分。
S500:统计每个参数λ的评分的总和作为参数λ的总评分,选出总评分最高的参数λ作为最优参数。
在该步骤中,以本发明的一些具体示例为例,分别对16个参数λ的第二评价指标进行加和的结果作为该参数λ的总评分,如此,总评分最高的参数λ即为最优参数。
根据本发明的实施例,最优参数的具体值不受特别的限制,本领域技术人员可根据不同的径流序列的数据源进行筛选。在本发明的一些具体示例中,各参数λ(Lambda)对应的平均MSE、MSE的标准差以及评分请见表1,从表1可知,最适合的参数λ值为0.14。
表1.不同参数λ的交叉验证效果评分
Figure BDA0001380393680000071
S600:根据最优参数在步骤S300中获得的各个气候因子的回归系数,其中,非零的回归系数对应的气候因子被识别为预报因子。
在该步骤中,根据步骤S500获得的最优参数,可获得该最优参数在步骤S300中各个气候因子的回归系数,则非零的回归系数对应的气候因子可被识别为预报因子,可用于中长期径流预报的输入数据使用。
根据本发明的实施例,非零的回归系数对应的气候因子被识别为预报因子的步骤可具体包括:将100次交叉验证的计算中的非零回归系数进行统计,并获得各个气候因子的回归系数为非零值的频率,将频率大于0.95的气候因子作为预报因子。
在本发明的一些具体示例中,根据最优参数λ=0.14在步骤S300中100次交叉验证中获得的非零回归系数进行统计,可获得各个气候因子的回归系数为非零值的概率,然后可以选取频率大于0.95的因子作为预报因子,对应着各预见期的统计结果如表2和表3所示(表中因子序号为1代表前期径流,因子序号为2-75代表74项气候因子,其具体含义列在表3中)。从表中可知,当预见期较大时,会有较多的气候因子在预报中占据比较重要的比重,并且其滞后期较大,也因此根据这些因子可提供预见期更长的径流预报。并且,还可以看到1号(前期径流)、69号(青藏高原指数)因子都是在当前预见期的情况下有最小的滞后期的因子被选中,而其余因子都有着稳定的滞后期。
表2.各预见期的预报因子(频率大于0.95)
Figure BDA0001380393680000081
表3.表2中各因子的实际名称
因子序号 实际名称
1 前期径流
17 西太平洋副高强度指数(110°E-180°)
20 大西洋副高强度指数(55°W-25°W)
24 北半球副高脊线(5E-360)
38 印度副高北界(65°E-95°E)
39 西太平洋副高北界(110°E-150°E)
69 西藏高原指数(30°N-40°N,75°E-105°E)
74 太阳黑子
75 南方涛动指数
在本发明的一些具体示例中,通过步骤S100~S600,可得到不同预见期的龙羊峡入库径流预报的预报因子,然后可以将这些因子作为各预报模型的输入。为了说明选取到的不同滞后期的74项气候因子(X1)是有益的,改变上述步骤中的备选预报因子集合X,让X中只包含有前期径流而不包含74项气候因子(X2),从而得到的各预见期情况下两者的对比如附图4所示。从图4可知,在预见期大于5个月后,采用74项气候因子的效果要优于只以前期径流作为预报因子的情况,这说明了通过Lasso回归方法能在众多的预报因子(在本实施例中是24*75=1800个)中选取最好的预报因子组合,并且通过引入74项气候因子,在预见期变长的情况下能够取得比较好的结果。并且,从前期径流和74项气候因子中选出了有益的龙羊峡入库径流的中长期预报因子。而更广泛地说,可以将各种其余因子如海温、尼诺3.4指数等作为备选的预报因子,通过本发明对预报因子进行筛选后再输入预报模型以提升模型效果。
综上所述,根据本发明的实施例,本发明提出了一种识别方法,可根据Lasso回归方法可有效地从众多滞后期不同的气候因子中,筛选出合适的中长期(预报期长于5个月)径流的预报因子,并且还可确定出不同的预报因子各自不同的滞后期。并且,相比于当前的基于经验的预报因子选取方法,本发明能够优先选取对预报最有益的预报因子,然后选择无益的预报因子,最后选取有干扰的预报因子,通过设定合适的预报因子数,能够达到最优的因子组合效果,以去除众多的备选因子中有干扰的预报因子对预报的影响。
在本发明的另一个方面,本发明提出了一种中长期径流的预测方法。
根据本发明的实施例,该预测方法输入的数据包括上述方法识别出的预报因子。需要说明的是,该预测方法除了输入上述方法识别出的预报因子的数据意外,还包括其他必要的步骤,例如建模、数据归一化处理、输出数据及其后处理,等等,本领域技术人员可根据实际的预测模拟过程进行补充,在此不再赘述。
综上所述,根据本发明的实施例,本发明提出了一种预测方法,其数据包括增加了和中长期径流遥相关的预报因子,所以该预测方法获得中长期径流的预报精度更高且预见期更长。本领域技术人员能够理解的是,前面针对中长期径流的预报因子的识别方法所描述的特征和优点,仍适用于该中长期径流的预报方法,在此不再赘述。
在本发明的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (9)

1.一种中长期径流的预报因子的识别方法,其特征在于,包括:
(1)对径流序列和气候因子序列进行标准化处理,以便获得标准化后的径流序列Q和气候因子序列F;
(2)设定并根据预见期,将包含一系列不同滞后期的所述标准化后的径流序列Q和气候因子序列F组成的备选预报因子集合X,并将对应标准化后的径流序列Q作为Lasso回归中的集合Y;
(3)给定一个参数λ,交叉验证并计算出预报集合Y’,并将所述预报集合Y’与所述集合Y进行对比,以便获得所述参数λ的第一评价指标;
(4)选取M个不同的所述参数λ,对其所述第一评价指标进行归一化处理,并对所述归一化处理的结果相加后作为评分;
(5)统计每个所述参数λ的所述评分的总和作为所述参数λ的总评分,选出所述总评分最高的所述参数λ作为最优参数;
(6)根据所述最优参数在步骤(3)中获得的各个气候因子的回归系数,其中,非零的回归系数对应的气候因子被识别为所述预报因子;
步骤(6)中,所述非零的回归系数对应的气候因子被识别为所述预报因子的步骤包括:
将100次交叉验证的计算中的非零回归系数进行统计,并获得各个气候因子的回归系数为非零值的频率,将频率大于0.95的气候因子作为所述预报因子。
2.根据权利要求1所述的识别方法,其特征在于,步骤(1)和(2)中,
所述径流序列为每月的当前径流数据组成的序列,
所述气候因子序列为每月的74项气候因子数据组成的矩阵;
所述预见期设定为1~12个月中的任一个,所述滞后期为1~24个月。
3.根据权利要求1所述的识别方法,其特征在于,步骤(2)中,所述备选预报因子集合X和所述集合Y的形式如下:
Figure FDA0003037400810000011
Yt=Qt
其中,LT为预见期,t为相对月数,Q为标准化后的径流序列,F为标准化后的气候因子序列。
4.根据权利要求1所述的识别方法,其特征在于,步骤(3)中,所述交叉验证并计算出预报集合Y’的步骤包括:
(3-1)将所述备选预报因子集合X和所述集合Y按照同样的顺序随机打乱并分为多段数据;
(3-2)从所述多段数据中任选一段作为待预报数据,将所述多段数据的其他数据作为Lasso的训练数据,根据所述参数λ计算出气候因子及径流因子的回归系数;
(3-3)根据所述多段数据的其他数据中各段的X分依次与所述回归系数进行计算,并结合出所述预报集合Y’。
5.根据权利要求4所述的识别方法,其特征在于,所述多段数据为26段数据。
6.根据权利要求1所述的识别方法,其特征在于,步骤(3)进一步包括:
重复100次所述交叉验证并计算出预报集合Y’并将所述预报集合Y’与所述集合Y进行对比的步骤,将100个均方误差作为所述参数λ的第一评价指标。
7.根据权利要求6所述的识别方法,其特征在于,步骤(4)中,所述对其所述第一评价指标进行归一化处理的步骤包括:
将所述100个均方误差的均值和标准差作为第二评价指标,再对所述M个不同的参数λ的所述第二评价指标进行归一化处理。
8.根据权利要求7所述的识别方法,其特征在于,步骤(5)中,所述最优参数为0.14。
9.一种中长期径流的预测方法,其特征在于,所述预测方法输入的数据包括权利要求1~8中任一项所述方法识别出的预报因子。
CN201710701183.3A 2017-08-16 2017-08-16 中长期径流的预报因子识别方法、中长期径流的预测方法 Active CN107622322B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710701183.3A CN107622322B (zh) 2017-08-16 2017-08-16 中长期径流的预报因子识别方法、中长期径流的预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710701183.3A CN107622322B (zh) 2017-08-16 2017-08-16 中长期径流的预报因子识别方法、中长期径流的预测方法

Publications (2)

Publication Number Publication Date
CN107622322A CN107622322A (zh) 2018-01-23
CN107622322B true CN107622322B (zh) 2021-07-20

Family

ID=61088827

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710701183.3A Active CN107622322B (zh) 2017-08-16 2017-08-16 中长期径流的预报因子识别方法、中长期径流的预测方法

Country Status (1)

Country Link
CN (1) CN107622322B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109523054A (zh) * 2018-09-29 2019-03-26 中山大学 一种基于随机游走的季节径流预报因子选择方法
CN109472403B (zh) * 2018-10-31 2022-03-11 中国水利水电科学研究院 一种集合经验模态分解及遥相关的中长期径流预报方法
CN110133755A (zh) * 2019-04-19 2019-08-16 上海电力学院 基于gra-lmbp权重的多天气类型下直散分离建模预测控制方法
CN110196456A (zh) * 2019-05-31 2019-09-03 河海大学 一种基于相似年灰色关联分析的中长期降雨径流预报方法
CN110555561B (zh) * 2019-09-06 2022-04-01 清华大学 一种中长期径流集合预报方法
CN115689368B (zh) * 2022-11-10 2023-08-01 华能西藏雅鲁藏布江水电开发投资有限公司 一种基于全寿命周期的径流预报模型评价方法
CN115713164B (zh) * 2022-11-26 2023-11-24 福建中锐汉鼎数字科技有限公司 一种流域下游水位预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
非稳态条件下中长期径流预报及其在水库调度中的应用;王君;《中国优秀硕士学位论文全文数据库 工程科技II辑》;20151215(第12期);正文第18-26页 *
高维数据变量选择的几点研究;于怡;《中国博士学位论文全文数据库 基础科学辑》;20150315(第03期);正文第45-49页 *

Also Published As

Publication number Publication date
CN107622322A (zh) 2018-01-23

Similar Documents

Publication Publication Date Title
CN107622322B (zh) 中长期径流的预报因子识别方法、中长期径流的预测方法
Wang et al. Analysis and application of forecasting models in wind power integration: A review of multi-step-ahead wind speed forecasting models
CN108304668B (zh) 一种结合水文过程数据和历史先验数据的洪水预测方法
CN101480143B (zh) 一种预测灌区作物单产量的方法
Di et al. A four-stage hybrid model for hydrological time series forecasting
Piltan et al. Energy demand forecasting in Iranian metal industry using linear and nonlinear models based on evolutionary algorithms
CN111665575B (zh) 一种基于统计动力的中长期降雨分级耦合预报方法及***
CN112288164B (zh) 一种计及空间相关性和修正数值天气预报的风功率组合预测方法
CN113705877B (zh) 基于深度学习模型的实时月径流预报方法
JP6645043B2 (ja) 誤差幅推定装置、誤差幅推定システム、誤差幅推定方法及びプログラム
CN111191193A (zh) 一种基于自回归滑动平均模型的长期土壤温湿度高精度预测方法
Nhita A rainfall forecasting using fuzzy system based on genetic algorithm
Lee et al. Probabilistic wind power forecasting based on the laplace distribution and golden search
Manor et al. Bayesian Inference aided analog downscaling for near-surface winds in complex terrain
CN114117852B (zh) 一种基于有限差分工作域划分的区域热负荷滚动预测方法
CN114580762A (zh) 一种基于XGBoost的水文预报误差校正方法
Tao et al. Water footprint modeling and forecasting of cassava based on different artificial intelligence algorithms in Guangxi, China
Kakade et al. Seasonal prediction of summer monsoon rainfall over cluster regions of India
Martín et al. Analysis of wind power productions by means of an analog model
CN116826745B (zh) 一种电力***背景下的分层分区短期负荷预测方法及***
CN112380778A (zh) 一种基于海温的气象干旱预报方法
Oduntan et al. A predictive model for improving cereals crop productivity using supervised machine learning algorithm
Mahdiraji et al. A Hybrid fuzzy regression-SSA approach for electricity consumption optimisation
CN117950087B (zh) 基于大尺度最优气候模态的人工智能降尺度气候预测方法
CN117993305B (zh) 一种流域土地利用与土壤侵蚀关系动态评估方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant