CN112733996A - 基于GA-PSO优化XGBoost的水文时间序列预测方法 - Google Patents

基于GA-PSO优化XGBoost的水文时间序列预测方法 Download PDF

Info

Publication number
CN112733996A
CN112733996A CN202110049321.0A CN202110049321A CN112733996A CN 112733996 A CN112733996 A CN 112733996A CN 202110049321 A CN202110049321 A CN 202110049321A CN 112733996 A CN112733996 A CN 112733996A
Authority
CN
China
Prior art keywords
pso
xgboost
hydrological
model
optimal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110049321.0A
Other languages
English (en)
Other versions
CN112733996B (zh
Inventor
马露
万定生
余宇峰
杨志勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hohai University HHU
Original Assignee
Hohai University HHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU filed Critical Hohai University HHU
Priority to CN202110049321.0A priority Critical patent/CN112733996B/zh
Publication of CN112733996A publication Critical patent/CN112733996A/zh
Application granted granted Critical
Publication of CN112733996B publication Critical patent/CN112733996B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A10/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
    • Y02A10/40Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Development Economics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Genetics & Genomics (AREA)
  • Game Theory and Decision Science (AREA)
  • Physiology (AREA)
  • Medical Informatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种基于GA‑PSO优化XGBoost的水文时间序列预测方法,采集对应水文站的雨量值及对应水文站的流量,组织成水文时间序列数据集;对数据进行预处理,将样本数据集划分为训练集和测试集;采用改进的GA‑PSO组合优化算法对XGBoost的学习率lr、基学习器个数n_estimators、最小叶子权重min_weights、最大树深max_depth等各项超参进行优化,同时利用样本数据集对XGBoost模型进行训练,最终得到GA‑PSO优化的XGBoost水文时间序列预测模型;对所述GA‑PSO优化的XGBoost水文预测模型进行测试。本发明采用GA‑PSO对XGBoost模型的参数进行优化,利用最优参数得到的模型进行水文预测,准确度更高。

Description

基于GA-PSO优化XGBoost的水文时间序列预测方法
技术领域
本发明属于水文预测技术,具体涉及一种基于GA-PSO优化XGBoost的水文时间序列预测方法。
背景技术
目前,我国水文行业从传统水文向现代水文迈进,自动水文站观测技术快速推广,从人工手动记录水文数据资料记录到当前自动站每几分钟甚至每秒钟一次的数据记录,水文数据资料覆盖愈加全面。这些水文数据拥有数量大、类别杂、时空性、更新快等特点,同时,它们受到季节气候、地貌特征、水文规律等诸多条件影响,隐藏了很多有价值的规律和信息。如何对它们进行有力的分析,从中得到有用的信息从而服务于水文预报、洪水检测等成为人们关注的焦点。传统水文行业普遍根据水文环境和过程建立物理模型再加以人工经验进行预测。从信息的角度出发,若能从流域拥有的长足时间序列历史资料中挖掘出特定的模式规律,利用近似趋势对流域未来的水位流量进行有效预测,有助于预防洪涝灾害,因此水文时间序列的预测重要性不言而喻。
近年来,不少学者将机器学习的方法应用于水文时间序列预测中,如:LSTM神经网络、支持向量机、BP神经网络等,上述方法也都取得了较好的效果,在改进了传统模型的计算速度和精度的同时,也存在一些问题:LSTM和BP神经网络学习能力强,但易陷入局部最优,需要大量参数,且收敛速度较慢;支持向量机预测效果较好,但对于大规模的训练样本,计算速度缓慢且依赖于超参数的选择。因此需要寻找一种效率与准确率兼顾的预测模型。
遗传算法和粒子群算法都是为模型优化参数时最常使用也是最基础的寻优算法,GA算法寻优的过程中,整个种群以编码的形式存在,变化的趋势也是逐渐均匀地向最优区域逼近,但GA是“无记忆”的,只通过交叉和变异来更新粒子,因而全局搜索能力较强;与之相对的,PSO算法“有记忆”,通过改变粒子的速度与位置来更新粒子,与前一时刻的位置息息相关,更适合于局部最优的搜索,要调节的参数少,收敛速度很快但要避免早熟收敛的情况。
发明内容
发明目的:本发明的目的在于解决现有技术中存在的不足,提供一种基于GA-PSO优化XGBoost的水文时间序列预测方法,通过数据挖掘的相关技术,对水文时间序列进行分析和预测研究。
技术方案:本发明的一种基于GA-PSO优化XGBoost的水文时间序列预测方法,包括以下步骤:
步骤S1、采集一水系流域对应的各雨量站一定时间段内的雨量值及对应水位站的水位,组织成水文时间序列数据集;
步骤S2、对步骤S1水文时间序列数据集中各水文样本数据进行预处理,将样本数据集划分为水文训练数据集L和水文测试数据集T;
步骤S3、采用改进的GA-PSO组合优化算法对XGBoost模型的学习率lr、基学习器个数n_estimators、最小叶子权重、最大树深等各项超参进行优化,同时利用样本数据集对XGBoost模型进行训练,最终得到GA-PSO优化的XGBoost水文时间序列预测模型;
步骤S4、对所述GA-PSO优化的XGBoost水文预测模型进行测试。
所述步骤S1是获取数据集和相应的标签信息,所述步骤S1进一步为:组织该水系流域对应的雨量站当前以及前7小时的雨量值及对应水文站当前以及前7小时的流量值作为水文时间序列数据集。
所述步骤S2是对数据集中的数据进行预处理并划分数据集,所述步骤S2进一步为:
步骤S2.1、所述步骤S2中对水文样本数据x(t)的预处理包括缺失值处理、错误值更正以及归一化;
归一化公式如下:
Figure BDA0002898654550000021
其中,x*为标准化后的值,x为初始值,xmin为原序列中的最小值,xmax为原序列中的最大值;
步骤S2.2、将预处理后的水文时间序列数据集的前80%数据作为水文训练数据集L,余下的20%数据作为水文测试数据集T。
XGBoost模型有众多参数,更优的参数能提高序列预测的精度,因此采用改进的GA-PSO算法对XGBoost模型的学习率lr、基学习器个数n_estimators、最小叶子权重min_weights和最大树深max_depth等各项超参进行优化,所属步骤S3具体包括:
步骤S3.1、初始化XGBoost模型的学习率lr、基学习器个数n_estimators、最小叶子权重min_weights、最大树深max_depth参数的取值范围,设置GA-PSO整体优化算法的迭代次数为T*
步骤S3.2、随机产生N个子群,每个子群中粒子的染色体就相当于一组XGBoost参数(lr,n_estimators,min_weights,max_depth);
步骤S3.3、采用R2作为个体适应度值,初始化步骤S3.2中N个子群中所有粒子的个体适应度值;
步骤S3.4、对这N个子群都进行一次经典GA优化,最终得到N个最优粒子,GA优化的具体方法为:每个子群包含m个个体,每个子群的迭代次数都设置为T1,对编码后的m个个体进行选择、交叉和变异操作来进一步更新种群;
步骤S3.5、再对变异之后的各粒子计算其适应度值,根据适应度值的大小来更新代表当前迭代次数的最优个体;
步骤S3.6、返回步骤S3.4继续完成经典GA优化,直至达到迭代次数上限T1满足终止条件,每个子群都会有T1个历史最优粒子,将这些粒子的适应度进行比较,适应度值最高的粒子作为该子群的最优个体,最终会得到N个来自N个子群的最优个体;
步骤S3.7、将步骤S3.6得到的N个最优个体进行解码,作为PSO算法的初始粒子群,进行改进后的PSO优化,PSO算法的迭代次数设置为T2
步骤S3.8、初始化PSO算法初始粒子的初始速度,仍然采用R2作为适应度值的计算公式,利用改进后的公式来更新每个粒子的速度和位置,从而更新历史最优位置,记为pbest,群体的全局最优位置gbest;
PSO中粒子速度和位置更新公式为:
Figure BDA0002898654550000031
Figure BDA0002898654550000032
其中,
Figure BDA0002898654550000033
表示当前t时刻的粒子速度,
Figure BDA0002898654550000034
表示当前t时刻的粒子位置,
Figure BDA0002898654550000035
表示个体极值点,
Figure BDA0002898654550000036
表示全局极值点,ω为惯性权重,c1、c2为学习因子,rand1、rand2为[0,1]区间内的随机数;
对于权重ω采用非线性递减权重法:
Figure BDA0002898654550000041
学习因子也和权重呈非线性函数关系:
Figure BDA0002898654550000042
步骤S3.9、判断当前迭代次数是否≤T2,如果满足则返回步骤S3.8继续进行当前PSO优化,否则跳转至步骤S3.10;
步骤S3.10、判断当前总的迭代次数是否≤T*,如果不能满足,则在PSO中的历史最优粒子中随机选取K个替换掉步骤S3.2中每个GA子群的K个个体,并返回步骤S3.2继续进行优化;如果满足则输出最优解;
所述步骤S4中的XGBoost是一个树集成模型,内部的决策树使用的是回归树,所述步骤S4详细过程为:
设GA-PSO优化的XGBoost水文时间序列预测模型的损失函数如下:
Figure BDA0002898654550000043
其中,
Figure BDA0002898654550000044
为损失函数,度量预测值
Figure BDA0002898654550000045
与实际值yi之间的差距;K表示模型中包含的决策树个数;
Figure BDA0002898654550000046
为正则项,式中γ为分割叶子节点的收益函数的惩罚常数,M为叶子节点个数,λ为L2正则项惩罚函数系数;
第j轮模型即第i个样本在第j次训练中的预测值为:
Figure BDA0002898654550000047
第j次训练模型的简化的目标函数为:
Figure BDA0002898654550000048
式中,
Figure BDA0002898654550000049
为损失函数的一阶导数,
Figure BDA00028986545500000410
为损失函数的二阶导数。
有益效果:与现有技术相比,本发明的优点在于:
本发明采用GA-PSO组合优化算法对XGBoost模型的参数进行优化,避免了在寻找最优参数时会陷入局部最优的情况,利用最优参数得到的模型进行水文预测,准确度更高。并且能在保证预测精度的基础上,具有更高的收敛速度,对于大规模的训练样本,计算速度也有一定的提升。
经过参数优化后的XGBoost预测模型有更好的预测效果和预测精度,并提高预测模型的泛化能力。
附图说明
图1为本发明的整体流程示意图;
图2为本发明一实施例中GA-PSO优化示意图;
图3为实施例中GA-PSO与GA和PSO优化算法的适应度值变化曲线对比图;
图4为实施例中预见期1h的细节序列(471,481)展示;
图5为实施例中预见期1h的细节序列(2068,2107)展示。
具体实施方式
下面对本发明技术方案进行详细说明,但是本发明的保护范围不局限于所述实施例。
如图1所示,发明的基于GA-PSO优化XGBoost的水文时间序列预测方法,主要包括4个步骤:
步骤S1、选取龙山流域的数据组织成水文时间序列数据集。时间从2010年12月24日01时~2014年7月25日01时共31416条小时数据,一条数据由龙山站流量值及四个雨量站的雨量值共五个属性构成。这四个雨量站分别为:龙山、后眷、和溪和月明;
步骤S2、对步骤S1水文时间序列数据集中各水文样本数据进行预处理,将样本数据集划分为水文训练数据集L和水文测试数据集T;
步骤S2.1、所述步骤S2中对水文样本数据的预处理包括缺失值处理、错误值更正以及归一化;
归一化公式如下:
Figure BDA0002898654550000051
其中,x*为标准化后的值,x为初始值,xmin为原序列中的最小值,xmax为原序列中的最大值;
步骤S2.2、将预处理后的水文时间序列数据集的前80%数据作为水文训练数据集L,余下的20%数据作为水文测试数据集T。选取2010年12月24日01时~2013年12月11日08时共26000条小时数据作为训练集L,2013年12月11日08时~2014年7月25日01时的5416条数据作为测试集T;
步骤S3、采用改进的GA-PSO组合优化算法对XGBoost模型的学习率lr、基学习器个数n_estimators、最小叶子权重min_weights和最大树深max_depth进行优化,同时利用样本数据集L对XGBoost模型进行训练,最终得到GA-PSO优化的XGBoost水文时间序列预测模型;
步骤S3.1、初始化XGBoost模型的学习率lr、基学习器个数n_estimators、最小叶子权重min_weights、最大树深max_depth参数的取值范围,设置lr范围是(0.01,0.4),n_estimators范围是(10,220),gamma范围是(3,10),max_depth范围是(0,0.2)。设置GA-PSO整体优化算法的迭代次数为T*,对于GA-PSO设置初始种群数量为N=50,迭代次数T*设置为100次,其中使用的GA中的交叉概率cp=0.85,变异概率mp=0.05,迭代次数T1=50,其中使用的改进PSO优化中的迭代次数T2=50,使用GA-PSO优化算法对XGBoost模型的参数jinxing寻优,具体流程如图2所示,具体步骤为:
步骤S3.2、随机产生N个子群,每个子群中粒子的染色体就相当于一组XGBoost参数(lr,n_estimators,min_weights,max_depth);
步骤S3.3、采用R2作为个体适应度值,初始化步骤S3.2中N个子群中所有粒子的个体适应度值;
步骤S3.4、对这50个子群都进行一次经典GA优化,最终得到50个最优粒子,GA优化的具体方法为:每个子群包含50个个体,每个子群的迭代次数都设置为T1,对编码后的50个个体进行选择、交叉和变异操作来进一步更新种群;
步骤S3.5、再对变异之后的各粒子计算其适应度值,根据适应度值的大小来更新代表当前迭代次数的最优个体;
步骤S3.6、返回步骤S3.4继续完成经典GA优化,直至达到迭代次数上限T1满足终止条件,每个子群都会有T1个历史最优粒子,将这些粒子的适应度进行比较,适应度值最高的粒子作为该子群的最优个体,最终会得到50个来自50个子群的最优个体;
步骤S3.7、将步骤S3.6得到的N个最优个体进行解码,作为PSO算法的初始粒子群,进行改进后的PSO优化,PSO算法的迭代次数设置为T2
步骤S3.8、初始化PSO算法初始粒子的初始速度,仍然采用R2作为适应度值的计算公式,利用改进后的公式来更新每个粒子的速度和位置,从而更新历史最优位置,记为pbest,群体的全局最优位置gbest;
PSO中粒子速度和位置更新公式为:
Figure BDA0002898654550000071
Figure BDA0002898654550000072
其中,
Figure BDA0002898654550000073
表示当前t时刻的粒子速度,
Figure BDA0002898654550000074
表示当前t时刻的粒子位置,
Figure BDA0002898654550000075
表示个体极值点,
Figure BDA0002898654550000076
表示全局极值点,ω为惯性权重,c1、c2为学习因子,rand1、rand2为[0,1]区间内的随机数;
对于权重ω采用非线性递减权重法:
Figure BDA0002898654550000077
学习因子也和权重呈非线性函数关系:
Figure BDA0002898654550000078
步骤S3.9、判断当前迭代次数是否≤T2,如果满足则返回步骤S3.8继续进行当前PSO优化,否则跳转至步骤S3.10;
步骤S3.10、判断当前总的迭代次数是否≤T*,如果不能满足,则在PSO中的历史最优粒子中随机选取K个替换掉步骤S3.2中每个GA子群的K个个体,其中,K=N/2=25,随后返回步骤S3.2继续进行优化;如果满足则输出最优解;
步骤S4、对所述GA-PSO优化的XGBoost水文预测模型进行测试。
设GA-PSO优化的XGBoost水文时间序列预测模型的损失函数如下:
Figure BDA0002898654550000079
其中,
Figure BDA00028986545500000710
为损失函数,度量预测值
Figure BDA00028986545500000711
与实际值yi之间的差距;K表示模型中包含的决策树个数;
Figure BDA00028986545500000712
为正则项,式中γ为分割叶子节点的收益函数的惩罚常数,M为叶子节点个数,λ为L2正则项惩罚函数系数;
第j轮模型即第i个样本在第j次训练中的预测值为:
Figure BDA00028986545500000713
第j次训练模型的简化的目标函数为:
Figure BDA0002898654550000081
式中,
Figure BDA0002898654550000082
为损失函数的一阶导数,
Figure BDA0002898654550000083
为损失函数的二阶导数。
本实施例中,经GA-PSO优化算法优化过参数的XGBoost模型在1~6小时预见期内的最佳参数如下表1所示:
表1
Figure BDA0002898654550000084
使用该最优模型对龙山的流量数据进行预测,采用SVM模型和LSTM模型与之进行对比,最终的预测结果如下图4所示,对预测结果的评价指标采用MRE,MAE,RMSE,R2四种,计算公式如下:
Figure BDA0002898654550000085
Figure BDA0002898654550000086
Figure BDA0002898654550000087
Figure BDA0002898654550000088
式中,yi为实测值,
Figure BDA0002898654550000089
为预报值,
Figure BDA00028986545500000810
为平均值,n为样本个数。
表2为本实施例预见期为1h时XGBoost使用最佳参数时与SVM和LSTM两种预测模型的预测值对比。
表2
Figure BDA00028986545500000811
Figure BDA0002898654550000091
表3展示所有预见期内三种模型预测结果评价指标的对比。
表3
Figure BDA0002898654550000092
图3展示GA-PSO优化算法(简称GPSO)在预见期为1h时的适应度值变化曲线,与经典GA和经典PSO算法进行对比。图4和图5分别选取了测试集中两段细节序列(471,481)和(2068,2107)进行展示。

Claims (5)

1.一种基于GA-PSO优化XGBoost的水文时间序列预测方法,其特征在于:包括以下步骤:
步骤S1、采集一水系流域对应的各雨量站一定时间段内的雨量值及对应水位站的水位,组织成水文时间序列数据集;
步骤S2、对步骤S1水文时间序列数据集中各水文样本数据进行预处理,将样本数据集划分为水文训练数据集L和水文测试数据集T;
步骤S3、采用改进的GA-PSO组合优化算法对XGBoost模型的学习率lr、基学习器个数n_estimators、最小叶子权重min_weights和最大树深max_depth进行优化,同时利用水文训练数据集L对XGBoost模型进行训练,最终得到GA-PSO优化的XGBoost水文时间序列预测模型;具体内容为:
步骤S3.1、初始化XGBoost模型的学习率lr、基学习器个数n_estimators、最小叶子权重min_weights、最大树深max_depth参数的取值范围,设置GA-PSO整体优化算法的迭代次数为T*
步骤S3.2、随机产生N个子群,每个子群中粒子的染色体就相当于一组XGBoost参数(lr,n_estimators,min_weights,max_depth);
步骤S3.3、采用R2作为个体适应度值,初始化步骤S3.2中N个子群中所有粒子的个体适应度值;
步骤S3.4、对这N个子群都进行一次经典GA优化,最终得到N个最优粒子,GA优化的具体方法为:每个子群包含m个个体,每个子群的迭代次数都设置为T1,对编码后的m个个体进行选择、交叉和变异操作来进一步更新种群;
步骤S3.5、再对变异之后的各粒子计算其适应度值,根据适应度值的大小来更新代表当前迭代次数的最优个体;
步骤S3.6、返回步骤S3.4继续完成对子群的GA优化,直至达到迭代次数上限T1满足终止条件,然后每个子群均有T1个历史最优粒子,将这些粒子的适应度进行比较,适应度值最高的粒子作为该子群的最优个体,最终会得到N个来自N个子群的最优个体;
步骤S3.7、将步骤S3.6得到的N个最优个体进行解码,作为PSO算法的初始粒子群,进行改进后的PSO优化,PSO算法的迭代次数设置为T2
步骤S3.8、初始化PSO算法初始粒子的初始速度,仍然采用R2作为适应度值的计算公式,利用改进后的公式来更新每个粒子的速度和位置,从而更新历史最优位置,记为pbest,群体的全局最优位置gbest;
步骤S3.9、判断当前迭代次数是否≤T2,如果满足则返回步骤S3.8继续进行当前PSO优化,否则跳转至步骤S3.10;
步骤S3.10、判断当前总的迭代次数是否≤T*,如果不能满足,则在PSO中的历史最优粒子中随机选取K个替换掉步骤S3.2中每个GA子群的K个个体,并返回步骤S3.2继续进行优化;如果满足则输出最优解;
步骤S4、对步骤S3所得GA-PSO优化过的最优XGBoost水文预测模型对测试集T进行测试。
2.根据权利要求1所述的基于GA-PSO优化XGBoost的水文时间序列预测方法,其特征在于:所述步骤S1中的水文时间序列数据集包括该水系流域对应的雨量站当前以及前7小时的雨量值、及对应水文站当前以及前7小时的流量值。
3.根据权利要求1所述的基于GA-PSO优化XGBoost的水文时间序列预测方法,其特征在于:所述步骤S2中对水文样本数据x(t)的预处理包括缺失值处理、错误值更正以及归一化;
归一化公式如下:
Figure FDA0002898654540000021
其中,x*为标准化后的值,x为初始值,xmin为原序列中的最小值,xmax为原序列中的最大值;
将预处理后的水文时间序列数据集的前80%数据作为水文训练数据集L,余下的20%数据作为水文测试数据集T。
4.根据权利要求1所述的基于GA-PSO优化XGBoost的水文时间序列预测方法,其特征在于:所述步骤S3.8中粒子速度和位置更新公式为:
Figure FDA0002898654540000022
Figure FDA0002898654540000023
其中,
Figure FDA0002898654540000031
表示当前t时刻的粒子速度,
Figure FDA0002898654540000032
表示当前t时刻的粒子位置,
Figure FDA0002898654540000033
表示个体极值点,
Figure FDA0002898654540000034
表示全局极值点,ω为惯性权重,c1、c2为学习因子,rand1、rand2为[0,1]区间内的随机数;
对于权重ω采用非线性递减权重法:
Figure FDA0002898654540000035
学习因子也和权重呈非线性函数关系:
Figure FDA0002898654540000036
5.根据权利要求1所述的基于GA-PSO优化XGBoost的水文时间序列预测方法,其特征在于:所述步骤S4的详细过程为:
设GA-PSO优化的XGBoost水文时间序列预测模型的损失函数如下:
Figure FDA0002898654540000037
其中,
Figure FDA0002898654540000038
为损失函数,度量预测值
Figure FDA0002898654540000039
与实际值yi之间的差距;K表示模型中包含的决策树个数;
Figure FDA00028986545400000310
为正则项,式中γ为分割叶子节点的收益函数的惩罚常数,M为叶子节点个数,λ为L2正则项惩罚函数系数;
第j轮模型即第i个样本在第j次训练中的预测值为:
Figure FDA00028986545400000311
第j次训练模型的简化的目标函数为:
Figure FDA00028986545400000312
式中,
Figure FDA00028986545400000313
为损失函数的一阶导数,
Figure FDA00028986545400000314
为损失函数的二阶导数;
用GA-PSO优化算法寻得的XGBoost模型的最佳参数对测试集进行测试。
CN202110049321.0A 2021-01-14 2021-01-14 基于GA-PSO优化XGBoost的水文时间序列预测方法 Active CN112733996B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110049321.0A CN112733996B (zh) 2021-01-14 2021-01-14 基于GA-PSO优化XGBoost的水文时间序列预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110049321.0A CN112733996B (zh) 2021-01-14 2021-01-14 基于GA-PSO优化XGBoost的水文时间序列预测方法

Publications (2)

Publication Number Publication Date
CN112733996A true CN112733996A (zh) 2021-04-30
CN112733996B CN112733996B (zh) 2022-07-12

Family

ID=75593039

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110049321.0A Active CN112733996B (zh) 2021-01-14 2021-01-14 基于GA-PSO优化XGBoost的水文时间序列预测方法

Country Status (1)

Country Link
CN (1) CN112733996B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113326660A (zh) * 2021-06-17 2021-08-31 广西路桥工程集团有限公司 基于GA-XGBoost模型的隧道围岩挤压变形预测方法
CN113503750A (zh) * 2021-06-25 2021-10-15 太原理工大学 一种直接空冷机组最佳背压确定方法
CN113553760A (zh) * 2021-06-25 2021-10-26 太原理工大学 一种汽轮机末级排汽焓软测量方法
CN114282431A (zh) * 2021-12-09 2022-04-05 淮阴工学院 一种基于改进sca和qrgru的径流区间预测方法及***
CN115169243A (zh) * 2022-07-28 2022-10-11 中铁三局集团有限公司 基于ga-pso-glssvm算法的土岩复合地层深基坑变形时序预测方法
CN115225560A (zh) * 2022-07-15 2022-10-21 国网河南省电力公司信息通信公司 一种电力通信业务中路由规划方法
CN117272051A (zh) * 2023-11-21 2023-12-22 浪潮通用软件有限公司 一种基于lstm优化模型的时间序列预测方法、设备及介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112015719A (zh) * 2020-08-27 2020-12-01 河海大学 基于正则化和自适应遗传算法的水文预测模型的构建方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112015719A (zh) * 2020-08-27 2020-12-01 河海大学 基于正则化和自适应遗传算法的水文预测模型的构建方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113326660A (zh) * 2021-06-17 2021-08-31 广西路桥工程集团有限公司 基于GA-XGBoost模型的隧道围岩挤压变形预测方法
CN113326660B (zh) * 2021-06-17 2022-11-29 广西路桥工程集团有限公司 基于GA-XGBoost模型的隧道围岩挤压变形预测方法
CN113503750A (zh) * 2021-06-25 2021-10-15 太原理工大学 一种直接空冷机组最佳背压确定方法
CN113553760A (zh) * 2021-06-25 2021-10-26 太原理工大学 一种汽轮机末级排汽焓软测量方法
CN113503750B (zh) * 2021-06-25 2022-07-29 太原理工大学 一种直接空冷机组最佳背压确定方法
CN114282431A (zh) * 2021-12-09 2022-04-05 淮阴工学院 一种基于改进sca和qrgru的径流区间预测方法及***
CN114282431B (zh) * 2021-12-09 2023-08-18 淮阴工学院 一种基于改进sca和qrgru的径流区间预测方法及***
CN115225560A (zh) * 2022-07-15 2022-10-21 国网河南省电力公司信息通信公司 一种电力通信业务中路由规划方法
CN115225560B (zh) * 2022-07-15 2023-08-22 国网河南省电力公司信息通信公司 一种电力通信业务中路由规划方法
CN115169243A (zh) * 2022-07-28 2022-10-11 中铁三局集团有限公司 基于ga-pso-glssvm算法的土岩复合地层深基坑变形时序预测方法
CN117272051A (zh) * 2023-11-21 2023-12-22 浪潮通用软件有限公司 一种基于lstm优化模型的时间序列预测方法、设备及介质
CN117272051B (zh) * 2023-11-21 2024-03-08 浪潮通用软件有限公司 一种基于lstm优化模型的时间序列预测方法、设备及介质

Also Published As

Publication number Publication date
CN112733996B (zh) 2022-07-12

Similar Documents

Publication Publication Date Title
CN112733996B (zh) 基于GA-PSO优化XGBoost的水文时间序列预测方法
CN109214592B (zh) 一种多模型融合的深度学习的空气质量预测方法
CN109142171B (zh) 基于特征扩张的融合神经网络的城市pm10浓度预测方法
CN104239489B (zh) 利用相似性搜索和改进bp神经网络预测水位的方法
CN113468803B (zh) 一种基于改进的woa-gru洪水流量预测方法及***
CN111401599B (zh) 一种基于相似性搜索和lstm神经网络的水位预测方法
Piltan et al. Energy demand forecasting in Iranian metal industry using linear and nonlinear models based on evolutionary algorithms
CN113537600B (zh) 一种全过程耦合机器学习的中长期降水预报建模方法
CN110363349B (zh) 一种基于ascs的lstm神经网络水文预测方法及***
CN111461457A (zh) 一种基于粒子群优化bp神经网络的基坑位移预测方法
CN107346459B (zh) 一种基于遗传算法改进的多模式污染物集成预报方法
CN109919356B (zh) 一种基于bp神经网络区间需水预测方法
CN114580762A (zh) 一种基于XGBoost的水文预报误差校正方法
CN113554466A (zh) 一种短期用电量预测模型构建方法、预测方法和装置
CN116721537A (zh) 基于gcn-ipso-lstm组合模型的城市短时交通流预测方法
CN106600959A (zh) 一种交通拥堵指数的预测方法
CN109344999A (zh) 一种径流概率预报方法
CN114595873B (zh) 一种基于灰色关联的da-lstm的短期电力负荷预测方法
CN115374995A (zh) 一种分布式光伏、小风电场站功率预测方法
CN114862032B (zh) 一种基于XGBoost-LSTM的电网负荷预测方法及装置
CN112015719A (zh) 基于正则化和自适应遗传算法的水文预测模型的构建方法
CN116596044A (zh) 基于多源数据的发电负荷预测模型训练方法及装置
CN113642699A (zh) 一种江河洪水智能预报***
CN117909888B (zh) 智慧人工智能气候预测方法
CN113762591A (zh) 一种基于gru和多核svm对抗学习的短期电量预测方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant