CN117828490A - 一种基于集成学习的对台风灾害预报方法及*** - Google Patents

一种基于集成学习的对台风灾害预报方法及*** Download PDF

Info

Publication number
CN117828490A
CN117828490A CN202410252323.3A CN202410252323A CN117828490A CN 117828490 A CN117828490 A CN 117828490A CN 202410252323 A CN202410252323 A CN 202410252323A CN 117828490 A CN117828490 A CN 117828490A
Authority
CN
China
Prior art keywords
typhoon
latitude
model
degrees
wind
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410252323.3A
Other languages
English (en)
Other versions
CN117828490B (zh
Inventor
方舟
王路瑶
陈泽昌
何佳信
王伟
杨元建
张文杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Information Science and Technology
Original Assignee
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Information Science and Technology filed Critical Nanjing University of Information Science and Technology
Priority to CN202410252323.3A priority Critical patent/CN117828490B/zh
Publication of CN117828490A publication Critical patent/CN117828490A/zh
Application granted granted Critical
Publication of CN117828490B publication Critical patent/CN117828490B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01WMETEOROLOGY
    • G01W1/00Meteorology
    • G01W1/10Devices for predicting weather conditions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Environmental & Geological Engineering (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Atmospheric Sciences (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Ecology (AREA)
  • Environmental Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于集成学习的对台风灾害预报方法及***,所述方法包括以下步骤:(1)利用台风参数数据、再分析资料、地面观测数据按时间和空间匹配构建历史台风训练数据集并进行预处理;(2)建立台风风雨预报模型,将历史台风训练数据集输入到台风风雨预报模型中进行训练,得到台风降水预报模型最优参数;(3)评估预报结果;本发明针对台风产生灾害受众多复杂条件影响,本发明的台风风雨预报模型采用的特征参数精确描述了台风路径与强度、风雨发生机理及动力过程,能快速地获取精确而非冗余的预报所需数据,有助于提高预报预警时效性。

Description

一种基于集成学习的对台风灾害预报方法及***
技术领域
本发明涉及天气预报与灾害预警技术领域,具体涉及一种基于集成学习的对台风灾害预报方法及***。
背景技术
台风是我国东南沿海地区面临的主要气象灾害之一。可带来强降雨、狂风、洪涝等严重危害,对其风雨的准确的及时的预报对防灾减灾事业至关重要。
传统数值天气预报模型与双偏振多普勒天气雷达回波进行风场和降雨的测量与预报由于对微物理过程机理认识尚不清楚与雷达、卫星测量降水方法等存在误差,其准确性与时效性达到瓶颈,且耗费大量时间和计算资源。
近年来,随着人工智能技术在气象领域的应用兴起,机器学习被广泛应用于各类极端天气的预报。具体而言,通过集成学习方法,能够更全面、准确地预测台风的风雨影响。支持向量机SVM的精准分类、长短时记忆神经网络LSTM能够捕捉时间序列数据中的长期依赖关系的能力、极致梯度提升树XGBoost所具有高效的集成学习机制和对特征的鲁棒性。进一步的,使用堆叠集成将LSTM和XGBoost组合在一起,可以获得更强大的整体性能为台风风雨预报提供了更高的准确性。这一集成学习模型的优势集合为提升台风风雨预报技术带来了更为显著的好处。
采用台风风雨预报模型,以台风路径、实况强度、副高指数、地区地理参数等要素作为输入,经过模型训练,可建立输入变量与台风风雨之间的复杂非线性关系,可用于实际台风来袭时的风雨预报,提供新型的、高效的、准确的新型预报方法,这是社会与以气象局为代表的相关部门所急需的。
发明内容
发明目的:本发明的目的是提供一种基于集成学习的对台风灾害预报方法及***从而解决目前对台风风雨的预报缺乏实效性与准确性的问题。
技术方案:本发明所述的一种基于集成学习的对台风灾害预报方法,包括以下步骤:
(1)利用台风参数数据、再分析资料、地面观测数据按时间和空间匹配构建历史台风训练数据集并进行预处理;
(2)建立台风风雨预报模型,将历史台风训练数据集输入到台风风雨预报模型中进行训练,得到台风降水预报模型最优参数;
(3)评估预报结果。
进一步的,所述步骤(1)中,台风参数数据包括:台风中心经度、台风中心纬度、气象站台经度、气象站台纬度、气象站台海拔、台风最低气压、台风近中心最大风速;再分析资料包括:西太平洋北纬 10°以北,东经 90°至 180°以内;500 hPa高度场的位势高度和纬向风;地面观测数据包括:降水量、风速;根据上述数据的二次计算或直接采用为台风风雨预报模型所配置的参数包括:台风中心经度、台风中心纬度、气象站台经度、气象站台纬度、台风中心与气象站台之间的距离、气象站台海拔、台风最低气压、台风近中心最大风速、西太副高强度、西太副高面积、西太副高西伸脊点与西太副高脊线;台风风雨预报模型预报目标参数包括:降水量、风速。
进一步的,所述步骤(1)中,预处理包括:根据台风中心经度、台风中心纬度、气象站台经度和气象站台纬度计算台风中心与气象站台之间的距离:
其中,R 代表地球的半径;Lat_sta为气象站台纬度、Lat为台风中心纬度、Long_sta为气象站台经度、Long为台风中心经度;
根据西太平洋500 hPa高度场的位势高度和纬向风计算西太副高指数;西太副高指数包括:
西太副高面积GM,公式如下:
西太副高强度GQ,公式如下:
西太副高脊线GX,公式如下:
西太副高西伸脊点GD,公式如下:
dx:纬向格距数值;
dy:经向格距数值;
i:格点纬向序号,i=1,2,……Nx,Nx为监测范围内的纬向格点总数,由西向东增加;
j:格点经向序号,j=1,2,……Ny,Ny为监测范围内的经向格点总数,由南向北增加;
:500 hPa高度场上某个格点的位势高度值;
:格点所在的纬度值;
其中,为在北纬10º以北、东经110º至东经150º范围内的500hPa高度场上的588位势什米等值线所包围的西太副高体内纬向风切变线即 所在纬度位置的平均值;若不存在588位势什米等值线,则定义584位势什米等值线内的纬向风切变线所在纬度位置的平均值;若在某月不存在584位势什米等值线,则以该月的历史最小值代替;
为北纬10º以北、东经90º至东经180º范围内的500hPa高度场上的588 位势什米等值线的最西格点所在位置的经度值;若最西格点在90ºE以西则统一计为90ºE;若在某月不存在588位势什米等值线,则以该月的历史最大值代替。
进一步的,所述步骤(2)中,建立台风风雨预报模型包括:SVM模块、LSTM模块和XGBoost模块;具体如下:首先,使用SVM进行训练,以判断受台风影响的区域;通过构建分离超平面,识别时序数据中不同区域的受影响与否情况;将SVM判断的受影响区域的时序数据输入到LSTM中,以高训练轮数来捕获时序数据中的长期依赖关系;然后利用 XGBoost通过集成多个决策树,建立复杂的非线性关系;最后,以线性回归为元模型将LSTM、XGBoost的输出进行堆叠输出。
进一步的,所述步骤(2)中,对模型进行训练具体如下:首先,将历史训练数据集导入台风风雨预报模型后,调整模型参数确定模型最佳性能参数;其次,是利用网格搜索与十倍交叉验证方法结合确定模型最优参数;网格搜索法将遍历预先设定的参数组合,评估参数采用以下公式计算得到:
其中,表示参数搜索空间,/>是参数组合,/>表示使用交叉验证评估参数/>下模型的性能指标;求解过程就是遍历/>,计算每个/>对应的/>,找到最大化的/>即最优参数组合;
使用交叉验证评估每组参数的模型性能,选择出性能最优的参数组合;具体确定方法如下:将历史训练数据集分隔为训练集和验证集,得到模型对验证集的降水量与风速预测结果后,对比验证集的实际降水量与风速,计算验证集结果的评估参数:平均绝对误差、均方根误差/>、偏差/>、相关系数R、观测值的标准偏差/>、模拟值的标准偏差/>、模拟值与观测值的吻合指数 />,选取评估参数最优的参数组合作为模型超参数,上述评估参数采用以下公式计算得到:
其中,为第i个预测值;/>为第i个观测值,N为样本总数,/>为观测值的平均,/>为预测值的平均,/>为第i个预测值和观测值间的差值。
本发明所述的一种基于集成学习的对台风灾害预报***,包括:
数据获取模块:用于利用台风参数数据、再分析资料、地面观测数据按时间和空间匹配构建历史台风训练数据集并进行预处理;
台风风雨预报模块:用于建立台风风雨预报模型,将历史台风训练数据集输入到台风风雨预报模型中进行训练,得到台风降水预报模型最优参数;
评估模块:用于评估预报结果。
进一步的,所述数据获取模块中,台风参数数据包括:台风中心经度、台风中心纬度、气象站台经度、气象站台纬度、气象站台海拔、台风最低气压、台风近中心最大风速;再分析资料包括:西太平洋北纬 10°以北,东经 90°至 180°以内;500 hPa高度场的位势高度和纬向风;地面观测数据包括:降水量、风速;根据上述数据的二次计算或直接采用为台风风雨预报模型所配置的参数包括:台风中心经度、台风中心纬度、气象站台经度、气象站台纬度、台风中心与气象站台之间的距离、气象站台海拔、台风最低气压、台风近中心最大风速、西太副高强度、西太副高面积、西太副高西伸脊点与西太副高脊线;台风风雨预报模型预报目标参数包括:降水量、风速。
进一步的,所述数据获取模块中,预处理包括:根据台风中心经度、台风中心纬度、气象站台经度和气象站台纬度计算台风中心与气象站台之间的距离:
其中,R 代表地球的半径;Lat_sta为气象站台纬度、Lat为台风中心纬度、Long_sta为气象站台经度、Long为台风中心经度;
根据西太平洋500 hPa高度场的位势高度和纬向风计算西太副高指数;西太副高指数包括:
西太副高面积GM,公式如下:
西太副高强度GQ,公式如下:
西太副高脊线GX,公式如下:
西太副高西伸脊点GD,公式如下:
dx:纬向格距数值;
dy:经向格距数值;
i:格点纬向序号,i=1,2,……Nx,Nx为监测范围内的纬向格点总数,由西向东增加;
j:格点经向序号,j=1,2,……Ny,Ny为监测范围内的经向格点总数,由南向北增加;
:500 hPa高度场上某个格点的位势高度值;
:格点所在的纬度值;
其中,为在北纬10º以北、东经110º至东经150º范围内的500hPa高度场上的588位势什米等值线所包围的西太副高体内纬向风切变线即 所在纬度位置的平均值;若不存在588位势什米等值线,则定义584位势什米等值线内的纬向风切变线所在纬度位置的平均值;若在某月不存在584位势什米等值线,则以该月的历史最小值代替;
为北纬10º以北、东经90º至东经180º范围内的500hPa高度场上的588 位势什米等值线的最西格点所在位置的经度值;若最西格点在90ºE以西则统一计为90ºE;若在某月不存在588位势什米等值线,则以该月的历史最大值代替。
进一步的,所述台风风雨预报模块中,建立台风风雨预报模型包括:SVM模块、LSTM模块和XGBoost模块;具体如下:首先,使用SVM进行训练,以判断受台风影响的区域;通过构建分离超平面,识别时序数据中不同区域的受影响与否情况;将SVM判断的受影响区域的时序数据输入到LSTM中,以高训练轮数来捕获时序数据中的长期依赖关系;然后利用XGBoost通过集成多个决策树,建立复杂的非线性关系;最后,以线性回归为元模型将LSTM、XGBoost的输出进行堆叠输出。
进一步的,所述台风风雨预报模块中,对模型进行训练具体如下:首先,将历史训练数据集导入台风风雨预报模型后,调整模型参数确定模型最佳性能参数;其次,是利用网格搜索与十倍交叉验证方法结合确定模型最优参数;网格搜索法将遍历预先设定的参数组合,评估参数采用以下公式计算得到:
其中,表示参数搜索空间,/>是参数组合,/>表示使用交叉验证评估参数/>下模型的性能指标;求解过程就是遍历/>,计算每个/>对应的/>,找到最大化的/>即最优参数组合;
使用交叉验证评估每组参数的模型性能,选择出性能最优的参数组合;具体确定方法如下:将历史训练数据集分隔为训练集和验证集,得到模型对验证集的降水量与风速预测结果后,对比验证集的实际降水量与风速,计算验证集结果的评估参数:平均绝对误差、均方根误差/>、偏差/>、相关系数R、观测值的标准偏差/>、模拟值的标准偏差/>、模拟值与观测值的吻合指数 />,选取评估参数最优的参数组合作为模型超参数,上述评估参数采用以下公式计算得到:
其中,为第i个预测值;/>为第i个观测值,N为样本总数,/>为观测值的平均,/>为预测值的平均,/>为第i个预测值和观测值间的差值。
有益效果:与现有技术相比,本发明具有如下显著优点:
(1)本发明通过集成学习,采用支持向量机配合线性回归作为元模型的将长短期记忆递归神经网络和极致梯度提升堆叠集成,建立了台风风雨与多种气象与地理的复杂条件之间非线性映射关系,能更快速地预报受台风影响区域和更精确的定量预报受台风影响区域风雨,对台风期间的预警和预报提供有力的支持;
(2)本发明利用长时间序列的大范围的受台风影响区域的气象数据与西太副高相关再分析资料,构建我国历史受台风影响区域风雨数据集用于训练集成学习模型,并深入分析了台风风雨影响的区域、距离与季节特征,能更准确地为受台风影响区域特别是较少受台风影响区域,提供预报方面的数据支持;
(3)针对台风产生灾害受众多复杂条件影响,本发明的台风风雨预报模型采用的特征参数精确描述了台风路径与强度、风雨发生机理及动力过程,能快速地获取精确而非冗余的预报所需数据,有助于提高预报预警时效性;
(4)本发明提出西太副高指数作为模型重要预报因子,简单而有效描述台风活动期间西太平洋副热带高压的大尺度环流与动态演变,西太副高指数的应用能够显著提高对台风风雨的预报准确性。
附图说明
图1为本发明的流程图;
图2 为本发明的台风降水模型所需特征数据示意图;
图3为本发明的台风风雨预报效果评估示意图。
具体实施方式
下面结合附图对本发明的技术方案作进一步说明。
如图1-2所示,本发明实施例提供一种基于集成学习的对台风灾害预报方法,包括以下步骤:
(1)利用台风参数数据、再分析资料、地面观测数据按时间和空间匹配构建历史台风训练数据集并进行预处理;台风参数数据包括:台风中心经度、台风中心纬度、气象站台经度、气象站台纬度、气象站台海拔、台风最低气压、台风近中心最大风速;再分析资料包括:西太平洋北纬 10°以北,东经 90°至 180°以内;500 hPa高度场的位势高度和纬向风;地面观测数据包括:降水量、风速;根据上述数据的二次计算或直接采用为台风风雨预报模型所配置的参数包括:台风中心经度、台风中心纬度、气象站台经度、气象站台纬度、台风中心与气象站台之间的距离、气象站台海拔、台风最低气压、台风近中心最大风速、西太副高强度、西太副高面积、西太副高西伸脊点与西太副高脊线;台风风雨预报模型预报目标参数包括:降水量、风速。
预处理包括:根据台风中心经度、台风中心纬度、气象站台经度和气象站台纬度计算台风中心与气象站台之间的距离:
其中,R 代表地球的半径;Lat_sta为气象站台纬度、Lat为台风中心纬度、Long_sta为气象站台经度、Long为台风中心经度;
根据西太平洋500 hPa高度场的位势高度和纬向风计算西太副高指数;西太副高指数包括:
西太副高面积GM,公式如下:
西太副高强度GQ,公式如下:
西太副高脊线GX,公式如下:
西太副高西伸脊点GD,公式如下:
dx:纬向格距数值;
dy:经向格距数值;
i:格点纬向序号,i=1,2,……Nx,Nx为监测范围内的纬向格点总数,由西向东增加;
j:格点经向序号,j=1,2,……Ny,Ny为监测范围内的经向格点总数,由南向北增加;
:500 hPa高度场上某个格点的位势高度值;
:格点所在的纬度值;
其中,为在北纬10º以北、东经110º至东经150º范围内的500hPa高度场上的588位势什米等值线所包围的西太副高体内纬向风切变线即 所在纬度位置的平均值;若不存在588位势什米等值线,则定义584位势什米等值线内的纬向风切变线所在纬度位置的平均值;若在某月不存在584位势什米等值线,则以该月的历史最小值代替;
为北纬10º以北、东经90º至东经180º范围内的500hPa高度场上的588 位势什米等值线的最西格点所在位置的经度值;若最西格点在90ºE以西则统一计为90ºE;若在某月不存在588位势什米等值线,则以该月的历史最大值代替。
(2)建立台风风雨预报模型,将历史台风训练数据集输入到台风风雨预报模型中进行训练,得到台风降水预报模型最优参数;建立台风风雨预报模型包括:SVM模块、LSTM模块和XGBoost模块;具体如下:首先,使用SVM进行训练,以判断受台风影响的区域;通过构建分离超平面,识别时序数据中不同区域的受影响与否情况;将SVM判断的受影响区域的时序数据输入到LSTM中,以高训练轮数来捕获时序数据中的长期依赖关系;然后利用 XGBoost通过集成多个决策树,建立复杂的非线性关系;最后,以线性回归为元模型将LSTM、XGBoost的输出进行堆叠输出。
对模型进行训练具体如下:首先,将历史训练数据集导入台风风雨预报模型后,调整模型参数确定模型最佳性能参数;其次,是利用网格搜索与十倍交叉验证方法结合确定模型最优参数;网格搜索法将遍历预先设定的参数组合,评估参数采用以下公式计算得到:
其中,表示参数搜索空间,/>是参数组合,/>表示使用交叉验证评估参数/>下模型的性能指标;求解过程就是遍历/>,计算每个/>对应的/>,找到最大化的/>即最优参数组合;
使用交叉验证评估每组参数的模型性能,选择出性能最优的参数组合;具体确定方法如下:将历史训练数据集分隔为训练集和验证集,得到模型对验证集的降水量与风速预测结果后,对比验证集的实际降水量与风速,计算验证集结果的评估参数:平均绝对误差、均方根误差/>、偏差/>、相关系数R、观测值的标准偏差/>、模拟值的标准偏差/>、模拟值与观测值的吻合指数 />,选取评估参数最优的参数组合作为模型超参数,上述评估参数采用以下公式计算得到:
其中,为第i个预测值;/>为第i个观测值,N为样本总数,/>为观测值的平均,/>为预测值的平均,/>为第i个预测值和观测值间的差值。
如图3所示,为台风风雨预报模型训练集和测试集的预报值与实际值的对比即预报效果示意图,PRCP为降雨量。
本发明实施例还提供一种基于集成学习的对台风灾害预报***,包括:
数据获取模块:用于利用台风参数数据、再分析资料、地面观测数据按时间和空间匹配构建历史台风训练数据集并进行预处理;台风参数数据包括:台风中心经度、台风中心纬度、气象站台经度、气象站台纬度、气象站台海拔、台风最低气压、台风近中心最大风速;再分析资料包括:西太平洋北纬 10°以北,东经 90°至 180°以内;500 hPa高度场的位势高度和纬向风;地面观测数据包括:降水量、风速;根据上述数据的二次计算或直接采用为台风风雨预报模型所配置的参数包括:台风中心经度、台风中心纬度、气象站台经度、气象站台纬度、台风中心与气象站台之间的距离、气象站台海拔、台风最低气压、台风近中心最大风速、西太副高强度、西太副高面积、西太副高西伸脊点与西太副高脊线;台风风雨预报模型预报目标参数包括:降水量、风速。
预处理包括:根据台风中心经度、台风中心纬度、气象站台经度和气象站台纬度计算台风中心与气象站台之间的距离:
其中,R 代表地球的半径;Lat_sta为气象站台纬度、Lat为台风中心纬度、Long_sta为气象站台经度、Long为台风中心经度;
根据西太平洋500 hPa高度场的位势高度和纬向风计算西太副高指数;西太副高指数包括:
西太副高面积GM,公式如下:
西太副高强度GQ,公式如下:
西太副高脊线GX,公式如下:
西太副高西伸脊点GD,公式如下:
dx:纬向格距数值;
dy:经向格距数值;
i:格点纬向序号,i=1,2,……Nx,Nx为监测范围内的纬向格点总数,由西向东增加;
j:格点经向序号,j=1,2,……Ny,Ny为监测范围内的经向格点总数,由南向北增加;
:500 hPa高度场上某个格点的位势高度值;
:格点所在的纬度值;/>
其中,为在北纬10º以北、东经110º至东经150º范围内的500hPa高度场上的588位势什米等值线所包围的西太副高体内纬向风切变线即 所在纬度位置的平均值;若不存在588位势什米等值线,则定义584位势什米等值线内的纬向风切变线所在纬度位置的平均值;若在某月不存在584位势什米等值线,则以该月的历史最小值代替;
为北纬10º以北、东经90º至东经180º范围内的500hPa高度场上的588 位势什米等值线的最西格点所在位置的经度值;若最西格点在90ºE以西则统一计为90ºE;若在某月不存在588位势什米等值线,则以该月的历史最大值代替。
台风风雨预报模块:用于建立台风风雨预报模型,将历史台风训练数据集输入到台风风雨预报模型中进行训练,得到台风降水预报模型最优参数;建立台风风雨预报模型包括:SVM模块、LSTM模块和XGBoost模块;具体如下:首先,使用SVM进行训练,以判断受台风影响的区域;通过构建分离超平面,识别时序数据中不同区域的受影响与否情况;将SVM判断的受影响区域的时序数据输入到LSTM中,以高训练轮数来捕获时序数据中的长期依赖关系;然后利用 XGBoost通过集成多个决策树,建立复杂的非线性关系;最后,以线性回归为元模型将LSTM、XGBoost的输出进行堆叠输出。
对模型进行训练具体如下:首先,将历史训练数据集导入台风风雨预报模型后,调整模型参数确定模型最佳性能参数;其次,是利用网格搜索与十倍交叉验证方法结合确定模型最优参数;网格搜索法将遍历预先设定的参数组合,评估参数采用以下公式计算得到:
其中,表示参数搜索空间,/>是参数组合,/>表示使用交叉验证评估参数/>下模型的性能指标;求解过程就是遍历/>,计算每个/>对应的/>,找到最大化的/>即最优参数组合;
使用交叉验证评估每组参数的模型性能,选择出性能最优的参数组合;具体确定方法如下:将历史训练数据集分隔为训练集和验证集,得到模型对验证集的降水量与风速预测结果后,对比验证集的实际降水量与风速,计算验证集结果的评估参数:平均绝对误差、均方根误差/>、偏差/>、相关系数R、观测值的标准偏差/>、模拟值的标准偏差/>、模拟值与观测值的吻合指数 />,选取评估参数最优的参数组合作为模型超参数,上述评估参数采用以下公式计算得到:
;/>
其中,为第i个预测值;/>为第i个观测值,N为样本总数,/>为观测值的平均,/>为预测值的平均,/>为第i个预测值和观测值间的差值。
评估模块:用于评估预报结果。

Claims (10)

1.一种基于集成学习的对台风灾害预报方法,其特征在于,包括以下步骤:
(1)利用台风参数数据、再分析资料、地面观测数据按时间和空间匹配构建历史台风训练数据集并进行预处理;
(2)建立台风风雨预报模型,将历史台风训练数据集输入到台风风雨预报模型中进行训练,得到台风降水预报模型最优参数;
(3)评估预报结果。
2.根据权利要求1所述的一种基于集成学***洋北纬10°以北,东经 90°至 180°以内;500 hPa高度场的位势高度和纬向风;地面观测数据包括:降水量、风速;根据上述数据的二次计算或直接采用为台风风雨预报模型所配置的参数包括:台风中心经度、台风中心纬度、气象站台经度、气象站台纬度、台风中心与气象站台之间的距离、气象站台海拔、台风最低气压、台风近中心最大风速、西太副高强度、西太副高面积、西太副高西伸脊点与西太副高脊线;台风风雨预报模型预报目标参数包括:降水量、风速。
3.根据权利要求1所述的一种基于集成学习的对台风灾害预报方法,其特征在于,所述步骤(1)中,预处理包括:根据台风中心经度、台风中心纬度、气象站台经度和气象站台纬度计算台风中心与气象站台之间的距离,公式如下:
其中,R 代表地球的半径;Lat_sta为气象站台纬度、Lat为台风中心纬度、Long_sta为气象站台经度、Long为台风中心经度;
根据西太平洋500 hPa高度场的位势高度和纬向风计算西太副高指数;西太副高指数包括:
西太副高面积GM,公式如下:
西太副高强度GQ,公式如下:
西太副高脊线GX,公式如下:
西太副高西伸脊点GD,公式如下:
dx:纬向格距数值;
dy:经向格距数值;
i:格点纬向序号,i=1,2,……Nx,Nx为监测范围内的纬向格点总数,由西向东增加;
j:格点经向序号,j=1,2,……Ny,Ny为监测范围内的经向格点总数,由南向北增加;
:500 hPa高度场上某个格点的位势高度值;
:格点所在的纬度值;
其中,为在北纬10º以北、东经110º至东经150º范围内的500hPa高度场上的588位势什米等值线所包围的西太副高体内纬向风切变线即 所在纬度位置的平均值;若不存在588位势什米等值线,则定义584位势什米等值线内的纬向风切变线所在纬度位置的平均值;若在某月不存在584位势什米等值线,则以该月的历史最小值代替;/>为北纬10º以北、东经90º至东经180º范围内的500hPa高度场上的588 位势什米等值线的最西格点所在位置的经度值;若最西格点在90ºE以西则统一计为90ºE;若在某月不存在588位势什米等值线,则以该月的历史最大值代替。
4.根据权利要求1所述的一种基于集成学***面,识别时序数据中不同区域的受影响与否情况;将SVM判断的受影响区域的时序数据输入到LSTM中,以高训练轮数来捕获时序数据中的长期依赖关系;然后利用 XGBoost通过集成多个决策树,建立复杂的非线性关系;最后,以线性回归为元模型将LSTM、XGBoost的输出进行堆叠输出。
5.根据权利要求1所述的一种基于集成学习的对台风灾害预报方法,其特征在于,所述步骤(2)中,对模型进行训练具体如下:首先,将历史训练数据集导入台风风雨预报模型后,调整模型参数确定模型最佳性能参数;其次,是利用网格搜索与十倍交叉验证方法结合确定模型最优参数;网格搜索法将遍历预先设定的参数组合,评估参数采用以下公式计算得到:
其中,表示参数搜索空间,/>是参数组合,/>表示使用交叉验证评估参数/>下模型的性能指标;求解过程就是遍历/>,计算每个/>对应的/>,找到/>最大化的/>即最优参数组合;
使用交叉验证评估每组参数的模型性能,选择出性能最优的参数组合;具体确定方法如下:将历史训练数据集分隔为训练集和验证集,得到模型对验证集的降水量与风速预测结果后,对比验证集的实际降水量与风速,计算验证集结果的评估参数:平均绝对误差、均方根误差/>、偏差/>、相关系数R、观测值的标准偏差/>、模拟值的标准偏差/>、模拟值与观测值的吻合指数 />,选取评估参数最优的参数组合作为模型超参数,上述评估参数采用以下公式计算得到:
其中,为第i个预测值;/>为第i个观测值,N为样本总数,/>为观测值的平均,/>为预测值的平均,/>为第i个预测值和观测值间的差值。
6.一种基于集成学习的对台风灾害预报***,其特征在于,包括:
数据获取模块:用于利用台风参数数据、再分析资料、地面观测数据按时间和空间匹配构建历史台风训练数据集并进行预处理;
台风风雨预报模块:用于建立台风风雨预报模型,将历史台风训练数据集输入到台风风雨预报模型中进行训练,得到台风降水预报模型最优参数;
评估模块:用于评估预报结果。
7.根据权利要求6所述的一种基于集成学***洋北纬 10°以北,东经 90°至 180°以内;500 hPa高度场的位势高度和纬向风;地面观测数据包括:降水量、风速;根据上述数据的二次计算或直接采用为台风风雨预报模型所配置的参数包括:台风中心经度、台风中心纬度、气象站台经度、气象站台纬度、台风中心与气象站台之间的距离、气象站台海拔、台风最低气压、台风近中心最大风速、西太副高强度、西太副高面积、西太副高西伸脊点与西太副高脊线;台风风雨预报模型预报目标参数包括:降水量、风速。
8.根据权利要求6所述的一种基于集成学习的对台风灾害预报***,其特征在于,所述数据获取模块中,预处理包括:根据台风中心经度、台风中心纬度、气象站台经度和气象站台纬度计算台风中心与气象站台之间的距离:
其中,R 代表地球的半径;Lat_sta为气象站台纬度、Lat为台风中心纬度、Long_sta为气象站台经度、Long为台风中心经度;
根据西太平洋500 hPa高度场的位势高度和纬向风计算西太副高指数;西太副高指数包括:
西太副高面积GM,公式如下:
西太副高强度GQ,公式如下:
西太副高脊线GX,公式如下:
西太副高西伸脊点GD,公式如下:
dx:纬向格距数值;
dy:经向格距数值;
i:格点纬向序号,i=1,2,……Nx,Nx为监测范围内的纬向格点总数,由西向东增加;
j:格点经向序号,j=1,2,……Ny,Ny为监测范围内的经向格点总数,由南向北增加;
:500 hPa高度场上某个格点的位势高度值;
:格点所在的纬度值;
其中,为在北纬10º以北、东经110º至东经150º范围内的500hPa高度场上的588位势什米等值线所包围的西太副高体内纬向风切变线即 所在纬度位置的平均值;若不存在588位势什米等值线,则定义584位势什米等值线内的纬向风切变线所在纬度位置的平均值;若在某月不存在584位势什米等值线,则以该月的历史最小值代替;/>为北纬10º以北、东经90º至东经180º范围内的500hPa高度场上的588 位势什米等值线的最西格点所在位置的经度值;若最西格点在90ºE以西则统一计为90ºE;若在某月不存在588位势什米等值线,则以该月的历史最大值代替。
9.根据权利要求6所述的一种基于集成学***面,识别时序数据中不同区域的受影响与否情况;将SVM判断的受影响区域的时序数据输入到LSTM中,以高训练轮数来捕获时序数据中的长期依赖关系;然后利用 XGBoost通过集成多个决策树,建立复杂的非线性关系;最后,以线性回归为元模型将LSTM、XGBoost的输出进行堆叠输出。
10.根据权利要求6所述的一种基于集成学习的对台风灾害预报***,其特征在于,所述台风风雨预报模块中,对模型进行训练具体如下:首先,将历史训练数据集导入台风风雨预报模型后,调整模型参数确定模型最佳性能参数;其次,是利用网格搜索与十倍交叉验证方法结合确定模型最优参数;网格搜索法将遍历预先设定的参数组合,评估参数采用以下公式计算得到:
其中,表示参数搜索空间,/>是参数组合,/>表示使用交叉验证评估参数/>下模型的性能指标;求解过程就是遍历/>,计算每个/>对应的/>,找到/>最大化的/>即最优参数组合;
使用交叉验证评估每组参数的模型性能,选择出性能最优的参数组合;具体确定方法如下:将历史训练数据集分隔为训练集和验证集,得到模型对验证集的降水量与风速预测结果后,对比验证集的实际降水量与风速,计算验证集结果的评估参数:平均绝对误差、均方根误差/>、偏差/>、相关系数R、观测值的标准偏差/>、模拟值的标准偏差/>、模拟值与观测值的吻合指数 />,选取评估参数最优的参数组合作为模型超参数,上述评估参数采用以下公式计算得到:
其中,为第i个预测值;/>为第i个观测值,N为样本总数,/>为观测值的平均,/>为预测值的平均,/>为第i个预测值和观测值间的差值。
CN202410252323.3A 2024-03-06 2024-03-06 一种基于集成学习的对台风灾害预报方法及*** Active CN117828490B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410252323.3A CN117828490B (zh) 2024-03-06 2024-03-06 一种基于集成学习的对台风灾害预报方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410252323.3A CN117828490B (zh) 2024-03-06 2024-03-06 一种基于集成学习的对台风灾害预报方法及***

Publications (2)

Publication Number Publication Date
CN117828490A true CN117828490A (zh) 2024-04-05
CN117828490B CN117828490B (zh) 2024-05-17

Family

ID=90506291

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410252323.3A Active CN117828490B (zh) 2024-03-06 2024-03-06 一种基于集成学习的对台风灾害预报方法及***

Country Status (1)

Country Link
CN (1) CN117828490B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109784578A (zh) * 2019-01-24 2019-05-21 中国科学院软件研究所 一种结合业务规则的在线学习停滞预测***
US20210089944A1 (en) * 2019-09-25 2021-03-25 Accenture Global Solutions Limited Optimizing generation of a forecast
AU2021105840A4 (en) * 2021-08-18 2021-10-28 Xinjiang Institute Of Ecology And Geography, Chinese Academy Of Sciences Method for predicting typhoon track
CN114357872A (zh) * 2021-12-24 2022-04-15 武汉理工大学 一种基于stacking模型融合的船舶运动黑箱辨识建模与运动预测方法
CN115019919A (zh) * 2022-06-16 2022-09-06 江苏省人民医院(南京医科大学第一附属医院) 基于深度学习的脑卒中早期康复后功能预测模型建立方法
US20220392567A1 (en) * 2021-05-27 2022-12-08 Qatar Foundation For Education, Science And Community Development Modelling framework for embedding-based predictions for compound-viral protein activity
WO2023045278A1 (zh) * 2021-09-27 2023-03-30 西安交通大学 数据双驱动的台风灾害下电网故障预测方法、装置和设备
CN117408735A (zh) * 2023-12-15 2024-01-16 广东云百科技有限公司 一种基于物联网的客户管理方法及***

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109784578A (zh) * 2019-01-24 2019-05-21 中国科学院软件研究所 一种结合业务规则的在线学习停滞预测***
US20210089944A1 (en) * 2019-09-25 2021-03-25 Accenture Global Solutions Limited Optimizing generation of a forecast
US20220392567A1 (en) * 2021-05-27 2022-12-08 Qatar Foundation For Education, Science And Community Development Modelling framework for embedding-based predictions for compound-viral protein activity
AU2021105840A4 (en) * 2021-08-18 2021-10-28 Xinjiang Institute Of Ecology And Geography, Chinese Academy Of Sciences Method for predicting typhoon track
WO2023045278A1 (zh) * 2021-09-27 2023-03-30 西安交通大学 数据双驱动的台风灾害下电网故障预测方法、装置和设备
CN114357872A (zh) * 2021-12-24 2022-04-15 武汉理工大学 一种基于stacking模型融合的船舶运动黑箱辨识建模与运动预测方法
CN115019919A (zh) * 2022-06-16 2022-09-06 江苏省人民医院(南京医科大学第一附属医院) 基于深度学习的脑卒中早期康复后功能预测模型建立方法
WO2023241012A1 (zh) * 2022-06-16 2023-12-21 南京医科大学 基于深度学习的脑卒中早期康复后功能预测模型建立方法
CN117408735A (zh) * 2023-12-15 2024-01-16 广东云百科技有限公司 一种基于物联网的客户管理方法及***

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BAIYOU QIAO等: "A parallel feature selection method based on NMI-XGBoost and distance correlation for typhoon trajectory prediction", 《SPRING LINK》, 23 January 2024 (2024-01-23), pages 1 - 29 *
刘峻等: "基于XGBoost和LSTM的台风强度预测模型分析", 《无线互联科技》, no. 6, 25 March 2022 (2022-03-25), pages 46 - 48 *
娄冉冉: "基于机器学习面向不同时间跨度的浪高预报研究", 《中国优秀硕士学位论文全文数据库 》, 15 March 2023 (2023-03-15), pages 010 - 17 *

Also Published As

Publication number Publication date
CN117828490B (zh) 2024-05-17

Similar Documents

Publication Publication Date Title
CN108227041B (zh) 基于站点实测数据和模式结果的水平能见度预报方法
CN111665575B (zh) 一种基于统计动力的中长期降雨分级耦合预报方法及***
CN111428942B (zh) 基于变网格技术提取微地形因子的线路覆冰厚度预测方法
EP2884413B1 (en) Method for predicting wind power density
CN101344937A (zh) 基于地理信息***的水上交通风险评价及预测方法
Feng et al. Short-term global horizontal irradiance forecasting based on sky imaging and pattern recognition
CN113255972B (zh) 基于Attention机制的短临降水预测方法
CN105891833A (zh) 基于多普勒雷达信息识别暖云降水率的方法
CN113591572A (zh) 基于多源数据和多时相数据的水土流失定量监测方法
CN106845080B (zh) 基于差异修正的景区旅游气象灾害智能预测方法
CN106485360A (zh) 基于全局夜光遥感的局部社会经济指标预测方法及***
WO2024031449A1 (zh) 一种基于网格聚类的峡谷风电短期功率预测方法
Vassallo et al. Utilizing physics-based input features within a machine learning model to predict wind speed forecasting error
CN112183625A (zh) 一种基于深度学习的pm2.5高精度时空预测方法
CN114880933A (zh) 一种基于再分析资料的无探空站点地基微波辐射计大气温湿廓线反演方法及***
CN110750516A (zh) 基于雷达图的降雨分析模型构建方法、构建***及分析方法
CN117556197B (zh) 一种基于人工智能的台风涡旋初始化方法
CN106355243A (zh) 一种基于神经网络的水平面太阳直射散射计算***及方法
KR101264873B1 (ko) 단계적 회귀 분석을 이용한 풍력 밀도 예측 방법
CN107403004B (zh) 一种基于地形数据的遥测雨量站点可疑数值检验方法
KR101313822B1 (ko) 신경망 분석 기법을 이용한 풍력 밀도 예측 방법
Pegion et al. Understanding predictability of daily southeast US precipitation using explainable machine learning
CN117828490B (zh) 一种基于集成学习的对台风灾害预报方法及***
Lu et al. Uncertainty quantification of machine learning models to improve streamflow prediction under changing climate and environmental conditions
Chen et al. Modified analogue forecasting in the hidden Markov framework for meteorological droughts

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant