CN110794485A - 基于集成学习的强对流天气持续时间预报方法 - Google Patents

基于集成学习的强对流天气持续时间预报方法 Download PDF

Info

Publication number
CN110794485A
CN110794485A CN201911003227.0A CN201911003227A CN110794485A CN 110794485 A CN110794485 A CN 110794485A CN 201911003227 A CN201911003227 A CN 201911003227A CN 110794485 A CN110794485 A CN 110794485A
Authority
CN
China
Prior art keywords
algorithm
strong convection
data
weather
selecting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911003227.0A
Other languages
English (en)
Inventor
文立玉
罗飞
向元吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu University of Information Technology
Original Assignee
Chengdu University of Information Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu University of Information Technology filed Critical Chengdu University of Information Technology
Priority to CN201911003227.0A priority Critical patent/CN110794485A/zh
Publication of CN110794485A publication Critical patent/CN110794485A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01WMETEOROLOGY
    • G01W1/00Meteorology
    • G01W1/10Devices for predicting weather conditions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Environmental & Geological Engineering (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Atmospheric Sciences (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Ecology (AREA)
  • Environmental Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于集成学习的强对流天气持续时间预报方法,包括以下步骤:S1,数据源选取:选择预报地区的地面气象站资料以及离预报地区最近的两个探空站资料;S2,数据预处理:剔除错误及缺测资料,根据计算出的相关强对流预报参数作为输入,选择每次强队流天气持续的时间作为输出,当天没有出现强对流天气则认为时间为0,对预报参数即输入作归一化处理;S3,机器学习算法选择:选用K最近邻算法、多项式回归算法、决策树算法、神经网络算法。本发明主要用强对流天气发生当天的各种气象要素来推测强对流天气可能会持续的时间,通过多机器学习算法比较策略,对目标任务进行训练测试,选出其中最优的学习算法,用作实际的预报任务中。

Description

基于集成学习的强对流天气持续时间预报方法
技术领域
本发明涉及天气预报技术领域,尤其涉及基于集成学习的强对流天气持续时间预报方法。
背景技术
天气预报(测)或气象预报(测)是使用现代科学技术对未来某一地点地球大气层的状态进行预测。从史前人类就已经开始对天气进行预测来相应地安排其工作与生活(比如农业生产、军事行动等等)。今天的天气预报主要是使用收集大量的数据(气温、湿度、风向和风速、气压等等),然后使用目前对大气过程的认识(气象学)来确定未来空气变化。由于大气过程的混乱以及今天科学并没有最终透彻地了解大气过程,因此天气预报总是有一定误差的。
常规预报方法,预报员利用天气学方法制作出来的,但准确度不高。另外还有一些算法虽然从不同角度来提高强对流天气预测准确率,但往往采用单一预测算法。在实际应用中,由于地域的不同,不同时空和不同季节对数据处理的要求也是不同的。这种单一的算法预报模型不能反映出数据的动态变化特征,导致预报的稳定性一般较差。
发明内容
基于背景技术存在的技术问题,本发明提出了基于集成学习的强对流天气持续时间预报方法。
本发明提出的基于集成学习的强对流天气持续时间预报方法,包括以下步骤:
S1,数据源选取:选择预报地区的地面气象站资料以及离预报地区最近的两个探空站资料;
S2,数据预处理:剔除错误及缺测资料,根据计算出的相关强对流预报参数作为输入,选择每次强队流天气持续的时间作为输出,当天没有出现强对流天气则认为时间为0,对预报参数即输入作归一化处理;
S3,机器学习算法选择:选用K最近邻算法、多项式回归算法、决策树算法、神经网络算法;
S4,集成学***均,得到集成学习的预报结果。
优选地,所述相关强对流预报参数包括整层比湿积分、A指数、K指数、修正K指数、总指数、修正总指数、对流有效位能、对流凝结温度、自由抬升对流温度、0—3km垂直风矢量差、强天气威胁指数、700hPa比湿、700hPa相对湿度、850hPa比湿、850hPa相对湿度、地面露点温度。
优选地,所述归一化处理采用均值方差归一化,将所有用作输入的数据归一到均值为0方差为1的分布中。
优选地,所述K最近邻算法在气象要素的变动是在一个稳定的范围内,即呈现出连续形态的情况下使用。
优选地,所述多项式回归算法在气象预报涉及要素多,所有的要素和结果很难呈线性关系的情况下使用。
优选地,所述决策树算法在强对流天气过程的产生中,每一种气象要素都起着或多或少的作用的情况下使用。
优选地,所述神经网络算法在对于强对流天气持续时间和当天的气象要素的复杂关系的情况下使用。
Figure BDA0002241958380000031
优选地,所述模型评分采用s=0,β≥2α公式计算,S代表模型的一个样本得分,α代表一个预测样本的真值,β代表一个预测样本的预测值,β是一个大于等于0的数,若计算出来β小于0,则认为它为0;对于一份包含若干个样本的数据,采用S求和再取平均的方式来得到某个模型的得分。
本发明主要用强对流天气发生当天的各种气象要素来推测强对流天气可能会持续的时间,将K最近邻算法、多项式回归算法、决策树算法、神经网络算法这四种算法进行适当综合,且采用交叉验证方式来训练模型,在模型的训练过程中对所有训练数据即各种气象要素比起传统预报方法都会有更好的考量,同时结合四个算法训练出来的最优模型,能够得出比单个算法模型更精确的计算结果。
具体实施方式
下面结合具体实施例对本发明作进一步解说。
本发明提出的基于集成学习的强对流天气持续时间预报方法,包括以下步骤:
S1,数据源选取:选择预报地区的地面气象站资料以及离预报地区最近的两个探空站资料;
S2,数据预处理:剔除错误及缺测资料,根据计算出的相关强对流预报参数作为输入,选择每次强队流天气持续的时间作为输出(单位为分),当天没有出现强对流天气则认为时间为0,对预报参数即输入作归一化处理;
S3,机器学习算法选择:选用K最近邻算法、多项式回归算法、决策树算法、神经网络算法;
S4,集成学***均,得到集成学习的预报结果。
因为是四个算法模型采用交叉验证方式来训练模型,充分考虑每种算法的长处和每份样本数据的特征值和其输出值,所以排除了可能因为算法单一和随机不均匀造成的各种过拟合情况,提高了模型整体的泛化能力,在对新的未经训练过的数据集进行训练时,也能表现出更好的预测能力。在模型的训练过程中对有训练数据即各种气象要素比起传统预报方法都会有更好的考量。同时,按照上方法结合四个算法训练出来的最优模型得出最终结果能比传统单个算法模型更准确。
具体地,相关强对流预报参数包括整层比湿积分、A指数、K指数、修正K指数、总指数、修正总指数、对流有效位能、对流凝结温度、自由抬升对流温度、0—3km垂直风矢量差、强天气威胁指数、700hPa比湿、700hPa相对湿度、850hPa比湿、850hPa相对湿度、地面露点温度。
具体地,归一化处理采用均值方差归一化,将有用作输入的数据归一到均值为0方差为1的分布中,这样可提高机器学习算法的运行效率和准确率。
具体地,K最近邻算法在气象要素的变动是在一个稳定的范围内,即呈现出连续形态的情况下使用。分配给预测点的标签数值是根据其最近邻居标签数值的平均值计算的;
多项式回归算法在气象预报涉及要素多,有的要素和结果很难呈线性关系的情况下使用。在机器学习中,一个常见的模式是针对数据进行线性函数的训练,但这种方法是假设数据呈线性关系的。而现实生活中,数据间的关系大多是非线性形式的,只有添加多项式特征才能将数据很好的拟合出来,多项式回归正好可以解决这类问题;
决策树算法在强对流天气过程的产生中,每一种气象要素都起着或多或少的作用的情况下使用。决策树是一种用于分类和回归的非参数监督学习方法。目标是创建一个模型,通过学习从数据特征推断出的决策规则来预测目标变量的值;
神经网络算法在对于强对流天气持续时间和当天的气象要素的复杂关系的情况下使用。要处理的是相对少量数值预报,以这里采用多层感知器这种轻量的神经网络进行预测。多层感知器能处理更加复杂的非线性问题,它对非线性数据的拟合能力更强。
具体地,模型评分采用s=0,β≥2α公式计算,S代表模型的一个样本得分,α代表一个预测样本的真值,β代表一个预测样本的预测值,β是一个大于等于0的数,若计算出来β小于0,则认为它为0。对于一份包含若干个样本的数据,采用S求和再取平均的方式来得到某个模型的得分。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (8)

1.基于集成学习的强对流天气持续时间预报方法,其特征在于,包括以下步骤:
S1,数据源选取:选择预报地区的地面气象站资料以及离预报地区最近的两个探空站资料;
S2,数据预处理:剔除错误及缺测资料,根据计算出的相关强对流预报参数作为输入,选择每次强队流天气持续的时间作为输出,当天没有出现强对流天气则认为时间为0,对预报参数即输入作归一化处理;
S3,机器学习算法选择:选用K最近邻算法、多项式回归算法、决策树算法、神经网络算法;
S4,集成学***均,得到集成学习的预报结果。
2.根据权利要求1所述的基于集成学习的强对流天气持续时间预报方法,其特征在于,所述相关强对流预报参数包括整层比湿积分、A指数、K指数、修正K指数、总指数、修正总指数、对流有效位能、对流凝结温度、自由抬升对流温度、0—3km垂直风矢量差、强天气威胁指数、700hPa比湿、700hPa相对湿度、850hPa比湿、850hPa相对湿度、地面露点温度。
3.根据权利要求1所述的基于集成学习的强对流天气持续时间预报方法,其特征在于,所述归一化处理采用均值方差归一化,将所有用作输入的数据归一到均值为0方差为1的分布中。
4.根据权利要求1所述的基于集成学习的强对流天气持续时间预报方法,其特征在于,所述K最近邻算法在气象要素的变动是在一个稳定的范围内,即呈现出连续形态的情况下使用。
5.根据权利要求1所述的基于集成学习的强对流天气持续时间预报方法,其特征在于,所述多项式回归算法在气象预报涉及要素多,所有的要素和结果很难呈线性关系的情况下使用。
6.根据权利要求1所述的基于集成学习的强对流天气持续时间预报方法,其特征在于,所述决策树算法在强对流天气过程的产生中,每一种气象要素都起着或多或少的作用的情况下使用。
7.根据权利要求1所述的基于集成学习的强对流天气持续时间预报方法,其特征在于,所述神经网络算法在对于强对流天气持续时间和当天的气象要素的复杂关系的情况下使用。
8.根据权利要求1所述的基于集成学***均的方式来得到某个模型的得分。
CN201911003227.0A 2019-10-22 2019-10-22 基于集成学习的强对流天气持续时间预报方法 Pending CN110794485A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911003227.0A CN110794485A (zh) 2019-10-22 2019-10-22 基于集成学习的强对流天气持续时间预报方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911003227.0A CN110794485A (zh) 2019-10-22 2019-10-22 基于集成学习的强对流天气持续时间预报方法

Publications (1)

Publication Number Publication Date
CN110794485A true CN110794485A (zh) 2020-02-14

Family

ID=69439578

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911003227.0A Pending CN110794485A (zh) 2019-10-22 2019-10-22 基于集成学习的强对流天气持续时间预报方法

Country Status (1)

Country Link
CN (1) CN110794485A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112698428A (zh) * 2021-03-24 2021-04-23 成都信息工程大学 西南地区降水延伸期综合预报信息处理方法、处理***
CN113158578A (zh) * 2021-05-06 2021-07-23 北京邮电大学 基于机器学习的海洋低空波导预测方法
CN113341419A (zh) * 2021-05-25 2021-09-03 成都信息工程大学 基于VAN-ConvLSTM的天气外推方法及***
CN113552655A (zh) * 2021-09-18 2021-10-26 成都信息工程大学 交替切换连续工作露-霜点仪及露-霜点连续测量方法
CN114280696A (zh) * 2021-12-23 2022-04-05 无锡九方科技有限公司 一种海雾等级智能预报方法及***

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105182450A (zh) * 2015-10-15 2015-12-23 成都信息工程大学 一种强对流天气短时预警***
CN108375808A (zh) * 2018-03-12 2018-08-07 南京恩瑞特实业有限公司 Nriet基于机器学习的大雾预报方法
CN108475393A (zh) * 2016-01-27 2018-08-31 华为技术有限公司 通过合成特征和梯度提升决策树进行预测的***和方法
CN109300174A (zh) * 2018-11-27 2019-02-01 杨波 一种强对流天气预报分析***
US20190158011A1 (en) * 2016-05-11 2019-05-23 Commonwealth Scientific And Industrial Research Organisation Solar power forecasting
CN109814175A (zh) * 2019-02-14 2019-05-28 浙江省气象台 一种基于卫星的强对流监测方法及其应用
CN110135654A (zh) * 2019-05-24 2019-08-16 北京百度网讯科技有限公司 用于预测强对流天气的方法和装置
CN110346844A (zh) * 2019-07-15 2019-10-18 南京恩瑞特实业有限公司 Nriet基于云分类和机器学习的定量降水估测方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105182450A (zh) * 2015-10-15 2015-12-23 成都信息工程大学 一种强对流天气短时预警***
CN108475393A (zh) * 2016-01-27 2018-08-31 华为技术有限公司 通过合成特征和梯度提升决策树进行预测的***和方法
US20190158011A1 (en) * 2016-05-11 2019-05-23 Commonwealth Scientific And Industrial Research Organisation Solar power forecasting
CN108375808A (zh) * 2018-03-12 2018-08-07 南京恩瑞特实业有限公司 Nriet基于机器学习的大雾预报方法
CN109300174A (zh) * 2018-11-27 2019-02-01 杨波 一种强对流天气预报分析***
CN109814175A (zh) * 2019-02-14 2019-05-28 浙江省气象台 一种基于卫星的强对流监测方法及其应用
CN110135654A (zh) * 2019-05-24 2019-08-16 北京百度网讯科技有限公司 用于预测强对流天气的方法和装置
CN110346844A (zh) * 2019-07-15 2019-10-18 南京恩瑞特实业有限公司 Nriet基于云分类和机器学习的定量降水估测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李文娟 等: "基于数值预报和随机森林算法的强对流天气分类预报技术", 《气象》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112698428A (zh) * 2021-03-24 2021-04-23 成都信息工程大学 西南地区降水延伸期综合预报信息处理方法、处理***
CN113158578A (zh) * 2021-05-06 2021-07-23 北京邮电大学 基于机器学习的海洋低空波导预测方法
CN113341419A (zh) * 2021-05-25 2021-09-03 成都信息工程大学 基于VAN-ConvLSTM的天气外推方法及***
CN113552655A (zh) * 2021-09-18 2021-10-26 成都信息工程大学 交替切换连续工作露-霜点仪及露-霜点连续测量方法
CN114280696A (zh) * 2021-12-23 2022-04-05 无锡九方科技有限公司 一种海雾等级智能预报方法及***

Similar Documents

Publication Publication Date Title
Ferreira et al. Estimation of reference evapotranspiration in Brazil with limited meteorological data using ANN and SVM–A new approach
CN110794485A (zh) 基于集成学习的强对流天气持续时间预报方法
CN115600932B (zh) 一种基于大数据的文物储藏环境异常评估方法
Song et al. Fuzzy clustering-based adaptive regression for drifting data streams
CN112288164B (zh) 一种计及空间相关性和修正数值天气预报的风功率组合预测方法
CN111753893A (zh) 一种基于聚类和深度学习的风电机组功率集群预测方法
CN108898251A (zh) 考虑气象相似性和功率波动的海上风电场功率预测方法
CN113269365B (zh) 一种基于麻雀优化算法的短期空调负荷预测方法及***
CN109143408B (zh) 基于mlp的动态区域联合短时降水预报方法
CN109146192B (zh) 一种考虑风电机组运行工况的风电功率预测方法
CN111882128B (zh) 基于tcn的汛期气候趋势预测方法
CN112527037A (zh) 一种具有环境因子预测功能的温室环境调控方法和***
Mantri et al. Weather prediction and classification using neural networks and k-nearest neighbors
CN113095547B (zh) 一种基于gra-lstm-ice模型的短期风功率预测方法
Bhardwaj et al. Weather forecasting using soft computing techniques
CN114897204A (zh) 一种海上风电场短期风速预测方法和装置
CN114066070A (zh) 基于人工智能和数值计算的天气预报方法
Jaiswal et al. A stacking ensemble learning model for rainfall prediction based on Indian climate
CN115907204A (zh) 麻雀搜索算法优化bp神经网络的林木蒸腾耗水预测方法
CN113723670B (zh) 变时间窗口的光伏发电功率短期预测方法
Saha et al. Fuzzy Clustering‐Based Ensemble Approach to Predicting Indian Monsoon
CN107977727B (zh) 一种基于社会发展和气候因素预测光缆网阻断概率的方法
CN115907189A (zh) 基于混合模型的大风预报订正方法
CN115392714A (zh) 一种基于fassa-svm的输电线路故障评估方法
CN115345245A (zh) 一种基于随机森林和迁移学习的热带气旋快速加强预报方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200214

RJ01 Rejection of invention patent application after publication