CN114548595A - 基于注意力机制的强对流天气物理特征量预测方法及*** - Google Patents

基于注意力机制的强对流天气物理特征量预测方法及*** Download PDF

Info

Publication number
CN114548595A
CN114548595A CN202210202985.0A CN202210202985A CN114548595A CN 114548595 A CN114548595 A CN 114548595A CN 202210202985 A CN202210202985 A CN 202210202985A CN 114548595 A CN114548595 A CN 114548595A
Authority
CN
China
Prior art keywords
weather
data
strong convection
model
longitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210202985.0A
Other languages
English (en)
Inventor
文立玉
罗飞
廖文龙
舒红平
卫霄飞
唐正全
曹亮
刘魁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu University of Information Technology
Original Assignee
Chengdu University of Information Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu University of Information Technology filed Critical Chengdu University of Information Technology
Priority to CN202210202985.0A priority Critical patent/CN114548595A/zh
Publication of CN114548595A publication Critical patent/CN114548595A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01WMETEOROLOGY
    • G01W1/00Meteorology
    • G01W1/10Devices for predicting weather conditions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Marketing (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Computational Linguistics (AREA)
  • General Business, Economics & Management (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Environmental & Geological Engineering (AREA)
  • Primary Health Care (AREA)
  • Atmospheric Sciences (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Ecology (AREA)
  • Environmental Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于注意力机制的强对流天气物理特征量预测方法及***,其中方法主要体现在搭建模型,所述模型包括注意力机制模块、编码模块以及解码模块,当输入数据进入到所述模型时,输入数据经过所述注意力机制模块,根据上一次的隐藏状态预测当前输入结果,将当前输入结果和当前输入数据叠加在一起并经过解码编码模块进行编码形成当前隐藏状态,将历史隐藏状态和当前隐藏状态相加后,通过所述解码模块解码后进行卷积生成预测结果。本发明有效解决了多维度、多输入的时空序列预测问题。

Description

基于注意力机制的强对流天气物理特征量预测方法及***
技术领域
本发明涉及气象技术领域,具体的说,涉及一种基于注意力机制的强对流天气物理特征量预测方法及***。
背景技术
自从人类诞生以来,天气就影响着人们的日常生活。天气塑造了各种大气事件,并对农业、交通、旅游、航空等现实生产生活***产生“雪球效应”,在这一领域中,数据科学家试图预测天气***的下一个状态,随着时空序列(spatio-temporalseris)模型的成功,业界为天气数值预报(NWP)创建了新的解决方案,与传统方法相比,这些解决方案具有明显的优势。与传统的数值天气预报的物理模型相比,深度学习模型可以在接收数据的几分钟内提供结果,利用多年采集的大量历史数据,并使用成本较低的模型进行准确预测。在众多大气事件中强对流天气对人类社会的影响最大,强对流天气是空气强烈垂直运动而导致出的天气现象,强对流天气(SCW)通常包括暴风雨、闪电、冰雹、对流阵风、短时强降雨、***,其对世界大部分地区的生命和财产构成严重威胁。由于小尺度的对流***快速变化并与环境进行复杂的相互作用,预测强对流天气的物理参数仍然是当今业务气象领域天气数值预报任务下的一个具有挑战性且有重大意义的问题。强对流的物理特征包含位势高度(Geopotential)、温度(Temperature)、风的u分量(U-wind)、风的v分量(V-wind)、相对湿度(Relativehumidity)、比湿(Specifichumidity)、垂直速度(Verticalvelocity)、涡度(Vorticity)、势涡度(Potentialvorticity)、比云液态含水量(Specificcloudliquidwatercontent)等。
强对流天气物理特征量的预测问题是一个多时间、多空间的序列预测问题(以下简称时空序列预测)。在多时间序列领域,经典的机器学***稳时间序列数据的一个更具挑战性的任务中,还可以结合统计方法和深度学习模型来预测M4数据集。此外,随着时间序列预测新方法的发展,人们可以将多时间序列与注意机制相结合,或在时间上进行扩张的随机卷积,以产生准确的长期预测。然而,所有这些方法都集中在单一目标序列的下一个值的预测上。例如,使用多个输入序列的协变量来预测多个时间序列。然而,在时空序列预测中,有多个具有时空协方差的时空协方差需要预测。
此外,以前关于时空序列的研究中,包括ConvLSTM在内,没有利用天气的数字数据集,如卫星图像、数值和气象站的观测。这些工作都集中在降水预测上。降水预测旨在准确、及时地预测相对较短时期内所在地区的降雨强度。输入和输出是一系列的雷达图像,它本质是解决了一个图像转换问题,而不是一个时空序列预测问题,它集中于一个数据源。然而,天气是一个受许多参数影响的混沌***,如植被、地理轮廓和人为因素。因此,更少的信息数量并不足以建模这种混沌行为。
天气数值预报问题属于多时空序列预测问题。在预测网络中引入ConvLSTM模型,该网络由一个编码器和一个由堆叠的ConvLSTM构建的解码器组成。该模型可以捕捉时空协方差矩阵,并在Moving-MNIST数据集和预测一个区域的降雨强度方面表现出很高的性能。此外,现有技术中还使用了这种架构来跟踪飓风。后来,现有技术中引入了轨迹门控递归单元(Traj-GRU)来学习输入雷达图像之间的位置不变运动,显示出更高的性能。然而,现有技术中提出的网络架构必须采用一维张量来预测一维输出。此外,现有技术中通过下采样和TrajGRU单元与输出卷积之间的上采样层改进了预测体系结构,忽略了多维输入问题。
注意力机制(AttentionMechanism)在深度学习中可谓发展迅猛,尤其是近几年,随着它在自然语言处理、语音识别、计算机视觉等领域的广泛应用,更是引起大家的高度关注。注意力机制源于对人类视觉的研究,是一种人类不可或缺的复杂认知功能,人具有关注一些信息的的同时忽略其他信息的选择能力。注意力机制符合人类看图片的逻辑,当我们看到一张图片时,往往没有看清图片的全部内容,而是将注意力集中在图片的某个重要部分。重点关注部分,就是一般所说的注意力集中部分,而对这一部分投入更多的注意力资源,以获取更多需要关注的目标细节信息,忽略其他无用信息。这种利用有限的注意力资源从大量信息中筛选出高价值信息的手段应用中深度学习中,可以极大的提升自然语言处理、图像处理的效率和性能。
为了实现人类动作识别,现有技术开发了具有完全连接的NNs和LSTMs的时空注意机制。例如,在时间序列预测中实现了一种双重注意机制。又有技术实现了一种多层次的注意机制,融合辅助信息和多个地理感觉时间序列数据来预测空气质量。对于流量预测,有人实现了一种对LSTM输出的关注机制,它接受了过去不同时期的输入。虽然这些工作成功地实现了注意机制,但输入是单个或多个时间序列,而不是三维张量。有人实现了一种注意机制来进一步改进ConvLSTM,它以三维张量作为输入;然而,性能几乎没有提高。最近,CNN关注LSTM(Conv+LSTM)与ConvLSTM在时间展开的架构和时间连接体系结构。他们根据不同的输入观察到损失的变化,例如,特征、解释模型决策的位置。与Conv+LSTM相比,ConvLSTM表现出高性能。然而,他们只为Conv+LSTM模型获得了可解释的结果,它们的解释是在特征和位置层面上,而不是在模型的激活上。
因此,现有技术需要一种提高预测准确性还能融合大气中自然流动的方法来解决强对流天气的物理特征量预测问题,并且需要一种可以充分融合多种天气参数、更好的学习空间相关性来实现气象时空序列预测的方法。
发明内容
本发明针对现有技术存在的不足,提供了基于注意力机制的强对流天气物理特征量预测方法及***。本发明通过加入更多的通道数(大气参数作为辅助信息)以优化预测结果,引入了基于注意力的递归网络结构,用于时空序列,解决多维度、多输入的时空序列预测问题。
本发明的具体技术方案如下:
根据本发明的第一技术方案,提供了一种基于注意力机制的强对流天气物理特征量预测方法,包括:获取气象参数文件;获取筛选出强对流天气的历史记录;提取并融合数据,制作数据集;搭建模型,所述模型包括注意力机制模块、编码模块以及解码模块,当输入数据进入到所述模型时,输入数据经过所述注意力机制模块,根据上一次的隐藏状态预测当前输入结果,将当前输入结果和当前输入数据叠加在一起并经过所述编码模块进行编码形成当前隐藏状态,将历史隐藏状态和当前隐藏状态相加后,通过所述解码模块解码后进行卷积生成预测结果;基于所述数据集,利用配置好的参数文件对所述模型进行训练,当loss值连续多次不再下降后停止训练;基于所述模型,预测强对流各天气因子的下一次观测数值。
根据本发明的第二技术方案,提供了一种基于注意力机制的强对流天气物理特征量预测***,包括处理器,所述处理器被配置为:获取气象参数文获取筛选出强对流天气的历史记录;提取并融合数据,制作数据集;搭建模型,搭建的模型包括注意力机制模块、编码模块以及解码模块,当输入数据进入到所述模型时,输入数据经过所述注意力机制模块,根据上一次的隐藏状态预测当前输入结果,将当前输入结果和当前输入数据叠加在一起并经过所述编码模块进行编码形成当前隐藏状态,将历史隐藏状态和当前隐藏状态相加后,通过所述解码模块解码后进行卷积生成预测结果;基于所述数据集,利用配置好的参数文件对所述模型进行训练,当loss值连续多次不再下降后停止训练;基于所述模型,预测强对流各天气因子的下一次观测数值。
有益效果在于:
本发明能够解决多维度、多输入的时空序列预测问题,通过加入更多的通道数(大气参数作为辅助信息)以优化预测结果,引入了基于注意力的递归模型,用于时空序列,其中注意力机制模块的卷积操作和解码编码模块作为记忆单元。基于此,本发明可以进行长期预测,并能够更好地学习空间相关性,同时允许使用多个辅助信息,并产生具有高可解释性的精细预测,进而有效解决强对流参数的预测。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
图1为根据本发明实施例的一种基于注意力机制的强对流天气物理特征量预测方法的流程图;
图2为根据本发明实施例的适用于强对流天气的物理特征图;
图3a为根据本发明实施例的温度可视化示意图,其中,横轴表示经度,纵轴表示维度。
图3b为根据本发明实施例的散度可视化示意图;其中,横轴表示经度,纵轴表示维度;。
图3c为根据本发明实施例的位势涡量可视化示意图;其中,横轴表示经度,纵轴表示维度;。
图3d为根据本发明实施例的位势可视化示意图;其中,横轴表示经度,纵轴表示维度;。
图3e为根据本发明实施例的气压层温度可视化示意图;其中,横轴表示经度,纵轴表示维度;。
图4为根据本发明实施例的不同强对流天气的分布情况图。
图5为根据本发明实施例的上下文配对机制原理示意图。
图6为根据本发明实施例的时空序列示意图。
图7为根据本发明实施例的注意力机制的原理示意图。
图8为根据本发明实施例的一种基于注意力机制的强对流天气物理特征量预测方法所预测得到的大气流动示意图。
图9为根据本发明实施例的基于注意力机制的强对流天气物理特征量预测***的硬件图。
具体实施方式
下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。
另外,在本发明中如涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定发明。
现在结合说明书附图对本发明做进一步的说明。
图1示出了根据本发明实施例的一种基于注意力机制的强对流天气物理特征量预测方法的流程图。如图1所示,本发明实施例提供了一种基于注意力机制的强对流天气物理特征量预测方法,该方法始于步骤S100,获取气象参数文件。可以理解的,气象参数文件是由若干气象参数组成的。注意,本文中所述的气象参考可以是任一格式,具体以实际需要进行选择。例如,可以是netCDF格式或GRIB2格式或MICAPS4格式等等。本发明实施例对此不作具体限制。
在一些实施例中,基于历史数据库,以预设周期获取若干气象参数,作为气象参数文件;其中,所述气象参数包括不同气压高度下的位势高度、温度、水平方向的风速分量、垂直方向的风速分量、相对湿度、比湿、垂直速度、涡度、势涡度、比云液态含水量。
示例性的,本发明实施例所用的为ECMWF所提供的ERA5数据,ERA5是过去4到7个10年全球气候和天气的第五代ECMWF再分析数据。目前的数据是从1950年开始的,分为1950-1978年和1979年以后的气候数据存储条目。ERA5取代了ERA-Interim再分析数据。ERA5提供大量大气、海浪和地表量的每小时估算值。为方便起见,已经预先计算了整体均值和散布。其基本产品包括:位势高度(Geopotential)、温度(Temperature)、风的u分量(U-wind)、风的v分量(V-wind)、相对湿度(Relativehumidity)、比湿(Specifichumidity)、垂直速度(Verticalvelocity)、涡度(Vorticity)、势涡度(Potentialvorticity)、比云液态含水量(Specificcloudliquidwatercontent)等。
其中,位势高度(Geopotential)参数是单位质量在特定位置相对于平均海平面的重力势能。这也是克服重力将单位质量从平均海平面提升到该位置所必须完成的工作量。位势高度可以通过将位势除以地球的重力加速度g(=9.80665m/s-2)来计算。位势高度在天气气象学(天气模式分析)中起着重要作用。在恒定压力水平(例如300、500或850hPa)绘制的位势高度图可用于识别天气***,例如气旋、反气旋、槽和脊。在地球表面,该参数显示地表的位势(高度)的变化,通常被称为地形。
势涡度(Potentialvorticity)是空气在大气中旋转的能力的量度。如果我们忽略加热和摩擦的影响,则在气团之后势涡度是守恒的。它用于寻找可能发生和发展大风暴的地方。潜在涡度在对流层顶上方强烈增加,因此,它也可用于与平流层和平流层-对流层交换有关的研究。当大气中的空气柱开始旋转时,就会形成大风暴。势涡度是根据大气中空气柱的风、温度和压力计算得出的。
相对湿度(Relativehumidity),该参数是水蒸气压力占空气饱和值的百分比(水蒸气开始凝结成液态水或沉积成冰的点)。对于超过0°C(273.15K)的温度,计算水的饱和度。在低于-23°C的温度下,计算冰上的饱和度。在-23°C和0°C之间,此参数是通过使用二次函数在冰值和水值之间进行插值来计算的。
比湿(Specifichumidity),该参数是每千克湿空气中的水蒸气质量。湿空气的总质量是干空气、水蒸气、云液、云冰、雨和降雪的总和。
垂直速度(Verticalvelocity),该参数是向上或向下方向的空气运动速度。ECMWF综合预报***(IFS)使用基于压力的垂直坐标系,压力随高度降低,因此垂直速度的负值表示向上运动。垂直速度对于了解大气的大规模动态非常有用,包括向上运动/上升(负值)和向下运动/下沉(正值)的区域。
涡度(Vorticity),该参数是空气在水平方向上围绕垂直轴相对于地球表面固定点旋转的量度。在天气***的尺度上,低谷(可能包括降雨的天气特征)与逆时针旋转(在北半球)相关,而脊(带来轻微或静止风的天气特征)与顺时针旋转相关。将地球自转的影响,即科里奥利参数,添加到相对涡度中会产生绝对涡度。
比云液态含水量(Specificcloudliquidwatercontent),由雨滴大小的大尺度云产生的大量水,因此可以作为降水落到地表。ECMWF综合预报***(IFS)中的云方案生成了大规模云。云图表示由于IFS在网格框或更大的空间尺度上直接预测的大气量(如压力、温度和湿度)的变化而导致的云和大尺度降水的形成和消散。该数量以每千克湿空气总质量的千克数表示。“潮湿空气的总质量”是干燥空气、水蒸气、云液、云冰、雨和降雪的总和。此参数表示网格框的平均值。云包含不同大小的水滴和冰粒的连续体。IFS云方案将其简化为表示许多离散的云滴/粒子,包括云水滴、雨滴、冰晶和雪(聚合冰晶)。在IFS中,液滴形成、相变和聚集的过程也得到了高度简化。
图2示出了根据本发明实施例的适用于强对流天气的物理特征图。如图2所示,在获取到netCDF格式存储的数据后进行读取并进行数据可视化,将时间戳转化为以公元纪年的表示方式,读取某一具体时间轴下对应地理范围内某一维度的物理参数,并用pyplot.colorbar展示出部分气象参数展示图。部分气象参数展示图如图3a-图3e所示。
在步骤S200,取筛选出强对流天气的历史记录。
在一些实施例中,筛选出的强对流天气的历史记录包括ID号、事件发生时间、修订时间、精度、纬度、强对流的天气类别。
其中,所述强对流的天气类别包括大风、破坏性闪电、冰雹、台风、大雪。
示例性的,本发明实施例所选取的历史记录为ESDW所提供的发生在法国境内的强对流天气的详细历史记录,具体包括以下基本数据项,ID号、事件发生时间、修订时间、精度、纬度、强对流的具体天气类别。如图4所示,本发明实施例筛选了2016-2018年在法国经常发生的强对流天气:大风、降雨、冰雹、台风、闪电,并统计出它们的发生次数。
在步骤S300,提取并融合数据,制作数据集.
本发明实施例为了保证所获取的数据集的正样本和负样本分布均匀,分别提取强对流天气数据和提取普通天气数据。
具体说来,提取强对流天气数据和提取普通天气数据;其中,强对流天气数据根据所述强对流天气的历史记录在所述气象参数文件中定位到该强对流事件所对应发生时段的所有天气参数,并根据该事件的经纬度坐标运用点扩散方法,将该点向外扩散形成第一经纬范围,基于所述第一经纬范围在气象参数文件中剪裁出对应的气象参数,作为所述数据集的正样本;
普通天气数据根据普通天气的历史记录在所述气象参数文件中定位到该普通事件所对应发生时段的所有天气参数,并根据该普通事件随机选择一个与所述第一经纬范围一样大的第二经纬范围,基于所述第二经纬范围在所述气象参数文件中剪裁出对应的气象参数,作为所述数据集的负样本。
在一些实施例中,所述第一经纬范围和所述第二经纬范围的大小可以为1.75°×1.75°。当然,本发明实施例仅仅是对经纬范围进行举例,对具体范围大小不作限定。
在选择1.75°×1.75°的情况下,从步骤S200中提供的CSV数据中取出一条数据,根据发生事件定位到相邻的两个时间戳,也就是将一次强对流事件用前后间隔一小时的两次观测数据表示,然后根据发生事件的经纬坐标,以此为中心,向外扩散形成1.75°×1.75°的经纬范围,换算成张量就是7×7的特征图,在参数文件中根据选取的预测数据,将多维特征图叠加在一起(stack)形成7×7×144的张量。
在步骤S400,搭建模型,所述模型包括注意力机制模块、编码模块以及解码模块,当输入数据进入到所述模型时,输入数据经过所述注意力机制模块,根据上一次的隐藏状态预测当前输入结果,将当前输入结果和当前输入数据叠加在一起并经过所述编码模块进行编码形成当前隐藏状态,将历史隐藏状态和当前隐藏状态相加后,通过所述解码模块解码后进行卷积生成预测结果。
示例性的,注意力机制模块的输入张量为B×T×m×n形式,隐藏状态为B×hidden×M×N的张量,经过融合输出的注意力权重矩阵大小为B×1×M×N。解码模块和编码模块可以参考ConvLSTM的实现方式,其中前向传播的输入张量为b×t×m×n×d,输出为b×t×m×n×d。
在一些实施例中,根据本发明实施例所搭建的模型包括:
上下文配对机制:本发明所提出的方法,用于将编码的顺序打乱后输入解码层,经实验验证该机制可以有效提高预测结果准确性,加速模型拟合的过程。
X:输入模型的训练数据(气象参数),t:下标,该数据代表对应t时间段的数据。
Y: 输入模型的标签数据(气象参数),t:下标,该数据代表对应t时间段的数据。
H: 编码层中的ConvLSTM输出的历史数据,又叫隐藏状态,下标t-1代表对应上一时间段的数据,上标k代表该数据的第k维度。
D: 解码层中的ConvLSTM输出的历史数据,下标t-1代表对应上一时间段的数据,上标k代表该数据的第k维度。
ConvLSTM: 模型的基本处理单元,主要采用卷积和LSTM算法获取短时记忆。
Conv2D: 在二维数据中进行卷机滤波操作,从而精简数据。
ReLU:线性整流函数,人工神经网络中常用的激活函数。
在该模型中,先输入上一步获取到的训练数据,假设是t时间段对应的气象参数Xt,然后使用本方法所提出的注意力机制方法,获得注意力矩阵A,将A与Xt相乘,可以理解为给训练数据进行加权,突出其中的流动信息,随后将相乘结果输入到编码层,其中的ConvLSTM会对数据的每一个维度进行编码并产生隐藏状态用于下一次计算,再接着把t时间段的标签数据以及经过本发明所提出的上下文配对机制计算得到的编码历史数据输入到解码层中,得到本次输入的编码数据,经过随后的Conv2D和ReLU操作得到本次输入的预测标签数据,该数据即为一次预测,可以输入到CNN网络中进行分类,也可以直接合并维度生成雷达发射预测图。
图5示出了根据本发明实施例的上下文配对机制原理示意图。可以理解的,上下配对机制可以携带上期记忆。如图5所示,图5中的H表示编码层中的ConvLSTM输出的历史数据,又叫隐藏状态,ConvLSTM具体指的是模型的基本处理单元,主要采用卷积和LSTM算法获取短时记忆。参数H的上标表示该数据的维度。例如H1表示该数据的第1维度,Hk表示该数据的第k维度,HK表示该数据的第K维度。参数D表示解码层中的ConvLSTM输出的历史数据,下标t-1代表对应上一时间段的数据,上标k代表该数据的第k维度。例如,
Figure 133170DEST_PATH_IMAGE002
表示上一时间段解码层中的ConvLSTM输出的第1维度的历史数据,
Figure 798638DEST_PATH_IMAGE004
表示上一时间段解码层中的ConvLSTM输出的第k维度的历史数据,
Figure 552967DEST_PATH_IMAGE006
表示上一时间段解码层中的ConvLSTM输出的第K维度的历史数据。因此,发明实施例可以基于上下文配对机制,整理先前所有的隐藏状态,并将其相加以携带长期的信赖信息,解码模块(decoder)根据上下文配对机制,将编码器生成的隐藏状态进一步解码,输入解码器后进一步进行卷积生成预测结果,基于预测出的物理特征预报数据,输入预先设计好的参数提取程序可以实现强对流天气特征参数的预测及气象参数预测图绘制。
示例性的,输入的数据,例如,可以是根据多次历史数据提取出位势高度(Geopotential)、温度(Temperature)、风的u分量(U-wind)、风的v分量(V-wind)、相对湿度(Relative humidity)、比湿(Specific humidity)、垂直速度(Vertical velocity)、涡度(Vorticity)、势涡度(Potential vorticity)、比云液态含水量(Specific cloud liquidwater content)等物理量,将这些天气物理量整理成
Figure 742509DEST_PATH_IMAGE008
的张量,本发明实施例在时空上将不同时刻的输入数据定义成多个时空序列
Figure 203577DEST_PATH_IMAGE010
,其中每个
Figure 820372DEST_PATH_IMAGE012
,M、N代表空间维度,T代表时间维度。图6示出了根据本发明实施例的时空序列示意图。最终模型输出的预测结果张量可以表示为
Figure 61997DEST_PATH_IMAGE014
,根据此模型输出的未来气象因子的预测结果进行相关数据提取操作就可实现强对流天气物理特征的预测。
图7示出了根据本发明实施例的注意力机制的原理示意图。如图7所示,本发明实施例中的模型的核心部分是注意力机制模块。关于注意力机制模块(Attention),其中X:输入模型的训练数据(气象参数),t:下标,该数据代表对应t时间段的数据。图7中的X1表示第一维度的训练数据,X i 表示第i维度的训练数据,X l 表示第l维度的训练数据。H: 编码层中的ConvLSTM输出的历史数据,又叫隐藏状态,下标t-1代表对应上一时间段的数据,上标k代表该数据的第k维度。ConvLSTM具体指的是模型的基本处理单元,主要采用卷积和LSTM算法获取短时记忆。图7中的
Figure 274804DEST_PATH_IMAGE016
表示上一时间段编码层中的ConvLSTM输出第一维度的历史数据。tanh:双曲正切函数;Conv2D:在二维数据中进行卷机滤波操作,从而精简数据;softmax:softmax逻辑回归模型是logistic回归模型在多分类问题上的推广。A:经过该步计算得到的注意力矩阵。基于注意力机制模块,可以计算注意力权重At。当运用注意力机制原理后,可以提高整体预测的准确性。图8示出了根据本发明实施例的所预测得到的大气流动示意图。如图8所示,图8中的横纵轴表示位置(单位:km),用于可视化大气的流动,因此本发明实施例可以很好的模拟自然界中的大气流动。
因此,在步骤S500,基于所述数据集,利用配置好的参数文件对所述模型进行训练,当loss值连续多次不再下降后停止训练并保存权重文件。其中,配置好模型的参数文件,包括全局开始日期(global_start_date)、全局结束日期(global_end_date)、数据步长、数据间隔时长、训练集验证集测试集的比例、下采样的模式(可选selective、average)、数据集 所包含的物理特征,需要预测的物理特征、batch-size的大小等。
最后,在步骤S600基于所述模型,预测强对流各天气因子的下一次观测数值。具体说来,预测各天气因子的下一次观测数值。就是将最新一次观测的数据连同先前的隐藏状态,经过所提出模型的encoder-decoder结构,计算得出各个天气因子的预测结果将预测结果划分成两大部分,将Geopotential、Temperature、U-wind、V-wind、Relative humidity、Specific humidity等作为一部分输入预先训练的六层cnn中进行强对流天气类型的分类,将需要预测个维度对应的数据进行可视化形成的预测图,用以辅助气象工作者的判断。
图9示出了根据本发明实施例的基于注意力机制的强对流天气物理特征量预测***的硬件图。如图9所示,本发明实施例还提供了一种基于注意力机制的强对流天气物理特征量预测***。该***700包括处理器701,所述处理器701被配置为:获取气象参数文件;获取筛选出强对流天气的历史记录;提取并融合数据,制作数据集;搭建模型,所述模型包括注意力机制模块、编码模块以及解码模块,当输入数据进入到所述模型时,输入数据经过所述注意力机制模块,根据上一次的隐藏状态预测当前输入结果,将当前输入结果和当前输入数据叠加在一起并经过所述解码编码模块进行编码形成当前隐藏状态,将历史隐藏状态和当前隐藏状态相加后,通过所述解码模块解码后进行卷积生成预测结果;基于所述数据集,利用配置好的参数文件对所述模型进行训练,当loss值连续多次不再下降后停止训练;基于所述模型,预测强对流各天气因子的下一次观测数值。
处理器701可以是包括一个以上通用处理设备的处理设备,诸如微处理器、中央处理单元(CPU)、图形处理单元(GPU)等。更具体地,处理器701可以是复杂指令集计算(CISC)微处理器、精简指令集计算(RISC)微处理器、超长指令字(VLIW)微处理器、运行其他指令集的处理器或运行指令集的组合的处理器。处理器701还可以是一个以上专用处理设备,诸如专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP)、片上***(SoC)等。
在一些实施例中,所述处理器701还可以被进一步配置为:提取强对流天气数据和提取普通天气数据;其中,强对流天气数据根据所述强对流天气的历史记录在所述气象参数文件中定位到该强对流事件所对应发生时段的所有天气参数,并根据该事件的经纬度坐标运用点扩散方法,将该点向外扩散形成第一经纬范围,基于所述第一经纬范围在气象参数文件中剪裁出对应的气象参数,作为所述数据集的正样本;普通天气数据根据普通天气的历史记录在所述气象参数文件中定位到该普通事件所对应发生时段的所有天气参数,并根据该普通事件随机选择一个与所述第一经纬范围一样大的第二经纬范围,基于所述第二经纬范围在所述气象参数文件中剪裁出对应的气象参数,作为所述数据集的负样本。
在一些实施例中,所述第一经纬范围的大小为1.75°×1.75°。
在一些实施例中,所述处理器701还可以被进一步配置为:将最新一次观测强对流天气的数据作为输入数据输入模型,得出预测结果。
在一些实施例中,所述配置好的参数文件包括全局开始日期、全局结束日期、数据步长、数据间隔时长、训练集验证集测试集的比例、下采样的模式、数据集所包含的物理特征,需要预测的物理特征。
在一些实施例中,基于历史数据库,以预设周期获取若干气象参数,作为气象参数文件;其中,所述气象参数包括不同气压高度下的位势高度、温度、水平方向的风速分量、垂直方向的风速分量、相对湿度、比湿、垂直速度、涡度、势涡度、比云液态含水量。
在一些实施例中,筛选出的强对流天气的历史记录包括ID号、事件发生时间、修订时间、精度、纬度、强对流的天气类别。
在一些实施例中,所述强对流的天气类别包括大风、破坏性闪电、冰雹、台风、大雪。
以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims (10)

1.基于注意力机制的强对流天气物理特征量预测方法,其特征在于,包括以下步骤:
获取气象参数文件;
获取筛选出强对流天气的历史记录;
提取并融合数据,制作数据集;
搭建模型,所述模型包括注意力机制模块、编码模块以及解码模块,当输入数据进入到所述模型时,输入数据经过所述注意力机制模块,根据上一次的隐藏状态预测当前输入结果,将当前输入结果和当前输入数据叠加在一起并经过所述编码模块进行编码形成当前隐藏状态,将历史隐藏状态和当前隐藏状态相加后,通过所述解码模块解码后进行卷积生成预测结果;
基于所述数据集,利用配置好的参数文件对所述模型进行训练,当loss值连续多次不再下降后停止训练;
基于所述模型,预测强对流各天气因子的下一次观测数值。
2.按照权利要求1所述的方法,其特征在于,所述提取并融合数据,制作数据集,包括以下步骤:
提取强对流天气数据和提取普通天气数据;其中,强对流天气数据根据所述强对流天气的历史记录在所述气象参数文件中定位到该强对流事件所对应发生时段的所有天气参数,并根据该事件的经纬度坐标运用点扩散方法,将所述事件的经纬度坐标点向外扩散形成第一经纬范围,基于所述第一经纬范围在气象参数文件中剪裁出对应的气象参数,作为所述数据集的正样本;
普通天气数据根据普通天气的历史记录在所述气象参数文件中定位到该普通事件所对应发生时段的所有天气参数,并根据该普通事件随机选择一个与所述第一经纬范围一样大的第二经纬范围,基于所述第二经纬范围在所述气象参数文件中剪裁出对应的气象参数,作为所述数据集的负样本。
3.按照权利要求2所述的方法,其特征在于,所述第一经纬范围的大小为1.75°×1.75°。
4.按照权利要求1所述的方法,其特征在于,基于所述模型,预测强对流各天气因子的下一次观测数值,包括以下步骤:
将最新一次观测强对流天气的数据作为输入数据输入模型,得出预测结果。
5.按照权利要求1所述的方法,其特征在于,所述配置好的参数文件包括全局开始日期、全局结束日期、数据步长、数据间隔时长、训练集验证集测试集的比例、下采样的模式、数据集所包含的物理特征,需要预测的物理特征。
6.按照权利要求1所述的方法,其特征在于,所述获取气象参数文件,包括以下步骤:
基于历史数据库,以预设周期获取若干气象参数,作为气象参数文件;
其中,所述气象参数包括不同气压高度下的位势高度、温度、水平方向的风速分量、垂直方向的风速分量、相对湿度、比湿、垂直速度、涡度、势涡度、比云液态含水量。
7.按照权利要求1所述的方法,其特征在于,筛选出的强对流天气的历史记录包括ID号、事件发生时间、修订时间、精度、纬度、强对流的天气类别。
8.按照权利要求7所述的方法,其特征在于,将历史隐藏状态和当前隐藏状态相加后,通过所述解码模块解码后进行卷积生成预测结果,包括以下步骤:
基于上下文配对机制,整理先前所有的隐藏状态,并将其与当前隐藏状态相加以携带长期的信赖信息,解码模块根据上下文配对机制,将编码模块生成的隐藏状态进一步解码,输入解码器后进一步进行卷积生成预测结果。
9.基于注意力机制的强对流天气物理特征量预测***,其特征在于,包括处理器,所述处理器被配置为:
获取气象参数文件;
获取筛选出强对流天气的历史记录;
提取并融合数据,制作数据集;
搭建模型,搭建的模型包括注意力机制模块、编码模块以及解码模块,当输入数据进入到所述模型时,输入数据经过所述注意力机制模块,根据上一次的隐藏状态预测当前输入结果,将当前输入结果和当前输入数据叠加在一起并经过所述编码模块进行编码形成当前隐藏状态,将历史隐藏状态和当前隐藏状态相加后,通过所述解码模块解码后进行卷积生成预测结果;
基于所述数据集,利用配置好的参数文件对所述模型进行训练,当loss值连续多次不再下降后停止训练;
基于所述模型,预测强对流各天气因子的下一次观测数值。
10.按照权利要求9所述的***,其特征在于,所述处理器被配置为:
提取强对流天气数据和提取普通天气数据;其中,强对流天气数据根据所述强对流天气的历史记录在所述气象参数文件中定位到该强对流事件所对应发生时段的所有天气参数,并根据该事件的经纬度坐标运用点扩散方法,将该点向外扩散形成第一经纬范围,基于所述第一经纬范围在气象参数文件中剪裁出对应的气象参数,作为所述数据集的正样本;
普通天气数据根据普通天气的历史记录在所述气象参数文件中定位到该普通事件所对应发生时段的所有天气参数,并根据该普通事件随机选择一个与所述第一经纬范围一样大的第二经纬范围,基于所述第二经纬范围在所述气象参数文件中剪裁出对应的气象参数,作为所述数据集的负样本。
CN202210202985.0A 2022-03-03 2022-03-03 基于注意力机制的强对流天气物理特征量预测方法及*** Pending CN114548595A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210202985.0A CN114548595A (zh) 2022-03-03 2022-03-03 基于注意力机制的强对流天气物理特征量预测方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210202985.0A CN114548595A (zh) 2022-03-03 2022-03-03 基于注意力机制的强对流天气物理特征量预测方法及***

Publications (1)

Publication Number Publication Date
CN114548595A true CN114548595A (zh) 2022-05-27

Family

ID=81661100

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210202985.0A Pending CN114548595A (zh) 2022-03-03 2022-03-03 基于注意力机制的强对流天气物理特征量预测方法及***

Country Status (1)

Country Link
CN (1) CN114548595A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116629142A (zh) * 2023-07-24 2023-08-22 合肥工业大学 基于transformer机制的雷电定位轨迹预测方法、***和存储介质
CN117650834A (zh) * 2024-01-29 2024-03-05 南京理工大学 基于知识蒸馏的天地一体化网络时空流量预测方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116629142A (zh) * 2023-07-24 2023-08-22 合肥工业大学 基于transformer机制的雷电定位轨迹预测方法、***和存储介质
CN116629142B (zh) * 2023-07-24 2023-09-29 合肥工业大学 基于transformer机制的雷电定位轨迹预测方法和***
CN117650834A (zh) * 2024-01-29 2024-03-05 南京理工大学 基于知识蒸馏的天地一体化网络时空流量预测方法
CN117650834B (zh) * 2024-01-29 2024-04-12 南京理工大学 基于知识蒸馏的天地一体化网络时空流量预测方法

Similar Documents

Publication Publication Date Title
CN109902885B (zh) 基于深度学习混合cnn-lstm模型的台风预测方法
Ghimire et al. Self-adaptive differential evolutionary extreme learning machines for long-term solar radiation prediction with remotely-sensed MODIS satellite and Reanalysis atmospheric products in solar-rich cities
Carneiro et al. Review on photovoltaic power and solar resource forecasting: current status and trends
CN114548595A (zh) 基于注意力机制的强对流天气物理特征量预测方法及***
Dupuy et al. ARPEGE cloud cover forecast postprocessing with convolutional neural network
Sayeed et al. A deep convolutional neural network model for improving WRF simulations
Jonnalagadda et al. Forecasting atmospheric visibility using auto regressive recurrent neural network
CN113496310A (zh) 基于深度学习模型的大气污染物预测方法和***
CN117008217A (zh) 一种融合自注意力模块与Unet模型的短时强降水预报方法
Ali et al. Sea ice forecasting using attention-based ensemble LSTM
Zhou et al. Quantitative precipitation forecast experiment based on basic NWP variables using deep learning
Liu et al. A spatio-temporal modeling framework for weather radar image data in tropical Southeast Asia
Larraondo et al. Automating weather forecasts based on convolutional networks
Jena et al. Deep convolutional network based machine intelligence model for satellite cloud image classification
Pegion et al. Understanding predictability of daily southeast US precipitation using explainable machine learning
Socaci et al. XNow: A deep learning technique for nowcasting based on radar products’ values prediction
Kim et al. Improvement in forecasting short-term tropical cyclone intensity change and their rapid intensification using deep learning
Bose et al. Simulation of atlantic hurricane tracks and features: A deep learning approach
CN114355482B (zh) 基于光流和气象数值预报的强对流天气识别方法及***
Karpatne et al. Earth science applications of sensor data
Rae A modified supercell composite parameter for supercell thunderstorms over the Gauteng Province, South Africa
Chen et al. Aviation visibility forecasting by integrating Convolutional Neural Network and long short-term memory network
Wang et al. The prediction method of tropical cyclone intensity change based on deep learning
Lee et al. Enhancing tropical cyclone intensity forecasting with explainable deep learning integrating satellite observations and numerical model outputs
Zhu et al. Tropical Cyclones Intensity Prediction in the Western North Pacific Using Gradient Boosted Regression Tree Model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination