CN114819053B - 基于时空卷积lstm的平均波向预报偏差订正方法 - Google Patents

基于时空卷积lstm的平均波向预报偏差订正方法 Download PDF

Info

Publication number
CN114819053B
CN114819053B CN202210210019.3A CN202210210019A CN114819053B CN 114819053 B CN114819053 B CN 114819053B CN 202210210019 A CN202210210019 A CN 202210210019A CN 114819053 B CN114819053 B CN 114819053B
Authority
CN
China
Prior art keywords
data
time
forecast
wave direction
space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210210019.3A
Other languages
English (en)
Other versions
CN114819053A (zh
Inventor
朱俊星
汪祥
孔浩然
张卫民
王辉赞
陈妍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN202210210019.3A priority Critical patent/CN114819053B/zh
Publication of CN114819053A publication Critical patent/CN114819053A/zh
Application granted granted Critical
Publication of CN114819053B publication Critical patent/CN114819053B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Image Analysis (AREA)

Abstract

本发明属于数值预报领域,公开了时空卷积LSTM的平均波向预报偏差订正方法,选取预报数据,选取待订正地区的逐小时海浪预报数据资料作为模式数据样本;选取再分析格点数据资料,以再分析数据作为真实值,选取待检测订正地区逐小时平均波向再分析数据;数据匹配,使得预报数据得以插值匹配到再分析数据的格网点上,此外,预报数据与再分析数据在时间尺度上匹配,最终两数据在空间、时间层面上实现匹配;构建偏差订正训练集;搭建基于层自注意力记忆的时空卷积LSTM偏差订正模型的多层网络结构。本发明采用面对面的区域订正方法,对时空特征进行了建模,克服了传统数值订正方法对于方位角的局限性,使得偏差订正更准确。

Description

基于时空卷积LSTM的平均波向预报偏差订正方法
技术领域
本发明属于平均波向预报偏差订正技术领域,尤其涉及基于时空卷积 LSTM的平均波向预报偏差订正方法。
背景技术
已有的基于机器学习的波向预测模型通常采用点对点方式(树模型、多层感知机等)或面对点方式(残差卷积神经网络),而难以针对历史时刻时空信息以及其他海浪、气象特征建模;并且波向预测往往将其作为数值而忽略了其方位角特性,为解决方位角以及历史时刻时空特征建模问题,需要构建一种能更好融合时空特征、其他特征,同时考虑波向方向角特性的机器学习模型;在一些实际应用中以再分析数据作为真实值,而再分析数据并无法获取到最新的数据,譬如采用ERA-5数据,只能获取到最新前5天的再分析数据,无法满足实际应用需求。
发明内容
有鉴于此,本发明提出了基于时空卷积LSTM的平均波向预报偏差订正方法,包括以下步骤:
S1:选取预报数据,选取待订正地区的逐小时海浪预报数据资料作为模式数据样本;
S2:选取再分析格点数据资料,以再分析数据作为真实值,选取待检测订正地区逐小时平均波向再分析数据;
S3:数据匹配,为使所述预报数据与所述再分析数据匹配,若所述预报数据为不规则格网数据,则对所述预报数据进行反距离权重插值,使得预报数据得以插值匹配到再分析数据的格网点上,此外,预报数据与再分析数据在时间尺度上匹配,最终两数据在空间、时间层面上实现匹配;
S4:构建偏差订正训练集;
S5:搭建基于层自注意力记忆的时空卷积LSTM偏差订正模型的多层网络结构,包括以下三部分:
第一层:基于层自注意力机制的时空卷积LSTM层,采用3层基于自注意力机制的时空卷积LSTM模块,时序上选择预报与再分析数据时空特征矩阵作为输入;
第二层:通道卷积融合层,将未来时刻预报数据进行特征选择,之后将特征选择后的预报数据与144小时前再分析数据平均波向以及预报和再分析数据波向真实角度差拼接,之后与基于层自注意力机制的时空卷积LSTM的输出,进行通道合并,之后将融合后的数据进行1×1通道卷积融合,此时通道卷积的输出为模型预测的预报与再分析波向真实角度差;
第三层:偏差订正层,将模型预测的波向真实角度差,与未来时刻的预报数据平均波向相加,生成订正后的平均波向数据。
进一步的,所述构建偏差订正训练集包括:
求取预报数据与再分析数据平均波向真实角度差,此外,将时间上连续的再分析数据144小时之前平均波向也作为训练集的时序特征,最终将上述数据在空间上转换成二维图像形式的数据,以构建空间层面匹配、时间层面连续的偏差订正训练集,包括逐小时预报数据、逐小时再分析数据平均波向、逐小时预报数据与再分析数据真实角度差、逐小时再分析数据前144小时平均波向。
进一步的,所述时空卷积LSTM中采用3*3大小的卷积核进行空间特征提取,所述3层基于层自注意力机制的时空卷积LSTM隐藏层分别为32、32、32,自注意力机制的隐藏层为12。
进一步的,所述真实角度差的计算公式为:
θbias=θfr-360×((θfr)>180)+360×((θfr)<-180)
其中θf表示预报数据平均波向,θr表示再分析数据平均波向。
进一步的,所述特征聚合的步骤包括如下:
在同一时间步中,模型层与层向上传播过程中,聚集的特征Z是Zh和Zm的融合,Zh和Zm分别对应于的特征;对于Zh而言,上一时间步的/>通过predRNN输出/>在SAM模块中被映射成不同的特征空间:
其中{Whq,Whk,Whv}是1×1卷积的权重集合,和C是通道个数,并且N为特征图长度与宽度乘积,应用矩阵乘积计算点与点间相似度分数:
第i点和第j点间相似度表示为其中/>和ht,j是维度为C×1的特征向量,然后沿列归一化相似度分数:
通过对每一位置加权聚合出Zh
Zh通过查询底层的通过权重Wmk和Wmv将底层的记忆1×1卷积映射到key和value/>接着通过query Qh和key Km之间的矩阵相乘来计算输入/>和记忆/>之间的相似性分数:
用于聚集特征的所有权重通过以下公式计算:
然后,通过对value Vm中的N个位置的加权和来计算Zm中第i个位置的“像素”:
其中,是记忆的第j列;最后,Z通过Wz[Zh;Zm]求得。
进一步的,通过门控机制自适应得更新上层记忆信息,使SAM能够在 predRNN模型基础上捕捉空间相关性与predRNN“之”字形记忆传递结构,这样记忆便可以把握全局的时空信息;通过聚合特征Z和输入来产生输入门i″t和输入融合门g″t,此外,忘记门被替换为1-i″t以减少参数,所述记忆更新过程的数学表示如下:
进一步的,通过输出门o″t点乘输出自注意力记忆模块的/>公式如下所示:
进一步的,在时序模型LSA-predRNN中,预报数据F和6天前同一时刻的再分析数据R以及F和R之间的真实波向角度差作为时序数据输入;此外,对于未来t时刻预报数据,对其进行特征选择以筛选特征,将筛选后的预报数据Ft与6天前同一时刻的再分析数据Rt-144以及Ft和Rt-144之间的真实波向角度差进行拼接,并与LSA-predRNN的输出进行通道卷积融合,将时序模型学习到的信息与未来时刻预报数据和相关的再分析数据的多个特征,进一步特征学习,以更好学习真实角度偏差。
进一步的,所述特征选择方式为包装法中不带启发式的后向搜索算法。
本发明的有益效果如下:
1)提出针对区域格网平均波向的机器学***均波向的偏差订正方法多针对于特定浮标点,而采用面对面的区域订正方法,使得偏差订正更具应用价值。
2)以深度学习图像识别模型为基础,提出了一种基于层自注意力机制的时空卷积LSTM方法,该方法对时空特征进行了建模,并且相比其他时序预测模型更具竞争力。
3)采用针对波向真实角度差的订正方法,通过先预测真实角度偏差,然后将角度差与预报数据相加完成偏差订正,克服了传统数值订正方法对于方位角的局限性。
4)采用通道卷积融合方法,通过考虑未来时刻预报数据,使得模型顾及时序数据同时,也考虑了其他海浪与气象特征。
5)将再分析数据也作为波向偏差订正的输入,将5天前同一时刻的再分析数据作为输入,使得输入的时序数据中,预报数据存在一种时序,再分析数据同样存在一种时序,提升了模型订正效果。
附图说明
图1本发明的波向真实角度差示意图;
图2本发明的LSA-predRNN时序模型图;
图3SAM自注意力记忆模块图;
图4本发明的时空卷积LSTM波向偏差订正方法架构图;
图5特征选择折线图。
具体实施方式
下面结合附图对本发明作进一步的说明,但不以任何方式对本发明加以限制,基于本发明教导所作的任何变换或替换,均属于本发明的保护范围。
本发明的目的是提供基于时空卷积LSTM的平均波向预报偏差订正方法。
为达到该目的,本发明采用的技术方案包括步骤如下:
一种基于层自注意力记忆的时空卷积LSTM波向预报偏差订正方法,其特征在于,包括以下步骤:
S1:选取预报数据资料,选取待订正地区的逐小时海浪预报数据资料作为模式数据样本;
S2:选取再分析格点数据资料,以再分析数据作为真实值,选取待检测订正地区逐小时平均波向再分析数据资料;
S3:数据匹配,为使预报数据与再分析数据匹配,若预报数据为不规则格网数据,则需要对预报数据进行反距离权重插值,使得预报数据得以插值匹配到再分析数据的格网点上,此外,预报数据与再分析数据在时间尺度上匹配,最终两数据在空间、时间层面上实现匹配;
S4:构建偏差订正训练集,求取预报数据与再分析数据平均波向真实角度差,此外,将时间上连续的再分析数据144小时(6天*24)之前平均波向也作为训练集的时序特征,最终将上述数据在空间上转换成二维图像形式的数据,以构建空间层面匹配、时间层面连续的偏差订正训练集,包括逐小时预报数据、逐小时再分析数据平均波向、逐小时预报数据与再分析数据真实角度差、逐小时再分析数据前144小时平均波向;
S5:搭建基于层自注意力记忆的时空卷积LSTM偏差订正模型,使用 Pytorch搭建多层网络结构,包括以下三部分:
第一层:基于层自注意力机制的时空卷积LSTM层,采用3层基于自注意力机制的时空卷积LSTM模块,时序上选择预报与再分析数据时空特征矩阵作为输入,即选择过去5个时刻预报数据以及120小时前的5个时刻再分析数据;时空卷积LSTM中采用3*3大小的卷积核进行空间特征提取,而3 层的基于层自注意力机制的时空卷积LSTM隐藏层分别为32、32、32,自注意力机制的隐藏层为12;
第二层:通道卷积融合层,将未来时刻预报数据进行特征选择,特征选择方式采用包装法中不带启发式的后向搜索算法,之后将特征选择后的预报数据与144小时前再分析数据平均波向以及预报和再分析数据波向真实角度差拼接,之后与基于层自注意力机制的时空卷积LSTM的输出,进行通道合并,之后将融合后的数据进行1×1通道卷积融合,此时通道卷积的输出为模型预测的预报与再分析波向真实角度差;
第三层:偏差订正层,将模型预测的波向真实角度差,与未来时刻的预报数据平均波向相加,以实现预报偏差订正;
为了使本发明的技术方案和有益效果更加清楚,以下结合实际例子,对本发明进行进一步描述。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
实施例1
本发明提出将6天前同一时刻再分析数据以及预报数据与6天前同一时刻再分析数据波向角度差作为模型输入的方法,例如,模型输入的历史时刻预报数据为Ft-5、Ft-4、Ft-3、Ft-2、Ft-1,而6天(6*24小时)前同一时刻分析数据Rt-149、Rt-148、Rt-147、Rt-146、Rt-145,以及历史时刻预报数据与6 天前同一时刻再分析数据平均波向真实角度差Rt-149-Ft-5、Rt-148-Ft-4… Rt-145-Ft-1也作为模型输入。
1.波向真实角度差
首先,针对方位角0~360°循环特性,将以往研究者对于数值订正问题转换为真实角度差的预测问题,之后再将角度差与预报数据波向相加以完成偏差订正;真实角度差θbias如图1所示,其中θf表示预报数据平均波向,θr表示再分析数据平均波向,最后将真实角度差与预报数据相加,实现偏差订正,真实角度差公式为:
θbias=θfr-360×((θfr)>180)+360×((θfr)< -180) (1)
2.基于自注意力机制的时空卷积LSTM模型
针对时空特征建模,借鉴图像识别研究,将空间特征矩阵转化为二维图像数值,提出一种基于层自注意力机制的时空卷积LSTM偏差订正方法。
LSTM是一种循环神经网络(Recurrent neural network,缩写为RNN),以序列数据为输入,在序列的演进方向进行递归且所有节点(循环单元)按链式连接的递归神经网络。
在predRNN结构中,记忆模块未充分表达层与层之间的空间记忆和不同时间步之间的“之”字形时间记忆传递关系,因此本发明在predRNN基础上,提出了一种基于层自注意力机制的时空LSTM(LSA-predRNN)用于本次偏差订正发明,如图2和图3所示,空间信息首先在层与层向上传递,之后随着时间推移沿“之”字形向前传递,使得空间信息得以高效流动;此外时间信息仍然水平向前传递。在predRNN中引入自注意力记忆(Self-AttentionMemory,缩写为SAM)结构,对时空记忆与标准时间记忆与时空记忆的计算后的输出/>进行进一步空间特征学习,以充分捕捉全局空间与时间信息;此处SAM模块使得时空记忆在模型同一时间片的层与层之间传递,而不同于 SA-ConvLSTM中记忆在时序上向前传递。
而在LSA-predRNN中,包含着基于自注意力机制的的时空卷积LSTM模块(LSA-ST-LSTM),具体实现方式如公式2所示,当模型层数为1时,模块输入为xt,当模型层数大于1时,则输入为下层模型输出
LSA-ST-LSTM中所引入SAM自注意力记忆结构如图3所示,该结构包含上一时间步以及底层模型的记忆输出/>整个过程可分为特征聚合、记忆更新和输出三部分。
1.特征聚合。在同一时间步中,模型层与层向上传播过程中,聚集的特征Z是 Zh和Zm的融合,Zh和Zm分别对应于的特征;对于Zh而言,上一时间步的/>通过predRNN输出/>在SAM模块中被映射成不同的特征空间:
其中{Whq,Whk,Whb}是1×1卷积的权重集合,和C是通道个数,并且N为特征图长度与宽度乘积,应用矩阵乘积计算点与点间相似度分数:
第i点和第j点间相似度表示为其中/>和ht,j是维度为C×1的特征向量,然后沿列归一化相似度分数:
最终通过对每一位置加权聚合出Zh:
Zh通过查询底层的通过权重Wmk和Wmv将底层的记忆1×1卷积映射到 key和value/>接着通过query Qh和key Km之间的矩阵相乘来计算输入/>和记忆/>之间的相似性分数:
与公式4相似,用于聚集特征的所有权重都是通过以下公式:
然后,通过对value Vm中的N个位置的加权和来计算Zm中第i个位置的“像素”:
其中,是记忆的第j列;最后,Z通过Wz[Zh;Zm]求得。
2.记忆更新。通过门控机制自适应得更新上层记忆信息,使SAM能够在 predRNN模型基础上捕捉空间相关性(层尺度)与时间依赖性(predRNN“之”字形记忆传递结构),这样Memory便可以把握全局的时空信息。通过聚合特征Z和输入来产生输入门i″t和输入融合门g″t,此外,忘记门被替换为1-i″t以减少参数,更新过程可以表示如下:
3.输出。通过输出门o″t点乘输出自注意力记忆模块的/>公式如下所示:
再分析数据输入
由于本发明以再分析数据作为真实值,而再分析数据并无法获取到最新的数据,譬如本发明所采用的ERA-5数据,只能获取到最新前5天的再分析数据,为满足实际应用需求,因此本发明提出将6天前同一时刻再分析数据以及预报数据与6天前同一时刻再分析数据波向角度差作为模型输入的方法,如下图4中左侧LSA-predRNN模块所示,模型输入的历史时刻预报数据为Ft-5、 Ft-4、Ft-3、Ft-2、Ft-1,而6天(6*24小时)前同一时刻分析数据Rt-149、Rt-148、 Rt-147、Rt-146、Rt-145,以及历史时刻预报数据与6天前同一时刻再分析数据平均波向真实角度差Rt-149-Ft-5、Rt-148-Ft-4…Rt-145-Ft-1也作为模型输入。
通道卷积融合针对平均波向之外的其他特征建模问题(海浪特征、气象特征),能够将这些融入偏差订正模型中,将有助于提升模型表现,如下图4所示,在时序模型LSA-predRNN中,预报数据F(Forecast)和6天前同一时刻的再分析数据R(reanalysis)以及F和R之间的真实波向角度差已经作为时序数据输入;此外,对于未来时刻(t时刻)预报数据,对其进行特征选择以筛选特征,特征选择方式选择包装法中不带启发式的后向搜索算法,将筛选后的(1)预报数据Ft与(2)6天前同一时刻的再分析数据Rt-144(reanalysis)以及(3)Ft和 Rt-144之间的真实波向角度差进行拼接,并与时序模型(LSA-predRNN)的输出进行通道卷积融合,这一步操作类似于一维数据的全连接特征学习,将时序模型学习到的信息与未来时刻预报数据和相关的再分析数据的多个特征,进一步特征学习,以更好学习真实角度偏差。包装法(Wrapper)基本思想:根据目标函数(往往是预测效果评分),每次选择若干特征,或者排除若干特征。对于每一个待选的特征子集,都在训练集上训练一遍模型,然后在验证集上根据误差大小选择出特征子集。一般欲训练什么算法,就选择该算法进行评估。后向搜索算法每次从现有特征集中选择一个特征删除并进行评价,直到达到阈值或者剩余特征集为空,然后从所有尝试过的特征子集F中选出在验证集上错误率最小的。包装法中不带启发式的后向搜索算法为本领域的现有技术,本发明不再赘述。
预报偏差订正
如图4所示,将通道卷积融合输出的真实角度差与预报数据相加,实现真正的角度偏差订正,生成订正后的平均波向数据。
本发明实验主要分为两部分:模型对比实验、偏差订正实验。模型对比实验利用1872小时(2021/03/01~2021/05/16)南海部分区域(8.5°~16°N, 109.5°~125°E)来探索模型性能,该区域二维图像大小为16×16。预报数据为 FVcom无结构三角形网格数据;再分析数据集为ERA-5数据,再分析数据的分辨率为0.5°。发明用前1704个小时来训练,后168个小时用来测试。将预报数据做反距离权重插值(Inverse Distance Weighted,是做大数据显示时使用的插值方法,为本领域的现有技术,本实施例不再赘述),映射到再分析数据上,使两种数据匹配在0.5°格网上,之后求取两数据集间波向角度差,并将6 天前同一时刻再分析数据平均波向也同上述数据进行映射,同时预报数据平均波向与6天前同一时刻再分析数据平均波向求取波向真实角度差,以便再分析数据也可作为后续模型输入,因而预报数据输入和再分析输入都具备时序特性。对于时空预测任务,需要对每一个时空格网填补数值,根据陆地、海洋的区分,海洋部分仍为波向角度差值以及其他特征数值(如波高、波周期等),而陆地部分均设为0。
为验证所提出模型性能,提出四种模型变体:(1)不包括后续通道卷积融合、偏差订正模块,并且再分析数据也不作为输入的模型,这一模型输出结果加上预报数据得到订正后结果,称之为LSA-predRNN-v1;(2)在v2模型基础上,将未来时刻预报数据所有特征优先进行特征选择,之后加入模型中进行通道卷积融合,称之为LSA-predRNN-v2;(3)最后在v2基础上,将历史时刻预报数据6天前同一时刻再分析数据平均波向,以及再分析数据与预报数据真实波向角度差同样作为模型输入,此外,将未来时刻6天前同一时刻的再分析数据平均波向和再分析与预报数据真实波向角度差也加入通道融合模块,最终模型称之为LSA-predRNN-v3。
在模型对比实验中,分别对比LSTM、ConvLSTM、predRNN、Self-AttentionConvLSTM、LSA-predRNN-v1、LSA-predRNN-v2、LSA-predRNN-v3共计7 种模型进行对比实验,且在v2模型实验中进行了特征选择,特征选择均在400 小时(2021/03/01~2021/05/16)南海部分区域(9.5°~11.5°N,112.0°~114.0°E) 来探索模型性能,该区域二维图像大小为5×5,进行包装法中不带启发式的后向搜索方法,以完成对除去平均波向之外的所有特征实现特征选择,并且特征选择过程采用了pytorch的LambdaLR调整学***均波向u分量(sin(wdir))、平均波向v分量(cos(wdir))、水深(h_center) 3个预报数据特征再加上平均波向(wdir)效果最佳,因而选择上述4个参数作为v2模型特征,以进行后续通道卷积融合;最后,7种模型评估指标选用 RMSE,单位为度(°),实验结果如下表1所示。
表1平均波向订正实验结果
预测方式 订正前RMSE(°) 订正后RMSE(°) 提升效果
LSTM(base) 114.3382 67.6233 40.86%
ConvLSTM 114.3382 58.4741 48.86%
predRNN 114.3382 48.6682 57.43%
SA-ConvLSTM 114.3382 53.2810 53.87%
LSA-predRNN-v1 114.3382 47.7424 58.24%
LSA-predRNN-v2 114.3382 46.8441 59.03%
LSA-predRNN-v3 114.3382 36.9760 67.66%
通过7种模型对比可以看出,LSA-predRNN-v3模型RMSE指标优于其他 6种模型,该模型相比于未订正前提升67.66%,并且相比基线模型LSTM提升45.32%,表明所提出时序模型具有一定先进性。
此外,为了与相关研究进行比对,实验引入了相关研究者采用的多层感知机(MLP)模型,并且对比模型MLP是针对波向数值进行订正,此外为了验证本研究所提出波向真实角度差的可靠性,引入LSA-predRNN-v3-number 模型,该模型并未考虑波向方位角特性,仅针对波向数值进行偏差订正。结果表明,相比于过往研究的MLP方法,以及针对数值的偏差订正方法,本研究所提出方法具有一定先进性。
表2平均波向订正实验结果
预测方式 订正前RMSE(°) 订正后RMSE(°) 提升效果
MLP 81.7139 47.1922 42.25%
LSA-predRNN-v3-number 94.7265 42.6108 55.02%
LSA-predRNN-v3 114.3382 36.9760 67.66%
偏差订正实验:
利用800小时(2021/4/13~2021/5/16)整个南海区域(0°~25°N,105°~122°E)训练模型,区域图像尺寸为51×35;选择前632小时数据做训练,后168小时做测试,并进行偏差订正应用,以2021年5月16日23时为例,对模型偏差订正效果进行可视化,订正后显著消除了FVcom预报模式存在的***误差影响。
实施例2
实施例1仅以再分析数据平均波向为真实值,阐述了模型订正效果,是由于研究区域没有格网点的观测数据,若存在格网点的观测数据,则观测数据也可同再分析数据一样作为输入,不过观测数据不必选择6天前的同一时刻,可同预报数据的时刻保持一致,因此本实施例在实施例1的基础上,用基于观测数据替代再分析数据平均波向为真实值,在此基础上形成平均波向偏差订正方法。
实施例3
峰值波向同样也是一种海浪参数,因而也可参照平均波向对峰值波向格网点区域数据进行偏差订正;因此本实施例在实施例1的基础上,用峰值波向替代再分析数据平均波向为真实值,在此基础上形成峰值波向偏差订正方法。
实施例4
本发明在案例中所选择的预报数据为不规则三角网数据,需要对其进行反距离权重插值以完成对再分析格点数据的匹配,然而,像WW3 (WAVEWATCH-Ⅲ)海浪预报数据便是规则格网点预报数据,针对这种规则类型的预报数据进行订正时,可直接对预报数据进行双线性插值,以匹配规则格点的再分析数据或真实数据,以便对这种模式下预报数据进行波向偏差订正。
实施例5
在特征选择实验中,选择了5×5的区域,既不是51×35也不是16×16,但计算的RMSE效果却大幅度降低,因而本实施例针对平均波向的偏差订正,也可分区域进行。
本发明的有益效果如下:
1)提出针对区域格网平均波向的机器学***均波向的偏差订正方法多针对于特定浮标点,而采用面对面的区域订正方法,使得偏差订正更具应用价值。
2)以深度学习图像识别模型为基础,提出了一种基于层自注意力机制的时空卷积LSTM方法,该方法对时空特征进行了建模,并且相比其他时序预测模型更具竞争力。
3)采用针对波向真实角度差的订正方法,通过先预测真实角度偏差,然后将角度差与预报数据相加完成偏差订正,克服了传统数值订正方法对于方位角的局限性。
4)采用通道卷积融合方法,通过考虑未来时刻预报数据,使得模型顾及时序数据同时,也考虑了其他海浪与气象特征。
5)将再分析数据也作为波向偏差订正的输入,将5天前同一时刻的再分析数据作为输入,使得输入的时序数据中,预报数据存在一种时序,再分析数据同样存在一种时序,提升了模型订正效果。
本文所使用的词语“优选的”意指用作实例、示例或例证。本文描述为“优选的”任意方面或设计不必被解释为比其他方面或设计更有利。相反,词语“优选的”的使用旨在以具体方式提出概念。如本申请中所使用的术语“或”旨在意指包含的“或”而非排除的“或”。即,除非另外指定或从上下文中清楚,“X使用A或B”意指自然包括排列的任意一个。即,如果X使用A;X使用B;或X使用A和B二者,则“X使用A或B”在前述任一示例中得到满足。
而且,尽管已经相对于一个或实现方式示出并描述了本公开,但是本领域技术人员基于对本说明书和附图的阅读和理解将会想到等价变型和修改。本公开包括所有这样的修改和变型,并且仅由所附权利要求的范围限制。特别地关于由上述组件(例如元件等)执行的各种功能,用于描述这样的组件的术语旨在对应于执行所述组件的指定功能(例如其在功能上是等价的)的任意组件(除非另外指示),即使在结构上与执行本文所示的本公开的示范性实现方式中的功能的公开结构不等同。此外,尽管本公开的特定特征已经相对于若干实现方式中的仅一个被公开,但是这种特征可以与如可以对给定或特定应用而言是期望和有利的其他实现方式的一个或其他特征组合。而且,就术语“包括”、“具有”、“含有”或其变形被用在具体实施方式或权利要求中而言,这样的术语旨在以与术语“包含”相似的方式包括。
本发明实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以多个或多个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。上述提到的存储介质可以是只读存储器,磁盘或光盘等。上述的各装置或***,可以执行相应方法实施例中的存储方法。
综上所述,上述实施例为本发明的一种实施方式,但本发明的实施方式并不受所述实施例的限制,其他的任何背离本发明的精神实质与原理下所做的改变、修饰、代替、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (8)

1.基于时空卷积LSTM的平均波向预报偏差订正方法,其特征在于,包括以下步骤:
S1:选取预报数据,选取待订正地区的逐小时海浪预报数据资料作为模式数据样本;
S2:选取再分析格点数据资料,以再分析数据作为真实值,选取待检测订正地区逐小时平均波向再分析数据;
S3:数据匹配,为使所述预报数据与所述再分析数据匹配,若所述预报数据为不规则格网数据,则对所述预报数据进行反距离权重插值,使得预报数据得以插值匹配到再分析数据的格网点上,此外,预报数据与再分析数据在时间尺度上匹配,最终两数据在空间、时间层面上实现匹配;
S4:构建偏差订正训练集,求取预报数据与再分析数据平均波向真实角度差,此外,将时间上连续的再分析数据144小时之前平均波向也作为训练集的时序特征,最终将上述数据在空间上转换成二维图像形式的数据,以构建空间层面匹配、时间层面连续的偏差订正训练集,包括逐小时预报数据、逐小时再分析数据平均波向、逐小时预报数据与再分析数据真实角度差、逐小时再分析数据前144小时平均波向;
S5:搭建基于层自注意力记忆的时空卷积LSTM偏差订正模型的多层网络结构,包括以下三部分:
第一层:基于层自注意力机制的时空卷积LSTM层,采用3层基于自注意力机制的时空卷积LSTM模块(LSA-ST-LSTM),时序上选择预报与再分析数据时空特征矩阵作为输入,LSA-ST-LSTM中引入SAM自注意力记忆结构过程可分为特征聚合、记忆更新和输出三部分;
第二层:通道卷积融合层,将未来时刻预报数据进行特征选择,之后将特征选择后的预报数据与144小时前再分析数据平均波向以及预报和再分析数据波向真实角度差拼接,之后与基于层自注意力机制的时空卷积LSTM的输出,进行通道合并,之后将融合后的数据进行1×1通道卷积融合,此时通道卷积的输出为模型预测的预报与再分析波向真实角度差;
第三层:偏差订正层,将模型预测的波向真实角度差,与未来时刻的预报数据平均波向相加,生成订正后的平均波向数据。
2.根据权利要求1所述的时空卷积LSTM的平均波向预报偏差订正方法,其特征在于,所述时空卷积LSTM中采用3*3大小的卷积核进行空间特征提取,所述3层基于层自注意力机制的时空卷积LSTM隐藏层分别为32、32、32,自注意力机制的隐藏层为12。
3.根据权利要求1所述的时空卷积LSTM的平均波向预报偏差订正方法,其特征在于,所述真实角度差的计算公式为:
θbias=θfr-360×((θfr)>180)+360×((θfr)<-180)
其中θf表示预报数据平均波向,θr表示再分析数据平均波向。
4.根据权利要求1所述的时空卷积LSTM的平均波向预报偏差订正方法,其特征在于,所述特征聚合的步骤包括如下:
在同一时间步中,模型层与层向上传播过程中,聚集的特征Z是Zh和Zm的融合,Zh和Zm分别对应于的特征;对于Zh而言,上一时间步的/>通过predRNN输出/> 在SAM模块中被映射成不同的特征空间:
其中(Whq,Whk,Whv)是1×1卷积的权重集合,和C是通道个数,并且N为特征图长度与宽度乘积,应用矩阵乘积计算点与点间相似度分数:
第i点和第j点间相似度表示为其中/>和ht,j是维度为C×1的特征向量,然后沿列归一化相似度分数:
通过对每一位置加权聚合出Zh
Zh通过查询底层的通过权重Wmk和Wmv将底层的记忆1×1卷积映射到key和value/>接着通过query Qh和key Km之间的矩阵相乘来计算输入/>和记忆/>之间的相似性分数:
用于聚集特征的所有权重通过以下公式计算:
然后,通过对value Vm中的N个位置的加权和来计算Zm中第i个位置的“像素”:
其中,是记忆的第j列;最后,Z通过Wz[Zh;Zm]求得。
5.根据权利要求4所述的时空卷积LSTM的平均波向预报偏差订正方法,其特征在于,通过门控机制自适应得更新上层记忆信息,使SAM能够在predRNN模型基础上捕捉空间相关性与predRNN“之”字形记忆传递结构,这样记忆便可以把握全局的时空信息;通过聚合特征Z和输入来产生输入门i't'和输入融合门g't',此外,忘记门被替换为1-i't'以减少参数,所述记忆更新过程的数学表示如下:
6.根据权利要求5所述的时空卷积LSTM的平均波向预报偏差订正方法,其特征在于,通过输出门o't'点乘输出自注意力记忆模块的/>公式如下所示:
7.根据权利要求1所述的时空卷积LSTM的平均波向预报偏差订正方法,其特征在于,在时序模型LSA-predRNN中,预报数据F和6天前同一时刻的再分析数据R以及F和R之间的真实波向角度差作为时序数据输入;此外,对于未来t时刻预报数据,对其进行特征选择以筛选特征,将筛选后的预报数据Ft与6天前同一时刻的再分析数据Rt-144以及Ft和Rt-144之间的真实波向角度差进行拼接,并与LSA-predRNN的输出进行通道卷积融合,将时序模型学习到的信息与未来时刻预报数据和相关的再分析数据的多个特征,进一步特征学习,以更好学习真实角度偏差。
8.根据权利要求7所述的时空卷积LSTM的平均波向预报偏差订正方法,其特征在于,所述特征选择方式为包装法中不带启发式的后向搜索算法。
CN202210210019.3A 2022-03-04 2022-03-04 基于时空卷积lstm的平均波向预报偏差订正方法 Active CN114819053B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210210019.3A CN114819053B (zh) 2022-03-04 2022-03-04 基于时空卷积lstm的平均波向预报偏差订正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210210019.3A CN114819053B (zh) 2022-03-04 2022-03-04 基于时空卷积lstm的平均波向预报偏差订正方法

Publications (2)

Publication Number Publication Date
CN114819053A CN114819053A (zh) 2022-07-29
CN114819053B true CN114819053B (zh) 2024-05-03

Family

ID=82528774

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210210019.3A Active CN114819053B (zh) 2022-03-04 2022-03-04 基于时空卷积lstm的平均波向预报偏差订正方法

Country Status (1)

Country Link
CN (1) CN114819053B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115049443B (zh) * 2022-08-15 2022-10-28 国能日新科技股份有限公司 基于多尺度特征的自适应回归气象中长期优化方法及***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106777949A (zh) * 2016-12-08 2017-05-31 河海大学 一种基于再分析数据的海浪波向的长期趋势预测方法
CN111738347A (zh) * 2020-06-28 2020-10-02 国家海洋环境预报中心 海浪方向谱订正方法、装置、存储介质和电子设备
WO2021068528A1 (zh) * 2019-10-11 2021-04-15 平安科技(深圳)有限公司 基于卷积神经网络的注意力权重计算方法、装置及设备
CN113344301A (zh) * 2021-07-05 2021-09-03 江苏省气象台 一种基于竞争卷积神经网络的降水预报客观订正方法
KR20210150776A (ko) * 2020-06-04 2021-12-13 대우조선해양 주식회사 해상이미지의 기계학습을 통한 파랑정보 추정시스템

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11966670B2 (en) * 2018-09-06 2024-04-23 Terrafuse, Inc. Method and system for predicting wildfire hazard and spread at multiple time scales

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106777949A (zh) * 2016-12-08 2017-05-31 河海大学 一种基于再分析数据的海浪波向的长期趋势预测方法
WO2021068528A1 (zh) * 2019-10-11 2021-04-15 平安科技(深圳)有限公司 基于卷积神经网络的注意力权重计算方法、装置及设备
KR20210150776A (ko) * 2020-06-04 2021-12-13 대우조선해양 주식회사 해상이미지의 기계학습을 통한 파랑정보 추정시스템
CN111738347A (zh) * 2020-06-28 2020-10-02 国家海洋环境预报中心 海浪方向谱订正方法、装置、存储介质和电子设备
CN113344301A (zh) * 2021-07-05 2021-09-03 江苏省气象台 一种基于竞争卷积神经网络的降水预报客观订正方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
珠江口近海海域海浪预报方法研究;王欣睿;《海洋通报》;20090630;第113-126页 *

Also Published As

Publication number Publication date
CN114819053A (zh) 2022-07-29

Similar Documents

Publication Publication Date Title
CN106909924B (zh) 一种基于深度显著性的遥感影像快速检索方法
CN111612066B (zh) 基于深度融合的卷积神经网络的遥感图像分类方法
Shabri et al. Streamflow forecasting using least-squares support vector machines
Kavzoglu et al. An assessment of the effectiveness of a rotation forest ensemble for land-use and land-cover mapping
CN113392961B (zh) 中尺度涡轨迹平稳序列提取与循环神经网络预测方法
CN109001736B (zh) 一种基于深度时空预测神经网络的雷达回波外推方法
CN107092859A (zh) 一种三维模型的深度特征提取方法
Wang et al. Distilling knowledge from an ensemble of convolutional neural networks for seismic fault detection
CN114724012B (zh) 基于时空跨尺度注意力融合热带不稳定波预警方法及装置
CN114780739B (zh) 基于时间图卷积网络的时序知识图谱补全方法及***
Shafizadeh-Moghadam et al. Performance analysis of radial basis function networks and multi-layer perceptron networks in modeling urban change: a case study
Kaloop et al. Optimizing local geoid undulation model using GPS/levelling measurements and heuristic regression approaches
CN113255995A (zh) 一种空气污染预测方法
CN114819053B (zh) 基于时空卷积lstm的平均波向预报偏差订正方法
Hsieh Evolution of machine learning in environmental science—A perspective
Ganguli et al. Predicting food security outcomes using convolutional neural networks (cnns) for satellite tasking
Abdalla et al. Deep learning weather forecasting techniques: literature survey
CN111611960A (zh) 一种基于多层感知神经网络大区域地表覆盖分类方法
Mojiri et al. Comparison of predictions by kriging and spatial autoregressive models
CN116912661A (zh) 一种具备域泛化能力的目标轨迹预测方法及***
CN115953902A (zh) 一种基于多视图时空图卷积网络的交通流预测方法
CN116070763A (zh) 基于梯度进化的新建风电场风电功率预测方法及***
CN114821033A (zh) 一种基于激光点云的三维信息增强的检测识别方法及装置
Yu et al. Prediction and generalisation over directed actions by grid cells
Pellicanò et al. 2cobel: A scalable belief function representation for 2d discernment frames

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant