CN115169439A - 一种基于序列到序列网络的有效波高预测方法和*** - Google Patents

一种基于序列到序列网络的有效波高预测方法和*** Download PDF

Info

Publication number
CN115169439A
CN115169439A CN202210678407.4A CN202210678407A CN115169439A CN 115169439 A CN115169439 A CN 115169439A CN 202210678407 A CN202210678407 A CN 202210678407A CN 115169439 A CN115169439 A CN 115169439A
Authority
CN
China
Prior art keywords
sequence
data set
wave data
wave
wave height
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210678407.4A
Other languages
English (en)
Other versions
CN115169439B (zh
Inventor
谭家明
朱俊星
李小勇
任小丽
邓科峰
汪祥
赵娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN202210678407.4A priority Critical patent/CN115169439B/zh
Publication of CN115169439A publication Critical patent/CN115169439A/zh
Application granted granted Critical
Publication of CN115169439B publication Critical patent/CN115169439B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于序列到序列网络的有效波高预测方法和***,本发明通过获取原始波浪数据集,在原始波浪数据集中加入滞后变量,获得第一波浪数据集;使用随机森林算法对第一波浪数据集进行特征选择,获得第二波浪数据集;构建带有基于记忆层的注意力机制的序列到序列模型,采用序列到序列模型对第二波浪数据集进行有效波高预测训练,获得训练好的序列到序列模型;通过训练好的序列到序列模型对待预测数据进行有效波高预测,获得最终有效波高预测值。本发明能够提高有效波高预测精度,并对异常值有更好的预测效果。

Description

一种基于序列到序列网络的有效波高预测方法和***
技术领域
本发明涉及海浪参数计算技术领域,具体涉及一种基于序列到序列网络的有效波高预测方法和***。
背景技术
极端海浪威胁人类的生命安全,破坏海岸工程,对人们的生产活动有重大影响。准确、快速的有效波高预测在航线规划、港口建设、海浪发电和军事活动等领域具有重要意义。然而,海洋是一个复杂的混沌***,由于海洋环境的不确定性和气象要素之间复杂的相互作用,我们难以准确预测有效波高。
应用最广泛的有效波高预报方法是基于物理的数值方法。这些方法根据物理条件和过程的变化,利用数学模型来描述波浪,通常是复杂和难以求解的。此外,这些方法很难挖掘出海洋数据中蕴含的对有效波高预测有价值的深层潜特征,并将其应用到波浪预测过程中。随着人工智能的兴起,基于机器学习的有效波高预测方法发展迅速,可以从海洋数据中挖掘有价值的潜在特征来实现较好的预测效果。随着对有效波高预测的重视程度不断提高,预测效果也在稳步提高,但仍存在以下几个挑战有待解决:
(1)现有的方法很少详细地评估浮标数据中潜在的有价值的有效波高预测特征;
(2)预测精度有待进一步提高;
(3)大多数方法对异常值的预测效果不理想。
发明内容
为解决现有技术中存在的问题,本发明提供一种基于序列到序列网络的有效波高预测方法和***,能够提高有效波高预测精度,并对异常值有更好的预测效果。
为达到上述目的,本发明的技术方案是这样实现的:
第一方面,本发明实施例提供了一种基于序列到序列网络的有效波高预测方法,包括步骤:
获取原始波浪数据集,在所述原始波浪数据集中加入滞后变量,获得第一波浪数据集;
使用随机森林算法对所述第一波浪数据集进行特征选择,获得第二波浪数据集;
构建带有基于记忆层的注意力机制的序列到序列模型,采用所述序列到序列模型对所述第二波浪数据集进行有效波高预测训练,获得训练好的序列到序列模型;
通过所述训练好的序列到序列模型对待预测数据进行有效波高预测,获得最终有效波高预测值。
与现有技术相比,本发明第一方面具有以下有益效果:
本方法通过获取原始波浪数据集,在原始波浪数据集中加入滞后变量,获得第一波浪数据集;使用随机森林算法对第一波浪数据集进行特征选择,获得第二波浪数据集;构建带有基于记忆层的注意力机制的序列到序列模型,采用序列到序列模型对第二波浪数据集进行有效波高预测训练,获得训练好的序列到序列模型;通过训练好的序列到序列模型对待预测数据进行有效波高预测,获得最终有效波高预测值。本方法通过在原始波浪数据集中加入滞后变量,能够增强原始波浪数据集中的特征;通过随机森林算法对第一波浪数据集中的每个特征相对于有效波高的重要性进行了排序,从而对第一波浪数据集进行特征选择,消除不相关或冗余的特征,为预测带来增益,提高预测模型的准确性;本方法还通过构建带有基于记忆层的注意力机制的序列到序列模型,采用序列到序列模型对第二波浪数据集进行有效波高预测训练,获得训练好的序列到序列模型;通过训练好的序列到序列模型对待预测数据进行有效波高预测,获得最终有效波高预测值,通过构建带有基于记忆层的注意力机制的序列到序列网络,以减少长序列预测中遗忘问题的发生,同时可较好地捕捉有效波高的突变,进一步提高预测模型的准确性,从而提高有效波高预测精度,对异常值有更好的预测效果。
根据本发明的一些实施例,所述获取原始波浪数据集,在所述原始波浪数据集中加入滞后变量,获得第一波浪数据集,包括:
将所述原始波浪数据集中的当前波浪数据的历史有效波高数据作为滞后变量加入到所述原始波浪数据集中,获得第一波浪数据集。
根据本发明的一些实施例,所述使用随机森林算法对所述第一波浪数据集进行特征选择,获得第二波浪数据集,包括:
获取所述第一波浪数据集的有效波高观测值,初始化历史相关系数为零,初始化第二波浪数据集为空数据集,初始化耐心值为零,预设最大耐心值;
使用随机森林算法对所述第一波浪数据集中的特征按特征重要性由高到低进行排序,获得排好序的第一波浪数据集;
将所述排好序的第一波浪数据集中的特征按特征重要性由高到低依次添加到所述第二波浪数据集中,每添加一次数据到所述第二波浪数据集中时,则通过神经网络计算一次有效波高预测值;
计算所述有效波高预测值与所述有效波高观测值之间的当前相关系数,将所述当前相关系数和所述历史相关系数进行判断:
若所述当前相关系数大于所述历史相关系数,则将所述第一波浪数据集中的特征添加到所述第二波浪数据集中;
若所述当前相关系数小于或等于所述历史相关系数,则将所述耐心值增加一,并移除所述当前相关系数对应的所述第一波浪数据集中的特征;
在第一波浪数据集中的所有数据判断完或所述耐心值增加到大于所述最大耐心值后结束判断,获得特征选择后的第二波浪数据集。
根据本发明的一些实施例,所述构建带有基于记忆层的注意力机制的序列到序列模型,包括:
采用门控递归单元网络作为编码器和解码器,基于所述编码器和所述解码器挖掘时间序列中前后值之间的关系;
在注意力机制中增加记忆层,根据所述编码器、所述解码器和所述注意力机制构建序列到序列模型。
根据本发明的一些实施例,通过如下公式建立所述编码器:
Input:X=(x1,x2,...,xt)
zt=σ(Wz·[ht-1,xt])
rt=σ(Wr·[ht-1,xt])
Figure BDA0003697344340000041
Figure BDA0003697344340000042
其中,X表示门控递归单元网络中每个单元的当前输入数据集,xt表示当前时刻的数据,ht-1表示从前一时刻t-1传递过来的隐藏状态,zt表示更新门,rt表示重置门,
Figure BDA0003697344340000051
表示当前时刻的中间记忆,所述中间记忆表示前一时刻的记忆与当前时刻的记忆的输入结合,Wz表示所述更新门zt的权值矩阵,Wr表示所述重置门rt的权值矩阵,W表示所述中间记忆
Figure BDA0003697344340000052
的权值矩阵,ht表示当前时刻隐藏状态,Input表示门控递归单元网络的输入,Output表示门控递归单元网络的输出。
根据本发明的一些实施例,通过如下公式建立所述解码器:
Input:X=(c1,c2,...,ck)
s0=ht
zk=σ(Wz·[sk-1,ck])
rk=σ(Wr·[sk-1,ck])
Figure BDA0003697344340000053
Figure BDA0003697344340000054
Output:yk=sk
其中,X表示解码器的输入,所述解码器的输入通过注意力机制获得,s0=ht表示所述编码器的最后一个隐藏状态ht被用作解码器隐藏层的初始输入s0,zk表示更新门,rk表示重置门,
Figure BDA0003697344340000055
表示当前时刻的中间记忆,所述中间记忆表示前一时刻的记忆与当前时刻的记忆的输入结合,Wz表示所述更新门zk的权值矩阵,Wr表示所述重置门rk的权值矩阵,W表示所述中间记忆
Figure BDA0003697344340000056
的权值矩阵,sk表示当前时刻隐藏状态,yk=sk表示将当前时刻隐藏状态sk作为门控递归单元网络的输出yk
根据本发明的一些实施例,通过如下公式建立所述注意力机制:
score(hi,sj)=vTtanh(W[hi;sj]+b)
ωij=Softmax((score(hi,sj)))
Figure BDA0003697344340000061
Figure BDA0003697344340000062
其中,hi表示所述编码器在i时刻的隐藏状态,sj表示所述解码器在j时刻的隐藏状态,根据所述hi和所述sj获得对应的输出分数,vT和b表示神经网络中的偏置参数,ωij表示通过softmax函数归一化分数来计算所述编码器与所述解码器隐藏状态之间的权重,
Figure BDA0003697344340000063
表示所述编码器输出的加权平均值,cj+1表示记忆层,所述记忆层将所述编码器中隐藏单元的输出hj用于下一时刻的预测,通过所述hj和所述
Figure BDA0003697344340000064
在特征维上拼接,并进行线性变换后获得的tj+1时刻解码器的输入。
第二方面,本发明实施例提供了一种基于序列到序列网络的有效波高预测***,包括:
第一波浪数据集获取单元,用于获取原始波浪数据集,在所述原始波浪数据集中加入滞后变量,获得第一波浪数据集;
第二波浪数据集获取单元,用于使用随机森林算法对所述第一波浪数据集进行特征选择,获得第二波浪数据集;
序列到序列模型训练单元,用于构建带有基于记忆层的注意力机制的序列到序列模型,采用所述序列到序列模型对所述第二波浪数据集进行有效波高预测训练,获得训练好的序列到序列模型;
最终有效波高预测值获取单元,用于通过所述训练好的序列到序列模型对待预测数据进行有效波高预测,获得最终有效波高预测值。
与现有技术相比,本发明第二方面具有以下有益效果:
本***第一波浪数据集通过获取原始波浪数据集,在原始波浪数据集中加入滞后变量,获得第一波浪数据集;第二波浪数据集获取单元使用随机森林算法对第一波浪数据集进行特征选择,获得第二波浪数据集;序列到序列模型训练单元构建带有基于记忆层的注意力机制的序列到序列模型,采用序列到序列模型对第二波浪数据集进行有效波高预测训练,获得训练好的序列到序列模型;最终有效波高预测值获取单元通过训练好的序列到序列模型对待预测数据进行有效波高预测,获得最终有效波高预测值。本***通过在原始波浪数据集中加入滞后变量,能够增强原始波浪数据集中的特征;通过随机森林算法对第一波浪数据集中的每个特征相对于有效波高的重要性进行了排序,从而对第一波浪数据集进行特征选择,消除不相关或冗余的特征,为预测带来增益,提高预测模型的准确性;本***还通过构建带有基于记忆层的注意力机制的序列到序列模型,采用序列到序列模型对第二波浪数据集进行有效波高预测训练,获得训练好的序列到序列模型;通过训练好的序列到序列模型对待预测数据进行有效波高预测,获得最终有效波高预测值,通过构建带有基于记忆层的注意力机制的序列到序列网络,以减少长序列预测中遗忘问题的发生,同时可较好地捕捉有效波高的突变,进一步提高预测模型的准确性,从而提高有效波高预测精度,对异常值有更好的预测效果。
第三方面,本发明实施例提供了一种基于序列到序列网络的有效波高预测设备,包括至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器;所述存储器存储有可被所述至少一个控制处理器执行的指令,所述指令被所述至少一个控制处理器执行,以使所述至少一个控制处理器能够执行如上所述的一种基于序列到序列网络的有效波高预测方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如上所述的一种基于序列到序列网络的有效波高预测方法。
可以理解的是,上述第三方面至第四方面与相关技术相比存在的有益效果与上述第一方面与相关技术相比存在的有益效果相同,可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明一个实施例提供的一种基于序列到序列网络的有效波高预测方法的流程图;
图2为本发明一个实施例提供的带有基于记忆层的注意力机制的序列到序列模型的结构图;
图3为本发明一个实施例提供的一种基于序列到序列网络的有效波高预测***的结构图。
具体实施方式
下面将结合附图,对本公开实施例的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。需要说明的是,在不冲突的情况下,本公开实施例及实施例中的特征可以相互组合。另外,附图的作用在于用图形补充说明书文字部分的描述,使人能够直观地、形象地理解本公开的每个技术特征和整体技术方案,但其不能理解为对本公开保护范围的限制。
在本发明的描述中,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
本发明的描述中,除非另有明确的限定,设置、安装、连接等词语应做广义理解,所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应用最广泛的有效波高预报方法是基于物理的数值方法。这些方法根据物理条件和过程的变化,利用数学模型来描述波浪,通常是复杂和难以求解的。此外,这些方法很难挖掘出海洋数据中蕴含的对有效波高预测有价值的深层潜特征,并将其应用到波浪预测过程中。随着人工智能的兴起,基于机器学习的有效波高预测方法发展迅速,可以从海洋数据中挖掘有价值的潜在特征来实现较好的预测效果。随着对有效波高预测的重视程度不断提高,预测效果也在稳步提高,但仍存在以下几个挑战有待解决:
(1)现有的方法很少详细地评估浮标数据中潜在的有价值的有效波高预测特征;
(2)预测精度有待进一步提高;
(3)大多数方法对异常值的预测效果不理想。
为解决上述问题,本发明通过在原始波浪数据集中加入滞后变量,能够增强原始波浪数据集中的特征;通过随机森林算法对第一波浪数据集中的每个特征相对于有效波高的重要性进行了排序,从而对第一波浪数据集进行特征选择,消除不相关或冗余的特征,为预测带来增益,提高预测模型的准确性;本发明还通过构建带有基于记忆层的注意力机制的序列到序列模型,采用序列到序列模型对第二波浪数据集进行有效波高预测训练,获得训练好的序列到序列模型;通过训练好的序列到序列模型对待预测数据进行有效波高预测,获得最终有效波高预测值,通过构建带有基于记忆层的注意力机制的序列到序列网络,以减少长序列预测中遗忘问题的发生,同时可较好地捕捉有效波高的突变,进一步提高预测模型的准确性,从而提高有效波高预测精度,对异常值有更好的预测效果。
参照图1,本发明实施例提供了一种基于序列到序列网络的有效波高预测方法,包括步骤:
步骤S100、获取原始波浪数据集,在原始波浪数据集中加入滞后变量,获得第一波浪数据集;
具体的,获取原始波浪数据集,在原始波浪数据集中加入滞后变量,获得第一波浪数据集。
例如,假设原始波浪数据集为
Figure BDA0003697344340000101
其中n表示浮标数据特征数量,T1表示每个特征的时间步长,即,
Figure BDA0003697344340000102
长度为T2的待预测有效波高序列表示为
Figure BDA0003697344340000103
本实施例的目标是找到一个足够好的函数F,使预测值和实际值之间的误差尽可能小。
Y=F(X)
本实施例利用神经网络挖掘T1时间步的输入特征与T2时间步的待预测特征(有效波高)之间的函数关系。
根据自回归移动平均模型的原理,本实施例将待预测特征随时间变化形成的数据序列视为随机序列,这个随机序列的变化反映了原始波浪数据在时间上的连续性。一方面,被预测的特征会受到其他特征的影响;另一方面,它有自己的变化规律。预测值Yt受其自身t时间段变化的影响的变化规律如下公式所示:
Yt=β1Yt-12Yt-2+...+βTYt-T+Zt
预测特征在t时刻的预测值Yt可以看作是之前时间的值加余项的线性组合的形式,这与多层感知器(MLP)的思想是一致的。受此启发,在有效波高预测问题中,本实施例将原始波浪数据集中的当前波浪数据的历史有效波高数据作为滞后变量加入到原始波浪数据集中,获得第一波浪数据集。本实施例中将1到12小时之前的波浪数据加入到当前波浪数据中,作为1到12阶的滞后变量。需要说明的是,本实施例不限定滞后变量只为1到12小时的数据,这个时间段可以根据需要进行调整。
在本实施例中,通过在原始波浪数据集中加入滞后变量,能够增强原始波浪数据集中的特征。
步骤S200、使用随机森林算法对第一波浪数据集进行特征选择,获得第二波浪数据集;
具体的,随机森林算法作为bagging算法和决策树算法的结合,被广泛应用于特征选择。假设给定具有c个特征X1,X2,...,Xc的数据集,想要计算不同特征Xi和Xj,i≠j之间的相对重要性。在随机森林算法中,一个特征的重要性是指该特征在随机森林的每棵决策树中的平均贡献度,由基尼指数计算出。该基尼指数公式如下:
Figure BDA0003697344340000121
其中,K表示所有样本可分为K个类别,phk表示类别k在节点h中所占的比例。在确定节点h的基尼指数后,可以计算特征Xj在节点h的重要性,即,节点h分支前后基尼指数的变化:
Figure BDA0003697344340000122
其中,GIm和GIo分别表示节点h分支后两个新节点的基尼指数。将特征Xj在决策树中出现的集合表示为H,则特征Xj在树i中的重要性
Figure BDA0003697344340000123
为:
Figure BDA0003697344340000124
假设随机森林中有N棵树,特征Xj的重要性评分
Figure BDA0003697344340000125
为:
Figure BDA0003697344340000126
由于不同区域的海洋环境差异较大,每个站点数据的特征选择结果也存在一定的差异。此外,尽管随机森林算法将海浪数据的每个特征相对于有效波高的重要性进行了排序,但具体选择哪些特征作为模型的输入以达到最佳的预测效果,还需要在实践中进行检验。因此,本实施例为每个站点设计了一个自适应特征选择算法,该算法发具体过程如下:
获取第一波浪数据集的有效波高观测值,初始化历史相关系数为零,初始化第二波浪数据集为空数据集,初始化耐心值为零,预设最大耐心值;
使用上述的随机森林算法对第一波浪数据集中的特征按特征重要性由高到低进行排序,获得排好序的第一波浪数据集;
将排好序的第一波浪数据集中的特征按特征重要性由高到低依次添加到第二波浪数据集中,每添加一次数据到第二波浪数据集中时,则通过神经网络计算一次有效波高预测值;
计算有效波高预测值与有效波高观测值之间的当前相关系数,相关系数的计算公式如下所示:
Figure BDA0003697344340000131
其中,其中yi是有效波高观测值,pi是有效波高预测值,
Figure BDA0003697344340000132
是有效波高观测值的平均值,
Figure BDA0003697344340000133
是有效波高预测值的平均值;
将当前相关系数和历史相关系数进行判断:
若当前相关系数大于历史相关系数,则将第一波浪数据集中的特征添加到第二波浪数据集中;
若当前相关系数小于或等于历史相关系数,则将耐心值增加一,并移除当前相关系数对应第一波浪数据集中的特征;
在第一波浪数据集中的所有数据判断完或耐心值增加到大于最大耐心值后结束判断,获得特征选择后的第二波浪数据集。
在通过随机森林得到特征的重要性排序后,本实施例使用前向选择的方法将特征按重要性由高到低的顺序依次添加到第二波浪数据集中。每次添加后,本实施例使用当前第二波浪数据集进行24小时有效波高预测,并记录预测结果与真实值之间的相关系数。最后,选择最优的相关系数对应的特征集作为序列到序列模型的输入。
在本实施例中,通过随机森林算法对第一波浪数据集中的每个特征相对于有效波高的重要性进行了排序,并选择最优的相关系数对应的特征集作为序列到序列模型的输入,消除了不相关或冗余的特征,增加了特征之间的相关性,为预测带来增益,提高预测模型的准确性。
步骤S300、构建带有基于记忆层的注意力机制的序列到序列模型,采用序列到序列模型对第二波浪数据集进行有效波高预测训练,获得训练好的序列到序列模型;
具体的,参照图2,在本实施例中,由于递归神经网络的缺陷,即使是优化后的长短时记忆网络(LSTM)、门控递归单元网络(GRU)等递归神经网络,在输入长序列时也只能尽量减少而不能避免遗忘的发生。为了缓解这一问题,本实施例在序列到序列模型(Seq2seq)中加入了带有基于记忆层的注意力机制。具体地说,本实施例引入了一个神经网络来计算编码器的输出贡献对解码器的权重。基于上述权重,然计算编码器的加权平均输出,它将解码器的特定解码与编码器的某些输出关联起来,具体过程如下所示:
采用门控递归单元网络作为编码器和解码器,基于编码器和解码器挖掘时间序列中前后值之间的关系,其中,
通过如下公式建立编码器:
Input:X=(x1,x2,...,xt)
zt=σ(Wz·[ht-1,xt])
rt=σ(Wr·[ht-1,xt])
Figure BDA0003697344340000141
Figure BDA0003697344340000142
其中,X表示门控递归单元网络中每个单元的当前输入数据集,xt表示当前时刻的数据,ht-1表示从前一时刻t-1传递过来的隐藏状态,zt表示更新门,rt表示重置门,
Figure BDA0003697344340000151
表示当前时刻的中间记忆,中间记忆表示前一时刻的记忆与当前时刻的记忆的输入结合,Wz表示更新门zt的权值矩阵,Wr表示重置门rt的权值矩阵,W表示中间记忆
Figure BDA0003697344340000152
的权值矩阵,ht表示当前时刻隐藏状态,Input表示门控递归单元网络的输入,Output表示门控递归单元网络的输出。
通过如下公式建立解码器:
Input:X=(c1,c2,...,ck)
s0=ht
zk=σ(Wz·[sk-1,ck])
rk=σ(Wr·[sk-1,ck])
Figure BDA0003697344340000153
Figure BDA0003697344340000154
Output:yk=sk
其中,X表示解码器的输入,解码器的输入通过注意力机制获得,s0=ht表示编码器的最后一个隐藏状态ht被用作解码器隐藏层的初始输入s0,zk表示更新门,rk表示重置门,
Figure BDA0003697344340000155
表示当前时刻的中间记忆,中间记忆表示前一时刻的记忆与当前时刻的记忆的输入结合,Wz表示更新门zk的权值矩阵,Wr表示重置门rk的权值矩阵,W表示中间记忆
Figure BDA0003697344340000156
的权值矩阵,sk表示当前时刻隐藏状态,yk=sk表示将当前时刻隐藏状态sk作为门控递归单元网络的输出yk
在注意力机制中增加记忆层,根据编码器、解码器和注意力机制构建序列到序列模型,通过如下公式建立带有基于记忆层的注意力机制:
score(hi,sj)=vTtanh(W[hi;sj]+b)
ωij=Softmax((score(hi,sj)))
Figure BDA0003697344340000161
Figure BDA0003697344340000162
其中,hi表示编码器在i时刻的隐藏状态,sj表示解码器在j时刻的隐藏状态,根据hi和sj获得对应的输出分数,vT和b表示神经网络中的偏置参数,ωij表示通过softmax函数归一化分数来计算编码器与解码器隐藏状态之间的权重,
Figure BDA0003697344340000163
表示编码器输出的加权平均值,cj+1表示记忆层,记忆层将编码器中隐藏单元的输出hj用于下一时刻的预测,通过hj
Figure BDA0003697344340000164
在特征维上拼接,并进行线性变换后获得的tj+1时刻解码器的输入。
采用序列到序列模型对第二波浪数据集进行有效波高预测训练,获得训练好的序列到序列模型。
本实施例中,构建了一个带有注意机制的序列到序列模型,使用门控递归单元网络作为编码器和解码器来挖掘时间序列中前后值之间的关系。为了减少输入长序列时遗忘问题的发生,本实施例还设计了一个记忆层来增加解码器隐藏层在注意机制中的权重。同时,深化了编解码器的网络深度,提高了网络泛化能力和特征提取能力。本实施例通过构建带有基于记忆层的注意力机制的序列到序列网络,以减少长序列预测中遗忘问题的发生,同时可较好地捕捉有效波高的突变,进一步提高预测模型的准确性。
步骤S400、通过训练好的序列到序列模型对待预测数据进行有效波高预测,获得最终有效波高预测值。
具体的,通过训练好的序列到序列模型对待预测数据进行有效波高预测,获得最终有效波高预测值,具体过程为:
在训练好的序列到序列模型中输入待预测数据,训练好的序列到序列模型中的编码器的最后一个隐藏状态
Figure BDA0003697344340000171
被用作解码器隐藏层的初始输入s0。用hi表示编码器在i时刻的隐藏状态,i=1,2,...,t1,用sj表示解码器在j时刻的隐藏状态,j=t1+1,t1+2,...,t1+t2。然后根据这两个向量通过如下公式计算相应的输出分数:
score(hi,sj)=vT tanh(W[hi;sj]+b)。
再根据得到的输出分数,使用softmax函数归一化分数来计算编码器与解码器隐藏状态之间的权重ωij,公式如下所示:
ωij=Softmax((score(hi,sj)))。
根据计算出的权重,我们推导出编码器输出的加权平均值
Figure BDA0003697344340000172
公式如下所示:
Figure BDA0003697344340000173
为了充分利用解码信息,将上一步的预测结果用于下一步预测,本实施例设计了一个存储层来存储解码器每一步的输出sj,通过
Figure BDA0003697344340000174
和sj在特征维上拼接,并进行线性变换后获得的tj时刻解码器的输入cj,计算公式如下:
Figure BDA0003697344340000175
再通过解码器获得待预测数据的最终有效波高预测值yj,通过上述步骤完成待预测数据的有效波高预测。
在本实施例中,通过在原始波浪数据集中加入滞后变量,能够增强原始波浪数据集中的特征;通过随机森林算法对第一波浪数据集中的每个特征相对于有效波高的重要性进行了排序,从而对第一波浪数据集进行特征选择,消除不相关或冗余的特征,为预测带来增益,提高预测模型的准确性;本实施例还通过构建带有基于记忆层的注意力机制的序列到序列模型,采用序列到序列模型对第二波浪数据集进行有效波高预测训练,获得训练好的序列到序列模型;通过训练好的序列到序列模型对待预测数据进行有效波高预测,获得最终有效波高预测值,通过构建带有基于记忆层的注意力机制的序列到序列网络,以减少长序列预测中遗忘问题的发生,同时可较好地捕捉有效波高的突变,进一步提高预测模型的准确性,从而提高有效波高预测精度,对异常值有更好的预测效果。
参照图3,本发明实施例提供了一种基于序列到序列网络的有效波高预测***,包括:
第一波浪数据集获取单元100,用于获取原始波浪数据集,在原始波浪数据集中加入滞后变量,获得第一波浪数据集;
第二波浪数据集获取单元200,用于使用随机森林算法对第一波浪数据集进行特征选择,获得第二波浪数据集;
序列到序列模型训练单元300,用于构建带有基于记忆层的注意力机制的序列到序列模型,采用序列到序列模型对第二波浪数据集进行有效波高预测训练,获得训练好的序列到序列模型;
最终有效波高预测值获取单元400,用于通过训练好的序列到序列模型对待预测数据进行有效波高预测,获得最终有效波高预测值。
需要说明的是,由于本实施例中的一种基于序列到序列网络的有效波高预测***与上述的一种基于序列到序列网络的有效波高预测方法基于相同的发明构思,因此,方法实施例中的相应内容同样适用于本***实施例,此处不再详述。
本发明实施例还提供了一种基于序列到序列网络的有效波高预测设备,包括:至少一个控制处理器和用于与至少一个控制处理器通信连接的存储器。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
实现上述实施例的一种基于序列到序列网络的有效波高预测方法所需的非暂态软件程序以及指令存储在存储器中,当被处理器执行时,执行上述实施例中的一种基于序列到序列网络的有效波高预测方法,例如,执行以上描述的图1中的方法步骤S100至步骤S400。
以上所描述的***实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个控制处理器执行,可使得上述一个或多个控制处理器执行上述方法实施例中的一种基于序列到序列网络的有效波高预测方法,例如,执行以上描述的图1中的方法步骤S100至S400的功能。
通过以上的实施方式的描述,本领域技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现。本领域技术人员可以理解实现上述实施例方法中的全部或部分流程是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(ReadOnly Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上是对本发明的较佳实施进行了具体说明,但本发明并不局限于上述实施方式,熟悉本领域的技术人员在不违背本发明精神的共享条件下还可作出种种等同的变形或替换,这些等同的变形或替换均包括在本发明权利要求所限定的范围内。

Claims (10)

1.一种基于序列到序列网络的有效波高预测方法,其特征在于,包括步骤:
获取原始波浪数据集,在所述原始波浪数据集中加入滞后变量,获得第一波浪数据集;
使用随机森林算法对所述第一波浪数据集进行特征选择,获得第二波浪数据集;
构建带有基于记忆层的注意力机制的序列到序列模型,采用所述序列到序列模型对所述第二波浪数据集进行有效波高预测训练,获得训练好的序列到序列模型;
通过所述训练好的序列到序列模型对待预测数据进行有效波高预测,获得最终有效波高预测值。
2.根据权利要求1所述的一种基于序列到序列网络的有效波高预测方法,其特征在于,所述获取原始波浪数据集,在所述原始波浪数据集中加入滞后变量,获得第一波浪数据集,包括:
将所述原始波浪数据集中的当前波浪数据的历史有效波高数据作为滞后变量加入到所述原始波浪数据集中,获得第一波浪数据集。
3.根据权利要求1所述的一种基于序列到序列网络的有效波高预测方法,其特征在于,所述使用随机森林算法对所述第一波浪数据集进行特征选择,获得第二波浪数据集,包括:
获取所述第一波浪数据集的有效波高观测值,初始化历史相关系数为零,初始化第二波浪数据集为空数据集,初始化耐心值为零,预设最大耐心值;
使用随机森林算法对所述第一波浪数据集中的特征按特征重要性由高到低进行排序,获得排好序的第一波浪数据集;
将所述排好序的第一波浪数据集中的特征按特征重要性由高到低依次添加到所述第二波浪数据集中,每添加一次数据到所述第二波浪数据集中时,则通过神经网络计算一次有效波高预测值;
计算所述有效波高预测值与所述有效波高观测值之间的当前相关系数,将所述当前相关系数和所述历史相关系数进行判断:
若所述当前相关系数大于所述历史相关系数,则将所述第一波浪数据集中的特征添加到所述第二波浪数据集中;
若所述当前相关系数小于或等于所述历史相关系数,则将所述耐心值增加一,并移除所述当前相关系数对应的所述第一波浪数据集中的特征;
在第一波浪数据集中的所有数据判断完或所述耐心值增加到大于所述最大耐心值后结束判断,获得特征选择后的第二波浪数据集。
4.根据权利要求1所述的一种基于序列到序列网络的有效波高预测方法,其特征在于,所述构建带有基于记忆层的注意力机制的序列到序列模型,包括:
采用门控递归单元网络作为编码器和解码器,基于所述编码器和所述解码器挖掘时间序列中前后值之间的关系;
在注意力机制中增加记忆层,根据所述编码器、所述解码器和所述注意力机制构建序列到序列模型。
5.根据权利要求4所述的一种基于序列到序列网络的有效波高预测方法,其特征在于,通过如下公式建立所述编码器:
Input:X=(x1,x2,...,xt)
zt=σ(Wz·[ht-1,xt])
rt=σ(Wr·[ht-1,xt])
Figure FDA0003697344330000031
Output:
Figure FDA0003697344330000032
其中,X表示门控递归单元网络中每个单元的当前输入数据集,xt表示当前时刻的数据,ht-1表示从前一时刻t-1传递过来的隐藏状态,zt表示更新门,rt表示重置门,
Figure FDA0003697344330000033
表示当前时刻的中间记忆,所述中间记忆表示前一时刻的记忆与当前时刻的记忆的输入结合,Wz表示所述更新门zt的权值矩阵,Wr表示所述重置门rt的权值矩阵,W表示所述中间记忆
Figure FDA0003697344330000034
的权值矩阵,ht表示当前时刻隐藏状态,Input表示门控递归单元网络的输入,Output表示门控递归单元网络的输出。
6.根据权利要求5所述的一种基于序列到序列网络的有效波高预测方法,其特征在于,通过如下公式建立所述解码器:
Input:X=(c1,c2,...,ck)
s0=ht
zk=σ(Wz·[sk-1,ck])
rk=σ(Wr·[sk-1,ck])
Figure FDA0003697344330000035
Figure FDA0003697344330000036
Output:yk=sk
其中,X表示解码器的输入,所述解码器的输入通过注意力机制获得,s0=ht表示所述编码器的最后一个隐藏状态ht被用作解码器隐藏层的初始输入s0,zk表示更新门,rk表示重置门,
Figure FDA0003697344330000041
表示当前时刻的中间记忆,所述中间记忆表示前一时刻的记忆与当前时刻的记忆的输入结合,Wz表示所述更新门zk的权值矩阵,Wr表示所述重置门rk的权值矩阵,W表示所述中间记忆
Figure FDA0003697344330000042
的权值矩阵,sk表示当前时刻隐藏状态,yk=sk表示将当前时刻隐藏状态sk作为门控递归单元网络的输出yk
7.根据权利要求6所述的一种基于序列到序列网络的有效波高预测方法,其特征在于,通过如下公式建立所述注意力机制:
score(hi,sj)=vTtanh(W[hi;sj]+b)
ωij=Softmax((score(hi,sj)))
Figure FDA0003697344330000043
Figure FDA0003697344330000044
其中,hi表示所述编码器在i时刻的隐藏状态,sj表示所述解码器在j时刻的隐藏状态,根据所述hi和所述sj获得对应的输出分数,vT和b表示神经网络中的偏置参数,ωij表示通过softmax函数归一化分数来计算所述编码器与所述解码器隐藏状态之间的权重,
Figure FDA0003697344330000045
表示所述编码器输出的加权平均值,cj+1表示记忆层,所述记忆层将所述编码器中隐藏单元的输出hj用于下一时刻的预测,通过所述hj和所述
Figure FDA0003697344330000046
在特征维上拼接,并进行线性变换后获得的tj+1时刻解码器的输入。
8.一种基于序列到序列网络的有效波高预测***,其特征在于,包括:
第一波浪数据集获取单元,用于获取原始波浪数据集,在所述原始波浪数据集中加入滞后变量,获得第一波浪数据集;
第二波浪数据集获取单元,用于使用随机森林算法对所述第一波浪数据集进行特征选择,获得第二波浪数据集;
序列到序列模型训练单元,用于构建带有基于记忆层的注意力机制的序列到序列模型,采用所述序列到序列模型对所述第二波浪数据集进行有效波高预测训练,获得训练好的序列到序列模型;
最终有效波高预测值获取单元,用于通过所述训练好的序列到序列模型对待预测数据进行有效波高预测,获得最终有效波高预测值。
9.一种基于序列到序列网络的有效波高预测设备,其特征在于,包括至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器;所述存储器存储有可被所述至少一个控制处理器执行的指令,所述指令被所述至少一个控制处理器执行,以使所述至少一个控制处理器能够执行如权利要求1至7任一项所述的一种基于序列到序列网络的有效波高预测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至7任一项所述的一种基于序列到序列网络的有效波高预测方法。
CN202210678407.4A 2022-06-16 2022-06-16 一种基于序列到序列网络的有效波高预测方法和*** Active CN115169439B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210678407.4A CN115169439B (zh) 2022-06-16 2022-06-16 一种基于序列到序列网络的有效波高预测方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210678407.4A CN115169439B (zh) 2022-06-16 2022-06-16 一种基于序列到序列网络的有效波高预测方法和***

Publications (2)

Publication Number Publication Date
CN115169439A true CN115169439A (zh) 2022-10-11
CN115169439B CN115169439B (zh) 2023-07-07

Family

ID=83485931

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210678407.4A Active CN115169439B (zh) 2022-06-16 2022-06-16 一种基于序列到序列网络的有效波高预测方法和***

Country Status (1)

Country Link
CN (1) CN115169439B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115711612A (zh) * 2022-11-02 2023-02-24 中国人民解放军国防科技大学 一种波浪有效波高的预测方法
CN116340868A (zh) * 2023-03-27 2023-06-27 中国科学院南海海洋研究所 一种基于机器学习的波浪特征集合预报方法及装置
CN116449462A (zh) * 2023-06-19 2023-07-18 山东省计算中心(国家超级计算济南中心) 海浪有效波高时空序列预测方法、***、存储介质及设备
CN117791856A (zh) * 2023-12-20 2024-03-29 武汉人云智物科技有限公司 一种基于巡检机器人的电网故障预警方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104050514A (zh) * 2014-05-29 2014-09-17 河海大学 一种基于再分析数据的海浪有效波高的长期趋势预测方法
CN113159389A (zh) * 2021-03-25 2021-07-23 大连海事大学 一种基于深度森林生成对抗网络的金融时间序列预测方法
CN114398819A (zh) * 2021-11-26 2022-04-26 中国石油大学(华东) 一种基于深度学习的非结构网格有效波高预测方法与***
CN114445634A (zh) * 2022-02-28 2022-05-06 南京信息工程大学 一种基于深度学习模型的海浪波高预测方法及***
CN114519311A (zh) * 2022-04-21 2022-05-20 中国海洋大学 全港池波浪有效波高的预测方法、***、存储介质、应用
CN114549925A (zh) * 2022-01-18 2022-05-27 大连理工大学 一种基于深度学习的海浪有效波高时间序列预测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104050514A (zh) * 2014-05-29 2014-09-17 河海大学 一种基于再分析数据的海浪有效波高的长期趋势预测方法
CN113159389A (zh) * 2021-03-25 2021-07-23 大连海事大学 一种基于深度森林生成对抗网络的金融时间序列预测方法
CN114398819A (zh) * 2021-11-26 2022-04-26 中国石油大学(华东) 一种基于深度学习的非结构网格有效波高预测方法与***
CN114549925A (zh) * 2022-01-18 2022-05-27 大连理工大学 一种基于深度学习的海浪有效波高时间序列预测方法
CN114445634A (zh) * 2022-02-28 2022-05-06 南京信息工程大学 一种基于深度学习模型的海浪波高预测方法及***
CN114519311A (zh) * 2022-04-21 2022-05-20 中国海洋大学 全港池波浪有效波高的预测方法、***、存储介质、应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JICHAO WANG 等: "Forecasting of significant wave height based on gated recurrent unit network in the taiwan strait and its adjacent waters", 《WATER》, pages 1 - 21 *
MOHAMMAD PIRHOOSHYARAN 等: "Forecasting, hindcasting and feature selection of ocean waves via recurrent and sequence-to-sequence networks", 《OCEAN ENGINEERING》, pages 1 - 14 *
NAWIN RAJ 等: "An EEMD-BiLSTM Algorithm Integrated with Boruta Random Forest Optimiser for Significant Wave Height Forecasting along Coastal Areas of Queensland, Australia", 《REMOTE SENSING》, pages 1 - 20 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115711612A (zh) * 2022-11-02 2023-02-24 中国人民解放军国防科技大学 一种波浪有效波高的预测方法
CN115711612B (zh) * 2022-11-02 2024-06-11 中国人民解放军国防科技大学 一种波浪有效波高的预测方法
CN116340868A (zh) * 2023-03-27 2023-06-27 中国科学院南海海洋研究所 一种基于机器学习的波浪特征集合预报方法及装置
CN116449462A (zh) * 2023-06-19 2023-07-18 山东省计算中心(国家超级计算济南中心) 海浪有效波高时空序列预测方法、***、存储介质及设备
CN116449462B (zh) * 2023-06-19 2023-10-03 山东省计算中心(国家超级计算济南中心) 海浪有效波高时空序列预测方法、***、存储介质及设备
CN117791856A (zh) * 2023-12-20 2024-03-29 武汉人云智物科技有限公司 一种基于巡检机器人的电网故障预警方法及装置

Also Published As

Publication number Publication date
CN115169439B (zh) 2023-07-07

Similar Documents

Publication Publication Date Title
CN115169439B (zh) 一种基于序列到序列网络的有效波高预测方法和***
CN110245801A (zh) 一种基于组合挖掘模型的电力负荷预测方法及***
CN112668804B (zh) 一种地波雷达船只断裂航迹预测方法
CN112712214B (zh) 海事搜救对象轨迹预测方法、***、装置和存储介质
Lopes et al. Artificial neural networks approaches for predicting the potential for hydropower generation: a case study for Amazon region
CN114912673A (zh) 一种基于鲸鱼优化算法和长短时记忆网络的水位预测方法
CN109460874B (zh) 一种基于深度学习的有义波高预测方法
Suryo et al. Improved time series prediction using LSTM neural network for smart agriculture application
CN115545334B (zh) 土地利用类型预测方法、装置、电子设备及存储介质
CN115018193A (zh) 基于lstm-ga模型的时间序列风能数据预测方法
CN112508177A (zh) 一种网络结构搜索方法、装置、电子设备及存储介质
Cruz et al. Prediction intervals with LSTM networks trained by joint supervision
CN117271979A (zh) 一种基于深度学习的赤道印度洋表层海流流速预测方法
CN116822722A (zh) 水位预测方法、***、装置、电子设备及介质
CN111428420B (zh) 海表流流速预测方法、装置、计算机设备和存储介质
Brunner et al. Using state predictions for value regularization in curiosity driven deep reinforcement learning
CN114139783A (zh) 基于非线性加权组合的风电短期功率预测方法及装置
Doudkin et al. Spacecraft Telemetry Time Series Forecasting With Ensembles of Neural Networks
Shi et al. An Attention-based Context Fusion Network for Spatiotemporal Prediction of Sea Surface Temperature
CN116070714B (zh) 基于联邦学习和神经架构搜索的云边协同训练方法及***
Abdelkader et al. On the Utilization of an Ensemble of Meta-Heuristics for Simulating Energy Consumption in Buildings
Tan et al. OSP-FEAN: Optimizing Significant Wave Height Prediction with Feature Engineering and Attention Network
CN116339130B (zh) 基于模糊规则的飞行任务数据获取方法、装置及设备
Navarro et al. Deep Learning Approach for the Prediction of the Concentration of Chlorophyll A in Seawater. A Case Study in El Mar Menor (Spain)
Chen et al. Intelligent prediction of wave loads based on multi-source data-driven methods

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant