CN114912077B - 一种融合随机搜索与混合分解误差订正的海浪预报方法 - Google Patents

一种融合随机搜索与混合分解误差订正的海浪预报方法 Download PDF

Info

Publication number
CN114912077B
CN114912077B CN202210591957.2A CN202210591957A CN114912077B CN 114912077 B CN114912077 B CN 114912077B CN 202210591957 A CN202210591957 A CN 202210591957A CN 114912077 B CN114912077 B CN 114912077B
Authority
CN
China
Prior art keywords
sea wave
wave
forecasting
decomposition
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210591957.2A
Other languages
English (en)
Other versions
CN114912077A (zh
Inventor
王智峰
柏根
王平
左丽明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hebei Hydrological Engineering Geological Exploration Institute Hebei Remote Sensing Center
Ocean University of China
Original Assignee
Hebei Hydrological Engineering Geological Exploration Institute Hebei Remote Sensing Center
Ocean University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hebei Hydrological Engineering Geological Exploration Institute Hebei Remote Sensing Center, Ocean University of China filed Critical Hebei Hydrological Engineering Geological Exploration Institute Hebei Remote Sensing Center
Priority to CN202210591957.2A priority Critical patent/CN114912077B/zh
Publication of CN114912077A publication Critical patent/CN114912077A/zh
Application granted granted Critical
Publication of CN114912077B publication Critical patent/CN114912077B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Tourism & Hospitality (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Development Economics (AREA)
  • Computational Mathematics (AREA)
  • Marketing (AREA)
  • Mathematical Analysis (AREA)
  • Operations Research (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Algebra (AREA)
  • Educational Administration (AREA)
  • Primary Health Care (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Biology (AREA)
  • Entrepreneurship & Innovation (AREA)

Abstract

一种融合随机搜索与混合分解误差订正的海浪预报方法,涉及人工智能技术领域,包括:步骤1、获取基于浮标观测的浮标历史观测数据,整合处理同海浪变化密切相关的海洋、气象资料,构建海浪预报数据库;步骤2、敏感性因子分析;步骤3、构建海浪预报模型;步骤4、获取海浪预报误差时间序列,将预报误差与初始预报波高相加,得到订正后的预报海浪波高。本发明参考数值预报模型的输入,以预报时刻的海浪相关要素进行数据驱动,同时对模型超参数进行自动化寻优以优化模型结构,并结合数据分解算法与深度学习的混合分解误差订正模型对海浪预报进行误差订正,以提高基于深度学习的海浪预报精度,提高预报时效性,降低海浪预报时滞。

Description

一种融合随机搜索与混合分解误差订正的海浪预报方法
技术领域
本发明涉及人工智能技术领域,具体涉及一种融合随机搜索与混合分解误差订正的海浪预报方法。
背景技术
我国地域广阔,海岸线漫长,沿海地区人口密集,海上活动频繁,同时也是饱受海浪灾害侵扰的国家之一。据国家***在2021年发布的《2020年中国海洋灾害公报》显示[1]:海浪灾害仍然是我国海洋灾害主要构成之一,2020年我国各类海洋灾害共造成直接经济损失8.32亿元,死亡(含失踪)6人。其中,人员死亡(含失踪)全部由海浪灾害造成。近海共发生有效波高4.0米(含)以上的灾害性海浪过程36次,海浪灾害发生8次,造成船舶损毁22艘。
因此,及时、准确的海浪预报对于沿海工程建设、海上作业、船舶航行安全等方面都具有重要意义。然而,由于波浪成因复杂,且波浪本身有很强的非线性,这使得精准的海浪预报十分困难。海浪预报发展至今共经历了传统海浪预报,数值海浪预报、机器学***衡导出谱的预报方法等。
随着二十世纪以来计算机计算能力的提升和人们对海浪机理认识的不断加深,海浪的数值预报方法被提出,并得到人们的重视。自五十年代中期开始,数值预报模式不断突破技术瓶颈,至今发展到第三代的海浪数值模式,突破了过去不能适应风场快速变化的难题,并充分考虑了包括波间非线性作用在内的各项波浪生成与耗散物理过程,成为当今海浪预报的主流模式。目前应用较为广泛的主要有WAM模式、SWAN(Surface Wave Models)模式、WAVEWATCHIII模式。其中SWAN模式采用了全隐式计算方法并考虑了浅水中波浪传播、绕射、破碎、反射等物理过程而常被应用于分辨率500米到十几公里的沿海区域,而WAM和WAVEWATCHIII则使用了显式或半隐式差分技术并考虑了涌浪与风浪的耗散、风能量输入等过程通常被应用于20公里以上的大洋尺度。
近年来随着机器学习方法的快速发展,引起了众多国内外学者的关注,也为海浪预报提供了一种新的思路。机器学习是一门包含数理统计、高等数学、计算机等多门学科的交叉学科。机器学习方法具有很好的自适应学习和非线性映射能力,对事物发生的物理机制不需要了解得很清楚,因此适合用来处理物理机制复杂、因果关系和推理规则难以确定的非线性问题。此外,海洋气象观测资料和海洋气象再分析数据在种类和数量上都随着科学的进步和计算机技术的突飞猛进而大幅度增加,很好的解决了机器学习所需的数据问题。而深度学习作为机器学习近十年来最热门的细分领域,在语音识别、图像分类等领域都展现出了强大的优势,解决了许多长期以来在机器学习历史上非常困难的问题,而且在海洋领域具有巨大的应用潜力。
目前深度学习的海浪预报主要分为两种:一种是以结合海浪相关要素作为模型输入进行预报,如Fan等人以波高、风速和风向为输入构建了基于LSTM的波浪预测模型。结果表明,LSTM算法在波浪预报方面优于BP神经网络、极端学习机(ELM)、支持向量机(SVM)、残差网络(ResNet)和随机森林(RF)算法。另一种是结合数据分解方法以历史波高的分解子序列作为输入,如Deka等人基于离散小波分解与人工神经网络ANN结合的混合波高预测模型进行波高预测,证明了其结果优于ANN模型。
传统海浪预报方法虽然在波浪预报中发挥了一定的作用,但在预报区域、不同波浪过程的普适性和准确度上仍然存在一定局限。作为目前主流的海浪预报模型,数值模型的求解主要基于能量平衡方程,该方法存在计算量大、非收敛等问题,短时间内难以解决。虽然深度学习在海浪预报中得到了广泛的应用,但基于海浪要素作为输入的深度学习模型通常所考虑要素为历史时刻的要素,其相关性与影响程度远低于预报时刻,这也导致了基于该方法的深度学习预报模型预报精度与时效性低于以预报时刻数值风浪要素驱动的预报模型。基于数据分解方法的深度学习预报模型虽然降低了海浪的非线性,但无法考虑其他要素的影响,只能基于历史海浪自身规律,也导致了其精度存在着不足。同时,深度神经网络模型中有许多超参数需要调节,如模型层数、单元个数、激活函数、优化器与学习率等,这些超参数无法通过神经网络的训练过程而不断迭代优化,而是需要人为设定。目前在海浪预报的深度学习研究中,超参数的调节多为手动选取。这种手动调节超参数的方法,不仅浪费大量时间,而且无法充分发挥模型的性能。而目前基于深度学习的海浪预报订正模型相关研究仍十分有限,其主要应用领域也为在数据预报模型的误差订正中。
发明内容
本发明提供了一种融合随机搜索与混合分解误差订正的海浪预报方法,目的是参考数值预报模型的输入,以预报时刻的海浪相关要素进行数据驱动,同时对模型超参数进行自动化寻优以优化模型结构,并结合数据分解算法与深度学习的混合分解误差订正模型对海浪预报进行误差订正,以提高基于深度学习的海浪预报精度,提高预报时效性,降低海浪预报时滞。
为达到上述目的,本发明的技术方案如下:
一种融合随机搜索与混合分解误差订正的海浪预报方法,包括:步骤1、获取基于浮标观测的浮标历史观测数据,整合处理同海浪变化密切相关的海洋、气象资料,构建海浪预报数据库;步骤2、敏感性因子分析,确定海浪预报模型的输入参数与步长;步骤3、构建海浪预报模型;步骤4、获取海浪预报误差时间序列,将预报误差与初始预报波高相加,得到订正后的预报海浪波高。
优选的,所述的步骤1中,将风速、风向、气温、气压、温度、湿度、波高、波向、波周期作为海浪预报模型的待评估输入参数。
优选的,所述的步骤2包括如下具体步骤:应用Hampel滤波器对数据异常值进行剔除,定义离群值为在window指定的窗口长度内,与局部中位数相差超过三倍局部换算MAD的元素;应用三次多项式插值对缺失值进行填补处理,采用皮尔逊相关系数对海浪相关要素进行相关性分析,将数量级不同的输入参数归一化;通过输入步长测试确定最佳输入特征与对应步长;
所述的皮尔逊相关系数的计算公式如下:
Figure GDA0004199691570000031
式(1)中:n为序列长度,oi为波高序列值,
Figure GDA0004199691570000032
为波高序列的平均值,ui为待评估输入参数,/>
Figure GDA0004199691570000033
为待评估输入变量的平均值;
将数量级不同的输入参数归一化的计算公式如下:
Datanor=(Datanor,max-Datanor,min)·(Data-Datamin)/(Datamax-Datamin)+Datanor,min (2)
式(2)中:Datanor为归一化之后的序列,Datanor,max为归一化区间上限,Datanor,min为归一化区间下限,Data为归一化前的序列,Datamax为归一化前序列的最大值,Datamin为归一化前的最小值。
优选的,所述的步骤2中,确定海浪预报模型输入参数的步骤如下:
(a)采用皮尔逊相关系数对海浪相关要素进行相关性分析,根据分析结果,选取海浪相关要素作为待评估输入参数,选取具有1~k个步长的待评估输入参数与过去时刻的有效波高作为输入,输入到海浪预报模型中;
(b)进行海浪预报模型的训练,并评估预报结果;
(c)如果加入具有k个步长的待评估输入参数后模型精度提高,则保留待评估输入参数,直至输入具有k+1个步长的待评估输入参数时精度降低;
(d)保留上一个优化后的变量,再加入剩下变量中相关性最高的新变量作为待评估输入参数;
(e)重复步骤(a)到(d),直至所有待评估输入参数测试完成;
(f)依据上述步骤中测试的测试结果得到海浪预报模型的输入参数。
优选的,所述的步骤3包括如下具体步骤:采用长短期记忆神经网络作为海浪预报模型,划分训练集和验证集,采用随机搜索算法优化海浪预报模型的超参数,输出预报结果。
优选的,所述的步骤3中,长短期记忆神经网络通过门式单元结构解决梯度消失与梯度***问题,通过输入门(it)、遗忘门(ft)、输出门(ot)和记忆单元来控制信息选择性的进入到记忆单元中保存或者遗忘;每个门通过激活函数Sigmoid来进行控制输出;
Sigmoid函数的定义为:
Figure GDA0004199691570000041
it=σ(Wi·[St-1,xt]+bi) (4)
ft=σ(Wf·[St-1,xt]+bf) (5)
ot=σ(Wo·[St-1,xt]+bo (6)
式(3)-(6)中,St-1表示t-1时刻的输出,xt表示当前时刻t的输入,σ表示Sigmoid激活函数,Wf、Wi、Wo分别为遗忘门、输入门、输出门的权重参数,bf、bi、bo分别为遗忘门、输入门、输出门的偏置系数。
优选的,所述的步骤3中,采用随机搜索算法进行超参数调节以优化包括神经网络层数、神经元数在内的模型结构,搜索策略如下:
(a)定义搜索空间;
(b)对于搜索范围是一个区间的超参数,根据给定的区间随机采样;对于搜索范围是有限个数的列表的超参数,在给定的列表中等概率采样;
(c)对(b)中得到的niter组采样结果,进行遍历;如果给定的搜索范围均为列表,则不放回抽样niter次;
(d)对满足约束条件的点,逐个比较其目标函数的值,抛弃误差大的组合,保留误差小的组合,最后便得到最优解的近似解。
优选的,所述的步骤4包括如下具体步骤:获取海浪预报误差时间序列,基于改进自适应噪声集合经验模态分解(ICEEMDAN)对误差时间序列进行分解,同样采用随机搜索算法优化混合误差订正模型结构,经过训练和验证后输出预报误差,将预报误差与初始预报波高相加,得到订正后的预报海浪波高。
优选的,所述的步骤4中,设海浪预报模型的预测值为
Figure GDA0004199691570000051
相应时刻的实测数据为
Figure GDA0004199691570000052
预测误差Ei表示为:
Figure GDA0004199691570000053
对误差序列进行纯随机性检验,即白噪声检验,确保误差时间序列存在自身规律;利用自相关系数进行检验,如果序列为白噪声,则该序列的延迟非零周期自相关系数近似服从均值为0;对于时间序列{Xt}而言,xt与xt-k之间的自相关系数的定义为:
Figure GDA0004199691570000054
式(8)中,Cov表示协方差,Var表示方差。当k=0时,ρ0=1;xt与xt-k的自相关系数的含义在于给出函数本身的相关性。
优选的,所述的步骤4中,改进自适应噪声集合经验模态分解(ICEEMDAN)是经验模态分解(EMD)的改进算法;EMD由Huang等人于1998年提出,是一种根据数据进行自适应分解的算法,该方法不需要人工划分分解层数,而是自适应分解,便利了学者的研究,其精度也经历了气象等领域预测的实验验证,通过EMD分解,原始数据可以分解为许多固有模态函数(IMFs)及一个残差项;其分解步骤如下:
(a)根据原始序列上下极值点求出上、下包络线;
(b)求出上下包络线的均值得到均值包络线;
(c)将原始数据减去均值包络线得到中间信号;
(d)判断中间信号是否满足1)在整个数据段内,极值点的个数和过零点的个数必须相等或相差最多不能超过一个;2)在任意时刻,由局部极大值点形成的上包络线和由局部极小值点形成的下包络线的平均值为零,即上、下包络线相对于时间轴局部对称;
(e)若不满足(d)中的两个条件,则以该中间信号为基础,重复(a)~(d);若满足条件,则将其视为一个IMF分量,将原始信号减去IMF分量,作为新的原始序列,重复(a)~(d),得到IMF2,…,直到余项包含少于2个极值,且不再需要进一步分解;
假设x为原始信号,Ek(·)是信号经EMD分解后的得到的第k个IMF分量,w(i)是均值为零的单位方差白噪声,M(·)为信号局部平均值;
改进自适应噪声集合经验模态分解(ICEEMDAN)的计算步骤如下:
(a)对L个叠加白噪声的混合原始信号进行EMD操作:
xi=x+β0E1(w(i)),i=1,...,L (9)
β0=λ0std(x)/std(E1(w(i))) (10)
式(10)中,std(·)表示计算标准差,推荐λ0值为0.2;
第一个余项计算公式为:
Figure GDA0004199691570000061
式(11)中:r表示残差分量;(b)第1模态分量IMF可以表示为如下:
IMF1(t)=x-r1(t) (12)
式(12)中:x为原始信号,r1(t)为第一个余项;
(c)计算第k个余项:
Figure GDA0004199691570000062
式(13)中:rk(t)为第k个余项
(d)计算第k个IMF分量:
IMFk(t)=rk-1(t)-rk(t),k=2,3,... (14)
(e)重复(c)与(d),直到余项不再需要进一步分解,原始序列的分解结果表示为如下:
Figure GDA0004199691570000063
式(15)中:x(t)为原始信号,IMF为模态分量,rn(t)为余项,n表示IMF的个数。
本发明一种融合随机搜索与混合分解误差订正的海浪预报方法的有益效果:
1.本发明采用敏感性因子分析、随机搜索算法确定预报模型输入参数和模型结构,实现了及时准确的快速海浪波高预报。
2.本发明提供了基于混合分解的海浪预报误差订正技术,减少了模型的时滞性、提高了预报精度和预报时效。
附图说明
图1、本发明的技术路线图。
具体实施方式
以下所述,是以阶梯递进的方式对本发明的实施方式详细说明,该说明仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
本发明的描述中,需要说明的是,术语“上”“下”“左”“右”“顶”“底”“内”“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以及特定的方位构造和操作,因此不能理解为对本发明的限制。
请参考图1所示:
一种融合随机搜索与混合分解误差订正的海浪预报方法,包括:步骤1、获取基于浮标观测的浮标历史观测数据,整合处理同海浪变化密切相关的海洋、气象资料,构建海浪预报数据库;步骤2、敏感性因子分析,确定海浪预报模型的输入参数与步长;;步骤3、构建海浪预报模型;步骤4、获取海浪预报误差时间序列,得到订正后的预报海浪波高。
所述的步骤1中,将风速、风向、气温、气压、温度、湿度、波高、波向、波周期作为海浪预报模型的待评估输入参数
所述的步骤2包括如下具体步骤:应用Hampel滤波器对数据异常值进行剔除,定义离群值为在window指定的窗口长度内,与局部中位数相差超过三倍局部换算MAD的元素;应用三次多项式插值对缺失值进行填补处理,其原理是逐次以三次曲线的极小点逼近所求函数,从而求得待求函数的近似最小点的一种迭代算法;采用皮尔逊相关系数对海浪相关要素进行相关性分析,将数量级不同的输入参数归一化;通过输入步长测试确定最佳输入特征与对应步长;
所述的皮尔逊相关系数的计算公式如下:
Figure GDA0004199691570000071
式(1)中:n为序列长度,oi为波高序列值,
Figure GDA0004199691570000072
为波高序列的平均值,ui为待评估输入参数,/>
Figure GDA0004199691570000073
为待评估输入变量的平均值;
将数量级不同的输入参数归一化的计算公式如下:
Datanor=(Datanor,max-Datanor,min)·(Data-Datamin)/(Datamax-Datamin)+Datanor,min (2)
式(2)中:Datanor为归一化之后的序列,Datanor,max为归一化区间上限,Datanor,min为归一化区间下限,Data为归一化前的序列,Datamax为归一化前序列的最大值,Datamin为归一化前的最小值。
所述的步骤2中,确定海浪预报模型输入参数的步骤如下:
(a)采用皮尔逊相关系数对海浪相关要素进行相关性分析,根据分析结果,选取海浪相关要素作为待评估输入参数,选取具有1~k个步长的待评估输入参数与过去时刻的有效波高作为输入,输入到海浪预报模型中;
(b)进行海浪预报模型的训练,并评估预报结果;
(c)如果加入具有k个步长的待评估输入参数后模型精度提高,则保留待评估输入参数,直至输入具有k+1个步长的待评估输入参数时精度降低;
(d)保留上一个优化后的变量,再加入剩下变量中相关性最高的新变量作为待评估输入参数;
(e)重复步骤(a)到(d),直至所有待评估输入参数测试完成;
(f)依据上述步骤中测试的测试结果得到海浪预报模型的输入参数。
所述的步骤3包括如下具体步骤:采用长短期记忆神经网络作为海浪预报模型,划分训练集和验证集,采用随机搜索算法优化海浪预报模型的超参数,输出预报结果。
所述的步骤3中,长短期记忆神经网络作为循环神经网络的一个变体,通过其独特的门式单元结构解决了循环神经网络中的梯度消失与梯度***问题;门表现为筛选信息进入记忆单元的一种方式,通过输入门(it)、遗忘门(ft)、输出门(ot)和记忆单元来控制信息选择性的进入到记忆单元中保存或者遗忘;每个门通过激活函数Sigmoid来进行控制输出;Sigmoid函数的定义为:
Figure GDA0004199691570000081
it=σ(Wi·[St-1,xt]+bi) (4)
ft=σ(Wf·[St-1,xt]+bf) (5)
ot=σ(Wo·[St-1,xt]+bo) (6)
式(3)-(6)中,St-1表示t-1时刻的输出,xt表示当前时刻t的输入,σ表示Sigmoid激活函数,Wf、Wi、Wo分别为遗忘门、输入门、输出门的权重参数,bf、bi、bo分别为遗忘门、输入门、输出门的偏置系数。
所述的步骤3中,采用随机搜索算法进行超参数调节以优化包括神经网络层数、神经元数在内的模型结构,搜索策略如下:
(a)定义搜索空间;
(b)对于搜索范围是一个区间的超参数,根据给定的区间随机采样;对于搜索范围是有限个数的列表的超参数,在给定的列表中等概率采样;
(c)对(b)中得到的niter组采样结果,进行遍历;如果给定的搜索范围均为列表,则不放回抽样niter次;
(d)对满足约束条件的点,逐个比较其目标函数的值,抛弃误差大的组合,保留误差小的组合,最后便得到最优解的近似解。
所述的步骤4包括如下具体步骤:获取海浪预报误差时间序列,基于改进自适应噪声集合经验模态分解(ICEEMDAN)对误差时间序列进行分解,同样采用随机搜索算法优化混合误差订正模型结构,经过训练和验证后输出预报误差,将预报误差与初始预报波高相加,得到订正后的预报海浪波高。
所述的步骤4中,设海浪预报模型的预测值为
Figure GDA0004199691570000093
相应时刻的实测数据为/>
Figure GDA0004199691570000094
预测误差Ei表示为:
Figure GDA0004199691570000091
对误差序列进行纯随机性检验,即白噪声检验,确保误差时间序列存在自身规律;利用自相关系数进行检验,如果序列为白噪声,则该序列的延迟非零周期自相关系数近似服从均值为0;对于时间序列{Xt}而言,xt与xt-k之间的自相关系数的定义为:
Figure GDA0004199691570000092
式(8)中,Cov表示协方差,Var表示方差。当k=0时,ρ0=1;xt与xt-k的自相关系数的含义在于给出函数本身的相关性。
所述的步骤4中,改进自适应噪声集合经验模态分解(ICEEMDAN)是经验模态分解(EMD)的改进算法。EMD由Huang等人于1998年提出,是一种根据数据进行自适应分解的算法。该方法不需要人工划分分解层数,而是自适应分解,便利了学者的研究,其精度也经历了气象等领域预测的实验验证。通过EMD分解,原始数据可以分解为许多固有模态函数(IMFs)及一个残差项。其分解步骤如下:
(a)根据原始序列上下极值点求出上、下包络线;
(b)求出上下包络线的均值得到均值包络线;
(c)将原始数据减去均值包络线得到中间信号;
(d)判断中间信号是否满足1)在整个数据段内,极值点的个数和过零点的个数必须相等或相差最多不能超过一个;2)在任意时刻,由局部极大值点形成的上包络线和由局部极小值点形成的下包络线的平均值为零,即上、下包络线相对于时间轴局部对称;
(e)若不满足(d)中的两个条件,则以该中间信号为基础,重复(a)~(d);若满足条件,则将其视为一个IMF分量,将原始信号减去IMF分量,作为新的原始序列,重复(a)~(d),得到IMF2,…,直到余项包含少于2个极值,且不再需要进一步分解;
假设x为原始信号,Ek(·)是信号经EMD分解后的得到的第k个IMF分量,w(i)是均值为零的单位方差白噪声,M(·)为信号局部平均值;改进自适应噪声集合经验模态分解(ICEEMDAN)的计算步骤如下:
(a)对L个叠加白噪声的混合原始信号进行EMD操作:
Figure GDA0004199691570000101
式(10)中,std(·)表示计算标准差,推荐λ0值为0.2;
第一个余项计算公式为:
Figure GDA0004199691570000102
式(11)中:r表示残差分量;(b)第1模态分量IMF可以表示为如下:
IMF1(t)=x-r1(t) (12)
式(12)中:x为原始信号;
(c)计算第k个余项:
Figure GDA0004199691570000103
式(13)中:rk(t)为第k个余项;
(d)计算第k个IMF分量:
IMFk(t)=rk-1(t)-rk(t),k=2,3,... (14)
(e)重复(c)与(d),直到余项不再需要进一步分解,原始序列的分解结果表示为如下:
Figure GDA0004199691570000111
式(15)中:x(t)为原始信号,IMF为模态分量,rn(t)为余项,n表示IMF的个数。

Claims (6)

1.一种融合随机搜索与混合分解误差订正的海浪预报方法,其特征为:包括:步骤1、获取基于浮标观测的浮标历史观测数据,整合处理同海浪变化密切相关的海洋、气象资料,构建海浪预报数据库;步骤2、敏感性因子分析,确定海浪预报模型的输入参数与步长;步骤3、构建海浪预报模型;步骤4、获取海浪预报误差时间序列,将预报误差与初始预报波高相加,得到订正后的预报海浪波高;
所述的步骤1中,将风速、风向、气温、气压、温度、湿度、波高、波向、波周期作为海浪预报模型的待评估输入参数;
所述的步骤2包括如下具体步骤:应用Hampel 滤波器对数据异常值进行剔除,定义离群值为在 window 指定的窗口长度内,与局部中位数相差超过三倍局部换算 MAD 的元素;应用三次多项式插值对缺失值进行填补处理,采用皮尔逊相关系数对海浪相关要素进行相关性分析,将数量级不同的输入参数归一化;通过输入步长测试确定最佳输入特征与对应步长;
所述的皮尔逊相关系数的计算公式如下:
Figure QLYQS_1
(1)
式(1)中:n为序列长度,
Figure QLYQS_2
为波高序列值,/>
Figure QLYQS_3
为波高序列的平均值,/>
Figure QLYQS_4
为待评估输入参数,/>
Figure QLYQS_5
为待评估输入变量的平均值;
将数量级不同的输入参数归一化的计算公式如下:
Figure QLYQS_6
(2)
式(2)中:
Figure QLYQS_7
为归一化之后的序列,/>
Figure QLYQS_8
为归一化区间上限,/>
Figure QLYQS_9
为归一化区间下限,/>
Figure QLYQS_10
为归一化前的序列,/>
Figure QLYQS_11
为归一化前序列的最大值,/>
Figure QLYQS_12
为归一化前的最小值;
所述的步骤2中,确定海浪预报模型输入参数的步骤如下:
(a)采用皮尔逊相关系数对海浪相关要素进行相关性分析,根据分析结果,选取海浪相关要素作为待评估输入参数,选取具有1~k个步长的待评估输入参数与过去时刻的有效波高作为输入,输入到海浪预报模型中;
(b)进行海浪预报模型的训练,并评估预报结果;
(c)如果加入具有k个步长的待评估输入参数后模型精度提高,则保留待评估输入参数,直至输入具有k+1个步长的待评估输入参数时精度降低;
(d)保留上一个优化后的变量,再加入剩下变量中相关性最高的新变量作为待评估输入参数;
(e)重复步骤(a)到(d),直至所有待评估输入参数测试完成;
(f)依据上述步骤中测试的测试结果得到海浪预报模型的输入参数;
所述的步骤4包括如下具体步骤: 获取海浪预报误差时间序列,基于改进自适应噪声集合经验模态分解对误差时间序列进行分解,同样采用随机搜索算法优化混合误差订正模型结构,经过训练和验证后输出预报误差,将预报误差与初始预报波高相加,得到订正后的预报海浪波高。
2.如权利要求1所述的一种融合随机搜索与混合分解误差订正的海浪预报方法,其特征为:所述的步骤3包括如下具体步骤:采用长短期记忆神经网络作为海浪预报模型,划分训练集和验证集,采用随机搜索算法优化海浪预报模型的超参数,输出预报结果。
3.如权利要求2所述的一种融合随机搜索与混合分解误差订正的海浪预报方法,其特征为:所述的步骤3中,长短期记忆神经网络通过门式单元结构解决梯度消失与梯度***问题,通过输入门(
Figure QLYQS_13
)、遗忘门(/>
Figure QLYQS_14
)、输出门(/>
Figure QLYQS_15
)和记忆单元来控制信息选择性的进入到记忆单元中保存或者遗忘;每个门通过激活函数Sigmoid来进行控制输出;
Sigmoid函数的定义为:
Figure QLYQS_16
(3)
Figure QLYQS_17
(4)
Figure QLYQS_18
(5)
Figure QLYQS_19
(6)
式(3)-(6)中,
Figure QLYQS_22
表示t-1时刻的输出,/>
Figure QLYQS_25
表示当前时刻t的输入,/>
Figure QLYQS_27
表示Sigmoid激活函数,/>
Figure QLYQS_21
、/>
Figure QLYQS_24
、/>
Figure QLYQS_26
分别为遗忘门、输入门、输出门的权重参数,/>
Figure QLYQS_28
、/>
Figure QLYQS_20
、/>
Figure QLYQS_23
分别为遗忘门、输入门、输出门的偏置系数。
4.如权利要求3所述的一种融合随机搜索与混合分解误差订正的海浪预报方法,其特征为:所述的步骤3中,采用随机搜索算法进行超参数调节以优化包括神经网络层数、神经元数在内的模型结构,搜索策略如下:
(a)定义搜索空间;
(b)对于搜索范围是一个区间的超参数,根据给定的区间随机采样;对于搜索范围是有限个数的列表的超参数,在给定的列表中等概率采样;
(c)对(b)中得到的niter组采样结果,进行遍历;如果给定的搜索范围均为列表,则不放回抽样niter次;
(d)对满足约束条件的点,逐个比较其目标函数的值,抛弃误差大的组合,保留误差小的组合,最后便得到最优解的近似解。
5.如权利要求4所述的一种融合随机搜索与混合分解误差订正的海浪预报方法,其特征为:所述的步骤4中,设海浪预报模型的预测值为
Figure QLYQS_29
,相应时刻的实测数据为/>
Figure QLYQS_30
,预测误差/>
Figure QLYQS_31
表示为:
Figure QLYQS_32
(7)
对误差序列进行纯随机性检验,即白噪声检验,确保误差时间序列存在自身规律;利用自相关系数进行检验,如果序列为白噪声,则该序列的延迟非零周期自相关系数近似服从均值为0;对于时间序列
Figure QLYQS_33
而言,/>
Figure QLYQS_34
与/>
Figure QLYQS_35
之间的自相关系数的定义为:
Figure QLYQS_36
(8)
式(8)中,
Figure QLYQS_37
表示协方差,/>
Figure QLYQS_38
表示方差;当/>
Figure QLYQS_39
时,/>
Figure QLYQS_40
;/>
Figure QLYQS_41
与/>
Figure QLYQS_42
的自相关系数的含义在于给出函数本身的相关性。
6.如权利要求5所述的一种融合随机搜索与混合分解误差订正的海浪预报方法,其特征为:所述的步骤4中,所述的改进自适应噪声集合经验模态分解为经验模态分解的改进算法,所述的经验模态分解的分解步骤如下:
(a)根据原始序列上下极值点求出上、下包络线;
(b)求出上下包络线的均值得到均值包络线;
(c)将原始数据减去均值包络线得到中间信号;
(d)判断中间信号是否满足1)在整个数据段内,极值点的个数和过零点的个数必须相等或相差最多不能超过一个;2)在任意时刻,由局部极大值点形成的上包络线和由局部极小值点形成的下包络线的平均值为零,即上、下包络线相对于时间轴局部对称;
(e)若不满足(d)中的两个条件,则以该中间信号为基础,重复(a)~(d);若满足条件,则将其视为一个IMF分量,将原始信号减去IMF分量,作为新的原始序列,重复(a)~(d),得到IMF2,…,直到余项包含少于2个极值,且不再需要进一步分解;
假设x为原始信号,
Figure QLYQS_43
是信号经EMD分解后的得到的第k个IMF分量,/>
Figure QLYQS_44
是均值为零的单位方差白噪声,/>
Figure QLYQS_45
为信号局部平均值;
改进自适应噪声集合经验模态分解的计算步骤如下:
(a)对L个叠加白噪声的混合原始信号进行EMD操作:
Figure QLYQS_46
(9)
Figure QLYQS_47
(10)
式(10)中,
Figure QLYQS_48
表示计算标准差,/>
Figure QLYQS_49
值为0.2;
第一个余项计算公式为:
Figure QLYQS_50
(11)
式(11)中:r表示残差分量;
(b)第1模态分量IMF表示为如下:
Figure QLYQS_51
(12)
式(12)中:x为原始信号,
Figure QLYQS_52
为第一个余项;
(c)计算第k个余项:
Figure QLYQS_53
(13)
式(13)中:
Figure QLYQS_54
为第k个余项;
(d)计算第k个IMF分量:
Figure QLYQS_55
(14)
(e)重复(c)与(d),直到余项不再需要进一步分解,原始序列的分解结果表示为如下:
Figure QLYQS_56
(15)
式(15)中:
Figure QLYQS_57
为原始信号,IMF为模态分量,/>
Figure QLYQS_58
为余项,n表示IMF的个数。
CN202210591957.2A 2022-05-27 2022-05-27 一种融合随机搜索与混合分解误差订正的海浪预报方法 Active CN114912077B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210591957.2A CN114912077B (zh) 2022-05-27 2022-05-27 一种融合随机搜索与混合分解误差订正的海浪预报方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210591957.2A CN114912077B (zh) 2022-05-27 2022-05-27 一种融合随机搜索与混合分解误差订正的海浪预报方法

Publications (2)

Publication Number Publication Date
CN114912077A CN114912077A (zh) 2022-08-16
CN114912077B true CN114912077B (zh) 2023-06-30

Family

ID=82768852

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210591957.2A Active CN114912077B (zh) 2022-05-27 2022-05-27 一种融合随机搜索与混合分解误差订正的海浪预报方法

Country Status (1)

Country Link
CN (1) CN114912077B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115711612B (zh) * 2022-11-02 2024-06-11 中国人民解放军国防科技大学 一种波浪有效波高的预测方法
CN115983141B (zh) * 2023-03-21 2023-07-14 国家***北海预报中心((国家***青岛海洋预报台)(国家***青岛海洋环境监测中心站)) 一种基于深度学习反演海浪波高的方法、介质及***
CN117421601B (zh) * 2023-12-19 2024-03-01 山东省科学院海洋仪器仪表研究所 一种海面蒸发波导临近期快速预报方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8423487B1 (en) * 2010-08-11 2013-04-16 The United States Of America As Represented By The Secretary Of The Navy Machine learning approach to wave height prediction
CN108038577A (zh) * 2017-12-26 2018-05-15 国家***北海预报中心 一种单站海浪有效波高数值预报结果多要素修正方法
CN110598170A (zh) * 2019-08-06 2019-12-20 天津大学 一种基于feemd分解时间序列的数据预测方法
CN114445634A (zh) * 2022-02-28 2022-05-06 南京信息工程大学 一种基于深度学习模型的海浪波高预测方法及***

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107886351A (zh) * 2017-10-18 2018-04-06 中国地质大学(武汉) 一种基于ceemd‑pso‑bp模型及误差补偿的原油价格预测方法及***
CN112116162B (zh) * 2020-09-26 2022-11-29 国家电网公司华中分部 基于ceemdan-qfoa-lstm的输电线覆冰厚度预测方法
CN112307676B (zh) * 2020-11-04 2022-10-14 国家***北海预报中心((国家***青岛海洋预报台)(国家***青岛海洋环境监测中心站)) 波高数值预报模型结果修正方法
CN113205226B (zh) * 2021-05-28 2022-10-14 河北工业大学 一种结合注意力机制以及误差修正的光伏功率预测方法
CN113283588B (zh) * 2021-06-03 2022-04-19 青岛励图高科信息技术有限公司 一种基于深度学习的近岸单点海浪浪高预报方法
CN113961613A (zh) * 2021-08-25 2022-01-21 国网上海市电力公司 基于周期性过滤的线性预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8423487B1 (en) * 2010-08-11 2013-04-16 The United States Of America As Represented By The Secretary Of The Navy Machine learning approach to wave height prediction
CN108038577A (zh) * 2017-12-26 2018-05-15 国家***北海预报中心 一种单站海浪有效波高数值预报结果多要素修正方法
CN110598170A (zh) * 2019-08-06 2019-12-20 天津大学 一种基于feemd分解时间序列的数据预测方法
CN114445634A (zh) * 2022-02-28 2022-05-06 南京信息工程大学 一种基于深度学习模型的海浪波高预测方法及***

Also Published As

Publication number Publication date
CN114912077A (zh) 2022-08-16

Similar Documents

Publication Publication Date Title
CN114912077B (zh) 一种融合随机搜索与混合分解误差订正的海浪预报方法
Tian Short-term wind speed prediction based on LMD and improved FA optimized combined kernel function LSSVM
CN111563706A (zh) 一种基于lstm网络的多变量物流货运量预测方法
CN111860982A (zh) 一种基于vmd-fcm-gru的风电场短期风电功率预测方法
CN110163433B (zh) 一种船舶流量预测方法
CN111665575B (zh) 一种基于统计动力的中长期降雨分级耦合预报方法及***
CN113705864A (zh) 基于VMD-CNN-BiLSTM-ATT混合模型的气象干旱预测方法及装置
CN113283588B (zh) 一种基于深度学习的近岸单点海浪浪高预报方法
CN114676822B (zh) 一种基于深度学习的多属性融合空气质量预报方法
CN111626785A (zh) 一种基于结合注意力的cnn-lstm网络基金价格预测方法
CN113705877A (zh) 基于深度学习模型的实时月径流预报方法
CN111222992A (zh) 一种基于注意力机制的长短期记忆神经网络的股票价格预测方法
CN107292446A (zh) 一种基于考虑分量关联性小波分解的混合风速预测方法
Lauguico et al. A fuzzy logic-based stock market trading algorithm using bollinger bands
CN116187835A (zh) 一种基于数据驱动的台区理论线损区间估算方法及***
CN111141879B (zh) 一种深度学习的空气质量监测方法以及装置、设备
CN117239722A (zh) 一种考虑多元负荷影响的***风荷短期预测方法
CN115186923A (zh) 光伏发电功率的预测方法、装置及电子设备
Sylaios et al. A fuzzy inference system for wind-wave modeling
CN116933152B (zh) 一种基于多维emd-pso-lstm神经网络的海浪信息预测方法及***
CN113222234A (zh) 基于集成模态分解的用气需求预测方法及其***
CN117371303A (zh) 一种海浪下有效波高的预测方法
Luo et al. A novel nonlinear combination model based on support vector machine for stock market prediction
CN116842358A (zh) 一种基于多尺度卷积和自适应特征融合的软测量建模方法
CN116739161A (zh) 一种融合经验模态分解和Informer模型的海表面温度预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant