CN111310968A - 一种基于互信息的lstm神经网络循环水文预报方法 - Google Patents

一种基于互信息的lstm神经网络循环水文预报方法 Download PDF

Info

Publication number
CN111310968A
CN111310968A CN201911329550.7A CN201911329550A CN111310968A CN 111310968 A CN111310968 A CN 111310968A CN 201911329550 A CN201911329550 A CN 201911329550A CN 111310968 A CN111310968 A CN 111310968A
Authority
CN
China
Prior art keywords
mutual information
rainfall
model
input
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911329550.7A
Other languages
English (en)
Other versions
CN111310968B (zh
Inventor
陈晨
梁肖旭
吕宁
周扬
肖凤林
李暨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201911329550.7A priority Critical patent/CN111310968B/zh
Publication of CN111310968A publication Critical patent/CN111310968A/zh
Application granted granted Critical
Publication of CN111310968B publication Critical patent/CN111310968B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A10/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
    • Y02A10/40Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Operations Research (AREA)
  • Computational Linguistics (AREA)
  • Tourism & Hospitality (AREA)
  • Remote Sensing (AREA)
  • Quality & Reliability (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于数据处理技术领域,公开了一种基于互信息的LSTM神经网络循环水文预报方法,通过互信息分析对原始数据进行筛选和分类,将降雨、水库水位、流量水文特征作为长短期记忆循环预测模型的输入特征;通过模拟降雨过程训练和确定LSTMC模型的结构,反映洪水的长期变化;利用实际洪水资料对模型的输出进行验证。本发明采用基于互信息的方法分析数据集,充分的捕获当前时刻流量与之前较长时间段的各个水文特征,动态的选取模型的输入特征。本发明利用深度学习算法,采用基于LSTM神经网络的循环预测模型,在用于洪水流量时间序列预测时,克服了水文变化过程受前期各方面因素影响较大的问题,能够较好的自动捕获有效特征。

Description

一种基于互信息的LSTM神经网络循环水文预报方法
技术领域
本发明属于数据处理技术领域,尤其涉及一种基于互信息的LSTM神经网 络循环水文预报方法。
背景技术
目前,最接近的现有技术:洪水作为自然灾害的一种,是水文学研究中不 可或缺的一部分。洪水是由暴雨、急骤融冰化雪、风暴潮等自然因素引起的江 河湖海水量迅速增加或水位迅猛上涨的水流现象。当发生洪水灾害时,会导致 许多危险,其后果包括人类生命危险,运输和通信网络的干扰,建筑物和基础 设施的破坏以及农作物的损失。因此,防洪减灾显得尤为重要。正确可靠的洪 水预报是防洪减灾环节中提高对洪水灾害响应时间的最重要的手段之一。
传统的方法主要包括概念方法和物理方法,因其具有明确的水文意义而被 广泛接受和应用。虽然有些方法丰富了洪水预报的理论,但水文过程是一种非 线性过程,不同流域的情况千差万别,很难模拟各流域洪水过程中复杂的物理 关系。因此基于数据驱动的方法被引入水文预报,该方法通过对历史水文数据 进行分析,应用各种人工智能算法进行模型构建与训练,使得这些模型具有一 定程度的自我调节能力,从而提高洪水预报的准确性。目前,常见的基于数据 驱动的水文预报模型大都基于人工神经网络(ANN)算法,在进行洪水较长时 间预报时,准确率会大大降低。一方面,当进行流量预测时,随着预测时间的增加,当前降雨量和之后的流量相关性将变得越越低。另一方面,过去主要用 于时间序列分析的这些模型的一个缺点是,关于输入序列顺序的任何信息都会 丢失。水文变化过程受前期各方面因素的影响比较大,因此需要一种可以捕获 之前计算信息的“记忆”能力。长短期记忆(LSTM)作为一种特殊的递归神经 网络(RNN),可以较好地解决RNN中可能出现的梯度消失或者梯度***问题。
现有技术一,成因分析法:是用动力学模型的方法研究径流预报,它综合 考虑了大气流动、气象因素、下垫面物理环境对水文的影响,实现洪水流量的 预报。现有技术一的缺点,成因分析法原理较简单,被广泛用于研究大气环流 与水文要素之间的关系。由于气象数据本身具有随机性,对流量较长时间预测 时,在较多的气象数据中,所需的有效气象数据的不确定性会增大许多,准确 预报的难度也会加大,准确度也会快速下降。同时成因分析法也使用较多的气 象数据,并对数据精度有较高要求,对水文序列中的随机性缺乏有效处理手段。
现有技术二,人工神经网络法:是一种基于数据驱动的水文预报方法,可 以在没有明确物理解释的情况下对非线性和复杂***进行建模。通过分析历史 水文数据进行特征选取,然后进行模型构建与训练,结合其它方法(如自回归 滑动平均法(ARMA)、禁忌搜索算法、主成分分析)提高洪水流量预报的准 确性。现有技术二的缺点,一方面,人工神经网络法所有的输入输出都是相互 独立的,在用于时间序列分析预测时,关于输入序列顺序的任何信息都会丢失, 而水文变化过程受前期各方面因素的影响比较大。另一方面,人工神经网络法 有收敛速度慢、容易陷入局部最优点、过拟合等缺点。
综上所述,现有技术存在的问题是:传统模型难以模拟水文过程中复杂的 物理关系和当前人工神经网络的输入输出相互独立,而水文变化过程受前期各 方面因素的影响比较大,以及较长时间洪水预报准确度快速降低。
解决上述技术问题的难度:传统模型难以模拟水文过程中复杂的物理关系 和当前人工神经网络的输入输出相互独立,而水文变化过程受前期各方面因素 的影响比较大,以及较长时间洪水预报准确度快速降低等问题。对于水文变化 过程受前期各方面因素影响比较大的问题,需要采用合适的算法进行水文变化 过程的序列特征进行选取。LSTM在处理时间序列预测问题时,能够自动有效捕 获输入序列的特征。在较长时间流量预测时,采用一种循环过程预测的方法, 根据实验结果显示,可以较好地提高洪水预报的准确性。
解决上述技术问题的意义:本发明基于息县流域应用,分析实际水文资料, 研究水文数据的特征和模型的预报性能,支持单点预测与较长时刻的洪水流量 预测,希望能为其它类似的工程提供有用的价值与参考。
发明内容
针对现有技术存在的问题,本发明提供了一种基于互信息的LSTM神经网 络循环水文预报方法。
本发明是这样实现的,一种基于互信息的LSTM神经网络循环水文预报方 法,所述基于互信息的LSTM神经网络循环水文预报方法包括以下步骤:
第一步,通过互信息分析对原始数据进行筛选和分类,将降雨、水库水位、 流量水文特征作为长短期记忆循环预测模型的输入特征;
第二步,通过模拟降雨过程训练和确定LSTMC模型的结构,反映洪水的长 期变化;
第三步,利用实际洪水资料对模型的输出进行验证。
进一步,所述第一步通过互信息分析对原始数据进行筛选和分类,将降雨、 水库水位、流量水文特征作为长短期记忆循环预测模型的输入特征具体包括: 降雨量数据采用反距离加权方法进行插值补全,流量和水库水位采用二次插值 方法补全;使用已处理好的等时段的降雨量和流量数据,采用互信息方法进行 求取各个雨量站的降雨量与水文站流量之间的互信息,互信息计算公式如下:
Figure BDA0002329228110000031
MI(X,Y)=H(X)+H(Y)-H(X,Y);
Figure BDA0002329228110000032
式中,X分别是一个离散随机变量,其样本大小为N,其值分别为x1,x2,…xN, 概率为p(x1),p(x2),…p(xN),H(X),H(Y)分别为X,Y的熵或信息量;X,Y在本发明中 指降雨量或流量,MI(X,Y)为X,Y的互信息,H(X,Y)为X,Y的联合熵,pXY(x,y)为 x,y的联合概率。
进一步,根据互信息的大小获取各个雨量站的权重,表达式如下:
Figure BDA0002329228110000041
式中,ri为第i个雨量站和流量之间的互信息,m为雨量站的总数,αi为 第i个雨量站的权重,对个雨量站的降雨量进行加权求和。
进一步,处理过的水文数据,选定某一时刻,分析各年当前流量与之前不 同时段降雨量的互信息,时段长度单位为1小时;根据降雨量与流量所获得的 一组互信息ρ=[ρ12,…ρh],确定互信息最大时对应的k时刻,通过模拟k时间 差范围内的降雨量变化作为模型的一部分输入特征,公式如下:
Δxi=xi-xi-p,(0≤p≤k);
式中,xi为第i小时的降雨量,xi-p为第i小时前p小时的降雨量,获得一 组输入特征变量x(t),x(t-1),…x(t-k)。
进一步,将获取到的输入特征数据与预测数据集进行归一化处理,采用 Min-max标准化,其公式如下:
Figure BDA0002329228110000042
式中,
Figure BDA0002329228110000043
为归一化处理后的第i个元素,Xi为待处理序列中的第i个元素, Xmax,Xmin分别为序列中的最大值与最小值,1≤i≤N,N为数据集的总数。
进一步,所述第二步构建长短期记忆循环LSTMC预测模型:包括输入层、 隐藏层和输出层,隐藏层中每个LSTM单元含有三个控制状态的门,分别为输 入门、遗忘门和输出门,输入门将新的信息选择性的记录到单元状态,遗忘门 将单元状态的信息选择性的遗忘,输出门将单元状态的信息选择性输出;
根据获得的模型输入特征,当预测获得t时刻的流量yt时,将该结果作为下 一层神经网络的部分特征输入,后续重复此操作,使用每层的输出作为后续的 一部分输入,构建LSTMC预测模型,是由n个相同的LSTM神经网络结构组成 的,每个结构都是一个预测器,最终产生一系列预测的结果;x(t),x(t-1),…x(t-k),p(t),p(t-1),…,p(t-k)分别为从t-k时刻到t时刻的降雨和水库水位的变化过 程,y(t),y(t+1),…y(t+n)分别为t,t+1,…t+n时刻预测的流量值。
进一步,所述输入门:
it=σ(ui*xt+wi*ht-1+bi);
遗忘门:
ft=σ(uf*xt+wf*ht-1+bf);
输出门:
ot=σ(uo*xt+wo*ht-1+bo);
细胞状态:
Figure BDA0002329228110000051
Figure BDA0002329228110000052
ht=ot*tanh(ct);
式中,it,ft,ot分别为t时刻输入门、遗忘门、输出门的状态向量;ct-1,ct分别 为t-1,t时刻LSTM单元的状态向量;
Figure BDA0002329228110000053
为t时刻更新LSTM单元状态的信息; ht-1,ht分别为t-1,t时刻输出门的状态向量,xt为t时刻单元输入;ui,uf,uo分别为输 入门、遗忘门、输出门与隐藏层之间的权重矩阵,uc为LSTM单元的权重矩阵; wi,wf,wo分别为输入门、遗忘门、输出门与输入层之间的权重矩阵,wc为LSTM 单元的权重矩阵;bi,bf,bo,bc分别为输入门、遗忘门、输出门和LSTM单元的偏 置向量。
进一步,所述第三步利用实际洪水资料对模型的输出进行验证具体包括: 将归一化处理后的数据集分为训练集和测试集两部分,训练集与测试集占比分 别为85%和15%,采用10折交叉验证法划分训练集,使用Adam算法进行模型 训练,确定模型中各层的权重,测试集用评估最终模型的预测精度。
进一步,使用相对误差和均方根误差定义如下:
Figure BDA0002329228110000061
Figure BDA0002329228110000062
式中,yreal(i),yreal为实际测量值,ypred(i),ypred为模型预测的值,n是预 测样本的总数;对于洪峰预报,以实测洪峰流量的20%作为许可误差;对于洪 峰时间预报,以预报根据时间至实测洪峰出现时间之间时距的30%作为许可误 差。
本发明的另一目的在于提供一种实现所述基于互信息的LSTM神经网络循 环水文预报方法的智能终端。
综上所述,本发明的优点及积极效果为:本发明通过互信息分析对原始数 据进行筛选和分类,将降雨、水库水位、流量等水文特征作为长短期记忆循环 预测模型的输入特征;通过模拟降雨过程训练和确定LSTMC模型的结构,以反 映洪水的长期变化;利用实际洪水资料对模型的输出进行验证;该模型具有较 高的预报精度,尤其针对洪峰阶段,洪峰时间和洪水峰值的预报精度有较大的 提高。
本发明采用了一种互信息算法分析数据集,获取模型输入特征的动态性或 自适应性。设计了一种基于LSTM循环预测的洪水预报模型,结合LSTM自动 捕获有效特征的优点,可以实现单点与较长时刻的洪水流量预测,具有较好的 预报精度。本发明采用基于互信息的方法分析数据集,能够充分的捕获当前时 刻流量与之前较长时间段的各个水文特征,动态的选取模型的输入特征。本发 明利用深度学习算法,采用一种基于LSTM神经网络的循环预测模型,在用于 洪水流量时间序列预测时,克服了水文变化过程受前期各方面因素影响较大的 问题,能够较好的自动捕获有效特征。本发明支持单点预测与较长时刻的洪水 流量预测,与传统的线性回归和神经网络模型相比,具有较好的预报效果,并 且本发明性能稳定,可移植性高。
附图说明
图1是本发明实施例提供的基于互信息的LSTM神经网络循环水文预报方 法流程图。
图2是本发明实施例提供的基于互信息的LSTM神经网络循环水文预报方 法实现流程图。
图3是本发明实施例提供的LSTM单元的结构示意图。
图4是本发明实施例提供的预测器的结构示意图。
图5是本发明实施例提供的息县数据预处理结果示意图。
图6是本发明实施例提供的评估模型的性能示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例, 对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以 解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明提供了一种基于互信息的LSTM神经网 络循环水文预报方法,下面结合附图对本发明作详细的描述。
如图1所示,本发明实施例提供的基于互信息的LSTM神经网络循环水文 预报方法包括以下步骤:
S101:通过互信息分析对原始数据进行筛选和分类,将降雨、水库水位、 流量等水文特征作为长短期记忆循环预测模型的输入特征;
S102:通过模拟降雨过程训练和确定LSTMC模型的结构,以反映洪水的长 期变化;
S103:利用实际洪水资料对模型的输出进行验证。
下面结合附图对本发明的技术方案作进一步的描述。
如图2所示,本发明实施例提供的基于互信息的LSTM神经网络循环水文 预报方法包括以下步骤:
(1)数据预处理分析:主要是针对各测量站点收集的的流量、水库水位、 降雨量等数据,根据已收集到的流量、降雨量、水库水位等水文数据分别进行 等时段均值处理,时段长度为1个小时。由于出现设备故障,现场条件恶劣和 程序维护等原因,收集到的数据可能存在一些缺失值。针对已获取水文数据的 数据中存在缺失值问题,降雨量数据采用反距离加权方法进行插值补全,流量 和水库水位采用二次插值方法补全。使用已处理好的等时段的降雨量和流量数 据,采用互信息方法进行求取各个雨量站的降雨量与水文站流量之间的互信息, 互信息计算公式如下:
Figure BDA0002329228110000081
MI(X,Y)=H(X)+H(Y)-H(X,Y);
Figure BDA0002329228110000082
式中,X分别是一个离散随机变量,其样本大小为N,其值分别为x1,x2,…xN, 概率为p(x1),p(x2),…p(xN),H(X),H(Y)分别为X,Y的熵或信息量;X,Y在本发明中 指降雨量或流量,MI(X,Y)为X,Y的互信息,H(X,Y)为X,Y的联合熵,pXY(x,y)为 x,y的联合概率。
根据互信息的大小获取各个雨量站的权重,其表达式如下:
Figure BDA0002329228110000083
式中,ri为第i个雨量站和流量之间的互信息,m为雨量站的总数,αi为 第i个雨量站的权重。然后对个雨量站的降雨量进行加权求和。
模型开发过程中最重要的一步是输入特征的选择。针对上述已经处理过的 水文数据,选定某一时刻,分析各年当前流量与之前不同时段降雨量的互信息, 时段长度单位为1小时。根据降雨量与流量所获得的一组互信息ρ=[ρ12,…ρh], 确定互信息最大时对应的k时刻,然后通过模拟k时间差范围内的降雨量变化作 为模型的一部分输入特征,公式如下:
Δxi=xi-xi-p,(0≤p≤k);
式中,xi为第i小时的降雨量,xi-p为第i小时前p小时的降雨量。由此本 发明获得一组输入特征变量x(t),x(t-1),…x(t-k)。
将获取到的输入特征数据与预测数据集进行归一化处理,采用Min-max标 准化,其公式如下:
Figure BDA0002329228110000091
式中,
Figure BDA0002329228110000092
为归一化处理后的第i个元素,Xi为待处理序列中的第i个元素, Xmax,Xmin分别为序列中的最大值与最小值,1≤i≤N,N为数据集的总数。
(2)构建长短期记忆循环(LSTMC)预测模型:
LSTMC模型包括输入层、隐藏层和输出层,隐藏层中每个LSTM单元含有 三个控制状态的门,分别为输入门、遗忘门和输出门,输入门将新的信息选择 性的记录到单元状态,遗忘门将单元状态的信息选择性的遗忘,输出门将单元 状态的信息选择性输出,LSTM单元如图3所示:
输入门:
it=σ(ui*xt+wi*ht-1+bi);
遗忘门:
ft=σ(uf*xt+wf*ht-1+bf);
输出门:
ot=σ(uo*xt+wo*ht-1+bo);
细胞状态:
Figure BDA0002329228110000093
Figure BDA0002329228110000094
ht=ot*tanh(ct);
式中,it,ft,ot分别为t时刻输入门、遗忘门、输出门的状态向量;ct-1,ct分别 为t-1,t时刻LSTM单元的状态向量;
Figure BDA0002329228110000106
为t时刻更新LSTM单元状态的信息; ht-1,ht分别为t-1,t时刻输出门的状态向量,xt为t时刻单元输入;ui,uf,uo分别为输 入门、遗忘门、输出门与隐藏层之间的权重矩阵,uc为LSTM单元的权重矩阵; wi,wf,wo分别为输入门、遗忘门、输出门与输入层之间的权重矩阵,wc为LSTM 单元的权重矩阵;bi,bf,bo,bc分别为输入门、遗忘门、输出门和LSTM单元的偏 置向量。
根据获得的模型输入特征,当预测获得t时刻的流量yt时,将该结果作为下 一层神经网络的部分特征输入,后续重复此操作,使用每层的输出作为后续的 一部分输入。以此构建了LSTMC预测模型,它是由n个相同的LSTM神经网络 结构组成的,每个结构都是一个预测器,最终产生一系列预测的结果。其整体 结构如图4所示:图中x(t),x(t-1),…x(t-k),p(t),p(t-1),…,p(t-k)分别为从t-k时 刻到t时刻的降雨和水库水位的变化过程,y(t),y(t+1),…y(t+n)分别为t,t+1,…t+n 时刻预测的流量值。
(3)模型训练与评估:
然后将归一化处理后的数据集分为训练集和测试集两部分,训练集与测试 集占比分别为85%和15%,采用10折交叉验证法划分训练集,使用Adam算法 进行模型训练,确定模型中各层的权重,测试集用评估最终模型的预测精度; 为了评估所提出模型的性能和数据的处理方法,依据国家标准的水文预报规范 要求,本发明使用相对误差和均方根误差,其定义如下:
Figure BDA0002329228110000101
Figure BDA0002329228110000102
式中,yreal(i),yreal为实际测量值,ypred(i),ypred为模型预测的值,n是预 测样本的总数。对于洪峰预报,以实测洪峰流量的20%作为许可误差。对于洪 峰时间预报,以预报根据时间至实测洪峰出现时间之间时距的30%作为许可误 差。对于精度评定,以合格预报次数和预报总次数之比的百分数为合格率,表 示多次预报总体精度水平。
下面结合实验对本发明的技术效果作详细的描述。
为了验证本发明的预测效果,选取目标流域(息县)2011-2018年各雨量站 与水文站的数据,按照前述的数据处理方法进行分析,数据预处理结果如图5 所示,将特征输入到带训练模型,通过调整参数,获得训练好的模型,然后对 模型进行测试,如果性能达标,保存模型。最终将建立的LSTMC预测模型与反 向神经网络循环(BPNNC)预测模型和线性回归循环预测(LRC)模型进行对 比,预报结果如表1。
表1预报结果
Figure BDA0002329228110000111
结果显示,LSTMC模型的RMSE结果明显有BPNNC和LRC模型。为了 更好地说明LSTMC预测模型的效果,从测试集中选取了10场洪水过程评估模 型的性能,如图6所示:10场洪水过程中洪峰形成的开始时间、实际峰值到的 时间、预测的峰值时间、实际峰值、预测峰值、峰值时间误差、峰值误差和洪 水过程的均方根误差。对应如表1所示。
表2
Figure BDA0002329228110000121
结果显示,洪峰时间到达误差都满足在许可误差的30%以内,预报精度为 100%;峰值误差有9场满足许可误差的20%以内,预报精度为90%。本发明的模 型能够产生较好的预报效果,满足洪水预报的要求。
本发明中对于模型输入特征的获取是基于互信息分析实现的,对于但凡用 到特征选取与数据分析的算法,可以结合不同流域的数据特征,通过协方差法、 相关系数法、回归分析法等对比实现。
应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合 实现。硬件部分可以利用专用逻辑实现;软件部分可以存储在存储器中,由适 当的指令执行***,例如微处理器或者专用设计硬件执行。本领域的普通技术 人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器 控制代码中实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存 储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供 了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、 诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑 设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行 的软件实现,也可以由上述硬件电路和软件的结合例如固件实现。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发 明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明 的保护范围之内。

Claims (10)

1.一种基于互信息的LSTM神经网络循环水文预报方法,其特征在于,所述基于互信息的LSTM神经网络循环水文预报方法包括以下步骤:
第一步,通过互信息分析对原始数据进行筛选和分类,将降雨、水库水位、流量水文特征作为长短期记忆循环预测模型的输入特征;
第二步,通过模拟降雨过程训练和确定LSTMC模型的结构,反映洪水的长期变化;
第三步,利用实际洪水资料对模型的输出进行验证。
2.如权利要求1所述的基于互信息的LSTM神经网络循环水文预报方法,其特征在于,所述第一步通过互信息分析对原始数据进行筛选和分类,将降雨、水库水位、流量水文特征作为长短期记忆循环预测模型的输入特征具体包括:降雨量数据采用反距离加权方法进行插值补全,流量和水库水位采用二次插值方法补全;使用已处理好的等时段的降雨量和流量数据,采用互信息方法进行求取各个雨量站的降雨量与水文站流量之间的互信息,互信息计算公式如下:
Figure FDA0002329228100000011
MI(X,Y)=H(X)+H(Y)-H(X,Y);
Figure FDA0002329228100000012
式中,X分别是一个离散随机变量,其样本大小为N,其值分别为x1,x2,…xN,概率为p(x1),p(x2),…p(xN),H(X),H(Y)分别为X,Y的熵或信息量;X,Y在本发明中指降雨量或流量,MI(X,Y)为X,Y的互信息,H(X,Y)为X,Y的联合熵,pXY(x,y)为x,y的联合概率。
3.如权利要求2所述的基于互信息的LSTM神经网络循环水文预报方法,其特征在于,根据互信息的大小获取各个雨量站的权重,表达式如下:
Figure FDA0002329228100000013
式中,ri为第i个雨量站和流量之间的互信息,m为雨量站的总数,αi为第i个雨量站的权重,对个雨量站的降雨量进行加权求和。
4.如权利要求3所述的基于互信息的LSTM神经网络循环水文预报方法,其特征在于,处理过的水文数据,选定某一时刻,分析各年当前流量与之前不同时段降雨量的互信息,时段长度单位为1小时;根据降雨量与流量所获得的一组互信息ρ=[ρ12,…ρh],确定互信息最大时对应的k时刻,通过模拟k时间差范围内的降雨量变化作为模型的一部分输入特征,公式如下:
Δxi=xi-xi-p,(0≤p≤k);
式中,xi为第i小时的降雨量,xi-p为第i小时前p小时的降雨量,获得一组输入特征变量x(t),x(t-1),…x(t-k)。
5.如权利要求4所述的基于互信息的LSTM神经网络循环水文预报方法,其特征在于,将获取到的输入特征数据与预测数据集进行归一化处理,采用Min-max标准化,其公式如下:
Figure FDA0002329228100000021
式中,
Figure FDA0002329228100000022
为归一化处理后的第i个元素,Xi为待处理序列中的第i个元素,Xmax,Xmin分别为序列中的最大值与最小值,1≤i≤N,N为数据集的总数。
6.如权利要求1所述的基于互信息的LSTM神经网络循环水文预报方法,其特征在于,所述第二步构建长短期记忆循环LSTMC预测模型:包括输入层、隐藏层和输出层,隐藏层中每个LSTM单元含有三个控制状态的门,分别为输入门、遗忘门和输出门,输入门将新的信息选择性的记录到单元状态,遗忘门将单元状态的信息选择性的遗忘,输出门将单元状态的信息选择性输出;
根据获得的模型输入特征,当预测获得t时刻的流量yt时,将该结果作为下一层神经网络的部分特征输入,后续重复此操作,使用每层的输出作为后续的一部分输入,构建LSTMC预测模型,是由n个相同的LSTM神经网络结构组成的,每个结构都是一个预测器,最终产生一系列预测的结果。
7.如权利要求6所述的基于互信息的LSTM神经网络循环水文预报方法,其特征在于,所述输入门:
it=σ(ui*xt+wi*ht-1+bi);
遗忘门:
ft=σ(uf*xt+wf*ht-1+bf);
输出门:
ot=σ(uo*xt+wo*ht-1+bo);
细胞状态:
Figure FDA0002329228100000031
Figure FDA0002329228100000032
ht=ot*tanh(ct);
式中,it,ft,ot分别为t时刻输入门、遗忘门、输出门的状态向量;ct-1,ct分别为t-1,t时刻LSTM单元的状态向量;
Figure FDA0002329228100000033
为t时刻更新LSTM单元状态的信息;ht-1,ht分别为t-1,t时刻输出门的状态向量,xt为t时刻单元输入;ui,uf,uo分别为输入门、遗忘门、输出门与隐藏层之间的权重矩阵,uc为LSTM单元的权重矩阵;wi,wf,wo分别为输入门、遗忘门、输出门与输入层之间的权重矩阵,wc为LSTM单元的权重矩阵;bi,bf,bo,bc分别为输入门、遗忘门、输出门和LSTM单元的偏置向量。
8.如权利要求1所述的基于互信息的LSTM神经网络循环水文预报方法,其特征在于,所述第三步利用实际洪水资料对模型的输出进行验证具体包括:将归一化处理后的数据集分为训练集和测试集两部分,训练集与测试集占比分别为85%和15%,采用10折交叉验证法划分训练集,使用Adam算法进行模型训练,确定模型中各层的权重,测试集用评估最终模型的预测精度。
9.如权利要求8所述的基于互信息的LSTM神经网络循环水文预报方法,其特征在于,使用相对误差和均方根误差定义如下:
Figure FDA0002329228100000041
Figure FDA0002329228100000042
式中,yreal(i),yreal为实际测量值,ypred(i),ypred为模型预测的值,n是预测样本的总数;对于洪峰预报,以实测洪峰流量的20%作为许可误差;对于洪峰时间预报,以预报根据时间至实测洪峰出现时间之间时距的30%作为许可误差。
10.一种实现权利要求1~9任意一项所述基于互信息的LSTM神经网络循环水文预报方法的智能终端。
CN201911329550.7A 2019-12-20 2019-12-20 一种基于互信息的lstm神经网络循环水文预报方法 Active CN111310968B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911329550.7A CN111310968B (zh) 2019-12-20 2019-12-20 一种基于互信息的lstm神经网络循环水文预报方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911329550.7A CN111310968B (zh) 2019-12-20 2019-12-20 一种基于互信息的lstm神经网络循环水文预报方法

Publications (2)

Publication Number Publication Date
CN111310968A true CN111310968A (zh) 2020-06-19
CN111310968B CN111310968B (zh) 2024-02-09

Family

ID=71156313

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911329550.7A Active CN111310968B (zh) 2019-12-20 2019-12-20 一种基于互信息的lstm神经网络循环水文预报方法

Country Status (1)

Country Link
CN (1) CN111310968B (zh)

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111724004A (zh) * 2020-07-13 2020-09-29 浙江大学 一种基于改进量子灰狼算法的水库可供水量预报方法
CN111737640A (zh) * 2020-08-17 2020-10-02 深圳江行联加智能科技有限公司 水位预测方法、装置及计算机可读存储介质
CN112001556A (zh) * 2020-08-27 2020-11-27 华中科技大学 一种基于深度学习模型的水库下游水位预测方法
CN112215400A (zh) * 2020-09-14 2021-01-12 山东省地质矿产勘查开发局第一地质大队 一种地下水开采过度预警方法与***
CN112488295A (zh) * 2020-11-23 2021-03-12 江苏科技大学 交叉验证算法优化lstm网络继电器贮存寿命预测方法
CN112597835A (zh) * 2020-12-11 2021-04-02 国汽(北京)智能网联汽车研究院有限公司 驾驶行为的评估方法、装置、电子设备及可读存储介质
CN112668711A (zh) * 2020-11-30 2021-04-16 西安电子科技大学 基于深度学习的洪水流量预测方法、装置和电子设备
CN112784479A (zh) * 2021-01-12 2021-05-11 河海大学 一种洪水流量预测的方法
CN112801416A (zh) * 2021-03-10 2021-05-14 长沙理工大学 基于多维水文信息的lstm流域径流量预测方法
CN112832744A (zh) * 2021-01-07 2021-05-25 中国石油大学(华东) 一种基于lstm神经网络的抽油机井检泵周期预测方法
CN112861989A (zh) * 2021-03-04 2021-05-28 水利部信息中心 一种基于密度筛选的深度神经网络回归模型
CN113158542A (zh) * 2021-01-29 2021-07-23 武汉大学 适用于缺资料地区的多变量设计洪水估计方法
CN113158556A (zh) * 2021-03-31 2021-07-23 山东电力工程咨询院有限公司 一种区域水位短时高精度预报方法
CN113743017A (zh) * 2021-09-13 2021-12-03 云南大学 一种基于计算机视觉及lstm神经网络的大流域径流模拟方法
CN113868223A (zh) * 2021-09-02 2021-12-31 深圳中兴网信科技有限公司 水质监测方法、装置、***和可读存储介质
CN113887787A (zh) * 2021-09-15 2022-01-04 大连理工大学 一种基于长短时记忆网络和nsga-ii算法的洪水预报模型参数多目标优化方法
CN113985496A (zh) * 2021-10-26 2022-01-28 天津大学 一种基于lstm-gm神经网络模型的风暴潮智能预报方法
CN114386334A (zh) * 2022-01-19 2022-04-22 浙江大学 一种基于分布式水文径流模拟替代模型的径流滚动预报方法
CN114399193A (zh) * 2022-01-11 2022-04-26 电子科技大学 一种基于深度时序点过程和lstm的缺资料地区径流事件检测方法
CN115474945A (zh) * 2022-09-15 2022-12-16 燕山大学 一种面向多通道脑肌电耦合分析的多元全局同步指数方法
CN115759403A (zh) * 2022-11-15 2023-03-07 东北农业大学 一种针对寒区水循环过程的动态组合预测模型构建方法
CN115828758A (zh) * 2022-12-13 2023-03-21 广东海洋大学 基于改进烟花算法优化网络的海水三维预测方法及***
CN115860272A (zh) * 2023-02-22 2023-03-28 山东捷讯通信技术有限公司 基于深度学习的水库多时间点智能水位预测方法及***
CN117421558A (zh) * 2023-10-26 2024-01-19 华中科技大学 一种梯级水库运行规则提取及其模型训练方法
CN112597835B (zh) * 2020-12-11 2024-07-09 国汽(北京)智能网联汽车研究院有限公司 驾驶行为的评估方法、装置、电子设备及可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050147325A1 (en) * 2003-12-29 2005-07-07 Shoupu Chen Method of image registration using mutual information
CN103839265A (zh) * 2014-02-26 2014-06-04 西安电子科技大学 基于sift和归一化互信息的sar图像配准方法
CN104463358A (zh) * 2014-11-28 2015-03-25 大连理工大学 一种耦合偏互信息和cfs集合预报的小水电发电能力预测方法
CN106600634A (zh) * 2016-12-12 2017-04-26 哈尔滨工业大学 基于改进体积插值方法的最大互信息图像配准方法
CN107463993A (zh) * 2017-08-04 2017-12-12 贺志尧 基于互信息‑核主成分分析‑Elman网络的中长期径流预报方法
CN109615011A (zh) * 2018-12-14 2019-04-12 河海大学 一种基于lstm的中小河流短期洪水预报方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050147325A1 (en) * 2003-12-29 2005-07-07 Shoupu Chen Method of image registration using mutual information
CN103839265A (zh) * 2014-02-26 2014-06-04 西安电子科技大学 基于sift和归一化互信息的sar图像配准方法
CN104463358A (zh) * 2014-11-28 2015-03-25 大连理工大学 一种耦合偏互信息和cfs集合预报的小水电发电能力预测方法
CN106600634A (zh) * 2016-12-12 2017-04-26 哈尔滨工业大学 基于改进体积插值方法的最大互信息图像配准方法
CN107463993A (zh) * 2017-08-04 2017-12-12 贺志尧 基于互信息‑核主成分分析‑Elman网络的中长期径流预报方法
CN109615011A (zh) * 2018-12-14 2019-04-12 河海大学 一种基于lstm的中小河流短期洪水预报方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张继国;谢平;龚艳冰;刘高峰;: "降雨信息空间插值研究评述与展望", 水资源与水工程学报 *

Cited By (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111724004B (zh) * 2020-07-13 2021-03-23 浙江大学 一种基于改进量子灰狼算法的水库可供水量预报方法
CN111724004A (zh) * 2020-07-13 2020-09-29 浙江大学 一种基于改进量子灰狼算法的水库可供水量预报方法
CN111737640A (zh) * 2020-08-17 2020-10-02 深圳江行联加智能科技有限公司 水位预测方法、装置及计算机可读存储介质
CN112001556A (zh) * 2020-08-27 2020-11-27 华中科技大学 一种基于深度学习模型的水库下游水位预测方法
CN112001556B (zh) * 2020-08-27 2022-07-15 华中科技大学 一种基于深度学习模型的水库下游水位预测方法
CN112215400A (zh) * 2020-09-14 2021-01-12 山东省地质矿产勘查开发局第一地质大队 一种地下水开采过度预警方法与***
CN112488295A (zh) * 2020-11-23 2021-03-12 江苏科技大学 交叉验证算法优化lstm网络继电器贮存寿命预测方法
CN112668711A (zh) * 2020-11-30 2021-04-16 西安电子科技大学 基于深度学习的洪水流量预测方法、装置和电子设备
CN112668711B (zh) * 2020-11-30 2023-04-18 西安电子科技大学 基于深度学习的洪水流量预测方法、装置和电子设备
CN112597835B (zh) * 2020-12-11 2024-07-09 国汽(北京)智能网联汽车研究院有限公司 驾驶行为的评估方法、装置、电子设备及可读存储介质
CN112597835A (zh) * 2020-12-11 2021-04-02 国汽(北京)智能网联汽车研究院有限公司 驾驶行为的评估方法、装置、电子设备及可读存储介质
CN112832744A (zh) * 2021-01-07 2021-05-25 中国石油大学(华东) 一种基于lstm神经网络的抽油机井检泵周期预测方法
CN112784479A (zh) * 2021-01-12 2021-05-11 河海大学 一种洪水流量预测的方法
CN112784479B (zh) * 2021-01-12 2022-09-23 河海大学 一种洪水流量预测的方法
CN113158542A (zh) * 2021-01-29 2021-07-23 武汉大学 适用于缺资料地区的多变量设计洪水估计方法
CN113158542B (zh) * 2021-01-29 2022-10-04 武汉大学 适用于缺资料地区的多变量设计洪水估计方法
CN112861989A (zh) * 2021-03-04 2021-05-28 水利部信息中心 一种基于密度筛选的深度神经网络回归模型
CN112801416A (zh) * 2021-03-10 2021-05-14 长沙理工大学 基于多维水文信息的lstm流域径流量预测方法
CN113158556A (zh) * 2021-03-31 2021-07-23 山东电力工程咨询院有限公司 一种区域水位短时高精度预报方法
CN113158556B (zh) * 2021-03-31 2023-08-08 山东电力工程咨询院有限公司 一种区域水位短时高精度预报方法
CN113868223A (zh) * 2021-09-02 2021-12-31 深圳中兴网信科技有限公司 水质监测方法、装置、***和可读存储介质
CN113743017A (zh) * 2021-09-13 2021-12-03 云南大学 一种基于计算机视觉及lstm神经网络的大流域径流模拟方法
CN113887787A (zh) * 2021-09-15 2022-01-04 大连理工大学 一种基于长短时记忆网络和nsga-ii算法的洪水预报模型参数多目标优化方法
CN113887787B (zh) * 2021-09-15 2024-05-07 大连理工大学 一种基于长短时记忆网络和nsga-ii算法的洪水预报模型参数多目标优化方法
CN113985496A (zh) * 2021-10-26 2022-01-28 天津大学 一种基于lstm-gm神经网络模型的风暴潮智能预报方法
CN113985496B (zh) * 2021-10-26 2024-04-09 天津大学 一种基于lstm-gm神经网络模型的风暴潮智能预报方法
CN114399193A (zh) * 2022-01-11 2022-04-26 电子科技大学 一种基于深度时序点过程和lstm的缺资料地区径流事件检测方法
CN114386334A (zh) * 2022-01-19 2022-04-22 浙江大学 一种基于分布式水文径流模拟替代模型的径流滚动预报方法
CN115474945A (zh) * 2022-09-15 2022-12-16 燕山大学 一种面向多通道脑肌电耦合分析的多元全局同步指数方法
CN115474945B (zh) * 2022-09-15 2024-04-12 燕山大学 一种面向多通道脑肌电耦合分析的多元全局同步指数方法
CN115759403B (zh) * 2022-11-15 2023-12-15 东北农业大学 一种针对寒区水循环过程的动态组合预测模型构建方法
CN115759403A (zh) * 2022-11-15 2023-03-07 东北农业大学 一种针对寒区水循环过程的动态组合预测模型构建方法
CN115828758B (zh) * 2022-12-13 2023-08-25 广东海洋大学 基于改进烟花算法优化网络的海水三维预测方法及***
CN115828758A (zh) * 2022-12-13 2023-03-21 广东海洋大学 基于改进烟花算法优化网络的海水三维预测方法及***
CN115860272A (zh) * 2023-02-22 2023-03-28 山东捷讯通信技术有限公司 基于深度学习的水库多时间点智能水位预测方法及***
CN117421558A (zh) * 2023-10-26 2024-01-19 华中科技大学 一种梯级水库运行规则提取及其模型训练方法

Also Published As

Publication number Publication date
CN111310968B (zh) 2024-02-09

Similar Documents

Publication Publication Date Title
CN111310968A (zh) 一种基于互信息的lstm神经网络循环水文预报方法
Piotrowski et al. Impact of deep learning-based dropout on shallow neural networks applied to stream temperature modelling
CN111639748B (zh) 一种基于lstm-bp时空组合模型的流域污染物通量预测方法
CN105740991B (zh) 基于改进bp神经网络拟合多种气候模式的气候变化预测方法及***
CN111767517B (zh) 一种应用于洪水预测的BiGRU多步预测方法、***及存储介质
CN111665575B (zh) 一种基于统计动力的中长期降雨分级耦合预报方法及***
CN115423163A (zh) 一种流域短期洪水事件预测方法、装置及终端设备
CN107798431A (zh) 一种基于改进Elman神经网络的中长期径流预报方法
Liu et al. Comparing machine-learning models for drought forecasting in vietnam’s cai river basin
Wang et al. Analysis of solar generation and weather data in smart grid with simultaneous inference of nonlinear time series
CN114723188A (zh) 水质预测方法、装置、计算机设备和存储介质
CN110991776A (zh) 一种基于gru网络实现水位预测的方法及***
CN114118565A (zh) 一种基于双向长短时记忆耦合模型的日径流预报方法
CN115759445A (zh) 一种基于机器学习和云模型的分类洪水随机预报方法
CN117526274A (zh) 极端气候下新能源功率预测方法、电子设备和存储介质
CN115545334A (zh) 土地利用类型预测方法、装置、电子设备及存储介质
CN115877483A (zh) 一种基于随机森林和gru的台风路径预报方法
CN114862023A (zh) 基于四维逐点气象预报的分布式光伏功率预测方法及***
CN113988210A (zh) 结构监测传感网失真数据修复方法、装置及存储介质
CN117192510A (zh) 一种双偏振雷达雨滴谱参数反演方法
CN116976227A (zh) 一种基于lstm机器学习的风暴增水预报方法及***
Nguyen et al. Water level prediction at tich-bui river in vietnam using support vector regression
CN113487069B (zh) 一种基于grace日降尺度和新型dwsdi指数的区域洪涝灾害风险评估方法
Wollsen et al. Improved local weather forecasts using artificial neural networks
Qiu et al. A short-term precipitation prediction model based on spatiotemporal convolution network and ensemble empirical mode decomposition

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant