CN114692788B - 基于增量学习的厄尔尼诺极端天气预警方法及装置 - Google Patents
基于增量学习的厄尔尼诺极端天气预警方法及装置 Download PDFInfo
- Publication number
- CN114692788B CN114692788B CN202210611385.XA CN202210611385A CN114692788B CN 114692788 B CN114692788 B CN 114692788B CN 202210611385 A CN202210611385 A CN 202210611385A CN 114692788 B CN114692788 B CN 114692788B
- Authority
- CN
- China
- Prior art keywords
- scale
- old
- new
- network
- parallel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000004927 fusion Effects 0.000 claims abstract description 49
- 238000012549 training Methods 0.000 claims abstract description 47
- 238000005516 engineering process Methods 0.000 claims abstract description 33
- 238000004821 distillation Methods 0.000 claims abstract description 29
- 238000013528 artificial neural network Methods 0.000 claims abstract description 25
- 230000005540 biological transmission Effects 0.000 claims abstract description 24
- 230000008859 change Effects 0.000 claims abstract description 23
- 230000003044 adaptive effect Effects 0.000 claims abstract description 18
- 230000002265 prevention Effects 0.000 claims abstract description 12
- 230000002708 enhancing effect Effects 0.000 claims abstract description 7
- 230000006870 function Effects 0.000 claims description 35
- 238000013527 convolutional neural network Methods 0.000 claims description 17
- 238000013507 mapping Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 5
- 238000007710 freezing Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 3
- 230000008014 freezing Effects 0.000 claims 2
- 230000007774 longterm Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 102100031184 C-Maf-inducing protein Human genes 0.000 description 1
- 101000993081 Homo sapiens C-Maf-inducing protein Proteins 0.000 description 1
- 239000005551 L01XE03 - Erlotinib Substances 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- AAKJLRGGTJKAMG-UHFFFAOYSA-N erlotinib Chemical compound C=12C=C(OCCOC)C(OCCOC)=CC2=NC=NC=1NC1=CC=CC(C#C)=C1 AAKJLRGGTJKAMG-UHFFFAOYSA-N 0.000 description 1
- 229960001433 erlotinib Drugs 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01W—METEOROLOGY
- G01W1/00—Meteorology
- G01W1/10—Devices for predicting weather conditions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/096—Transfer learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Business, Economics & Management (AREA)
- Environmental & Geological Engineering (AREA)
- Biodiversity & Conservation Biology (AREA)
- Environmental Sciences (AREA)
- Ecology (AREA)
- Atmospheric Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Tourism & Hospitality (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Educational Administration (AREA)
Abstract
Description
技术领域
本发明涉及气象预测、海洋现象预测以及增量学习领域,尤其涉及一种基于增量学习的厄尔尼诺极端天气预警方法及装置。
背景技术
厄尔尼诺现象[1,2,3]是一种海洋-大气***的周期性变化,是地球年际气候变化的主要驱动因素之一,会对全球范围内的气候、环境和社会经济造成极大影响[4]。厄尔尼诺现象与全球极端天气灾害的发生息息相关,已经受到学术界和相关行业的重视。例如,1997厄尔尼诺事件发生的次年,1998年夏季,我国长江流域、东北地区发生流域性特大暴雨洪涝灾害;2014年开始的厄尔尼诺事件,导致2015年我国冬季全国平均降水量较常年同期偏多五成以上,创历史最高纪录,长江流域和江南地区极易发生洪涝灾害。极端暴雨期间,容易导致输电线路杆塔塔基、变压器、变电站等重要电力设施浸水,甚至造成火灾导致大面积的停电,影响电网安全稳定运行。
近年来,为了预防极端天气并降低其对人类生产生活的影响,全球的研究者们致力于利用基于神经网络的表示学***。例如:厄尔尼诺现象的发生与缓慢的海洋变化及其与大气的耦合有关,这表明利用卷积神经网络提前对厄尔尼诺事件进行预测,进而对其导致的暴雨等极端天气进行预警是可行的[5]。但是,目前有关在厄尔尼诺现象影响下对极端降雨的预测工作较少,利用增量学***的工作尚未开展,例如,利用增量学习对厄尔尼诺影响下极端降雨进行准确预测及对电网防灾预警工作尚未开展。
发明内容
本发明提供了一种基于增量学***,解决了传统卷积神经网络在面对持续出现的新数据时扩展性不足、时空继承性缺乏的问题,以及极端降雨长短期预测的差异化问题,例如,可以有效的提升增量的厄尔尼诺现象下输电线路沿线降雨量预测的准确度,减轻自然灾害;详见下文描述:
第一方面,一种基于增量学习的厄尔尼诺极端天气预警方法,所述方法包括:
对海洋数据进行下采样,得到多尺度的海洋数据,将多尺度数据以预设年为界划分为多个任务序列;
将任务序列以数据流形式输入并行卷积神经网络,通过有监督表示学习提取多尺度特征;
基于增量训练,使用多尺度特征频域蒸馏技术,选择性地约束多尺度特征低频分量的漂移,记忆并行卷积神经网络在旧任务中学到的知识;
使用多尺度特征自适应融合技术,根据输入多尺度数据不同的时间跨度,自适应学习不同的融合参数,增强对新任务的学习能力;
其中,所述多尺度特征频域蒸馏技术用于使新并行网络的输出特征去逼近旧并行网络的输出特征。
其中,所述多尺度特征自适应融合技术包括:多尺度并行网络,两个瓶颈层,两个全连接层,以及一个自适应融合函数。
进一步地,所述使用多尺度特征频域蒸馏技术,选择性地约束多尺度特征低频分量的漂移,记忆并行卷积神经网络在旧任务中学到的知识具体为:
将欧式距离定义为多尺度特征频域蒸馏损失函数:
其中,所述自适应融合函数为:
其中,为大尺度特征对最终结果的重要性,为小尺度特征对最终结果的重要性,和log函数旨在使大或小的输入值得到更显著的区分,函数旨在将和的值映射到(0, 1)区间,为打分层,用于输出每一尺度特征的重要性;
第二方面,一种基于增量学习的厄尔尼诺极端天气预警装置,所述装置包括:
划分多个任务序列模块,用于对海洋数据进行下采样,得到多尺度的海洋数据,将多尺度数据以预设年为界划分为多个任务序列;提取多尺度特征模块,用于将任务序列以数据流形式输入并行卷积神经网络,通过有监督表示学习提取多尺度特征;增量训练模块,用于基于增量训练,使用多尺度特征频域蒸馏技术,选择性地约束多尺度特征低频分量的漂移,记忆并行卷积神经网络在旧任务中学到的知识;自适应融合模块,用于使用多尺度特征自适应融合技术,根据输入多尺度数据不同的时间跨度,自适应学习不同的融合参数,增强对新任务的学习能力;预警模块,用于自适应融合后的特征通过全连接层,输出某一海洋现象变化规律的Nino3.4指数;基于Nino3.4指数建立极端降雨概率的映射函数,预测值超过阈值则进行暴雨预警并提前开展输电线路暴雨防治工作。
第三方面,一种基于增量学习的厄尔尼诺极端天气预警装置,所述装置包括:处理器和存储器,所述存储器中存储有程序指令,所述处理器调用存储器中存储的程序指令以使装置执行第一方面中的任一项所述的方法步骤。
第四方面,一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时使所述处理器执行第一方面中的任一项所述的方法步骤。
本发明提供的技术方案的有益效果是:
1、本发明将增量学习、厄尔尼诺现象以及降雨预测预警这些领域创新性地结合起来,现有的基于深度学习的预测方法需要一次性在封闭数据库上训练,耗时长,计算量大,难以在线适应新的海洋数据,因此导致实用性非常有限;本发明基于增量学习,使得基于神经网络的海洋数据表示学习模型可以增量地学习并挖掘新出现的海洋数据中的变化规律,同时保持对已经学习到的旧知识的记忆与巩固,弥补了之前研究的盲点,提高了厄尔尼诺现象下输电线路沿线降雨量预测在现实世界中的部署能力;
2、本发明添加了多尺度特征频域蒸馏技术,对新并行网络和旧并行网络提取到的特征进行离散余弦变换,得到一系列正交的特征分量,利用欧式距离进行特征层面的蒸馏,匹配新旧并行网络输出的低频特征分量,进而约束了网络参数的更新,尽力减轻灾难性遗忘;
3、本发明添加了多尺度特征自适应融合技术,根据长短期预测任务自适应学***,例如,可以有效的提升增量的厄尔尼诺现象下输电线路沿线降雨量预测的准确度,减轻自然灾害。
附图说明
图1为一种基于增量学习的厄尔尼诺极端天气预警方法的流程图;
图2为一种基于增量学习的厄尔尼诺极端天气预警方法的网络结构图;
图3为一种基于增量学习的厄尔尼诺极端天气预警方法的映射函数图;
图4为一种基于增量学习的厄尔尼诺极端天气预警装置的结构示意图;
图5为一种基于增量学习的厄尔尼诺极端天气预警装置的另一结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面对本发明实施方式作进一步地详细描述。
通过对背景技术的分析可知,当需要学习大量新出现的海洋数据时,神经网络可以同时保持对旧知识的记忆(对已经学到的海洋数据变化规律的记忆)和对新知识(新海洋数据的变化规律)的学习,得到目标月的Nino3.4指数值,进而根据Nino3.4指数值对目标月输电线路沿线降雨进行预测,提前做好极端降雨预警和防灾减灾工作。
1、如何在保持旧知识的同时,实时地去学习增量出现的新海洋数据中的变化规律,从总体上把握相关因素与厄尔尼诺现象下输电线路沿线降雨量的非线性时空关联关系;
2、如何构建不同前置预测时间和网络结构的对应关系,是值得进行深入研究的部分。
本发明实施例设计了一个多尺度输入的并行神经网络作为主干网络,在并行神经网络上添加了一多尺度特征频域蒸馏技术和多尺度特征自适应融合技术,成功解决了现有方法在处理增量出现的海洋数据流时,无法在线适应新数据或结构简单粗糙等缺陷,并在此基础上增加了对长短期预测的自适应差异化处理,以及增加了对知识时空继承性的关注,提高了海洋数据表示学***。根据并行神经网络输出的Nino3.4指数值判断某月输电线路沿线降雨量大小,提前做好暴雨预警和防灾减灾工作。
实施例1
一种基于增量学习的厄尔尼诺极端天气预警方法,参见图1,该方法包括以下步骤:
101:对海洋数据进行下采样,得到多尺度的海洋数据,将多尺度数据以若干年或几十年为界划分为多个任务序列;
其中,本发明实施例以厄尔尼诺现象为例,多尺度数据为多尺度的海表温度和热含量图。
102:将任务序列以数据流的方式输入并行卷积神经网络中,通过有监督表示学习提取多尺度特征;
其中,上述的多尺度特征根据并行卷积神经网络输入的不同可用于表示各种海洋现象变化规律,并将已经训练过的任务称为旧任务,未经训练的任务称为新任务;本发明实施例是以厄尔尼诺现象为例进行说明,具体实现时还可以应用到其他自然现象中,本发明实施例对此不做赘述。
103:进行增量训练[5],使用一多尺度特征频域蒸馏技术,选择性地约束多尺度特征低频分量的漂移,精准有效地记忆并行卷积神经网络在旧任务中学到的知识,减少遗忘;
现有的海洋数据表示学习方法需要一次性在封闭数据集上训练,耗时长,计算量大,难以在线适应新的海洋数据,因此实用性和可靠性非常有限,于是本方法借鉴增量学习的知识,弥补了之前研究的不足。
104:使用一多尺度特征自适应融合技术,根据输入多尺度数据不同的时间跨度,自适应学习不同的融合参数,增强对新任务的学习能力;
本发明实施例关注了长短期预测任务对多尺度数据的需求差异性问题。基于多尺度特征融合参数的自适应学习,解决现有技术中方法过于简单,对新海洋数据适应力不足的问题。
105:自适应融合后的特征通过全连接层,输出某一海洋现象变化规律的具体量化值,以厄尔尼诺现象为例,此处输出为Nino3.4指数;
其中,Nino3.4指数是太平洋Nino3.4区域(170°W-120°W, 5°S-5°N)平均海温距平指数,Nino3.4指数连续5个月超过0.5℃就定义为一次厄尔尼诺事件。
106:收集山东省过去50年中输电线路沿线的每月平均最高降雨量及该月发生极端降雨的情况,结合过去50年中Nino3.4指数的变化规律,建立一个Nino3.4指数大小与发生极端降雨概率的映射函数,并找到一个Nino3.4指数映射值的阈值,一旦预测的值超过该阈值则在当月有很大可能发生极端降雨;
综上所述,本发明实施例通过上述步骤101-步骤107弥补了之前研究的盲点,可以提升基于神经网络的极端气候预测水平,例如,可以有效的提升增量的厄尔尼诺现象下输电线路沿线降雨量预测的准确度,减轻自然灾害。
实施例2
下面结合具体的实例、计算公式对实施例1中的方案进行进一步地介绍,详见下文描述:
201:对海洋数据进行下采样,得到多尺度的海洋数据,将多尺度数据以若干年或几十年为界划分为多个任务序列;
其中,上述步骤201主要包括:
其中,以厄尔尼诺现象预测为例,划分任务序列的具体操作以1861年至2004年耦合模型比对项目第5阶段数据库(CMIP5)为例,其中本发明实施例取出140年的数据,可以任意划分为多个任务,例如:一个任务包含20年的数据,每个增量训练阶段只训练一个任务,共分7个阶段全部训练完成。
202:将任务序列以数据流的方式输入并行卷积神经网络中,通过有监督表示学习提取多尺度特征,此多尺度特征根据输入的不同可用于表示各种海洋现象变化规律,并将已经训练过的任务称为旧任务,未经训练的任务称为新任务;
卷积神经网络在处理具有空间结构的多维阵列数据(彩色图像)方面取得了突出的成果。因此,卷积神经网络可以用来揭示三维预测场与预测指数之间的联系。本发明实施例定义并行卷积神经网络的输入为,特征提取函数为,全连接层输出函数为,其中代表并行卷积神经网络的第个分支。以厄尔尼诺现象预测为例,本发明实施例将连续三个月的SST图和HC图作为输入,可以得到输出特征:
203:进行增量训练[5],使用一多尺度特征频域蒸馏技术,选择性地约束多尺度特征低频分量的漂移,精准有效地记忆并行卷积神经网络在旧任务中学到的知识,减少遗忘;
其中,在每次训练新任务时,利用上一个训练阶段已经训练好的旧并行网络参数初始化新并行网络,冻结旧并行网络的参数,并将训练数据同时输入新旧的并行网络中。参见图2,将新并行网络和旧并行网络输出的多尺度特征和()进行离散余弦变换,拉近其多尺度特征低频分量之间的欧式距离,约束特征的演变。
将欧式距离定义为多尺度特征频域蒸馏损失函数:
其中,大尺度网络分支使用大小为44的卷积核,并且其输入是尺寸为7224的大尺度海表温度(SST)和热含量(HC)图;小尺度网络分支使用大小为22的卷积核,并且其输入的是经过下采样后的尺寸为5418的小尺度海表温度(SST)和热含量(HC)图。
其中,旧并行网络指的是:上一个训练阶段(即第个训练阶段)已经训练好的网络;新并行网络指的是:使用上一阶段训练好的网络来初始化参数的新并行网络,用于当前阶段(第个训练阶段)的训练。新并行网络和旧并行网络区别是:在新的训练阶段,旧并行网络参数全程冻结,用于帮助训练新并行网络,新并行网络训练完成后删除旧并行网络。此多尺度特征频域蒸馏技术对于维持一个稳定的表征,继承旧知识,抵抗灾难性遗忘有非常不错的效果。
204:使用一多尺度特征自适应融合技术,根据输入多尺度数据不同的时间跨度,自适应学习不同的融合参数,增强对新任务的学习能力;
其中,新并行网络的两个分支输出的特征和,经过两个瓶颈层和来对齐特征维度,瓶颈层为本领域公知的技术术语,本发明实施例对此不做赘述。将维度对齐之后的多尺度特征分别输入一个打分层(即全连接层),打分层的作用是输出每一尺度特征的重要性。
其中,
为大尺度特征对最终结果的重要性,为小尺度特征对最终结果的重要性,和log函数旨在使较大或较小的输入值得到更显著的区分,函数旨在将和的值映射到(0, 1)区间。得到大尺度特征(即大尺度输入数据经过大尺度网络分支后得到的特征)和小尺度特征(即小尺度输入数据经过小尺度网络分支后得到的特征)的重要性分值之后,就进行多尺度特征的自适应融合:
现有的增量学习技术,或是只考虑添加正则化项来约束网络参数的变化,或是只考虑单纯地提高对新数据的学习能力,而本发明实施例同时考虑了两者,并且考虑了多尺度输入与预测时间尺度之间的映射关系,提升了增量的厄尔尼诺极端天气预测算法的性能。
205:自适应融合后的特征通过全连接层,输出某一海洋现象变化规律的具体量化值,以厄尔尼诺现象为例,此处输出为Nino3.4指数;
本发明实施例通过多尺度特征频域蒸馏和多尺度特征自适应融合,可以在继承旧知识的同时,高效地学习并挖掘新海洋数据中的变化规律,克服了增量学习过程中的灾难性遗忘问题。同时,本发明实施例首次将增量学习与海洋数据表示学习相结合,满足实际应用中的需要,并以厄尔尼诺现象为例,说明了本发明实施例的具体应用方式。
206:收集山东省过去50年中输电线路沿线的每月平均最高降雨量及该月发生极端降雨的情况,参见图3,结合过去50年中Nino3.4指数的变化规律,建立一个Nino3.4指数大小与发生极端降雨概率的映射函数,并找到一个Nino3.4指数映射值的阈值,一旦预测的值超过该阈值则在当月有很大可能发生极端降雨。
例如,本发明实施例选择2016年7月作为目标月,m设置为5,则需要将2015年11月、12月和2016年1月份的SST和HC图输入并行卷积神经网络,预测得到5个月后的Nino3.4指数,再通过映射函数,发现结果大于阈值k,则就可以实现提前5个月的输电线路暴雨预警,减少输电线路上发生的自然灾害,或线路倒塌等导致的人员伤亡等情况的发生。
综上所述,本发明实施例通过上述步骤201-步骤207弥补了之前研究的盲点,可以提升基于神经网络的极端气候预测水平,可以有效的提升增量的厄尔尼诺现象下输电线路沿线降雨量预测的准确度,减轻自然灾害。
实施例3
一种基于增量学习的厄尔尼诺极端天气预警装置,参见图4,该装置包括:
划分多个任务序列模块,用于对海洋数据进行下采样,得到多尺度的海洋数据,将多尺度数据以预设年为界划分为多个任务序列;
提取多尺度特征模块,用于将任务序列以数据流形式输入并行卷积神经网络,通过有监督表示学习提取多尺度特征;
增量训练模块,用于基于增量训练,即使用一多尺度特征频域蒸馏技术,选择性地约束多尺度特征低频分量的漂移,记忆并行卷积神经网络在旧任务中学到的知识;
自适应融合模块,用于使用一多尺度特征自适应融合技术,根据输入多尺度数据不同的时间跨度,自适应学习不同的融合参数,增强对新任务的学习能力;
预警模块,用于自适应融合后的特征通过全连接层,输出某一海洋现象变化规律的Nino3.4指数;基于Nino3.4指数建立极端降雨概率的映射函数,预测值超过阈值则进行暴雨预警并提前开展输电线路暴雨防治工作。
这里需要指出的是,以上实施例中的装置描述是与实施例中的方法描述相对应的,本发明实施例在此不做赘述。
综上所述,本发明实施例通过上述模块可以有效的提升增量的厄尔尼诺现象下输电线路沿线降雨量预测的准确度,减轻自然灾害。
实施例4
一种基于增量学习的厄尔尼诺极端天气预警装置,参见图5,该装置包括:处理器和存储器,存储器中存储有程序指令,处理器调用存储器中存储的程序指令以使装置执行实施例1中的以下方法步骤:
对海洋数据进行下采样,得到多尺度的海洋数据,将多尺度数据以预设年为界划分为多个任务序列;将任务序列以数据流形式输入并行卷积神经网络,通过有监督表示学习提取多尺度特征;基于增量训练,即使用一多尺度特征频域蒸馏技术,选择性地约束多尺度特征低频分量的漂移,记忆并行卷积神经网络在旧任务中学到的知识;
使用一多尺度特征自适应融合技术,根据输入多尺度数据不同的时间跨度,自适应学习不同的融合参数,增强对新任务的学习能力;
其中,多尺度特征频域蒸馏技术用于使新并行网络的输出特征去逼近旧并行网络的输出特征。
其中,多尺度特征自适应融合技术包括:多尺度并行网络,两个瓶颈层,两个全连接层,以及一个自适应融合函数。
进一步地,使用一多尺度特征频域蒸馏技术,选择性地约束多尺度特征低频分量的漂移,记忆并行卷积神经网络在旧任务中学到的知识具体为:
将欧氏距离定义为定义多尺度特征频域蒸馏损失函数:
进一步地,旧并行网络第个训练阶段已经训练好的网络;新并行网络:使用上一阶段训练好的网络来初始化参数的新并行网络,用于当前第个训练阶段的训练;在新的训练阶段,旧并行网络参数全程冻结,用于帮助训练新并行网络,新并行网络训练完成后删除旧并行网络。
其中,自适应融合函数为:
这里需要指出的是,以上实施例中的装置描述是与实施例中的方法描述相对应的,本发明实施例在此不做赘述。
上述的处理器1和存储器2的执行主体可以是计算机、单片机、微控制器等具有计算功能的器件,具体实现时,本发明实施例对执行主体不做限制,根据实际应用中的需要进行选择。
存储器2和处理器1之间通过总线3传输数据信号,本发明实施例对此不做赘述。
基于同一发明构思,本发明实施例还提供了一种计算机可读存储介质,存储介质包括存储的程序,在程序运行时控制存储介质所在的设备执行上述实施例中的方法步骤。
该计算机可读存储介质包括但不限于快闪存储器、硬盘、固态硬盘等。
这里需要指出的是,以上实施例中的可读存储介质描述是与实施例中的方法描述相对应的,本发明实施例在此不做赘述。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例的流程或功能。
计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者通过计算机可读存储介质进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质或者半导体介质等。
参考文献
[1]Ham, YG., Kim, JH. & Luo, JJ. Deep learning for multi-year ENSOforecasts [J]. Nature 573, 568–572 (2019).
[2]彭加毅. ENSO对西太平洋副高的影响及与东亚季风的相互作用研究[D]. 南京气象学院, 1999.
[3]韩文韬. 近50年中国冬夏气温对ENSO响应的年代际变化特征研究[D]. 南京信息工程大学, 2013.
[4]Chen, HC., Tseng, YH., Hu, ZZ. et al. Enhancing the ENSOPredictability beyond the Spring Barrier [J]. Sci Rep 10, 984 (2020)..
[5]Yan J, Mu L, Wang L, et al. Temporal Convolutional Networks forthe Advance Prediction of ENSO [J]. Scientific Reports, 2020, 10(1):8055..
[6]S. Rebuffi, A. Kolesnikov, G. Sperl, and C. H. Lampert. icarl:Incremental classifier and representation learning [J] . CVPR, 2017.
[7]Li Z, Hoiem D. Learning without forgetting [J]. IEEE transactionson pattern analysis and machine intelligence, 2017, 40(12): 2935-2947.
本发明实施例对各器件的型号除做特殊说明的以外,其他器件的型号不做限制,只要能完成上述功能的器件均可。
本领域技术人员可以理解附图只是一个优选实施例的示意图,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于增量学习的厄尔尼诺极端天气预警方法,其特征在于,所述方法包括:
对海洋数据进行下采样,得到多尺度的海洋数据,将多尺度数据以预设年为界划分为多个任务序列;
将任务序列以数据流形式输入并行卷积神经网络,通过有监督表示学习提取多尺度特征;
基于增量训练,使用多尺度特征频域蒸馏技术,选择性地约束多尺度特征低频分量的漂移,记忆并行卷积神经网络在旧任务中学到的知识;
使用多尺度特征自适应融合技术,根据输入多尺度数据不同的时间跨度,自适应学习不同的融合参数,增强对新任务的学习能力;
自适应融合后的特征通过全连接层,输出反映厄尔尼诺现象变化规律的Nino3.4指数;基于Nino3.4指数建立极端降雨概率r的映射函数,预测r值超过阈值q则进行暴雨预警并提前开展输电线路暴雨防治工作;
其中,所述使用多尺度特征频域蒸馏技术,选择性地约束多尺度特征低频分量的漂移,记忆并行卷积神经网络在旧任务中学到的知识具体为:
在每次训练新任务时,利用上一个训练阶段已经训练好的旧并行网络参数初始化新并行网络Ωt,冻结旧并行网络Ωt-1的参数,并将训练数据同时输入新旧的并行网络中;
将欧式距离定义为多尺度特征频域蒸馏损失函数:
2.根据权利要求1所述的一种基于增量学习的厄尔尼诺极端天气预警方法,其特征在于,所述多尺度特征频域蒸馏技术用于使新并行网络的输出特征去逼近旧并行网络的输出特征。
3.根据权利要求1所述的一种基于增量学习的厄尔尼诺极端天气预警方法,其特征在于,所述多尺度特征自适应融合技术包括:多尺度并行网络,两个瓶颈层,两个全连接层,以及一个自适应融合函数。
4.根据权利要求1所述的一种基于增量学习的厄尔尼诺极端天气预警方法,其特征在于,
所述旧并行网络为:第t-1个训练阶段已经训练好的网络;
所述新并行网络为:使用上一阶段训练好的网络来初始化参数的新并行网络,用于当前第t个训练阶段的训练;
在新的训练阶段,旧并行网络参数全程冻结,用于帮助训练新并行网络,新并行网络训练完成后删除旧并行网络。
6.一种基于增量学习的厄尔尼诺极端天气预警装置,其特征在于,所述装置包括:
划分多个任务序列模块,用于对海洋数据进行下采样,得到多尺度的海洋数据,将多尺度数据以预设年为界划分为多个任务序列;
提取多尺度特征模块,用于将任务序列以数据流形式输入并行卷积神经网络,通过有监督表示学习提取多尺度特征;
增量训练模块,用于基于增量训练,使用多尺度特征频域蒸馏技术,选择性地约束多尺度特征低频分量的漂移,记忆并行卷积神经网络在旧任务中学到的知识;
自适应融合模块,用于使用多尺度特征自适应融合技术,根据输入多尺度数据不同的时间跨度,自适应学习不同的融合参数,增强对新任务的学习能力;
预警模块,用于自适应融合后的特征通过全连接层,输出某一海洋现象变化规律的Nino3.4指数;基于Nino3.4指数建立极端降雨概率r的映射函数,预测r值超过阈值q则进行暴雨预警并提前开展输电线路暴雨防治工作;
其中,所述使用多尺度特征频域蒸馏技术,选择性地约束多尺度特征低频分量的漂移,记忆并行卷积神经网络在旧任务中学到的知识具体为:
在每次训练新任务时,利用上一个训练阶段已经训练好的旧并行网络参数初始化新并行网络Ωt,冻结旧并行网络Ωt-1的参数,并将训练数据同时输入新旧的并行网络中;
将欧式距离定义为多尺度特征频域蒸馏损失函数:
7.一种基于增量学习的厄尔尼诺极端天气预警装置,其特征在于,所述装置包括:处理器和存储器,所述存储器中存储有程序指令,所述处理器调用存储器中存储的程序指令以使装置执行权利要求1-5中的任一项所述的方法步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时使所述处理器执行权利要求1-5中的任一项所述的方法步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210611385.XA CN114692788B (zh) | 2022-06-01 | 2022-06-01 | 基于增量学习的厄尔尼诺极端天气预警方法及装置 |
US18/133,875 US20230393304A1 (en) | 2022-06-01 | 2023-04-12 | El nino extreme weather early warning method and device based on incremental learning |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210611385.XA CN114692788B (zh) | 2022-06-01 | 2022-06-01 | 基于增量学习的厄尔尼诺极端天气预警方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114692788A CN114692788A (zh) | 2022-07-01 |
CN114692788B true CN114692788B (zh) | 2022-08-19 |
Family
ID=82131263
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210611385.XA Active CN114692788B (zh) | 2022-06-01 | 2022-06-01 | 基于增量学习的厄尔尼诺极端天气预警方法及装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20230393304A1 (zh) |
CN (1) | CN114692788B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116975787B (zh) * | 2023-09-20 | 2023-11-28 | 国家海洋环境预报中心 | 一种enso建模和预测方法及装置 |
CN117556715B (zh) * | 2024-01-12 | 2024-03-26 | 湖南大学 | 基于信息融合的典型环境下智能电表退化分析方法及*** |
CN117909691B (zh) * | 2024-03-15 | 2024-06-07 | 广东海洋大学 | 一种海洋工程设计数据的获取***及方法 |
CN118227979A (zh) * | 2024-05-24 | 2024-06-21 | 南京信息工程大学 | 一种基于改进卷积神经网络利用热带太平洋次表层海温异常的预测enso方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103198493A (zh) * | 2013-04-09 | 2013-07-10 | 天津大学 | 一种基于多特征自适应融合和在线学习的目标跟踪方法 |
CN107092793A (zh) * | 2017-04-20 | 2017-08-25 | 国网湖南省电力公司 | 一种输电线路沿线降雨响应程度计算方法及其*** |
CN113515656A (zh) * | 2021-07-06 | 2021-10-19 | 天津大学 | 一种基于增量学习的多视角目标识别与检索方法、及装置 |
CN114169394A (zh) * | 2021-11-04 | 2022-03-11 | 浙江大学 | 一种多尺度自适应图学习的多变量时间序列预测方法 |
CN114202091A (zh) * | 2021-07-02 | 2022-03-18 | 中国海洋大学 | 印度洋偶极子指数预测方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108089186A (zh) * | 2018-01-08 | 2018-05-29 | 哈尔滨工程大学 | 基于航海雷达图像遮挡区多特性参数组合的雨强等级反演方法 |
CN109933839B (zh) * | 2019-01-11 | 2023-04-14 | 青岛理工大学 | 一种关于时-空数据分析的集成式极点对称模态分解方法 |
US10871594B2 (en) * | 2019-04-30 | 2020-12-22 | ClimateAI, Inc. | Methods and systems for climate forecasting using artificial neural networks |
US11537889B2 (en) * | 2019-05-20 | 2022-12-27 | ClimateAI, Inc. | Systems and methods of data preprocessing and augmentation for neural network climate forecasting models |
CN113792757B (zh) * | 2021-08-18 | 2023-12-08 | 吉林大学 | 一种基于多尺度注意力残差网络的波形图分类方法 |
-
2022
- 2022-06-01 CN CN202210611385.XA patent/CN114692788B/zh active Active
-
2023
- 2023-04-12 US US18/133,875 patent/US20230393304A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103198493A (zh) * | 2013-04-09 | 2013-07-10 | 天津大学 | 一种基于多特征自适应融合和在线学习的目标跟踪方法 |
CN107092793A (zh) * | 2017-04-20 | 2017-08-25 | 国网湖南省电力公司 | 一种输电线路沿线降雨响应程度计算方法及其*** |
CN114202091A (zh) * | 2021-07-02 | 2022-03-18 | 中国海洋大学 | 印度洋偶极子指数预测方法 |
CN113515656A (zh) * | 2021-07-06 | 2021-10-19 | 天津大学 | 一种基于增量学习的多视角目标识别与检索方法、及装置 |
CN114169394A (zh) * | 2021-11-04 | 2022-03-11 | 浙江大学 | 一种多尺度自适应图学习的多变量时间序列预测方法 |
Non-Patent Citations (3)
Title |
---|
Deep learning for multi-year ENSO forecasts;Yoo-Geun Ham 等;《NATURE》;20190926;全文 * |
Multi-Year ENSO Forecasts Using Parallel Convolutional Neural Networks With Heterogeneous Architecture;Min Ye 等;《Frontiers in Marine Science》;20210819;全文 * |
Temporal Convolutional Networks for the Advance Prediction of ENSO;Jining Yan 等;《scientific reports》;20200515;全文 * |
Also Published As
Publication number | Publication date |
---|---|
US20230393304A1 (en) | 2023-12-07 |
CN114692788A (zh) | 2022-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114692788B (zh) | 基于增量学习的厄尔尼诺极端天气预警方法及装置 | |
Sadler et al. | Modeling urban coastal flood severity from crowd-sourced flood reports using Poisson regression and Random Forest | |
US10909446B2 (en) | Systems and methods for selecting global climate simulation models for training neural network climate forecasting models | |
US11537889B2 (en) | Systems and methods of data preprocessing and augmentation for neural network climate forecasting models | |
US11231522B2 (en) | Methods and systems for climate forecasting using artificial neural networks | |
Granata et al. | Artificial Intelligence models for prediction of the tide level in Venice | |
CN112132149B (zh) | 一种遥感影像语义分割方法及装置 | |
CN104268627A (zh) | 一种基于深度神经网络迁移模型的短期风速预报方法 | |
CN114077913A (zh) | 基于自动储层神经网络的多步预测未来风速的方法和*** | |
Kim et al. | DeepTC: ConvLSTM network for trajectory prediction of tropical cyclone using spatiotemporal atmospheric simulation data | |
CN116108995A (zh) | 感潮河段船舶油耗预测方法、装置及电子设备 | |
CN116152206A (zh) | 一种光伏输出功率预测方法、终端设备及存储介质 | |
Abdalla et al. | Deep learning weather forecasting techniques: literature survey | |
Qu et al. | A hybrid model based on ensemble empirical mode decomposition and fruit fly optimization algorithm for wind speed forecasting | |
CN115470957A (zh) | 基于深度学习的台风期间近海海浪波高预测***、计算机设备、存储介质 | |
Mar et al. | Optimum neural network architecture for precipitation prediction of Myanmar | |
Ronghua et al. | Prediction of soil moisture with complex-valued neural network | |
CN114881295A (zh) | 一种基于注意力机制的gcn-lstm船舶交通流预测方法 | |
Alshayeb et al. | Novel optimized deep learning algorithms and explainable artificial intelligence for storm surge susceptibility modeling and management in a flood-prone island | |
John et al. | Prediction of floods using improved pca with one-dimensional convolutional neural network | |
Yang et al. | Improving Seasonal Prediction of Summer Precipitation in the Middle–Lower Reaches of the Yangtze River Using a TU-Net Deep Learning Approach | |
CN117151303B (zh) | 一种基于混合模型的超短期太阳辐照度预测方法及*** | |
Liu et al. | A-KNN: An adaptive method for constructing high-resolution ocean models | |
Zhang et al. | Spatial-temporal Offshore Current Field Forecasting Using Residual-learning Based Purely CNN Methodology with Attention Mechanism | |
Qiu et al. | Enhancing Multidimensional Rainfall and Reservoir Flow Forecasting: Innovations and Improvements in the Informer Model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder |
Address after: 300072 Tianjin City, Nankai District Wei Jin Road No. 92 Patentee after: Tianjin University Patentee after: Qingdao Marine Science and Technology Center Address before: 300072 Tianjin City, Nankai District Wei Jin Road No. 92 Patentee before: Tianjin University Patentee before: QINGDAO NATIONAL LABORATORY FOR MARINE SCIENCE AND TECHNOLOGY DEVELOPMENT CENTER |
|
CP01 | Change in the name or title of a patent holder |