CN117556197B - 一种基于人工智能的台风涡旋初始化方法 - Google Patents
一种基于人工智能的台风涡旋初始化方法 Download PDFInfo
- Publication number
- CN117556197B CN117556197B CN202410038922.5A CN202410038922A CN117556197B CN 117556197 B CN117556197 B CN 117556197B CN 202410038922 A CN202410038922 A CN 202410038922A CN 117556197 B CN117556197 B CN 117556197B
- Authority
- CN
- China
- Prior art keywords
- data
- typhoon
- typhoons
- meteorological
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 22
- 238000011423 initialization method Methods 0.000 title claims abstract description 17
- 238000000034 method Methods 0.000 claims abstract description 186
- 238000013136 deep learning model Methods 0.000 claims abstract description 79
- 238000012549 training Methods 0.000 claims abstract description 56
- 230000006399 behavior Effects 0.000 claims abstract description 23
- 230000009467 reduction Effects 0.000 claims abstract description 20
- 238000013480 data collection Methods 0.000 claims abstract description 11
- 230000008602 contraction Effects 0.000 claims abstract description 8
- 238000010801 machine learning Methods 0.000 claims abstract description 8
- 239000000284 extract Substances 0.000 claims abstract description 7
- 238000003909 pattern recognition Methods 0.000 claims abstract description 7
- 238000013499 data model Methods 0.000 claims abstract description 5
- 230000008569 process Effects 0.000 claims description 84
- 238000004458 analytical method Methods 0.000 claims description 59
- 230000006870 function Effects 0.000 claims description 56
- 230000008859 change Effects 0.000 claims description 52
- 238000004364 calculation method Methods 0.000 claims description 30
- 238000012545 processing Methods 0.000 claims description 30
- 238000006243 chemical reaction Methods 0.000 claims description 24
- 238000000605 extraction Methods 0.000 claims description 21
- 238000010606 normalization Methods 0.000 claims description 21
- 238000011161 development Methods 0.000 claims description 18
- 230000018109 developmental process Effects 0.000 claims description 18
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 18
- 238000005070 sampling Methods 0.000 claims description 16
- 239000013535 sea water Substances 0.000 claims description 15
- 238000005516 engineering process Methods 0.000 claims description 14
- 230000008520 organization Effects 0.000 claims description 13
- 230000011218 segmentation Effects 0.000 claims description 12
- 238000011176 pooling Methods 0.000 claims description 11
- 238000001556 precipitation Methods 0.000 claims description 11
- 238000010276 construction Methods 0.000 claims description 9
- 238000003908 quality control method Methods 0.000 claims description 9
- 230000002159 abnormal effect Effects 0.000 claims description 8
- 238000013527 convolutional neural network Methods 0.000 claims description 8
- 238000005457 optimization Methods 0.000 claims description 8
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 230000002829 reductive effect Effects 0.000 claims description 7
- 230000001932 seasonal effect Effects 0.000 claims description 7
- 101100366707 Arabidopsis thaliana SSL11 gene Proteins 0.000 claims description 6
- 101100366710 Arabidopsis thaliana SSL12 gene Proteins 0.000 claims description 6
- 230000003542 behavioural effect Effects 0.000 claims description 6
- 230000005540 biological transmission Effects 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 6
- 230000007774 longterm Effects 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000005728 strengthening Methods 0.000 claims description 6
- 101100366711 Arabidopsis thaliana SSL13 gene Proteins 0.000 claims description 5
- 101100366561 Panax ginseng SS11 gene Proteins 0.000 claims description 5
- 230000009286 beneficial effect Effects 0.000 claims description 5
- 230000010354 integration Effects 0.000 claims description 5
- 230000007613 environmental effect Effects 0.000 claims description 4
- 230000004927 fusion Effects 0.000 claims description 4
- 238000012795 verification Methods 0.000 claims description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 101100366562 Panax ginseng SS12 gene Proteins 0.000 claims description 3
- 101100366563 Panax ginseng SS13 gene Proteins 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 3
- 238000010219 correlation analysis Methods 0.000 claims description 3
- 230000003247 decreasing effect Effects 0.000 claims description 3
- 238000009499 grossing Methods 0.000 claims description 3
- 238000012804 iterative process Methods 0.000 claims description 3
- 238000013178 mathematical model Methods 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 3
- 238000012544 monitoring process Methods 0.000 claims description 3
- 230000036961 partial effect Effects 0.000 claims description 3
- 230000000737 periodic effect Effects 0.000 claims description 3
- BULVZWIRKLYCBC-UHFFFAOYSA-N phorate Chemical compound CCOP(=S)(OCC)SCSCC BULVZWIRKLYCBC-UHFFFAOYSA-N 0.000 claims description 3
- 230000001737 promoting effect Effects 0.000 claims description 3
- 238000000547 structure data Methods 0.000 claims description 3
- 239000000758 substrate Substances 0.000 claims description 3
- 238000012731 temporal analysis Methods 0.000 claims description 3
- 238000000700 time series analysis Methods 0.000 claims description 3
- 238000004800 variational method Methods 0.000 claims description 3
- JTJMJGYZQZDUJJ-UHFFFAOYSA-N phencyclidine Chemical class C1CCCCN1C1(C=2C=CC=CC=2)CCCCC1 JTJMJGYZQZDUJJ-UHFFFAOYSA-N 0.000 claims 3
- 238000012216 screening Methods 0.000 claims 2
- 230000005856 abnormality Effects 0.000 claims 1
- 230000002708 enhancing effect Effects 0.000 claims 1
- 229920006395 saturated elastomer Polymers 0.000 claims 1
- 230000002265 prevention Effects 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000007547 defect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 239000013589 supplement Substances 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000012407 engineering method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
- G06F18/15—Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/17—Function evaluation by approximation methods, e.g. inter- or extrapolation, smoothing, least mean square method
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Operations Research (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于人工智能的台风涡旋初始化方法,通过结合多种气象数据来源提供了更全面的台风行为信息,通过对数据进行预处理并将其转换为适合机器学习模型使用的数据集,通过应用深度学习模型,包括一个收缩路径和一个扩展路径以及跳跃连接,对数据进行特征学习和模式识别,提取台风的关键特征和模式,通过将训练好的深度学习模型应用于实时气象数据,构建台风涡旋结构并预测台风路径和强度,通过持续的数据收集和模型训练,更新和改进深度学习模型的预测能力。本发明的方法能够实现更为准确的台风涡旋初始化,显著提升台风路径和强度预测的准确性和效率,为台风预警和防灾减灾提供有效的技术支持。
Description
技术领域
本发明属于气象预报技术领域,涉及台风涡旋初始化的方法和技术改进,特别是一种基于人工智能的台风涡旋初始化方法,旨在提高台风路径和强度预测的准确性和效率,为灾害预防和减轻提供科学依据。
背景技术
台风是一种主要在热带或亚热带海洋上由特定气象条件下形成的强大的旋转风暴,具有极高的风速和降水量,作为一种极端的天气现象,对全球社会、经济和人民生活产生了深远的影响。台风的不可预测性和巨大破坏力使得准确的台风预测成为气象学中的一个紧迫而重要的任务。为了实现台风预测,需要对海洋、大气、陆地等多个***的相互作用进行深入的分析和模拟,这涉及到大量的非线性、动态、随机和不确定的因素,对数据的处理和模型的建立提出了很高的要求。传统的台风预测方法依赖于经典的气象模型和有限的观测数据,但在处理大量复杂数据时显示出明显的局限性,尤其是在台风涡旋初始化方面。
台风涡旋初始化在气象学中是一个关键过程,是实现准确天气预报的基础,特别是在对台风这类复杂气象现象的预测中。这一过程涉及在给定的边界条件下,利用观测数据和模式预报场,通过数据同化等算法让台风在气象模型中发展,以获取相对合理台风的初始状态,提升台风初始涡旋的代表性。这一过程对于准确预测台风路径和强度至关重要,因为台风的初始状态会影响后续的模拟结果。然而,由于观测数据的限制和模型本身的不足,传统的台风涡旋初始化方法在初始化时往往无法准确反映台风的实际强度和路径。在模拟中,由于模型分辨率和处理能力的限制,台风的初始涡旋仍然不够准确,导致较大的强度预报误差,影响了气象预报的整体可靠性。
目前,常用的台风台风涡旋初始化方法主要有以下几种:一是BVM法(BogusVortex Method),该方法是在模式预报场中人为地***一个假想的台风涡旋,以模拟台风的存在,然后通过模式平衡调整,使其与周围环境相协调。该方法的优点是简单易行,缺点是涡旋的位置、形状、强度等参数都需要人为设定,且与实际观测数据的一致性较差。二是BDAM法(Bogus Data Assimilation Method),该方法是在BVM的基础上,利用观测数据对涡旋进行修正,使其更接近真实的台风状态。该方法的优点是能够利用观测数据,缺点是观测数据的质量和数量不足,且数据同化过程中存在误差传播和非线性问题。此外还有EnKF法(Ensemble Kalman Filter Method),该方法是一种基于蒙特卡罗(Monte Carlo)技术的数据同化方法,它通过生成一组初始状态的集合,然后利用观测数据对集合进行更新,得到后验状态的集合,从而反映台风的不确定性。该方法的优点是能够考虑观测和模式的误差,缺点是计算量大,且对观测数据的分布和质量要求高。
然而,上述现有台风涡旋初始化方法在处理观测数据时存在诸多问题。观测数据的不足、数据质量问题以及模型的简化假设,经常导致预测结果与实际情况有较大的偏差。更重要的是,这些方法往往无法充分利用现有的大量气象数据,尤其是模式预报和分析数据,从而限制了涡旋初始化的性能和准确性。这种局限性主要源自于现有方法在数据处理和整合方面的不足。例如,传统的台风涡旋初始化技术往往难以有效整合来自不同来源和不同类型的气象数据,如卫星遥感数据、气象雷达数据、地面观测站数据等。这些数据在空间和时间分辨率、参数类型等方面的差异性使得它们的综合应用成为一个复杂的挑战。此外,由于技术限制,传统方法在处理大规模、高维度的数据时也显示出了局限性,难以实现数据的深度挖掘和有效应用。
综上,台风预测是气象学中的一个重要而复杂的任务,其准确性直接影响灾害预防和应对。传统的台风涡旋初始化方法依赖于有限的观测数据和经验模型,这在很大程度上限制了预测的准确性。随着人工智能技术的发展,出现了通过更复杂的数据分析和模式识别来改进台风预测的可能性。面对这一发展,为克服现有传统方法在数据利用和特征识别方面的局限,如何通过集成创新技术手段对台风涡旋初始化进行改进,以提高台风预测的准确性和效率,成为了当前气象领域中一个亟待解决的技术问题。
发明内容
(一)发明目的
鉴于上述背景和存在的问题,特别是在台风涡旋初始化过程中观测数据的限制、模型简化假设带来的不足,以及传统台风涡旋初始化方法在数据利用和特征识别方面的局限性,本发明旨在通过一种基于人工智能的台风涡旋初始化方法。该方法通过结合深度学习模型与大量模式再分析和预报数据,旨在克服传统方法在处理复杂气象数据和实现准确台风涡旋初始化方面的局限性。本发明通过集成再分析数据、台风分析数据、模式预报数据及台风最佳路径数据等多种气象数据来源,提供了更全面的台风行为视角,有效地提升了预测模型的输入数据质量和准确性。同时,本发明通过应用深度学习模型能够准确识别和分析台风的不同模式和特征,为台风涡旋初始化提供了更为精确的信息。本发明通过结合多源数据集成和先进的深度学习技术,显著提升了台风路径和强度预测的准确性和效率,对于灾害预防和减轻具有重要的实际应用价值。
(二)技术方案
为实现该发明目的,解决其技术问题,本发明采用如下技术方案:
一种基于人工智能的台风涡旋初始化方法,用于实现台风涡旋的初始化,其特征在于,该方法在实施时至少包括以下步骤:
SS1. 多源气象数据收集
收集并分析多种气象数据来源的多种不同类型的气象数据以获取台风的历史和实时的行为信息,所述多种不同类型的气象数据至少包括再分析数据、台风分析数据、台风模式预报数据和台风最佳路径数据,其中,所述再分析数据是通过将历史气象观测数据与气象模型相结合所重构的过去气象条件数据集,所述台风分析数据为针对台风事件进行动力初始化和同化观测后形成的气象数据,所述台风模式预报数据为基于气象模型预测产生的台风未来行为气象数据,所述台风最佳路径数据为综合多种信息后所得出的台风实际移动路径数据;
SS2. 多源气象数据预处理
对步骤SS1所收集的多源气象数据进行至少包括数据插值、数据规范化和特征工程在内的预处理以转换为适合机器学习模型使用的数据集,其中,所述数据插值处理通过考虑待插值点与已知数据点之间的距离来估算待插值点的数值以填补数据空白或将数据转换为统一的分辨率,所述数据规范化处理至少包括单位转换、缩放到统一区间和标准化处理以将数据转换为一致的格式和尺度,所述特征工程至少包括基本气象特征提取、时间序列特征提取、高级特征构造、特征选择和数据降维以从原始数据中提取和选择对于台风预测任务最有用的特征;
SS3. 深度学习模型训练
使用深度学习模型对步骤SS2预处理后的数据集进行特征学习和模式识别以提取台风的关键特征和模式,并通过训练和验证过程优化深度学习模型的性能和准确性,其中,所述深度学习模型用于捕获上下文信息和精确定位台风特征并至少包括一收缩路径和一对称的扩展路径,所述收缩路径用于提取数据中的高级特征并包括多个卷积层和池化层,所述扩展路径用于恢复数据中的细节信息并包括多个卷积层和上采样层,所述卷积层和上采样层之间还设有跳跃连接,用于将所述收缩路径中的低级特征与所述扩展路径中的高级特征之间的数据连接,所述训练和验证过程利用分割的数据集进行模型训练和验证,以评估模型的准确性和泛化能力,确保其在实际应用中的有效性;
SS4. 台风涡旋初始化
将步骤SS3训练好的深度学习模型应用于实时气象数据以构建台风涡旋结构并预测台风路径和强度,其中,所述台风涡旋结构为至少包括台风的形状、大小、强度和风场分布信息的三维结构,所述预测台风路径和强度是指根据所述台风涡旋结构和气象模型,计算台风在未来一定时间内的移动方向、速度和变化趋势;
SS5. 持续学习和优化模型
通过持续的数据收集和模型训练以不断更新和改进所述深度学习模型的预测能力,其中,所述数据收集包括实时获取最新的气象数据和台风数据以及反馈所述深度学习模型的预测结果和实际观测结果之间的差异,所述模型训练包括根据数据的变化和反馈的误差调整所述深度学习模型的参数和结构,以适应不断变化的气象条件和并不断提升预测的准确性。
本发明优选的实例中,上述步骤SS1中,所述再分析数据是通过将历史气象观测数据与气象模型相结合所重构的过去气象条件数据集,所述过去气象条件数据集用以反映台风发生和发展的历史气象环境、为台风的历史行为提供全面视角并为台风涡旋初始化提供背景信息,所述再分析数据的生成至少包括如下子步骤:
SS11. 收集和整理历史气象观测数据,所述历史气象观测数据至少包括通过地面、船舶、探空和/或卫星气象观测方式得到的涵盖广泛时间和空间范围并包括多种气象要素和台风信息的气象数据,所述气象要素至少包括风速、气压、温度和/或湿度,所述台风信息至少包括台风的路径、强度和/或风场,对历史气象观测数据的整理包括对数据进行质量控制和格式转换以便于后续的处理和分析;
SS12. 选择合适的气象模型并根据气象模型的输入要求,对步骤SS11中的历史气象观测数据进行插值和规范化以保证数据的一致性和完整性,同时考虑数据的时空分辨率和覆盖范围以满足模型的精度和稳定性后输入到气象模型中以产生模型预测数据,所述气象模型是指基于物理方程和数值方法建立的用于模拟和预测气象现象的数学模型,包括全球气候模型、区域气候模型或数值天气预报模型;
SS13. 利用数据同化技术对步骤SS12中所输入的历史气象观测数据与气象模型所输出的模型预测数据进行融合和最优集成,以减少观测数据和模型预测数据之间的误差并提高数据的可信度和代表性,同时保留数据的动力和物理意义以便于反映台风的特征和行为,所述数据同化技术为变分法、卡尔曼滤波法或集合卡尔曼滤波法;
SS14. 输出步骤SS13中的结果以得到再分析数据,即重构的过去气象条件数据集,所述过去气象条件数据集提供了对过去气象条件的连续且一致的重构,继而作为台风涡旋初始化的重要输入,为深度学习模型训练提供必要的历史气象信息,增强模型对台风行为预测的准确性。
进一步地,上述子步骤SS11中,对历史气象观测数据的整理包括对数据进行质量控制和格式转换,其中,对数据进行质量控制,包括检查数据是否存在缺失、异常、错误和/或不一致问题,并对问题数据进行修正或剔除;对数据进行格式转换,包括将数据转换为适合机器学习模型使用的统一的数据格式和尺度,并对数据进行单位转换、缩放到统一区间和/或标准化处理,以保证数据的一致性和完整性。
本发明优选的实例中,上述步骤SS1中,所述台风分析数据为针对台风事件进行动力初始化和同化观测后形成的气象数据,所述台风分析数据至少包括:
台风的路径数据,即台风中心在不同时间点的经纬度坐标,用于描述台风的移动轨迹和速度以及与地理位置的关系,所述台风的路径数据从各国家级气象局和/或国际气象组织提供的台风最佳路径数据或者利用卫星图像和地面观测结果进行插值和平滑处理得到;
台风的强度数据,即台风中心在不同时间点的最低气压和最大风速,用于描述台风的强度等级和变化趋势以及与气象条件的关系,所述台风的强度数据从各国家级气象局和/或国际气象组织提供的台风最佳路径数据或者利用卫星图像和地面观测结果进行估测和校正得到;
台风的三维结构数据,即台风影响范围内不同半径和高度处的风速、风向、温度、湿度和/或气压信息,以再分析数据作为背景场,通过同化卫星和地面观测数据并在此基础上开展涡旋初始化以得到更加能够代表台风涡旋结构的三维数据,并且其中所述涡旋初始化采用气象模型从分析时刻的前一个时刻积分到分析时刻,然后将台风涡旋移植到前一时刻,重复上述步骤至涡旋强度与最佳路径强度接近。
本发明优选的实例中,上述步骤SS1中,所述台风模式预报数据为基于气象模型预测产生的台风未来行为气象数据,所述台风模式预报数据包括:
台风路径预报数据,即根据气象模型对台风中心的移动方向和速度进行预测的数据,用于描述台风未来的移动轨迹和位置以及与地理位置的关系;所述台风路径预报数据从各国家级气象局和/或国际气象组织提供的台风模式预报数据或者利用自主研发的数值天气预报模型生成;
台风强度预报数据,即根据气象模型对台风中心的最低气压和最大风速进行预测的数据,用于描述台风未来的强度等级和变化趋势以及与气象条件的关系;所述台风强度预报数据从各国家级气象局和/或国际气象组织提供的台风模式预报数据或者利用自主研发的数值天气预报模型生成;
台风风场预报数据,即根据气象模型对台风中心附近不同半径和高度处的风速和风向进行预测的数据,用于描述台风未来的结构和动力特征以及与环境流场的关系;所述台风风场预报数据从各国家级气象局和/或国际气象组织提供的台风模式预报数据或者利用自主研发的数值天气预报模型生成;
台风降水预报数据,即根据气象模型对台风中心附近不同区域和高度处的降水量和降水类型进行预测的数据,用于描述台风未来的水汽输送和降水分布特征以及与热力条件的关系;
其中,所述台风路径预报数据、台风强度预报数据、台风风场预报数据及台风降水预报数据从各国家级气象局和/或国际气象组织提供的台风模式预报数据或者利用自主研发的数值天气预报模型生成。
本发明优选的实例中,上述步骤SS1中,所述台风最佳路径数据为综合多种信息后所得出的台风实际移动路径数据,所述台风实际路径数据通过汇总和分析来自气象观测站、卫星观测以及其他相关技术手段所记录的信息得出,提供了关于台风实际移动轨迹的准确信息,包括其路径变化、移动速度以及与预测模型偏差的详细分析。
本发明优选的实例中,上述步骤SS2中,所述数据插值处理通过考虑待插值点与已知数据点之间的距离来估算待插值点的数值以填补数据空白或将数据转换为统一的分辨率,其中所述数据插值处理采用Cressman空间插值方法,该方法根据以下公式进行插值计算:
式中,V(P)表示待插值点P的数值,V(P i )表示已知数据点P i 的数值,W(d i )表示基于距离d i 的权重函数并且为距离d i 的递减函数,d i 表示待插值点P与已知数据点P i 之间的距离,n表示参与插值的数据点数量。
本发明优选的实例中,上述步骤SS2中,所述数据插值处理还包括对数据进行空间和时间的加权平均以考虑数据的时空相关性和可信度并提高数据的连续性和代表性,并根据以下公式对数据进行空间和时间的数据插值和加权平均计算:
式中,V(P)表示待插值点P的数值,V(P i )表示已知数据点P i 的数值,W s (d i )表示基于距离d i 的空间权重函数,W t (d i )表示基于时间t i 的时间权重函数,d i 表示待插值点P与已知数据点P i 之间的空间距离,t i 表示待插值点P与已知数据点P i 之间的时间差,n表示参与插值的数据点数量。
进一步地,所述空间权重函数W s (d i )和时间权重函数W t (d i )采用如下高斯函数的形式进行表达:
式中,σ s 和σ t 分别表示空间和时间的标准差,用于分别控制空间和时间的权重衰减速度。
本发明优选的实例中,上述步骤SS2中,所述数据规范化处理至少包括单位转换、缩放到统一区间和标准化处理以将数据转换为一致的格式和尺度,并至少包括如下子步骤:
SS21. 对数据进行单位转换,将不同单位的气象数据转换为统一的标准单位,以消除单位差异对模型训练的影响;
SS22. 将数据缩放到统一区间,将所有气象数据类型按照一定的比例缩放到0到1或-1到1的统一区间范围内以消除不同测量范围差异对模型训练的影响,并使用如下公式所示的最小-最大规范化方法在进行数据缩放:
式中,X为原始数据,X norm 为规范化后的数据,X min 和X max 分别为同类型数据在数据集中的最小值和最大值;
SS23. 对数据进行标准化处理,将气象数据转换为均值为0、标准差为1的标准格式以消除数据分布差异对模型训练的影响,其标准化公式为:
式中,X为原始气象数据,μ为数据的均值,δ为数据的标准差,Z为标准化后的气象数据。
本发明优选的实例中,上述步骤SS2中,所述特征工程包括基本气象特征提取、时间序列特征提取、高级特征构造、特征选择和数据降维以从原始数据中提取和选择对于台风预测任务最有用的特征,并至少包括如下子步骤:
SS2A. 对数据进行基本气象特征提取,所述基本气象特征为反映台风发展信息的指标并至少包括垂直风切变(VWS)、条件性海洋热含量(COHC)、200百帕散度(D200)、相对湿度(RHMD)、海平面气压变化(dMSLP)和/或台风移动速度(SPD);
SS2B. 对数据进行时间序列特征提取,从气象数据的时间序列中提取趋势分析和季节性模式,包括分析长期的温度和/或气压变化趋势以及识别数据中的季节性降水模式和/或风向变化,通过这些时间序列分析以捕捉与台风发展有关的长期和周期性变化;
SS2C. 对数据进行高级特征构造,基于历史同期数据比较构建高级特征以突出当前气象条件与历史模式的对比和异常特征,通过比较分析以提取当前数据的异常或显著特征;
SS2D. 对数据进行特征选择,至少包括相关性分析和特征重要性评估,通过分析各特征与台风强度和路径预测的相关性以筛选出与预测最相关的特征,通过评估各特征对预测模型的贡献度以筛选对预测最有帮助的特征;
SS2E. 根据特征数量的多少判断是否对数据进行数据降维,若特征数量大于预设阈值则对数据进行数据降维,通过数据降维处理以去除数据中的冗余和不相关特征并保留对预测最重要的特征,从而减少特征的数量和复杂度,并简化模型并降低计算负担。
进一步地,上述子步骤SS2A在对数据进行基本气象特征提取的过程中:
所述垂直风切变(VWS)是指在不同高度上风速的方向和速度变化,其计算公式为:
式中,u 850和v 850分别表示850百帕高度上的东西向和南北向风速,u 200和v 200分别表示200百帕高度上的东西向和南北向风速,并且其中较低的垂直风切变有利于台风的强度和发展;
所述条件性海洋热含量(COHC)是指海洋中储存的热量,高的海洋热含量有利于为台风提供更多能量并促进其加强,其计算公式为:
式中,c p 为海水的比热容,ρ为海水的密度,T为海水的温度,T 26为26°C的等温线深度,D 26为26°C的等温线深度与海底深度的最小值;
所述200百帕散度(D200)是指在大气中大约12千米高度并对应200百帕气压的水平风场散度情况,其计算公式为:
式中,u和v分别表示东西向和南北向风速,x和y分别表示经度和纬度,正散度即空气流动呈发散状态并与热带气旋的加强有关,因为其有助于热带气旋上层的空气流出并为气旋中心带来更多的上升气流和能量,负散度即空气流动呈聚集状态可能会抑制热带气旋的发展;
所述相对湿度(RHMD)是指实际温度T下的饱和水汽压与露点温度T d 下的饱和水汽压的比值,其计算公式为:
式中,e sat (Td)为露点温度下的饱和水汽压,e sat (T)为实际温度下的饱和水汽压,所述相对湿度(RHMD)的变化提供了大气中水汽含量的分布和变化,对准确预测降水潜力和台风强度变化具有重要影响;
所述海平面气压变化(dMSLP)是指海平面气压的变化率,其计算采用前后两个时次的海平面气压值(MSLP)之差来表示变化率以反映海平面气压在不同时间点的变化,其计算公式为:
式中,MSLP(t1)、MSLP(t2)分别为第一个时次t1、第二个时次t2的海平面气压值,海平面气压变化(dMSLP)是监测台风发展的关键指标之一,海平面气压的降低预示着台风的加强;
所述台风移动速度(SPD)是指台风中心在一定时间内的平均移动速度,关系到其路径预测以及可能影响的区域,台风移动速度的计算采用两个时间点间台风中心位置的变化距离除以时间间隔以获得准确的移动速度估算,其计算公式为:
式中,x 1,y 1和x 2,y 2分别代表在两个不同时间点的台风中心的地理坐标,Δt是这两个时间点之间的时间差。
本发明优选的实例中,上述步骤SS3中,所述深度学习模型为基于卷积神经网络(CNN)的Unet深度学习模型,所述Unet深度学习模型具有用于提取和融合气象数据中关键特征和模式的U形结构并包含一收缩路径和一对称的扩展路径,其中,所述收缩路径由多个卷积层和池化层组成,用于捕获上下文信息和进行下采样;所述扩展路径由多个卷积层和上采样层组成,用于恢复细节信息和进行上采样;所述收缩路径和扩展路径之间还设有跳跃连接,用于将低级特征和高级特征进行拼接以增强特征的表达能力。
进一步地,所述Unet深度学习模型基于所输入的气象数据并通过其多层结构学习和提取台风的关键特征和模式,所述台风的关键特征和模式至少包括台风的形状、大小、强度和移动模式,其中,
对于台风的形状,所述Unet深度学习模型通过收缩路径和扩展路径的卷积操作以及与跳跃连接和上采样层的组合捕捉和重构台风的空间结构,至少包括识别和提取台风的眼壁、螺旋雨带特征及其在不同时间点的变化,从而识别出台风的轮廓和边界并得到台风的形状信息;
对于台风的大小,所述Unet深度学习模型通过收缩路径和扩展路径的卷积层的特征提取操作以及池化层和上采样层的下采样和上采样操作调整台风的分辨率,至少包括在多个尺度上对台风图像进行分析以测量其空间覆盖范围和边界、计算台风的几何属性及其在不同时间点的变化,从而得到台风的大小和面积信息;
对于台风的强度,所述Unet深度学习模型通过收缩路径和扩展路径的跳跃连接操作融合不同层次的特征,通过综合分析至少包括风速、气压、温度在内的多种气象参数以及至少包括海洋热含量和垂直风切变在内的动力学因素,得到台风中心及其周围区域的至少包括中心气压、最大风速、最大风半径在内的强度信息;
对于台风的移动模式,所述Unet深度学习模型通过收缩路径和扩展路径的卷积层的特征提取操作分析台风的移动趋势和方向,至少包括通过分析气象数据的时空特征和大气环流模式并结合压力场数据预测台风的潜在移动方向和速度,从而得到台风的移动模式信息。
进一步地,所述Unet深度学习模型训练的过程涉及调整网络的权重以最小化预测输出和实际结果之间的差异,模型训练过程至少包括如下子步骤:
SS31. 初始化权重:在训练开始时,对Unet深度学习模型网络中的权重进行随机初始化以打破网络的对称性,所述权重表示网络各层之间的连接强度并决定了网络的初始状态和收敛速度;
SS32. 前向传播:给定一组输入的气象数据和对应的台风分割标签,网络通过其包括收缩路径和扩展路径在内的多层结构对输入数据进行特征提取和分割以得到网络的预测输出,在训练的每个步骤中,输入的气象数据通过网络进行前向传播,每一层中的数据与权重相乘并加上偏置后通过激活函数进行非线性转换,包括通过卷积层、池化层以及上采样层的传递,以生成对台风特征的预测输出;
SS33. 计算损失:根据网络的预测输出和实际结果并基于损失函数计算网络的损失函数值以反映网络的分割误差,所述损失函数使用均方误差、交叉熵损失或Dice系数进行定义;
SS34. 反向传播:根据损失函数值计算网络中每一层的梯度,即损失函数对每一层权重的偏导数以反映权重变化对损失函数的影响,并基于损失函数的梯度及反向传播算法计算每个权重对最终损失的贡献度,这个过程从输出层开始,逐层向后传播到输入层;
SS35. 权重更新:根据反向传播计算出的梯度并结合学习率,使用随机梯度下降或Adam优化算法更新调整网络中每一层的权重,使得权重沿着梯度的反方向变化,从而使得损失函数值减小,继而减小预测输出和实际结果之间的差异;
SS36. 迭代过程:重复前向传播、损失计算、反向传播和权重更新的过程,直至损失函数值收敛使得模型在训练数据上的性能达到可接受的水平或达到预设的迭代次数。
(三)技术效果
同现有技术相比,本发明的基于人工智能的台风涡旋初始化方法,具有以下有益且显著的技术效果:
(1)本发明通过结合多源气象数据,包括再分析数据、台风分析数据、台风模式预报数据和台风最佳路径数据等,提供了更全面的台风行为视角,这种综合性的数据利用方式显著提高了台风预测的准确性和可靠性。现有技术通常依赖于单一数据源或简化的数据处理方法,本发明不仅能够利用历史和实时的观测数据,还能够结合模式的预报数据和最佳路径数据,从而更好反映台风实际情况和未来趋势,为台风涡旋初始化提供更为可靠的数据基础。
(2)本发明在数据预处理阶段采用的数据插值、规范化和特征工程方法为深度学习模型的训练提供了高质量的数据输入。特别是Cressman插值方法和数据规范化步骤,确保了不同来源和分辨率的数据能被有效整合和标准化。相比于现有技术,本发明的方法能够解决数据空白、数据不一致和数据冗余等问题,通过数据插值和数据规范化,将数据转换为统一的分辨率、格式和尺度,通过特征工程,从原始数据中提取和选择对于台风预测任务最有用的特征,从而降低数据的维度和复杂度,提高数据的有效性和可用性。
(3)本发明应用深度学习模型对数据集进行特征学习和模式识别,以提取台风的关键特征和模式,并通过训练和验证过程优化深度学习模型的性能和准确性。相比于现有技术,本发明的方法能够利用深度学习模型的非线性拟合和自适应学习能力,从复杂的气象数据中自动地学习和提取台风的高级特征和模式,无需人为地设定参数和阈值,从而克服传统方法在处理复杂气象数据和实现准确台风涡旋初始化方面的局限性。
(4)本发明进一步采用了Unet模型作为深度学习模型,该模型具有对称的U形结构,包括一个收缩路径和一个扩展路径,以及跳跃连接,能够同时利用低层的位置信息和高层的语义信息,从而提高分割的精度和鲁棒性。Unet模型以其U形结构在复杂结构的图像和数据处理中表现出色,特别是在特征提取和模式识别方面。该模型能够有效地从气象数据中学习和提取关键的台风特征,如形状、大小、强度和移动模式。相较于现有的预测模型,Unet提供了更高的预测精度和更好的泛化能力。
(5)本发明通过将训练好的深度学习模型应用于实时气象数据,以构建台风涡旋结构并预测台风路径和强度。相比于现有技术,本发明的方法能够实现对台风涡旋的三维结构的构建,包括台风的形状、大小、强度和风场分布信息,从而更好地反映台风的动力特征和变化规律,为台风路径和强度的预测提供了更为精确的信息。本发明还能够根据台风涡旋结构和气象模型,计算台风在未来一定时间内的移动方向、速度和变化趋势,从而实现对台风路径和强度的预测,为台风预警和防灾减灾提供了有效的技术支持。
(6)本发明通过持续的数据收集和模型训练,以不断更新和改进深度学习模型的预测能力。相比于现有技术,本发明的方法能够实现对深度学习模型的持续学习和优化,通过实时获取最新的气象数据和台风数据,以及反馈深度学习模型的预测结果和实际观测结果之间的差异,从而根据数据的变化和反馈的误差调整深度学习模型的参数和结构,以适应不断变化的气象条件,并不断提升预测的准确性。
附图说明
图1所示为本发明的基于人工智能的台风涡旋初始化方法的实施流程示意图;
图2所示为本发明中再分析数据的生成过程示意图;
图3所示为本发明中数据规范化处理过程示意图;
图4所示为本发明中特征工程处理过程示意图;
图5所示为本发明中Unet深度学习模型训练过程示意图。
具体实施方式
为了更好的理解本发明,下面结合实施例进一步阐明本发明的内容。在附图中,自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。所描述的实施例是本发明一部分实施例,而不是全部的实施例。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。下面结合附图对本发明的结构、技术方案作进一步的具体描述,给出本发明的一个实施例。
实施例1
如图1所示,本发明的基于人工智能的台风涡旋初始化方法在实施时,主要包括如下步骤:
SS1. 多源气象数据收集
收集并分析多种气象数据来源的多种不同类型的气象数据以获取台风的历史和实时的行为信息,多种不同类型的气象数据至少包括再分析数据、台风分析数据、台风模式预报数据和台风最佳路径数据,其中,再分析数据是通过将历史气象观测数据与气象模型相结合所重构的过去气象条件数据集,台风分析数据为针对台风事件进行动力初始化和同化观测后形成的气象数据,台风模式预报数据为基于气象模型预测产生的台风未来行为气象数据,台风最佳路径数据为综合多种信息后所得出的台风实际移动路径数据;
SS2. 多源气象数据预处理
对步骤SS1所收集的多源气象数据进行至少包括数据插值、数据规范化和特征工程在内的预处理以转换为适合机器学习模型使用的数据集,其中,数据插值处理通过考虑待插值点与已知数据点之间的距离来估算待插值点的数值以填补数据空白或将数据转换为统一的分辨率,数据规范化处理至少包括单位转换、缩放到统一区间和标准化处理以将数据转换为一致的格式和尺度,特征工程至少包括基本气象特征提取、时间序列特征提取、高级特征构造、特征选择和数据降维以从原始数据中选择对台风预测任务最有用的特征;
SS3. 深度学习模型训练
使用深度学习模型对步骤SS2预处理后的数据集进行特征学习和模式识别以提取台风的关键特征和模式,并通过训练和验证过程优化深度学习模型的性能和准确性,其中,深度学习模型用于捕获上下文信息和精确定位台风特征并至少包括一收缩路径和一对称的扩展路径,收缩路径用于提取数据中的高级特征并包括多个卷积层和池化层,扩展路径用于恢复数据中的细节信息并包括多个卷积层和上采样层,卷积层和上采样层之间还设有跳跃连接,用于将收缩路径中的低级特征与扩展路径中的高级特征之间的数据连接,训练和验证过程利用分割的数据集进行模型训练和验证,以评估模型的准确性和泛化能力,确保其在实际应用中的有效性;
SS4. 台风涡旋初始化
将步骤SS3训练好的深度学习模型应用于实时气象数据以构建台风涡旋结构并预测台风路径和强度,台风涡旋结构为至少包括台风的形状、大小、强度和风场分布信息的三维结构,预测台风路径和强度是指根据台风涡旋结构和气象模型,计算台风在未来一定时间内的移动方向、速度和变化趋势;
SS5. 持续学习和优化模型
通过持续的数据收集和模型训练以不断更新和改进深度学习模型的预测能力,其中,数据收集包括实时获取最新的气象数据和台风数据以及反馈深度学习模型的预测结果和实际观测结果之间的差异,模型训练包括根据数据的变化和反馈的误差调整深度学习模型的参数和结构,以适应不断变化的气象条件和并不断提升预测的准确性。
本发明的上述实施例中,通过结合多源气象数据和深度学习技术,能够实现更为准确的台风涡旋初始化。该方法充分利用现代数据分析技术,显著提升台风路径和强度预测的准确性和效率,为台风预警和防灾减灾提供有效的技术支持。
实施例2
在上述实施例1的基础上,本实施例作为对其中步骤SS1的进一步补充。
本发明的基于人工智能的台风涡旋初始化方法,其步骤SS1中,再分析数据是通过将历史气象观测数据与气象模型相结合所重构的过去气象条件数据集,过去气象条件数据集用以反映台风发生和发展的历史气象环境、为台风的历史行为提供全面视角并为台风涡旋初始化提供背景信息,再分析数据的生成如图2所示:
SS11. 收集和整理历史气象观测数据,历史气象观测数据至少包括通过地面、船舶、探空和/或卫星气象观测方式得到的涵盖广泛时间和空间范围并包括多种气象要素和台风信息的气象数据,气象要素至少包括风速、气压、温度和/或湿度,台风信息至少包括台风的路径、强度和/或风场,对历史气象观测数据的整理包括对数据进行质量控制和格式转换以便后续的处理和分析。
在该子步骤中,对历史气象观测数据的整理包括对数据进行质量控制和格式转换,其中,对数据进行质量控制,包括检查数据是否存在缺失、异常、错误和/或不一致问题,并对问题数据进行修正或剔除;对数据进行格式转换,包括将数据转换为适合机器学习模型使用的统一的数据格式和尺度,并对数据进行单位转换、缩放到统一区间和/或标准化处理,以保证数据的一致性和完整性。
SS12. 选择合适的气象模型并根据气象模型的输入要求,对步骤SS11中的历史气象观测数据进行插值和规范化以保证数据的一致性和完整性,同时考虑数据的时空分辨率和覆盖范围以满足模型的精度和稳定性后输入到气象模型中以产生模型预测数据,气象模型是指基于物理方程和数值方法建立的用于模拟和预测气象现象的数学模型,包括全球气候模型、区域气候模型或数值天气预报模型;
SS13. 利用数据同化技术对步骤SS12中所输入的历史气象观测数据与气象模型所输出的模型预测数据进行融合和最优集成,以减少观测数据和模型预测数据之间的误差并提高数据的可信度和代表性,同时保留数据的动力和物理意义以便于反映台风的特征和行为,数据同化技术为变分法、卡尔曼滤波法或集合卡尔曼滤波法;
SS14. 输出步骤SS13中的结果以得到再分析数据,即重构的过去气象条件数据集,过去气象条件数据集提供了对过去气象条件的连续且一致的重构,继而作为台风涡旋初始化的重要输入,为深度学习模型训练提供必要的历史气象信息,增强模型对台风行为预测的准确性。
通过以上步骤,本发明能够充分利用历史气象数据,结合现代气象模型技术,为台风涡旋初始化提供全面而深入的历史背景和环境信息。这不仅有助于深入理解台风的历史行为模式,也为未来的台风预测和研究提供了坚实的数据基础。
本发明优选的实例中,上述步骤SS1中,台风分析数据为针对台风事件进行动力初始化和同化观测后形成的气象数据,台风分析数据至少包括:
台风的路径数据,即台风中心在不同时间点的经纬度坐标,用于描述台风的移动轨迹和速度以及与地理位置的关系,台风的路径数据从各国家级气象局和/或国际气象组织提供的台风最佳路径数据或者利用卫星图像和地面观测结果进行插值和平滑处理得到;
台风的强度数据,即台风中心在不同时间点的最低气压和最大风速,用于描述台风的强度等级和变化趋势以及与气象条件的关系,台风的强度数据从各国家级气象局和/或国际气象组织提供的台风最佳路径数据或者利用卫星图像和地面观测结果进行估测和校正得到;
台风的三维结构数据,即台风影响范围内不同半径和高度处的风速、风向、温度、湿度和/或气压信息,以再分析数据作为背景场,通过同化卫星和地面观测数据并在此基础上开展涡旋初始化以得到更加能够代表台风涡旋结构的三维数据,并且其中所述涡旋初始化采用气象模型从分析时刻的前一个时刻积分到分析时刻,然后将台风涡旋移植到前一时刻,重复上述步骤至涡旋强度与最佳路径强度接近。台风分析数据的关键作用在于提供了关于特定台风事件的详细和实时信息,这对于深入理解台风的动态特性和行为模式至关重要。通过分析这些数据,可以获得关于台风路径变化、强度波动、风速分布和降水模式等多方面的深入见解。这些信息不仅有助于揭示台风的形成和发展机制,而且为台风预测模型的训练提供了直接且具体的输入。在本发明中,台风分析数据被用作台风涡旋初始化的关键输入之一。通过将这些实时和详细的台风观测数据整合到深度学习模型中,可以显著提高模型对台风行为预测的准确性和可靠性。此外,台风分析数据的应用还有助于模型更好地适应不同的台风事件,增强其在多样化气象条件下的预测能力。
本发明优选的实例中,上述步骤SS1中,台风模式预报数据为基于气象模型预测产生的台风未来行为气象数据,台风模式预报数据包括:
台风路径预报数据,即根据气象模型对台风中心的移动方向和速度进行预测的数据,用于描述台风未来的移动轨迹和位置以及与地理位置的关系;台风路径预报数据从各国家级气象局和/或国际气象组织提供的台风模式预报数据或者利用自主研发的数值天气预报模型生成;
台风强度预报数据,即根据气象模型对台风中心的最低气压和最大风速进行预测的数据,用于描述台风未来的强度等级和变化趋势以及与气象条件的关系;台风强度预报数据从各国家级气象局和/或国际气象组织提供的台风模式预报数据或者利用自主研发的数值天气预报模型生成;
台风风场预报数据,即根据气象模型对台风中心附近不同半径和高度处的风速和风向进行预测的数据,用于描述台风未来的结构和动力特征以及与环境流场的关系;台风风场预报数据从各国家级气象局和/或国际气象组织提供的台风模式预报数据或者利用自主研发的数值天气预报模型生成;
台风降水预报数据,即根据气象模型对台风中心附近不同区域和高度处的降水量和降水类型进行预测的数据,用于描述台风未来的水汽输送和降水分布特征以及与热力条件的关系;
其中,台风路径预报数据、台风强度预报数据、台风风场预报数据及台风降水预报数据从各国家级气象局和/或国际气象组织提供的台风模式预报数据或者利用自主研发的数值天气预报模型生成。
台风模式预报数据的关键作用在于提供对未来台风行为的预测,为理解台风的潜在发展趋势提供了重要依据。通过分析这些预报数据,可以评估和比较不同气象模型的预测性能,特别是在预测台风路径和强度方面的准确度。这对于优化和校准人工智能模型至关重要,因为它可以揭示模型在特定气象条件下的表现,指导模型的改进和调整。在本发明中,台风模式预报数据不仅作为深度学习模型训练的重要输入,还用于模型预测结果的验证和优化。通过将这些基于先进数值模型的预报数据融入深度学习模型中,可以显著提升模型对台风未来行为预测的准确性,并帮助模型更好地适应和响应不断变化的气象条件,从而增强台风预测和涡旋初始化的整体性能和效率。
本发明优选的实例中,上述步骤SS1中,台风最佳路径数据为综合多种信息后所得出的台风实际移动路径数据,台风实际路径数据通过汇总和分析来自气象观测站、卫星观测以及其他相关技术手段所记录的信息得出,提供了关于台风实际移动轨迹的准确信息,包括其路径变化、移动速度以及与预测模型偏差的详细分析。
台风最佳路径数据对于评估气象预测的准确性和深度学习模型的效果至关重要。它不仅能够用于验证预测模型的准确性,还能够帮助识别模型可能存在的缺陷或不足,指导模型的进一步优化和调整。在台风预测的背景下,最佳路径数据是理解台风行为和改进预测模型的关键资源。在本发明中,台风最佳路径数据被用作深度学习模型训练和验证的重要参考。通过分析这些数据,模型可以更准确地学习台风的行为模式,提高对未来台风路径和强度预测的准确性。此外,这些数据还可以用来评估模型在实际应用中的性能,确保模型能够在实际气象条件下有效运作。
实施例3
在上述实施例1的基础上,本实施例作为对其中步骤SS2的进一步补充。
本发明的基于人工智能的台风涡旋初始化方法,其步骤SS2中,数据插值处理通过考虑待插值点与已知数据点之间的距离来估算待插值点的数值以填补数据空白或将数据转换为统一的分辨率,其中数据插值处理采用Cressman空间插值方法,该方法根据以下公式进行插值计算:
式中,V(P)表示待插值点P的数值,V(P i )表示已知数据点P i 的数值,W(d i )表示基于距离d i 的权重函数并且为距离d i 的递减函数,d i 表示待插值点P与已知数据点P i 之间的距离,n表示参与插值的数据点数量。
由于分析气象数据可能来自不同的模式,它们在空间和时间分辨率上可能存在差异。数据插值用于填补数据集中的缺失值,或将数据转换为统一的分辨率。数据插值是处理气象数据中的关键步骤,特别是当数据来自不同模型且具有不同的空间和时间分辨率时。本发明通过上述Cressman插值方法,可以有效地将不同来源和分辨率的气象数据统一到相同的空间框架中,为进一步的分析和模型训练提供连续完整的数据集。
本发明优选的实例中,上述步骤SS2中,数据插值处理还包括对数据进行空间和时间的加权平均以考虑数据的时空相关性和可信度并提高数据的连续性和代表性,并根据以下公式对数据进行空间和时间的数据插值和加权平均计算:
式中,V(P)表示待插值点P的数值,V(P i )表示已知数据点P i 的数值,W s (d i )表示基于距离d i 的空间权重函数,W t (d i )表示基于时间t i 的时间权重函数,d i 表示待插值点P与已知数据点P i 之间的空间距离,t i 表示待插值点P与已知数据点P i 之间的时间差,n表示参与插值的数据点数量。
进一步地,空间权重函数W s (d i )和时间权重函数W t (d i )采用如下高斯函数的形式进行表达:
式中,σ s 和σ t 分别表示空间和时间的标准差,用于分别控制空间和时间的权重衰减速度。
本发明中,通过高斯函数可以使距离或时间较近的数据点具有较大的权重,而距离或时间较远的数据点具有较小的权重,从而反映数据的时空相关性和可信度,并可以更加平滑地处理数据插值,尤其是在空间和时间上的变化较大的区域。空间高斯权重函数考虑了数据点之间的地理位置关系,而时间高斯权重函数则考虑了数据的时效性和相关性,通过这种方法,可以有效地利用多源气象数据的互补信息,为每个待插值点分配一个合理的权重,从而得到更平滑和准确的插值结果,为深度学习模型提供高质量的训练数据。
本发明优选的实例中,上述步骤SS2中,数据规范化处理至少包括单位转换、缩放到统一区间和标准化处理以将数据转换为一致的格式和尺度,并至少包括如下子步骤,如图3所示:
SS21. 对数据进行单位转换,将不同单位的气象数据转换为统一的标准单位,以消除单位差异对模型训练的影响;
SS22. 将数据缩放到统一区间,将所有气象数据类型按照一定的比例缩放到0到1或-1到1的统一区间范围内以消除不同测量范围差异对模型训练的影响,并使用如下公式所示的最小-最大规范化方法在进行数据缩放:
式中,X为原始数据,X norm 为规范化后的数据,X min 和X max 分别为同类型数据在数据集中的最小值和最大值;
SS23. 对数据进行标准化处理,将气象数据转换为均值为0、标准差为1的标准格式以消除数据分布差异对模型训练的影响,其标准化公式为:
式中,X为原始气象数据,μ为数据的均值,δ为数据的标准差,Z为标准化后的气象数据。
本发明通过上述规范化步骤,可以确保模型接收到的输入数据在不同特征之间具有可比性,从而提高机器学习模型在训练和预测过程中的性能和准确性。规范化处理对于处理大规模和复杂的气象数据集尤其重要。
本发明优选的实例中,上述步骤SS2中,特征工程包括基本气象特征提取、时间序列特征提取、高级特征构造、特征选择和数据降维以从原始数据中提取和选择对于台风预测任务最有用的特征,如图4所示:
SS2A. 对数据进行基本气象特征提取,基本气象特征为反映台风发展信息的指标并至少包括垂直风切变(VWS)、条件性海洋热含量(COHC)、200百帕散度(D200)、相对湿度(RHMD)、海平面气压变化(dMSLP)和/或台风移动速度(SPD);
SS2B. 对数据进行时间序列特征提取,从气象数据的时间序列中提取趋势分析和季节性模式,包括分析长期的温度和/或气压变化趋势以及识别数据中的季节性降水模式和/或风向变化,通过这些时间序列分析以捕捉与台风发展有关的长期和周期性变化;
SS2C. 对数据进行高级特征构造,基于历史同期数据比较构建高级特征以突出当前气象条件与历史模式的对比和异常特征,通过比较分析以提取当前数据的异常或显著特征;
SS2D. 对数据进行特征选择,至少包括相关性分析和特征重要性评估,通过分析各特征与台风强度和路径预测的相关性以筛选出与预测最相关的特征,通过评估各特征对预测模型的贡献度以筛选对预测最有帮助的特征;
SS2E. 根据特征数量的多少判断是否对数据进行数据降维,若特征数量大于预设阈值则对数据进行数据降维,通过数据降维处理以去除数据中的冗余和不相关特征并保留对预测最重要的特征,从而减少特征的数量和复杂度,并简化模型并降低计算负担。
特征工程是从原始数据中提取和选择对于预测任务最有用的特征的过程。这可能包括创建新的特征(如从时间序列数据中提取趋势和季节性模式)或选择最相关的特征子集。在台风预测的上下文中,有效的特征可能包括风速、气压变化、温度梯度等,这些都是台风强度和路径的重要指标。通过这些预处理步骤,能够确保数据集的质量和适用性,为后续的深度学习模型训练和分析打下坚实的基础。本发明通过上述特征工程各子步骤的实施,能够有效地从原始气象数据中提取和构建对台风预测最关键的特征集合,从而大大提升深度学习模型在台风涡旋初始化方面的性能和准确性。
进一步地,上述子步骤SS2A在对数据进行基本气象特征提取的过程中:
垂直风切变(VWS)是指在不同高度上风速的方向和速度变化,其计算公式为:
式中,u 850和v 850分别表示850百帕高度上的东西向和南北向风速,u 200和v 200分别表示200百帕高度上的东西向和南北向风速,并且其中较低的垂直风切变有利于台风的强度和发展;
条件性海洋热含量(COHC)是指海洋中储存的热量,高的海洋热含量有利于为台风提供更多能量并促进其加强,其计算公式为:
式中,c p 为海水的比热容,ρ为海水的密度,T为海水的温度,T 26为26°C的等温线深度,D 26为26°C的等温线深度与海底深度的最小值;
200百帕散度(D200)是指在大气中大约12千米高度并对应200百帕气压的水平风场散度情况,其计算公式为:
式中,u和v分别表示东西向和南北向风速,x和y分别表示经度和纬度,正散度即空气流动呈发散状态并与热带气旋的加强有关,因为其有助于热带气旋上层的空气流出并为气旋中心带来更多的上升气流和能量,负散度即空气流动呈聚集状态可能会抑制热带气旋的发展;
相对湿度(RHMD)是指实际温度T下的饱和水汽压与露点温度T d 下的饱和水汽压的比值,其计算公式为:
式中,e sat (Td)为露点温度下的饱和水汽压,e sat (T)为实际温度下的饱和水汽压,相对湿度(RHMD)的变化提供了大气中水汽含量的分布和变化,对准确预测降水潜力和台风强度变化具有重要影响;
所述海平面气压变化(dMSLP)是指海平面气压的变化率,其计算采用前后两个时次的海平面气压值(MSLP)之差来表示变化率以反映海平面气压在不同时间点的变化,其计算公式为:
式中,MSLP(t1)、MSLP(t2)分别为第一个时次t1、第二个时次t2的海平面气压值,海平面气压变化(dMSLP)是监测台风发展的关键指标之一,海平面气压的降低预示着台风的加强;
台风移动速度(SPD)是指台风中心在一定时间内的平均移动速度,关系到其路径预测以及可能影响的区域,台风移动速度的计算采用两个时间点间台风中心位置的变化距离除以时间间隔以获得准确的移动速度估算,其计算公式为:
式中,x 1,y 1和x 2,y 2分别代表在两个不同时间点的台风中心的地理坐标,Δt是这两个时间点之间的时间差。
实施例4
在上述实施例1的基础上,本实施例作为对其中步骤SS3的进一步补充。
本发明的基于人工智能的台风涡旋初始化方法,其步骤SS3中,深度学习模型为基于卷积神经网络(CNN)的Unet深度学习模型,Unet深度学习模型具有用于提取和融合气象数据中关键特征和模式的U形结构并包含一收缩路径和一对称的扩展路径,其中,收缩路径由多个卷积层和池化层组成,用于捕获上下文信息和进行下采样;扩展路径由多个卷积层和上采样层组成,用于恢复细节信息和进行上采样;收缩路径和扩展路径之间还设有跳跃连接,用于将低级特征和高级特征进行拼接以增强特征的表达能力。
本发明中所使用的Unet模型是一种基于卷积神经网络(CNN)的深度学习模型,可以从气象数据中提取台风的形状、大小、强度和风场分布等特征,并输出台风的三维结构。Unet模型的核心思想是利用U形结构,将收缩路径和扩展路径进行对称连接,实现多尺度特征的融合和分割。
收缩路径是由多个卷积层和池化层组成,用于捕获上下文信息和进行下采样。每次下采样之后,特征图的数量增加,但是分辨率减少,这有助于提取高层的语义特征,但是会损失一些细节和位置信息。收缩路径的最后一层是一个瓶颈层,它包含了最高层的特征,也是扩展路径的起点。
扩展路径是由多个卷积层和上采样层组成,用于恢复细节信息和进行上采样。每次上采样之后,特征图的数量减少,但是分辨率增加,这有助于恢复低层的细节特征,但是会缺乏一些语义信息。扩展路径的每一层都会与收缩路径的对应层进行跳跃连接,将低层的位置信息和高层的语义信息进行拼接,从而增强特征的表达能力。扩展路径的最后一层是一个输出层,它使用一个1×1的卷积,将特征图映射到目标类别的数量,得到最终的分割结果。
进一步地,Unet深度学习模型基于所输入的气象数据并通过其多层结构学习和提取台风的关键特征和模式,台风的关键特征和模式至少包括台风的形状、大小、强度和移动模式,其中,
对于台风的形状,Unet深度学习模型通过收缩路径和扩展路径的卷积操作以及与跳跃连接和上采样层的组合捕捉和重构台风的空间结构,至少包括识别和提取台风的眼壁、螺旋雨带特征及其在不同时间点的变化,从而识别出台风的轮廓和边界并得到台风的形状信息;
对于台风的大小,Unet深度学习模型通过收缩路径和扩展路径的卷积层的特征提取操作以及池化层和上采样层的下采样和上采样操作调整台风的分辨率,至少包括在多个尺度上对台风图像进行分析以测量其空间覆盖范围和边界、计算台风的几何属性及其在不同时间点的变化,从而得到台风的大小和面积信息;
对于台风的强度,Unet深度学习模型通过收缩路径和扩展路径的跳跃连接操作融合不同层次的特征,通过综合分析至少包括风速、气压、温度在内的多种气象参数以及至少包括海洋热含量和垂直风切变在内的动力学因素,得到台风中心及其周围区域的至少包括中心气压、最大风速、最大风半径在内的强度信息;
对于台风的移动模式,Unet深度学习模型通过收缩路径和扩展路径的卷积层的特征提取操作分析台风的移动趋势和方向,至少包括通过分析气象数据的时空特征和大气环流模式并结合压力场数据预测台风的潜在移动方向和速度,从而得到台风的移动模式信息。
进一步地,Unet深度学习模型训练的过程涉及调整网络的权重以最小化预测输出和实际结果之间的差异,模型训练过程如图5所示:
SS31. 初始化权重:在训练开始时,对Unet深度学习模型网络中的权重进行随机初始化以打破网络的对称性,权重表示网络各层之间的连接强度并决定了网络的初始状态和收敛速度;
SS32. 前向传播:给定一组输入的气象数据和对应的台风分割标签,网络通过其包括收缩路径和扩展路径在内的多层结构对输入数据进行特征提取和分割以得到网络的预测输出,在训练的每个步骤中,输入的气象数据通过网络进行前向传播,每一层中的数据与权重相乘并加上偏置后通过激活函数进行非线性转换,包括通过卷积层、池化层以及上采样层的传递,以生成对台风特征的预测输出;
SS33. 计算损失:根据网络的预测输出和实际结果并基于损失函数计算网络的损失函数值以反映网络的分割误差,损失函数使用均方误差、交叉熵损失或Dice系数进行定义;
SS34. 反向传播:根据损失函数值计算网络中每一层的梯度,即损失函数对每一层权重的偏导数以反映权重变化对损失函数的影响,并基于损失函数的梯度及反向传播算法计算每个权重对最终损失的贡献度,这个过程从输出层开始,逐层向后传播到输入层;
SS35. 权重更新:根据反向传播计算出的梯度并结合学习率,使用随机梯度下降或Adam优化算法更新调整网络中每一层的权重,使得权重沿着梯度的反方向变化,从而使得损失函数值减小,继而减小预测输出和实际结果之间的差异;
SS36. 迭代过程:重复前向传播、损失计算、反向传播和权重更新的过程,直至损失函数值收敛使得模型在训练数据上的性能达到可接受的水平或达到预设的迭代次数。
通过上述实施例,完全有效地实现了本发明的目的。该领域的技术人员可以理解本发明包括但不限于附图和以上具体实施方式中描述的内容。虽然本发明已就目前认为最为实用且优选的实施例进行说明,但应知道,本发明并不限于所公开的实施例,任何不偏离本发明的功能和结构原理的修改都将包括在权利要求书的范围中。
Claims (14)
1.一种基于人工智能的台风涡旋初始化方法,用于实现台风涡旋的初始化,其特征在于,该方法在实施时包括以下步骤:
SS1. 多源气象数据收集
收集并分析多种气象数据来源的多种不同类型的气象数据以获取台风的历史和实时的行为信息,所述多种不同类型的气象数据包括再分析数据、台风分析数据、台风模式预报数据和台风最佳路径数据,其中,所述再分析数据是通过将历史气象观测数据与气象模型相结合所重构的过去气象条件数据集,所述台风分析数据为针对台风事件进行动力初始化和同化观测后形成的气象数据,所述台风模式预报数据为基于气象模型预测产生的台风未来行为气象数据,所述台风最佳路径数据为综合多种信息后所得出的台风实际移动路径数据;
SS2. 多源气象数据预处理
对步骤SS1所收集的多源气象数据进行包括数据插值、数据规范化和特征工程的预处理以转换为适合机器学习模型使用的数据集,其中,所述数据插值处理通过考虑待插值点与已知数据点之间的距离来估算待插值点的数值以填补数据空白或将数据转换为统一的分辨率,所述数据规范化处理包括单位转换、缩放到统一区间和标准化处理以将数据转换为一致的格式和尺度,所述特征工程包括基本气象特征提取、时间序列特征提取、高级特征构造、特征选择和数据降维以从原始数据中提取和选择对于台风预测任务最有用的特征,并包括如下子步骤:
SS2A. 对数据进行基本气象特征提取,所述基本气象特征为反映台风发展信息的指标并包括垂直风切变VWS、条件性海洋热含量COHC、200百帕散度D200、相对湿度RHMD、海平面气压变化dMSLP和/或台风移动速度SPD,
SS2B. 对数据进行时间序列特征提取,从气象数据的时间序列中提取趋势分析和季节性模式,包括分析长期的温度和/或气压变化趋势以及识别数据中的季节性降水模式和/或风向变化,通过这些时间序列分析以捕捉与台风发展有关的长期和周期性变化,
SS2C. 对数据进行高级特征构造,基于历史同期数据比较构建高级特征以突出当前气象条件与历史模式的对比和异常特征,通过比较分析以提取当前数据的异常或显著特征,
SS2D. 对数据进行特征选择,包括相关性分析和特征重要性评估,通过分析各特征与台风强度和路径预测的相关性以筛选出与预测最相关的特征,通过评估各特征对预测模型的贡献度以筛选对预测最有帮助的特征,
SS2E. 根据特征数量的多少判断是否对数据进行数据降维,若特征数量大于预设阈值则对数据进行数据降维,通过数据降维处理以去除数据中的冗余和不相关特征并保留对预测最重要的特征,从而减少特征的数量和复杂度,并简化模型并降低计算负担;
SS3. 深度学习模型训练
使用深度学习模型对步骤SS2预处理后的数据集进行特征学习和模式识别以提取台风的关键特征和模式,并通过训练和验证过程优化深度学习模型的性能和准确性,其中,所述深度学习模型用于捕获上下文信息和精确定位台风特征并包括一收缩路径和一对称的扩展路径,所述收缩路径用于提取数据中的高级特征并包括多个卷积层和池化层,所述扩展路径用于恢复数据中的细节信息并包括多个卷积层和上采样层,所述卷积层和上采样层之间还设有跳跃连接,用于将所述收缩路径中的低级特征与所述扩展路径中的高级特征之间的数据连接,所述训练和验证过程利用分割的数据集进行模型训练和验证,以评估模型的准确性和泛化能力,确保其在实际应用中的有效性;
SS4. 台风涡旋初始化
将步骤SS3训练好的深度学习模型应用于实时气象数据以构建台风涡旋结构并预测台风路径和强度,其中,所述台风涡旋结构为包括台风的形状、大小、强度和风场分布信息的三维结构,所述预测台风路径和强度是指根据所述台风涡旋结构和气象模型,计算台风在未来一定时间内的移动方向、速度和变化趋势;
SS5. 持续学习和优化模型
通过持续的数据收集和模型训练以不断更新和改进所述深度学习模型的预测能力,其中,所述数据收集包括实时获取最新的气象数据和台风数据以及反馈所述深度学习模型的预测结果和实际观测结果之间的差异,所述模型训练包括根据数据的变化和反馈的误差调整所述深度学习模型的参数和结构。
2.根据权利要求1所述的基于人工智能的台风涡旋初始化方法,其特征在于,上述步骤SS1中,所述再分析数据是通过将历史气象观测数据与气象模型相结合所重构的过去气象条件数据集,所述过去气象条件数据集用以反映台风发生和发展的历史气象环境、为台风的历史行为提供全面视角并为台风动力初始化提供背景信息,所述再分析数据的生成包括如下子步骤:
SS11. 收集和整理历史气象观测数据,所述历史气象观测数据包括通过地面、船舶、探空和/或卫星气象观测方式得到的涵盖广泛时间和空间范围并包括多种气象要素和台风信息的气象数据,所述气象要素包括风速、气压、温度和/或湿度,所述台风信息包括台风的路径、强度和/或风场,对历史气象观测数据的整理包括对数据进行质量控制和格式转换以便于后续的处理和分析;
SS12. 选择气象模型并根据气象模型的输入要求,对步骤SS11中的历史气象观测数据进行插值和规范化以保证数据的一致性和完整性,同时考虑数据的时空分辨率和覆盖范围以满足模型的精度和稳定性后输入到气象模型中以产生模型预测数据,所述气象模型是指基于物理方程和数值方法建立的用于模拟和预测气象现象的数学模型,包括全球气候模型、区域气候模型或数值天气预报模型;
SS13. 利用数据同化技术对步骤SS12中所输入的历史气象观测数据与气象模型所输出的模型预测数据进行融合和最优集成,以减少观测数据和模型预测数据之间的误差并提高数据的可信度和代表性,同时保留数据的动力和物理意义以便于反映台风的特征和行为,所述数据同化技术为变分法、卡尔曼滤波法或集合卡尔曼滤波法;
SS14. 输出步骤SS13中的结果以得到再分析数据,即重构的过去气象条件数据集,所述过去气象条件数据集提供了对过去气象条件的连续且一致的重构,继而作为台风动力初始化的重要输入,为深度学习模型训练提供历史气象信息,增强模型对台风行为预测的准确性。
3.根据权利要求2所述的基于人工智能的台风涡旋初始化方法,其特征在于,上述子步骤SS11中,对历史气象观测数据的整理包括对数据进行质量控制和格式转换,其中,对数据进行质量控制,包括检查数据是否存在缺失、异常、错误和/或不一致问题,并对问题数据进行修正或剔除;对数据进行格式转换,包括将数据转换为适合机器学习模型使用的统一的数据格式和尺度,并对数据进行单位转换、缩放到统一区间和/或标准化处理,以保证数据的一致性和完整性。
4.根据权利要求1所述的基于人工智能的台风涡旋初始化方法,其特征在于,上述步骤SS1中,所述台风分析数据为针对台风事件进行动力初始化和同化观测后形成的气象数据,所述台风分析数据包括:
台风的路径数据,即台风中心在不同时间点的经纬度坐标,用于描述台风的移动轨迹和速度以及与地理位置的关系,所述台风的路径数据从各国家级气象局和/或国际气象组织提供的台风最佳路径数据或者利用卫星图像和地面观测结果进行插值和平滑处理得到;
台风的强度数据,即台风中心在不同时间点的最低气压和最大风速,用于描述台风的强度等级和变化趋势以及与气象条件的关系,所述台风的强度数据从各国家级气象局和/或国际气象组织提供的台风最佳路径数据或者利用卫星图像和地面观测结果进行估测和校正得到;
台风的三维结构数据,即台风影响范围内不同半径和高度处的风速、风向、温度、湿度和/或气压信息,以再分析数据作为背景场,通过同化卫星和地面观测数据并在此基础上开展涡旋初始化以得到更加能够代表台风涡旋结构的三维数据,并且其中所述涡旋初始化采用气象模型从分析时刻的前一个时刻积分到分析时刻,然后将台风涡旋移植到前一时刻,重复上述步骤至涡旋强度与最佳路径强度接近。
5.根据权利要求1所述的基于人工智能的台风涡旋初始化方法,其特征在于,上述步骤SS1中,所述台风模式预报数据为基于气象模型预测产生的台风未来行为气象数据,包括:
台风路径预报数据,即根据气象模型对台风中心的移动方向和速度进行预测的数据,用于描述台风未来的移动轨迹和位置以及与地理位置的关系;所述台风路径预报数据从各国家级气象局和/或国际气象组织提供的台风模式预报数据或者利用自主研发的数值天气预报模型生成;
台风强度预报数据,即根据气象模型对台风中心的最低气压和最大风速进行预测的数据,用于描述台风未来的强度等级和变化趋势以及与气象条件的关系;所述台风强度预报数据从各国家级气象局和/或国际气象组织提供的台风模式预报数据或者利用自主研发的数值天气预报模型生成;
台风风场预报数据,即根据气象模型对台风中心附近不同半径和高度处的风速和风向进行预测的数据,用于描述台风未来的结构和动力特征以及与环境流场的关系;所述台风风场预报数据从各国家级气象局和/或国际气象组织提供的台风模式预报数据或者利用自主研发的数值天气预报模型生成;
台风降水预报数据,即根据气象模型对台风中心附近不同区域和高度处的降水量和降水类型进行预测的数据,用于描述台风未来的水汽输送和降水分布特征以及与热力条件的关系;
其中,所述台风路径预报数据、台风强度预报数据、台风风场预报数据及台风降水预报数据从各国家级气象局和/或国际气象组织提供的台风模式预报数据或者利用自主研发的数值天气预报模型生成。
6.根据权利要求1所述的基于人工智能的台风涡旋初始化方法,其特征在于,上述步骤SS1中,所述台风最佳路径数据为综合多种信息后所得出的台风实际移动路径数据,所述台风实际路径数据通过汇总和分析来自气象观测站、卫星观测以及其他相关技术手段所记录的信息得出,提供了关于台风实际移动轨迹的准确信息,包括其路径变化、移动速度以及与预测模型偏差的详细分析。
7.根据权利要求1所述的基于人工智能的台风涡旋初始化方法,其特征在于,上述步骤SS2中,所述数据插值处理通过考虑待插值点与已知数据点之间的距离来估算待插值点的数值以填补数据空白或将数据转换为统一的分辨率,其中所述数据插值处理采用Cressman空间插值方法,该方法根据以下公式进行插值计算:
式中,V(P)表示待插值点P的数值,V(P i )表示已知数据点P i 的数值,W(d i )表示基于距离d i 的权重函数并且为距离d i 的递减函数,d i 表示待插值点P与已知数据点P i 之间的距离,n表示参与插值的数据点数量。
8.根据权利要求1所述的基于人工智能的台风涡旋初始化方法,其特征在于,上述步骤SS2中,所述数据插值处理还包括对数据进行空间和时间的加权平均以考虑数据的时空相关性和可信度并提高数据的连续性和代表性,并根据以下公式对数据进行空间和时间的数据插值和加权平均计算:
式中,V(P)表示待插值点P的数值,V(P i )表示已知数据点P i 的数值,W s (d i )表示基于距离d i 的空间权重函数,W t (d i )表示基于时间t i 的时间权重函数,d i 表示待插值点P与已知数据点P i 之间的空间距离,t i 表示待插值点P与已知数据点P i 之间的时间差,n表示参与插值的数据点数量。
9.根据权利要求8所述的基于人工智能的台风涡旋初始化方法,其特征在于,所述空间权重函数W s (d i )和时间权重函数W t (d i )采用如下高斯函数的形式进行表达:
式中,σ s 和σ t 分别表示空间和时间的标准差,用于分别控制空间和时间的权重衰减速度。
10.根据权利要求1所述的基于人工智能的台风涡旋初始化方法,其特征在于,上述步骤SS2中,所述数据规范化处理包括单位转换、缩放到统一区间和标准化处理以将数据转换为一致的格式和尺度,并包括如下子步骤:
SS21. 对数据进行单位转换,将不同单位的气象数据转换为统一的标准单位,以消除单位差异对模型训练的影响;
SS22. 将数据缩放到统一区间,将所有气象数据类型按照一定的比例缩放到0到1或-1到1的统一区间范围内以消除不同测量范围差异对模型训练的影响,并使用如下公式所示的最小-最大规范化方法在进行数据缩放:
式中,X为原始数据,X norm 为规范化后的数据,X min 和X max 分别为同类型数据在数据集中的最小值和最大值;
SS23. 对数据进行标准化处理,将气象数据转换为均值为0、标准差为1的标准格式以消除数据分布差异对模型训练的影响,其标准化公式为:
式中,X为原始气象数据,μ为数据的均值,δ为数据的标准差,Z为标准化后的气象数据。
11.根据权利要求1所述的基于人工智能的台风涡旋初始化方法,其特征在于,上述子步骤SS2A在对数据进行基本气象特征提取的过程中:
所述垂直风切变VWS是指在不同高度上风速的方向和速度变化,其计算公式为:
式中,u 850和v 850分别表示850百帕高度上的东西向和南北向风速,u 200和v 200分别表示200百帕高度上的东西向和南北向风速,并且其中较低的垂直风切变有利于台风的强度和发展;
所述条件性海洋热含量COHC是指海洋中储存的热量,高的海洋热含量有利于为台风提供更多能量并促进其加强,其计算公式为:
式中,c p 为海水的比热容,ρ为海水的密度,T为海水的温度,T 26为26°C的等温线深度,D 26为26°C的等温线深度与海底深度的最小值;
所述200百帕散度D200是指在大气中12千米高度并对应200百帕气压的水平风场散度情况,其计算公式为:
式中,u和v分别表示东西向和南北向风速,x和y分别表示经度和纬度,正散度即空气流动呈发散状态并与热带气旋的加强有关,因为其有助于热带气旋上层的空气流出并为气旋中心带来更多的上升气流和能量,负散度即空气流动呈聚集状态会抑制热带气旋的发展;
所述相对湿度RHMD是指实际温度T下的饱和水汽压与露点温度T d 下的饱和水汽压的比值,其计算公式为:
式中,e sat (Td)为露点温度下的饱和水汽压,e sat (T)为实际温度下的饱和水汽压,所述相对湿度RHMD的变化提供了大气中水汽含量的分布和变化,对准确预测降水潜力和台风强度变化具有重要影响;
所述海平面气压变化dMSLP是指海平面气压的变化率,其计算采用前后两个时次的海平面气压值MSLP之差来表示变化率以反映海平面气压在不同时间点的变化,其计算公式为:
式中,MSLP(t1)、MSLP(t2)分别为第一个时次t1、第二个时次t2的海平面气压值,海平面气压变化dMSLP是监测台风发展的关键指标之一,海平面气压的降低预示着台风的加强;
所述台风移动速度SPD是指台风中心在一定时间内的平均移动速度,关系到其路径预测以及可能影响的区域,台风移动速度的计算采用两个时间点间台风中心位置的变化距离除以时间间隔以获得准确的移动速度估算,其计算公式为:
式中,x 1,y 1和x 2,y 2分别代表在两个不同时间点的台风中心的地理坐标,Δt是这两个时间点之间的时间差。
12.根据权利要求1所述的基于人工智能的台风涡旋初始化方法,其特征在于,上述步骤SS3中,所述深度学习模型为基于卷积神经网络CNN的Unet深度学习模型,所述Unet深度学习模型具有用于提取和融合气象数据中关键特征和模式的U形结构并包含一收缩路径和一对称的扩展路径,其中,所述收缩路径由多个卷积层和池化层组成,用于捕获上下文信息和进行下采样;所述扩展路径由多个卷积层和上采样层组成,用于恢复细节信息和进行上采样;所述收缩路径和扩展路径之间还设有跳跃连接,用于将低级特征和高级特征进行拼接以增强特征的表达能力。
13.根据权利要求12所述的基于人工智能的台风涡旋初始化方法,其特征在于,所述Unet深度学习模型基于所输入的气象数据并通过其多层结构学习和提取台风的关键特征和模式,所述台风的关键特征和模式包括台风的形状、大小、强度和移动模式,其中,
对于台风的形状,所述Unet深度学习模型通过收缩路径和扩展路径的卷积操作以及与跳跃连接和上采样层的组合捕捉和重构台风的空间结构,包括识别和提取台风的眼壁、螺旋雨带特征及其在不同时间点的变化,从而识别出台风的轮廓和边界并得到台风的形状信息;
对于台风的大小,所述Unet深度学习模型通过收缩路径和扩展路径的卷积层的特征提取操作以及池化层和上采样层的下采样和上采样操作调整台风的分辨率,包括在多个尺度上对台风图像进行分析以测量其空间覆盖范围和边界、计算台风的几何属性及其在不同时间点的变化,从而得到台风的大小和面积信息;
对于台风的强度,所述Unet深度学习模型通过收缩路径和扩展路径的跳跃连接操作融合不同层次的特征,通过综合分析包括风速、气压、温度的多种气象参数以及包括海洋热含量和垂直风切变的动力学因素,得到台风中心及其周围区域的包括中心气压、最大风速、最大风半径的强度信息;
对于台风的移动模式,所述Unet深度学习模型通过收缩路径和扩展路径的卷积层的特征提取操作分析台风的移动趋势和方向,包括通过分析气象数据的时空特征和大气环流模式并结合压力场数据预测台风的潜在移动方向和速度,从而得到台风的移动模式信息。
14.根据权利要求12所述的基于人工智能的台风涡旋初始化方法,其特征在于,所述Unet深度学习模型训练的过程涉及调整网络的权重以最小化预测输出和实际结果之间的差异,模型训练过程包括如下子步骤:
SS31. 初始化权重:在训练开始时,对Unet深度学习模型网络中的权重进行随机初始化以打破网络的对称性,所述权重表示网络各层之间的连接强度并决定了网络的初始状态和收敛速度;
SS32. 前向传播:给定一组输入的气象数据和对应的台风分割标签,网络通过其包括收缩路径和扩展路径在内的多层结构对输入数据进行特征提取和分割以得到网络的预测输出,在训练的每个步骤中,输入的气象数据通过网络进行前向传播,每一层中的数据与权重相乘并加上偏置后通过激活函数进行非线性转换,包括通过卷积层、池化层以及上采样层的传递,以生成对台风特征的预测输出;
SS33. 计算损失:根据网络的预测输出和实际结果并基于损失函数计算网络的损失函数值以反映网络的分割误差,所述损失函数使用均方误差、交叉熵损失或Dice系数进行定义;
SS34. 反向传播:根据损失函数值计算网络中每一层的梯度,即损失函数对每一层权重的偏导数以反映权重变化对损失函数的影响,并基于损失函数的梯度及反向传播算法计算每个权重对最终损失的贡献度,这个过程从输出层开始,逐层向后传播到输入层;
SS35. 权重更新:根据反向传播计算出的梯度并结合学习率,使用随机梯度下降或Adam优化算法更新调整网络中每一层的权重,使得权重沿着梯度的反方向变化,从而使得损失函数值减小,继而减小预测输出和实际结果之间的差异;
SS36. 迭代过程:重复前向传播、损失计算、反向传播和权重更新的过程,直至损失函数值收敛使得模型在训练数据上的性能达到可接受的水平或达到预设的迭代次数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410038922.5A CN117556197B (zh) | 2024-01-11 | 2024-01-11 | 一种基于人工智能的台风涡旋初始化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410038922.5A CN117556197B (zh) | 2024-01-11 | 2024-01-11 | 一种基于人工智能的台风涡旋初始化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117556197A CN117556197A (zh) | 2024-02-13 |
CN117556197B true CN117556197B (zh) | 2024-03-22 |
Family
ID=89813186
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410038922.5A Active CN117556197B (zh) | 2024-01-11 | 2024-01-11 | 一种基于人工智能的台风涡旋初始化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117556197B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117809203B (zh) * | 2024-02-28 | 2024-05-14 | 南京信息工程大学 | 一种多任务持续学习的跨海域热带气旋强度估计方法 |
CN117893176B (zh) * | 2024-03-13 | 2024-05-24 | 浙江省气象台 | 台风预报业务多岗位决策协同方法及*** |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116860824A (zh) * | 2023-05-30 | 2023-10-10 | 南京信息工程大学 | 一种气象数据知识发现方法及*** |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114547017B (zh) * | 2022-04-27 | 2022-08-05 | 南京信息工程大学 | 一种基于深度学习的气象大数据融合方法 |
-
2024
- 2024-01-11 CN CN202410038922.5A patent/CN117556197B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116860824A (zh) * | 2023-05-30 | 2023-10-10 | 南京信息工程大学 | 一种气象数据知识发现方法及*** |
Non-Patent Citations (1)
Title |
---|
综述预测台风路径的传统模型与神经网络;王旭洋;;科学咨询(科技・管理);20200101(第01期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117556197A (zh) | 2024-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111815037B (zh) | 一种基于注意力机制的可解释性短临极端降雨预测方法 | |
CN117556197B (zh) | 一种基于人工智能的台风涡旋初始化方法 | |
Feng et al. | Modeling urban growth with GIS based cellular automata and least squares SVM rules: a case study in Qingpu–Songjiang area of Shanghai, China | |
Olsson et al. | Neural networks for rainfall forecasting by atmospheric downscaling | |
US9262723B2 (en) | Predicting climate data using climate attractors derived from a global climate model | |
CN109738970A (zh) | 基于雷电数据挖掘实现雷电预警的方法、装置和存储介质 | |
CN108761574A (zh) | 基于多源信息融合的降雨量估算方法 | |
Ayet et al. | Nowcasting solar irradiance using an analog method and geostationary satellite images | |
CN111665575B (zh) | 一种基于统计动力的中长期降雨分级耦合预报方法及*** | |
CN112966722A (zh) | 基于半监督随机森林模型的区域滑坡易发性预测方法 | |
CN115933008A (zh) | 一种强对流天气预报预警方法 | |
CN113496310A (zh) | 基于深度学习模型的大气污染物预测方法和*** | |
CN116777079A (zh) | 一种基于贝叶斯层间结构模型的沙漠化侵扰灾害预测方法 | |
CN117526274A (zh) | 极端气候下新能源功率预测方法、电子设备和存储介质 | |
CN117332909B (zh) | 基于智能体的多尺度城市内涝道路交通暴露性预测方法 | |
CN114385611A (zh) | 一种基于人工智能算法和知识图谱的降水预测方法和*** | |
CN114882373A (zh) | 基于深度神经网络的多特征融合沙尘暴预测方法 | |
El Rafei et al. | Analysis of extreme wind gusts using a high-resolution Australian regional reanalysis | |
CN112200355B (zh) | 一种滑坡的预测方法、装置、设备和存储介质 | |
CN117540303A (zh) | 基于交叉半监督机器学习算法的滑坡易发性评估方法及*** | |
CN117494034A (zh) | 基于交通拥堵指数和多源数据融合的空气质量预测方法 | |
Tan et al. | Projected changes of typhoon intensity in a regional climate model: Development of a machine learning bias correction scheme | |
KR102411074B1 (ko) | 인공지능과 위성영상을 이용한 냉수대 탐지 및 예측을 위한 장치 및 방법 | |
Mihai et al. | Analyzing meteorological data using unsupervised learning techniques | |
Misra et al. | Statistical downscaling of high-resolution precipitation in India using convolutional long short-term memory networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |