CN117875504A - 溃坝预测及其模型训练方法、装置、电子设备及存储介质 - Google Patents

溃坝预测及其模型训练方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN117875504A
CN117875504A CN202410056883.1A CN202410056883A CN117875504A CN 117875504 A CN117875504 A CN 117875504A CN 202410056883 A CN202410056883 A CN 202410056883A CN 117875504 A CN117875504 A CN 117875504A
Authority
CN
China
Prior art keywords
dam
training
dam break
break prediction
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410056883.1A
Other languages
English (en)
Inventor
陈新海
刘杰
颜君峻
龚春叶
杨博
王庆林
张庆阳
李胜国
甘新标
陈旭光
肖调杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN202410056883.1A priority Critical patent/CN117875504A/zh
Publication of CN117875504A publication Critical patent/CN117875504A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2155Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0499Feedforward networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/0895Weakly supervised learning, e.g. semi-supervised or self-supervised learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2123/00Data types
    • G06F2123/02Data types in the time domain, e.g. time-series data
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A10/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
    • Y02A10/40Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Strategic Management (AREA)
  • Biomedical Technology (AREA)
  • Economics (AREA)
  • Biophysics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Primary Health Care (AREA)
  • Educational Administration (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种溃坝预测及其模型训练方法、装置、电子设备及可读存储介质,应用于人工智能技术领域。其中,方法包括将坝岸数据训练样本集对应的时空域离散为二维网格并生成训练数据点集。以时空坐标作为输入、预测物理场作为输出、且包含多个隐藏层的全连接神经网络模型构建溃坝预测模型;以描述溃坝现象的物理信息模型为置信度从坝岸数据采样点中选择满足条件的采样点作为伪标签训练数据点。基于训练数据点集和伪标签训练数据点确定溃坝预测模型的溃坝预测损失函数,并对溃坝预测模型进行训练。本申请能够解决相关技术溃坝预测精度和效率均无法满足用户现实需求的问题,能够有效提高溃坝预测的精准度和效率。

Description

溃坝预测及其模型训练方法、装置、电子设备及存储介质
技术领域
本申请涉及人工智能技术领域,特别是涉及一种溃坝预测及其模型训练方法、装置、电子设备及可读存储介质。
背景技术
溃坝,即坝体溃决,为一种灾害性的水流现象,为了降低坝体溃决的危害,相关技术通常利用PINNs(Physics-informed Neural Networks,物理信息神经网络)对描述溃坝问题的数学模型进行分析,通过同时学习训练数据样本的分布规律以及数学模型描述的物理定律来实现对溃坝的预测。
但是,利用PINN预测的溃坝结果准确率不高,且由于PINN的训练过程容易不收敛,导致溃坝预测效率不高。
鉴于此,提高溃坝预测的精准度和效率,是所属领域技术人员需要解决的技术问题。
发明内容
本申请提供了一种溃坝预测及其模型训练方法、装置、电子设备及可读存储介质,能够有效提高溃坝预测的精准度和效率。
为解决上述技术问题,本申请提供以下技术方案:
本申请一方面提供了一种溃坝预测模型训练方法,包括:
将坝岸数据训练样本集对应的时空域离散为二维网格,并通过分析所述二维网格生成训练数据点集;所述训练数据点集包括坝岸数据采样点、水流速边界点及初始水深点;
基于以时空坐标作为输入、预测物理场作为输出、且包含多个隐藏层的全连接神经网络模型,构建用于预测溃坝现象发生后自由水面高度的溃坝预测模型;所述预测物理场包括水流速度和自由水面高度;
基于将描述坝溃坝现象的物理信息模型作为置信度,从所述坝岸数据采样点中选择满足预设置信度条件的目标采样点作为伪标签训练数据点;
分别基于所述坝岸数据采样点、所述水流速边界点、所述初始水深点和所述伪标签训练数据点,确定所述溃坝预测模型的溃坝预测损失函数;
利用所述训练数据点和所述伪标签训练数据点,通过所述溃坝预测损失函数对所述溃坝预测模型进行训练,直至满足预设模型终止条件。
示例性的,所述将坝岸数据训练样本集对应的时空域离散为二维网格,并通过分析所述二维网格生成训练数据点集,包括:
将坝岸数据训练样本集的位置信息所在的空间域离散为第一位置向量和第二位置向量,将坝岸数据训练样本集的时间信息所在的时间域离散为时间向量;
将所述第一位置向量、所述第二位置向量和所述时间向量进行组合,并调用网格创建函数生成第一位置网格、第二位置网格和时间网格,并将所述第一位置网格、所述第二位置网格和所述时间网格拉伸至目标长度的一维向量;
将所述第一位置网格、所述第二位置网格和所述时间网格分别对应存储至预先构建的坝岸数据采样点存储结构、水流速边界点存储结构及初始水深点存储结构中。
示例性的,所述基于将描述坝溃坝现象的物理信息模型作为置信度,从所述坝岸数据采样点中选择满足预设置信度条件的目标采样点作为伪标签训练数据点,包括:
在对所述溃坝预测模型的每一轮次的训练过程中,将当前批次获取的当前坝岸数据采样点输入至当前训练轮次下溃坝预测模型,得到当前预测物理场;
基于所述当前预测物理场,计算所述物理信息模型的残差值;
从各轮次得到的残差值中选择满足预设置信度条件的目标残差值;
将各目标残差值对应批次的坝岸数据采样点作为伪标签训练数据点。
示例性的,利用所述训练数据点和所述伪标签训练数据点,通过所述溃坝预测损失函数对所述溃坝预测模型进行训练,包括:
调用梯度清空函数将优化器保存的梯度清零;
调用自动求导函数对所述溃坝预测损失函数进行反向传播,并调用自动微分方法将按照链式法则隐式的计算梯度;
调用模型参数更新函数,利用计算得到的新梯度更新所述溃坝预测模型的权重参数。
示例性的,所述分别基于所述坝岸数据采样点、所述水流速边界点、所述初始水深点和所述伪标签训练数据点,确定所述溃坝预测模型的溃坝预测损失函数,包括:
根据所述溃坝预测模型对所述坝岸数据采样点、所述水流速边界点、所述初始水深点和所述伪标签训练数据点的预测数据,所述物理信息模型,水流边界条件和初始水深条件,得到物理控制损失项、边界损失项、初始损失项和伪标签损失项;
根据所述物理控制损失项、所述边界损失项、所述初始损失项、所述伪标签损失项及其各自的权重因子,确定所述溃坝预测损失函数。
示例性的,所述根据所述溃坝预测模型对所述坝岸数据采样点、所述水流速边界点、所述初始水深点和所述伪标签训练数据点的预测数据,所述物理信息模型,水流边界条件和初始水深条件,得到物理控制损失项、边界损失项、初始损失项和伪标签损失项,包括:
将当前批次获取的当前训练数据点和当前伪标签训练数据点,输入至当前训练轮次下溃坝预测模型,得到采样预测物理场;
基于所述采样预测物理场,确定所述物理信息模型的采样残差值,并确定所述采样预测物理场的物理均方误差;
根据所述采样残差值和所述物理均方误差,确定物理控制损失项;
从所述训练数据点选择多个水流速边界采样点,将各水流速边界采样点输入至当前训练轮次下的溃坝预测模型,得到水流速预测信息;
基于所述水流速预测信息,确定水流边界条件对应的边界残差值,并确定所述预测水流信息的边界均方误差;
根据所述边界残差值和所述边界均方误差,确定边界损失项;
从所述训练数据点选择多个初始水深采样点,将各初始水深采样点输入至当前训练轮次下的溃坝预测模型,得到水深预测信息;
基于所述水深预测信息,确定初始水深条件对应的初始残差值,并确定所述水深预测信息的初始均方误差;
根据所述初始残差值和所述初始均方误差,确定初始损失项;
从所述伪标签训练数据点选择多个伪标签采样点,并将各伪标签采样点输入至当前训练轮次下的溃坝预测模型,得到伪标签预测信息;
根据所述伪标签预测信息的均方误差确定伪标签损失项。
本申请一方面提供了一种溃坝预测方法,包括:
预先利用如前任意一项所述溃坝预测模型训练方法训练得到溃坝预测模型;
获取用于描述待测坝的溃坝现象的待测物理信息模型和当前坝岸数据;
基于所述待测物理信息模型和所述当前坝岸数据,调用所述溃坝预测模型预测得到所述待测坝的目标水流速度和目标自由水面高度;
根据所述目标水流速度和所述目标自由水面高度,生成所述待测坝的溃坝预测信息。
本申请另一方面提供了一种溃坝预测模型训练装置,包括:
训练数据生成模块,用于将坝岸数据训练样本集对应的时空域离散为二维网格,并通过分析所述二维网格生成训练数据点集;所述训练数据点集包括坝岸数据采样点、水流速边界点及初始水深点;
模型搭建模块,用于基于以时空坐标作为输入、预测物理场作为输出、且包含多个隐藏层的全连接神经网络模型,构建用于预测溃坝现象发生后自由水面高度的溃坝预测模型;所述预测物理场包括水流速度和自由水面高度;
伪标签生成模块,用于基于将描述待测坝的溃坝现象的物理信息模型作为置信度,从所述坝岸数据采样点中选择满足预设置信度条件的目标采样点作为伪标签训练数据点;
损失函数确定模块,用于分别基于所述坝岸数据采样点、所述水流速边界点、所述初始水深点和所述伪标签训练数据点,确定所述溃坝预测模型的溃坝预测损失函数;
模型训练模块,用于利用所述训练数据点和所述伪标签训练数据点,通过所述溃坝预测损失函数对所述溃坝预测模型进行训练,直至满足预设模型终止条件。
本申请还提供了一种电子设备,包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如前任一项所述溃坝预测模型训练方法和/或溃坝预测方法的步骤。
本申请最后还提供了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前任一项所述溃坝预测模型训练方法和/或溃坝预测方法的步骤。
本申请提供的技术方案的优点在于,将自训练机制引入到了用于预测溃坝现象发生后自由水面高度的溃坝预测模型的训练之中,提高了无监督训练数据点中的物理信息的利用率。训练过程中,由描述溃坝现象的物理信息模型作为置信度从采样点中选择伪标签训练数据点,将其与训练过程形成正反馈,能够提高溃坝预测模型的收敛速度和训练效率,进一步的,伪标签训练数据点在迭代过程中逐步产生并不断更新,可以缓和自训练物理信息网络训练过程中的震荡现象,使训练过程更加平稳,能够有效提高溃坝预测模型的预测精度和训练效率,从而提高溃坝预测模型对溃坝现象发生后自由水面高度的预测精度和效率,进而能够高效且高精度地得到溃坝现象发生后自由水面高度随时间的变化情况。
此外,本申请还针对溃坝预测模型训练方法提供了溃坝预测方法、相应的实现装置、电子设备及可读存储介质,进一步使得所述方法更具有实用性,所述溃坝预测方法、装置、电子设备及可读存储介质具有相应的优点。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。
附图说明
为了更清楚的说明本申请或相关技术的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请提供的一个示例性应用场景的二维径向溃坝现象示意图;
图2为本申请提供的一个示例性应用场景的发生溃坝后的0.5s时刻的二维径向溃坝现象示意图;
图3为本申请提供的一个示例性应用场景的发生溃坝后的1s时刻的二维径向溃坝现象示意图;
图4为本申请提供的一个示例性应用场景的物理信息神经网络示意图;
图5为本申请提供的一种溃坝预测模型训练方法的流程示意图;
图6为本申请提供的另一种溃坝预测模型训练方法的流程示意图;
图7为本申请提供的一种溃坝预测方法的流程示意图;
图8为本申请提供的溃坝预测模型训练装置的一种具体实施方式结构图;
图9为本申请提供的电子设备的一种具体实施方式结构图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面结合附图和具体实施方式对本申请作进一步的详细说明。其中,说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等是用于区别不同的对象,而不是用于描述特定的顺序。此外术语“包括”和“具有”以及二者的任何变形,意图在于覆盖不排他的包含。术语“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
溃坝问题为流体力学计算过程中的一项工作,描述该物理现象的物理信息模型通常采用偏微分方程数学模型,偏微分方程(也即PDEs)为包含未知函数的偏导数(或偏微分)的方程,在物理和工程领域中有着广泛的引用,通常采用下述关系式(1)-(3)定义PDEs的基本形式:
N[u(x,t);λ]=f(x,t),x∈Ω,t∈(0,T] (1)
其中,λ是未知的方程参数,u(x,t)为方程潜在的解。f(x,t)为方程的源项,g(x,t)和h(x)分别为边界条件和初值条件。N[·]和B[·]是非线性偏微分算子,本领域技术人员可基于采用任何一种相关技术所记载的偏微分方程,这均不影响本申请的实现。相关技术通常通过采用浅水方程(Shallow Water Equation)作为描述坝溃坝现象的物理信息模型,其为经典的偏微分方程,以二维浅水方程为例,相关技术通常采用下述关系式(4)-(6)来表示浅水方程:
其中,u、v分别表示水平和垂直方向的速度;h表示水深,为该问题的主要待求解目标;Gr=9.8是重力加速度。该方程由二维不可压缩纳维-斯托克斯方程(Navier-StokesEquations,N-S Equations)推导而来,被广泛应用于自由表面流动问题的模拟。本申请针对的是一个二维径向溃坝场景,描述了方形域中心初始化水位的圆形凸起坝的演化过程。h的初始条件如下式(7)所示:
其中,r为圆形突起坝的半径,图1展示了该溃坝现象随时间变化的情况,t=0时刻方形域中心有高于水面的圆形凸起坝;溃坝现象发生后,自由水面高度的变化由对应的浅水控制,图2和图3还展示了后续的演化过程大致为t=0.5s和t=1s时刻对应图像。
可以理解的,浅水方程数学性质差,数值方法求解困难。基于物理信息的神经网络也即PINNs通常用于解决有监督学习任务的神经网络,同时尊重由一般非线性偏微分方程描述的任何给定的物理规律。其不仅能够像传统神经网络一样学习到训练数据样本的分布规律,而且能够学习到数学方程描述的物理定律。相关技术通常利用物理信息神经网络计算物理信息模型如上述的浅水方程,也即将物理方程作为限制加入到神经网络之中使得拟合得到的结果更加满足物理规律,其体系结构如图4所示。PINNs的主体结构为以时空坐标(空间坐标x,y;时间坐标t)为输入,物理场(速度场u,v;水面高度h)为输出的全连接神经网络。其将物理控制方程、边界条件和初值条件等物理信息作为约束项放入神经网络的损失函数中,从而将方程求解问题转化为优化问题。在训练过程中,优化器利用梯度下降和反向传播算法优化模型朝着满足物理信息的方向前进,从而计算物理信息模型。对于PINNs,其按照读取数据的时空坐标位置可将数据点分为边界点、初值点和域内采样点(简称采样点)。不同类型的数据点对应不同的损失函数,如式(8)-(11)所示。其中,将采样点带入控制方程,其残差项即为方程损失,如式(8)所示;将边界点带入边界条件,其残差项即为边界损失,如式(9)所示;将初值点带入初始条件,其残差项即为初始损失,如式(10)所示;最后将上述损失加权求和即可得到神经网络的总损失函数,如式(11)所示,其训练方法和所涉及的框架可参阅任何相关技术所记载的内容,此处便不再赘述:
L=Wf*Lf+Wb*Lb+W0*L0 (11)
但是,使用PINNs存在准确率不高,训练过程容易不收敛的问题。为了该技术问题,本申请将自训练方法和物理信息神经网络进行结合,训练得到作为一种自训练物理信息神经网络的溃坝预测模型。物理信息神经网络的训练过程中包含大量的无监督数据和少量有监督数据,是经典的半监督学习场景。“自训练”机制为机器学习领域中常见的半监督学习方法,其核心思想是赋予模型预测置信度大的样本以“伪标签”。所谓“伪标签”,就是将模型的预测值作为标签,这些数据将以监督数据的方式进行训练。因此,“自训练”机制可以看作是一种将无监督数据转化为有监督数据的方法,该方法可以提高数据的利用率和训练效率,能够有效提升溃坝预测模型准确度。理想情况下,随着模型训练次数的增加,模型准确率不断上升,模型生成的“伪标签”数据的数量和质量逐步提升,高质高量的“伪标签”将进一步提高模型的准确率,从而起到正反馈效果。本发明利用“自训练”机制,给溃坝预测模型预测结果置信度较高的无监督数据点赋予伪标签,逐步将无监督数据转化为有监督数据,从而充分利用无监督数据点中的物理信息,加速溃坝预测模型的收敛并提高物理信息模型的准确率。
在介绍了本申请的技术方案后,下面详细的说明本申请的各种非限制性实施方式。为了更好的说明本申请,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有这些具体细节,本申请同样可以实施。在另外一些实例中,对于所属领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本申请的主旨。
首先参见图5,图5为本申请提供的一种溃坝预测方法的流程示意图,本申请可包括以下内容:
S501:将坝岸数据训练样本集对应的时空域离散为二维网格,并通过分析二维网格生成训练数据点集。
在本实施例中,坝岸数据训练样本集为用于训练溃坝预测模型的训练样本集,其可通过获取历史坝岸数据并经过预处理操作来构建,坝岸数据训练样本集包含大量坝岸数据作为训练样本,坝岸数据包括但并不限制于历史坝岸图像数据、历史拉力数据、历史水位数据、坝体的材料、尺寸、形状、坝体的倾斜角度。坝岸数据训练样本集为在时空坐标也即空间坐标和时间坐标下所获取到的数据,本步骤将将时空域下的坝岸数据训练样本集的各坝岸数据训练样本进行离散处理,并对二维网格所存储的数据进行分析,得到坝岸数据采样点、水流速边界点及初始水深点,将坝岸数据采样点、水流速边界点及初始水深点作为后续训练溃坝预测模型的训练数据点
S502:基于以时空坐标作为输入、预测物理场作为输出、且包含多个隐藏层的全连接神经网络模型,构建用于预测溃坝现象发生后自由水面高度的溃坝预测模型。
在本实施例中,溃坝预测模型可用于预测溃坝现象发生后自由水面高度,从而可以得到溃坝现象发生后自由水面高度随时间变化的情况,有利于提前对坝进行维护,并做好相关防洪措施。预测物理场包括水流速度和自由水面高度;隐藏层的具体层数可根据实际应用场景灵活选择,本申请对此不作任何限定。示例性的,在实际应用过程中,溃坝预测模型的搭建过程可包括:
步骤1、初始化数组Network,该Network可用于存放序列化模型。
步骤2、在Network中添加一层全连接层,神经元个数例如可为3,表示空间横纵坐标和时间坐标;
步骤3、初始化j=1,其中j表示当前构建神经网络的隐藏层数;
步骤4、向Network中添加一层全连接层,神经元个数为100;
步骤5、向Network中添加一层权重归一化(也即weight_norm)层;
步骤6、向Network中添加一个激活函数层,激活函数例如可为tanh,当然可以采用其他类型的激活函数,本申请对此不作任何限定。
步骤7、令j=j+1;
步骤8、判断j是否小于6,若是,则返回步骤3,若否,则执行步骤;
步骤9、添加一个全连接层作为输出层,神经元个数例如可为3,表示输出的速度场和/>以及自由水面高度/>
通过上述步骤1-步骤9,可完成整个溃坝预测模型的搭建,并存放在数组Network中。
S503:基于将描述坝溃坝现象的物理信息模型作为置信度,从坝岸数据采样点中选择满足预设置信度条件的目标采样点作为伪标签训练数据点。
在本实施例中,预设置信度条件为基于置信度预先设置的条件,例如超过预设置信度阈值的坝岸数据采样点为满足预设置信度条件的目标采样点,例如按照置信度值从大到小进行排序,前n个置信度值坝岸数据采样点作为目标采样点。伪标签训练数据点为训练过程中置信度较高的网络预测值,其本质上为采样点的子集。本步骤在溃坝预测模型的每一轮次训练过程中均会产生伪标签训练数据点,将该伪标签训练数据点和S501的训练数据点集共同作为溃坝预测模型的训练样本数据。伪标签数据作为一项独立于采样点、边界点和初值点的数据点,有单独的损失函数,描述下述式(12)所示。同时,本步骤根据物理信息模型筛选伪标签训练数据点,示例性的,可将坝岸数据采样点和预测值带入物理信息模型后求得其残差,将残差值小的数据赋予伪标签。一般情况下,方程残差小的点更有可能为方程的解,因此本步骤兼具理论基础和实践价值:
S504:分别基于坝岸数据采样点、水流速边界点、初始水深点和伪标签训练数据点,确定溃坝预测模型的溃坝预测损失函数。
基于S501和S503可知,溃坝预测模型按照读取数据的时空坐标位置将训练样本的数据点分为坝岸数据采样点、水流速边界点及初始水深点。不同类型的数据点对应不同的损失函数,将坝岸数据采样点带入物理信息模型,其残差项即为坝岸数据采样点对应的损失;将水流速边界点带入水流速边界条件,其残差项即为水流速边界点对应损失;将初始水深点带入初始水深条件,其残差项为初始水深点初始损失;最后将上述损失加权求和即可得到溃坝预测模型的总损失函数。
S505:利用训练数据点和伪标签训练数据点,通过溃坝预测损失函数对溃坝预测模型进行训练,直至满足预设模型终止条件。
在本实施例中,溃坝预测模型的训练过程包括训练物理信息神经网络和产生伪标签这两个步骤,如图6所示。图6位于上方的线条表示的是物理信息网络的训练过程:将坝岸数据采样点、水流速边界点及初始水深点送入神经网络前向传播计算预测值;将不同类型数据点的预测值带入相应的损失函数;最后通过反向传播和梯度下降更新网络的参数。图6位于下方的线条表示的是产生伪标签和更新S501的训练数据点集的过程:将所有的采样点放入神经网络前向传播计算预测值;将预测值带入物理信息模型得到方程残差;对方程残差进行排序并筛选出残差值较小的采样点;这些采样点的置信度较高,因此赋予其伪标签;在后续训练过程中,伪标签数据点以有监督的形式进行训练。
在模型训练过程中,可利用深度学习框架的自动微分技术和链式法则对S504的损失函数进行求导运算,使用梯度下降和反向传播算法优化神经网络模型,完成对物理信息模型的求解过程。至此完成了一轮完整的训练过程,其中,S501和S502只需要在对溃坝预测模型训练前执行一次,通过重复执行S503-S505直至满足预设模型终止条件,预设模型终止条件可为预设迭代次数,也即执行S503-S505的次数,还可为溃坝预测模型的精度大于预设精度阈值,这均不影响本申请的实现,当达到预设模型终止条件即可完成溃坝预测模型对S503的物理信息模型的求解,进而得到溃坝现象发生后自由水面高度随时间的变化情况。
在本申请提供的技术方案中,将自训练机制引入到了用于预测溃坝现象发生后自由水面高度的溃坝预测模型的训练之中,提高了无监督训练数据点中的物理信息的利用率。训练过程中,由描述溃坝现象的物理信息模型作为置信度从采样点中选择伪标签训练数据点,将其与训练过程形成正反馈,能够提高溃坝预测模型的收敛速度和训练效率,进一步的,伪标签训练数据点在迭代过程中逐步产生并不断更新,可以缓和自训练物理信息网络训练过程中的震荡现象,使训练过程更加平稳,能够有效提高溃坝预测模型的预测精度和训练效率,进而提高溃坝预测模型对溃坝现象发生后自由水面高度的预测精度和效率,进而高效且高精度地能够得到溃坝现象发生后自由水面高度随时间的变化情况。
在上述实施例中,对于如何执行步骤S501并不做限定,本实施例中给出训练数据点集的一种示例性的生成方式,可包括下述内容:
将坝岸数据训练样本集的位置信息所在的空间域离散为第一位置向量和第二位置向量,将坝岸数据训练样本集的时间信息所在的时间域离散为时间向量;将第一位置向量、第二位置向量和时间向量进行组合,并调用任何一种相关技术所记载的网格创建函数来生成第一位置网格、第二位置网格和时间网格,并将第一位置网格、第二位置网格和时间网格拉伸至目标长度的一维向量;将第一位置网格、第二位置网格和时间网格分别对应存储至预先构建的坝岸数据采样点存储结构、水流速边界点存储结构及初始水深点存储结构中。
其中,可采用X表示第一位置向量,Y表示第二位置向量,T表示时间向量,坝岸数据训练样本集对应的空间域的边界为x1、x2、y1和y2,对应时间域的边界为t1和t2,目标长度可为Nx×Ny×Nt,网格创建函数可采用numpy.meshgrid()函数,第一位置网格、第二位置网格和时间网格分别可用X_mesh,Y_mesh,T_mesh来表示,坝岸数据采样点存储结构、水流速边界点存储结构及初始水深点存储结构可分别使用D、H和K表示,本实施例的一种示例性的实施过程可包括:
步骤1、将连续的时空求解域Ω∈[x1,x2]×[y1,y2]×[t1,t2]离散为Nx×Ny×Nt,其中空间域[x1,x2]和[y1,y2]可离散为(Nx,1)的向量X和(Ny,1)的向量Y,时间域[t1,t2]可离散为(Nt,1)的向量T;
步骤2、将向量X、向量Y和向量T组合后调用numpy.meshgrid()函数生成二维网格X_mesh,Y_mesh,T_mesh;
步骤3、将X_mesh、Y_mesh和T_mesh拉伸为长度为Nx×Ny×Nt的一维向量;
步骤4、初始化数组D,H,K,P;其中D用于存放坝岸数据采样点对应的数据,H用于存放水流速边界点的数据,K用于存放初始水深点的数据,P用于存放伪标签训练数据点;
步骤5、初始化i=0,i表示X_mesh、Y_mesh和T_mesh的下标;
步骤6、判断X_mesh[i]是否等于x1或X_mesh[i]是否等于x2或Y_mesh[i]是否等于y1或Y_mesh[i]是否等于y2,若是,则将(X_mesh[i],Y_mesh[i],T_mesh[i])放入数组H并跳转至步骤,否则继续执行步骤7;
步骤7、判断T_mesh[i]是否等于t0,若是,则将(X_mesh[i],Y_mesh[i],T_mesh[i])放入数组K并跳转至步骤9,否则继续执行步骤8;
步骤8、将(X_mesh[i],Y_mesh[i],T_mesh[i])放入数组D;
步骤9、令i=i+1;
步骤10、判断i是否小于Nx×Ny×Nt,若是,则返回至步骤6;否则,该部分结束。
通过上述步骤1至步骤9,本实施例用于训练溃坝预测模型的数据点便可全部生成,整个过程简单又高效。
在上述实施例中,对于如何执行步骤S503并不做限定,本实施例中给出伪标签训练数据点的一种示例性的生成方式,可包括下述内容:
在对溃坝预测模型的每一轮次的训练过程中,将当前批次获取的当前坝岸数据采样点输入至当前训练轮次下溃坝预测模型,得到当前预测物理场;基于当前预测物理场,计算物理信息模型的残差值;从各轮次得到的残差值中选择满足预设置信度条件的目标残差值;将各目标残差值对应批次的坝岸数据采样点作为伪标签训练数据点。
其中,预设置信度条件可为按照置信度值从大到小进行排序,前2000个置信度值坝岸数据采样点作为目标采样点。本实施例的一种示例性的实施过程可包括:
步骤1、初始化k=0,k为当前处理采样点的批次;
步骤2、初始化存放物理信息模型残差的数组Q;
步骤3、从坝岸数据采样点存储结构D中取出D[1000*k]~D[1000*(k+1)]的坝岸数据采样点Dk
步骤4、将第k批采样点Dk放入溃坝预测模型得到预测值
步骤5、将第k批预测值带入物理信息模型计算残差Rk;
步骤6、将第k批采样点的方程残差Rk放入数组Q中的对应位置上;
步骤7、令k=k+1;
步骤8、若i小于10,则跳转至执行步骤3,否则,直接执行步骤9;
步骤9、对数组Q中的数据点按残差值大小从小到大进行排序;
步骤10、筛选出数组Q中前2000的数据赋予伪标签,作为本次产生的伪标签数据Pk
步骤11、初始化a=0,其中a表示Pk的下标位置;
步骤12、如果Pk[a]在P中,则更新Pk[a]的值,否则直接将Pk[a]存放入P;
步骤13、令a=a+1;
步骤14、若a小于2000,则返回至步骤12,否则该过程结束。
通过上述步骤14结束后,本轮生成的伪标签训练数据产生完毕,并存放至数组P中。
由上可知,本实施例引入了超参数来控制每回合产生“伪标签点”的数量,从而进一步提高溃坝预测模型生成“伪标签点”的精度,提升溃坝预测模型的精度。
在上述实施例中,对于如何执行步骤S505并不做限定,本实施例中给出利用训练数据点和伪标签训练数据点通过溃坝预测损失函数对溃坝预测模型的一种示例性的训练方式,可包括下述内容:
调用梯度清空函数将优化器保存的梯度清零;调用自动求导函数对溃坝预测损失函数进行反向传播,并调用自动微分方法将按照链式法则隐式的计算梯度;调用模型参数更新函数,利用计算得到的新梯度更新溃坝预测模型的权重参数。
其中,本实施例可采用optimizer.zero_grad()函数作为梯度清空函数,采用Loss.backward()函数作为自动求导函数,采用optimizer.step()函数作为模型参数更新函数,当然,本领域技术人员也可以采用其他类型的函数,这均不影响本申请的实现。基于上述类型函数,本实施例的一种示例性的实施过程可包括:
步骤1、调用optimizer.zero_grad()函数将优化器保存的梯度清零;
步骤2、调用Loss.backward()函数对损失函数进行反向传播,深度学习框架中的自动微分框架将按照链式法则隐式的计算梯度;
步骤3、调用optimizer.step()函数,将求解好的新梯度用于更新神经网络的权重参数。
在上述实施例中,对于如何执行步骤S504并不做限定,本实施例中给出溃坝预测损失函数的一种示例性的生成方式,可包括下述内容:
根据溃坝预测模型对坝岸数据采样点、水流速边界点、初始水深点和伪标签训练数据点的预测数据,物理信息模型,水流边界条件和初始水深条件,得到物理控制损失项、边界损失项、初始损失项和伪标签损失项;根据物理控制损失项、边界损失项、初始损失项、伪标签损失项及其各自的权重因子,确定溃坝预测损失函数。
其中,物理控制损失项、边界损失项、初始损失项和伪标签损失项的权重因子可根据实际需求灵活选择,当然,各权重因子默认可设置为相同,此时溃坝预测损失函数便是物理控制损失项、边界损失项、初始损失项和伪标签损失项的和。物理控制损失项、边界损失项、初始损失项和伪标签损失项的确定过程可包括:
将当前批次获取的当前训练数据点和当前伪标签训练数据点,输入至当前训练轮次下溃坝预测模型,得到采样预测物理场;基于采样预测物理场,确定物理信息模型的采样残差值,并确定采样预测物理场的物理均方误差;根据采样残差值和物理均方误差,确定物理控制损失项;
从训练数据点选择多个水流速边界采样点,将各水流速边界采样点输入至当前训练轮次下的溃坝预测模型,得到水流速预测信息;基于水流速预测信息,确定水流边界条件对应的边界残差值,并确定预测水流信息的边界均方误差;根据边界残差值和边界均方误差,确定边界损失项;
从训练数据点选择多个初始水深采样点,将各初始水深采样点输入至当前训练轮次下的溃坝预测模型,得到水深预测信息;基于水深预测信息,确定初始水深条件对应的初始残差值,并确定水深预测信息的初始均方误差;根据初始残差值和初始均方误差,确定初始损失项;
从伪标签训练数据点选择多个伪标签采样点,并将各伪标签采样点输入至当前训练轮次下的溃坝预测模型,得到伪标签预测信息;根据伪标签预测信息的均方误差确定伪标签损失项。
为了使所属领域技术人员更加清楚溃坝预测损失函数的确定过程,本实施例还提供了溃坝预测损失函数的一种示例性的生成过程:
步骤1、从用于存放坝岸数据采样点的数组D中随机选取1000个坝岸数据采样点;
步骤2、将1000个采样点送入溃坝预测模型中,得到对应的输出
步骤3、初始化物理控制损失项LossE=0,用来存放物理控制损失项;
步骤4、初始化b=0,其中b表示的下标位置:
步骤5、将带入物理信息模型,得到方程残差;
步骤6、计算的均方误差,/>
步骤7、令
步骤8、令b=b+1;
步骤9、若b小于1000,则返回步骤5,否则,直接执行步骤10;
步骤10、从用于存放水流速边界点的数组H中随机选取100个水流速边界点;
步骤11、将100个水流速边界点送入溃坝预测模型中,得到对应的输出
步骤12、初始化边界损失项LossB=0,用来存放边界损失项;
步骤13、初始化c=0,其中c表示U,V的下标位置;
步骤14、将带入边界条件,得到边界残差;
步骤15、计算的均方误差/>
步骤16、令
步骤17、令c=c+1;
步骤18、若c小于100,则返回步骤14,否则,直接执行步骤19;
步骤19、从用于存放初始水深点的数组K中随机选取100个初始水深点;
步骤20、将N个初始水深点送入溃坝预测模型中,得到对应的输出
步骤21、初始化初始损失项LossI=0,用来存放初始损失项;
步骤22、初始化d=0,其中d表示的下标位置;
步骤23、将带入初值条件,得到初值残差;
步骤24、计算的均方误差/>
步骤25、令
步骤26、令d=d+1;
步骤27、若d小于100,则返回步骤23,否则,直接执行步骤28;
步骤28、若用于存储伪标签训练数据点的数组P不为空,则继续执行步骤29,否则,跳转至步骤37;
步骤29、从数组P中随机选取1000个伪标签点;
步骤30、将N个伪标签点送入溃坝预测模型中,得到对应的输出
步骤31、初始化伪标签损失项LossP=0,用来存放伪标签损失项;
步骤32、初始化e=0,其中e表示的下标位置;
步骤33、计算的均方误差/>其中He为伪标签;
步骤34、令
步骤35、令e=e+1;
步骤36、若e小于1000,则返回步骤33,否则,继续执行步骤37;
步骤37、令Loss=LossE+LossB+LossI+LossP
最后,本申请还提供了一种溃坝预测方法,如图7所示,本申请例如可应用于日常生活中预测任何一个大坝在发生溃坝现象后的水面自由高度随着时间的变化情况,可包括下述内容:
S701:预先训练溃坝预测模型。
可预先利用如上任意一个实施例所记载的溃坝预测模型训练方法来训练得到溃坝预测模型。
S702:获取用于描述待测坝的溃坝现象的待测物理信息模型和当前坝岸数据。
S703:基于待测物理信息模型和当前坝岸数据,调用溃坝预测模型预测得到待测坝的目标水流速度和目标自由水面高度。
S704:根据目标水流速度和目标自由水面高度,生成待测坝的溃坝预测信息。
其中,溃坝预测信息包括待测坝发生溃坝现象后的水面自由高度随着时间的变化情况,进一步的,还可给出相应的防止措施和警示信息,并将相应的警示信息发送至相应的客户端。
需要说明的是,本申请中各步骤之间没有严格的先后执行顺序,只要符合逻辑上的顺序,则这些步骤可以同时执行,也可按照某种预设顺序执行,图5和图7只是一种示意方式,并不代表只能是这样的执行顺序。
本申请还针对溃坝预测模型训练方法及溃坝预测方法提供了相应的装置,进一步使得方法更具有实用性。其中,装置可从功能模块的角度和硬件的角度分别说明。下面对本申请提供的溃坝预测模型训练装置和溃坝预测装置进行介绍,该装置用以实现本申请提供的相应的溃坝预测模型训练方法和溃坝预测方法,在本实施例中,溃坝预测模型训练装置和溃坝预测装置可以包括或被分割成一个或多个程序模块,该一个或多个程序模块被存储在存储介质中,并由一个或多个处理器所执行,已完成实施例一公开的溃坝预测方法及溃坝预测模型训练方法。本申请所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序本身更适合于描述溃坝预测模型训练装置和溃坝预测装置在存储介质中的执行过程。以下描述将具体介绍本实施例各程序模块的功能,下文描述的溃坝预测模型训练装置与上文描述的溃坝预测模型训练方法、溃坝预测装置与上文描述的溃坝预测方法可相互对应参照。
基于功能模块的角度,请参见图8,图8为本申请提供的溃坝预测装置在一种具体实施方式下的结构图,该装置可包括:
训练数据生成模块801,用于将坝岸数据训练样本集对应的时空域离散为二维网格,并通过分析二维网格生成训练数据点集;训练数据点集包括坝岸数据采样点、水流速边界点及初始水深点;
模型搭建模块802,用于基于以时空坐标作为输入、预测物理场作为输出、且包含多个隐藏层的全连接神经网络模型,构建用于预测溃坝现象发生后自由水面高度的溃坝预测模型;预测物理场包括水流速度和自由水面高度;
伪标签生成模块803,用于基于将描述待测坝的溃坝现象的物理信息模型作为置信度,从坝岸数据采样点中选择满足预设置信度条件的目标采样点作为伪标签训练数据点;
损失函数确定模块804,用于分别基于坝岸数据采样点、水流速边界点、初始水深点和伪标签训练数据点,确定溃坝预测模型的溃坝预测损失函数;
模型训练模块805,用于利用训练数据点和伪标签训练数据点,通过溃坝预测损失函数对溃坝预测模型进行训练,直至满足预设模型终止条件。
可选的,在本实施例的一些实施方式中,上述训练数据生成模块801还可用于:
将坝岸数据训练样本集的位置信息所在的空间域离散为第一位置向量和第二位置向量,将坝岸数据训练样本集的时间信息所在的时间域离散为时间向量;
将第一位置向量、第二位置向量和时间向量进行组合,并调用网格创建函数生成第一位置网格、第二位置网格和时间网格,并将第一位置网格、第二位置网格和时间网格拉伸至目标长度的一维向量;
将第一位置网格、第二位置网格和时间网格分别对应存储至预先构建的坝岸数据采样点存储结构、水流速边界点存储结构及初始水深点存储结构中。
可选的,在本实施例的另一些实施方式中,上述伪标签生成模块803还可用于:
在对溃坝预测模型的每一轮次的训练过程中,将当前批次获取的当前坝岸数据采样点输入至当前训练轮次下溃坝预测模型,得到当前预测物理场;
基于当前预测物理场,计算物理信息模型的残差值;
从各轮次得到的残差值中选择满足预设置信度条件的目标残差值;
将各目标残差值对应批次的坝岸数据采样点作为伪标签训练数据点。
示例性的,在本实施例的一些实施方式中,上述模型训练模块805还可用于:
调用梯度清空函数将优化器保存的梯度清零;
调用自动求导函数对溃坝预测损失函数进行反向传播,并调用自动微分方法将按照链式法则隐式的计算梯度;
调用模型参数更新函数,利用计算得到的新梯度更新溃坝预测模型的权重参数。
示例性的,在本实施例的另一些实施方式中,上述损失函数确定模块804还可用于:
根据溃坝预测模型对坝岸数据采样点、水流速边界点、初始水深点和伪标签训练数据点的预测数据,物理信息模型,水流边界条件和初始水深条件,得到物理控制损失项、边界损失项、初始损失项和伪标签损失项;
根据物理控制损失项、边界损失项、初始损失项、伪标签损失项及其各自的权重因子,确定溃坝预测损失函数。
作为上述实施例的一种示例性的实施方式,上述损失函数确定模块804还可进一步用于:
将当前批次获取的当前训练数据点和当前伪标签训练数据点,输入至当前训练轮次下溃坝预测模型,得到采样预测物理场;
基于采样预测物理场,确定物理信息模型的采样残差值,并确定采样预测物理场的物理均方误差;
根据采样残差值和物理均方误差,确定物理控制损失项;
从训练数据点选择多个水流速边界采样点,将各水流速边界采样点输入至当前训练轮次下的溃坝预测模型,得到水流速预测信息;
基于水流速预测信息,确定水流边界条件对应的边界残差值,并确定预测水流信息的边界均方误差;
根据边界残差值和边界均方误差,确定边界损失项;
从训练数据点选择多个初始水深采样点,将各初始水深采样点输入至当前训练轮次下的溃坝预测模型,得到水深预测信息;
基于水深预测信息,确定初始水深条件对应的初始残差值,并确定水深预测信息的初始均方误差;
根据初始残差值和初始均方误差,确定初始损失项;
从伪标签训练数据点选择多个伪标签采样点,并将各伪标签采样点输入至当前训练轮次下的溃坝预测模型,得到伪标签预测信息;
根据伪标签预测信息的均方误差确定伪标签损失项。
本申请所述溃坝预测装置和溃坝预测模型训练装置的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
由上可知,本实施例能够有效提高溃坝预测模型的预测精度和训练效率,从而提高溃坝预测模型对溃坝现象发生后自由水面高度的预测精度和效率,进而能够高效且高精度地得到溃坝现象发生后自由水面高度随时间的变化情况。
上文中提到的溃坝预测模型训练装置和溃坝预测装置是从功能模块的角度描述,进一步的,本申请还提供一种电子设备,是从硬件角度描述。图9为本申请实施例提供的电子设备在一种实施方式下的结构示意图。如图9所示,该电子设备包括存储器90,用于存储计算机程序;处理器91,用于执行计算机程序时实现如上述任一实施例提到的溃坝预测方法和/或溃坝预测模型训练方法的步骤。
其中,处理器91可以包括一个或多个处理核心,比如4核心处理器、8核心处理器,处理器91还可为控制器、微控制器、微处理器或其他数据处理芯片等。处理器91可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable GateArray,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器91也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central Processing Unit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器91可以集成有GPU(Graphics Processing Unit,图形处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器91还可以包括AI(ArtificialIntelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器90可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器90还可包括高速随机存取存储器以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。存储器90在一些实施例中可以是电子设备的内部存储单元,例如服务器的硬盘。存储器90在另一些实施例中也可以是电子设备的外部存储设备,例如服务器上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器90还可以既包括电子设备的内部存储单元也包括外部存储设备。存储器90不仅可以用于存储安装于电子设备的应用软件及各类数据,例如:执行溃坝预测模型训练方法和/或溃坝预测方法过程中的程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。本实施例中,存储器90至少用于存储以下计算机程序901,其中,该计算机程序被处理器91加载并执行之后,能够实现前述任一实施例公开的溃坝预测模型训练方法和/或溃坝预测方法的相关步骤。另外,存储器90所存储的资源还可以包括操作***902和数据903等,存储方式可以是短暂存储或者永久存储。其中,操作***902可以包括Windows、Unix、Linux等。数据903可以包括但不限于溃坝预测模型训练结果和/或溃坝预测结果对应的数据等。
在一些实施例中,上述电子设备还可包括有显示屏92、输入输出接口93、通信接口94或者称为网络接口、电源95以及通信总线96。其中,显示屏92、输入输出接口93比如键盘(Keyboard)属于用户接口,可选的用户接口还可以包括标准的有线接口、无线接口等。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。通信接口94可选的可以包括有线接口和/或无线接口,如WI-FI接口、蓝牙接口等,通常用于在电子设备与其他电子设备之间建立通信连接。通信总线96可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extendedindustry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图9中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
本领域技术人员可以理解,图9中示出的结构并不构成对该电子设备的限定,可以包括比图示更多或更少的组件,例如还可包括实现各类功能的传感器97。
本申请所述电子设备的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
由上可知,本实施例能够有效提高溃坝预测模型的预测精度和训练效率,从而提高溃坝预测模型对溃坝现象发生后自由水面高度的预测精度和效率,进而能够高效且高精度地得到溃坝现象发生后自由水面高度随时间的变化情况。
可以理解的是,如果上述实施例中的溃坝预测模型训练方法和/或溃坝预测方法以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对相关技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、电可擦除可编程ROM、寄存器、硬盘、多媒体卡、卡型存储器(例如SD或DX存储器等)、磁性存储器、可移动磁盘、CD-ROM、磁碟或者光盘等各种可以存储程序代码的介质。
基于此,本申请还提供了一种可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时如上任意一实施例所述溃坝预测模型训练方法和/或溃坝预测方法的步骤。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的硬件包括装置及电子设备而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
以上对本申请所提供的一种溃坝预测及其模型训练方法、装置、电子设备及可读存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,基于本申请中的实施例,对于本技术领域的普通技术人员来说,在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。

Claims (10)

1.一种溃坝预测模型训练方法,其特征在于,包括:
将坝岸数据训练样本集对应的时空域离散为二维网格,并通过分析所述二维网格生成训练数据点集;所述训练数据点集包括坝岸数据采样点、水流速边界点及初始水深点;
基于以时空坐标作为输入、预测物理场作为输出、且包含多个隐藏层的全连接神经网络模型,构建用于预测溃坝现象发生后自由水面高度的溃坝预测模型;所述预测物理场包括水流速度和自由水面高度;
基于将描述坝溃坝现象的物理信息模型作为置信度,从所述坝岸数据采样点中选择满足预设置信度条件的目标采样点作为伪标签训练数据点;
分别基于所述坝岸数据采样点、所述水流速边界点、所述初始水深点和所述伪标签训练数据点,确定所述溃坝预测模型的溃坝预测损失函数;
利用所述训练数据点和所述伪标签训练数据点,通过所述溃坝预测损失函数对所述溃坝预测模型进行训练,直至满足预设模型终止条件。
2.根据权利要求1所述的溃坝预测模型训练方法,其特征在于,所述将坝岸数据训练样本集对应的时空域离散为二维网格,并通过分析所述二维网格生成训练数据点集,包括:
将坝岸数据训练样本集的位置信息所在的空间域离散为第一位置向量和第二位置向量,将坝岸数据训练样本集的时间信息所在的时间域离散为时间向量;
将所述第一位置向量、所述第二位置向量和所述时间向量进行组合,并调用网格创建函数生成第一位置网格、第二位置网格和时间网格,并将所述第一位置网格、所述第二位置网格和所述时间网格拉伸至目标长度的一维向量;
将所述第一位置网格、所述第二位置网格和所述时间网格分别对应存储至预先构建的坝岸数据采样点存储结构、水流速边界点存储结构及初始水深点存储结构中。
3.根据权利要求1所述的溃坝预测模型训练方法,其特征在于,所述基于将描述坝溃坝现象的物理信息模型作为置信度,从所述坝岸数据采样点中选择满足预设置信度条件的目标采样点作为伪标签训练数据点,包括:
在对所述溃坝预测模型的每一轮次的训练过程中,将当前批次获取的当前坝岸数据采样点输入至当前训练轮次下溃坝预测模型,得到当前预测物理场;
基于所述当前预测物理场,计算所述物理信息模型的残差值;
从各轮次得到的残差值中选择满足预设置信度条件的目标残差值;
将各目标残差值对应批次的坝岸数据采样点作为伪标签训练数据点。
4.根据权利要求1所述的溃坝预测模型训练方法,其特征在于,利用所述训练数据点和所述伪标签训练数据点,通过所述溃坝预测损失函数对所述溃坝预测模型进行训练,包括:
调用梯度清空函数将优化器保存的梯度清零;
调用自动求导函数对所述溃坝预测损失函数进行反向传播,并调用自动微分方法将按照链式法则隐式的计算梯度;
调用模型参数更新函数,利用计算得到的新梯度更新所述溃坝预测模型的权重参数。
5.根据权利要求1至4任意一项所述的溃坝预测模型训练方法,其特征在于,所述分别基于所述坝岸数据采样点、所述水流速边界点、所述初始水深点和所述伪标签训练数据点,确定所述溃坝预测模型的溃坝预测损失函数,包括:
根据所述溃坝预测模型对所述坝岸数据采样点、所述水流速边界点、所述初始水深点和所述伪标签训练数据点的预测数据,所述物理信息模型,水流边界条件和初始水深条件,得到物理控制损失项、边界损失项、初始损失项和伪标签损失项;
根据所述物理控制损失项、所述边界损失项、所述初始损失项、所述伪标签损失项及其各自的权重因子,确定所述溃坝预测损失函数。
6.根据权利要求5所述的溃坝预测模型训练方法,其特征在于,所述根据所述溃坝预测模型对所述坝岸数据采样点、所述水流速边界点、所述初始水深点和所述伪标签训练数据点的预测数据,所述物理信息模型,水流边界条件和初始水深条件,得到物理控制损失项、边界损失项、初始损失项和伪标签损失项,包括:
将当前批次获取的当前训练数据点和当前伪标签训练数据点,输入至当前训练轮次下溃坝预测模型,得到采样预测物理场;
基于所述采样预测物理场,确定所述物理信息模型的采样残差值,并确定所述采样预测物理场的物理均方误差;
根据所述采样残差值和所述物理均方误差,确定物理控制损失项;
从所述训练数据点选择多个水流速边界采样点,将各水流速边界采样点输入至当前训练轮次下的溃坝预测模型,得到水流速预测信息;
基于所述水流速预测信息,确定水流边界条件对应的边界残差值,并确定所述预测水流信息的边界均方误差;
根据所述边界残差值和所述边界均方误差,确定边界损失项;
从所述训练数据点选择多个初始水深采样点,将各初始水深采样点输入至当前训练轮次下的溃坝预测模型,得到水深预测信息;
基于所述水深预测信息,确定初始水深条件对应的初始残差值,并确定所述水深预测信息的初始均方误差;
根据所述初始残差值和所述初始均方误差,确定初始损失项;
从所述伪标签训练数据点选择多个伪标签采样点,并将各伪标签采样点输入至当前训练轮次下的溃坝预测模型,得到伪标签预测信息;
根据所述伪标签预测信息的均方误差确定伪标签损失项。
7.一种溃坝预测方法,其特征在于,包括:
预先利用如权利要求1至6任意一项所述溃坝预测模型训练方法训练得到溃坝预测模型;
获取用于描述待测坝的溃坝现象的待测物理信息模型和当前坝岸数据;
基于所述待测物理信息模型和所述当前坝岸数据,调用所述溃坝预测模型预测得到所述待测坝的目标水流速度和目标自由水面高度;
根据所述目标水流速度和所述目标自由水面高度,生成所述待测坝的溃坝预测信息。
8.一种溃坝预测模型训练装置,其特征在于,包括:
训练数据生成模块,用于将坝岸数据训练样本集对应的时空域离散为二维网格,并通过分析所述二维网格生成训练数据点集;所述训练数据点集包括坝岸数据采样点、水流速边界点及初始水深点;
模型搭建模块,用于基于以时空坐标作为输入、预测物理场作为输出、且包含多个隐藏层的全连接神经网络模型,构建用于预测溃坝现象发生后自由水面高度的溃坝预测模型;所述预测物理场包括水流速度和自由水面高度;
伪标签生成模块,用于基于将描述待测坝的溃坝现象的物理信息模型作为置信度,从所述坝岸数据采样点中选择满足预设置信度条件的目标采样点作为伪标签训练数据点;
损失函数确定模块,用于分别基于所述坝岸数据采样点、所述水流速边界点、所述初始水深点和所述伪标签训练数据点,确定所述溃坝预测模型的溃坝预测损失函数;
模型训练模块,用于利用所述训练数据点和所述伪标签训练数据点,通过所述溃坝预测损失函数对所述溃坝预测模型进行训练,直至满足预设模型终止条件。
9.一种电子设备,其特征在于,包括处理器和存储器,所述处理器用于执行所述存储器存储的计算机程序时实现如权利要求1至6任一项所述的溃坝预测模型训练方法和/或如权利要求7所述的溃坝预测方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的溃坝预测模型训练方法和/或如权利要求7所述的溃坝预测方法的步骤。
CN202410056883.1A 2024-01-15 2024-01-15 溃坝预测及其模型训练方法、装置、电子设备及存储介质 Pending CN117875504A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410056883.1A CN117875504A (zh) 2024-01-15 2024-01-15 溃坝预测及其模型训练方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410056883.1A CN117875504A (zh) 2024-01-15 2024-01-15 溃坝预测及其模型训练方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN117875504A true CN117875504A (zh) 2024-04-12

Family

ID=90582654

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410056883.1A Pending CN117875504A (zh) 2024-01-15 2024-01-15 溃坝预测及其模型训练方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN117875504A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118133437A (zh) * 2024-05-10 2024-06-04 上海惠生海洋工程有限公司 船舶局部结构强度分析方法、装置、计算机设备、及介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118133437A (zh) * 2024-05-10 2024-06-04 上海惠生海洋工程有限公司 船舶局部结构强度分析方法、装置、计算机设备、及介质

Similar Documents

Publication Publication Date Title
US20220043951A1 (en) Generating integrated circuit floorplans using neural networks
Praveen et al. Low cost PSO using metamodels and inexact pre-evaluation: Application to aerodynamic shape design
WO2022068623A1 (zh) 一种模型训练方法及相关设备
Georgiou et al. Learning fluid flows
CN109690576A (zh) 在多个机器学习任务上训练机器学习模型
WO2019081705A1 (en) USING HIERARCHICAL REPRESENTATIONS FOR NEURONAL NETWORK ARCHITECTURE SEARCH
CN109559300A (zh) 图像处理方法、电子设备及计算机可读存储介质
CN117875504A (zh) 溃坝预测及其模型训练方法、装置、电子设备及存储介质
CN111524112B (zh) 追钢识别方法、***、设备及介质
EP3671575A2 (en) Neural network processing method and apparatus based on nested bit representation
CN108334910A (zh) 一种事件检测模型训练方法以及事件检测方法
WO2022100607A1 (zh) 一种神经网络结构确定方法及其装置
WO2020013956A1 (en) Systems, methods, and computer-readable media for improved table identification using a neural network
CN109271957A (zh) 人脸性别识别方法以及装置
Li et al. A two-stage surrogate-assisted evolutionary algorithm (TS-SAEA) for expensive multi/many-objective optimization
Liu et al. Quantum-inspired African vultures optimization algorithm with elite mutation strategy for production scheduling problems
Zhou et al. Comparison of classic object-detection techniques for automated sewer defect detection
Patel et al. Smart adaptive mesh refinement with NEMoSys
Anitha et al. Convolution Neural Network and Auto-encoder Hybrid Scheme for Automatic Colorization of Grayscale Images
US11544425B2 (en) Systems and methods for expediting design of physical components through use of computationally efficient virtual simulations
US11295046B2 (en) Systems and methods for expediting design of physical components through use of computationally efficient virtual simulations
CN110019952A (zh) 视频描述方法、***及装置
KR20200061154A (ko) 시각 및 텍스트 정보를 포함하는 다이어그램의 분석 방법 및 장치
CN109299725A (zh) 一种基于张量链并行实现高阶主特征值分解的预测***和装置
CN115346072A (zh) 图像分类模型的训练方法及装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination