CN116151487B - 预测海面溢油轨迹的物理知识与数据混合驱动的预测算法 - Google Patents

预测海面溢油轨迹的物理知识与数据混合驱动的预测算法 Download PDF

Info

Publication number
CN116151487B
CN116151487B CN202310416873.XA CN202310416873A CN116151487B CN 116151487 B CN116151487 B CN 116151487B CN 202310416873 A CN202310416873 A CN 202310416873A CN 116151487 B CN116151487 B CN 116151487B
Authority
CN
China
Prior art keywords
oil
oil spill
data
grid
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310416873.XA
Other languages
English (en)
Other versions
CN116151487A (zh
Inventor
徐小峰
刘智厅
刘文志
齐鹏
邓忆瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Petroleum East China
Original Assignee
China University of Petroleum East China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Petroleum East China filed Critical China University of Petroleum East China
Priority to CN202310416873.XA priority Critical patent/CN116151487B/zh
Publication of CN116151487A publication Critical patent/CN116151487A/zh
Application granted granted Critical
Publication of CN116151487B publication Critical patent/CN116151487B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Mathematical Physics (AREA)
  • General Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Operations Research (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于轨迹预测领域,具体涉及预测海面溢油轨迹的物理知识与数据混合驱动的预测算法,步骤包括:步骤一:对元胞自动机理论进行梳理和理论分析;步骤二:确认影响因素,为规则设立建立基础,对结果进行补充修正;步骤三:对影响因素进行融合,构建改进后的预测模型,计算预测结果;步骤四:分析所使用的入参,确定预测模型,计算预测模型预测值;步骤五:对计算的结果进行汇总分析,构建混合驱动下的预测模型;步骤六:对数据进行量纲一致和网格统一,将物理知识与数据进行混合驱动;步骤七:通过运算,得到溢油轨迹预测结果,以已有的混合智能***为框架,利用包含物理先验知识的模型协助解决数据驱动进行溢油轨迹预测,提高预测效率和精度。

Description

预测海面溢油轨迹的物理知识与数据混合驱动的预测算法
技术领域
本发明属于轨迹预测技术领域,具体涉及一种用于预测海面溢油轨迹的物理知识与数据混合驱动的预测算法。
背景技术
随着海上石油开采及运输行业的快速发展,海上钻井平台数量不断增多,石油运输总量快速增加。根据EIA数据显示,世界石油极限储量为1万亿吨,可采储量3000亿吨,其中海洋石油储量占比45%。
然而大量的石油开采与运输会带来一系列问题,其中最为突出的就是海洋溢油事故的频繁发生。海洋溢油事故是指在进行石油勘探开发、储运及炼制的过程中,因意外情况或人为操作失误等原因造成的原油外泄到海洋中的现象,主要包括石油钻井平台泄露事故和船舶碰撞溢油事故。这两种溢油事故对沿海和海洋环境的影响是最大的,会对周边的渔业和旅游业造成严重损失。据统计,溢油量超过1000吨的泄露事故全球每年平均发生约4.4次,总体石油溢入海洋约有600万吨,不仅造成了巨大的经济资源损失,更严重污染了海洋生态环境,部分生物面临灭绝的危险,海洋生物的生存环境受到极大破坏。例如,2010年4月的“深水地平线”事件是石油钻井平台泄露事故中最具有代表性的事件,被称为“最严重的一次”溢油事故,大量原油流入海湾,事故发生近3个多月才完全控制住漏油,造成的经济损失高达数千亿美金。船舶溢油事故方面,仅在1973年至2018年间沿海港口共发生船舶溢油事故3336起,平均每年76起,对海洋环境产生了恶劣影响,造成巨大经济损失。
根据OPRC公约(《1990年国际油污防备、反应和合作公约》)条例说明,海上溢油中对“油”的定义是指任何形式的石油,包括油泥、油渣、燃料油、炼制产品和原油等。事故发生后,泄漏的油品漂浮在海面上,对海洋环境造成严重污染、破坏生态环境、造成人命伤亡和财产损失、甚至会有可能影响地区的安全。其产生危害的主要原因有以下几点:①溢出的油品易燃,容易发生***和火灾,造成船员及救助人员的伤亡和经济损失;②由于事故地点在海面上,溢出的油污会随着海浪和风而发生漂移扩散;③油品覆盖在水面上后,海鸟和海产品会由于缺氧窒息或吸入油品而在海洋环境中大量死亡,对海洋生态环境造成极大的破坏。而重新修复原有的生态环境需要巨大的人力物力,造成经济方面巨大损失;④随着油污的漂移扩散,破坏了沿海旅游区及沿海港口,危害地区安全,牵扯到地区和国家权益。
海上溢油事故属于突发事件,突发事件具有突发性、紧急性、高度不确定性、复杂性、破坏性、持续性和衍生性等一系列特征。在处理溢出的油品时,要结合事故状况,选择进行溢油燃烧、溢油回收、溢油拦阻等应急措施。而在这一过程中,需要使用到拦阻类溢油物资、回收类溢油物资、分散类溢油物资和吸油材料等应急物资。为了尽量减小突发事件带来的损失,必须及时采取有效的调度决策,根据事故点的需求,及时准确的调度溢油应急物资。因此,在应对海上突发溢油事故时,无论是减少溢油事故对海洋环境造成危害,还是降低因事故造成的经济损失,合理有效的找到溢油现在的位置以及未来可能的位置,才能及时采取应急措施,将溢油污染破坏控制在最小范围。
目前,针对溢油轨迹的预测有两大类不同的方法。传统的溢油轨迹预测是通过对溢油过程进行划分,分阶段创建相应的物理模型。这些模型通常与天气预报***一起工作,获取特定区域的大量信息,就可以进行模拟。这种类型的解决方案在溢油的整体轨迹预测上工作很好,但在具体小的区域内溢油的占比预测效果较差,并且将相同的解决方案推广到新的区域是相当困难的。为了创建出适应性更强的预测模型,一些学者提出了数据驱动的混合智能***预测方法,旨在通过分析以前解决的问题的解决方案来生成新问题的解决方案。但这类方法同样也遇到了一些挑战:①在预测溢油整体轨迹上,尤其是对“由无到有”的网格区域预测存在较大误差,结果在物理上无法解释或不一致;②能否合理设计案例库结构,正确选择显著的特征和开发有效的索引技术;③能否找到合适的方法对检索到的相似案例组进行处理,以得到新案例的解决方案。因此,利用已知的物理知识驱动模型来协助构建混合智能***、解决混合智能***的构建难题与挑战是本文的切入点。
发明内容
针对现有技术中存在的问题,本发明的目的在于:提供一种能够考虑多种影响因素、预测结果更为精准的海面溢油轨迹预测算法,在实际发生溢油事故后可以根据溢油点位置的当前状态以及环境因素等实现未来溢油扩散位置的准确预测。
为实现上述目的,本发明采取的技术方案是:预测海面溢油轨迹的物理知识与数据混合驱动的预测算法,包括如下步骤:
步骤一:对元胞自动机理论解决海面溢油轨迹预测问题的常用模型进行梳理和理论分析;
步骤二:确认海面溢油轨迹的影响因素,在步骤一的基础上对海洋溢油轨迹的影响因素进行分析,为元胞自动机模型的规则设立建立基础,对传统元胞自动机模型得到的结果进行补充修正;
步骤三:对步骤二所计算的海面溢油轨迹的影响因素进行融合,构建改进后的元胞自动机物理预测模型,计算物理知识驱动下的预测结果;
步骤四:分析数据驱动预测过程所使用的入参,确定数据驱动的预测模型,计算数据驱动下的预测模型预测值;
步骤五:对步骤二、步骤三所计算的物理驱动模型与数据驱动模型所计算的结果进行汇总分析,构建混合驱动下的海面溢油轨迹预测模型;
步骤六:在步骤五构建的海面溢油轨迹预测模型的基础上,对不同数据来源的相关数据进行量纲一致和网格统一,将物理知识通过残差融合的方式与数据进行混合驱动;
步骤七:通过步骤六中混合驱动进行运算,得到海面溢油轨迹预测结果。
上述的预测海面溢油轨迹的物理知识与数据混合驱动的预测算法,所述步骤一包括,构建基于元胞自动机的海面溢油轨迹预测模型,实现物理知识的驱动模型,具体步骤为:
步骤1-1:构建传统元胞自动机模型,通过每一元胞的质量来判断该元胞是否存在溢油,t+1时刻元胞(i,j,k)的质量
Figure SMS_1
的溢油质量计算公式为:
Figure SMS_2
式中:m代表东、西、南、北四个正方向的传输系数;md代表东南、东北、西南、西北四个斜角方向的斜角修正系数,
Figure SMS_3
是t时刻元胞(i,j,k)中的溢油质量,/>
Figure SMS_4
代表元胞(i,j,k)在t+1时刻的溢油质量;/>
Figure SMS_5
分别代表元胞(i,j-1,k)、(i,j+1,k)、(i+1,j,k)、(i-1,j,k)在t时刻的溢油质量;
Figure SMS_6
分别代表元胞(i+1,j+1,k)、(i+1,j-1,k)、(i-1,j-1,k)、(i-1,j+1,k)在t时刻的溢油质量;
步骤1-2:综合考虑元胞空间、元胞状态、元胞邻居、元胞规则、元胞的初始溢油质量的问题,基于元胞自动机构建海面溢油轨迹预测模型。
上述的预测海面溢油轨迹的物理知识与数据混合驱动的预测算法,所述元胞空间是指所有的海洋溢油的元胞依据一定的规律来构成的空间,除了元胞空间的维度外,其三角形、四边形或者六边形不同的形状选择也至关重要,根据元胞自动机模型需要与网格化划分的数据相耦合,溢油的垂直扩散对溢油量的变换影响,海洋溢油的元胞模拟采用三维的元胞空间,并将研究区域划分为N×N个区域,N为自然数;
所述元胞状态是指每个元胞有未污染和污染两种状态,设置
Figure SMS_7
为状态阈值,将t时刻元胞(i,j,k)的质量表示为/>
Figure SMS_8
,则在/>
Figure SMS_9
情形下元胞状态为污染;/>
Figure SMS_10
下元胞状态为未污染;
所述元胞邻居是指在元胞自动机模型中对某元胞的状态起决定作用的周围元胞,所述元胞邻居采用摩尔型邻居类型,邻居数目为3d-1,d为维度,即每个中心元胞都要考虑周围四个正方向,东、西、南、北和四个斜方向,东北、东南、西北、西南的影响,作用距离为1个元胞距离;
所述元胞规则为溢油在扩散过程中受到自身以及外部因素的影响对溢油本身的轨迹、质量产生影响,用于修正元胞自动机模型所输出的溢油质量。
上述的预测海面溢油轨迹的物理知识与数据混合驱动的预测算法,所述步骤二包括:
步骤2-1:风、流状态影响分析,风流影响系数W表示风、流状态下不同邻居元胞对中心元胞的影响,其中风影响系数为:在风速的方向从西到东时,只有邻居元胞(i-1,j,k)对中心元胞(i,j,k)产生影响,此时在t时风产生的影响系数WF中引入(i,j,k)和(i-1,j,k)处风速的平均值,并以该平均值与风速最大值的比作为风的影响系数,公式如下:
Figure SMS_11
,式中,/>
Figure SMS_12
和/>
Figure SMS_13
分别表示为t时元胞(i,j,k)和(i-1,j,k)处的东向上的风速;FVmax为最大风速;RW是风转化系数,其他方向上的影响系数依次计算,
Ws为在t时在某方向上水流产生的影响系数,Ws修正为该某方向上的水流速度与流域内最大流速的比值,公式为:
Figure SMS_14
,式中,/>
Figure SMS_15
为t时元胞(i,j,k)处的水流在东向上的速度;SVmax为此流域内观测到的最大流速,其他方向上的影响系数依次计算,
根据所述的风影响系数和水流影响系数,计算风和流的影响系数为W=WF+WS,具体到某一网格的影响系数为
Figure SMS_16
步骤2-2:海面溢油在垂直方向质量消耗影响分析,海上溢油扩散和漂移过程中,溢油在垂直方向上存在垂直扩散现象,在元胞都为海水表层元胞时,风力是溢油垂直传输的主要动力,垂直方向的溢油传输量为
Figure SMS_17
,其计算公式如下:
Figure SMS_18
,式中,/>
Figure SMS_19
代表元胞(i,j,k)在t时刻的相对风速,且/>
Figure SMS_20
,其中/>
Figure SMS_21
代表元胞(i,j,k)在t时刻的风速,WVmax代表曾经观察到的最大风速值,/>
Figure SMS_22
代表元胞(i,j,k)在t时刻的溢油质量,RW是石油垂直方向上的传输速率;
步骤2-3:蒸发作用影响分析,通过蒸发模型得到溢油蒸发质量
Figure SMS_23
,修正后的计算公式为:/>
Figure SMS_24
,式中,F为蒸发率,其方程表述为:
Figure SMS_25
,式中,a、b为常量,T是油温,TG是沸点曲线的梯度,T0是溢油的初始沸点温度,K是蒸发系数,S是油与海水的接触面积,V0是溢油最初的体积,t是时间;
步骤2-4:扩散影响分析,海面溢油在扩散过程中会受到溢油本身物理性质、化学性质以及环境因素的影响,包括溶解过程、乳化过程,所述溶解过程是指溢油过程中有一部分溢油会溶解于海水,溶解于海水的溢油质量Mr的计算公式为:
Figure SMS_26
,式中,D是扩散系数, />
Figure SMS_27
为海水中的有浓度梯度,负号表示溢油质量增加的方向与溢油扩散的方向不同;
所述乳化过程是指对中心元胞的质量影响的扩散变化,乳化溢油质量
Figure SMS_28
的计算公式:/>
Figure SMS_29
,乳化含水率YW计算公式为:/>
Figure SMS_30
,式中,KA为常数,uw为风速,/>
Figure SMS_31
,/>
Figure SMS_32
为最终含水率为常数;
步骤2-5:溶解损失影响分析,溢油在海洋中漂浮的过程中会有小部分融水物质溶解于海水,设定溢油溶解于海水而丢失的质量参数为
Figure SMS_33
,其具体计算公式为:
Figure SMS_34
,式中,/>
Figure SMS_35
是扩散系数,/>
Figure SMS_36
是溢油与海水的接触面积,/>
Figure SMS_37
为海洋中的溢油浓度梯度。
上述的预测海面溢油轨迹的物理知识与数据混合驱动的预测算法,所述步骤三包括:
步骤3-1:基于每个溢油网格Ci,j的海洋元素行为信息,使用传统的元胞自动机模型得到纯物理知识驱动下的溢油网格Ci,j下一时刻的预测溢油质量
Figure SMS_38
,元胞溢油质量表示为Mi,j,k,k表示网格区域在海水中的不同深度,根据所述的风流影响系数WF、垂直方向的溢油传输量/>
Figure SMS_39
、溢油蒸发质量/>
Figure SMS_40
、乳化损失量/>
Figure SMS_41
、溶解损失量/>
Figure SMS_42
以及传统元胞自动机模型溢油质量计算公式,计算在t+1时刻的溢油质量/>
Figure SMS_43
,用以下公式获得:
Figure SMS_44
步骤3-2:将预测区域进行栅格化处理,其中设置5km×5km的大网格以及500m×500m的小网格,使得物理模型输出的溢油质量数据转换为溢油百分比,即每个大网格包含100个小网格,其中每个小网格的溢油质量设定有阈值
Figure SMS_45
,若某时刻该小网格的溢油质量
Figure SMS_46
,则认为该小网格存在溢油,最终,物理知识驱动模型下的大网格溢油占比输出
Figure SMS_47
即为物理驱动模型的预测结果,其中/>
Figure SMS_48
是该大网格中认定存在溢油的小网格数量。
上述的预测海面溢油轨迹的物理知识与数据混合驱动的预测算法,其特征是,所述步骤四包括:
步骤4-1:通过RBF神经网络来训练数据预测网格中浮油的变化;
步骤4-2:使用RBF神经网络的径向基中心选取使用固定中心法来选取,从输入数据集中选择原有数据点作为中心,得到被聚类之后的同一聚类组数据样本的样本分布情况;
步骤4-3:使用Gaussian函数作为激活函数保证神经网络训练的速度,实现RBF神经网络局部逼近,当输入数据距离激活函数的中心很远时隐含层的输出数值忽略;
步骤4-4:给定0-T时刻中每个溢油网格Ci,j(I,j=1,2,…,n)的溢油占比强度为Yi,j,0-T,基于0-T时刻每个溢油网格的海洋元素行为信息
Figure SMS_49
与对应下一时刻的溢油占比强度Yi,j,t+1,训练出预测神经网络NN(X,T;θ),其中θ是可训练权重/>
Figure SMS_50
和偏差b的集合,此时纯数据驱动的误差为/>
Figure SMS_51
,其中/>
Figure SMS_52
为下一时刻的数据驱动预测结果。
上述的预测海面溢油轨迹的物理知识与数据混合驱动的预测算法,所述步骤五包括:
步骤5-1:所述计算得到物理驱动模型的预测结果为
Figure SMS_53
,所述计算得到数据驱动模型的预测结果为/>
Figure SMS_54
,根据残差的相关概念,计算物理驱动结果相较于数据驱动结果的残差为:/>
Figure SMS_55
步骤5-2:在得到数据驱动与物理驱动的残差以及数据驱动的结果后,根据回归理论分别对两项数据进行处理,最终预测值
Figure SMS_56
,其中β1和β2是用于平衡数据驱动结果与残差之间相互作用的权重,通过最小化损失
Figure SMS_57
来得到最佳权重参数β,得到基于物理先验知识进行残差修正的海面溢油轨迹数据驱动模型。
上述的预测海面溢油轨迹的物理知识与数据混合驱动的预测算法,所述步骤六采用最小-最大规范化方法和双线性插值法对来自于不同数据来源的相关数据进行量纲一致和网格统一,具体步骤为:
步骤6-1:最小-最大规范化方法,对原始数据进行线性变换,将数据值映射到[0,1]之间,转换公式为
Figure SMS_58
步骤6-2:双线性插值法,在两个方向分别进行一次线性插值,在Q11=(x1,y1)、Q12=(x1,y2)、Q21=(x2,y1)、Q22=(x2,y2)已知时,要得到未知函数f在点P=(x,y)的值,首先在x方向进行线性插值得:
Figure SMS_59
Figure SMS_60
,式中,R1=(x1,y1),R2=(x2,y2);
继而在y方向进行线性插值,得到:
Figure SMS_61
进而可得双线性插值结果为:
Figure SMS_62
步骤6-3:采用加权欧氏距离进行相似度度量,并引入权重系数来表征各特征变量的重要程度,消除不同变量对溢油轨迹变化的不同影响,目标案例与源案例聚类中心的相似度
Figure SMS_63
为:
Figure SMS_64
欧式距离
Figure SMS_74
的计算公式为:/>
Figure SMS_65
,式中,/>
Figure SMS_71
为源案例聚类中心,其中/>
Figure SMS_67
为案例库中各源案例的编号;/>
Figure SMS_70
为目标案例;/>
Figure SMS_69
为权重系数,用于表征各特征变量对海面溢油漂移的影响程度;/>
Figure SMS_73
为第/>
Figure SMS_77
个源案例的第/>
Figure SMS_79
个特征变量值,其中/>
Figure SMS_68
为特征向量编号,/>
Figure SMS_72
;/>
Figure SMS_75
为目标案例的第/>
Figure SMS_80
个特征向量值;/>
Figure SMS_76
和/>
Figure SMS_78
分别为第
Figure SMS_66
个特征向量的最大值和最小值。
上述任一项所述的预测海面溢油轨迹的物理知识与数据混合驱动的预测算法,所述步骤七包括有效性分析,以公开发表的全球气象数据为基础设计算例,将物理驱动模型、数据驱动模型以及混合驱动模型分别对算例进行求解预测,依据真实算例求解得到的预测轨迹与真实溢油扩散轨迹对比验证模型及算法的有效性。
上述的预测海面溢油轨迹的物理知识与数据混合驱动的预测算法,所述有效性分析采用Kappa系数法来进行检验,计算公式为:
Figure SMS_81
,其中/>
Figure SMS_87
为模拟结果与实际结果的实际一致性,/>
Figure SMS_91
为模拟与实际结果的实际一致性,研究区域划分为/>
Figure SMS_82
个网格空间,/>
Figure SMS_88
为模拟与实际结果都为非溢油的网格数,/>
Figure SMS_93
为模拟为溢油网格而实际为非溢油网格的网格数,/>
Figure SMS_95
为模拟为非溢油网格而实际为溢油网格的网格数,/>
Figure SMS_83
为模拟与实际结果都为溢油网格的网格数,则/>
Figure SMS_85
和/>
Figure SMS_90
的计算公式如下:/>
Figure SMS_92
Figure SMS_84
,结合/>
Figure SMS_86
和/>
Figure SMS_89
的计算公式,Kappa系数的具体计算方法可表示为:/>
Figure SMS_94
,其中,Kappa系数的取值表明模拟结果与实际结果的一致性程度。
本发明一种结合物理知识的数据驱动混合轨迹预测算法的有益效果是:海面溢油轨迹预测一般是基于物理化学原理来展开研究,本发明则以已有的数据驱动下的混合智能***为框架,利用包含物理先验知识的模型来协助解决数据驱动方法下进行海面溢油轨迹预测遇到的各种挑战,提高整个混合智能***的预测效率和精度。创新性的利用以物理先验知识为基础建立的元胞自动机模型,优化数据驱动下混合智能***中的案例重用与修正阶段,提高***预测得准确性和鲁棒性,对于拓展溢油轨迹预测研究范围、完善溢油轨迹预测方法具有重要的理论意义;现实生活中,如果可以准确有效的找到溢油事故中溢油现在的位置以及未来可能的位置,对于海洋管理部门可以从容布设应急对策,提高溢油应急效率,降低周边的经济、环境损失;对于周围旅游业、渔业从业者,可以减少其受溢油影响时间,维持正常生产生活,维持当地的正常发展。
附图说明
图1 为溢油卫星图像网格化处理效果示意图;
图2 为网格着色处理效果示意图;
图3 为基于元胞自动机的海面溢油轨迹预测模型流程示意图;
图4 为混合驱动下的基于案例推理***的循环流程示意图;
图5 为双线性插值示意图;
图6为模拟图像与真实结果对比示意图。
具体实施方式
为使本领域技术人员更好的理解本发明的技术方案,下面结合具体实施方式及附图对本发明的技术方案进行说明。
本发明选取了沿海的“深水地平线”石油钻井平台起火***事故为基本素材,通过对于预测模型的搭建,预测该事故在记录时间之后的溢油扩散轨迹来验证混合预测模型的效果与性能。
本发明通过以下技术方案达到上述目的:
如图1-6所示,在本技术方案中,海上发生溢油事故后,溢油在风、流、涌、浪等的作用下,会迅速自遗漏处向外漂移扩散,形成大面积分散的海上油膜和油带,而形成的海上油膜通常是不规则的。此时,我们可以对溢油会影响到的附近区域做网格化处理,然后确定溢油卫星图像对应的每个网格中不同时间点的浮油数量。根据图像和计算出的浮油数量,每个网格会出现不同数量的亮点表示,并且不同的时间对应的浮油亮点会被涂上不同的颜色,如图1所示。之后,根据每个网格中出现的浮油亮点的数量,将网格以不同的强度着色,如图2所示,亮点的数量越多,网格的颜色就越深,该区域受到的溢油污染就越严重。至此,每个网格的颜色深浅可以量化表示为数据中的输出变量:溢油网格中的溢油占比。
各方研究证明,复杂海洋***中的海洋元素行为会对海面溢油轨迹的发展起到决定性的作用,海洋元素行为包括洋流方向与强度、浪高、海上气压等,而这些海洋元素的行为信息可以通过海洋气象站、卫星图像等获得。因此,每个溢油网格所处的海洋情况可以作为溢油轨迹预测的输入特征参数。综上所述,以每个溢油案例所处的海洋情况作为案例特征构建案例库,并根据案例推理***的框架搭建有关溢油轨迹的案例推理***或数据驱动成为溢油轨迹预测的一种可能方法。
根据卫星图像识别或计算出的溢油污染程度,每个网格会出现不同数量的亮点表示,并且不同的时间对应的浮油亮点会被涂上不同的颜色,前一时间段用红棕色表示,后一时间段用紫色表示。
根据每个网格中出现的浮油亮点的数量,将网格以不同的强度着色,亮点的数量越多,网格的颜色就越深,该区域受到的溢油污染就越严重。
考虑到纯粹的数据驱动模型可能非常适合观察结果,导致泛化性能不佳,并出现预测结果在物理上不一致或无法解释的情况。因此,本文通过物理知识驱动下的元胞自动机模型预测结果对数据驱动结果进行残差修正,并作为案例修正与重用阶段的核心模型。
物理先验知识与数据混合驱动下的海面溢油轨迹预测问题可以概括为:在溢油可能影响的海面上,溢油轨迹预测的案例推理***会把要分析的溢油区域网格化,其中每个溢油区域网格即是案例主体
Figure SMS_96
,结合具体案例,其具体步骤如下:
步骤1:构建基于元胞自动机的海面溢油轨迹预测模型,实现物理知识的驱动模型,具体步骤为:
1.1. 物理知识驱动下的海面溢油轨迹预测模型有很多类,但考虑到以元胞自动机为基础的溢油预测模型的数据形式与基于GIS地理卫星***的网格数据形式具有天然的契合性,可以使得两者之间的输出形式统一。因此,本发明选择使用基于元胞自动机的海面溢油预测模型实现物理知识驱动下的海面溢油轨迹预测。图3为使用元胞自动机模型进行预测的流程图,首先将预测区域进行网格划分,计算每个网格的溢油质量M,将M与阈值M0对比来判定该网格内是否存在溢油,根据存在情况绘制溢油网格图。传统元胞自动机溢油预测模型的优势主要在于可以实现动态溢油轨迹模拟分析,实时输出元胞网格内的溢油质量,这与数据驱动的全过程各时间段的数据输出形式相吻合,所以本发明选择传统元胞自动机模型来实现物理知识驱动。构建传统元胞自动机模型,通过每一元胞的质量来判断该元胞是否存在溢油,t+1时刻元胞(i,j,k)的质量
Figure SMS_97
的溢油质量计算公式为:
Figure SMS_98
,式中:m代表东、西、南、北四个正方向的传输系数;md代表东南、东北、西南、西北四个斜角方向的斜角修正系数,/>
Figure SMS_99
是t时刻元胞(i,j,k)中的溢油质量,/>
Figure SMS_100
代表元胞(i,j,k)在t+1时刻的溢油质量;/>
Figure SMS_101
分别代表元胞(i,j-1,k)、(i,j+1,k)、(i+1,j,k)、(i-1,j,k)在t时刻的溢油质量;/>
Figure SMS_102
分别代表元胞(i+1,j+1,k)、(i+1,j-1,k)、(i-1,j-1,k)、(i-1,j+1,k)在t时刻的溢油质量。
1.2. 综合考虑元胞空间、元胞状态、元胞邻居、元胞规则、元胞的初始溢油质量的问题,基于元胞自动机构建海面溢油轨迹预测模型。
步骤2:确定元胞自动机模型的具体规则,其具体步骤如下:
2.1. 所述元胞空间是指所有的海洋溢油的元胞依据一定的规律来构成的空间,除了元胞空间的维度外,其三角形、四边形或者六边形不同的形状选择也至关重要,根据元胞自动机模型需要与网格化划分的数据相耦合,溢油的垂直扩散对溢油量的变换影响,海洋溢油的元胞模拟采用三维的元胞空间,并将研究区域划分为N×N个区域,N为自然数。
2.2. 所述元胞状态是指每个元胞有未污染和污染两种状态,设置M0为状态阈值,将t时刻元胞(i,j,k)的质量表示为
Figure SMS_103
,则在/>
Figure SMS_104
情形下元胞状态为污染;
Figure SMS_105
下元胞状态为未污染。
2.3. 所述元胞邻居是指在元胞自动机模型中对某元胞的状态起决定作用的周围元胞,所述元胞邻居采用摩尔型邻居类型,邻居数目为3d-1,d为维度,即每个中心元胞都要考虑周围四个正方向,东、西、南、北和四个斜方向,东北、东南、西北、西南的影响,作用距离为1个元胞距离。
2.4. 所述转化规则为溢油在扩散过程中收到自身以及外部因素的影响对溢油本身的轨迹、质量等产生影响,需考虑这些因素来修正元胞自动机模型所输出的溢油质量。
步骤3:根据实际影响海面溢油因素分析,确定由于溢油本身性质以及外部因素等对溢油质量造成的影响,其具体步骤为:
3.1. 风、流状态影响分析,影响系数W表示风、流状态下不同邻居元胞对中心元胞的影响,其中风影响系数为:在风速的方向从西到东时,只有邻居元胞(i-1,j,k)对中心元胞(i,j,k)产生影响,此时在t时风产生的影响系数WF中引入(i,j,k)和(i-1,j,k)处风速的平均值,并以该平均值与风速最大值的比作为风的影响系数,公式如下:
Figure SMS_106
,式中,/>
Figure SMS_107
和/>
Figure SMS_108
分别表示为t时元胞(i,j,k)和(i-1,j,k)处的东向上的风速;FVmax为最大风速;RW是风转化系数,其他方向上的影响系数依次计算。
Ws为在t时在某方向上水流产生的影响系数,Ws修正为该某方向上的水流速度与流域内最大流速的比值,公式为:
Figure SMS_109
,式中,/>
Figure SMS_110
为t时元胞(i,j,k)处的水流在东向上的速度;SVmax为此流域内观测到的最大流速,其他方向上的影响系数依次计算。
根据所述的风影响系数和水流影响系数,计算风和流的影响系数为W=WF+WS,具体到某一网格的影响系数为
Figure SMS_111
3.2. 海面溢油在垂直方向质量消耗影响分析,海上溢油扩散和漂移过程中,溢油在垂直方向上存在垂直扩散现象,在元胞都为海水表层元胞时,风力是溢油垂直传输的主要动力,垂直方向的溢油传输量为
Figure SMS_112
,其计算公式如下:
Figure SMS_113
,式中,/>
Figure SMS_114
代表元胞(i,j,k)在t时刻的相对风速,且
Figure SMS_115
,其中/>
Figure SMS_116
代表元胞(i,j,k)在t时刻的风速,WVmax代表曾经观察到的最大风速值,/>
Figure SMS_117
代表元胞(i,j,k)在t时刻的溢油质量,RW是石油垂直方向上的传输速率。
3.3. 蒸发作用影响分析,通过蒸发模型Stiver&Mackay模式得到溢油蒸发质量
Figure SMS_118
,修正后的计算公式为:/>
Figure SMS_119
,式中,F为蒸发率,其方程表述为:
Figure SMS_120
,式中,a、b为常量,T是油温,TG是沸点曲线的梯度,T0是溢油的初始沸点温度,K是蒸发系数,S是油与海水的接触面积,V0是溢油最初的体积,t是时间。
3.4. 扩散影响分析,海面溢油在扩散过程中会受到溢油本身物理性质、化学性质以及环境因素的影响,包括溶解过程、乳化过程,所述溶解过程是指溢油过程中有一部分溢油会溶解于海水,溶解于海水的溢油质量Mr的计算公式为:
Figure SMS_121
,式中,D是扩散系数, />
Figure SMS_122
为海水中的有溢油浓度梯度,负号表示溢油质量增加的方向与溢油扩散的方向不同。/>
所述乳化过程是指对中心元胞的质量影响的扩散变化,乳化溢油质量
Figure SMS_123
的计算公式:/>
Figure SMS_124
,乳化含水率YW计算公式为:/>
Figure SMS_125
,式中,KA=4.5×10-6,uw为风速,/>
Figure SMS_126
,/>
Figure SMS_127
为最终含水率。
3.5. 溶解损失影响分析,溢油在海洋中漂浮的过程中会有小部分融水物质溶解于海水,设定溢油溶解于海水而丢失的质量参数为
Figure SMS_128
,其具体计算公式为:
Figure SMS_129
,式中,/>
Figure SMS_130
是溢油与海水的接触面积。
步骤4:构建混合驱动预测模型的案例推理***,其具体步骤为:
4.1. 案例检索:将案例的属性变量子集X={X1,X2,…,Xn}作为案例检索的节点变量,分别是{温度,气压,盐度,...}。之后对实际溢油数据搭建起来的案例库进行案例检索,得到与预测案例CD的最相似案例组
Figure SMS_131
。一旦从案例库中恢复与待解决问题最相似的案例,就将这些最相似案例的信息作为案例重用与修正阶段的模型输入,得到下一时刻预测案例/>
Figure SMS_132
的溢油网格中的溢油占比/>
Figure SMS_133
。最终,将每个预测网格在不同时刻的溢油网格中的溢油占比组合在一起即可得知溢油轨迹的发展情况。
4.2. 案例推理***进行案例的重用与修正,给定0-T时刻中每个溢油网格Ci,j(I,j=1,2,…,n)的溢油占比(强度)信息Yi,j,0-T,以及所有时刻中每个溢油网格的海洋元素行为信息
Figure SMS_134
,分别是{温度,气压,盐度,/>
Figure SMS_135
Figure SMS_136
},其中共有10个行为信息变量,具体如表1所示。
表1 海洋元素行为信息参数表
Figure SMS_137
进行案例修正的具体步骤为:
4.2.1 纯数据驱动,基于0-T时刻每个溢油网格的海洋元素行为信息
Figure SMS_138
与对应下一时刻的溢油占比强度Yi,j,t+1,可以训练出预测神经网络NN(X,T;θ),其中θ是可训练权重ω和偏差b的集合,此时纯数据驱动的误差为
Figure SMS_139
4.2.2 纯物理模型驱动,基于每个溢油网格Ci,j的海洋元素行为信息,我们可以使用传统的元胞自动机模型,物理过程包含溢油漂移、风化等因素,得到纯物理知识驱动下的溢油网格Ci,j下一时刻的预测溢油质量
Figure SMS_141
。其中,元胞或网格溢油质量表示为Mi,j,k,其中k表示网格区域在海水中的不同深度,本发明预测的是海面溢油质量,所以k一般取0,在t+1时刻的溢油质量/>
Figure SMS_145
可用以下公式获得,
Figure SMS_146
,其中,风和流的影响系数W=WF+WS;垂直方向的溢油传输量/>
Figure SMS_140
;溢油蒸发质量/>
Figure SMS_144
;乳化损失量/>
Figure SMS_147
;溶解损失量Mr均已在步骤3中进行了推导与计算。通常来看,利用数据驱动下的网格划分精度(以5km×5km为例)要远小于物理模型下的网格划分精度(以500m×500m为例)。因此,我们可以将大网格作为研究基准,使得物理模型输出的溢油质量数据转换为溢油百分比,即每个大网格包含100个小网格,其中每个小网格的溢油质量设定有阈值M0,若某时刻该小网格的溢油质量/>
Figure SMS_148
,则认为该小网格存在溢油。最终,物理模型下的大网格溢油占比输出/>
Figure SMS_142
,其中noil是该大网格中认定存在溢油的小网格数量。此时,物理驱动结果与数据驱动结果的残差/>
Figure SMS_143
4.2.3 案例修正,在得到数据驱动与物理驱动的残差以及数据驱动的结果之后,根据回归理论分别对这两项进行处理,最终预测值
Figure SMS_149
。其中β1和β2是用于平衡数据驱动结果与残差之间相互作用的权重。最终,通过最小化损失/>
Figure SMS_150
来得到最佳权重参数β,得到基于物理先验知识进行残差修正的海面溢油轨迹数据驱动模型,并作为整个案例重用和修订阶段的核心模型。
4.3. 案例学习,得到目标案例的预测值之后,目标案例的特征属性向量与其预测值将共同组成一组新的向量序列。通过将新案例更新至案例库中进行扩充,将有利于后续推理工作的长期开展。然而,案例库的更新应符合一定规则,若新案例与案例库中已有案例的相似度很高,则该案例对提高检索效率的意义较小,甚至可能导致库中相似案例过多而降低检索效率,故在本阶段需开展相似度判定。
步骤5:根据上述步骤的内容得到了一个混合驱动下的海面溢油轨迹预测模型,为了提高案例推理***预测得准确性,本发明所描述的混合***包括不同的人工智能技术,以实现每个CBR阶段的目标。如图4所示,每个CBR阶段都使用人工智能技术来获得其解,相关技术的阶段将在以下步骤中解释。
5.1. 进行数据预处理与案例检索,在数据预处理阶段,考虑到不同指标之间往往具有不同的量纲,数值差别较大,再加上不同数据来源***的地理网格划分标准不一致。***需要对来自于不同数据来源的相关数据进行量纲一致和网格统一,本发明选择最小-最大规范化方法和双线性插值法进行。
5.1.1 最小-最大规范化方法,对原始数据进行线性变换,可以将数据值映射到[0,1]之间,转换公式为
Figure SMS_151
5.1.2 双线性插值法,在两个方向分别进行一次线性插值。插值过程遵循图5所示的插值规则,假设Q11=(x1,y1)、Q12=(x1,y2)、Q21=(x2,y1)、Q22=(x2,y2)已知,要得到未知函数f在点P=(x,y)的值,首先在x方向进行线性插值得:
Figure SMS_152
Figure SMS_153
,式中,R1=(x1,y1),R2=(x2,y2)。
继而在y方向进行线性插值,得到:
Figure SMS_154
进而可得双线性插值结果为:
Figure SMS_155
5.2. 案例存储,数据预处理结束后,应用K-Means聚类算法,将历史数据聚类存储在案例库中,为CBR周期中的其他阶段进行服务。当出现新问题或预测问题时,分类检索算法会计算新问题与存储案例不同聚类中心的相似性,该相似性由案例结构变量之间的多维距离体现。将计算距离最小的案例聚类组作为最相似案例组,用于下一阶段。
考虑到不同变量对溢油轨迹变化的影响不同,因此本文将采用加权欧氏距离进行相似度度量,并引入权重系数来表征各特征变量的重要程度。目标案例与源案例聚类中心的相似度
Figure SMS_166
为:/>
Figure SMS_158
,欧式距离/>
Figure SMS_162
的计算公式为:
Figure SMS_169
,式中,/>
Figure SMS_172
为源案例聚类中心,其中/>
Figure SMS_170
为案例库中各源案例的编号;/>
Figure SMS_171
为目标案例;/>
Figure SMS_167
为权重系数,用于表征各特征变量对海面溢油漂移的影响程度;/>
Figure SMS_173
为第/>
Figure SMS_159
个源案例的第/>
Figure SMS_163
个特征变量值,其中/>
Figure SMS_160
为特征向量编号,/>
Figure SMS_164
;/>
Figure SMS_165
为目标案例的第/>
Figure SMS_168
个特征向量值;/>
Figure SMS_157
和/>
Figure SMS_161
分别为第/>
Figure SMS_156
个特征向量的最大值和最小值。
其余过程均已在步骤4中给予说明。
步骤6:实际案例分析与算法效果验证,2010年4月20日当地时间22:00左右, “深水地平线”(Deepwater Horizon)石油钻井平台起火***,直到2010年7月15日,在该漏油事件发生近3个月后,新的控油装置已成功罩住水下漏油点,“再无原油流入海湾”。整个“深水地平线”事件受到全社会各界人士的极大关注,具有较为完备且大量的基础数据,因此本技术方案将其作为案例进行分析展示,用以核准本申请中的预测结果,其具体步骤为:
6.1. 真实溢油数据的收集与整理,其具体步骤为:
6.1.1 溢油图像数据,本技术方案收集了2010年4月23日至 2010年8月11日期间在海湾北部 DWH 响应期间收集的累积油污区域的相关处理后的图像数据。
6.1.2 流场数据,本技术方案从HYCOM模型网站提供的海湾区域海洋环流模型(GOM HYCOM)获得流场数据:海水盐度、水面温度、东向水流速度、北向水流速度。
该模型使用耦合海洋数据同化(NCOMA)***进行数据同化,吸收可用的卫星高度计观测结果和原位海面温度(SST)以及来自XBT、Argo浮标和锚泊浮标的海面温度与盐度剖面图。NCOMA同化技术的使用能使预报误差控制在较小的范围内,使得预报结果具有更高的准确性。经过再分析,流场数据都被统一到分辨率为1/25°(0.04)的网格(GOMu0.04)当中,并转化为NetCDF格式,提供以下5个变量/字段:海平面高度、水温、盐度、东向海水流速和北向海水流速。
6.1.3 风场数据,风场数据来源是由CIRL Research Data Archive(RDA)提供的环境预报中心(NCEP)的环境预报***再分析资料(CFSR)的风场(http://rda.ucar.edu),CFSR每天初始化 4 次(0000、0600、1200和1800 UTC),即每6小时收集一次数据。6小时大气、海洋和陆地表面分析产品的水平分辨率为 0.3、0.5、1.0、1.9和2.5度水平分辨率(0.01度约等于1000米)。本技术方案选择分辨率最为清晰的0.3水平分辨率数据,并通过双线插值法与图像数据分辨率保持一致。数据种类:水面气压、经向风向及风力、纬向风向及风力。
6.1.4 元胞自动机参数设定,在的深水地平线事件(Deepwater Horizon oilspill)实验中,元胞自动机模型其他相关数据设置如下:元胞尺寸500 m,时间步长1800 s,假设石油泄漏前十天天连续溢油15000桶,后面每天连续溢油80000桶作为输入。
6.2. 基于以上数据及模型设定规则,本技术方案利用python和java编码得出预测结果,与之前的相关工作一样,本发明将从海面溢油整体轨迹预测图像对比以及常规预测评价指标两个方面进行结果展示,其具体步骤为:
6.2.1 进行海面溢油的整体轨迹预测。考虑到“深水地平线”事件溢油时间过长、期间会受到人为干扰,再加上当时卫星识别技术精确度有限。所以,本技术方案利用所建立的案例推理***对“深水地平线事件”发生十天后的5月1日进行当日整体轨迹预测展示。为了便于对比,模拟结果沿用元胞自动机模型的展示方法,对存在溢油的网格以白色网格展示,不存在溢油的网格以黑色网格展示,具体预测结果如图6所示。
6.2.2 整体预测效果检验,为了进一步量化整体轨迹预测的效果,本发明采用Kappa系数法来进行检验。Kappa系数法的计算公式为:
Figure SMS_174
,其中/>
Figure SMS_175
为模拟结果与实际结果的实际一致性,/>
Figure SMS_176
为模拟与实际结果的实际一致性。
将研究区域划分为
Figure SMS_177
个网格空间,/>
Figure SMS_181
为模拟与实际结果都为非溢油的网格数,/>
Figure SMS_183
为模拟为溢油网格而实际为非溢油网格的网格数,/>
Figure SMS_179
为模拟为非溢油网格而实际为溢油网格的网格数,/>
Figure SMS_180
为模拟与实际结果都为溢油网格的网格数,则/>
Figure SMS_185
和/>
Figure SMS_186
的计算公式如下:/>
Figure SMS_178
,/>
Figure SMS_182
,因此,本发明Kappa系数的具体计算方法可表示为:/>
Figure SMS_184
不同的Kappa系数,表明不同水平的一致性。Kappa系数>0.8时,表明模拟结果与实际结果有极好的一致性;0.6<Kappa系数<0.8,表明模拟结果与实际结果有较高度的一致性;0.4<Kappa系数<0.6,表明模拟结果与实际结果中度一致性;Kappa系数<0.4时,表明一致性很差。使用本申请的预测算法构成的预测模型得到的预测模拟结果如表2所示,Kappa系数达到0.625,标志着模拟结果与实际结果具有较好的一致性。
表2 Kappa系数模拟计算结果
Figure SMS_187
6.2.3 常规预测指标评价,使用三种不同的技术,使用包含从10000到30000个案例的不同量案例库进行预测结果展示,具体结果如表3所示。
表3 不同技术和不同案例库数量的情况下常规预测评价指标展示
Figure SMS_188
从上表3中,我们可以得到以下结论:(1)在只使用RBF神经网络作为案例重用阶段模型,而不对案例库结构设计进行预测时,单纯增加案例库规模反而会降低预测精度;(2)CBR(KMeans+RBF)列的预测效果优于CBR(RBF)列,这是因为利用KMeans算法构建案例库,增强了案例库的组织特征,在使用模型训练之前就消除了无用的数据,达到提高模型精度的目的;(3)混合驱动模型结果明显优于其他两种技术,这说明在案例修正阶段,本文引入的利用物理知识驱动的元胞自动机模型预测结果与数据驱动预测结果的残差具有明显的修正效果。
上述实施例只是为了说明本发明的发明构思和特点,其目的在于让本领域内的普通技术人员能够了解本发明的内容并据以实施,并不能以此限定本发明的保护范围。凡是根据本发明内容的实质所做出的等效变化或修饰,都应该涵盖在本发明的保护范围之内。

Claims (9)

1.预测海面溢油轨迹的物理知识与数据混合驱动的预测算法,其特征在于,包括如下步骤:
步骤一:对元胞自动机理论解决海面溢油轨迹预测问题的常用模型进行梳理和理论分析;
步骤二:确认海面溢油轨迹的影响因素,在步骤一的基础上对海洋溢油轨迹的影响因素进行分析,为元胞自动机模型的规则设立建立基础,对传统元胞自动机模型得到的结果进行补充修正;
步骤三:对步骤二所计算的海面溢油轨迹的影响因素进行融合,构建改进后的元胞自动机物理预测模型,计算物理知识驱动下的预测结果;
步骤四:分析数据驱动预测过程所使用的入参,确定数据驱动的预测模型,计算数据驱动下的预测模型预测值,包括:
步骤4-1:通过RBF神经网络来训练数据预测网格中浮油的变化,
步骤4-2:使用RBF神经网络的径向基中心选取使用固定中心法来选取,从输入数据集中选择原有数据点作为中心,得到被聚类之后的同一聚类组数据样本的样本分布情况;
步骤4-3:使用Gaussian函数作为激活函数保证神经网络训练的速度,实现RBF神经网络局部逼近,当输入数据距离激活函数的中心很远时隐含层的输出数值忽略;
步骤4-4:给定0-T时刻中每个溢油网格Ci,j(I,j=1,2,…,n)的溢油占比强度为Yi,j,0-T,基于0-T时刻每个溢油网格的海洋元素行为信息
Figure FDA0004256191050000011
与对应下一时刻的溢油占比强度Yi,j,t+1,训练出预测神经网络NN(X,T;θ),其中θ是可训练权重ω和偏差b的集合,此时纯数据驱动的误差为/>
Figure FDA0004256191050000012
其中/>
Figure FDA0004256191050000013
为下一时刻的数据驱动预测结果;
步骤五:对步骤二、步骤三所计算的物理驱动模型与数据驱动模型所计算的结果进行汇总分析,构建混合驱动下的海面溢油轨迹预测模型;
步骤六:在步骤五构建的海面溢油轨迹预测模型的基础上,对不同数据来源的相关数据进行量纲一致和网格统一,将物理知识通过残差融合的方式与数据进行混合驱动;
步骤七:通过步骤六中混合驱动进行运算,得到海面溢油轨迹预测结果。
2.根据权利要求1所述的预测海面溢油轨迹的物理知识与数据混合驱动的预测算法,其特征是,所述步骤一包括,构建基于元胞自动机的海面溢油轨迹预测模型,实现物理知识的驱动模型,具体步骤为:
步骤1-1:构建传统元胞自动机模型,通过每一元胞的质量来判断该元胞是否存在溢油,t+1时刻元胞(i,j,k)的质量
Figure FDA0004256191050000021
的溢油质量计算公式为:
Figure FDA0004256191050000022
式中:m代表东、西、南、北四个正方向的传输系数;md代表东南、东北、西南、西北四个斜角方向的斜角修正系数,
Figure FDA0004256191050000023
是t时刻元胞(i,j,k)中的溢油质量,/>
Figure FDA0004256191050000024
代表元胞(i,j,k)在t+1时刻的溢油质量;/>
Figure FDA0004256191050000025
分别代表元胞(i,j-1,k)、(i,j+1,k)、(i+1,j,k)、(i-1,j,k)在t时刻的溢油质量;
Figure FDA0004256191050000026
分别代表元胞(i+1,j+1,k)、(i+1,j-1,k)、(i-1,j-1,k)、(i-1,j+1,k)在t时刻的溢油质量;
步骤1-2:综合考虑元胞空间、元胞状态、元胞邻居、元胞规则、元胞的初始溢油质量的问题,基于元胞自动机构建海面溢油轨迹预测模型。
3.根据权利要求2所述的预测海面溢油轨迹的物理知识与数据混合驱动的预测算法,其特征是,
所述元胞空间是指所有的海洋溢油的元胞依据一定的规律来构成的空间,除了元胞空间的维度外,其三角形、四边形或者六边形不同的形状选择也至关重要,根据元胞自动机模型需要与网格化划分的数据相耦合,溢油的垂直扩散对溢油量的变换影响,海洋溢油的元胞模拟采用三维的元胞空间,并将研究区域划分为N×N个区域,N为自然数;
所述元胞状态是指每个元胞有未污染和污染两种状态,设置
Figure FDA00042561910500000210
为状态阈值,将t时刻元胞(i,j,k)的质量表示为/>
Figure FDA0004256191050000027
则在/>
Figure FDA0004256191050000028
情形下元胞状态为污染;/>
Figure FDA0004256191050000029
下元胞状态为未污染;
所述元胞邻居是指在元胞自动机模型中对某元胞的状态起决定作用的周围元胞,所述元胞邻居采用摩尔型邻居类型,邻居数目为3d-1,d为维度,即每个中心元胞都要考虑周围四个正方向,东、西、南、北和四个斜方向,东北、东南、西北、西南的影响,作用距离为1个元胞距离;
所述元胞规则为溢油在扩散过程中受到自身以及外部因素的影响对溢油本身的轨迹、质量产生影响,用于修正元胞自动机模型所输出的溢油质量。
4.根据权利要求2所述的预测海面溢油轨迹的物理知识与数据混合驱动的预测算法,其特征是,所述步骤二包括:
步骤2-1:风、流状态影响分析,风流影响系数W表示风、流状态下不同邻居元胞对中心元胞的影响,其中风影响系数为:在风速的方向从西到东时,只有邻居元胞(i-1,j,k)对中心元胞(i,j,k)产生影响,此时在t时风产生的影响系数WF中引入(i,j,k)和(i-1,j,k)处风速的平均值,并以该平均值与风速最大值的比作为风的影响系数,公式如下:
Figure FDA0004256191050000031
式中,
Figure FDA0004256191050000032
和/>
Figure FDA0004256191050000033
分别表示为t时元胞(i,j,k)和(i-1,j,k)处的东向上的风速;FVmax为最大风速;RW是风转化系数,其他方向上的影响系数依次计算,
Ws为在t时在某方向上水流产生的影响系数,Ws修正为该某方向上的水流速度与流域内最大流速的比值,公式为:
Figure FDA0004256191050000034
式中,
Figure FDA0004256191050000035
为t时元胞(i,j,k)处的水流在东向上的速度;SVmax为此流域内观测到的最大流速,其他方向上的影响系数依次计算,
根据所述的风影响系数和水流影响系数,计算风和流的影响系数为W=WF+WS,具体到某一网格的影响系数为
Figure FDA0004256191050000036
步骤2-2:海面溢油在垂直方向质量消耗影响分析,海上溢油扩散和漂移过程中,溢油在垂直方向上存在垂直扩散现象,在元胞都为海水表层元胞时,风力是溢油垂直传输的主要动力,垂直方向的溢油传输量为/>
Figure FDA0004256191050000041
其计算公式如下:
Figure FDA0004256191050000042
式中,
Figure FDA0004256191050000043
代表元胞(i,j,k)在t时刻的相对风速,且/>
Figure FDA0004256191050000044
其中/>
Figure FDA0004256191050000045
代表元胞(i,j,k)在t时刻的风速,WVmax代表曾经观察到的最大风速值,/>
Figure FDA0004256191050000046
代表元胞(i,j,k)在t时刻的溢油质量,RW是石油垂直方向上的传输速率;
步骤2-3:蒸发作用影响分析,通过蒸发模型得到溢油蒸发质量
Figure FDA0004256191050000047
修正后的计算公式为:
Figure FDA0004256191050000048
式中,F为蒸发率,其方程表述为:
Figure FDA0004256191050000049
式中,a、b为常量,T是油温,TG是沸点曲线的梯度,T0是溢油的初始沸点温度,K是蒸发系数,S是油与海水的接触面积,V0是溢油最初的体积,t是时间;
步骤2-4:扩散影响分析,海面溢油在扩散过程中会受到溢油本身物理性质、化学性质以及环境因素的影响,包括溶解过程、乳化过程,所述溶解过程是指溢油过程中有一部分溢油会溶解于海水,溶解于海水的溢油质量Mr的计算公式为:
Figure FDA00042561910500000410
式中,D是扩散系数,
Figure FDA0004256191050000051
为海水中的有浓度梯度,负号表示溢油质量增加的方向与溢油扩散的方向不同,
所述乳化过程是指对中心元胞的质量影响的扩散变化,乳化溢油质量
Figure FDA0004256191050000052
的计算公式:
Figure FDA0004256191050000053
乳化含水率YW计算公式为:
Figure FDA0004256191050000054
式中,KA为常数,uw为风速,
Figure FDA0004256191050000055
Figure FDA0004256191050000056
为最终含水率为常数;
步骤2-5:溶解损失影响分析,溢油在海洋中漂浮的过程中会有小部分融水物质溶解于海水,设定溢油溶解于海水而丢失的质量参数为
Figure FDA00042561910500000510
其具体计算公式为:
Figure FDA0004256191050000057
式中,D是扩散系数,S是溢油与海水的接触面积,
Figure FDA0004256191050000058
为海洋中的溢油浓度梯度。
5.根据权利要求4所述的预测海面溢油轨迹的物理知识与数据混合驱动的预测算法,其特征是,所述步骤三包括:
步骤3-1:基于每个溢油网格Ci,j的海洋元素行为信息,使用传统的元胞自动机模型得到纯物理知识驱动下的溢油网格Ci,j下一时刻的预测溢油质量
Figure FDA0004256191050000059
元胞溢油质量表示为Mi,j,k,k表示网格区域在海水中的不同深度,根据所述的风流影响系数WF、垂直方向的溢油传输量/>
Figure FDA0004256191050000061
溢油蒸发质量/>
Figure FDA0004256191050000062
乳化损失量/>
Figure FDA0004256191050000063
溶解损失量/>
Figure FDA0004256191050000068
以及传统元胞自动机模型溢油质量计算公式,计算在t+1时刻的溢油质量/>
Figure FDA0004256191050000064
用以下公式获得:
Figure FDA0004256191050000065
步骤3-2:将预测区域进行栅格化处理,其中设置5km×5km的大网格以及500m×500m的小网格,使得物理模型输出的溢油质量数据转换为溢油百分比,即每个大网格包含100个小网格,其中每个小网格的溢油质量设定有阈值M0,若某时刻该小网格的溢油质量
Figure FDA0004256191050000066
则认为该小网格存在溢油,最终,物理知识驱动模型下的大网格溢油占比输出
Figure FDA0004256191050000067
即为物理驱动模型的预测结果,其中noil是该大网格中认定存在溢油的小网格数量。
6.根据权利要求1所述的预测海面溢油轨迹的物理知识与数据混合驱动的预测算法,其特征是,所述步骤五包括:
步骤5-1:所述计算得到物理驱动模型的预测结果为Yi,j,PHYS,所述计算得到数据驱动模型的预测结果为Y′i,j,t+1根据残差的相关概念,计算物理驱动结果相较于数据驱动结果的残差为:Li,j,t+1=Yi,j,t+1-Yi,j,t+1,PHYS
步骤5-2:在得到数据驱动与物理驱动的残差以及数据驱动的结果后,根据回归理论分别对两项数据进行处理,最终预测值H(Yi,j,t+1)=βY+ε=β1Y′i,j,t+12Li,j,t+1+ε其中β1和β2是用于平衡数据驱动结果与残差之间相互作用的权重,通过最小化损失
Figure FDA0004256191050000071
来得到最佳权重参数β,得到基于物理先验知识进行残差修正的海面溢油轨迹数据驱动模型。
7.根据权利要求6所述的预测海面溢油轨迹的物理知识与数据混合驱动的预测算法,其特征是,所述步骤六采用最小-最大规范化方法和双线性插值法对来自于不同数据来源的相关数据进行量纲一致和网格统一,具体步骤为:
步骤6-1:最小-最大规范化方法,对原始数据进行线性变换,将数据值映射到[0,1]之间,转换公式为
Figure FDA0004256191050000072
步骤6-2:双线性插值法,在两个方向分别进行一次线性插值,在Q11=(x1,y1)、Q12=(x1,y2)、Q21=(x2,y1)、Q22=(x2,y2)已知时,要得到未知函数f在点P=(x,y)的值,首先在x方向进行线性插值得:
Figure FDA0004256191050000073
Figure FDA0004256191050000074
式中,R1=(x1,y1),R2=(x2,y2),
继而在y方向进行线性插值,得到:
Figure FDA0004256191050000075
进而可得双线性插值结果为:
Figure FDA0004256191050000076
步骤6-3:采用加权欧氏距离进行相似度度量,并引入权重系数来表征各特征变量的重要程度,消除不同变量对溢油轨迹变化的不同影响,目标案例与源案例聚类中心的相似度S(C0,Cij)为:
Figure FDA0004256191050000081
欧式距离
Figure FDA0004256191050000082
的计算公式为:
Figure FDA0004256191050000083
式中,Cij为源案例聚类中心,其中ij为案例库中各源案例的编号;C0为目标案例;ωi为权重系数,用于表征各特征变量对海面溢油漂移的影响程度;
Figure FDA0004256191050000084
为第ij个源案例的第k个特征变量值,其中k为特征向量编号,k=1,2,...,10;/>
Figure FDA0004256191050000085
为目标案例的第k个特征向量值;maxk和mink分别为第k个特征向量的最大值和最小值。
8.根据权利要求1-6任一项所述的预测海面溢油轨迹的物理知识与数据混合驱动的预测算法,其特征是,所述步骤七包括有效性分析,以公开发表的全球气象数据为基础设计算例,将物理驱动模型、数据驱动模型以及混合驱动模型分别对算例进行求解预测,依据真实算例求解得到的预测轨迹与真实溢油扩散轨迹对比验证模型及算法的有效性。
9.根据权利要求8所述的预测海面溢油轨迹的物理知识与数据混合驱动的预测算法,其特征是,所述有效性分析采用Kappa系数法来进行检验,计算公式为:
Figure FDA0004256191050000086
其中PA为模拟结果与实际结果的实际一致性,Pe为模拟与实际结果的实际一致性,研究区域划分为n个网格空间,a为模拟与实际结果都为非溢油的网格数,b为模拟为溢油网格而实际为非溢油网格的网格数,c为模拟为非溢油网格而实际为溢油网格的网格数,d为模拟与实际结果都为溢油网格的网格数,则PA和Pe的计算公式如下:
Figure FDA0004256191050000087
Figure FDA0004256191050000088
结合PA和Pe的计算公式,Kappa系数的具体计算方法可表示为:
Figure FDA0004256191050000091
其中,Kappa系数的取值表明模拟结果与实际结果的一致性程度。
CN202310416873.XA 2023-04-19 2023-04-19 预测海面溢油轨迹的物理知识与数据混合驱动的预测算法 Active CN116151487B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310416873.XA CN116151487B (zh) 2023-04-19 2023-04-19 预测海面溢油轨迹的物理知识与数据混合驱动的预测算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310416873.XA CN116151487B (zh) 2023-04-19 2023-04-19 预测海面溢油轨迹的物理知识与数据混合驱动的预测算法

Publications (2)

Publication Number Publication Date
CN116151487A CN116151487A (zh) 2023-05-23
CN116151487B true CN116151487B (zh) 2023-07-07

Family

ID=86358539

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310416873.XA Active CN116151487B (zh) 2023-04-19 2023-04-19 预测海面溢油轨迹的物理知识与数据混合驱动的预测算法

Country Status (1)

Country Link
CN (1) CN116151487B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116499532B (zh) * 2023-06-27 2023-09-01 中建三局集团华南有限公司 基于水文模型构建的复杂海洋环境深水群桩施工监测***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014203039A1 (en) * 2013-06-19 2014-12-24 Aselsan Elektronik Sanayi Ve Ticaret Anonim Sirketi System and method for implementing reservoir computing using cellular automata
CN112115598A (zh) * 2020-09-09 2020-12-22 南京大学 一种面向海上漂移轨迹预测的数据与模型耦合分析方法
CN115544916A (zh) * 2022-10-19 2022-12-30 中国农业大学 含植被明渠的污染物扩散预测方法及装置
CN115564150A (zh) * 2022-12-06 2023-01-03 中交天津港湾工程研究院有限公司 基于stokes漂移和潮混合机制的溢油轨迹预测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AR109623A1 (es) * 2018-02-16 2019-01-09 Pescarmona Enrique Menotti Proceso y sistema de análisis y gestión hidrológica para cuencas

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014203039A1 (en) * 2013-06-19 2014-12-24 Aselsan Elektronik Sanayi Ve Ticaret Anonim Sirketi System and method for implementing reservoir computing using cellular automata
CN112115598A (zh) * 2020-09-09 2020-12-22 南京大学 一种面向海上漂移轨迹预测的数据与模型耦合分析方法
CN115544916A (zh) * 2022-10-19 2022-12-30 中国农业大学 含植被明渠的污染物扩散预测方法及装置
CN115564150A (zh) * 2022-12-06 2023-01-03 中交天津港湾工程研究院有限公司 基于stokes漂移和潮混合机制的溢油轨迹预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于元胞自动机的海洋溢油模型;满苗苗;柳林;程鹏;魏国忠;张省;;海洋科学(09);全文 *

Also Published As

Publication number Publication date
CN116151487A (zh) 2023-05-23

Similar Documents

Publication Publication Date Title
CN111666918B (zh) 一种基于多因素的海岸线变化识别方法
CN114926749B (zh) 基于遥感图像的近地面大气污染物反演方法及***
Li et al. Decision-making on process risk of Arctic route for LNG carrier via dynamic Bayesian network modeling
CN102222313B (zh) 基于核主成分分析的城市演化模拟元胞模型处理方法
Loughney et al. Development and application of a multiple-attribute decision-analysis methodology for site selection of floating offshore wind farms on the UK Continental Shelf
CN116151487B (zh) 预测海面溢油轨迹的物理知识与数据混合驱动的预测算法
CN113011455B (zh) 一种空气质量预测svm模型构建方法
CN116187210B (zh) 一种lstm耦合机理模型的时空多源近岸海域水质时序预测方法
CN111859779A (zh) 一种燃气管网防第三方施工破坏风险预警的方法及装置
KR102365072B1 (ko) 바람 예측 자료의 보정 고도화를 통한 파랑예측 모델 정확도 향상을 위한 장치 및 방법
Chiri et al. Mid-long term oil spill forecast based on logistic regression modelling of met-ocean forcings
CN116863097A (zh) 一种空间环境数据模型构建方法及装置
CN116401939A (zh) 一种基于梯度约束神经网络的北极海冰短期预报方法
CN117556197A (zh) 一种基于人工智能的台风涡旋初始化方法
Xiong et al. Ai-goms: Large ai-driven global ocean modeling system
Dinçer et al. Enhancing wind turbine site selection through a novel wake penalty criterion
Chock et al. The impact of an 8 h ozone air quality standard on ROG and NOx controls in Southern California
CN114385611A (zh) 一种基于人工智能算法和知识图谱的降水预测方法和***
Zhou et al. A decision framework of offshore wind power station site selection using a MULTIMOORA method under pythagorean hesitant fuzzy environment
CN113962426A (zh) 一种近海水上通航安全智能预报方法和装置
Gordon et al. Separating internal and forced contributions to near term SST predictability in the CESM2-LE
Tian et al. Risk assessment of nautical navigational environment based on grey fixed weight cluster
Wang et al. Xihe: A data-driven model for global ocean eddy-resolving forecasting
KR20230082343A (ko) 태양광 발전 입지 자동 선정 시스템 및 그 방법
Shahriar et al. Spatial-temporal prediction of algal bloom

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant