CN115545356A - 预测模型的确定方法、s波走时曲线预测方法及相关设备 - Google Patents

预测模型的确定方法、s波走时曲线预测方法及相关设备 Download PDF

Info

Publication number
CN115545356A
CN115545356A CN202211513254.4A CN202211513254A CN115545356A CN 115545356 A CN115545356 A CN 115545356A CN 202211513254 A CN202211513254 A CN 202211513254A CN 115545356 A CN115545356 A CN 115545356A
Authority
CN
China
Prior art keywords
target
global
participant
local
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211513254.4A
Other languages
English (en)
Other versions
CN115545356B (zh
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Fenghe Digital Intelligence Technology Co ltd
Original Assignee
Shenzhen Fenghe Digital Intelligence Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Fenghe Digital Intelligence Technology Co ltd filed Critical Shenzhen Fenghe Digital Intelligence Technology Co ltd
Priority to CN202211513254.4A priority Critical patent/CN115545356B/zh
Publication of CN115545356A publication Critical patent/CN115545356A/zh
Application granted granted Critical
Publication of CN115545356B publication Critical patent/CN115545356B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Animal Husbandry (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Mining & Mineral Resources (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Artificial Intelligence (AREA)
  • Agronomy & Crop Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种预测模型的确定方法、S波走时曲线预测方法及相关设备,包括:将目标均值和目标标准差发送至各参与方,并利用其对全局验证集进行标准化处理,得到目标验证集;将候选全局参数发送至各参与方,以及接收各参与方返回的本地参数;基于各参与方返回的本地参数,确定全局参数,将其赋值于候选全局参数,以及利用其和全局验证集对全局的S波走时预测模型进行验证,并将验证结果和全局参数确定为本轮迭代的结果;判断是否满足迭代结束条件,若否,继续迭代训练;若是,基于各轮迭代的结果,确定目标全局参数及目标S波走时预测模型。本申请能保障各参与方的数据隐私,提升了模型泛化能力,能充分逼近将各参与方数据集中训练时的效果。

Description

预测模型的确定方法、S波走时曲线预测方法及相关设备
技术领域
本申请涉及地球物理勘探技术领域,更具体地说,是涉及一种预测模型的确定方法、S波走时曲线预测方法及相关设备。
背景技术
测井曲线是评估油藏生产潜力的重要工具,通过测井曲线,我们可以获取岩石物理特性、地质化学特征以及地质力学特征。由于经费或者仪器故障等问题,测井曲线通常会存在缺失,且极少数井会包含S波走时曲线。在北海油田(the North Sea Area)目前公开的200多口井中,只有40多口井含有S波走时曲线。S波走时曲线是计算油藏地质力学参数不可缺少的输入数据,如何补齐S波走时曲线数据成为亟待解决的问题。
发明内容
有鉴于此,本申请提供了一种预测模型的确定方法、S波走时预测方法及相关设备,以确定S波走时预测模型并实现对S波走时的预测。
为实现上述目的,本申请第一方面提供了一种应用于服务器的预测模型的确定方法,包括:
基于来自各参与方的样本数量及各均值,确定目标均值,所述各均值包括参与方的本地数据的均值;
基于来自各参与方的样本数量及各标准差,确定目标标准差,所述各标准差包括参与方的本地数据的标准差;
利用所述目标均值和所述目标标准差,对全局验证集进行标准化处理,得到目标验证集,所述全局验证集中的数据由各参与方提供的部分本地数据构成;
将所述目标均值和所述目标标准差发送至各参与方,以便各参与方利用所述目标均值和所述目标标准差对本地数据进行标准化处理;
将S波走时预测模型的初始全局参数赋值于候选全局参数,并将候选全局参数发送至各参与方,以及接收来自各参与方返回的本地参数,所述本地参数为每一参与方利用候选全局参数对本地的S波走时预测模型进行训练后得到的模型参数;
基于各参与方返回的本地参数,确定全局参数,将所述全局参数赋值于候选全局参数,以及利用所述全局参数和所述全局验证集对全局的S波走时预测模型进行验证,并将验证结果和所述全局参数确定为本轮迭代的结果;
判断是否满足迭代结束条件,若否,返回执行将候选全局参数发送至各参与方的步骤;
若是,基于各轮迭代的结果,确定目标全局参数及目标S波走时预测模型。
优选地,本地数据中的数据项包括中子孔隙度、密度和P波走时。
优选地,基于来自各参与方的样本数量及各均值,确定目标均值的过程,包括:
利用下述方程式确定目标均值
Figure 508407DEST_PATH_IMAGE001
Figure 534132DEST_PATH_IMAGE002
其中,
Figure 988116DEST_PATH_IMAGE003
为第k个参与方的样本数量,
Figure 859120DEST_PATH_IMAGE004
为第k个参与方的本地数据的均值,K为参与方的数量,
Figure 714949DEST_PATH_IMAGE005
为样本总数量。
优选地,基于来自各参与方的样本数量及各标准差,确定目标标准差的过程,包括:
利用下述方程式确定目标标准差
Figure 911575DEST_PATH_IMAGE006
Figure 400326DEST_PATH_IMAGE007
其中,
Figure 584008DEST_PATH_IMAGE003
为第k个参与方的样本数量,
Figure 45076DEST_PATH_IMAGE008
为第k个参与方的本地数据的标准差,K为参与方的数量,
Figure 396292DEST_PATH_IMAGE005
为样本总数量。
优选地,基于各参与方返回的本地参数,确定全局参数的过程,包括:
利用下述方程式确定全局参数
Figure 637918DEST_PATH_IMAGE009
Figure 116303DEST_PATH_IMAGE010
其中,K为参与方的数量,
Figure 681146DEST_PATH_IMAGE003
为第k个参与方的样本数量,
Figure 219575DEST_PATH_IMAGE011
为第k个参与方返回的本地参数,
Figure 869868DEST_PATH_IMAGE005
为总样本数量。
优选地,判断是否满足迭代结束条件的过程,包括:
获取各参与方的总迭代次数,判断所述总迭代次数是否达到预设阈值;
若是,确定满足迭代结束条件;若否,确定不满足迭代结束条件。
优选地,所述验证结果为S波走时预测模型的预测值与真实值的均方误差MSE;基于各轮迭代的结果,确定目标全局参数的过程,包括:
从各轮迭代的结果中,筛选出具有最小MSE值的结果;
将所述具有最小MSE值的结果中的全局参数确定为目标全局参数。
本申请第二方面提供了一种应用于参与方的预测模型的确定方法,包括:
将本地数据的样本数量、均值和标准差发送至服务器,并接收由所述服务器返回的目标均值和目标标准差,所述目标均值为所述服务器基于各参与方的样本数量及本地数据的均值计算得到的,所述目标标准差为所述服务器基于各参与方的样本数量及本地数据的标准差计算得到的;
利用目标均值和目标标准差对本地数据进行标准化处理,得到本地训练集;
当接收到来自所述服务器的候选全局参数时,利用候选全局参数和所述本地训练集对本地的S波走时预测模型进行训练,并将本轮训练后的本地参数发送返回至所述服务器,所述候选全局参数为所述服务器基于各参与方返回的本地参数计算得到的;
当接收到来自所述服务器的目标全局参数时,将所述目标全局参数应用于本地的S波走时预测模型,得到目标S波走时预测模型;
其中,所述目标全局参数为所述服务器利用全局验证集对各候选全局参数验证后得到的,所述全局验证集中的数据由各参与方提供的部分本地数据构成。
本申请第三方面提供了一种预测模型的确定***,包括服务器和连接于所述服务器的多个参与方;
所述服务器用于实现如上述的应用于服务器的预测模型的确定方法的各个步骤;
所述参与方存储有本地数据,用于实现如上述的应用于参与方的预测模型的确定方法的各个步骤。
本申请第四方面提供了一种应用于服务器的预测模型的确定装置,包括:
目标均值确定单元,用于基于来自各参与方的样本数量及各均值,确定目标均值,所述各均值包括参与方的本地数据的均值;
目标标准差确定单元,用于基于来自各参与方的样本数量及各标准差,确定目标标准差,所述各标准差包括参与方的本地数据的标准差;
验证集处理单元,用于利用所述目标均值和所述目标标准差,对全局验证集进行标准化处理,得到目标验证集,所述全局验证集中的数据由各参与方提供的部分本地数据构成;
数据参数下发单元,用于将所述目标均值和所述目标标准差发送至各参与方,以便各参与方利用所述目标均值和所述目标标准差对本地数据进行标准化处理;
模型参数初始化单元,用于将S波走时预测模型的初始全局参数赋值于候选全局参数;
联邦训练处理单元,用于将候选全局参数发送至各参与方,以及接收来自各参与方返回的本地参数,所述本地参数为每一参与方利用候选全局参数对本地的S波走时预测模型进行训练后得到的模型参数;
全局参数更新单元,用于基于各参与方返回的本地参数,确定全局参数,将所述全局参数赋值于候选全局参数,以及利用所述全局参数和所述全局验证集对全局的S波走时预测模型进行验证,并将验证结果和所述全局参数确定为本轮迭代的结果;
迭代判断单元,用于判断是否满足迭代结束条件,若否,返回执行所述联邦训练处理单元;
全局参数确定单元,用于当所述迭代判断单元确定满足迭代结束条件时,基于各轮迭代的结果,确定目标全局参数。
本申请第五方面提供了一种应用于参与方的预测模型的确定装置,包括:
联邦数值确定单元,用于将本地数据的样本数量、均值和标准差发送至服务器,并接收由所述服务器返回的目标均值和目标标准差,所述目标均值为所述服务器基于各参与方的样本数量及本地数据的均值计算得到的,所述目标标准差为所述服务器基于各参与方的样本数量及本地数据的标准差计算得到的;
本地数据处理单元,用于利用目标均值和目标标准差对本地数据进行标准化处理,得到本地训练集;
本地模型训练单元,用于当接收到来自所述服务器的候选全局参数时,利用候选全局参数和所述本地训练集对本地的S波走时预测模型进行训练,并将本轮训练后的本地参数发送返回至所述服务器,所述候选全局参数为所述服务器基于各参与方返回的本地参数计算得到的;
目标模型确定单元,用于当接收到来自所述服务器的目标全局参数时,将所述目标全局参数应用于本地的S波走时预测模型,得到目标S波走时预测模型;
其中,所述目标全局参数为所述服务器利用全局验证集对各候选全局参数验证后得到的,所述全局验证集中的数据由各参与方提供的部分本地数据构成。
本申请第六方面提供了一种预测模型的确定设备,包括:存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现上述的预测模型的确定方法的各个步骤。
本申请第七方面提供了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上述的预测模型的确定方法的各个步骤。
本申请第八方面提供了一种S波走时曲线预测方法,包括:
将各数据项的值输入目标S波走时预测模型,得到S波走时的预测值;
其中,所述各数据项包括中子孔隙度、密度和P波走时;
所述目标S波走时预测模型为采用如上述的预测模型的确定方法,或,上述的预测模型的确定***,来构建的目标S波走时预测模型。
经由上述的技术方案可知,服务器首先基于来自各参与方的样本数量及各均值,确定目标均值,其中,所述各均值包括参与方的本地数据中每一数据项的均值。基于来自各参与方的样本数量及各标准差,确定目标标准差,其中,所述各标准差包括参与方的本地数据中每一数据项的标准差。然后,将所述目标均值和所述目标标准差发送至各参与方,使得各参与方可以利用所述目标均值和所述目标标准差,对本地训练集进行标准化处理。服务器利用所述目标均值和所述目标标准差,对全局验证集进行标准化处理,得到目标验证集,其中,所述全局验证集中的数据由各参与方提供的部分本地数据构成。通过所述标准化处理,有助于避免模型过拟合,加快模型拟合速度。接着,将S波走时预测模型的初始全局参数赋值于候选全局参数,并将候选全局参数发送至各参与方,使得各参与方可以利用候选全局参数对本地的S波走时预测模型进行训练,并得到训练后的本地参数,此时,各参与方将各自训练后的本地参数返回给服务器,服务器接收来自各参与方返回的本地参数,并基于各参与方返回的本地参数,确定全局参数。得到全局参数后,一方面,利用所述全局参数和所述全局验证集对全局的S波走时预测模型进行验证,并将验证结果和所述全局参数确定为本轮迭代的结果;另一方面,将所述全局参数赋值于候选全局参数,得到新的候选全局参数。接着,判断是否满足迭代结束条件。若仍未满足迭代结束条件,则返回执行将候选全局参数发送至各参与方的步骤,以便各参与方利用新的候选全局参数开展新的一次迭代训练。若已经满足迭代结束条件,则基于各轮迭代的结果,确定目标全局参数及目标S波走时预测模型。由于各参与方仅需将少量本地数据上传至服务器,以用作构造全局验证集,大部分的本地数据留在参与方进行本地训练,这部分数据不被外部所见,很好地保障了各参与方的数据隐私。同时,各参与方经过本地训练得到的本地参数汇聚至服务器,用以更新全局参数,使得所述全局参数能够体现各参与方的本地数据在S波走时预测模型中的训练结果,提升了模型泛化能力,最终得到的目标S波走时预测模型的效果能够充分逼近通过将所有训练数据集中在一起训练所获得的机器学习模型的效果。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例公开的预测模型的确定***的示意图;
图2为本申请实施例公开的应用于服务器的预测模型的确定方法的示意图;
图3为本申请实施例公开的应用于参与方的预测模型的确定方法的示意图;
图4示例了本申请的技术方案与传统机器学习方法的效果对比图;
图5为本申请实施例公开的应用于服务器的预测模型的确定装置的示意图;
图6为本申请实施例公开的预测模型的确定设备的示意图;
图7为本申请实施例公开的应用于参与方的预测模型的确定装置的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的发明人发现,为补齐缺失S波走时曲线,可以基于观测数据来拟合P波走时和S波走时之间的关系。S波走时除了跟P波走时存在相关性,跟密度以及孔隙度的相关性也较高,相比于线性拟合的方法,机器学习模型可以接受更多种类的输入曲线,因此,也可以采用机器学习模型来预测S波走时。应用于S波走时预测的机器学习算法主要有多层感知器(MLP)、一维卷机神经网络模型(1D CNNs)以及循环神经网络模型(LSTM和GRU)。基于给定的测井曲线,例如中子孔隙度(
Figure 151944DEST_PATH_IMAGE012
)、密度(
Figure 836873DEST_PATH_IMAGE013
)、P波走时(DTC)和S波走时(DTS),这类方法训练模型学习
Figure 342940DEST_PATH_IMAGE012
Figure 496841DEST_PATH_IMAGE013
以及DTC到DTS的映射关系,然后在缺失DTS的地方做出预测。
机器学习算法是数据驱动的方法,理论上训练数据越多,模型性能越好。国内几乎没有公开的测井曲线数据,数据都集中在各个石油公司,而国外也只有少数的测井曲线数据是公开的。由于行业竞争、用户隐私以及数据安全等方面的因素,目前很难将不同组织之间的数据整合到一起。因此,采用传统的机器学习方法,利用各自拥有的数据来单独进行机器学习,会存在模型泛化性能不佳的问题。
为打破数据孤岛以及为了让机器学习模型在更多的数据里学到输入特征到S波走时的映射关系,本申请提出采用联邦学习框架来训练模型。该学习框架具有以下几个特点:(1)多个机构共建一个机器学习模型,并且每一个机构都提供一些训练数据;(2)每一个参与机构的数据都不会离开该参与方,即数据不离开本地,也不会被其他参与机构看到;(3)本地训练好的模型参数可以在各个参与方之间传输和交换;(4)采用该学习框架训练的模型效果能够充分逼近通过将所有训练数据集中在一起并训练获得的机器学习模型的效果。根据参与机构提供的数据特征,联邦学习可以分为横向联邦学习、纵向联邦学习和迁移联邦学习。由于各个机构拥有的测井曲线类别相差不大,只是数据样本不同,因此,本申请采用横向联邦学习方法训练模型。通过采用横向联邦学习框架训练模型,可以在不看见训练数据的情况下让模型学习到更多的知识,既保护了各个机构的数据安全,也提升了模型泛化能力。
本申请实施例提供的预测模型的确定***,采用客户-服务器的形式来组建联邦学习架构,如图1所示,该***包括服务器和多个参与方,其中,服务器具备模型验证的能力,各参与方具备模型训练的能力,该***联邦训练的过程可以包括以下五个阶段:
(1)超参数(hyper-parameter)设置
主要包括确定学习率(learning rate)、优化器(optimizer)、本地模型训练轮数(epoch或者迭代次数)、全局模型训练轮数(epoch或者迭代次数)、batch-size。此外,如果是处理序列数据的模型,还需要确定序列数据的长度。
(2)数据准备,主要包括:
a)确定用于预测S波走时测井曲线的特征,例如从体积密度曲线、中子孔隙度曲线、P波走时测井曲线预测S波走时曲线;
b)各个参与方上传少量数据到服务器,用于构建全局验证集;
c)各参与方计算本地数据的均值、标准差,并将均值、标准差以及样本数量上传至服务器;
d)服务器将各参与方上传的均值、标准差以及样本数量合并成目标均值和目标标准差,并且将目标均值和目标标准差传递至各参与方;
e)参与方基于目标均值和目标标准差将本地数据标准化;
f)服务器基于目标均值和目标标准差将全局验证集标准化。
(3)模型搭建,主要包括:
a)确定模型框架,具体包含确定模型类别(RNN、CNN或者MLP)、模型层数、激活函数的选取、是否采用BN(批量标准化),是否采用dropout等;
b)服务器基于模型框架信息搭建全局模型;
c)各参与方基于模型框架信息搭建本地模型。
(4)模型训练,主要包括:
a)服务器将全局模型的初始参数传递至各个参与模型训练的参与方;
b)参与方将全局模型的参数复制到本地模型;
c)参与方基于本地数据训练本地模型,训练轮数为给定的本地模型训练轮数;
d)参与方将训练好的本地模型参数传递至服务器;
e)服务器基于联邦均值法更新全局模型的参数;
f)服务器将更新的全局模型应用于验证集;
g)如果全局模型训练轮数达到设定的轮数,转至步骤(h);否则,转至步骤a);
h)基于全局模型在验证集上的表现选取目标全局模型。
(5)模型确定,主要为将目标全局模型的参数传递至各参与方。
下面从服务器的角度,介绍本申请实施例提供的预测模型的确定方法。请参阅图2,该应用于服务器的预测模型的确定方法可以包括如下步骤:
步骤S101,基于来自各参与方的样本数量及各均值,确定目标均值。
其中,各均值包括参与方的本地数据中每一数据项的均值。例如,若本地数据中的数据项包括中子孔隙度、密度和P波走时,则各均值包括中子孔隙度的均值、密度的均值和P波走时的均值。
步骤S102,基于来自各参与方的样本数量及各标准差,确定目标标准差。
同样地,各标准差包括参与方的本地数据中每一数据项的标准差。
步骤S103,将目标均值和目标标准差发送至各参与方,并利用目标均值和目标标准差,对全局验证集进行标准化处理,得到目标验证集。
其中,全局验证集中的数据由各参与方提供的部分本地数据构成。即,各参与方从本地数据中抽取少量数据,发送至服务器。服务器聚合各参与方提供的本地数据,组建全局验证集,用于对全局的S波走时预测模型进行验证。
通过将目标均值和目标标准差发送至各参与方,使得各参与方可以利用该目标均值和目标标准差对本地数据进行标准化处理。
步骤S104,将S波走时预测模型的初始全局参数赋值于候选全局参数。
其中,S波走时预测模型为机器学习模型,该模型以中子孔隙度、密度和P波走时等作为输入,以S波走时作为输出。在第一次联邦训练时,由于还没有各参与方的训练结果,因此可以利用S波走时预测模型的初始全局参数作为各参与方的候选全局参数。之后,则可以依据各参与方返回的本地参数来计算出新一轮迭代训练时需要用到的候选全局参数。
步骤S105,将候选全局参数发送至各参与方,以及接收来自各参与方返回的本地参数。
其中,该本地参数为每一参与方利用候选全局参数对本地的S波走时预测模型进行训练后得到的模型参数。
步骤S106,基于各参与方返回的本地参数,确定全局参数,将该全局参数赋值于候选全局参数,以及利用该全局参数和全局验证集对全局的S波走时预测模型进行验证,并将验证结果和该全局参数确定为本轮迭代的结果。
其中,验证结果可包括模型性能评估指标,如RMSE(Root Mean Square Error,均方根误差)、MSE(Mean Square Error,均方误差)、MAE(Mean Absolute Error,平均绝对误差)、MAPE(Mean Absolute Percentage Error,平均绝对百分误差)等。通过多轮的联邦训练,可以得到各轮迭代的结果,即多个验证结果-全局参数组。
步骤S107,判断是否满足迭代结束条件,若是,执行步骤S108;若否,返回执行步骤S105。
步骤S108,基于各轮迭代的结果,确定目标全局参数及目标S波走时预测模型。
其中,可以根据验证结果中的模型性能评估指标,来确定最佳的全局参数。
通过上面的描述可知,在本申请中,服务器首先基于来自各参与方的样本数量及各均值,确定目标均值,其中,所述各均值包括参与方的本地数据中每一数据项的均值。基于来自各参与方的样本数量及各标准差,确定目标标准差,其中,所述各标准差包括参与方的本地数据中每一数据项的标准差。然后,将所述目标均值和所述目标标准差发送至各参与方,使得各参与方可以利用所述目标均值和所述目标标准差,对本地训练集进行标准化处理。服务器利用所述目标均值和所述目标标准差,对全局验证集进行标准化处理,得到目标验证集,其中,所述全局验证集中的数据由各参与方提供的部分本地数据构成。通过所述标准化处理,有助于避免模型过拟合,加快模型拟合速度。接着,将S波走时预测模型的初始全局参数赋值于候选全局参数,并将候选全局参数发送至各参与方,使得各参与方可以利用候选全局参数对本地的S波走时预测模型进行训练,并得到训练后的本地参数,此时,各参与方将各自训练后的本地参数返回给服务器,服务器接收来自各参与方返回的本地参数,并基于各参与方返回的本地参数,确定全局参数。得到全局参数后,一方面,利用所述全局参数和所述全局验证集对全局的S波走时预测模型进行验证,并将验证结果和所述全局参数确定为本轮迭代的结果;另一方面,将所述全局参数赋值于候选全局参数,得到新的候选全局参数。接着,判断是否满足迭代结束条件。若仍未满足迭代结束条件,则返回执行将候选全局参数发送至各参与方的步骤,以便各参与方利用新的候选全局参数开展新的一次迭代训练。若已经满足迭代结束条件,则基于各轮迭代的结果,确定目标全局参数及目标S波走时预测模型。由于各参与方仅需将少量本地数据上传至服务器,以用作构造全局验证集,大部分的本地数据留在参与方进行本地训练,这部分数据不被外部所见,很好地保障了各参与方的数据隐私。同时,各参与方经过本地训练得到的本地参数汇聚至服务器,用以更新全局参数,使得所述全局参数能够体现各参与方的本地数据在S波走时预测模型中的训练结果,提升了模型泛化能力,最终得到的目标S波走时预测模型的效果能够充分逼近通过将所有训练数据集中在一起训练所获得的机器学习模型的效果。
在本申请的一些实施例中,上述提及的本地数据中的数据项包括中子孔隙度、密度和P波走时。
在本申请的一些实施例中,步骤S101基于来自各参与方的样本数量及各均值,确定目标均值的过程,可以包括:
利用下述方程式确定目标均值
Figure 566297DEST_PATH_IMAGE001
Figure 856464DEST_PATH_IMAGE002
其中,
Figure 720384DEST_PATH_IMAGE003
为第k个参与方的样本数量,
Figure 158318DEST_PATH_IMAGE004
为第k个参与方的本地数据的均值,K为参与方的数量,
Figure 782198DEST_PATH_IMAGE005
为样本总数量。
在本申请的一些实施例中,步骤S102基于来自各参与方的样本数量及各标准差,确定目标标准差的过程,可以包括:
利用下述方程式确定目标标准差
Figure 176139DEST_PATH_IMAGE006
Figure 227271DEST_PATH_IMAGE007
其中,
Figure 152502DEST_PATH_IMAGE003
为第k个参与方的样本数量,
Figure 569620DEST_PATH_IMAGE008
为第k个参与方的本地数据的标准差,K为参与方的数量,
Figure 834379DEST_PATH_IMAGE005
为样本总数量。
在本申请的一些实施例中,步骤S106基于各参与方返回的本地参数,确定全局参数的过程,可以包括:
利用下述方程式确定全局参数
Figure 305681DEST_PATH_IMAGE009
Figure 452628DEST_PATH_IMAGE010
其中,
Figure 418310DEST_PATH_IMAGE003
为第k个参与方的样本数量,
Figure 786844DEST_PATH_IMAGE011
为第k个参与方返回的本地参数,
Figure 242096DEST_PATH_IMAGE005
为总样本数量。
基于上述确定全局参数的公式,容易得到,对于迭代
Figure 79602DEST_PATH_IMAGE014
次以后得到的全局参数
Figure 832663DEST_PATH_IMAGE015
,计算公式如下:
Figure 806435DEST_PATH_IMAGE016
其中,
Figure 432589DEST_PATH_IMAGE003
为第k个参与方的样本数量,
Figure 741079DEST_PATH_IMAGE017
为第k个参与方在迭代
Figure 48564DEST_PATH_IMAGE014
次后返回的本地参数,
Figure 391689DEST_PATH_IMAGE005
为总样本数量。
步骤S105及步骤S106为各参与方迭代训练的过程,该迭代过程会持续进行,直到损失函数收敛,或达到允许的迭代次数上限,或达到允许的训练时间上限。
在本申请的一些实施例中,步骤S107判断是否满足迭代结束条件的过程,可以包括:
获取各参与方的总迭代次数,判断总迭代次数是否达到预设阈值;
确定满足迭代结束条件;若否,确定不满足迭代结束条件。
在本申请的一些实施例中,步骤S106中提及的验证结果为S波走时预测模型的预测值与真实值的均方误差MSE;步骤S108基于各轮迭代的结果,确定目标全局参数的过程,可以包括:
S1,从各轮迭代的结果中,筛选出具有最小MSE值的结果;
S2,将该具有最小MSE值的结果中的全局参数确定为目标全局参数。
下面从参与方的角度,介绍本申请实施例提供的预测模型的确定方法。请参阅图3,该应用于参与方的预测模型的确定方法,可以包括如下步骤:
步骤S201,将本地数据的样本数量、均值和标准差发送至服务器,并接收由服务器返回的目标均值和目标标准差。
其中,该目标均值为服务器基于各参与方的样本数量及本地数据的均值计算得到的,该目标标准差为所述服务器基于各参与方的样本数量及每一数据项的标准差计算得到的。
步骤S202,利用目标均值和目标标准差对本地数据进行标准化处理,得到本地训练集。
步骤S203,当接收到来自服务器的候选全局参数时,利用候选全局参数和本地训练集对本地的S波走时预测模型进行训练,并将本轮训练后的本地参数发送返回至服务器。
其中,该候选全局参数为服务器基于各参与方返回的本地参数计算得到的。可以理解的是,在第一次进行模型训练时,该候选全局参数为服务器预设的初始全局参数;之后的候选全局参数,则为服务器根据上一轮模型训练中得到本地参数计算得到。
步骤S204,当接收到来自服务器的目标全局参数时,将该目标全局参数应用于本地的S波走时预测模型,得到目标S波走时预测模型。
其中,该目标全局参数为服务器利用全局验证集对各候选全局参数验证后得到的,全局验证集中的数据由各参与方提供的部分本地数据构成。
可以理解的是,该应用于参与方的预测模型的确定方法,与前述应用于服务器的预测模型的确定方法,相互配合使用,具体的技术细节在前文已有相应的介绍,此处不再赘述。
为验证本申请的技术方案的有效性,将训练数据分成5组(即设置5个参与方),每组含有的样本数目分别为24745、1616、18382、29088以及50904,其中,验证集数据和测试集数据能够被服务器看到。S波走时预测模型采用GRU模型,隐含层含有5个神经元,模型一共迭代200次,并采用MSE来衡量模型的性能。图4展示了模型在我们的数据上得到的验证结果和测试结果。为了对比,还将所有参与方的数据集中到一起来训练GRU模型,模型迭代60次。对于上述训练过程,重复执行了10次,采用本申请的技术方案和传统机器学习在测试集上给出的MSE分别为0.17680.0216和0.1690
Figure 126427DEST_PATH_IMAGE018
0.0225。由此可以得出结论,采用本申请的技术方案训练得到的模型效果很接近基于传统机器学习方法训练得到的模型。
下面从服务器端,对本申请实施例提供的预测模型的确定装置进行描述,下文描述的预测模型的确定装置与上文描述的应用于服务器的预测模型的确定方法可相互对应参照。
请参见图5,所述应用于服务器的预测模型的确定装置,可以包括:
目标均值确定单元21,用于基于来自各参与方的样本数量及各均值,确定目标均值,所述各均值包括参与方的本地数据的均值;
目标标准差确定单元22,用于基于来自各参与方的样本数量及各标准差,确定目标标准差,所述各标准差包括参与方的本地数据的标准差;
验证集处理单元23,用于利用所述目标均值和所述目标标准差,对全局验证集进行标准化处理,得到目标验证集,所述全局验证集中的数据由各参与方提供的部分本地数据构成;
数据参数下发单元24,用于将所述目标均值和所述目标标准差发送至各参与方,以便各参与方利用所述目标均值和所述目标标准差对本地数据进行标准化处理;
模型参数初始化单元25,用于将S波走时预测模型的初始全局参数赋值于候选全局参数;
联邦训练处理单元26,用于将候选全局参数发送至各参与方,以及接收来自各参与方返回的本地参数,所述本地参数为每一参与方利用候选全局参数对本地的S波走时预测模型进行训练后得到的模型参数;
全局参数更新单元27,用于基于各参与方返回的本地参数,确定全局参数,将所述全局参数赋值于候选全局参数,以及利用所述全局参数和所述全局验证集对全局的S波走时预测模型进行验证,并将验证结果和所述全局参数确定为本轮迭代的结果;
迭代判断单元28,用于判断是否满足迭代结束条件,若否,返回执行联邦训练处理单元25;
全局参数确定单元29,用于当所述迭代判断单元确定满足迭代结束条件时,基于各轮迭代的结果,确定目标全局参数。
在本申请的一些实施例中,目标均值确定单元21基于来自各参与方的样本数量及各均值,确定目标均值的过程,可以包括:
利用下述方程式确定目标均值
Figure 735263DEST_PATH_IMAGE001
Figure 830127DEST_PATH_IMAGE002
其中,
Figure 778491DEST_PATH_IMAGE003
为第k个参与方的样本数量,
Figure 933398DEST_PATH_IMAGE004
为第k个参与方的本地数据的均值,K为参与方的数量,
Figure 29530DEST_PATH_IMAGE005
为样本总数量。
在本申请的一些实施例中,目标标准差确定单元22基于来自各参与方的样本数量及各标准差,确定目标标准差的过程,可以包括:
利用下述方程式确定目标标准差
Figure 678817DEST_PATH_IMAGE006
Figure 14113DEST_PATH_IMAGE007
其中,
Figure 90653DEST_PATH_IMAGE003
为第k个参与方的样本数量,
Figure 408502DEST_PATH_IMAGE008
为第k个参与方的本地数据的标准差,K为参与方的数量,
Figure 110748DEST_PATH_IMAGE005
为样本总数量。
在本申请的一些实施例中,全局参数更新单元26基于各参与方返回的本地参数,确定全局参数的过程,可以包括:
利用下述方程式确定全局参数
Figure 33704DEST_PATH_IMAGE009
Figure 530414DEST_PATH_IMAGE010
其中,K为参与方的数量,
Figure 335559DEST_PATH_IMAGE003
为第k个参与方的样本数量,
Figure 326648DEST_PATH_IMAGE011
为第k个参与方返回的本地参数,
Figure 353379DEST_PATH_IMAGE005
为总样本数量。
在本申请的一些实施例中,迭代判断单元27判断是否满足迭代结束条件的过程,可以包括:
获取各参与方的总迭代次数,判断所述总迭代次数是否达到预设阈值;
若是,确定满足迭代结束条件;若否,确定不满足迭代结束条件。
在本申请的一些实施例中,所述验证结果为S波走时预测模型的预测值与真实值的均方误差MSE;全局参数确定单元28基于各轮迭代的结果,确定目标全局参数的过程,可以包括:
从各轮迭代的结果中,筛选出具有最小MSE值的结果;
将所述具有最小MSE值的结果中的全局参数确定为目标全局参数。
上述应用于服务器的预测模型的确定装置可应用于预测模型的确定设备,如计算机等。可选的,图6示出了所述预测模型的确定设备的硬件结构框图,参照图6,预测模型的确定设备的硬件结构可以包括:至少一个处理器31,至少一个通信接口32,至少一个存储器33和至少一个通信总线34。
在本申请实施例中,处理器31、通信接口32、存储器33、通信总线34的数量为至少一个,且处理器31、通信接口32、存储器33通过通信总线34完成相互间的通信;
处理器31可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本申请实施例的一个或多个集成电路等;
存储器33可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory)等,例如至少一个磁盘存储器;
其中,存储器33存储有程序,处理器31可调用存储器33存储的程序,所述程序用于:
基于来自各参与方的样本数量及各均值,确定目标均值,所述各均值包括参与方的本地数据的均值;
基于来自各参与方的样本数量及各标准差,确定目标标准差,所述各标准差包括参与方的本地数据的标准差;
利用所述目标均值和所述目标标准差,对全局验证集进行标准化处理,得到目标验证集,所述全局验证集中的数据由各参与方提供的部分本地数据构成;
将所述目标均值和所述目标标准差发送至各参与方,以便各参与方利用所述目标均值和所述目标标准差对本地数据进行标准化处理;
将S波走时预测模型的初始全局参数赋值于候选全局参数,并将候选全局参数发送至各参与方,以及接收来自各参与方返回的本地参数,所述本地参数为每一参与方利用候选全局参数对本地的S波走时预测模型进行训练后得到的模型参数;
基于各参与方返回的本地参数,确定全局参数,将所述全局参数赋值于候选全局参数,以及利用所述全局参数和所述全局验证集对全局的S波走时预测模型进行验证,并将验证结果和所述全局参数确定为本轮迭代的结果;
判断是否满足迭代结束条件,若否,返回执行将候选全局参数发送至各参与方的步骤;
若是,基于各轮迭代的结果,确定目标全局参数及目标S波走时预测模型。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
本申请实施例还提供一种存储介质,该存储介质可存储有适于处理器执行的程序,所述程序用于:
基于来自各参与方的样本数量及各均值,确定目标均值,所述各均值包括参与方的本地数据的均值;
基于来自各参与方的样本数量及各标准差,确定目标标准差,所述各标准差包括参与方的本地数据的标准差;
利用所述目标均值和所述目标标准差,对全局验证集进行标准化处理,得到目标验证集,所述全局验证集中的数据由各参与方提供的部分本地数据构成;
将所述目标均值和所述目标标准差发送至各参与方,以便各参与方利用所述目标均值和所述目标标准差对本地数据进行标准化处理;
将S波走时预测模型的初始全局参数赋值于候选全局参数,并将候选全局参数发送至各参与方,以及接收来自各参与方返回的本地参数,所述本地参数为每一参与方利用候选全局参数对本地的S波走时预测模型进行训练后得到的模型参数;
基于各参与方返回的本地参数,确定全局参数,将所述全局参数赋值于候选全局参数,以及利用所述全局参数和所述全局验证集对全局的S波走时预测模型进行验证,并将验证结果和所述全局参数确定为本轮迭代的结果;
判断是否满足迭代结束条件,若否,返回执行将候选全局参数发送至各参与方的步骤;
若是,基于各轮迭代的结果,确定目标全局参数及目标S波走时预测模型。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
下面从参与方端,对本申请实施例提供的预测模型的确定装置进行描述,下文描述的预测模型的确定装置与上文描述的应用于参与方的预测模型的确定方法可相互对应参照。
请参见图7,所述应用于参与方的预测模型的确定装置,可以包括:
联邦数值确定单元41,用于将本地数据的样本数量、均值和标准差发送至服务器,并接收由所述服务器返回的目标均值和目标标准差,所述目标均值为所述服务器基于各参与方的样本数量及本地数据的均值计算得到的,所述目标标准差为所述服务器基于各参与方的样本数量及本地数据的标准差计算得到的;
本地数据处理单元42,用于利用目标均值和目标标准差对本地数据进行标准化处理,得到本地训练集;
本地模型训练单元43,用于当接收到来自所述服务器的候选全局参数时,利用候选全局参数和所述本地训练集对本地的S波走时预测模型进行训练,并将本轮训练后的本地参数发送返回至所述服务器,所述候选全局参数为所述服务器基于各参与方返回的本地参数计算得到的;
目标模型确定单元44,用于当接收到来自所述服务器的目标全局参数时,将所述目标全局参数应用于本地的S波走时预测模型,得到目标S波走时预测模型;
其中,所述目标全局参数为所述服务器利用全局验证集对各候选全局参数验证后得到的,所述全局验证集中的数据由各参与方提供的部分本地数据构成。
上述应用于参与方的预测模型的确定装置可应用于预测模型的确定设备,如计算机等。可选的,图5示出了预测模型的确定设备的硬件结构框图,参照图5,预测模型的确定设备的硬件结构可以包括:至少一个处理器31,至少一个通信接口32,至少一个存储器33和至少一个通信总线34。
在本申请实施例中,处理器31、通信接口32、存储器33、通信总线34的数量为至少一个,且处理器31、通信接口32、存储器33通过通信总线34完成相互间的通信;
处理器31可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本申请实施例的一个或多个集成电路等;
存储器33可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory)等,例如至少一个磁盘存储器;
其中,存储器33存储有程序,处理器31可调用存储器33存储的程序,所述程序用于:
将本地数据的样本数量、均值和标准差发送至服务器,并接收由所述服务器返回的目标均值和目标标准差,所述目标均值为所述服务器基于各参与方的样本数量及本地数据的均值计算得到的,所述目标标准差为所述服务器基于各参与方的样本数量及本地数据的标准差计算得到的;
利用目标均值和目标标准差对本地数据进行标准化处理,得到本地训练集;
当接收到来自所述服务器的候选全局参数时,利用候选全局参数和所述本地训练集对本地的S波走时预测模型进行训练,并将本轮训练后的本地参数发送返回至所述服务器,所述候选全局参数为所述服务器基于各参与方返回的本地参数计算得到的;
当接收到来自所述服务器的目标全局参数时,将所述目标全局参数应用于本地的S波走时预测模型,得到目标S波走时预测模型;
其中,所述目标全局参数为所述服务器利用全局验证集对各候选全局参数验证后得到的,所述全局验证集中的数据由各参与方提供的部分本地数据构成。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
本申请实施例还提供一种存储介质,该存储介质可存储有适于处理器执行的程序,所述程序用于:
将本地数据的样本数量、均值和标准差发送至服务器,并接收由所述服务器返回的目标均值和目标标准差,所述目标均值为所述服务器基于各参与方的样本数量及本地数据的均值计算得到的,所述目标标准差为所述服务器基于各参与方的样本数量及本地数据的标准差计算得到的;
利用目标均值和目标标准差对本地数据进行标准化处理,得到本地训练集;
当接收到来自所述服务器的候选全局参数时,利用候选全局参数和所述本地训练集对本地的S波走时预测模型进行训练,并将本轮训练后的本地参数发送返回至所述服务器,所述候选全局参数为所述服务器基于各参与方返回的本地参数计算得到的;
当接收到来自所述服务器的目标全局参数时,将所述目标全局参数应用于本地的S波走时预测模型,得到目标S波走时预测模型;
其中,所述目标全局参数为所述服务器利用全局验证集对各候选全局参数验证后得到的,所述全局验证集中的数据由各参与方提供的部分本地数据构成。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
综上所述:
在本申请的技术方案中,服务器首先基于来自各参与方的样本数量及各均值,确定目标均值,其中,所述各均值包括参与方的本地数据中每一数据项的均值。基于来自各参与方的样本数量及各标准差,确定目标标准差,其中,所述各标准差包括参与方的本地数据中每一数据项的标准差。然后,将所述目标均值和所述目标标准差发送至各参与方,使得各参与方可以利用所述目标均值和所述目标标准差,对本地训练集进行标准化处理。服务器利用所述目标均值和所述目标标准差,对全局验证集进行标准化处理,得到目标验证集,其中,所述全局验证集中的数据由各参与方提供的部分本地数据构成。通过所述标准化处理,有助于避免模型过拟合,加快模型拟合速度。接着,将S波走时预测模型的初始全局参数赋值于候选全局参数,并将候选全局参数发送至各参与方,使得各参与方可以利用候选全局参数对本地的S波走时预测模型进行训练,并得到训练后的本地参数,此时,各参与方将各自训练后的本地参数返回给服务器,服务器接收来自各参与方返回的本地参数,并基于各参与方返回的本地参数,确定全局参数。得到全局参数后,一方面,利用所述全局参数和所述全局验证集对全局的S波走时预测模型进行验证,并将验证结果和所述全局参数确定为本轮迭代的结果;另一方面,将所述全局参数赋值于候选全局参数,得到新的候选全局参数。接着,判断是否满足迭代结束条件。若仍未满足迭代结束条件,则返回执行将候选全局参数发送至各参与方的步骤,以便各参与方利用新的候选全局参数开展新的一次迭代训练。若已经满足迭代结束条件,则基于各轮迭代的结果,确定目标全局参数及目标S波走时预测模型。由于各参与方仅需将少量本地数据上传至服务器,以用作构造全局验证集,大部分的本地数据留在参与方进行本地训练,这部分数据不被外部所见,很好地保障了各参与方的数据隐私。同时,各参与方经过本地训练得到的本地参数汇聚至服务器,用以更新全局参数,使得所述全局参数能够体现各参与方的本地数据在S波走时预测模型中的训练结果,提升了模型泛化能力,最终得到的目标S波走时预测模型的效果能够充分逼近通过将所有训练数据集中在一起训练所获得的机器学习模型的效果。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间可以根据需要进行组合,且相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (14)

1.一种预测模型的确定方法,其特征在于,包括:
基于来自各参与方的样本数量及各均值,确定目标均值,所述各均值包括参与方的本地数据的均值;
基于来自各参与方的样本数量及各标准差,确定目标标准差,所述各标准差包括参与方的本地数据的标准差;
利用所述目标均值和所述目标标准差,对全局验证集进行标准化处理,得到目标验证集,所述全局验证集中的数据由各参与方提供的部分本地数据构成;
将所述目标均值和所述目标标准差发送至各参与方,以便各参与方利用所述目标均值和所述目标标准差对本地数据进行标准化处理;
将S波走时预测模型的初始全局参数赋值于候选全局参数,并将候选全局参数发送至各参与方,以及接收来自各参与方返回的本地参数,所述本地参数为每一参与方利用候选全局参数对本地的S波走时预测模型进行训练后得到的模型参数;
基于各参与方返回的本地参数,确定全局参数,将所述全局参数赋值于候选全局参数,以及利用所述全局参数和所述全局验证集对全局的S波走时预测模型进行验证,并将验证结果和所述全局参数确定为本轮迭代的结果;
判断是否满足迭代结束条件,若否,返回执行将候选全局参数发送至各参与方的步骤;
若是,基于各轮迭代的结果,确定目标全局参数及目标S波走时预测模型。
2.根据权利要求1所述的方法,其特征在于,本地数据中的数据项包括中子孔隙度、密度和P波走时。
3.根据权利要求1所述的方法,其特征在于,基于来自各参与方的样本数量及各均值,确定目标均值的过程,包括:
利用下述方程式确定目标均值
Figure 503060DEST_PATH_IMAGE001
Figure 921403DEST_PATH_IMAGE002
其中,
Figure 400795DEST_PATH_IMAGE003
为第k个参与方的样本数量,
Figure 195576DEST_PATH_IMAGE004
为第k个参与方的本地数据的均值,K为参与方的数量,
Figure 76813DEST_PATH_IMAGE005
为样本总数量。
4.根据权利要求1所述的方法,其特征在于,基于来自各参与方的样本数量及各标准差,确定目标标准差的过程,包括:
利用下述方程式确定目标标准差
Figure 666057DEST_PATH_IMAGE006
Figure 904184DEST_PATH_IMAGE007
其中,
Figure 237076DEST_PATH_IMAGE003
为第k个参与方的样本数量,
Figure 972820DEST_PATH_IMAGE008
为第k个参与方的本地数据的标准差,K为参与方的数量,
Figure 998545DEST_PATH_IMAGE005
为样本总数量。
5.根据权利要求1所述的方法,其特征在于,基于各参与方返回的本地参数,确定全局参数的过程,包括:
利用下述方程式确定全局参数
Figure 452529DEST_PATH_IMAGE009
Figure 589112DEST_PATH_IMAGE010
其中,K为参与方的数量,
Figure 992411DEST_PATH_IMAGE003
为第k个参与方的样本数量,
Figure 438305DEST_PATH_IMAGE011
为第k个参与方返回的本地参数,
Figure 130318DEST_PATH_IMAGE005
为总样本数量。
6.根据权利要求1所述的方法,其特征在于,判断是否满足迭代结束条件的过程,包括:
获取各参与方的总迭代次数,判断所述总迭代次数是否达到预设阈值;
若是,确定满足迭代结束条件;若否,确定不满足迭代结束条件。
7.根据权利要求1所述的方法,其特征在于,所述验证结果为S波走时预测模型的预测值与真实值的均方误差MSE;基于各轮迭代的结果,确定目标全局参数的过程,包括:
从各轮迭代的结果中,筛选出具有最小MSE值的结果;
将所述具有最小MSE值的结果中的全局参数确定为目标全局参数。
8.一种预测模型的确定方法,其特征在于,包括:
将本地数据的样本数量、均值和标准差发送至服务器,并接收由所述服务器返回的目标均值和目标标准差,所述目标均值为所述服务器基于各参与方的样本数量及本地数据的均值计算得到的,所述目标标准差为所述服务器基于各参与方的样本数量及本地数据的标准差计算得到的;
利用目标均值和目标标准差对本地数据进行标准化处理,得到本地训练集;
当接收到来自所述服务器的候选全局参数时,利用候选全局参数和所述本地训练集对本地的S波走时预测模型进行训练,并将本轮训练后的本地参数发送返回至所述服务器,所述候选全局参数为所述服务器基于各参与方返回的本地参数计算得到的;
当接收到来自所述服务器的目标全局参数时,将所述目标全局参数应用于本地的S波走时预测模型,得到目标S波走时预测模型;
其中,所述目标全局参数为所述服务器利用全局验证集对各候选全局参数验证后得到的,所述全局验证集中的数据由各参与方提供的部分本地数据构成。
9.一种预测模型的确定***,其特征在于,包括服务器和连接于所述服务器的多个参与方;
所述服务器用于实现如权利要求1~7中任一项所述的预测模型的确定方法的各个步骤;
所述参与方存储有本地数据,用于实现如权利要求8所述的预测模型的确定方法的各个步骤。
10.一种预测模型的确定装置,其特征在于,包括:
目标均值确定单元,用于基于来自各参与方的样本数量及各均值,确定目标均值,所述各均值包括参与方的本地数据的均值;
目标标准差确定单元,用于基于来自各参与方的样本数量及各标准差,确定目标标准差,所述各标准差包括参与方的本地数据的标准差;
验证集处理单元,用于利用所述目标均值和所述目标标准差,对全局验证集进行标准化处理,得到目标验证集,所述全局验证集中的数据由各参与方提供的部分本地数据构成;
数据参数下发单元,用于将所述目标均值和所述目标标准差发送至各参与方,以便各参与方利用所述目标均值和所述目标标准差对本地数据进行标准化处理;
模型参数初始化单元,用于将S波走时预测模型的初始全局参数赋值于候选全局参数;
联邦训练处理单元,用于将候选全局参数发送至各参与方,以及接收来自各参与方返回的本地参数,所述本地参数为每一参与方利用候选全局参数对本地的S波走时预测模型进行训练后得到的模型参数;
全局参数更新单元,用于基于各参与方返回的本地参数,确定全局参数,将所述全局参数赋值于候选全局参数,以及利用所述全局参数和所述全局验证集对全局的S波走时预测模型进行验证,并将验证结果和所述全局参数确定为本轮迭代的结果;
迭代判断单元,用于判断是否满足迭代结束条件,若否,返回执行所述联邦训练处理单元;
全局参数确定单元,用于当所述迭代判断单元确定满足迭代结束条件时,基于各轮迭代的结果,确定目标全局参数。
11.一种预测模型的确定装置,其特征在于,包括:
联邦数值确定单元,用于将本地数据的样本数量、均值和标准差发送至服务器,并接收由所述服务器返回的目标均值和目标标准差,所述目标均值为所述服务器基于各参与方的样本数量及本地数据的均值计算得到的,所述目标标准差为所述服务器基于各参与方的样本数量及本地数据的标准差计算得到的;
本地数据处理单元,用于利用目标均值和目标标准差对本地数据进行标准化处理,得到本地训练集;
本地模型训练单元,用于当接收到来自所述服务器的候选全局参数时,利用候选全局参数和所述本地训练集对本地的S波走时预测模型进行训练,并将本轮训练后的本地参数发送返回至所述服务器,所述候选全局参数为所述服务器基于各参与方返回的本地参数计算得到的;
目标模型确定单元,用于当接收到来自所述服务器的目标全局参数时,将所述目标全局参数应用于本地的S波走时预测模型,得到目标S波走时预测模型;
其中,所述目标全局参数为所述服务器利用全局验证集对各候选全局参数验证后得到的,所述全局验证集中的数据由各参与方提供的部分本地数据构成。
12.一种预测模型的确定设备,其特征在于,包括:存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现如权利要求1~8中任一项所述的预测模型的确定方法的各个步骤。
13.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1~8中任一项所述的预测模型的确定方法的各个步骤。
14.一种S波走时曲线预测方法,其特征在于,包括:
将各数据项的值输入目标S波走时预测模型,得到S波走时的预测值;
其中,所述各数据项包括中子孔隙度、密度和P波走时;
所述目标S波走时预测模型为采用如权利要求1~8中任一项所述的预测模型的确定方法,或,采用如权利要求9所述的预测模型的确定***,来构建的目标S波走时预测模型。
CN202211513254.4A 2022-11-30 2022-11-30 预测模型的确定方法、s波走时曲线预测方法及相关设备 Active CN115545356B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211513254.4A CN115545356B (zh) 2022-11-30 2022-11-30 预测模型的确定方法、s波走时曲线预测方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211513254.4A CN115545356B (zh) 2022-11-30 2022-11-30 预测模型的确定方法、s波走时曲线预测方法及相关设备

Publications (2)

Publication Number Publication Date
CN115545356A true CN115545356A (zh) 2022-12-30
CN115545356B CN115545356B (zh) 2024-02-27

Family

ID=84722126

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211513254.4A Active CN115545356B (zh) 2022-11-30 2022-11-30 预测模型的确定方法、s波走时曲线预测方法及相关设备

Country Status (1)

Country Link
CN (1) CN115545356B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1050376B (it) * 1973-05-16 1981-03-10 Inst Francais Du Petrole Dispositivo per generare delle onde trasversali nel suolo
CN112213768A (zh) * 2020-09-25 2021-01-12 南方科技大学 一种联合震源机制反演的地面微地震定位方法及***
CN112380198A (zh) * 2020-10-29 2021-02-19 吉林大学 一种基于深度学习的地震接收函数自动挑选方法
CN113592028A (zh) * 2021-08-16 2021-11-02 中国地质大学(北京) 多专家分类委员会机器测井流体识别的方法及***
CN114280670A (zh) * 2021-12-13 2022-04-05 华能煤炭技术研究有限公司 多物理模型测井横波速度曲线重构方法、***及电子设备
CN114488311A (zh) * 2021-12-22 2022-05-13 中国石油大学(华东) 基于ssa-elm算法的横波时差预测方法
CN114723155A (zh) * 2022-04-19 2022-07-08 中海油田服务股份有限公司 横波曲线预测方法、装置、计算设备及存储介质
CN114723095A (zh) * 2021-01-05 2022-07-08 中国石油天然气股份有限公司 缺失测井曲线预测方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110263102A (zh) * 2019-06-27 2019-09-20 中国石油集团东方地球物理勘探有限责任公司 一种测井数据储存方法及装置
CN112147688B (zh) * 2020-08-11 2023-09-26 中国石油天然气股份有限公司 一种储层油气识别方法和装置
CN113807544B (zh) * 2020-12-31 2023-09-26 京东科技控股股份有限公司 一种联邦学习模型的训练方法、装置及电子设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1050376B (it) * 1973-05-16 1981-03-10 Inst Francais Du Petrole Dispositivo per generare delle onde trasversali nel suolo
CN112213768A (zh) * 2020-09-25 2021-01-12 南方科技大学 一种联合震源机制反演的地面微地震定位方法及***
CN112380198A (zh) * 2020-10-29 2021-02-19 吉林大学 一种基于深度学习的地震接收函数自动挑选方法
CN114723095A (zh) * 2021-01-05 2022-07-08 中国石油天然气股份有限公司 缺失测井曲线预测方法及装置
CN113592028A (zh) * 2021-08-16 2021-11-02 中国地质大学(北京) 多专家分类委员会机器测井流体识别的方法及***
CN114280670A (zh) * 2021-12-13 2022-04-05 华能煤炭技术研究有限公司 多物理模型测井横波速度曲线重构方法、***及电子设备
CN114488311A (zh) * 2021-12-22 2022-05-13 中国石油大学(华东) 基于ssa-elm算法的横波时差预测方法
CN114723155A (zh) * 2022-04-19 2022-07-08 中海油田服务股份有限公司 横波曲线预测方法、装置、计算设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
(波兰)伍拉迪斯罗·霍曼达(WLADYSLAW HOMENDA): "《模式识别 数据质量视角》", 30 April 2020, 机械工业出版社, pages: 12 - 13 *
BINGYANG CHEN ETAL: ""Federated Learning for Cross-block Oil-water Layer Identification"", 《HTTPS://ARXIV.ORG/ABS/2112.14359》 *
BINGYANG CHEN ETAL: ""Federated Learning for Cross-block Oil-water Layer Identification"", 《HTTPS://ARXIV.ORG/ABS/2112.14359》, 29 December 2021 (2021-12-29), pages 1 - 10 *

Also Published As

Publication number Publication date
CN115545356B (zh) 2024-02-27

Similar Documents

Publication Publication Date Title
Houlahan et al. The priority of prediction in ecological understanding
CN111027686B (zh) 一种滑坡位移的预测方法、装置及设备
Ali Neural networks: a new tool for the petroleum industry?
Garcia et al. Using neural networks for parameter estimation in ground water
CN107992968B (zh) 基于集成时间序列分析技术的电能表计量误差预测方法
Olatunji et al. Improved sensitivity based linear learning method for permeability prediction of carbonate reservoir using interval type-2 fuzzy logic system
Yang et al. Two-stepped evolutionary algorithm and its application to stability analysis of slopes
CN112308288A (zh) 一种基于粒子群优化lssvm的违约用户概率预测方法
Anifowose et al. Recent advances in the application of computational intelligence techniques in oil and gas reservoir characterisation: a comparative study
Elwakil et al. Construction productivity fuzzy knowledge base management system
Zoveidavianpoor A comparative study of artificial neural network and adaptive neurofuzzy inference system for prediction of compressional wave velocity
CN115660147A (zh) 一种基于传播路径间与传播路径内影响力建模的信息传播预测方法及***
Khandelwal et al. Artificial neural networks as a valuable tool for well log interpretation
Matinkia et al. Developing a new model for drilling rate of penetration prediction using convolutional neural network
US20220137245A1 (en) Systems and methods for seismic well tie domain conversion and neural network modeling
Zhang Prediction of Purchase Volume of Cross‐Border e‐Commerce Platform Based on BP Neural Network
Paterson et al. A fuzzy-logic tool for multi-criteria decision making in fisheries: the case of the South African pelagic fishery
CN115545356A (zh) 预测模型的确定方法、s波走时曲线预测方法及相关设备
Rossel et al. Assessment of the production and economic risks of site‐specific liming using geostatistical uncertainty modelling
Huang et al. A deep learning approach for predicting critical events using event logs
CN116432839A (zh) 基于bp神经网络的回填料成本预测方法、装置及设备
Kotenko et al. Formation of Indicators for Assessing Technical Reliability of Information Security Systems
Peng et al. Meteorological satellite operation prediction using a BiLSTM deep learning model
Olatunji et al. Harnessing the power of type-2 fuzzy logic system in the prediction of reservoir properties
CN112307330B (zh) 一种交易偏好判别模型自适应方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant