CN115545357A - 一种提升模型性能的方法、地层岩性预测方法及相关设备 - Google Patents
一种提升模型性能的方法、地层岩性预测方法及相关设备 Download PDFInfo
- Publication number
- CN115545357A CN115545357A CN202211513656.4A CN202211513656A CN115545357A CN 115545357 A CN115545357 A CN 115545357A CN 202211513656 A CN202211513656 A CN 202211513656A CN 115545357 A CN115545357 A CN 115545357A
- Authority
- CN
- China
- Prior art keywords
- lithology
- training sample
- loss function
- stratum
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000012549 training Methods 0.000 claims abstract description 212
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 58
- 239000011435 rock Substances 0.000 claims abstract description 14
- 238000005259 measurement Methods 0.000 claims abstract description 12
- 230000006870 function Effects 0.000 claims description 160
- 239000003245 coal Substances 0.000 claims description 36
- 229910052925 anhydrite Inorganic materials 0.000 claims description 31
- OSGAYBCDTDRGGQ-UHFFFAOYSA-L calcium sulfate Chemical compound [Ca+2].[O-]S([O-])(=O)=O OSGAYBCDTDRGGQ-UHFFFAOYSA-L 0.000 claims description 31
- 230000008569 process Effects 0.000 claims description 25
- 238000002372 labelling Methods 0.000 claims description 9
- 230000000704 physical effect Effects 0.000 claims description 5
- 230000002708 enhancing effect Effects 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 239000000696 magnetic material Substances 0.000 claims description 2
- 238000010801 machine learning Methods 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 7
- 230000009471 action Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 2
- 235000019738 Limestone Nutrition 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 230000008020 evaporation Effects 0.000 description 2
- 238000001704 evaporation Methods 0.000 description 2
- 229910052500 inorganic mineral Inorganic materials 0.000 description 2
- 239000006028 limestone Substances 0.000 description 2
- 239000011707 mineral Substances 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005553 drilling Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Software Systems (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Marine Sciences & Fisheries (AREA)
- Mining & Mineral Resources (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Animal Husbandry (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Agronomy & Crop Science (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Educational Administration (AREA)
- Geophysics And Detection Of Objects (AREA)
Abstract
本申请公开了一种提升模型性能的方法、地层岩性预测方法及相关设备,所述提升模型性能的方法包括:基于岩层的地球物理特性,确定各目标测井曲线之间的逻辑关系集;基于所述逻辑关系集及训练样本所在地层的岩性,对训练样本进行标注,得到样本标签,所述训练样本为地层的各目标测井曲线的值;结合基于概率分布度量的损失函数以及所述逻辑关系集,构建目标损失函数;基于所述训练样本、所述样本标签及所述目标损失函数,对预设的地层岩性预测模型进行训练,得到目标地层岩性预测模型。本申请可以降低样本不均衡性对所述地层岩性预测模型性能的影响,提高了所述地层岩性预测模型预测的准确性,并且提高了所述地层岩性预测模型的可解释性。
Description
技术领域
本申请涉及地球物理勘探技术领域,更具体地说,是涉及一种提升模型性能的方法、地层岩性预测方法及相关设备。
背景技术
地层岩性是油藏分析的基础,计算油藏参数、搭建地质模型等都需要知道地层岩性信息。传统获取地层岩性信息的方式主要通过分析钻井返回的岩屑、分析岩心、分析传统测井曲线。当数据量增大的时候,采用传统方法获取地层岩性信息就会耗时耗力。
深度神经网络在图像识别领域获得突破性进展,引领各行各业相继掀起机器学习应用热潮,近年来油气行业也尝试采用机器学习的方法来助力油气开发。应用于地层岩性识别的机器学习算法主要有随机森林(RF)、XGBoost、多层感知器(MLP)、一维卷积网络模型(1D CNNs)以及循环神经网络(LSTM和GRU)。机器学习算法的应用加大了地层岩性识别实现自动化的可能性。
然而,机器学***衡性,影响了机器学习模型的性能。
发明内容
有鉴于此,本申请提供了一种提升模型性能的方法、地层岩性预测方法及相关设备,以提高地层岩性预测模型的性能及可解释性。
为实现上述目的,本申请第一方面提供了一种提升模型性能的方法,包括:
基于岩层的地球物理特性,确定各目标测井曲线之间的逻辑关系集;
基于所述逻辑关系集及训练样本所在地层的岩性,对训练样本进行标注,得到样本标签,所述训练样本为地层的各目标测井曲线的值;
结合基于概率分布度量的损失函数以及所述逻辑关系集,构建目标损失函数;
基于所述训练样本、所述样本标签及所述目标损失函数,对预设的地层岩性预测模型进行训练,得到目标地层岩性预测模型。
优选地,基于岩层的地球物理特性,确定各目标测井曲线之间的逻辑关系集的过程,包括:
优选地,基于所述逻辑关系集及训练样本所在地层的岩性,对训练样本进行标注,得到样本标签的过程,包括:
若训练样本所在地层的岩性为页岩,将所述训练样本的岩性标记为页岩,将所述训练样本的第一扩展标签项标记为1,将所述训练样本的第二扩展标签项标记为0,将所述训练样本的第三扩展标签项标记为0,将所述训练样本的第四扩展标签项标记为0;
若训练样本所在地层的岩性为煤,将所述训练样本的岩性标记为煤,将所述训练样本的第一扩展标签项标记为0,将所述训练样本的第二扩展标签项标记为1,将所述训练样本的第三扩展标签项标记为0,将所述训练样本的第四扩展标签项标记为0;
若训练样本所在地层的岩性为硬石膏,将所述训练样本的岩性标记为硬石膏,将所述训练样本的第一扩展标签项标记为0,将所述训练样本的第二扩展标签项标记为0,将所述训练样本的第三扩展标签项标记为1,将所述训练样本的第四扩展标签项标记为1;
若训练样本所在地层的岩性为除了煤、硬石膏以及页岩以外的其他岩性,将所述训练样本的岩性标记为相应的岩性,将所述训练样本的第一扩展标签项标记为0,将所述训练样本的第二扩展标签项标记为0,将所述训练样本的第三扩展标签项标记为0,将所述训练样本的第四扩展标签项标记为0;
其中,由训练样本的岩性及各扩展标签项构成样本标签。
优选地,所述基于概率分布度量的损失函数为二值交叉熵函数;结合基于概率分布度量的损失函数以及所述逻辑关系集,构建目标损失函数的过程,包括:
基于所述逻辑关系集,构建多个约束项,所述约束项用于约束训练样本的岩性及各目标测井曲线的值;
利用乘积三角范数Product T-norm将每一约束项转化为损失函数项;
结合二值交叉熵函数及各损失函数项,构建目标损失函数。
优选地,所述多个约束项包括:
以及
优选地,利用乘积三角范数Product T-norm将每一约束项转化为损失函数项的过程,包括:
将所述第二约束项转换为第二损失函数项:
将所述第四约束项转换为第四损失函数项:
优选地,结合二值交叉熵函数及各损失函数项,构建目标损失函数的过程,包括:
将下述方程式确定为目标损失函数:
优选地,基于所述训练样本、所述样本标签及所述目标损失函数,对预设的地层岩性预测模型进行训练的过程,包括:
将训练样本输入至地层岩性预测模型中,得到所述地层岩性预测模型的输出;
基于训练样本的样本标签以及所述目标损失函数,计算得到所述输出的损失值,并以所述损失值趋近于预设的损失阈值为目标,更新所述地层岩性预测模型的可学习参数。
本申请第二方面提供了一种提升模型性能的装置,包括:
逻辑关系确定单元,用于基于岩层的地球物理特性,确定各目标测井曲线之间的逻辑关系集;
样本标签确定单元,用于基于所述逻辑关系集及训练样本所在地层的岩性,对训练样本进行标注,得到样本标签,所述训练样本为地层的各目标测井曲线的值;
损失函数构建单元,用于结合基于概率分布度量的损失函数以及所述逻辑关系集,构建目标损失函数;
预测模型训练单元,用于基于所述训练样本、所述样本标签及所述目标损失函数,对预设的地层岩性预测模型进行训练,得到目标地层岩性预测模型。
本申请第三方面提供了一种提升模型性能的设备,包括:存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现上述的提升模型性能的方法的各个步骤。
本申请第四方面提供了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上述的提升模型性能的方法的各个步骤。
本申请第五方面提供了一种地层岩性预测方法,包括:
将对应于一地层的各目标测井曲线的值输入目标地层岩性预测模型,得到所述地层的岩性预测结果;
其中,所述目标地层岩性预测模型为采用上述的提升模型性能的方法来构建的目标地层岩性预测模型。
经由上述的技术方案可知,本申请首先基于岩层的地球物理特性,确定各目标测井曲线之间的逻辑关系集。其中,所述逻辑关系集包含了各目标测井曲线之间的约束关系。然后,基于所述逻辑关系集及训练样本所在地层的岩性,对训练样本进行标注,得到样本标签。其中,所述训练样本为地层的各目标测井曲线的值;所述样本标签不但包括训练样本的岩性,还包括描述各测井曲线关系的中间标注。接着,结合基于概率分布度量的损失函数以及所述逻辑关系集,构建目标损失函数。最后,基于所述训练样本、所述样本标签及所述目标损失函数,对预设的地层岩性预测模型进行训练,得到目标地层岩性预测模型。由于样本标签及目标损失函数均包含了各测井曲线的之间的约束关系,使得可以引导所述地层岩性预测模型识别出作为少数类的训练样本的岩性,降低了样本不均衡性对所述地层岩性预测模型性能的影响,提高了所述地层岩性预测模型预测的准确性,并且提高了所述地层岩性预测模型的可解释性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例公开的提升模型性能的方法的示意图;
图2为本申请实施例公开的利用领域知识进行标注扩展的示意图;
图3示例了地层岩性预测模型在数据上得到的交叉验证结果和测试结果;
图4示例了本申请实施例公开的地层岩性预测模型的整体性能;
图5为本申请实施例公开的提升模型性能的装置的示意图;
图6为本申请实施例公开的提升模型性能的设备的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的发明人发现,机器学***衡性,样本主要为砂岩和碳酸盐岩,含少量的泥岩,偶尔会存在煤层以及蒸发矿物,其中砂岩和碳酸盐岩为大多数类(majority class),煤层和蒸发矿物为少数类(minority class)。对于多分类问题,模型假定每类的样本数目相近。由于模型训练的时候主要看到大多数类的样本,从少数类学习到的信息较少,因此,如果样本不均衡,模型在少数类上会表现较差;(2)地质学家基于测井曲线分析地层岩性信息已有几十年的历史,积累了丰富的经验,传统方法侧重物理机理,得到的结果具备可解释性。因此,地质学家希望模型也具有可解释性,而目前的机器学习模型为一个黑箱,难以解释输入和输出的内部规律。
由于少数类样本少,模型从少量类学***衡的数据中学习出识别少数类的本领。基于领域知识,可以明确知道为什么模型会把一个样本预测成煤层或者硬石膏,因此,模型的可解释性也得到增强。领域知识和机器学习算法结合的方式主要有四种:(1)基于领域知识生成更多的训练数据;(2)基于领域知识修改模型结构;(3)基于领域知识构建额外的损失函数项来约束模型训练过程;(4)基于领域知识验证最终输出结果。本申请选择通过构建额外损失函数项的方式将领域知识跟机器学习算法结合,以增强模型可解释性以及降低不均衡样本对模型性能的影响。
下面介绍本申请实施例提供的提升模型性能的方法,该方法可以提高地层岩性预测模型的性能,且使得预测结果具备可解释性。请参阅图1,本申请实施例提供的提升模型性能的方法可以包括如下步骤:
步骤S101,基于岩层的地球物理特性,确定各目标测井曲线之间的逻辑关系集。
其中,各目标测井曲线可以包括伽马曲线(GR)、中子孔隙度()、密度()、P-波时差(DTC)、S-波时差(DTS)、电阻率()和地层岩性(LITH)数据等。岩层的地球物理特性可以包括各目标测井曲线与地层岩性的约束关系,基于这些约束关系,可以构建一系列逻辑关系式。
表1:基于领域知识的约束关系
步骤S102,基于逻辑关系集及训练样本所在地层的岩性,对训练样本进行标注,得到样本标签。
其中,训练样本为地层的各目标测井曲线的值。通常地,训练样本的标签仅包括最终标注,如某训练样本的岩性为页岩,则该训练样本的标签为页岩;如某训练样本的岩性为煤,则该训练样本的标签为煤。为引导模型识别出少数类,可以基于逻辑关系集构建额外的中间标注。即,若某训练样本的岩性为页岩,则该训练样本的中间标注可以包括:伽马曲线的读数高于;若如某训练样本的岩性为煤,则该训练样本的中间标注可以包括:密度不高于。这些中间标注用于监督模型的训练,使得模型能够基于领域知识正确识别出少数类的岩性。
步骤S103,结合基于概率分布度量的损失函数以及逻辑关系集,构建目标损失函数。
其中,基于概率分布度量的损失函数可以包括交叉熵损失函数、Softmax损失函数等,用于度量模型的预测值与真实值之间的差异程度。可以基于逻辑关系集,构建额外的损失函数项,然后由这些损失函数项,结合交叉熵损失函数等现有的损失函数,来构建目标损失函数。
步骤S104,基于训练样本、样本标签及目标损失函数,对预设的地层岩性预测模型进行训练,得到目标地层岩性预测模型。
本申请首先基于岩层的地球物理特性,确定各目标测井曲线之间的逻辑关系集。其中,所述逻辑关系集包含了各目标测井曲线之间的约束关系。然后,基于所述逻辑关系集及训练样本所在地层的岩性,对训练样本进行标注,得到样本标签。其中,所述训练样本为地层的各目标测井曲线的值;所述样本标签不但包括训练样本的岩性,还包括描述各测井曲线关系的中间标注。接着,结合基于概率分布度量的损失函数以及所述逻辑关系集,构建目标损失函数。最后,基于所述训练样本、所述样本标签及所述目标损失函数,对预设的地层岩性预测模型进行训练,得到目标地层岩性预测模型。由于样本标签及目标损失函数均包含了各测井曲线的之间的约束关系,使得可以引导所述地层岩性预测模型识别出作为少数类的训练样本的岩性,降低了样本不均衡性对所述地层岩性预测模型性能的影响,提高了所述地层岩性预测模型预测的准确性,并且提高了所述地层岩性预测模型的可解释性。
在本申请的一些实施例中,步骤S101基于岩层的地球物理特性,确定各目标测井曲线之间的逻辑关系集的过程,可以包括:
实际上,在标注时不需要给定、、和的值,只需要对煤层、硬石膏以及页岩这三类样本的中间标注做监督。基于此,在本申请的一些实施例中,步骤S102基于逻辑关系集及训练样本所在地层的岩性,对训练样本进行标注,得到样本标签的过程,可以包括:
S2,若训练样本所在地层的岩性为页岩,将该训练样本的岩性标记为页岩,将该训练样本的第一扩展标签项、第二扩展标签项、第三扩展标签项以及第四扩展标签项分别标记为1、0、0、0。
S3,若训练样本所在地层的岩性为煤,将该训练样本的岩性标记为煤,将该训练样本的第一扩展标签项、第二扩展标签项、第三扩展标签项以及第四扩展标签项分别标记为0、1、0、0。
S4,若训练样本所在地层的岩性为硬石膏,将该训练样本的岩性标记为硬石膏,将该训练样本的第一扩展标签项、第二扩展标签项、第三扩展标签项以及第四扩展标签项分别标记为0、0、1、1。
S5,若训练样本所在地层的岩性为除了煤、硬石膏以及页岩以外的其他岩性,将该训练样本的岩性标记为相应的岩性,将该训练样本的第一扩展标签项标记为0,将所述训练样本的第二扩展标签项标记为0,将所述训练样本的第三扩展标签项标记为0,将所述训练样本的第四扩展标签项标记为0。
上述“相应的岩性”是指与训练样本所在地层的岩性相一致的岩性,具体地,地层岩性除了煤、硬石膏、页岩,还可以包括砂岩、泥质砂岩、石灰岩、泥质石灰岩等,因此,若训练样本所在地层的岩性为砂岩,则可以将该训练样本的岩性标记为砂岩;若训练样本所在地层的岩性为泥质砂岩,则可以将该训练样本的岩性标记为泥质砂岩;以此类推。
其中,由训练样本的岩性及各扩展标签项构成样本标签。
如图2所示,通过上述的扩展标注过程,使得标注数据的维度从扩充到,其中,n为训练样本的个数,为扩展标注项的个数,亦即表1中所包含的条件的个数。由于本实施例中,扩展标注项有4个,最终得到的标注数据的维度为。
本申请要解决的问题为多标签分类(multi-label classification)问题。采用神经网络处理这类问题时,输出层包含k个神经元对应k个类别,输出层的激活函数一般采用Softmax,而损失函数可以为交叉熵损失(Cross-Entropy loss)。在前述实施例中,把各逻辑关系中的条件添加到标注数据以后,输出层神经元增加至k+m-1。因为各类别之间不是互斥的,允许同时出现,可以采用sigmoid激活函数分别将输出层的每个元素转换为概率值,同时将损失函数调整为二值交叉熵损失函数(Binary Cross-Entropy Loss)。
基于此,在本申请的一些实施例中,前面提及的基于概率分布度量的损失函数为二值交叉熵函数。步骤S103结合基于概率分布度量的损失函数以及逻辑关系集,构建目标损失函数的过程,可以包括:
S1,基于逻辑关系集,构建多个约束项。
其中,这些约束项用于约束训练样本的岩性及各目标测井曲线的值。
S2,利用Product T-norm(乘积三角范数)将每一约束项转化为损失函数项。
S3,结合二值交叉熵函数及各损失函数项,构建目标损失函数。
表2:逻辑运算符的真值表
基于此,在本申请的一些实施例中,上述S1提及的多个约束项可以包括以下五个约束项:
以及
由于每一训练样本有且仅有一个岩性类别(页岩、煤、硬石膏及其他岩性中仅可择一),因此,可以得到第四约束项:
其中,此处假设总共有K种岩性,每一训练样本的岩性仅可在这K种岩性中择一而定。
表3:将逻辑关系映射到可导函数
基于表3所示的Product T-norm算子,式(1)可以改写为:
假设式(2)为真,则添加到损失函数的惩罚项为:
基于式(3)可以得到第一约束项、第二约束项及第三约束项的可导函数。
对于第四约束项,假设所有样本中总有4种岩性,即对于每一训练样本,其岩性为第一岩性(概率为)、其岩性为第二岩性(概率为)、其岩性为第三岩性(概率为)以及其岩性为第四岩性(概率为)中,仅有一项为真,可以表示为:
假设上式为真,则最小化目标函数为:
因此,对于所有样本中总有K种岩性的情况,根据式(4)可以得到最小化目标函数为:
基于此,在本申请的一些实施例中,上述S2利用乘积三角范数Product T-norm将每一约束项转化为损失函数项的过程,可以包括:
S22,将第二约束项转换为第二损失函数项:
S24,将第四约束项转换为第四损失函数项:
在本申请的一些实施例中,上述S3结合二值交叉熵函数及各损失函数项,构建目标损失函数的过程,可以包括:
将下述方程式确定为目标损失函数:
在本申请的一些实施例中,步骤S104基于训练样本、样本标签及目标损失函数,对预设的地层岩性预测模型进行训练的过程,可以包括:
S1,将训练样本输入至地层岩性预测模型中,得到地层岩性预测模型的输出。
S2,基于训练样本的样本标签以及目标损失函数,计算得到该输出的损失值,并以损失值趋近于预设的损失阈值为目标,更新该地层岩性预测模型的可学习参数。
基于上述各实施例提供的提升模型性能的方法,本申请实施例还提供一种地层岩性预测方法,该方法可以包括:
将对应于一地层的各目标测井曲线的值输入地层岩性预测模型,得到改地层的岩性预测结果。
其中,该地层岩性预测模型为采用上述任一实施例提供的提升模型性能的方法构建的目标地层岩性预测模型。
表4:每一类地层岩性的F-score
为证明本申请所提出的方法的有效性,采用F-score来衡量地层岩性预测模型的性能,其中,神经网络模型采用GRU模型。图3及图4展示了该地层岩性预测模型在数据上得到的交叉验证结果和测试结果。从图3中可以看到,页岩、煤层和硬石膏为少数样本,图4展示了模型整体性能,考虑了领域知识以后,模型的整体性能有一定的提升。从表4可以看到,结合领域知识(GRU_mu_0.01)的方法能提升模型预测煤、硬石膏以及页岩的能力,有效提升了模型的性能。
可以理解的是,本申请实施例仅展示了基于GRU模型得到的结果。由于领域知识是以额外损失函数项的方式跟机器学习算法结合,因此模型不局限于GRU模型。
下面对本申请实施例提供的提升模型性能的装置进行描述,下文描述的提升模型性能的装置与上文描述的提升模型性能的方法可相互对应参照。
请参见图5,本申请实施例提供的提升模型性能的装置,可以包括:
逻辑关系确定单元21,用于基于岩层的地球物理特性,确定各目标测井曲线之间的逻辑关系集;
样本标签确定单元22,用于基于所述逻辑关系集及训练样本所在地层的岩性,对训练样本进行标注,得到样本标签,所述训练样本为地层的各目标测井曲线的值;
损失函数构建单元23,用于结合基于概率分布度量的损失函数以及所述逻辑关系集,构建目标损失函数;
预测模型训练单元24,用于基于所述训练样本、所述样本标签及所述目标损失函数,对预设的地层岩性预测模型进行训练,得到目标地层岩性预测模型。
在本申请的一些实施例中,逻辑关系确定单元21基于岩层的地球物理特性,确定各目标测井曲线之间的逻辑关系集的过程,可以包括:
在本申请的一些实施例中,样本标签确定单元22基于所述逻辑关系集及训练样本所在地层的岩性,对训练样本进行标注,得到样本标签的过程,可以包括:
若训练样本所在地层的岩性为页岩,将所述训练样本的岩性标记为页岩,将所述训练样本的第一扩展标签项标记为1,将所述训练样本的第二扩展标签项标记为0,将所述训练样本的第三扩展标签项标记为0,将所述训练样本的第四扩展标签项标记为0;
若训练样本所在地层的岩性为煤,将所述训练样本的岩性标记为煤,将所述训练样本的第一扩展标签项标记为0,将所述训练样本的第二扩展标签项标记为1,将所述训练样本的第三扩展标签项标记为0,将所述训练样本的第四扩展标签项标记为0;
若训练样本所在地层的岩性为硬石膏,将所述训练样本的岩性标记为硬石膏,将所述训练样本的第一扩展标签项标记为0,将所述训练样本的第二扩展标签项标记为0,将所述训练样本的第三扩展标签项标记为1,将所述训练样本的第四扩展标签项标记为1;
若训练样本所在地层的岩性为除了煤、硬石膏以及页岩以外的其他岩性,将所述训练样本的岩性标记为相应的岩性,将所述训练样本的第一扩展标签项标记为0,将所述训练样本的第二扩展标签项标记为0,将所述训练样本的第三扩展标签项标记为0,将所述训练样本的第四扩展标签项标记为0;
其中,由训练样本的岩性及各扩展标签项构成样本标签。
在本申请的一些实施例中,所述基于概率分布度量的损失函数为二值交叉熵函数;损失函数构建单元23结合基于概率分布度量的损失函数以及所述逻辑关系集,构建目标损失函数的过程,可以包括:
基于所述逻辑关系集,构建多个约束项,所述约束项用于约束训练样本的岩性及各目标测井曲线的值;
利用乘积三角范数Product T-norm将每一约束项转化为损失函数项;
结合二值交叉熵函数及各损失函数项,构建目标损失函数。
在本申请的一些实施例中,所述多个约束项包括:
以及
在本申请的一些实施例中,损失函数构建单元23利用乘积三角范数Product T-norm将每一约束项转化为损失函数项的过程,可以包括:
将所述第二约束项转换为第二损失函数项:
将所述第四约束项转换为第四损失函数项:
在本申请的一些实施例中,损失函数构建单元23结合二值交叉熵函数及各损失函数项,构建目标损失函数的过程,可以包括:
将下述方程式确定为目标损失函数:
在本申请的一些实施例中,预测模型训练单元24基于所述训练样本、所述样本标签及所述目标损失函数,对预设的地层岩性预测模型进行训练的过程,可以包括:
将训练样本输入至地层岩性预测模型中,得到所述地层岩性预测模型的输出;
基于训练样本的样本标签以及所述目标损失函数,计算得到所述输出的损失值,并以所述损失值趋近于预设的损失阈值为目标,更新所述地层岩性预测模型的可学习参数。
本申请实施例提供的提升模型性能的装置可应用于提升模型性能的设备,如计算机等。可选的,图6示出了提升模型性能的设备的硬件结构框图,参照图6,提升模型性能的设备的硬件结构可以包括:至少一个处理器31,至少一个通信接口32,至少一个存储器33和至少一个通信总线34。
在本申请实施例中,处理器31、通信接口32、存储器33、通信总线34的数量为至少一个,且处理器31、通信接口32、存储器33通过通信总线34完成相互间的通信;
处理器31可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本申请实施例的一个或多个集成电路等;
存储器33可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory)等,例如至少一个磁盘存储器;
其中,存储器33存储有程序,处理器31可调用存储器33存储的程序,所述程序用于:
基于岩层的地球物理特性,确定各目标测井曲线之间的逻辑关系集;
基于所述逻辑关系集及训练样本所在地层的岩性,对训练样本进行标注,得到样本标签,所述训练样本为地层的各目标测井曲线的值;
结合基于概率分布度量的损失函数以及所述逻辑关系集,构建目标损失函数;
基于所述训练样本、所述样本标签及所述目标损失函数,对预设的地层岩性预测模型进行训练,得到目标地层岩性预测模型。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
本申请实施例还提供一种存储介质,该存储介质可存储有适于处理器执行的程序,所述程序用于:
基于岩层的地球物理特性,确定各目标测井曲线之间的逻辑关系集;
基于所述逻辑关系集及训练样本所在地层的岩性,对训练样本进行标注,得到样本标签,所述训练样本为地层的各目标测井曲线的值;
结合基于概率分布度量的损失函数以及所述逻辑关系集,构建目标损失函数;
基于所述训练样本、所述样本标签及所述目标损失函数,对预设的地层岩性预测模型进行训练,得到目标地层岩性预测模型。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
综上所述:
本申请首先基于岩层的地球物理特性,确定各目标测井曲线之间的逻辑关系集。其中,所述逻辑关系集包含了各目标测井曲线之间的约束关系。然后,基于所述逻辑关系集及训练样本所在地层的岩性,对训练样本进行标注,得到样本标签。其中,所述训练样本为地层的各目标测井曲线的值;所述样本标签不但包括训练样本的岩性,还包括描述各测井曲线关系的中间标注。接着,结合基于概率分布度量的损失函数以及所述逻辑关系集,构建目标损失函数。最后,基于所述训练样本、所述样本标签及所述目标损失函数,对预设的地层岩性预测模型进行训练,得到目标地层岩性预测模型。由于样本标签及目标损失函数均包含了各测井曲线的之间的约束关系,使得可以引导所述地层岩性预测模型识别出作为少数类的训练样本的岩性,降低了样本不均衡性对所述地层岩性预测模型性能的影响,提高了所述地层岩性预测模型预测的准确性,并且提高了所述地层岩性预测模型的可解释性。进一步地,领域知识以额外损失函数项的形式跟算法结合,可应用于多种模型结构,具有良好的普适性。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间可以根据需要进行组合,且相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (12)
1.一种提升模型性能的方法,其特征在于,包括:
基于岩层的地球物理特性,确定各目标测井曲线之间的逻辑关系集;
基于所述逻辑关系集及训练样本所在地层的岩性,对训练样本进行标注,得到样本标签,所述训练样本为地层的各目标测井曲线的值;
结合基于概率分布度量的损失函数以及所述逻辑关系集,构建目标损失函数;
基于所述训练样本、所述样本标签及所述目标损失函数,对预设的地层岩性预测模型进行训练,得到目标地层岩性预测模型。
3.根据权利要求2所述的方法,其特征在于,基于所述逻辑关系集及训练样本所在地层的岩性,对训练样本进行标注,得到样本标签的过程,包括:
若训练样本所在地层的岩性为页岩,将所述训练样本的岩性标记为页岩,将所述训练样本的第一扩展标签项标记为1,将所述训练样本的第二扩展标签项标记为0,将所述训练样本的第三扩展标签项标记为0,将所述训练样本的第四扩展标签项标记为0;
若训练样本所在地层的岩性为煤,将所述训练样本的岩性标记为煤,将所述训练样本的第一扩展标签项标记为0,将所述训练样本的第二扩展标签项标记为1,将所述训练样本的第三扩展标签项标记为0,将所述训练样本的第四扩展标签项标记为0;
若训练样本所在地层的岩性为硬石膏,将所述训练样本的岩性标记为硬石膏,将所述训练样本的第一扩展标签项标记为0,将所述训练样本的第二扩展标签项标记为0,将所述训练样本的第三扩展标签项标记为1,将所述训练样本的第四扩展标签项标记为1;
若训练样本所在地层的岩性为除了煤、硬石膏以及页岩以外的其他岩性,将所述训练样本的岩性标记为相应的岩性,将所述训练样本的第一扩展标签项标记为0,将所述训练样本的第二扩展标签项标记为0,将所述训练样本的第三扩展标签项标记为0,将所述训练样本的第四扩展标签项标记为0;
其中,由训练样本的岩性及各扩展标签项构成样本标签。
4.根据权利要求2所述的方法,其特征在于,所述基于概率分布度量的损失函数为二值交叉熵函数;结合基于概率分布度量的损失函数以及所述逻辑关系集,构建目标损失函数的过程,包括:
基于所述逻辑关系集,构建多个约束项,所述约束项用于约束训练样本的岩性及各目标测井曲线的值;
利用乘积三角范数Product T-norm将每一约束项转化为损失函数项;
结合二值交叉熵函数及各损失函数项,构建目标损失函数。
8.根据权利要求1所述的方法,其特征在于,基于所述训练样本、所述样本标签及所述目标损失函数,对预设的地层岩性预测模型进行训练的过程,包括:
将训练样本输入至地层岩性预测模型中,得到所述地层岩性预测模型的输出;
基于训练样本的样本标签以及所述目标损失函数,计算得到所述输出的损失值,并以所述损失值趋近于预设的损失阈值为目标,更新所述地层岩性预测模型的可学习参数。
9.一种提升模型性能的装置,其特征在于,包括:
逻辑关系确定单元,用于基于岩层的地球物理特性,确定各目标测井曲线之间的逻辑关系集;
样本标签确定单元,用于基于所述逻辑关系集及训练样本所在地层的岩性,对训练样本进行标注,得到样本标签,所述训练样本为地层的各目标测井曲线的值;
损失函数构建单元,用于结合基于概率分布度量的损失函数以及所述逻辑关系集,构建目标损失函数;
预测模型训练单元,用于基于所述训练样本、所述样本标签及所述目标损失函数,对预设的地层岩性预测模型进行训练,得到目标地层岩性预测模型。
10.一种提升模型性能的设备,其特征在于,包括:存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现如权利要求1~8中任一项所述的提升模型性能的方法的各个步骤。
11.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1~8中任一项所述的提升模型性能的方法的各个步骤。
12.一种地层岩性预测方法,其特征在于,包括:
将对应于一地层的各目标测井曲线的值输入目标地层岩性预测模型,得到所述地层的岩性预测结果;
其中,所述目标地层岩性预测模型为采用如权利要求1~8中任一项所述的提升模型性能的方法来构建的目标地层岩性预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211513656.4A CN115545357B (zh) | 2022-11-30 | 2022-11-30 | 一种提升模型性能的方法、地层岩性预测方法及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211513656.4A CN115545357B (zh) | 2022-11-30 | 2022-11-30 | 一种提升模型性能的方法、地层岩性预测方法及相关设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115545357A true CN115545357A (zh) | 2022-12-30 |
CN115545357B CN115545357B (zh) | 2023-04-07 |
Family
ID=84722489
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211513656.4A Active CN115545357B (zh) | 2022-11-30 | 2022-11-30 | 一种提升模型性能的方法、地层岩性预测方法及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115545357B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115879647A (zh) * | 2023-02-15 | 2023-03-31 | 深圳市峰和数智科技有限公司 | 一种基于领域知识与深度学习结合的地层岩性预测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6629086B1 (en) * | 1998-11-30 | 2003-09-30 | Institut Francais Du Petrole | Method for interpreting petroleum characteristics of geological sediments |
CN112990320A (zh) * | 2021-03-19 | 2021-06-18 | 中国矿业大学(北京) | 一种岩性的分类方法、装置、电子设备及存储介质 |
CN112989708A (zh) * | 2021-04-08 | 2021-06-18 | 重庆科技学院 | 一种基于lstm神经网络的测井岩性识别方法及*** |
CN113361638A (zh) * | 2021-07-01 | 2021-09-07 | 中国石油大学(北京) | 一种复杂储层岩性识别方法、装置、设备及存储介质 |
CN113792936A (zh) * | 2021-09-28 | 2021-12-14 | 中海石油(中国)有限公司 | 一种随钻岩性智能识别方法、***、设备和存储介质 |
-
2022
- 2022-11-30 CN CN202211513656.4A patent/CN115545357B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6629086B1 (en) * | 1998-11-30 | 2003-09-30 | Institut Francais Du Petrole | Method for interpreting petroleum characteristics of geological sediments |
CN112990320A (zh) * | 2021-03-19 | 2021-06-18 | 中国矿业大学(北京) | 一种岩性的分类方法、装置、电子设备及存储介质 |
CN112989708A (zh) * | 2021-04-08 | 2021-06-18 | 重庆科技学院 | 一种基于lstm神经网络的测井岩性识别方法及*** |
CN113361638A (zh) * | 2021-07-01 | 2021-09-07 | 中国石油大学(北京) | 一种复杂储层岩性识别方法、装置、设备及存储介质 |
CN113792936A (zh) * | 2021-09-28 | 2021-12-14 | 中海石油(中国)有限公司 | 一种随钻岩性智能识别方法、***、设备和存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115879647A (zh) * | 2023-02-15 | 2023-03-31 | 深圳市峰和数智科技有限公司 | 一种基于领域知识与深度学习结合的地层岩性预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115545357B (zh) | 2023-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bolandi et al. | Analyzing organic richness of source rocks from well log data by using SVM and ANN classifiers: a case study from the Kazhdumi formation, the Persian Gulf basin, offshore Iran | |
Al-Anazi et al. | On the capability of support vector machines to classify lithology from well logs | |
US11989829B2 (en) | Generating geological facies models with fidelity to the diversity and statistics of training images using improved generative adversarial networks | |
US11893495B2 (en) | Dual neural network architecture for determining epistemic and aleatoric uncertainties | |
US20220146705A1 (en) | Automated facies classification from well logs | |
CN115545357B (zh) | 一种提升模型性能的方法、地层岩性预测方法及相关设备 | |
Bhattacharya | A primer on machine learning in subsurface geosciences | |
Chaki et al. | A probabilistic neural network (PNN) based framework for lithology classification using seismic attributes | |
Xie et al. | Towards optimization of boosting models for formation lithology identification | |
Pratama | Machine learning: using optimized KNN (K-Nearest Neighbors) to predict the facies classifications | |
Amir et al. | Integration of petrophysical log data with computational intelligence for the development of a lithology predictor | |
Brown et al. | Machine learning on Crays to optimize petrophysical workflows in oil and gas exploration | |
Kheirollahi et al. | Robust estimation of shear wave velocity in a carbonate oil reservoir from conventional well logging data using machine learning algorithms | |
Noh et al. | Explainable deep learning for supervised seismic facies classification using intrinsic method | |
Ren et al. | Valuable data extraction for resistivity imaging logging interpretation | |
Chen et al. | A high-performance voting-based ensemble model of graph convolutional extreme learning machines for identifying geochemical anomalies related to mineralization | |
CN115879647B (zh) | 一种基于领域知识与深度学习结合的地层岩性预测方法 | |
Li et al. | A novel hybrid CNN–SVM method for lithology identification in shale reservoirs based on logging measurements | |
Sun et al. | Optimization of models for rapid identification of oil and water layers during drilling-a win-win strategy based on machine learning | |
Gu et al. | A smart predictor used for lithologies of tight sandstone reservoirs: a case study of member of Chang 4+ 5, Jiyuan Oilfield, Ordos Basin | |
Asedegbega et al. | Application of machine learniing for reservoir facies classification in port field, Offshore Niger Delta | |
Chikhi et al. | Hybrid neural network methods for lithology identification in the Algerian Sahara | |
Bütepage et al. | Gaussian process encoders: Vaes with reliable latent-space uncertainty | |
Al-Gharbi et al. | Evaluating the effectiveness of machine learning technologies in improving real-time drilling data quality | |
Kumar et al. | Applying Data Analytics & Machine Learning Methods for Recovery Factor Prediction and Uncertainty Modelling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |