CN117951509B - 一种矿物组成含量预测方法及预测*** - Google Patents
一种矿物组成含量预测方法及预测*** Download PDFInfo
- Publication number
- CN117951509B CN117951509B CN202410345654.1A CN202410345654A CN117951509B CN 117951509 B CN117951509 B CN 117951509B CN 202410345654 A CN202410345654 A CN 202410345654A CN 117951509 B CN117951509 B CN 117951509B
- Authority
- CN
- China
- Prior art keywords
- logging
- data
- neural network
- characteristic
- composition content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 229910052500 inorganic mineral Inorganic materials 0.000 title claims abstract description 102
- 239000011707 mineral Substances 0.000 title claims abstract description 102
- 238000000034 method Methods 0.000 title claims abstract description 75
- 239000000203 mixture Substances 0.000 title claims abstract description 72
- 239000011435 rock Substances 0.000 claims abstract description 64
- 238000003062 neural network model Methods 0.000 claims abstract description 41
- 230000004927 fusion Effects 0.000 claims abstract description 38
- 238000012549 training Methods 0.000 claims abstract description 27
- 238000007781 pre-processing Methods 0.000 claims abstract description 12
- 238000012847 principal component analysis method Methods 0.000 claims abstract description 11
- 238000013528 artificial neural network Methods 0.000 claims description 57
- 230000004044 response Effects 0.000 claims description 50
- 238000012545 processing Methods 0.000 claims description 23
- 238000004364 calculation method Methods 0.000 claims description 20
- 230000009467 reduction Effects 0.000 claims description 13
- 238000011156 evaluation Methods 0.000 claims description 10
- 230000004913 activation Effects 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 8
- 238000005457 optimization Methods 0.000 claims description 8
- 230000001186 cumulative effect Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 230000000306 recurrent effect Effects 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 5
- 238000005520 cutting process Methods 0.000 claims description 4
- 238000010219 correlation analysis Methods 0.000 claims description 3
- 230000000717 retained effect Effects 0.000 claims description 2
- 238000011161 development Methods 0.000 abstract description 5
- 230000006870 function Effects 0.000 description 30
- 239000010410 layer Substances 0.000 description 25
- 238000012360 testing method Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 7
- 238000000513 principal component analysis Methods 0.000 description 7
- 125000004122 cyclic group Chemical group 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 229910021532 Calcite Inorganic materials 0.000 description 2
- 239000004927 clay Substances 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 229910000514 dolomite Inorganic materials 0.000 description 2
- 239000010459 dolomite Substances 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000010433 feldspar Substances 0.000 description 2
- 239000010453 quartz Substances 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N silicon dioxide Inorganic materials O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000005518 electrochemistry Effects 0.000 description 1
- 238000001730 gamma-ray spectroscopy Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000003079 shale oil Substances 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/30—Assessment of water resources
Landscapes
- Geophysics And Detection Of Objects (AREA)
Abstract
本发明提供一种矿物组成含量预测方法及预测***,属于油气田勘探与开发领域,方法包括收集已测岩石矿物组成含量数据及对应深度预设范围内的测井数据和录井数据,并进行预处理;利用相关系数法和主成分分析法对特征进行选取和降维;而后构建多源融合数据集,并训练得到混合神经网络模型,自定义约束条件建立针对矿物含量预测的损失函数,最后利用混合神经网络模型预测矿物组成含量,本发明充分考虑了测井数据和录井数据与岩石矿物组成的相关性,根据矿物组成含量特征构建自定义损失函数,提高了预测的准确性,解决了地层岩心取样难、室内实验开展不便、岩石矿物含量数据不连续的缺陷。
Description
技术领域
本发明涉及油气田勘探与开发领域,尤其涉及一种矿物组成含量预测方法及预测***。
背景技术
在油气田勘探与开发过程中,岩石矿物含量对开展岩相类型、孔隙结构、力学性质、润湿性、脆性等研究具有重要意义。由于取心和测试成本高,目前多数油田仅在区块探井的关键层段开展岩样的XRD测试以获取岩石矿物含量。元素录井开展井次更广泛,可直接反映岩石中各类元素的含量;常规测井反映了地层岩石电学、声学、电化学、放射性等地球物理特性;使用多元回归等数学方法可利用元素录井数据或常规测井数据近似计算出矿物含量,但上述计算结果误差较大,参考作用有限,为提升岩石矿物组成含量预测的准确性。
因此,有必要提供一种矿物组成含量预测方法及预测***解决上述技术问题。
发明内容
为解决上述技术问题,本发明提供一种矿物组成含量预测方法及预测***,同时使用录井数据与测井数据,并构建混合神经网络模型,添加针对矿物含量预测的约束条件,实现精确度更高、连续性更好的岩石矿物组成含量预测。
本发明提供的一种矿物组成含量预测方法,预测方法包括以下步骤:
S1:获取并预处理已测岩石矿物组成含量数据,及其对应深度在预测范围内的测井数据和录井数据,其中,所述测井数据包括至少一个测井响应特征,所述录井数据包括至少一个元素特征;
S2:利用相关系数法获取所述测井数据的测井响应特征和所述录井数据的元素特征与矿物含量之间的相关性,并选择出高于预设的相关性阈值的测井响应特征和/或元素特征;
S3:利用主成分分析法对选择出的测井响应特征和/或元素特征进行降维处理,并基于累计贡献率筛选测井响应特征和/或元素特征;
S4:基于筛选后的测井响应特征和/或元素特征,以及已测岩石矿物组成含量数据构建多源融合数据集;
S5:基于BP神经网络和循环神经网络构建混合神经网络模型,并通过所述多源融合数据集训练所述混合神经网络模型,其中,所述多源融合数据集包括的元素特征作为BP神经网络的输入,多源融合数据集包括的测井响应特征作为循环神经网络的输入,已测岩石矿物组成含量数据同时作为BP神经网络和循环神经网络的输出;
S6:基于均方根误差、平均绝对误差和决定系数的评估指标衡量所述混合神经网络模型的预测结果,并根据预测结果优化所述混合神经网络模型;
S7:利用优化后的所述混合神经网络模型对未测的岩石矿物组成含量进行预测。
优选的,在步骤S1中:
测井响应特征包括地层各深度的纵波时差值、伽马测井值、自然电位测井值、电阻率测井值;
元素特征包括开展岩屑元素录井层段所获取的Na、Mg、Al、Si、K、Ca、Fe、P、S、Cl元素的含量;
预处理包括异常值去除和数据标准化处理,其中,数据标准化处理的公式为:
;
其中,为特征参数/>的第/>个数,/>为该特征参数所有数据的平均值,/>为该特征参数所有数据的标准差,/>为/>标准化后的值。
优选的,在步骤S2中,相关系数法采用Pearson相关系数法,具体计算公式为:
;
其中,为特征参数/>与标签/>之间的Pearson相关系数,/>为特征参数/>的数据个数,/>为特征参数/>的第/>个数,/>为标签数据/>的第/>个数。
优选的,在步骤S2中,相关系数法采用Spearman相关系数法,具体计算公式为:
;
其中,为特征参数/>与标签/>之间的Spearman相关系数,/>、/>分别是特征参数/>与标签/>第/>个取值的排序等级,/>、/>分别是特征参数/>与标签/>的平均排序等级。
优选的,在步骤S3中,累计贡献率的阈值为95%,测井响应特征和/或元素特征中大于95%累计贡献率的则保留,反之,则剔除。
优选的,步骤S5包括:
由BP神经网络输出第一结果;
由循环神经网络输出第二结果;
连接第一结果和第二结果,输出最终预测结果,并对最终预测结果进行约束,其中,约束的限制项公式为:
;
其中, 为限制项,/> 是输出项的数量即岩石矿物类型数量,/> 是样本的数量,/> 是 第/> 个样本的第/> 个输出项的预测值;
基于最终预测结果和MSE函数构建新的优化目标函数,其中,MSE函数的计算公式为:
;
其中,是第/>个样本的第/>个输出项的真实值;
新的优化目标函数的计算公式为:
。
优选的,步骤S5中,BP神经网络包括输入层、隐藏层和输出层,且输入层、隐藏层和输出层的输出计算公式为:
;
;
;
其中,为经过步骤S4处理后的录井数据的特征矩阵,/>、/>、/>为各层的权重矩阵,/>、/>、/>为各层的偏置参数,/>、/>为两个隐藏层的激活函数,/>为输出结果。
优选的,步骤S5中,循环神经网络采用GRU门循环单元,且GRU门循环单元的输出计算公式为:
;
;
;
;
其中,t为时间步,为步骤S4处理后的测井数据的特征矩阵,/>、/>分别是时间步t的重置门、更新门的输出结果,/>、/>分别是时间步t的候选隐藏状态、隐藏状态,/>是激活函数,/>、/>、/>、/>、/>、/>是权重参数,/>、/>、/>是偏置参数,/>是哈达玛乘积运算符。
一种矿物组成含量预测***,应用于上述一种矿物组成含量预测方法,包括:
数据获取模块,用于获取并预处理已测岩石矿物组成含量数据,及其对应深度在预测范围内的测井数据和录井数据,其中,所述测井数据包括至少一个测井响应特征,所述录井数据包括至少一个元素特征;
相关性分析模块,用于利用相关系数法获取所述测井数据的测井响应特征和所述录井数据的元素特征与矿物含量之间的相关性,并选择出高于预设的相关性阈值的测井响应特征和/或元素特征;
降维处理模块,用于利用主成分分析法对选择出的测井响应特征和/或元素特征进行降维处理,并基于累计贡献率筛选测井响应特征和/或元素特征;
数据集构建模块,用于基于筛选后的测井响应特征和/或元素特征,以及已测岩石矿物组成含量数据构建多源融合数据集;
混合模块构建模块,用于基于BP神经网络和循环神经网络构建混合神经网络模型,并通过所述多源融合数据集训练所述混合神经网络模型,其中,所述多源融合数据集包括的元素特征作为BP神经网络的输入,多源融合数据集包括的测井响应特征作为循环神经网络的输入,已测岩石矿物组成含量数据同时作为BP神经网络和循环神经网络的输出;
模型优化模块,基于均方根误差、平均绝对误差和决定系数的评估指标衡量所述混合神经网络模型的预测结果,并根据预测结果优化所述混合神经网络模型;
预测模块,用于利用优化后的所述混合神经网络模型对未测的岩石矿物组成含量进行预测。
与相关技术相比较,本发明提供的一种矿物组成含量预测方法及预测***具有如下有益效果:
本发明通过收集已测岩石矿物组成含量数据及对应深度预设范围内的测井数据和录井数据,并进行预处理;而后利用相关系数法和主成分分析法对特征进行选取和降维;接着构建多源融合数据集,并训练得到混合神经网络模型,自定义约束条件建立针对矿物含量预测的损失函数,最后利用混合神经网络模型预测矿物组成含量,本发明充分考虑了测井数据和录井数据与岩石矿物组成的相关性,根据矿物组成含量特征构建自定义损失函数,提高了预测的准确性,解决了地层岩心取样难、室内实验开展不便、岩石矿物含量数据不连续的缺陷,适用于油气勘探中具备常规测井和元素录井资料层段的各类岩石矿物含量的高精度定量预测。
附图说明
图1是本发明提供的一种矿物组成含量预测方法的流程示意图;
图2是一个含有两层隐藏层的BP神经网络的结构示意图;
图3是门循环单元GRU的结构示意图;
图4是本发明的混合神经网络模型示意图;
图5是本发明实施例中岩石矿物含量与特征参数之间的相关性图;
图6是本发明实施例中岩石矿物含量与降维后的特征参数之间的相关性图,图中“元素_1”表示录井数据降维后的第一个主成分;
图7是本发明实施例中训练过程损失函数和限制项C的变化图;
图8是本发明实施例中Hybrid(MSELoss)对照模型训练过程MSE损失函数和限制项C的变化图;
图9是本发明实施例中在A井3540m-3740m井段使用本发明所构建的方法预测各类矿物含量结果;
图10是本发明提供的一种矿物组成含量预测***的模块结构图。
具体实施方式
下面结合附图和实施方式对本发明做进一步说明。
实施例一
参考图1所示,本发明提供的一种矿物组成含量预测方法,预测方法包括以下步骤:
S1:获取并预处理已测岩石矿物组成含量数据,及其对应深度在预测范围内的测井数据和录井数据,其中,所述测井数据包括至少一个测井响应特征,所述录井数据包括至少一个元素特征。
在本实施例中,已测岩石矿物组成含量数据为岩样的XRD测试结果;测井数据中的测井响应特征包括地层各深度的纵波时差值(AC)、伽马测井值(GR、GRSL)、自然伽马能谱测井值(K、TH、U、KTH)、自然电位测井值(SP)、电阻率测井值(R25、RS、RD)等;录井数据中的元素特征为开展岩屑元素录井层段所获取的Na、Mg、Al、Si、K、Ca、Fe、P、S、Cl等元素的含量;预处理过程包括异常值去除和数据标准化处理。
具体的,预处理的数据标准化处理的公式为:
;
其中,为特征参数/>的第/>个数,/>为该特征参数所有数据的平均值,/>为该特征参数所有数据的标准差,/>为/>标准化后的值。
S2:利用相关系数法获取所述测井数据的测井响应特征和所述录井数据的元素特征与矿物含量之间的相关性,并选择出高于预设的相关性阈值的测井响应特征和/或元素特征。
在本实施例中,可以利用Pearson相关系数法或Spearman相关系数法判断测井数据和录井数据中各特征参数与矿物含量之间的相关性高低,排除相关性较低的特征参数,以便提高预测精度,其中,无论是正相关,还是负相关,只要是相关性较高,均需要保留。
其中,若采用Pearson相关系数法,则可以通过下式计算相关性;
;
其中,式中为特征参数/>与标签/>之间的Pearson相关系数,/>为特征参数/>的数据个数,/>为特征参数/>的第/>个数,/>为标签数据/>的第/>个数。
若采用Spearman相关系数法,则可以通过下式计算相关性;
;
其中,为特征参数/>与标签/>之间的Spearman相关系数,/>、/>分别是特征参数/>与标签/>第/>个取值的排序等级,/>、/>分别是特征参数/>与标签/>的平均排序等级。
在进行相关性判断后,有可能测井数据的各特征参数的相关性均为较强,有可能是部分较强,部分较低,也有可能是全部较低;同样的,录井数据中各特征参数的相关性均为较强,有可能是部分较强,部分较低,也有可能是全部较低,那么,选择出的高于预设的相关性阈值的各特征有可能全部是测井响应特征,有可能全部是元素特征,也有可能是测井响应特征和元素特征。
S3:利用主成分分析法对选择出的测井响应特征和/或元素特征进行降维处理,并基于累计贡献率筛选测井响应特征和/或元素特征。
在本实施例中,使用主成分分析法(PCA)分别应用于测井数据和录井数据,进行降维处理,并根据可接受的累计贡献率选择主成分数量,以便减少模型复杂度。
具体的,对经过相关性判断后的测井数据中的测井响应特征和录井数据的元素特征进行主成分分析(PCA),选择累计贡献率95%作为阈值截取能最大程度保留原始信息的主成分个数,以减少特征参数维度的同时最大限度保留数据信息。
S4:基于筛选后的测井响应特征和/或元素特征,以及已测岩石矿物组成含量数据构建多源融合数据集。
在本实施例中,将每个已测岩样对应深度的录井数据与该深度以上预设范围t内(如取t=5m)的所有测井数据作为特征,与该深度的岩石矿物含量数据组成一个样本,并重复该过程,最终构建含有录井数据和测井数据的多源数据的融合数据集。
具体的,在一个样本中,测井数据组成的特征值大小为Nt×NL,其中Nt为间隔t范围内所有测井点的数量,NL为测井曲线的数量,录井数据组成的特征值大小为1×NE,其中,NE为元素录井测试的元素数量,岩石矿物含量组成的标签值大小为1×NM,其中,NM为XRD测试的矿物种类数。
根据已有的岩石矿物含量数据量,重复该步骤多次,形成的特征值数据集大小分别为NS×Nt×NL、NS×NE,标签数据集大小为NS×NM,其中,NS为所有样本数量,NL、NE应使用经过相关性判断和降维处理的特征。
S5:基于BP神经网络和循环神经网络构建混合神经网络模型,并通过所述多源融合数据集训练所述混合神经网络模型,其中,所述多源融合数据集包括的元素特征作为BP神经网络的输入,多源融合数据集包括的测井响应特征作为循环神经网络的输入,已测岩石矿物组成含量数据同时作为BP神经网络和循环神经网络的输出。
在本实施例中,使用BP神经网络和循环神经网络(RNN)两种结构构建混合神经网络模型,分别用于接收输入的录井数据和测井数据;计算混合神经网络模型的预测结果与100%之间的误差,并与MSE函数共同构成新的优化目标函数(损失函数)。
在该步骤中,参考图2所示,BP神经网络由输入层、隐藏层和输出层组成,并用如下公式计算每层神经网络的输出:
;
;
;
其中,为经过步骤S4处理后的录井数据的特征矩阵,/>、/>、/>为各层的权重矩阵,/>、/>、/>为各层的偏置参数,/>、/>为两个隐藏层的激活函数,/>为输出结果。
参考图3所示,循环神经网络使用门控循环单元GRU,并利用如下公式计算门控循环单元GRU的输出:
;
;
;
;
其中,t为时间步,为步骤S4处理后的测井数据的特征矩阵,/>、/>分别是时间步t的重置门、更新门的输出结果,/>、/>分别是时间步t的候选隐藏状态、隐藏状态,/>是激活函数,/>、/>、/>、/>、/>、/>是权重参数,/>、/>、/>是偏置参数,/>是哈达玛乘积运算符。
使用近似“编码器-解码器”的方法连接BP神经网络和循环神经网络分别输出的第一结果和第二结果,并再次经过一层全连接层转换输出最终预测结果,参考图4所示,其为混合神经网络模型的示意图。
其中,全连接层使用ReLU激活函数,循环神经网络内部使用Sigmoid激活函数。
同时,根据矿物含量组成之和为100%的特征,对输出最终预测结果进行约束,建立下式所示的限制项:
;
其中,为限制项,/>是输出项的数量即岩石矿物类型数量,/>是样本的数量,/>是第/>个样本的第/>个输出项的预测值。
最后,计算MES函数,并求其与自定义的限制项之和得到新的目标函数(损失函数),其中,MES函数的计算公式为:
;
其中,是第/>个样本的第/>个输出项的真实值;
新的目标函数的计算公式为:
。
S6:基于均方根误差、平均绝对误差和决定系数的评估指标衡量所述混合神经网络模型的预测结果,并根据预测结果优化所述混合神经网络模型。
在本实施例中,均方根误差RMSE的计算公式为:
;
平均绝对误差MAE的计算公式为:
;
决定系数R2的计算公式为:
;
其中,是所有样本真实值的平均值,评估指标均方根误差RMSE和平均绝对误差MAE低者、决定系数R2高者为优。
S7:利用优化后的所述混合神经网络模型对未测的岩石矿物组成含量进行预测。
本发明提供的一种矿物组成含量预测方法的工作原理如下:本发明通过收集已测岩石矿物组成含量数据及对应深度预设范围内的测井数据和录井数据,并进行预处理;而后利用相关系数法和主成分分析法对特征进行选取和降维;接着构建多源融合数据集,并训练得到混合神经网络模型,自定义约束条件建立针对矿物含量预测的损失函数,最后利用混合神经网络模型预测矿物组成含量,本发明充分考虑了测井数据和录井数据与岩石矿物组成的相关性,根据矿物组成含量特征构建自定义损失函数,提高了预测的准确性,解决了地层岩心取样难、室内实验开展不便、岩石矿物含量数据不连续的缺陷,适用于油气勘探中具备常规测井和元素录井资料层段的各类岩石矿物含量的高精度定量预测。
实施例二
一种矿物组成含量预测***,参考图10所示,应用于上述一种矿物组成含量预测方法,包括:
数据获取模块100,用于获取并预处理已测岩石矿物组成含量数据,及其对应深度在预测范围内的测井数据和录井数据,其中,所述测井数据包括至少一个测井响应特征,所述录井数据包括至少一个元素特征。
相关性分析模块200,用于利用相关系数法获取所述测井数据的测井响应特征和所述录井数据的元素特征与矿物含量之间的相关性,并选择出高于预设的相关性阈值的测井响应特征和/或元素特征。
降维处理模块300,用于利用主成分分析法对选择出的测井响应特征和/或元素特征进行降维处理,并基于累计贡献率筛选测井响应特征和/或元素特征。
数据集构建模块400,用于基于筛选后的测井响应特征和/或元素特征,以及已测岩石矿物组成含量数据构建多源融合数据集。
混合模块构建模块500,用于基于BP神经网络和循环神经网络构建混合神经网络模型,并通过所述多源融合数据集训练所述混合神经网络模型,其中,所述多源融合数据集包括的元素特征作为BP神经网络的输入,多源融合数据集包括的测井响应特征作为循环神经网络的输入,已测岩石矿物组成含量数据同时作为BP神经网络和循环神经网络的输出。
模型优化模块600,基于均方根误差、平均绝对误差和决定系数的评估指标衡量所述混合神经网络模型的预测结果,并根据预测结果优化所述混合神经网络模型。
预测模块700,用于利用优化后的所述混合神经网络模型对未测的岩石矿物组成含量进行预测。
实施例三
以中国东部某页岩油井A井、B井的储层段为例
首先,收集研究区的已测岩石矿物组成含量数据及对应深度附近的测井数据和录井数据,并进行预处理;具体的,岩石矿物组成含量数据为岩样的XRD测试结果,包括粘土、石英、长石、白云石、方解石等矿物含量,如表1所示;测井数据包括地层各深度的纵波时差值(AC)、伽马测井值(GR、GRSL)、自然伽马能谱测井值(K、TH、U、KTH)、自然电位测井值(SP)、电阻率测井值(R25、RS、RD),如表2所示;录井数据为开展岩屑元素录井层段所获取的Na、Mg、Al、Si、P、S、Cl、K、Ca、Ti、V、Cr、Mn、Fe、Co、Ni、Cu、Zn、As、Rb、Sr、Y、Zr、Nb、W、Pb、Th、U等由XRF测试得到的元素含量,如表3所示。
表1部分地层层段岩石矿物含量测试结果
。
表2部分地层层段常规测井值
。
表3部分地层层段元素录井值
。
另外,本发明的岩石矿物组成含量预测方法中,还需要对收集到的测井、录井及矿物含量数据进行预处理,预处理包括异常值去除和数据标准化处理,其中,利用上述数据标准化公式对测井数据、元素录井数据中的每一项参数进行标准化。
其次,利用相关系数法和主成分分析法对特征参数进行选取和降维。
在实施例中,使用Spearman相关系数分别计算测井数据和录井数据与岩石矿物组成含量之间的相关性,结果如图5所示,选择正、负相关性较强的参数作为特征参数,本实施例中排除了元素录井中Ni、As、Zr、Nb、W、Pb等相关性较弱的参数。
在本实施例中,使用主成分分析方法PCA对选择出的参数进行降维处理,选择累计贡献率95%作为阈值截取能最大程度保留原始信息的主成分个数,PCA方法分别独立作用在测井数据和录井数据上;在应用PCA方法后,录井数据的参数由原始的22个降至13个主成分、测井数据的参数由原来的11个降至6个主成分,将降维后的数据再次进行Spearman相关性判断,如图6所示,可见信息浓缩、靠前的主成分相关性增强。
接着,基于测井数据和录井数据构建多源融合数据集,并划分用于机器学习的训练集、测试集。
在本实施例中,将每个已测岩样对应深度的元素录井数据与该深度以上t=5m范围内的所有测井数据作为特征,与该深度的岩石矿物含量数据组成一个样本,重复该过程,构建多源数据的融合数据集,例如,对于3680.3m深度处的岩样,选择表1中3680.3m深度的数据为标签,选择表2中3675.3m-3680.3m范围内的数据作为测井特征参数,选择表3中3680.3m深度的数据为元素录井特征参数,由此组成一个样本。
在本实施例中,根据收集的岩石矿物组成数据,构建了包含249个样本的多源数据融合数据集。
在本实施例中,按照8:2的比例将249个样本的数据集划分成训练集、测试集两个数据集,分别包含199个和50个样本,其中,训练集用于训练和调整模型参数,测试集不在训练过程中出现,仅用于最终评估模型性能。
再接着,构建针对多源融合数据集的混合神经网络模型,自定义约束条件建立针对矿物含量预测的损失函数。
在本实施例中,测井特征参数输入到含有1个双向GRU单元的编码器结构,隐藏单元数为32,输出记为hidden_1;元素录井特征参数输入到包含1个隐藏层的解码器结构(BP神经网络),隐藏单元数为16,经ReLU激活函数后输出,记为hidden_2;hidden_1与hidden_2组合后再经两个隐藏层,隐藏单元数分别为16、8,最终输出粘土、石英、长石、方解石、白云石共5个预测结果。
在本实施例中,使用上述自定义损失函数作为模型训练的优化目标函数,并在训练过程监测限制项C的变化,如图7所示。
在本实施例中,训练步数500步、学习率0.001。
再接着,根据均方根误差RMSE、平均绝对误差MAE、决定系数R2等评估指标衡量模型的预测效果。
在本发明实施例中,为进一步说明本发明多源融合数据及混合模型结构对岩石矿物组成含量预测精度的提升,使用了两个简单的模型预测结果作为对比:一是仅用BP神经网络模型对元素录井数据进行训练,模型结构为输入层、两层隐藏层、输出层,各层神经元数分别为13、16、8、5;二是仅用循环神经网络GRU模型对测井数据进行训练,设置为单层、双向、32个隐藏单元。
在本实施例中,为进一步说明本发明自定义损失函数对岩石矿物组成含量预测精度的提升,使用与本发明相同混合神经网络结构,不同损失函数(MSELoss),在相同的多源融合数据集上进行训练,并在训练过程中单独计算每一时间步限制项C的值;需要说明的是对照模型本不包括对限制项C的计算,为获得C的值需在模型循环迭代时单独添加一项计算步记录C的变化,这种设置不会对对照模型的性能产生影响;对照模型在训练集上损失函数MSELoss和限制项C的变化,如图8所示。
在本实施例中,本发明的模型与上述三个对照模型在测试集上的预测评估效果如表4所示,表4中Hybrid表示本发明的混合神经网络模型及多源融合数据集,为使用本发明的自定义损失函数训练,MSELoss为使用常规的MSE损失函数训练。
表4三种模型在测试集上对各类岩石矿物组成含量的预测评估效果
。
在本实施例中,如表4所示本发明的矿物组成含量预测方法,在训练集上预测效果优于仅用元素录井数据训练的BP-ANN模型、优于仅用常规测井数据训练的GRU模型、优于使用常规损失函数MSELoss的混合神经网络。
在本实施例中,如图7所示,限制项C在训练开始的前50步迅速降至1以下,表明限制项C是前期总损失中的主要贡献者,最终限制项C在0.3上下波动,说明5个预测值之和与100的误差仅有0.55左右(0.3的二次方根)。
在本实施例中,如图8所示,对照模型的限制项C尽管在训练初期开始下降,但最低降至6左右,甚至随着训练进行,该值还略有上升。
在本实施例中,基于构建测录井融合数据集方法,以收集到的元素录井数据深度为参考,在A井3540m-3740m井深共形成261个样本,其中148个样本有岩石矿物含量标签,之中90个带标签样本参与了训练;使用本发明所构建的模型对全部样本进行预测,得到各矿物含量的预测值,并连成曲线,如图9所示。图中“train_set”“test_set”分别表示训练集和测试集样本,“pred_CLoss”表示本发明构建的混合神经网络模型预测效果。
本申请是参照根据本申请实施例的方法、设备(***)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框,以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一种计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器,或者能够用于携带或存储数据的计算机可读的任何其他介质。
还需要说明的是,术语“包括”“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
Claims (9)
1.一种矿物组成含量预测方法,其特征在于,预测方法包括以下步骤:
S1:获取并预处理已测岩石矿物组成含量数据,及其对应深度在预测范围内的测井数据和录井数据,其中,所述测井数据包括至少一个测井响应特征,所述录井数据包括至少一个元素特征;
S2:利用相关系数法获取所述测井数据的测井响应特征和所述录井数据的元素特征与矿物含量之间的相关性,并选择出高于预设的相关性阈值的测井响应特征和/或元素特征;
S3:利用主成分分析法对选择出的测井响应特征和/或元素特征进行降维处理,并基于累计贡献率筛选测井响应特征和/或元素特征;
S4:基于筛选后的测井响应特征和/或元素特征,以及已测岩石矿物组成含量数据构建多源融合数据集;
S5:基于BP神经网络和循环神经网络构建混合神经网络模型,并通过所述多源融合数据集训练所述混合神经网络模型,其中,所述多源融合数据集包括的元素特征作为BP神经网络的输入,并由BP神经网络输出hidden_2,多源融合数据集包括的测井响应特征作为循环神经网络的输入,并由循环神经网络输出hidden_1,再将hidden_1与hidden_2组合后经两个隐藏层,以输出岩石矿物组成含量的预测结果;
S6:基于均方根误差、平均绝对误差和决定系数的评估指标衡量所述混合神经网络模型的预测结果,并根据预测结果优化所述混合神经网络模型;
S7:利用优化后的所述混合神经网络模型对未测的岩石矿物组成含量进行预测。
2.根据权利要求1所述的一种矿物组成含量预测方法,其特征在于,在步骤S1中:
测井响应特征包括地层各深度的纵波时差值、伽马测井值、自然电位测井值、电阻率测井值;
元素特征包括开展岩屑元素录井层段所获取的Na、Mg、Al、Si、K、Ca、Fe、P、S、Cl元素的含量;
预处理包括异常值去除和数据标准化处理,其中,数据标准化处理的公式为:
;
其中,为特征参数/>的第/>个数,/>为该特征参数所有数据的平均值,/>为该特征参数所有数据的标准差,/>为/>标准化后的值。
3.根据权利要求2所述的一种矿物组成含量预测方法,其特征在于,在步骤S2中,相关系数法采用Pearson相关系数法,具体计算公式为:
;
其中,为特征参数/>与标签/>之间的Pearson相关系数,/>为特征参数/>的数据个数,/>为特征参数/>的第/>个数,/>为标签数据/>的第/>个数。
4.根据权利要求2所述的一种矿物组成含量预测方法,其特征在于,在步骤S2中,相关系数法采用Spearman相关系数法,具体计算公式为:
;
其中,为特征参数/>与标签/>之间的Spearman相关系数,/>、/>分别是特征参数/>与标签第/>个取值的排序等级,/>、/>分别是特征参数/>与标签/>的平均排序等级。
5.根据权利要求2所述的一种矿物组成含量预测方法,其特征在于,在步骤S3中,累计贡献率的阈值为95%,测井响应特征和/或元素特征中大于95%累计贡献率的则保留,反之,则剔除。
6.根据权利要求5所述的一种矿物组成含量预测方法,其特征在于,步骤S5包括:
由BP神经网络输出第一结果;
由循环神经网络输出第二结果;
连接第一结果和第二结果,输出最终预测结果,并对最终预测结果进行约束,其中,约束的限制项公式为:
;
其中,为限制项,/>是输出项的数量即岩石矿物类型数量,/>是样本的数量,/>是第/>个样本的第/>个输出项的预测值;
基于最终预测结果和MSE函数构建新的优化目标函数,其中,MSE函数的计算公式为:
;
其中,是第/>个样本的第/>个输出项的真实值;
新的优化目标函数的计算公式为:
。
7.根据权利要求6所述的一种矿物组成含量预测方法,其特征在于,步骤S5中,BP神经网络包括输入层、隐藏层和输出层,且输入层、隐藏层和输出层的输出计算公式为:
;
;
;
其中,为经过步骤S4处理后的录井数据的特征矩阵,/>、/>、/>为各层的权重矩阵,/>、/>、/>为各层的偏置参数,/>、/>为两个隐藏层的激活函数,/>为输出结果。
8.根据权利要求7所述的一种矿物组成含量预测方法,其特征在于,步骤S5中,循环神经网络采用GRU门循环单元,且GRU门循环单元的输出计算公式为:
;
;
;
;
其中,t为时间步,为步骤S4处理后的测井数据的特征矩阵,/>、/>分别是时间步t的重置门、更新门的输出结果,/>、/>分别是时间步t的候选隐藏状态、隐藏状态,/>是激活函数,、/>、/>、/>、/>、/>是权重参数,/>、/>、/>是偏置参数,/>是哈达玛乘积运算符。
9.一种矿物组成含量预测***,其特征在于,应用于上述权利要求1-8任意一项所述的一种矿物组成含量预测方法,包括:
数据获取模块,用于获取并预处理已测岩石矿物组成含量数据,及其对应深度在预测范围内的测井数据和录井数据,其中,所述测井数据包括至少一个测井响应特征,所述录井数据包括至少一个元素特征;
相关性分析模块,用于利用相关系数法获取所述测井数据的测井响应特征和所述录井数据的元素特征与矿物含量之间的相关性,并选择出高于预设的相关性阈值的测井响应特征和/或元素特征;
降维处理模块,用于利用主成分分析法对选择出的测井响应特征和/或元素特征进行降维处理,并基于累计贡献率筛选测井响应特征和/或元素特征;
数据集构建模块,用于基于筛选后的测井响应特征和/或元素特征,以及已测岩石矿物组成含量数据构建多源融合数据集;
混合模块构建模块,用于基于BP神经网络和循环神经网络构建混合神经网络模型,并通过所述多源融合数据集训练所述混合神经网络模型,其中,所述多源融合数据集包括的元素特征作为BP神经网络的输入,并由BP神经网络输出hidden_2,多源融合数据集包括的测井响应特征作为循环神经网络的输入,并由循环神经网络输出hidden_1,再将hidden_1与hidden_2组合后经两个隐藏层,以输出岩石矿物组成含量的预测结果;
模型优化模块,基于均方根误差、平均绝对误差和决定系数的评估指标衡量所述混合神经网络模型的预测结果,并根据预测结果优化所述混合神经网络模型;
预测模块,用于利用优化后的所述混合神经网络模型对未测的岩石矿物组成含量进行预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410345654.1A CN117951509B (zh) | 2024-03-26 | 2024-03-26 | 一种矿物组成含量预测方法及预测*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410345654.1A CN117951509B (zh) | 2024-03-26 | 2024-03-26 | 一种矿物组成含量预测方法及预测*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117951509A CN117951509A (zh) | 2024-04-30 |
CN117951509B true CN117951509B (zh) | 2024-05-31 |
Family
ID=90794472
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410345654.1A Active CN117951509B (zh) | 2024-03-26 | 2024-03-26 | 一种矿物组成含量预测方法及预测*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117951509B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110399649A (zh) * | 2019-07-03 | 2019-11-01 | 中国石油天然气集团有限公司 | 一种基于成岩指示元素的变质岩量化识别方法 |
CN113202461A (zh) * | 2020-12-03 | 2021-08-03 | 中国石油天然气集团有限公司 | 基于神经网络识别岩性的方法和装置 |
WO2022095534A1 (zh) * | 2020-11-03 | 2022-05-12 | 西安西热锅炉环保工程有限公司 | 一种预测火电厂氨逃逸的方法 |
CN114991757A (zh) * | 2022-06-08 | 2022-09-02 | 中国石油天然气股份有限公司 | 一种随钻地层压力测录一体化监测方法及*** |
-
2024
- 2024-03-26 CN CN202410345654.1A patent/CN117951509B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110399649A (zh) * | 2019-07-03 | 2019-11-01 | 中国石油天然气集团有限公司 | 一种基于成岩指示元素的变质岩量化识别方法 |
WO2022095534A1 (zh) * | 2020-11-03 | 2022-05-12 | 西安西热锅炉环保工程有限公司 | 一种预测火电厂氨逃逸的方法 |
CN113202461A (zh) * | 2020-12-03 | 2021-08-03 | 中国石油天然气集团有限公司 | 基于神经网络识别岩性的方法和装置 |
CN114991757A (zh) * | 2022-06-08 | 2022-09-02 | 中国石油天然气股份有限公司 | 一种随钻地层压力测录一体化监测方法及*** |
Non-Patent Citations (2)
Title |
---|
基于循环神经网络的单站能见度短临预报试验;李昕蓓;张苏平;衣立;韩美;潘宁;;海洋气象学报;20190515(02);全文 * |
多尺度时频空三域特征联合下的储层岩性识别方法;王宗仁;《物探与化探》;20230228;第47卷(第1期);81-90页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117951509A (zh) | 2024-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Shi et al. | Application of extreme learning machine and neural networks in total organic carbon content prediction in organic shale with wire line logs | |
Alnahwi et al. | Mineralogical composition and total organic carbon quantification using x-ray fluorescence data from the Upper Cretaceous Eagle Ford Group in southern Texas | |
AU2005279829B2 (en) | Improving the accuracy of shaly sand formation evaluation | |
CN109800954B (zh) | 基于测井数据的储层评价方法 | |
CN111027882A (zh) | 一种基于高阶神经网络利用常规测井资料评价脆性指数的方法 | |
CN113837501B (zh) | 基于图神经网络的页岩总有机碳预测方法、***和设备 | |
CN113344050A (zh) | 一种基于深度学习的岩性智能化识别方法及*** | |
US11796714B2 (en) | Determination of mechanical properties of a geological formation using deep learning applied to data acquired while drilling | |
CN113610945A (zh) | 一种基于混合神经网络的地应力曲线预测方法 | |
CN111199107A (zh) | 三角洲相砂岩圈闭评价新方法 | |
CN104598705B (zh) | 用于识别地下物质层的方法和装置 | |
CN110671092A (zh) | 油气产能检测方法及*** | |
CN117272841B (zh) | 一种基于混合神经网络的页岩气甜点预测方法 | |
Larson et al. | Machine learning classification of Austin Chalk chemofacies from high-resolution x-ray fluorescence core characterization | |
CN117951509B (zh) | 一种矿物组成含量预测方法及预测*** | |
CN117251802A (zh) | 一种基于迁移学习的非均质储层参数预测方法及*** | |
Anifowose et al. | Contributions of machine learning to quantitative and real-time mud gas data analysis: A critical review | |
CN117093922A (zh) | 一种基于改进svm的不平衡样本油藏复杂流体识别方法 | |
CN114076776A (zh) | 一种泥页岩有机碳含量的预测方法和应用 | |
CN114075973B (zh) | 地层元素测井曲线重构方法及装置 | |
CN117174203B (zh) | 用于砂岩铀矿的测井曲线响应分析方法 | |
Soto B et al. | Use of Neural Networks to Predict the Permeability and Porosity of Zone" C" of the Cantagallo Field in Colombia | |
Mezghani et al. | Digital Sedimentological Core Description Through Machine Learning | |
Daniel | Machine learning for pay zone identification in the Smørbukk field using well logs and XRF data | |
Pirrone et al. | CCUS in Mature Fields: How Core-to-Log Data-Driven Analytics Enhances Mechanistic Models for the Purpose of Reservoir and Caprock Mineralogical Characterization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |