CN115330007A - 基于深度融合模型的储层多分类预测方法 - Google Patents

基于深度融合模型的储层多分类预测方法 Download PDF

Info

Publication number
CN115330007A
CN115330007A CN202110509149.2A CN202110509149A CN115330007A CN 115330007 A CN115330007 A CN 115330007A CN 202110509149 A CN202110509149 A CN 202110509149A CN 115330007 A CN115330007 A CN 115330007A
Authority
CN
China
Prior art keywords
feature
reservoir
data
depth
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110509149.2A
Other languages
English (en)
Inventor
朱剑兵
王兴谋
冯德永
江洁
李长红
宫红波
贺洋洋
杨景楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Petroleum and Chemical Corp
Geophysical Research Institute of Sinopec Shengli Oilfield Co
Original Assignee
China Petroleum and Chemical Corp
Geophysical Research Institute of Sinopec Shengli Oilfield Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Petroleum and Chemical Corp, Geophysical Research Institute of Sinopec Shengli Oilfield Co filed Critical China Petroleum and Chemical Corp
Priority to CN202110509149.2A priority Critical patent/CN115330007A/zh
Publication of CN115330007A publication Critical patent/CN115330007A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Mathematical Physics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Biomedical Technology (AREA)
  • Agronomy & Crop Science (AREA)
  • Animal Husbandry (AREA)
  • Molecular Biology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Geophysics And Detection Of Objects (AREA)
  • Biophysics (AREA)
  • Quality & Reliability (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Mining & Mineral Resources (AREA)
  • Primary Health Care (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Computational Linguistics (AREA)

Abstract

本发明提供一种基于深度融合模型的储层多分类预测方法,包括:步骤1:获取井震数据并进行预处理;步骤2:通过特征优选算法获得更能代表储层特征的属性输入模型;步骤3:通过卷积神经网络进行横向切片特征学习;步骤4:设计时序特征并输入到循环神经网络分支进行预测;步骤5:将深度特征数据输入到深度特征网络中进行训练;步骤6:使用特征交叉方式进行自动特征工程计算;步骤7:进行多分类储层预测,获得储层预测结果。该基于深度融合模型的储层多分类预测方法能够快速的进行地震多特征的储层预测,解决了由于地质构造的复杂性以及地震数据特征多样性和冗余性而导致的储层预测难度大,准确率低,耗费人力和资源过多的问题。

Description

基于深度融合模型的储层多分类预测方法
技术领域
本发明涉及地球物理勘探地震解释与深度学习技术领域的应用技术领域,特别是涉及到一种基于深度融合模型的储层多分类预测方法。
背景技术
当前,地震属性分析法是储层预测中利用地震纵波数据的进行预测的重要方法,现今经过多方验证并且得到广泛认可与应用的地震方向特征属性已经达60多种,其中较为常见的地震属性有振幅、频率、时间、相位、地震波与地震反射波的吸收衰减等等。这60多种地震属性又可以与几何、统计方向数据进行叠加评价,再加上综合以及衍生的地震属性如何成功有效地管理这多达上百种的不同地震属性并科学合理地提取有效参数是进行地质储层预测的核心分析技术。然而,当前的技术在数据整合,参数分析方面主要通过传统的波形分析和属性优选等传统方法进行,在特征量巨大的油气储层预测场景中存在普适性差,耗时长,准确度偏低等缺点。
在申请号:CN202010830939.6的中国专利申请中,涉及到涉及一种多模型融合的储层预测***,包括:数据获取模块、提升树模型、模型调用模块、多模多专家深度网络;一种储层预测方法,包括如下步骤:步骤一、提取目标层段数据;步骤二、获取特征重要性排名;步骤三、对重要性排名靠前的特征进行切片,作为横向原始特征输入非对称卷积模块;对地震体垂向层级特征进行建模,作为纵向原始特征输入到双向门控循环单元;对地震体深度信息进行建模,作为深度特征输入到嵌入层;步骤四、特征融合,再输入到全连接神经网络,最终输出储层预测的分类结果。
在申请号:CN202010280776.9的中国专利申请中,涉及到一种油气储层渗透率预测模型的构建方法及其应用,方法包括获取待测油井目标样本集和辅助油井辅助样本集;从辅助样本集选出多个样本构成分类训练样本集,结合目标样本集二类训练分类器;采用训练的分类器生成辅助样本集中各样本与待测油井相关性大小以作为该样本初始权重,从辅助样本集中确定初始权重大于过滤阈值的多个样本构成辅助训练样本集;调整该多个样本初始权重使得各样本权重加和不大于目标样本集中各样本权重加和;基于目标样本集、辅助训练样本集以及各样本权重训练渗透率预测模型。
在申请号:CN201810069113.5的中国专利申请中,涉及到一种少井条件下的储层预测方法,包括以下步骤:获取勘探目标的测井数据和地震数据,对勘探目标的地震数据进行三维解释追踪,获得勘探目标的地质层位解释结果;定性划分勘探目标的典型测线地震相;定量划分勘探目标的三维地震数据体的地震相;对定量划分的勘探目标三维地震数据体的地震相进行沉积相解释,得到勘探目标宏观上的储层展布趋势认识;确定能够反映储层特征的储层敏感参数的种类及储层对应的能够反映储层特征的储层敏感参数的数值范围;计算能够反映储层特征的储层敏感参数的值;提取储层敏感参数属性平面图;在储层敏感参数属性平面图中重新划定储层对应的能够反映储层特征的储层敏感参数的数值范围,进而预测储层分布规律。
以上现有技术均与本发明有较大区别,未能解决我们想要解决的技术问题,为此我们发明了一种新的基于深度融合模型的储层多分类预测方法。
发明内容
本发明的目的是提供一种能够快速的进行地震多特征的储层预测。的基于深度融合模型的储层多分类预测方法。
本发明的目的可通过如下技术措施来实现:基于深度融合模型的储层多分类预测方法,该基于深度融合模型的储层多分类预测方法包括:
步骤1:获取井震数据并进行预处理;
步骤2:通过特征优选算法获得更能代表储层特征的属性输入模型;
步骤3:通过卷积神经网络进行横向切片特征学习;
步骤4:设计时序特征并输入到循环神经网络分支进行预测;
步骤5:将深度特征数据输入到深度特征网络中进行训练;
步骤6:使用特征交叉方式进行自动特征工程计算;
步骤7:进行多分类储层预测,获得储层预测结果。
本发明的目的还可通过如下技术措施来实现:
在步骤1中,将地震处理后的叠后地震数据以及相关解释文件进行预处理,将整个地震体处理成一个三维矩阵,由线号、道号以及时间维度构成;在生成了地震体特征文件后,用时深关系转化的方法将其对应的储层标记数据由深度转化为时间维度。
在步骤1中,根据现场工程师在勘探过程中记录的每个勘测点的时间和深度对应关系,建立一个线性模型去拟合一个时间-深度的转化函数,根据该模型拟合的线性方程将数据中的所有时间参数转换为深度。
在步骤2中,利用xgboost模型进行计算,按照时序顺序分别输入每个步骤1中特征文件的点位值和标记,其中每个特征文件对应了一个提升树,通过设计的损失函数对模型进行拟合学习,最终确定参数并得到排序特征向量,获得特征重要性排名。
在步骤2中,先将所有特征文件表示为数据集D,然后使用k个提升树模型进行xgboost排序训练;在进行xgboost模型计算时,按照时序顺序分别输入每个特征文件的点位值和标记即储层或者非储层,其中每个特征文件对应了一个提升树,通过设计的损失函数对模型进行拟合学习,最终确定参数并得到排序特征向量,获得特征重要性排名;然后对排名靠前的特征数据进行横向切片、垂向切片、深度点位特征和采样点统计特征进行生成。
在步骤3中,设计卷积神经网络模块进行横向特征的提取,通常地质体在横向上的展布范围要比垂向上的大得多,使用14×14的网格地震数据水平切片作为输入数据,利用卷积神经网络提取更高维度的特征,横向特征提取能够抽取得到更多的有效特征。
在步骤3中,该卷积神经网络包括3个卷积层、2个池化层和一个全连接层,全连接层的长度为64个,激活函数为relu。
步骤4中,通过双向门控循环单元来对地震体的垂向层级特征进行提取,双向门控循环单元采用上下5个采样点作为输入,结果拼接作为输出。
步骤5中,获取所有井位点的训练数据,并将每一个点的深度转化到(1,n)的序列中,n为地震数据的采样点个数,通过逐个编码的形式将深度信息转化为n维向量d,再初始化一个特征嵌入权重w,将深度特征从高维度转化为低维度,然后输入到融合模块中进行储层分类预测。
在步骤6中,对多个特征进行特征交叉计算,使用特征交叉公式对所有的特征进行线性计算相加和二阶组合计算并相加。
在步骤7中,对上述卷积神经网络分支和循环神经网络分支的输出向量进行多种方式融合;将步骤3、4、5、6得到特征向量进行拼接,获得融合特征向量,然后通过全连接层进行进一步特征计算,最后接入多分类器获得储层预测结果。
本发明中的基于深度融合模型的储层多分类预测方法,首先基于地震处理后的叠后地震数据以及地震解释研究人员提供的岩性标记和层位解释文件进行数据预处理,将有标记的区域点位特征数据进行处理并向量化,使之与相应的标签组成样本数据。通过xgboost模型对井震特征数据进行特征工程,提取重要性靠前的井震特征数据。然后设计一个深度融合模型将井震数据的横向维度特征、垂向维度特征、深度特征以及采样点统计特征分别输入网络分支,再讲各个分支网络的输出进行融合,获得井震融合特征。最后实现一个基于井震数据对相应点位进行储层预测的深度学习模型。该基于深度融合模型的储层多分类预测方法,通过多类别多维度特征石油勘探原始数据,经过数据预处理,特征工程,利用融合深度模型进行学习,将深度学习技术应用到石油勘探领域,解决了由于地质构造的复杂性以及地震数据特征多样性和冗余性而导致的储层预测难度大,准确率低,耗费人力和资源过多的问题。
附图说明
图1为本发明的一具体实施例中井震数据多类别划分图;
图2为本发明的一具体实施例中融合模型结构图;
图3为本发明的一具体实施例中储层油水分类效果图;
图4为本发明的基于深度融合模型的储层多分类预测方法的一具体实施例的流程图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作和/或它们的组合。
在应用本发明的一具体实施例1中,如图4所示,图4为本发明的基于深度融合模型的储层多分类预测方法的流程图。该基于深度融合模型的储层多分类预测方法包括了以下步骤:
步骤1:井震数据的获取和预处理。
本方法使用的数据为某地区的地震资料数据以及相关解释文件,包括件岩石属性文件、油气属性文件以及时深关系文件。另外,地质勘探专家也为我们提供一份基于专家经验和传统储层分析方法得到的储层厚度相关性文件。通过构建一个三维立体空间的方法,每个特征的地震体文件存储结构相同,并且按照字节进行存储。每个特征的地震体文件包括一个3600个字节的文件头,以及若干个字节的道数据。整个地震体是一个三维地震体,由线号(line)、道号(cdp)以及时间(time)维度构成,每个线上有1614个道,每个道上有1251个时间点数据。在生成了地震体特征文件后,本方法使用时深关系转化的方法将储层数据由深度转化为时间维度,根据现场工程师在勘探过程中记录的每个勘测点的时间和深度对应关系,建立一个线性模型去拟合一个时间-深度的转化函数。根据该模型拟合的线性方程将数据中的所有时间参数转换为深度,以方便后面的模型计算。获得的深度信息为一个长度为1251的序列,每一个测试点的深度在(0,1251)这个区间之内。
步骤2:经过预处理后我们已经获得各个特征对应的井震数据,由于特征数据有201个,数量较多且有相关性和冗余性,要对这些特征进行优化和排序,通过特征优选算法获得更能代表储层特征的属性输入模型,通过对特征数据通过我们设计的特征融合方法进行拼接和融合,加强相关性挖掘。首先将所有特征文件存储进并表示为数据集D,然后使用k个提升树模型进行xgboost排序训练。在进行xgboost模型计算时,按照时序顺序分别输入每个特征文件的点位值和标记(储层或者非储层),其中每个特征文件对应了一个提升树,通过设计的损失函数对模型进行拟合学习,最终确定参数并得到排序特征向量,获得特征重要性排名。然后对排名靠前的特征数据进行横向切片、垂向切片、深度点位特征和采样点统计特征进行生成。
步骤3:设计卷积神经网络模块,通常地质体在横向上的展布范围要比垂向上的大得多,本方法使用14×14的网格地震数据水平切片作为输入数据,利用卷积神经网络提取更高维度的特征,横向特征提取能够抽取得到更多的有效特征。
进一步,该卷积神经网络包括3个卷积层、2个池化层和一个全连接层,全连接层的长度为64个,激活函数为relu。
步骤4:设计时序特征并输入到循环神经网络分支进行预测。沉积储层具有横向分布规律不明显、垂向粒级递变层理和沉积回旋性特性。对于这种横向分布规律不明显,所述的单一横向特征提取模块不能够很好的抽取此类特征,而双向循环神经网络擅长处理这种层级关系序列数据,且能考虑上下关系,本方法通过双向门控循环单元(BiGRU)来对地震体的垂向层级特征进行提取,增强模型处理不同特点的地质结构能力,也能够提高模型的预测能力。
进一步,双向门控循环单元采用上下5个采样点作为输入,结果拼接作为输出。
步骤5:设计深度特征模块并输入到深度神经网络中进行训练。
进一步,获取所有井位点的训练数据,并将每一个点的深度转化到(1,1251)的序列中,通过逐个编码的形式将深度信息转化为1251维向量d,再初始化一个特征嵌入权重w,将深度特征从高维度转化为低维度,然后输入到融合模块中进行储层预测。
步骤6:本步骤使用特征交叉方式进行自动特征工程计算,加入所有特征进行组合,作为另一个模型分支。
进一步,对201个特征进行特征交叉计算,使用fm特征交叉公式对所有的特征进行线性计算相加和二阶组合计算并相加。
步骤7:设计多分支融合模块对上述卷积神经网络分支和循环神经网络分支的输出向量进行多种方式融合。将步骤3、4、5、6得到特征向量进行拼接,获得融合特征向量,然后通过全连接层进行进一步特征计算,最后接入多分类器获得储层预测结果,结果如图3所示。
在应用本发明的一具体实施例2中,本发明的基于深度融合模型的储层多分类预测方法包括了以下步骤:
步骤1:井震数据的获取和预处理。本方法使用的数据为胜利油田某地区的地震资料数据以及相关解释文件,包括件岩石属性文件、油气属性文件以及时深关系文件。另外,地质勘探专家也为我们提供一份基于专家经验和传统储层分析方法得到的储层厚度相关性文件。
步骤1.1本方法的地震资料数据指地震数据采集的波形记录,以及经过地震数据处理后的三维地震体或者二维剖面数据,通过初步处理和解释后产生衍生特征地震体,包括振幅类数据、频率类数据、相位类数据、流体检测类数据。这些数据数据相关性高、冗余性大,给建模带来了一定的难度。本方法使用了全部地震体的201个地震体数据,盖了201个衍生特征,即每一个特征对应一个地震体数据。全部的地震体数据总共可以分为7大类,包括18个原始地震体数据文件(seismic)、52个振幅类数据文件(ampseismic)、15个流体检测类属性数据文件(flidseismic)、31个频率类数据文件(frequentlyseismic)、44个相位类数据文件(phaseseismic)、20个结构类数据文件(structureseismic)和21个其它属性文件(otherseismic)。
步骤1.2方法中对原始数据进行预处理,通过构建一个三维立体空间的方法,每个特征的地震体文件存储结构相同,并且按照字节进行存储。每个特征的地震体文件包括一个3600个字节的文件头,以及若干个字节的道数据。整个地震体是一个三维地震体,由线号(line)、道号(cdp)以及时间(time)维度构成,每个线上有1614个道,每个道上有1251个时间点数据。
步骤1.3在生成了地震体特征文件后,本方法使用时深关系转化的方法将储层数据由深度转化为时间维度,根据现场工程师在勘探过程中记录的每个勘测点的时间和深度对应关系,建立一个线性模型去拟合一个时间-深度的转化函数即h(x)=θ01x其中θ0和θ1是要学习的参数。
求得参数后,我们可以根据该模型拟合的线性方程将数据中的所有时间参数转换为深度,以方便后面的模型计算。获得的深度信息为一个长度为1251的序列,每一个测试点的深度在(0,1251)这个区间之内。
步骤1.4在通过对测井资料数据和地震资料数据的分析和处理后,可以得到带标签的地震体数据。在输入到模型之前,会对这些数据进行归一化处理。本文通过实验评估主要采用线形归一化的方法,其表达式如下
Figure BDA0003059581110000081
其中,max(X)是数据集X中的最大值,min(X)是数据集X中的最小值,这里是对每个特征地震体进行归一化,将值域跨度较大的地震数据压缩到0和1之间,这样更利于模型的学***滑,也更容易收敛,这对于使用小样本标签的建模是很有必要的。
步骤1.5原始数据中同时包含了大量的标记信息,包括非储层、干层、水层、含油水层、油层、油水同层、气层、气水同层、差油层。根据多类别的属性和特点,在本方法中将这些细分类进行了划分,分成四个大类作为本方法的最终分类类别。分别为非储层、干层、水层和油气层。
步骤2经过预处理后我们已经获得各个特征对应的井震数据,由于特征数据有201个,数量较多且有相关性和冗余性,要对这些特征进行优化和排序,通过特征优选算法获得更能代表储层特征的属性输入模型,通过对特征数据通过我们设计的特征融合方法进行拼接和融合,加强相关性挖掘。
步骤2.1Xgboost模型主要利用树模型为基础思想,在选择***点的时候,会选择最优***点,速度较快,性能较好。首先读取201个特征文件,并取出所有目标层段的数据,将相同位置(线号、道号、时间相同)的点组合成一个长度为201的特征向量,将有标签的数据分离出来,用于模型做有监督的学习,这样在模型学习结束后,可以根据相关参数对201个特征的重要性进行排名。首先将所有特征文件存储进并表示为数据集D,然后使用k个提升树模型进行xgboost排序训练,提升树的输出表示为fk(xi),整个提升树的输出可以表示为
Figure BDA0003059581110000091
设计目标函数来使得模型拟合训练数据,本方法中的目标函数设计为:
Figure BDA0003059581110000092
Figure BDA0003059581110000093
其中l函数是用来衡量标签和模型预测值的损失函数,Ω表示当前模型的复杂度,T表示当前模型树的个数,w表示树的叶子结点的权重值,fk为第k个提升树的参数。
在进行xgboost模型计算时,按照时序顺序分别输入每个特征文件的点位值和标记(储层或者非储层),其中每个特征文件对应了一个提升树,然后通过损失函数对模型进行拟合学习,最终确定参数并得到排序特征向量,获得特征重要性排名。
步骤2.2利用xgboost获取特征排序的特征属性后,通过切片的方式获取特征数据。本文从line、cdp和time三个维度进行切片处理,在具体实验中,切面从中心采样点向四周扩散,选取大小为14*14。在切片后,本方法使用如下4中方法构建不同的切片特征数据用于模型输入
步骤2.3选择了一个特征地震体,对于每个采样点,分别从三个维度时间,线号和道号进行切片。以采样点为中心,切出三个14*14平面,然后将三个平面组合成28*28平面用作输入,对于空白部分添加0。
步骤2.4将2.3方法得到的切片,直接组合成三个通道的数据用于卷积神经网络。
步骤2.5只固定时间维度,得到一个14*14的横向切片用于输入,横向切片特征能够表示地表或地表下相同层位特征变化情况
步骤2.6考虑到特征组合会给储层预测带来增益,选择经过Xgboost特征优选后的排名较高的特征构建组合特征。将这四个14*14的切片组合成一个28*28大小的切片用于卷积神经网络输入,或直接组合成4通道数据。
步骤3设计卷积神经网络模块,通常地质体在横向上的展布范围要比垂向上的大得多,本方法使用14×14的网格地震数据水平切片作为输入数据,利用卷积神经网络提取更高维度的特征,横向特征提取能够抽取得到更多的有效特征。
步骤3.1在经过特征优选和特征切片拼接组合后,设计卷积神经网络模块抽取数据的特征并结合分类器预测数据的类别。
步骤3.2确定输入切片数据的维度和大小。
步骤3.3对输入数据进行卷积操作,进行标准化处理,然后经过relu激活函数计算得到第一输出数据
步骤3.4对所述的第一数据再次进行卷积、标准化和relu激活函数处理,然后进行最大池化操作,获得第二输出数据。
步骤3.5对所述的第二输出数据进行两次卷积和激活函数计算处理,获得第三输出数据。
步骤3.6对所述的第三输出数据进行全局平均池化操作,获得第四输出数据。
步骤3.7对所述第四输出数据进行标准化和并通过激活函数计算,然后接入32维全连接层网络获得第五输出数据。
步骤3.8对所述的第五层数据随机抛弃掉20%的神经元节点,得到最终输出特征向量。
步骤4设计时序特征并输入到循环神经网络分支进行预测
步骤4.1沉积储层具有横向分布规律不明显、垂向粒级递变层理和沉积回旋性特性。对于这种横向分布规律不明显,所述的单一横向特征提取模块不能够很好的抽取此类特征,而双向循环神经网络擅长处理这种层级关系序列数据,且能考虑上下关系,本方法通过双向门控循环单元(BiGRU)来对地震体的垂向层级特征进行提取,增强模型处理不同特点的地质结构能力,也能够提高模型的预测能力。
步骤4.2获取步骤二中所述的特征数据,对于每个有标签的数据点,在竖直方向上分别向上和向下读取5个点位的数据,拼接成长度为11的向量,作为纵向输入数据。
步骤4.3将输入数据调整为两个方向的维度,分别为当前位置向上的1*6维向量v1,和当前位置向下的1*6维向量v2。将v1和v2分别输入设计的GRU网络做计算,GRU网络的隐藏层神经元数量设计为32,隐藏层层数为2。分别得到第一输出数据和第二输出数据。
步骤4.4将第一输出数据和第二输出数据进行拼接,然后送入到relu激活函数进行计算,得到第三输出数据。
步骤4.5将得到的第三输出数据输入到全连接网络进行计算,然后进行标准化操作得到时序分支的最终输出数据。
步骤5设计深度特征模块并输入到深度神经网络中进行预测
步骤5.1根据步骤1.3所述的时间-深度转化方法,获取所有井位点的训练数据,并将每一个点的深度转化到(1,1251)的序列中,通过逐个编码的形式将深度信息转化为1251维向量d,再初始化一个特征嵌入权重w,将深度特征从高维度转化为低维度,然后输入到融合模块中进行储层预测。
步骤5.2首先初始化一个1251*32维度的权重矩阵w,然后将深度信息与权重矩阵相乘得到一个32维向量s,为了使s归一化,对s的奇数维度数据使用cos函数进行计算,对s的偶数维度数据使用sin函数计算进行归一化得到最终的融合模块网络输出。
步骤6在步骤3,4,5中分别使用xgboost得到的优选特征进行了横向切片组合,纵向特征获取以及深度特征获取。本步骤使用特征交叉方式进行自动特征工程计算,加入所有特征进行组合,作为另一个模型分支。
步骤6.1获取源数据的201个特征,按照井位,道号和深度分别读取每个特征数据在相应探测点的属性值。然后读取标记数据,对每个点位的储层非储层情况进行标记,整体属性和标记数据。
步骤6.2对201个特征进行特征交叉计算,使用fm特征交叉公式对所有的特征进行线性计算相加和二阶组合计算并相加。
Figure BDA0003059581110000121
其中vi,vj为分别为特征xi,xj的隐向量做特征嵌,其值随着模型的训练进行更新学习,N=201。首先对特征进行线性计算,w为计算权重。然后对特征进行两两交叉计算,并将所有的二阶特征交叉组合后进行求和,具体计算方式如下所示。
Figure BDA0003059581110000122
步骤6.3获得上一层输出之后,接入全连接网络对特征维度进行计算并降低维度,获得不大于32维的特征向量作为特征交叉层的输出数据。
步骤7设计多分支融合模块对上述卷积神经网络分支和循环神经网络分支的输出向量进行多种方式融合。
步骤7.1将步骤3、4、5、6得到特征向量进行拼接,获得融合特征向量,然后通过全连接层进行进一步特征计算,最后接入多分类器获得储层预测结果。
步骤7.2将步骤3、4、5、6中的输出以第二层维度划分,分别与卷积模块输出,循环神经网络模块输出,深度特征输出和特征交叉输出相乘,得到输出结果,然后将结果输入到全连接网络层,输出维度设置为4,分别代表非储层、干层、水层、油气层。
在应用本发明的一具体实施例3中,请参看图1,对于某一个地区的油气勘探区域,提取了30万个采样点的样本,包括干层、水层和油层,每种类别中又进行了细粒度划分。每个特征的地震体文件包括一个3600个字节的文件头,以及若干个字节的道数据。整个地震体是一个三维地震体,由线号(line)、道号(cdp)以及时间(time)维度构成,每个线上有1614个道,每个道上有1251个时间点数据。在生成了地震体特征文件后,本方法使用时深关系转化的方法将储层数据由深度转化为时间维度,根据现场工程师在勘探过程中记录的每个勘测点的时间和深度对应关系,建立一个线性模型去拟合一个时间-深度的转化函数。根据该模型拟合的线性方程将数据中的所有时间参数转换为深度,以方便后面的模型计算。获得的深度信息为一个长度为1251的序列,每一个测试点的深度在(0,1251)这个区间之内。
请参看图2,在特征提取过程中,设计卷积神经网络模块,通常地质体在横向上的展布范围要比垂向上的大得多,本方法使用14×14的网格地震数据水平切片作为输入数据,利用卷积神经网络提取更高维度的特征,横向特征提取能够抽取得到更多的有效特征,并设计时序特征并输入到循环神经网络分支进行预测。沉积储层具有横向分布规律不明显、垂向粒级递变层理和沉积回旋性特性。对于这种横向分布规律不明显,所述的单一横向特征提取模块不能够很好的抽取此类特征,而双向循环神经网络擅长处理这种层级关系序列数据,且能考虑上下关系,本方法通过双向门控循环单元(BiGRU)来对地震体的垂向层级特征进行提取,增强模型处理不同特点的地质结构能力,也能够提高模型的预测能力。进一步,双向门控循环单元采用上下5个采样点作为输入,结果拼接作为输出。根据步骤1.3所述的时间-深度转化方法,获取所有井位点的训练数据,并将每一个点的深度转化到(1,1251)的序列中,通过逐个编码的形式将深度信息转化为1251维向量d,再初始化一个特征嵌入权重,将深度特征从高维度转化为低维度,然后输入到融合模块中进行储层预测。在图2所示第四个模块中,对所获得的201个特征进行特征交叉计算,使用fm特征交叉公式对所有的特征进行线性计算相加和二阶组合计算并相加。并进行特征融合获取细粒度分类结果,分类器输出维度为7。
本发明的基于深度融合模型的储层多分类预测方法,属于深度学习技术在地球物理勘探领域的应用。所述方法首先利用地震处理后的叠后地震数据以及地震解释研究人员提供的岩性标记和层位解释文件进行数据预处理,将有标记的区域点位特征数据进行处理并向量化,使之与相应的标签组成样本数据。然后对样本数据进行特征工程,提取重要性靠前的井震特征数据,设计深度融合模型将横向维度特征、垂向维度特征、深度特征、采样点统计特征进行融合训练,获得井震融合特征。最后实现了基于井震数据对研究工区进行储层预测的深度学习模型。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域技术人员来说,其依然可以对前述实施例记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
除说明书所述的技术特征外,均为本专业技术人员的已知技术。

Claims (11)

1.基于深度融合模型的储层多分类预测方法,其特征在于,该基于深度融合模型的储层多分类预测方法包括:
步骤1:获取井震数据并进行预处理;
步骤2:通过特征优选算法获得更能代表储层特征的属性输入模型;
步骤3:通过卷积神经网络进行横向切片特征学习;
步骤4:设计时序特征并输入到循环神经网络分支进行预测;
步骤5:将深度特征数据输入到深度特征网络中进行训练;
步骤6:使用特征交叉方式进行自动特征工程计算;
步骤7:进行多分类储层预测,获得储层预测结果。
2.根据权利要求1所述的基于深度融合模型的储层多分类预测方法,其特征在于,在步骤1中,将地震处理后的叠后地震数据以及相关解释文件进行预处理,将整个地震体处理成一个三维矩阵,由线号line、道号cdp以及时间time维度构成;在生成了地震体特征文件后,用时深关系转化的方法将其对应的储层标记数据由深度转化为时间维度。
3.根据权利要求2所述的基于深度融合模型的储层多分类预测方法,其特征在于,在步骤1中,根据现场工程师在勘探过程中记录的每个勘测点的时间和深度对应关系,建立一个线性模型去拟合一个时间-深度的转化函数,根据该模型拟合的线性方程将数据中的所有时间参数转换为深度。
4.根据权利要求1所述的基于深度融合模型的储层多分类预测方法,其特征在于,在步骤2中,利用xgboost模型进行计算,按照时序顺序分别输入每个步骤1中的特征文件的点位值和标记,其中每个特征文件对应了一个提升树,通过设计的损失函数对模型进行拟合学习,最终确定参数并得到排序特征向量,获得特征重要性排名。
5.根据权利要求4所述的基于深度融合模型的储层多分类预测方法,其特征在于,在步骤2中,先将所有特征文件表示为数据集D,然后使用k个提升树模型进行xgboost排序训练;在进行xgboost模型计算时,按照时序顺序分别输入每个特征文件的点位值和标记即储层或者非储层,其中每个特征文件对应了一个提升树,通过设计的损失函数对模型进行拟合学习,最终确定参数并得到排序特征向量,获得特征重要性排名;然后对排名靠前的特征数据进行横向切片、垂向切片、深度点位特征和采样点统计特征进行生成。
6.根据权利要求1所述的基于深度融合模型的储层多分类预测方法,其特征在于,在步骤3中,设计卷积神经网络模块进行横向特征的提取,通常地质体在横向上的展布范围要比垂向上的大得多,使用14×14的网格地震数据水平切片作为输入数据,利用卷积神经网络提取更高维度的特征,横向特征提取能够抽取得到更多的有效特征。
7.根据权利要求6所述的基于深度融合模型的储层多分类预测方法,其特征在于,在步骤3中,该卷积神经网络包括3个卷积层、2个池化层和一个全连接层,全连接层的长度为64个,激活函数为relu。
8.根据权利要求1所述的基于深度融合模型的储层多分类预测方法,其特征在于,步骤4中,通过双向门控循环单元来对地震体的垂向层级特征进行提取,双向门控循环单元采用上下5个采样点作为输入,结果拼接作为输出。
9.根据权利要求1所述的基于深度融合模型的储层多分类预测方法,其特征在于,步骤5中,获取所有井位点的训练数据,并将每一个点的深度转化到(1,n)的序列中,n为地震数据的采样点个数,通过逐个编码的形式将深度信息转化为n维向量d,再初始化一个特征嵌入权重w,将深度特征从高维度转化为低维度,然后输入到融合模块中进行储层分类预测。
10.根据权利要求1所述的基于深度融合模型的储层多分类预测方法,其特征在于,在步骤6中,对多个特征进行特征交叉计算,使用特征交叉公式对所有的特征进行线性计算相加和二阶组合计算并相加。
11.根据权利要求1所述的基于深度融合模型的储层多分类预测方法,其特征在于,在步骤7中,对上述卷积神经网络分支和循环神经网络分支的输出向量进行多种方式融合;将步骤3、4、5、6得到特征向量进行拼接,获得融合特征向量,然后通过全连接层进行进一步特征计算,最后接入多分类器获得储层预测结果。
CN202110509149.2A 2021-05-11 2021-05-11 基于深度融合模型的储层多分类预测方法 Pending CN115330007A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110509149.2A CN115330007A (zh) 2021-05-11 2021-05-11 基于深度融合模型的储层多分类预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110509149.2A CN115330007A (zh) 2021-05-11 2021-05-11 基于深度融合模型的储层多分类预测方法

Publications (1)

Publication Number Publication Date
CN115330007A true CN115330007A (zh) 2022-11-11

Family

ID=83912594

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110509149.2A Pending CN115330007A (zh) 2021-05-11 2021-05-11 基于深度融合模型的储层多分类预测方法

Country Status (1)

Country Link
CN (1) CN115330007A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111983691A (zh) * 2020-08-18 2020-11-24 北京北斗天巡科技有限公司 一种多模型融合的储层预测方法及软件***
CN116660992A (zh) * 2023-06-05 2023-08-29 北京石油化工学院 一种基于多特征融合的地震信号处理方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111983691A (zh) * 2020-08-18 2020-11-24 北京北斗天巡科技有限公司 一种多模型融合的储层预测方法及软件***
CN111983691B (zh) * 2020-08-18 2023-10-13 郑州市混沌信息技术有限公司 一种多模型融合的储层预测方法及软件***
CN116660992A (zh) * 2023-06-05 2023-08-29 北京石油化工学院 一种基于多特征融合的地震信号处理方法
CN116660992B (zh) * 2023-06-05 2024-03-05 北京石油化工学院 一种基于多特征融合的地震信号处理方法

Similar Documents

Publication Publication Date Title
CN107356958B (zh) 一种基于地质信息约束的河流相储层分步地震相预测方法
CN109709603B (zh) 地震层位识别与追踪方法、***
Raeesi et al. Classification and identification of hydrocarbon reservoir lithofacies and their heterogeneity using seismic attributes, logs data and artificial neural networks
CN103487832B (zh) 一种三维地震信号中的有监督波形分类方法
CN111596978A (zh) 用人工智能进行岩相分类的网页显示方法、模块和***
CN106707340A (zh) 一种火山岩岩相的预测方法
CN110609320B (zh) 一种基于多尺度特征融合的叠前地震反射模式识别方法
US7519476B1 (en) Method of seismic interpretation
Brazell et al. A machine-learning-based approach to assistive well-log correlation
CN106886043B (zh) 基于地震数据深度学习的储层检测方法
CN111983691B (zh) 一种多模型融合的储层预测方法及软件***
CN103257360B (zh) 基于模糊c均值聚类的碳酸盐岩流体识别方法
CN115330007A (zh) 基于深度融合模型的储层多分类预测方法
CN104280771A (zh) 一种基于em算法的三维地震数据波形的半监督聚类方法
Gu et al. Complex lithofacies identification using improved probabilistic neural networks
CN110609327B (zh) 基于叠前地震属性的碳酸盐岩储集相预测方法及装置
Eskandari et al. Reservoir Modelling of Complex Geological Systems--A Multiple-Point Perspective
CN113033648A (zh) 一种使用机器学习算法实现测井解释的方法
CN116168224A (zh) 基于成像砾石含量的机器学习岩相自动识别方法
CN111894563B (zh) 潜山段中裂缝型储层的分类确定方法及***
CN117452518B (zh) 基于多学科数据融合聚类算法的储层岩性预测方法
CN117272841B (zh) 一种基于混合神经网络的页岩气甜点预测方法
CN109143355B (zh) 基于som的半监督全局优化地震相定量分析方法
US20240127039A1 (en) Geologic learning framework
CN115808710A (zh) 一种致密储层叠前地震数据特征提取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination