CN113592028A - 多专家分类委员会机器测井流体识别的方法及*** - Google Patents

多专家分类委员会机器测井流体识别的方法及*** Download PDF

Info

Publication number
CN113592028A
CN113592028A CN202110939640.9A CN202110939640A CN113592028A CN 113592028 A CN113592028 A CN 113592028A CN 202110939640 A CN202110939640 A CN 202110939640A CN 113592028 A CN113592028 A CN 113592028A
Authority
CN
China
Prior art keywords
data
logging
training
prediction
logging data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110939640.9A
Other languages
English (en)
Inventor
谭茂金
白洋
张海涛
石玉江
王长胜
吴静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Geosciences Beijing
Original Assignee
China University of Geosciences Beijing
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Geosciences Beijing filed Critical China University of Geosciences Beijing
Priority to CN202110939640.9A priority Critical patent/CN113592028A/zh
Publication of CN113592028A publication Critical patent/CN113592028A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了多专家分类委员会机器测井流体识别的方法及***,属于智能识别的领域,该方法包括:S1:获取测井数据和流体类型标签数据作为输入数据;S2:对输入数据进行数据清洗、环境校正和敏感测井数据筛选,得到训练数据;S3:将训练数据输入多个异质学习器中进行训练,之后输入到组合器中进行集成,得到多专家分类委员会机器流体识别模型;S4:将新井测井数据输入到多专家分类委员会机器流体识别模型中,得到最终流体识别结果。本发明能够最大程度的结合每种智能算法的优势,减少单个智能算法陷入局部极小和过拟合的风险,降低测井数据中的噪声干扰,提高集成***的精度和鲁棒性。

Description

多专家分类委员会机器测井流体识别的方法及***
技术领域
本发明属于智能识别的领域,具体涉及一种多专家分类委员会机器测井流体识别的方法及***。
背景技术
目前,地球物理测井作为深入地层的″眼睛″和″耳朵″,具有测量物理参数多、分辨率高、信息量大等优点,能够为油气藏评价提供连续、准确的电、声、核/核磁等原位物理参数,主要包括自然伽马、深浅电阻率、声波、密度、中子等。利用这些测井数据,通过解释图版、经验公式、体积模型等手段,可以实现地下岩性类型、油气储层和流体性质定性判别,指导实际油气生产与开发工作。
随着我国油气开发逐渐向非常规、深层复杂油气储层迈进,常规地球物理测井解释与评价方法难以适用,可靠性差。特别在一些低孔低渗储层、低阻油层和复杂岩性地层中,孔隙流体对测井响应贡献小,不同流体类型与测井响应存在非线性关系。因此,利用一些智能算法构建测井数据与流体类型的非线性映射关系,对提高流体识别能力和精度具有较好的作用。目前,常用到的智能算法包括神经网络、支持向量机、决策树、贝叶斯算法等,这些方法均是提前输入测井数据与储层油层、油水同层、含油水层、水层、干层等流体标签,自动优化模型结构,构建非线性流体识别模型,实现未知储层的流体类型预测。
采用一个性能较好的智能模型来预测复杂储层流体类型具有误差小、效率高的优势。但是,训练一个性能可靠的智能模型往往是困难的,包括学习方法优选、超参数优化、欠拟合和过拟合的权衡等,每个因素都对模型精度、鲁棒性、泛化能力具有较大影响。而且,依据无免费午餐定理,不存在一个训练模型在精度、鲁棒性、泛化能力上均是最优的。因此,一些基于投票机制将多个同类型基学习器组合起来的集成学习方法被提出,并在各应用领域广泛应用。然而,目前集成学习的提升机制主要依赖于基学习器的独立性,当训练数据量较小时,传统的自助采样很容易使基学习器达到饱和,影响集成效果。
有鉴于此,特提出本发明。
发明内容
本发明的目的是提供多专家分类委员会机器测井流体识别的方法及***,将多种不同类型的智能算法作为基学习器,以投票法作为组合器,构建委员会机器,能够最大程度的结合每种智能算法的优势,减少单个智能算法陷入局部极小和过拟合的风险,降低测井数据中的噪声干扰,提高集成***的精度和鲁棒性。
为了实现上述目的,本发明提供了一种多专家分类委员会机器测井流体识别的方法,包括以下步骤:
S1:获取测井数据和流体类型标签数据作为输入数据;
S2:对输入数据进行数据清洗、环境校正和敏感测井数据筛选,得到训练数据;
S3:将训练数据输入多个异质学习器中进行训练,之后输入到组合器中进行集成,得到多专家分类委员会机器流体识别模型;
S4:将新井测井数据输入到多专家分类委员会机器流体识别模型中,得到测井流体识别结果。
进一步地,所述步骤S2中,数据清洗是对测井数据进行重新审查与校验的过程,用于删除冗余信息、纠正错误信息并且提供数据一致性,其中,删除冗余信息包括删除径向地层特征相似的电阻率测井数据、删除纵向地层特征相近的测井数据;纠正错误信息包括去除异常井段数据和噪声影响较大的测井数据;提供数据一致性包括规范不同井测井数据的名称、单位和数据类型;
环境校正是利用测井解释图版或校正公式去除井眼、泥浆、井斜和围岩对测井数据质量的影响,其包括基于三参数反演的电法测井环境校正、基于漫反射声路法的声波测井环境校正、基于声波时差中子测井重构法的中子测井环境校正和基于声波时差密度测井重构法的密度测井环境校正。
进一步地,所述步骤S2中,敏感测井数据筛选包括以下步骤:
S201:将全部测井数据作为输入,利用BP神经网络、概率神经网络和决策树算法进行训练,构建预训练智能模型;
S202:将新井测井数据作为预测数据,输入到预训练智能模型中进行流体类型预测,得到预测结果A;
S203:对某一系列的测井数据进行一定比例的扰动,其他测井数据保持不变,得到扰动数据集;
S204:将扰动数据集输入到预训练智能模型中进行流体类型预测,得到预测结果B1,记录预测结果B1相对预测结果A的受影响程度δ(B1,A);
S205:依次扰动不同系列的测井数据,输入到预训练智能模型中得到预测结果B2、B3、...、Bm,记录其相对A的受影响程度δ(Bm,A);
S206:依据不同测井系列扰动对输出端的影响程度大小,以影响程度越大测井数据敏感越强为依据,判断测井数据敏感性。
进一步地,所述步骤S3中,多异质学习器联合训练中,采用异质智能算法,接收相同的输入数据,分别进行超参数网格搜索和智能模型训练,得到多个并列的子模型,其中,异质智能算法包括BP神经网络、概率神经网络和决策树算法;
委员会机器组合器集成中,采用相对多数投票法、绝对多数投票法和加权投票法和学习法,其中,相对多数投票法以各子模型预测结果频数最多的判别结果作为输出,当不止一个结果频数最多时,选择训练性能最好的子模型输出作为最终判别结果;绝对多数投票法以子模型预测结果频数超过总频数一半的判别结果作为输出,当不存在频数过半的情况时,拒绝预测;加权投票法为每一类预测结果赋予最优化权重,最终得分最高的判别结果作为输出;学习法利用智能算法建立所有子模型输出与真实结果的非线性映射关系,利用这一关系指导未知数据预测结果的组合。
更进一步地,所述步骤S4中,多专家分类委员会机器流体识别模型包括多个训练完成的子模型和组合器,将新井测井数据进行数据清洗和环境校正后,输入到子模型中进行流体类型判别,通过组合器输出最终的流体类型判别结果。
本发明还提供了一种多专家分类委员会机器测井流体识别的***,包括训练数据准备模块、委员会机器训练模块和委员会机器预测模块;
训练数据准备模块,用于对输入的测井数据和流体类型标签数据进行数据清洗、环境校正和敏感测井数据筛选,得到训练数据;
委员会机器训练模块,用于对训练数据进行多异质学习器联合训练和委员会机器组合器集成,得到多专家分类委员会机器流体识别模型;
委员会机器预测模块,用于根据新井测井数据和多专家分类委员会机器流体识别模型,得到测井流体识别结果。
进一步地,所述训练数据准备模块中,数据清洗是对测井数据进行重新审查与校验的过程,用于删除冗余信息、纠正错误信息并且提供数据一致性,其中,删除冗余信息包括删除径向地层特征相似的电阻率测井数据、删除纵向地层特征相近的测井数据;纠正错误信息包括去除异常井段数据和噪声影响较大的测井数据;提供数据一致性包括规范不同井测井数据的名称、单位和数据类型;
环境校正是利用解释图版或校正公式去除井眼、泥浆、井斜和围岩对测井数据质量的影响,其包括基于三参数反演的电法测井环境校正、基于漫反射声路法的声波测井环境校正、基于声波时差中子测井重构法的中子测井环境校正和基于声波时差密度测井重构法的密度测井环境校正。
进一步地,所述训练数据准备模块中,敏感测井数据筛选包括以下步骤:
S201:将全部测井数据作为输入,分别利用BP神经网络、概率神经网络和决策树算法进行训练,构建预训练智能模型;
S202:将新井测井数据作为预测数据,输入到预训练智能模型中进行流体类型预测,得到预测结果A;
S203:对某一系列的测井数据进行扰动,其他测井数据保持不变,得到扰动数据集;
S204:将扰动数据集输入到预训练智能模型中进行流体类型预测,得到预测结果B1,计算预测结果B1相对预测结果A的受影响程度δ(B1,A);
S205:依次扰动不同系列的测井数据,输入到预训练智能模型中得到预测结果B2、B3、...、Bm,计算其相对A的受影响程度δ(Bm,A);
S206:依据不同测井系列扰动对输出端的影响程度大小,以影响程度越大测井数据敏感越强为依据,判断测井数据敏感性。
进一步地,所述委员会机器训练模块中,多异质学习器联合训练采用异质智能算法,接收相同的输入数据,分别进行超参数网格搜索和智能模型训练,得到多个并列的子模型其中,异质智能算法包括BP神经网络、概率神经网络和决策树算法;
委员会机器组合器集成采用相对多数投票法、绝对多数投票法和加权投票法和学习法,其中,相对多数投票法以各子模型预测结果频数最多的判别结果作为输出,当不止一个结果频数最多时,选择训练性能最好的子模型输出作为最终判别结果;其中,绝对多数投票法以子模型预测结果频数超过总频数一半的判别结果作为输出,当不存在频数过半的情况时,拒绝预测;加权投票法为每一类预测结果赋予最优化权重,最终得分最高的判别结果作为输出;学习法利用智能算法建立所有子模型输出与真实结果的非线性映射关系,利用这一关系指导未知数据预测结果的组合。
更进一步地,委员会机器预测模块以多专家分类委员会机器流体识别模型为核心,包括多个训练完成的子模型和组合器,用于将测井数据进行数据清洗和环境校正后,输入到子模型中进行流体类型判别,通过组合器输出最终的流体类型判别结果。
本发明提供的多专家分类委员会机器测井流体识别的方法及***,具有如下有益效果:引入了多种智能算法联合的思想,构建了用于测井流体识别的多专家分类委员会机器的方法及***。该***核心算法是委员会机器训练模块,它通过模拟人类委员会机制,以灵活可靠的相对多数投票法、绝对多数投票法、加权投票法、学习法等决策机制,将多种异质智能算法联合起来,降低了预测***陷入局部极小、过拟合的风险,提高了训练模型的鲁棒性和预测结果的准确度。而且,本发明依托委员会机器核心算法,通过训练数据准备模块和委员会机器预测模块构建了一套完整的测井流体识别结果的***,既能提高输入数据的质量,又能提供快速、准确的流体类型判别结果。
附图说明
图1为根据本发明的一种多专家分类委员会机器测井流体识别的方法的流程图。
图2为根据本发明的一种多专家分类委员会机器测井流体识别的***的结构示意图。
图3为根据本发明的输入数据引入高斯噪声比例为5%时的单智能算法和委员会机器预测准确度图表。
图4为根据本发明的输入数据引入高斯噪声比例为10%时的单智能算法和委员会机器预测准确度图表。
图5为根据本发明的流体判别结果的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合具体实施方式对本发明作进一步的详细说明。
本发明的一实施方式提供一种多专家分类委员会机器测井流体识别的方法,如图1所示,通过多专家综合决策,能够提高预测模型的精度和鲁棒性,该方法包括以下步骤:
S1:获取测井数据和流体类型标签数据。
其中,测井数据包括自然伽马测井、电阻率测井、声波测井、密度测井、中子测井等数据。流体类型标签数据包括油层、油水同层、含油水层、水层和干层的数据。
S2:对测井数据和流体类型标签数据构成的输入数据进行数据清洗、环境校正和敏感测井数据筛选,得到训练数据。
数据清洗是对测井数据进行重新审查与校验的过程,用于删除冗余信息、纠正错误信息并且提供数据一致性,其中,删除冗余信息包括删除径向地层特征相似的电阻率测井数据、删除纵向地层特征相近的测井数据;纠正错误信息包括去除异常井段数据和噪声影响较大的测井数据;提供数据一致性包括规范不同井测井数据的名称、单位和数据类型。
环境校正是利用解释图版或校正公式去除井眼、泥浆、井斜和围岩等环境因素对测井数据质量的影响,包括但不限于基于三参数反演的电法测井环境校正、基于漫反射声路法的声波测井环境校正、基于声波时差中子测井重构法的中子测井环境校正和基于声波时差密度测井重构法的密度测井环境校正。
敏感测井数据筛选是在数据清洗的基础上,进一步删减数据冗余特征的过程。具体步骤为:
S201:全部测井数据作为输入,利用但不限于BP神经网络、概率神经网络、决策树等智能算法进行训练,构建预训练智能模型;
S202:将测井数据作为预测数据,输入到预训练智能模型中进行流体类型预测,得到预测结果A;
S203:对某一系列的测井数据进行一定比例的扰动,其他测井数据保持不变,得到扰动数据集,其中,该比例可以根据实际情况进行调整;
S204:将N组扰动数据集输入到预训练智能模型中进行流体类型预测,得到预测结果B1,计算预测结果B1相对预测结果A的受影响程度δ(B1,A),其计算公式如下:
Figure BDA0003214316330000071
S205:依次扰动不同系列的测井数据,输入到预训练智能模型中得到预测结果B2、B3、...、Bm,记录其相对A的受影响程度δ(Bm,A);
S206:依据不同测井系列扰动对输出端的影响程度大小,以影响程度越大,测井数据敏感越强为依据,判断测井数据敏感性。
S3:将训练数据输入多个异质学习器中进行训练,之后输入到组合器中进行集成,得到多专家分类委员会机器流体识别模型。
并且,步骤S3中,多异质学习器联合训练中,异质学习器是委员会机器的主体,包括但不限于BP神经网络、概率神经网络、决策树等任何不同类型的智能算法。一般而言,委员会机器中采用的异质学习器的数量必须大于3个。这些智能算法接收相同的输入数据,分别进行超参数网格搜索和智能模型训练,得到多个并列的子模型,该子模型为不同智能算法训练得到的模型。
委员会机器组合器集成中,委员会机器组合器是委员会机器的核心,包括相对多数投票法、绝对多数投票法、加权投票法和学习法等。其中,相对多数投票法以各子模型预测结果频数最多的判别结果作为输出,当不止一个结果频数最多时,选择训练性能最好的子模型输出作为最终判别结果;绝对多数投票法以子模型预测结果频数超过总频数一半的判别结果作为输出,当不存在频数过半的情况时,拒绝预测;加权投票法为每一类预测结果赋予最优化权重,最终得分最高的判别结果作为输出;学习法利用智能算法建立所有子模型输出与真实结果的非线性映射关系,利用这一关系指导未知数据预测结果的组合。
S4:将新井测井数据输入到多专家分类委员会机器流体识别模型中,得到测井流体识别结果。
多专家分类委员会机器流体识别模型包括多个训练完成的子模型和组合器,将新井测井数据进行数据清洗和环境校正后,即可输入到子模型中进行流体类型判别,最终通过组合器输出最终的流体类型判别结果。
本发明的另一实施方式提供一种多专家分类委员会机器测井流体识别的方法,其利用测井数据构建多专家分类委员会机器流体识别模型及流体类型判别***。图2为本发明的所述的多专家分类委员会机器测井流体识别的***示意图,通过多专家综合决策,能够提高预测模型的精度和鲁棒性。
本发明的***包括三个主要模块,分别为训练数据准备模块1、委员会机器训练模块2和委员会机器预测模块3。
训练数据准备模块1,用于对测井数据和流体类型标签数据构成的输入数据进行数据清洗、环境校正和敏感测井数据筛选,得到训练数据。
数据清洗是对测井数据进行重新审查与校验的过程,用于删除冗余信息、纠正错误信息并且提供数据一致性,其中,删除冗余信息包括删除径向地层特征相似的电阻率测井数据、删除纵向地层特征相近的测井数据;纠正错误信息包括去除异常井段数据和噪声影响较大的测井数据;提供数据一致性包括规范不同井测井数据的名称、单位和数据类型。
环境校正是利用解释图版或校正公式去除井眼、泥浆、井斜和围岩等环境因素对测井数据质量的影响。包括但不限于基于三参数反演的电法测井环境校正、基于漫反射声路法的声波测井环境校正、基于声波时差中子测井重构法的中子测井环境校正和基于声波时差密度测井重构法的密度测井环境校正。
敏感测井数据筛选是在数据清洗的基础上,进一步删减数据冗余特征的过程。具体步骤为:
1)全部测井数据作为输入,利用但不限于BP神经网络、概率神经网络、决策树等智能算法进行训练,构建预训练智能模型;
2)将测井数据作为预测数据,输入到预训练智能模型中进行流体类型预测,得到预测结果A;
3)对某一系列的测井数据进行一定比例的扰动,其他测井数据保持不变,得到扰动数据集,其中,该比例可以根据实际情况进行调整;
4)将N组扰动数据集输入到预训练智能模型中进行流体类型预测,得到预测结果B1,记录B1相对A的受影响程度δ(B1,A),其计算公式如下:
Figure BDA0003214316330000091
5)依次扰动不同系列的测井数据,输入到预训练智能模型中得到预测结果B2、B3、...、Bm,计算预测结果Bm相对预测结果A的受影响程度δ(Bm,A);
6)依据不同测井系列扰动对输出端的影响程度大小,判断测井数据敏感性。
委员会机器训练模块2,用于对训练数据进行多异质学习器联合训练和委员会机器组合器集成,因此,其可以分为2个部分,分别为多异质学习器联合训练和委员会机器组合器集成。
多异质学习器联合训练中,异质学习器是委员会机器的主体,包括但不限于BP神经网络、概率神经网络、决策树、最邻近算法等任何不同类型的智能算法。一般而言,委员会机器中采用的异质学习器的数量必须大于3个。这些智能算法接收相同的输入数据,分别进行超参数网格搜索和智能模型训练,得到多个并列的子模型,该子模型为不同智能算法训练得到的模型。
委员会机器组合器集成中,委员会机器组合器是委员会机器的核心,包括相对多数投票法、绝对多数投票法、加权投票法和学习法等。其中,相对多数投票法以各子模型预测结果频数最多的判别结果作为输出,当不止一个结果频数最多时,选择训练性能最好的子模型输出作为最终判别结果;绝对多数投票法以子模型预测结果频数超过总频数一半的判别结果作为输出,当不存在频数过半的情况时,拒绝预测;加权投票法为每一类预测结果赋予最优化权重,最终得分最高的判别结果作为输出;学习法利用智能算法建立所有子模型输出与真实结果的非线性映射关系,利用这一关系指导未知数据预测结果的组合。
委员会机器预测模块4以多专家分类委员会机器流体识别模型为核心,包括多个训练完成的子模型和组合器。将测井数据进行数据清洗和环境校正后,即可输入到子模型中进行流体类型判别,最终通过组合器输出最终的流体类型判别结果。
下文中,将结合示例对本发明的多专家分类委员会机器测井流体识别的方法及***进行说明。
选取我国西部某油田部分测井数据及生产、测试数据开展多专家分类委员会机器测井流体识别的实验。作为输入的测井曲线分别为阵列感应测井数据(AT10、AT20、AT3、AT60、AT90)、声波时差(AC)、补偿密度(DEN)、中子密度(CNL)、伽马(GR)。流体判别目标为五种储层类型,分别为油层、油水同层、含油水层、水层、干层,利用独热编码构建标签数据为[10000]、[01000]、[00100]、[00010]、[00001]。
首先,将测井数据与标签数据输入到训练数据准备模块中进行预处理,即数据清洗、环境校正、敏感测井数据筛选。最终构建了以AT90、AC、DEN、CNL、GR共5个系列测井数据作为特征数据,以独热编码的测试数据作为标签数据构建训练集,输入到下一个模块中进行训练。表1为用于分类委员会机器训练的部分训练数据。
表1部分基于测井数据和测试数据构建的训练数据
Figure BDA0003214316330000111
然后,在委员会机器训练模块中,BP神经网络、概率神经网络、决策树等多个异质学习器会基于训练数据进行子模型训练,包括超参数的最优化和模型结构的自动调优,最终训练得到多个子流体判别模型。对于组合策略,在大多数测井流体识别问题中,一般采用相对多数投票法。另外,在针对特定问题,如对输出结果可靠性有更高要求时,则选择绝对多数投票法。
最后,使用测试数据对多专家分类委员会机器流体识别模型性能,特别是鲁棒性进行了测试。测试方式为噪声扰动法,即分别在不同测井数据中引入不同比例的高斯噪声,输入到已训练委员会机器流体识别模型中进行预测。如图3-4所示,通过与真实标签对比可知:在无噪声情况下,委员会机器输出准确度为97.92%,而所有单个智能算法的平均准确度为87.50%。当分别在AT90、AC、DEN、CNL、GR中引入5%比例的高斯噪声时,所有单个智能算法的准确度均有下降(85.83%、72.50%、59.17%、84.85%、83.75%),而委员会机器输出准确度分别为97.92%、79.17%、64.58%、93.75%、87.50%,均大大高于所有单个智能算法输出结果的平均准确度。同样,当把引入噪声比例从5%增加到10%时,所有单个智能算法的准确度进一步下降(84.17%、59.58%、54.58%、79.58%、72.92%),而委员会机器输出准确度分别为95.83%、66.67%、66.67%、85.42%、79.17%(图2)。对比结果表明,多专家分类委员会机器流体识别模型的准确度与鲁棒性均高于单个智能算法,能够有效的实现多异质学习器的联合决策。
在委员会机器预测模块中,采用所述多专家分类委员会机器流体识别模型针对实际测井数据进行预测,能够快速得到油层、油水同层、含油水层、水层、干层等流体判别结果。如图5所示,第1、3、4道为测井数据,第2道为深度道,第5道为地层剖面,第6道为委员会机器流体识别结果,从上至下依次判别为油层(1)、油水同层(2)、含油水层(3)和水层(4)。
本文中应用了具体个例对发明构思进行了详细阐述,以上实施例以油藏为例的说明只是用于帮助理解本发明的核心思想,对气藏来说,流体识别变为气层、气水同层、含气水层和水层等的判别,同样也是适用的。应当指出,对于本技术领域的普通技术人员来说,在不脱离该发明构思的前提下,所做的任何显而易见的修改、等同替换或其他改进,均应包含在本发明的保护范围之内。

Claims (10)

1.一种多专家分类委员会机器测井流体识别的方法,其特征在于,包括以下步骤:
S1:获取测井数据和流体类型标签数据作为输入数据;
S2:对输入数据进行数据清洗、环境校正和敏感测井数据筛选,得到训练数据二
S3:将训练数据输入多个异质学习器中进行训练,之后输入到组合器中进行集成,得到多专家分类委员会机器流体识别模型二
S4:将新井测井数据输入到多专家分类委员会机器流体识别模型中,得到测井流体识别结果。
2.根据权利要求1所述的多专家分类委员会机器测井流体识别的方法,其特征在于,所述步骤S2中,数据清洗是对测井数据进行重新审查与校验的过程,用于删除冗余信息、纠正错误信息并且提供数据一致性,其中,删除冗余信息包括删除径向地层特征相似的电阻率测井数据、删除纵向地层特征相近的测井数据;纠正错误信息包括去除异常井段数据和噪声影响较大的测井数据;提供数据一致性包括规范不同井测井数据的名称、单位和数据类型;
环境校正是利用测井解释图版或校正公式去除井眼、泥浆、井斜和围岩对测井数据质量的影响,其包括基于三参数反演的电法测井环境校正、基于漫反射声路法的声波测井环境校正、基于声波时差中子测井重构法的中子测井环境校正和基于声波时差密度测井重构法的密度测井环境校正。
3.根据权利要求1所述的多专家分类委员会机器测井流体识别的方法,其特征在于,所述步骤S2中,敏感测井数据筛选包括以下步骤:
S201:将全部测井数据作为输入,利用BP神经网络、概率神经网络和决策树算法进行训练,构建预训练智能模型;
S202:将新井测井数据作为预测数据,输入到预训练智能模型中进行流体类型预测,得到预测结果A;
S203:对某一系列的测井数据进行扰动,其他测井数据保持不变,得到扰动数据集;
S204:将扰动数据集输入到预训练智能模型中进行流体类型预测,得到预测结果B1,计算预测结果B1相对预测结果A的受影响程度δ(B1,A);
S205:依次扰动不同系列的测井数据,输入到预训练智能模型中得到预测结果B2、B3、...、Bm,计算其相对A的受影响程度δ(Bm,A);
S206:依据不同测井系列扰动对输出端的影响程度大小,以影响程度越大测井数据敏感越强为依据,判断测井数据敏感性。
4.根据权利要求1所述的多专家分类委员会机器测井流体识别的方法,其特征在于,所述步骤S3中,多异质学习器联合训练中,采用异质智能算法,接收相同的输入数据,分别进行超参数网格搜索和智能模型训练,得到多个并列的子模型,其中,异质智能算法包括BP神经网络、概率神经网络和决策树算法;
在组合器集成中,采用相对多数投票法、绝对多数投票法和加权投票法和学习法,其中,相对多数投票法以各子模型预测结果频数最多的判别结果作为输出,当不止一个结果频数最多时,选择训练性能最好的子模型输出作为最终判别结果二绝对多数投票法以子模型预测结果频数超过总频数一半的判别结果作为输出,当不存在频数过半的情况时,拒绝预测;加权投票法为每一类预测结果赋予最优化权重,最终得分最高的判别结果作为输出;学习法利用智能算法建立所有子模型输出与真实结果的非线性映射关系,利用这一关系指导未知数据预测结果的组合。
5.根据权利要求1所述的多专家分类委员会机器测井流体识别的方法,其特征在于,所述步骤S4中,多专家分类委员会机器流体识别模型包括多个训练完成的子模型和组合器,将新井测井数据进行数据清洗和环境校正后,输入到子模型中进行流体类型判别,通过组合器输出最终的流体类型判别结果。
6.一种多专家分类委员会机器测井流体识别的***,其特征在于,包括训练数据准备模块、委员会机器训练模块和委员会机器预测模块;
训练数据准备模块,用于对输入的测井数据和流体类型标签数据进行数据清洗、环境校正和敏感测井数据筛选,得到训练数据;
委员会机器训练模块,用于对训练数据进行多异质学习器联合训练和委员会机器组合器集成,得到多专家分类委员会机器流体识别模型;
委员会机器预测模块,用于根据新井测井数据和多专家分类委员会机器流体识别模型,得到测井流体识别结果。
7.根据权利要求5所述的多专家分类委员会机器测井流体识别的方法,其特征在于,所述训练数据准备模块中,数据清洗是对测井数据进行重新审查与校验的过程,用于删除冗余信息、纠正错误信息并且提供数据一致性,其中,删除冗余信息包括删除径向地层特征相似的电阻率测井数据、删除纵向地层特征相近的测井数据二纠正错误信息包括去除异常井段数据和噪声影响较大的测井数据二提供数据一致性包括规范不同井测井数据的名称、单位和数据类型;
环境校正是利用解释图版或校正公式去除井眼、泥浆、井斜和围岩对测井数据质量的影响,其包括基于三参数反演的电法测井环境校正、基于漫反射声路法的声波测井环境校正、基于声波时差中子测井重构法的中子测井环境校正和基于声波时差密度测井重构法的密度测井环境校正。
8.根据权利要求6所述的多专家分类委员会机器测井流体识别的方法,其特征在于,所述训练数据准备模块中,敏感测井数据筛选包括以下步骤:
S201:将全部测井数据作为输入,利用BP神经网络、概率神经网络和决策树算法进行训练,构建预训练智能模型;
S202:将新井测井数据作为预测数据,输入到预训练智能模型中进行流体类型预测,得到预测结果A;
S203:对某一系列的测井数据进行一定比例的扰动,其他测井数据保持不变,得到扰动数据集;
S204:将扰动数据集输入到预训练智能模型中进行流体类型预测,得到预测结果B1,记录预测结果B1相对预测结果A的受影响程度δ(B1,A);
S205:依次扰动不同系列的测井数据,输入到预训练智能模型中得到预测结果B2、B3、...、Bm,记录其相对A的受影响程度δ(Bm,A);
S206:依据不同测井系列扰动对输出端的影响程度大小,以影响程度越大测井数据敏感越强为依据,判断测井数据敏感性。
9.根据权利要求6所述的多专家分类委员会机器测井流体识别的方法,其特征在于,所述委员会机器训练模块中,多异质学习器联合训练采用异质智能算法,接收相同的输入数据,分别进行超参数网格搜索和智能模型训练,得到多个并列的子模型其中,异质智能算法包括BP神经网络、概率神经网络和决策树算法;
委员会机器组合器集成采用相对多数投票法、绝对多数投票法和加权投票法和学习法,其中,相对多数投票法以各子模型预测结果频数最多的判别结果作为输出,当不止一个结果频数最多时,选择训练性能最好的子模型输出作为最终判别结果;其中,绝对多数投票法以子模型预测结果频数超过总频数一半的判别结果作为输出,当不存在频数过半的情况时,拒绝预测;加权投票法为每一类预测结果赋予最优化权重,最终得分最高的判别结果作为输出;学习法利用智能算法建立所有子模型输出与真实结果的非线性映射关系,利用这一关系指导未知数据预测结果的组合。
10.根据权利要求6所述的多专家分类委员会机器测井流体识别的方法,其特征在于,委员会机器预测模块以多专家分类委员会机器流体识别模型为核心,包括多个训练完成的子模型和组合器,用于将测井数据进行数据清洗和环境校正后,输入到子模型中进行流体类型判别,通过组合器输出最终的流体类型判别结果。
CN202110939640.9A 2021-08-16 2021-08-16 多专家分类委员会机器测井流体识别的方法及*** Pending CN113592028A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110939640.9A CN113592028A (zh) 2021-08-16 2021-08-16 多专家分类委员会机器测井流体识别的方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110939640.9A CN113592028A (zh) 2021-08-16 2021-08-16 多专家分类委员会机器测井流体识别的方法及***

Publications (1)

Publication Number Publication Date
CN113592028A true CN113592028A (zh) 2021-11-02

Family

ID=78258106

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110939640.9A Pending CN113592028A (zh) 2021-08-16 2021-08-16 多专家分类委员会机器测井流体识别的方法及***

Country Status (1)

Country Link
CN (1) CN113592028A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115545356A (zh) * 2022-11-30 2022-12-30 深圳市峰和数智科技有限公司 预测模型的确定方法、s波走时曲线预测方法及相关设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101787884A (zh) * 2010-01-28 2010-07-28 中国石油集团川庆钻探工程有限公司 声波孔隙度和中子孔隙度差值储层流体类型判别方法
CN108596251A (zh) * 2018-04-25 2018-09-28 中国地质大学(北京) 一种基于委员会机器利用测井数据进行储层流体识别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101787884A (zh) * 2010-01-28 2010-07-28 中国石油集团川庆钻探工程有限公司 声波孔隙度和中子孔隙度差值储层流体类型判别方法
CN108596251A (zh) * 2018-04-25 2018-09-28 中国地质大学(北京) 一种基于委员会机器利用测井数据进行储层流体识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
白洋等: "致密砂岩气藏动态分类委员会机器测井流体识别方法", 《地球物理学报》, vol. 64, no. 5, pages 1 - 2 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115545356A (zh) * 2022-11-30 2022-12-30 深圳市峰和数智科技有限公司 预测模型的确定方法、s波走时曲线预测方法及相关设备
CN115545356B (zh) * 2022-11-30 2024-02-27 深圳市峰和数智科技有限公司 预测模型的确定方法、s波走时曲线预测方法及相关设备

Similar Documents

Publication Publication Date Title
CN109086824B (zh) 一种基于卷积神经网络的海底底质声呐图像分类方法
Liu et al. Deep classified autoencoder for lithofacies identification
CN108897975A (zh) 基于深度信念网络的煤层气测井含气量预测方法
CN110751186B (zh) 一种基于监督式表示学习的跨项目软件缺陷预测方法
CN113359212B (zh) 一种基于深度学习的储层特征预测方法及模型
CN110657984A (zh) 一种基于强化胶囊网络的行星齿轮箱故障诊断方法
CN112733447B (zh) 一种基于域自适应网络的水下声源定位方法及***
CN115758212A (zh) 一种基于并行网络和迁移学习的机械设备故障诊断方法
CN109858523A (zh) 一种神经网络和射线理论的浅海声速剖面反演方法
CN111381275A (zh) 一种地震数据的初至拾取方法和装置
CN115146700A (zh) 一种基于Transformer序列到序列模型的径流预测方法
CN113780242A (zh) 一种基于模型迁移学习的跨场景水声目标分类方法
CN108288092A (zh) 一种利用核磁共振t2谱形态获取致密砂岩渗透率的方法
CN114723095A (zh) 缺失测井曲线预测方法及装置
CN113687433A (zh) 一种基于Bi-LSTM的大地电磁信号去噪方法及***
CN115185937A (zh) 一种基于sa-gan架构的时间序列异常检测方法
CN117708656B (zh) 一种面向单源域的滚动轴承跨域故障诊断方法
CN114487129B (zh) 基于声发射技术的柔性材料的损伤识别方法
CN114676733A (zh) 一种基于稀疏自编码辅助分类生成式对抗网络的复杂供输机构故障诊断方法
CN114357372A (zh) 一种基于多传感器数据驱动的飞机故障诊断模型生成方法
CN113592028A (zh) 多专家分类委员会机器测井流体识别的方法及***
CN117093922A (zh) 一种基于改进svm的不平衡样本油藏复杂流体识别方法
CN110552693A (zh) 一种基于深度神经网络的感应测井曲线的层界面识别方法
CN112987091A (zh) 储层检测方法、装置、电子设备和存储介质
CN116990865B (zh) 基于深度迁移学习的微地震事件检测方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination