CN116882119A - 储层参数预测模型建立方法、装置、电子设备和存储介质 - Google Patents
储层参数预测模型建立方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN116882119A CN116882119A CN202210313179.0A CN202210313179A CN116882119A CN 116882119 A CN116882119 A CN 116882119A CN 202210313179 A CN202210313179 A CN 202210313179A CN 116882119 A CN116882119 A CN 116882119A
- Authority
- CN
- China
- Prior art keywords
- model
- data
- reservoir parameter
- generator
- generator model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000012549 training Methods 0.000 claims abstract description 82
- 238000013528 artificial neural network Methods 0.000 claims abstract description 37
- 238000007781 pre-processing Methods 0.000 claims abstract description 19
- 238000012847 principal component analysis method Methods 0.000 claims abstract description 16
- 230000015654 memory Effects 0.000 claims description 18
- 238000005457 optimization Methods 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 15
- 238000012795 verification Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 12
- 238000012360 testing method Methods 0.000 claims description 12
- 238000004458 analytical method Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 4
- 238000010801 machine learning Methods 0.000 description 12
- 210000002569 neuron Anatomy 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 238000007637 random forest analysis Methods 0.000 description 7
- 238000012706 support-vector machine Methods 0.000 description 7
- 239000004215 Carbon black (E152) Substances 0.000 description 6
- 229930195733 hydrocarbon Natural products 0.000 description 6
- 150000002430 hydrocarbons Chemical class 0.000 description 6
- 230000004913 activation Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 239000003129 oil well Substances 0.000 description 3
- 108010014173 Factor X Proteins 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000009123 feedback regulation Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/22—Yield analysis or yield optimisation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A10/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
- Y02A10/40—Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- Artificial Intelligence (AREA)
- Quality & Reliability (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Geometry (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Computer Hardware Design (AREA)
- Primary Health Care (AREA)
- Life Sciences & Earth Sciences (AREA)
- Operations Research (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开一种储层参数预测模型建立方法、装置、电子设备和存储介质,其中预测模型建立方法包括:获取储层参数数据以及储层参数数据的影响因素数据;针对影响因素数据利用主成分分析方法进行预处理,生成主成分影响因素,并从得到的所有主成分影响因素中选取设定数量个主成分影响因素;利用全连接神经网络搭建条件生成式对抗网络中的生成器模型;利用全连接神经网络搭建条件生成式对抗网络中的判别器模型;利用建立好的生成器模型和判别器模型建立组合模型;利用组合模型对生成器模型和判别器模型进行训练学习,直至生成器模型生成的对应条件下的储层参数预测数据与真实的储层参数数据的误差小于设定值,此时的生成器模型为储层参数预测模型。
Description
技术领域
本发明涉及油气藏开发技术领域,尤其涉及一种储层参数预测模型建立方法、装置、电子设备和存储介质。
背景技术
传统预测方法:地质统计学方法。它以区域化变量理论为基础,充分考虑了地质参数空间变化的趋势、方向性及两样点参数的相互依赖性等等,求出比较符合地质规律的地质统计模型和方法,来表征各种储层参数的变化规律,然后用这种规律,对参数的空间展布进行预测。
机器学习方法:全连接神经网络(FCNN)、随机森林(RF)、支持向量机(SVM)。利用机器学习算法,对大量的储层参数数据进行学习,从而得到储层参数的预测模型。
现有技术至少存在以下问题:
(1)传统基于地质统计学的储层参数预测方法,考虑储层参数的影响因素有限,理论假设过多,且无法描述储层参数与其影响因素之间的高维、非线性关系,预测精度低;
(2)现今基于机器学习的油气藏储层参数预测模型,没有涉及到条件生成式对抗网络,而条件生成式对抗网络在多个领域展现出比LSTM、FCNN、RF、SVM更强的预测精准度;
(3)现今基于机器学习的油气藏储层参数预测模型含有较多的超参数,模型超参数的调整费时费力,而且对最终模型的性能有一定的影响;
(4)无论是传统基于地质统计学的储层参数预测方法,还是现今基于机器学习的油气藏储层参数预测模型建立方法,其用于储层参数预测的输入参数大都是人为选取的,即使有少量的研究者对输入参数进行了一些筛选和预处理,但是未能与最终预测模型的性能形成***的自动反馈调节机制,即根据模型的预测效果自动地对输入参数进行筛选和预处理。
因此,期待一种新的油气藏储层参数预测模型建立方法,能够提高参数预测精度。
发明内容
本发明的目的是提出一种储层参数预测模型建立方法、装置、电子设备和存储介质,能够提高参数预测精度。
为了实现上述目的,本发明提供了一种气水两相启动压力梯度测试装置,包括:步骤1:获取油田上每口井的储层参数数据以及所述储层参数数据的影响因素数据;
步骤2:针对每口井的所述储层参数数据的影响因素数据利用主成分分析方法进行预处理,生成主成分影响因素,并从得到的所有所述主成分影响因素中选取设定数量个主成分影响因素;
步骤3:利用全连接神经网络搭建条件生成式对抗网络中的生成器模型,所述生成器模型的条件输入为:所述步骤2中的选取的所述设定数量个主成分影响因素,所述生成器模型的输出为:当前设定数量个主成分影响因素下的储层参数预测数据;
步骤4:利用全连接神经网络搭建条件生成式对抗网络中的判别器模型,所述判别器模型的输入为:所述步骤1中收集的真实的所述储层参数数据或者所述步骤3中所述生成器模型生成的预测数据,以及所述步骤2中的选取的所述设定数量个主成分影响因素;所述判别器模型的输出为概率,所述概率为所述判别器模型的输入为真实的所述储层参数数据而非所述生成器模型生成的储层参数预测数据的概率;
步骤5:利用建立好的所述生成器模型和所述判别器模型建立组合模型,所述组合模型能够调用所述生成器模型和所述判别器模型;利用所述组合模型对所述生成器模型和所述判别器模型进行训练学习,直至所述生成器模型生成的对应条件下的所述储层参数预测数据与真实的所述储层参数数据的误差小于设定值,此时的所述生成器模型为储层参数预测模型。
根据本发明一种具体实施方式,所述步骤1包括:将所述影响因素数据按照设定的比例划分为训练集、验证集以及测试集;
在所述步骤2中,对所述训练集中的所述影响因素数据利用主成分分析方法进行预处理。
根据本发明一种优选实施方式,所述步骤5中,利用所述组合模型对所述生成器模型和所述判别器模型进行训练学习包括:
从所述训练集中选择第一批次的训练样本,以所述训练集中该批次每口井的所述设定数量个主成分影响因素作为生成器的条件输入,利用所述生成器模型,输出所述生成器模型对应条件下的储层参数预测数据;
将所述生成器模型的所述设定数量个主成分影响因素与所述生成器模型输出的所述储层参数预测数据组合,设置标签为0,形成虚假数据集,输入到所述判别器模型中;并将所述生成器模型的所述设定数量个主成分影响因素以及对应的真实的所述储层参数数据组合,设置标签为1,形成真实数据集,也输入到所述判别器模型中,对所述判别器模型进行训练学习;
之后,将所述生成器模型的所述设定数量个主成分影响因素与所述生成器模型输出的所述储层参数预测数据组合,设置标签为1,伪装为真实数据集,输入所述组合模型内,实现对所述生成器模型的训练学习;
从所述训练集中选择下个批次的训练样本,重复上述步骤,对所述判别器模型和所述生成器模型进行重复训练学习以实现条件生成式对抗网络的一次迭代训练,进行多次所述迭代训练,直至所述生成器模型生成的对应条件下的所述储层参数预测数据与真实的所述储层参数数据的误差小于设定值。
根据本发明一种具体实施方式,利用全连接神经网络搭建条件生成式对抗网络中的生成器模型包括:
设置全连接神经网络层,对所述设定数量个主成分影响因素进行预处理,将所述预处理后的数据与所述生成器模型生成的随机噪声数据拼接起来;再次设置全连接神经网络层,对拼接后的数据进行处理,从而输出当前所述设定数量个主成分影响因素下的储层参数预测数据。
根据本发明一种具体实施方式,利用全连接神经网络搭建条件生成式对抗网络中的判别器模型包括:
利用全连接神经网络层,对所述设定数量个主成分影响因素进行预处理,将所述预处理后的数据与所述步骤1中收集的真实的所述储层参数数据或者所述生成器模型生成的预测数据拼接起来,再利用全连接神经网络层对拼接后的数据进行处理,从而输出,所述判别器模型的输入为真实的所述储层参数数据而非所述生成器模型生成的储层参数预测数据的概率。
根据本发明一种优选实施方式,所述方法还包括:利用贝叶斯超参数优化方法对所述生成器模型进行优化,将优化后的所述生成器模型确定为最终的所述储层参数预测模型。
具体地,所述步骤5中,在所述组合模型调用所述生成器模型和所述判别器模型的过程中,所述判别器模型的网络权重不发生变化,所述生成器模型的网络权重随着输入数据的训练而发生变化。
本发明另一公开实例提供了一种电子设备,包括:
存储器,存储有可执行指令;
处理器,所述处理器运行所述存储器中的所述可执行指令,以实现上述的储层参数预测模型建立方法。
本发明另一公开实例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的储层参数预测模型建立方法。
本发明再一公开实例提供了一种储层参数预测模型建立装置,包括:
数据获取模块,所述数据获取模块用于获取油田上每口井的储层参数数据以及所述储层参数数据的影响因素数据;
分析模块,所述分析模块用于针对每口井的所述储层参数数据的影响因素数据利用主成分分析方法进行预处理,生成主成分影响因素,并从得到的所有所述主成分影响因素中选取设定数量个主成分影响因素;
生成器模型模块,所述生成器模型模块用于利用全连接神经网络搭建条件生成式对抗网络中的生成器模型,所述生成器模型的条件输入为:所述分析模块中的选取的所述设定数量个主成分影响因素,所述生成器模型的生成对象为:当前设定数量个主成分影响因素下的储层参数预测数据。
判别器模型模块,所述判别器模型模块用于利用全连接神经网络搭建条件生成式对抗网络中的判别器模型,所述判别器模型的输入为:所述数据获取模块获取的真实的所述储层参数数据或者所述生成器模型生成的预测数据,所述判别器模型的输出为概率,所述概率为所述判别器模型的输入为真实的所述储层参数数据的概率;
预测模块,所述预测模块用于利用建立好的所述生成器模型和所述判别器模型建立组合模型,所述组合模型能够调用所述生成器模型和所述判别器模型;利用所述组合模型对所述生成器模型和所述判别器模型进行训练学习,直至所述生成器模型生成的对应条件下的所述储层参数预测数据与真实的所述储层参数数据的误差小于设定值,此时的所述生成器模型为储层参数预测模型。
本发明的有益效果在于:
将机器学习方法中的条件生成式对抗网络与油气藏储层参数预测相结合,利用对大量油气藏储层参数的分布数据进行学习,建立了数据驱动的油气藏储层参数预测模型,提高了模型预测精度;
进一步地,建模过程中,利用主成分分析方法对模型输入数据进行预处理,并首次利用贝叶斯优化方法对主成分的选取个数以及网络中的超参数进行优化,综合提高了模型预测精度;
进一步地,该储层参数预测模型将主成分分析方法、条件生成式对抗网络、贝叶斯优化三者有机结合,形成***理论,是一种新的储层参数预测思路和方法,开辟了条件生成式对抗网络在储层参数预测的先例,对油气藏新井储层参数预测以及油气藏开发方案设计具有重要意义。
本发明具有其它的特性和优点,这些特性和优点从并入本文中的附图和随后的具体实施方式中将是显而易见的,或者将在并入本文中的附图和随后的具体实施方式中进行详细陈述,这些附图和具体实施方式共同用于解释本发明的特定原理。
附图说明
通过结合附图对本发明示例性实施例进行更详细的描述,本发明的上述以及其它目的、特征和优势将变得更加明显。
图1是根据本发明一实施例的储层参数预测模型建立方法的流程图。
图2是根据本发明一实施例的生成器模型结构示意图。
图3是根据本发明一实施例的判别器模型结构示意图。
图4是根据本发明一实施例的组合模型结构示意图。
具体实施方式
以下结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本发明中的各个实施例以及各实施例中的各个特征可以互相结合,所形成的技术方案均在本发明的保护范围之内。
条件生成式对抗网络(CGAN)作为一种较为新型的机器学习方法,暂时还未应用到油气藏储层参数预测上。但是,在其他研究领域,条件生成式对抗网络已经得到了较为广泛的应用,并且在这些领域的相关参数预测上展现出了比长短期记忆神经网络(LSTM)、全连接神经网络(FCNN)、随机森林(RF)以及支持向量机(SVM)等传统机器学习方法具有更高的预测精度。
因此,本发明将条件生成式对抗网络与油气藏储层参数预测相结合,提出了一种基于条件生成式对抗网络的油气藏储层参数预测模型建立方法。通过条件生成式对抗网络(CGAN)的对抗式训练,学习油气藏储层参数的复杂分布规律,建立起储层参数与其影响因素之间的非线性映射关系,并利用主成分分析方法筛选输入参数、利用贝叶斯超参数优化方法优化模型结构,综合提高模型的预测精度,从而实现对未知区域储层参数的精准预测,为油田的下一步开发提供了可靠的依据,助力油气藏的高效开发。
本发明一实施例提供了一种储层参数预测模型建立方法,参考图1,该方法包括:
步骤1:获取油田上每口井的储层参数数据以及所述储层参数数据的影响因素数据;
步骤2:针对每口井的所述储层参数数据的影响因素数据利用主成分分析方法进行预处理,生成主成分影响因素,并从得到的所有所述主成分影响因素中选取设定数量个主成分影响因素;
步骤3:利用全连接神经网络搭建条件生成式对抗网络中的生成器模型,所述生成器模型的条件输入为:所述步骤2中的选取的所述设定数量个主成分影响因素,所述生成器模型的输出为:当前设定数量个主成分影响因素下的储层参数预测数据;
步骤4:利用全连接神经网络搭建条件生成式对抗网络中的判别器模型,所述判别器模型的输入为:所述步骤1中收集的真实的所述储层参数数据或者所述步骤3中所述生成器模型生成的预测数据,以及所述步骤2中的选取的所述设定数量个主成分影响因素;所述判别器模型的输出为概率,所述概率为所述判别器模型的输入为真实的所述储层参数数据而非所述生成器模型生成的储层参数预测数据的概率;
步骤5:利用建立好的所述生成器模型和所述判别器模型建立组合模型,所述组合模型能够调用所述生成器模型和所述判别器模型;利用所述组合模型对所述生成器模型和所述判别器模型进行训练学习,直至所述生成器模型生成的对应条件下的所述储层参数预测数据与真实的所述储层参数数据的误差小于设定值,此时的所述生成器模型为储层参数预测模型。
本实施例中,所述步骤1包括:将所述影响因素数据按照设定的比例划分为训练集、验证集以及测试集;在所述步骤2中,对所述训练集中的所述影响因素数据利用主成分分析方法进行预处理。
本实施例中,所述步骤5中,利用所述组合模型对所述生成器模型和所述判别器模型进行训练学习包括:从所述训练集中选择第一批次的训练样本,以所述训练集中该批次每口井的所述设定数量个主成分影响因素作为生成器的条件输入,利用所述生成器模型,输出所述生成器模型对应条件下的储层参数预测数据;将所述生成器模型的所述设定数量个主成分影响因素与所述生成器模型输出的所述储层参数预测数据组合,设置标签为0,形成虚假数据集,输入到所述判别器模型中;并将所述生成器模型的所述设定数量个主成分影响因素以及对应的真实的所述储层参数数据组合,设置标签为1,形成真实数据集,也输入到所述判别器模型中,对所述判别器模型进行训练学习;之后,将所述生成器模型的所述设定数量个主成分影响因素与所述生成器模型输出的所述储层参数预测数据组合,设置标签为1,伪装为真实数据集,输入所述组合模型内,实现对所述生成器模型的训练学习;从所述训练集中选择下个批次的训练样本,重复上述步骤,对所述判别器模型和所述生成器模型进行重复训练学习以实现条件生成式对抗网络的一次迭代训练,进行多次所述迭代训练,直至所述生成器模型生成的对应条件下的所述储层参数预测数据与真实的所述储层参数数据的误差小于设定值。
本实施例中,利用全连接神经网络搭建条件生成式对抗网络中的生成器模型包括:设置全连接神经网络层,对所述设定数量个主成分影响因素进行预处理,将所述预处理后的数据与所述生成器模型生成的随机噪声数据拼接起来;再次设置全连接神经网络层,对拼接后的数据进行处理,从而输出当前所述设定数量个主成分影响因素下的储层参数预测数据。
本实施例中,利用全连接神经网络搭建条件生成式对抗网络中的判别器模型包括:利用全连接神经网络层,对所述设定数量个主成分影响因素进行预处理,将所述预处理后的数据与所述步骤1中收集的真实的所述储层参数数据或者所述生成器模型生成的预测数据拼接起来,再利用全连接神经网络层对拼接后的数据进行处理,从而输出,所述判别器模型的输入为真实的所述储层参数数据而非所述生成器模型生成的储层参数预测数据的概率。
本实施例中,所述方法还包括:利用贝叶斯超参数优化方法对所述生成器模型进行优化,将优化后的所述生成器模型确定为最终的所述储层参数预测模型。
本实施例中,所述步骤5中,在所述组合模型调用所述生成器模型和所述判别器模型的过程中,所述判别器模型的网络权重不发生变化,所述生成器模型的网络权重随着输入数据的训练而发生变化。
本实施例将机器学习方法中的条件生成式对抗网络与油气藏储层参数预测相结合,利用对大量油气藏储层参数的分布数据进行学习,建立了数据驱动的油气藏储层参数预测模型,提高了模型预测精度;
进一步地,建模过程中,利用主成分分析方法对模型输入数据进行预处理,并首次利用贝叶斯优化方法对主成分的选取个数以及网络中的超参数进行优化,综合提高了模型预测精度;
进一步地,该储层参数预测模型将主成分分析方法、条件生成式对抗网络、贝叶斯优化三者有机结合,形成***理论,是一种新的储层参数预测思路和方法,开辟了条件生成式对抗网络在储层参数预测的先例,对油气藏新井储层参数预测以及油气藏开发方案设计具有重要意义。
实施例1
为了使本发明的目的、技术方案和优点更加清楚,下面将结合油气藏储层参数预测实例对本发明实施方式作更加详细的描述:
第一步:收集油田上每口油气井的储层参数数据以及相应的储层参数影响因素数据,并按照一定的比例划分为训练集、验证集以及测试集。其中,储层参数数据包括储层孔隙度、储层渗透率、储层含油饱和度、储层含气饱和度、储层含水饱和度等;储层参数影响因素包括储层层位名称、储层层位经度、储层层位纬度、储层层位海拔深度、储层层位所在区块名称等。
见表1,为收集的某气田125口气井的孔隙度参数数据以及相应的储层孔隙度影响因素数据,本次收集到的储层参数影响因素数据主要包括井底经度、井底纬度、井底东距、井底北距、井底边界方向、井底边界距离、井底测量方向、井底测量距离、储层平均样品中部深度,本次收集的储层孔隙度数据为一口井中某储层的平均孔隙度。
以气井为基本单位,将所有数据按照6:2:2的比例划分为训练集、验证集以及测试集,则训练集有75组油井的数据,验证集有25口油井的数据,测试集有25口油井的数据。
第二步:利用主成分分析方法对训练集、验证集以及测试集中储层参数的影响因素数据进行预处理,生成主成分影响因素,并从得到的所有主成分影响因素中选取P个主成分。其中,P为一个变量,具体将由最终产生的预测模型的性能决定。
第三步:基于主成分处理后的各个数据集,首先对训练集数据进行最大最小归一化处理,然后,利用训练集数据的最大值和最小值对验证集和测试集数据进行相同的处理。
最大最小归一化公式如下:
第四步:利用全连接神经网络(FCNN)搭建条件生成式对抗网络中的生成器模型。其中,生成器模型的条件输入为:从训练集中得到的所有主成分影响因素中选取P个主成分;生成器模型的生成对象为:当前P个主成分影响因素下对应的储层参数预测数据。
参照附图2,首先设置FCNN层,来对条件X,即第三步中归一化后的P个主成分影响因素,进行预处理;然后,将经过FCNN层预处理后的数据与生成器生成的随机噪声数据Z连接起来;最后,再次设置FCNN层来对拼接后的数据进行处理,从而输出当前P个主成分影响因素下的储层预测孔隙度Y′。其中,生成器模型超参数设置如下:(1)将对输入的归一化后的P个主成分影响因素X进行预处理的FCNN层层数设置为A1、每层神经元个数设置B1、每层丢弃率设置为C1;(2)将对拼接后数据进行处理的FCNN网络的层数设置为D1、每层神经元个数设置E1、每层丢弃率设置为F1;(3)将生成网络中Adam优化器的初始学习速率设置为G1;
第五步:利用全连接神经网络(FCNN)搭建条件生成式对抗网络中的判别器模型。其中,判别器模型接受两个输入,第一个输入为条件X,即第三步中归一化后的P个主成分影响因素,进行预处理,第二个为条件X对应的真实储层孔隙度数据Y或者生成器在条件X下生成的预测储层孔隙度数据Y′。判别器模型的输出为:所输入样本来自真实的训练数据而不是生成模型合成的数据的概率,如果输出的概率>0.5,这说明这类数据的标签为1,属于真实数据,反之,则为假数据,即是生成器生成的数据。
参照附图3,判别器模型设置时,首先设置FCNN层,来对条件X,即第三步中归一化后的P个主成分影响因素,进行预处理;然后,将经过FCNN层预处理后的数据与输入的储层孔隙度数据(条件X对应的真实储层孔隙度数据Y或者生成器在条件X下生成的预测储层孔隙度数据Y′)连接起来;最后,再次设置FCNN层来对拼接后的数据进行处理,并且,此FCNN层的最后一层的神经元个数为1,激活函数为sigmoid,输出当前所输入的数据是真实数据的概率,如果输出的概率>0.5,属于真实数据,反之,则为假数据,即是生成器生成的数据。其中,判别器模型的参数设置:由于判别器模型的主体结构与生成器模型相似,所以其参数设置与生成器模型参数的设置也相似:(1)将对输入的归一化后的P个主成分影响因素X进行预处理的FCNN层层数设置为A2、神经元个数设置B2、每层丢弃率设置为C2;(2)将对拼接后数据进行处理的FCNN网络的层数设置为D2、每层神经元个数设置E2、每层丢弃率设置为F2;(3)将判别网络中Adam优化器的初始学习速率设置为G2;
第六步:参考附图4,利用建立好的生成器模型以及判别器模型,建立一个组合模型,该模型可以调用生成器模型和判别器模型,在调用过程中,判别器模型的网络的权重不发生变化,生成器模型的网络权重则会随着输入数据的训练而发生变化。
第七步:首先,从训练集数据中选择第一个批次的训练样本,这个批次内的训练样本数为H2,利用建立好的生成器模型,以得到的训练集中该批次每口油气井的P个储层参数主成分影响因素为生成器模型的条件输入,输出生成器模型第一次生成的对应条件下的油气井储层参数数据;然后,将生成器模型的条件输入与生成器模型输出的油气井储层参数组合,设置标签为0,输入到判别器模型里;同时,将生成器模型的条件输入以及对应的真实的油气井储层参数数据组合,设置标签为1,也送入判别器模型里,让判别器模型进行第一次的学习,即第一次对真假数据进行学习;最后,将生成器模型的条件输入与生成器模型输出的油气井储层参数组合,设置标签为1,输入第五步中建立的组合模型内,实现对生成器模型的单独训练学习,而不影响判别器模型,提高生成器模型生成数据的能力。
第八步:从训练集数据中选择第下个批次的训练样本,这个批次内的训练样本数也为H2,重复第七步的过程,如此往复,直至训练集中剩下的样本数不足H2时,就将剩下的所有样本当成一个批次,重复第七步,进行训练。此时,训练集中所有样本都经过一次训练后,即实现了条件生成式对抗网络的一次迭代训练过程,也称为一个训练周期,生成器模型和判别器模型的性能将会随着交替迭代训练次数(H1)的增加,逐渐提高。
第九步:重复第七步、第八步,进行H1次交替迭代训练。当重复到一定的次数时,生成器模型产生的对应条件下的油气井储层参数数据,将非常接近真实数据,也就实现了储层参数的预测功能。训练过程中同时监控每一次交替迭代训练完成后生成器模型在验证集上的预测误差,并将每次交替迭代训练后的生成器模型单独保存下来,最后选取训练过程中在验证集上误差最小的生成器模型,该模型即为储层参数预测模型。
第十步:利用贝叶斯超参数优化方法,对生成器模型网络与判别器模型网络中设置的超参数、选取的主成分个数(P值)、第八步中设置的每次迭代训练过程中这个批次内的训练样本数(H2)以及第九步中的迭代训练次数(H1)进行优化,寻找使模型在验证集中预测效果最好的参数组合。其中,贝叶斯优化时,会先随机使用几组超参数、P值以及迭代训练次数,进行试算,试算的次数可以人为设置,这里将试算次数设置为10;然后,再进行真正的贝叶斯优化,试算结束以后的每一次贝叶斯优化,都会参考之前计算的结果,也就是模型在验证集上的表现,从而选择下一次计算时应该使用的超参数、P值以及迭代训练次数,这里将真正执行贝叶斯优化的步数设置为40。
第十一步:利用通过贝叶斯超参数优化得到的第十步中各类参数的最优组合,建立储层参数预测模型。该模型即为我们将用来对未知区域新油气井的储层参数进行预测的模型,输入该位置区域新油气井的储层参数影响因素数据,即可预测出对应位置处新井的储层参数值。
经过程序运行得到各参数的最优组合如下:
在生成器模型网络中,对输入的影响因素X进行预处理的FCNN层设置为4层,每层神经元数量设置为181,每层的丢弃率为0.3948,激活函数均为relu;对拼接后数据进行处理的FCNN层设置为3层,前两层神经元数量设置为220,前两层网络每层的丢弃率为0.0446,第3层神经元数量设置为1,前2层的激活函数均为relu,最后1层的激活函数为是tanh,其他均为relu。生成网络中Adam优化器的初始学习速率设置为0.0009613。
在判别器模型网络中,对输入影响因素X进行预处理的FCNN层设置为2层,每层神经元数量设置为16,每层的丢弃率为0.4282,激活函数均为relu;对拼接后数据进行处理的FCNN设置为3层,前2层每层神经元数量设置为79,前两层网络每层的丢弃率为0.4834,最后1层神经元数量设置为1,前2层的激活函数均为relu,最后1层的激活函数为sigmoid。判别网络中Adam优化器的初始学习速率设置为0.0008748。
训练周期数经过贝叶斯优化后设置为505,每个训练周期内每个批次送入模型进行交替迭代训练的样本数量被优化为10。
根据同样的训练集数据,分别利用FCNN、RF、SVM这3种机器学习方法建立了储层孔隙度预测模型,并结合贝叶斯算法和验证集数据对各个模型的结构进行了优化。最后,利用同样未经过训练的测试集数据,对各个优化后模型的预测精度进行了评价。参照表2,
表2孔隙度预测平均绝对百分比误差
从表2中可以看到,4中基于机器学***均绝对百分比误差明显低于其他三种传统的机器学习方法,体现了CGAN强大的拟合能力,具有比FCNN、RF、SVM更高的预测精度,与CGAN在其他领域上反映出的良好性能相互印证。
实施例2
本公开提供一种电子设备包括,该电子设备包括:存储器,存储有可执行指令;处理器,处理器运行存储器中的可执行指令,以实现上述储层参数预测模型建立方法。
根据本公开实施例的电子设备包括存储器和处理器。
该存储器用于存储非暂时性计算机可读指令。具体地,存储器可以包括一个或多个计算机程序产品,该计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。该易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。该非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。
该处理器可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元,并且可以控制电子设备中的其它组件以执行期望的功能。在本公开的一个实施例中,该处理器用于运行该存储器中存储的该计算机可读指令。
实施例3
本公开实施例提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述储层参数预测模型建立方法。
根据本公开实施例的计算机可读存储介质,其上存储有非暂时性计算机可读指令。当该非暂时性计算机可读指令由处理器运行时,执行前述的本公开各实施例方法的全部或部分步骤。
上述计算机可读存储介质包括但不限于:光存储介质(例如:CD-ROM和DVD)、磁光存储介质(例如:MO)、磁存储介质(例如:磁带或移动硬盘)、具有内置的可重写非易失性存储器的媒体(例如:存储卡)和具有内置ROM的媒体(例如:ROM盒)。
实施例4
本公开实施例提供一种储层参数预测模型建立装置,包括:
数据获取模块,所述数据获取模块用于获取油田上每口井的储层参数数据以及所述储层参数数据的影响因素数据;
分析模块,所述分析模块用于针对每口井的所述储层参数数据的影响因素数据利用主成分分析方法进行预处理,生成主成分影响因素,并从得到的所有所述主成分影响因素中选取设定数量个主成分影响因素;
生成器模型模块,所述生成器模型模块用于利用全连接神经网络搭建条件生成式对抗网络中的生成器模型,所述生成器模型的条件输入为:所述分析模块中的选取的所述设定数量个主成分影响因素,所述生成器模型的生成对象为:当前设定数量个主成分影响因素下的储层参数预测数据。
判别器模型模块,所述判别器模型模块用于利用全连接神经网络搭建条件生成式对抗网络中的判别器模型,所述判别器模型的输入为:所述数据获取模块获取的真实的所述储层参数数据或者所述生成器模型生成的预测数据,所述判别器模型的输出为概率,所述概率为所述判别器模型的输入为真实的所述储层参数数据的概率;
预测模块,所述预测模块用于利用建立好的所述生成器模型和所述判别器模型建立组合模型,所述组合模型能够调用所述生成器模型和所述判别器模型;利用所述组合模型对所述生成器模型和所述判别器模型进行训练学习,直至所述生成器模型生成的对应条件下的所述储层参数预测数据与真实的所述储层参数数据的误差小于设定值,此时的所述生成器模型为储层参数预测模型。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。
Claims (10)
1.一种储层参数预测模型建立方法,其特征在于,包括:
步骤1:获取油田上每口井的储层参数数据以及所述储层参数数据的影响因素数据;
步骤2:针对每口井的所述储层参数数据的影响因素数据利用主成分分析方法进行预处理,生成主成分影响因素,并从得到的所有所述主成分影响因素中选取设定数量个主成分影响因素;
步骤3:利用全连接神经网络搭建条件生成式对抗网络中的生成器模型,所述生成器模型的条件输入为:所述步骤2中的选取的所述设定数量个主成分影响因素,所述生成器模型的输出为:当前设定数量个主成分影响因素下的储层参数预测数据;
步骤4:利用全连接神经网络搭建条件生成式对抗网络中的判别器模型,所述判别器模型的输入为:所述步骤1中收集的真实的所述储层参数数据或者所述步骤3中所述生成器模型生成的预测数据,以及所述步骤2中的选取的所述设定数量个主成分影响因素;所述判别器模型的输出为概率,所述概率为所述判别器模型的输入为真实的所述储层参数数据而非所述生成器模型生成的储层参数预测数据的概率;
步骤5:利用建立好的所述生成器模型和所述判别器模型建立组合模型,所述组合模型能够调用所述生成器模型和所述判别器模型;利用所述组合模型对所述生成器模型和所述判别器模型进行训练学习,直至所述生成器模型生成的对应条件下的所述储层参数预测数据与真实的所述储层参数数据的误差小于设定值,此时的所述生成器模型为储层参数预测模型。
2.根据权利要求1所述的储层参数预测模型建立方法,其特征在于,所述步骤1包括:将所述影响因素数据按照设定的比例划分为训练集、验证集以及测试集;
在所述步骤2中,对所述训练集中的所述影响因素数据利用主成分分析方法进行预处理。
3.根据权利要求2所述的储层参数预测模型建立方法,其特征在于,所述步骤5中,利用所述组合模型对所述生成器模型和所述判别器模型进行训练学习包括:
从所述训练集中选择第一批次的训练样本,以所述训练集中该批次每口井的所述设定数量个主成分影响因素作为生成器的条件输入,利用所述生成器模型,输出所述生成器模型对应条件下的储层参数预测数据;
将所述生成器模型的所述设定数量个主成分影响因素与所述生成器模型输出的所述储层参数预测数据组合,设置标签为0,形成虚假数据集,输入到所述判别器模型中;并将所述生成器模型的所述设定数量个主成分影响因素以及对应的真实的所述储层参数数据组合,设置标签为1,形成真实数据集,也输入到所述判别器模型中,对所述判别器模型进行训练学习;
之后,将所述生成器模型的所述设定数量个主成分影响因素与所述生成器模型输出的所述储层参数预测数据组合,设置标签为1,伪装为真实数据集,输入所述组合模型内,实现对所述生成器模型的训练学习;
从所述训练集中选择下个批次的训练样本,重复上述步骤,对所述判别器模型和所述生成器模型进行重复训练学习以实现条件生成式对抗网络的一次迭代训练,进行多次所述迭代训练,直至所述生成器模型生成的对应条件下的所述储层参数预测数据与真实的所述储层参数数据的误差小于设定值。
4.根据权利要求1所述的储层参数预测模型建立方法,其特征在于,利用全连接神经网络搭建条件生成式对抗网络中的生成器模型包括:
设置全连接神经网络层,对所述设定数量个主成分影响因素进行预处理,将所述预处理后的数据与所述生成器模型生成的随机噪声数据拼接起来;再次设置全连接神经网络层,对拼接后的数据进行处理,从而输出当前所述设定数量个主成分影响因素下的储层参数预测数据。
5.根据权利要求1所述的储层参数预测模型建立方法,其特征在于,利用全连接神经网络搭建条件生成式对抗网络中的判别器模型包括:
利用全连接神经网络层,对所述设定数量个主成分影响因素进行预处理,将所述预处理后的数据与所述步骤1中收集的真实的所述储层参数数据或者所述生成器模型生成的预测数据拼接起来,再利用全连接神经网络层对拼接后的数据进行处理,从而输出,所述判别器模型的输入为真实的所述储层参数数据而非所述生成器模型生成的储层参数预测数据的概率。
6.根据权利要求1所述的储层参数预测模型建立方法,其特征在于,所述方法还包括:利用贝叶斯超参数优化方法对所述生成器模型进行优化,将优化后的所述生成器模型确定为最终的所述储层参数预测模型。
7.根据权利要求1所述的油气藏储层参数预测模型建立方法,其特征在于,所述步骤5中,在所述组合模型调用所述生成器模型和所述判别器模型的过程中,所述判别器模型的网络权重不发生变化,所述生成器模型的网络权重随着输入数据的训练而发生变化。
8.一种电子设备,其特征在于,所述电子设备包括:
存储器,存储有可执行指令;
处理器,所述处理器运行所述存储器中的所述可执行指令,以实现权利要求1-7中任一项所述的储层参数预测模型建立方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7中任一项所述的储层参数预测模型建立方法。
10.一种储层参数预测模型建立装置,其特征在于,包括:
数据获取模块,所述数据获取模块用于获取油田上每口井的储层参数数据以及所述储层参数数据的影响因素数据;
分析模块,所述分析模块用于针对每口井的所述储层参数数据的影响因素数据利用主成分分析方法进行预处理,生成主成分影响因素,并从得到的所有所述主成分影响因素中选取设定数量个主成分影响因素;
生成器模型模块,所述生成器模型模块用于利用全连接神经网络搭建条件生成式对抗网络中的生成器模型,所述生成器模型的条件输入为:所述分析模块中的选取的所述设定数量个主成分影响因素,所述生成器模型的生成对象为:当前设定数量个主成分影响因素下的储层参数预测数据。
判别器模型模块,所述判别器模型模块用于利用全连接神经网络搭建条件生成式对抗网络中的判别器模型,所述判别器模型的输入为:所述数据获取模块获取的真实的所述储层参数数据或者所述生成器模型生成的预测数据,所述判别器模型的输出为概率,所述概率为所述判别器模型的输入为真实的所述储层参数数据的概率;
预测模块,所述预测模块用于利用建立好的所述生成器模型和所述判别器模型建立组合模型,所述组合模型能够调用所述生成器模型和所述判别器模型;利用所述组合模型对所述生成器模型和所述判别器模型进行训练学习,直至所述生成器模型生成的对应条件下的所述储层参数预测数据与真实的所述储层参数数据的误差小于设定值,此时的所述生成器模型为储层参数预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210313179.0A CN116882119A (zh) | 2022-03-28 | 2022-03-28 | 储层参数预测模型建立方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210313179.0A CN116882119A (zh) | 2022-03-28 | 2022-03-28 | 储层参数预测模型建立方法、装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116882119A true CN116882119A (zh) | 2023-10-13 |
Family
ID=88268577
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210313179.0A Pending CN116882119A (zh) | 2022-03-28 | 2022-03-28 | 储层参数预测模型建立方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116882119A (zh) |
-
2022
- 2022-03-28 CN CN202210313179.0A patent/CN116882119A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gallicchio et al. | Design of deep echo state networks | |
CN113052371B (zh) | 基于深度卷积神经网络的剩余油分布预测方法及装置 | |
Peng et al. | Accelerating minibatch stochastic gradient descent using typicality sampling | |
CN112381264A (zh) | 一种基于改进图卷积神经网络的用电负荷辨识方法 | |
Zhang et al. | Bilateral sensitivity analysis: a better understanding of a neural network | |
Dash et al. | A differential harmony search based hybrid interval type2 fuzzy EGARCH model for stock market volatility prediction | |
CN114548591B (zh) | 一种基于混合深度学习模型和Stacking的时序数据预测方法及*** | |
CN103324954A (zh) | 一种基于树结构的图像分类方法及其*** | |
CN110428015A (zh) | 一种模型的训练方法及相关设备 | |
CN110895729A (zh) | 一种输电线路工程建设工期的预测方法 | |
CN109934422A (zh) | 一种基于时间序列数据分析的神经网络风速预测方法 | |
CN111160459A (zh) | 超参数的优化装置和方法 | |
CN115186936B (zh) | 基于gnn模型的油田最优井网构建方法 | |
CN108062566A (zh) | 一种基于多核潜在特征提取的智能集成软测量方法 | |
CN113128689A (zh) | 一种调控知识图谱的实体关系路径推理方法及*** | |
CN113011895A (zh) | 关联账户样本筛选方法、装置和设备及计算机存储介质 | |
CN104732067A (zh) | 一种面向流程对象的工业过程建模预测方法 | |
Pavlov-Kagadejev et al. | Optimizing long-short-term memory models via metaheuristics for decomposition aided wind energy generation forecasting | |
Hoffmann et al. | Improving automated hyperparameter optimization with case-based reasoning | |
CN113435128A (zh) | 基于条件生成式对抗网络的油气藏产量预测方法及装置 | |
CN115618987A (zh) | 生产井生产数据预测方法、装置、设备和存储介质 | |
CN113095501A (zh) | 一种基于深度强化学***衡分类决策树生成方法 | |
CN116882119A (zh) | 储层参数预测模型建立方法、装置、电子设备和存储介质 | |
CN115345303A (zh) | 卷积神经网络权重调优方法、装置、存储介质和电子设备 | |
CN113656707A (zh) | 一种理财产品推荐方法、***、存储介质及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |