CN116384554A - 机械钻速预测方法、装置、电子设备及计算机存储介质 - Google Patents
机械钻速预测方法、装置、电子设备及计算机存储介质 Download PDFInfo
- Publication number
- CN116384554A CN116384554A CN202310232677.7A CN202310232677A CN116384554A CN 116384554 A CN116384554 A CN 116384554A CN 202310232677 A CN202310232677 A CN 202310232677A CN 116384554 A CN116384554 A CN 116384554A
- Authority
- CN
- China
- Prior art keywords
- rop
- model
- prediction
- data
- mechanical drilling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005553 drilling Methods 0.000 title claims abstract description 69
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000009467 reduction Effects 0.000 claims abstract description 43
- 238000013528 artificial neural network Methods 0.000 claims abstract description 42
- 239000011435 rock Substances 0.000 claims abstract description 15
- 238000012512 characterization method Methods 0.000 claims abstract description 6
- 238000007621 cluster analysis Methods 0.000 claims abstract description 6
- 230000035515 penetration Effects 0.000 claims description 22
- 230000006870 function Effects 0.000 claims description 20
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 14
- 230000000694 effects Effects 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 10
- 238000013507 mapping Methods 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 4
- 238000010521 absorption reaction Methods 0.000 claims description 2
- 238000006073 displacement reaction Methods 0.000 claims description 2
- 238000011010 flushing procedure Methods 0.000 claims description 2
- 238000012360 testing method Methods 0.000 description 29
- 230000015572 biosynthetic process Effects 0.000 description 21
- 238000005755 formation reaction Methods 0.000 description 21
- 238000010801 machine learning Methods 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 8
- 238000001914 filtration Methods 0.000 description 8
- 238000009826 distribution Methods 0.000 description 7
- 238000012549 training Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000007637 random forest analysis Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000011161 development Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 238000002679 ablation Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 239000003345 natural gas Substances 0.000 description 3
- 210000002569 neuron Anatomy 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 238000003064 k means clustering Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 239000003208 petroleum Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 241000208422 Rhododendron Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 239000003245 coal Substances 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- BABWHSBPEIVBBZ-UHFFFAOYSA-N diazete Chemical compound C1=CN=N1 BABWHSBPEIVBBZ-UHFFFAOYSA-N 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000009533 lab test Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 239000003209 petroleum derivative Substances 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 238000013517 stratification Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- E—FIXED CONSTRUCTIONS
- E21—EARTH OR ROCK DRILLING; MINING
- E21B—EARTH OR ROCK DRILLING; OBTAINING OIL, GAS, WATER, SOLUBLE OR MELTABLE MATERIALS OR A SLURRY OF MINERALS FROM WELLS
- E21B45/00—Measuring the drilling time or rate of penetration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/30—Assessment of water resources
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Economics (AREA)
- Artificial Intelligence (AREA)
- Strategic Management (AREA)
- Mining & Mineral Resources (AREA)
- Human Resources & Organizations (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Geology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Development Economics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Primary Health Care (AREA)
- Quality & Reliability (AREA)
- Marine Sciences & Fisheries (AREA)
- Animal Husbandry (AREA)
Abstract
本发明涉及机械钻速预测技术领域,涉及一种机械钻速预测方法、装置、电子设备及计算机存储介质,其包括以下步骤:一、对机械钻速ROP表征参数进行优选,优选出录井参数和反应地层特征的测井参数;二、利用Savitzky‑Golay滤波器对收集的数据进行降噪;三、以测井参数作为输入特征进行K‑means聚类分析,将岩石特征相似的地层环境划分为同一簇类;四、采用深度残差神经网络ResNet建立ROP预测模型,将聚类得到的结果与降噪后的录井参数作为输入特征;五、通过ROP预测模型进行机械钻速预测。本发明能够实现对ROP的高精度预测。
Description
技术领域
本发明涉及机械钻速预测技术领域,具体地说,涉及一种机械钻速预测方法、装置、电子设备及计算机存储介质。
背景技术
能源是国民经济发展的重要支撑,能源安全直接影响国家安全、社会稳定。当前世界能源使用结构仍以石油、天然气和煤炭三大传统能源为主,占比85%,核能、太阳能、水力、风力、波浪能、潮汐能、地热等能源仅占15%。在今后较长一段时间里,石油与天然气仍然是最主要的能源,化石能源仍然是人类生存和发展的能源基础。
对石油、天然气等化石能源的高效开采,仍然是保障能源安全的重中之重。随着浅层油气资源的日益枯竭,深部油气资源的勘探开发成为必然,现代钻井工程正面临着钻井深度增大,施工难度加大,施工环境愈加复杂等问题,钻井成本随之越发高昂,提高钻井效率十分必要。准确预测机械钻速,从而优选钻井参数,是提高钻井效益最为直接和有效的手段。
ROP预测模型主要可以分为基于物理的模型和数据驱动的模型两个类别。传统的基于物理的机械钻速预测模型由于其简单性而被广泛应用。1969年FS Young提出钻速方程,建立了多参数与机械钻速的定量关系,用于最大化机械钻速模型的研究。1974年Bourgoyne A T等人综合考虑可钻性级值、钻压、转速、钻头参数等因素,同时首次使用水力参数和井底围压等参数对原有的钻速方程进行修正,提出了修正的钻速方程,主要应用于钻压和转速的优化。2004年,R.Rommetveit等人提出了一种新的机械钻速监控模型,用于模拟转盘转速和钻压对机械钻速的影响,经过现场应用,利用该模型优化钻井参数后可使机械钻速提高15%以上,同时可以有效提高机械效率。这些模型绝大多数都致力于通过机理分析和实验室实验来建立钻井参数与ROP之间的数学关系,明确定义参数之间的关系及其对ROP的影响。然而,面对复杂的井下环境,想要准确预测机械钻速(ROP)绝非易事。传统的基于物理的模型虽然在一定程度上能够反映钻井规律,但局限性较大,例如数理分析方法的能力有限,在复杂的井下环境下由于各个参数之间的高度非线性而很难准确预测ROP。另外,这些模型跟钻井方式、破岩工具、钻井参数、岩石力学参数密切相关,许多待定参数难以准确获取,导致模型的适用性较差。同时,面对愈加复杂的钻井环境和海量的钻井数据,传统方法显得低效且难以满足需求。
近年来,机器学习技术发展迅速,因数据驱动模型的特性,可以不依赖于理论分析,且在输入参数方面具有高度灵活性、能够拟合复杂的非线性关系等优点,基于机器学习预测ROP受到了广泛关注。自1997年Bilgesu等人发表了第一篇关于使用人工神经网络(ANN)进行ROP预测的文章以来,人们在使用ANN进行ROP预测上做了很多工作。ANN是基于模仿人脑神经网络结构和功能而建立的一种信息处理***,它能够对一组特定数据集进行学习,记忆和创建自己的关系,具有容错、高效、自适应等特点。ANN强大的非线性映射能力能够为复杂的ROP预测问题提供良好的解决方案。多层感知器(MLP)形式和极限学习机(ELM)形式的神经网络在机械钻速预测中被广泛使用。近年来,为实现机械钻速的高精度预测,许多研究人员开始采用不同的方法来优化网络结构(例如隐藏层数,每层神经元个数等)。2018年,Anemangely等人比较了粒子群优化算法(PSO)和杜鹃鸟优化算法(COA)在优化MLP形式的人工神经网络方面的性能,他们的结果表明MLP-COA在预测ROP上具有更好的性能。2019年,Diaz等人选取深度、钻压、转速、孔隙压力梯度和井底等效循环泥浆密度等九个输入参数,通过比较不同隐藏节点数量和三个不同隐藏层数量的各种情况,选出了最优的ANN结构对ROP进行预测,取得了较高的效率和可靠性。2022年,Chengkai Zhang考虑到不同类别参数对ROP的影响机制的不同,采用四个子网络结构对ROP进行建模,其中引入了基于注意力机制的门控递归单元网络来评估钻头磨损。此外,其它的机器学习方法,如随机森林、支持向量回归等也被用于构建ROP预测模型。2019年,Christine等人通过优选随机森林、人工神经网络、支持向量回归、岭回归、梯度提升机等五种机器学习方法用于机械钻速预测。2022年,Alsaihati等人引入基于随机森林(RF),人工神经网络(ANN)和自适应神经模糊推理***(ANFIS)的集成学习模型,用于预测不同地层岩性的ROP。2022年,Hashemizadeh等人优选钩重、扭矩、立管压力、泥浆粘度和地层硬度等作为输入参数,利用多元线性回归(MLR)、岭回归、决策树(DT)、随机森林(RF)和人工神经网络(ANN)等9种机器学习算法来预测ROP。
利用机器学习构建智能钻速预测模型可以高效快速挖掘钻井数据中的深层隐藏信息,从而发现被传统理论模型所忽视的客观规律,具有极强的适应性。但是,现有的机器学习方法预测ROP仍有不足之处。比如考虑的特征参数较少,数据规模较小;此外,在考虑地层特性对ROP预测的影响方面也存在不足。为了尽可能减小甚至消除地层特性对ROP预测的影响,Hegde等人为每个地层都构建了一个唯一的ROP模型,此方法虽考虑了不同地层对ROP的影响,但比较繁琐。此外,研究者们增加了测井参数的使用。例如,Ashrafi等人选择了钻压、转速、泵压、伽马射线和密度测井等8个参数作为输入特征训练模型。上述方法在消除地层特性的影响方面有积极影响,但它们都是将与地质有关参数和录井参数视为是具有相同的优先级的特征一起输入ROP模型。
站在机器学习的角度,ROP预测其实质为一个回归任务,由于神经网络的表达能力和任意非线性,在回归任务中极具竞争力。但基于神经网络获得高性能的ROP预测模型面临着三个重要的挑战:
1)原始ROP预测数据集质量差,难以直接通过原始数据训练出高性能的模型。由于现场施工环境较较差、地层情况复杂以及施工队伍水平层次不齐等因素,现场收集的到某些数据与实际值存在较大偏差,原始数据集中存在较多的噪声数据,若直接使用原始数据训练模型,会导致训练出的模型的性能较差;
2)如何通过一个通用模型完成对整口井的机械钻速预测。由于地层存在抬升与下沉,同一地层在不同井中对应的深度并不相同。而测井数据反映地层岩石信息,因此,不同井的测井数据中相同地层对应的范围并不一致,传统的解决方案需要按照地质分层构建出多个模型,以完成对整口井的ROP预测。模型的训练及测试过程极为繁琐,极大的增加了使用成本;
3)如何使模型适应海量的钻井数据,充分挖掘出钻井数据中深层的隐藏信息。随着大数据、人工智能等数字化技术与自动化钻井技术的不断融合发展,钻井作业产生的数据类型越来越复杂,数据量越来越庞大。与传统的钻井数据相比,钻井大数据数据量巨大、样本多样性丰富,钻井大数据中含有需要被挖掘的深层隐藏信息更多,反映内容更加真实全面。传统的神经网络网络层数较浅,无法充分挖掘出钻井大数据中深层的隐藏信息。
发明内容
本发明的内容是提供一种基于钻井大数据与深度残差神经网络的机械钻速预测方法、装置、电子设备及计算机存储介质,其能够实现对ROP的高精度预测。
根据本发明的一种机械钻速预测方法,其包括以下步骤:
一、对机械钻速ROP表征参数进行优选,优选出录井参数和反应地层特征的测井参数;
二、利用Savitzky-Golay滤波器对收集的数据进行降噪;
三、以测井参数作为输入特征进行K-means聚类分析,将岩石特征相似的地层环境划分为同一簇类;
四、采用深度残差神经网络ResNet建立ROP预测模型,将聚类得到的结果与降噪后的录井参数作为输入特征;
五、通过ROP预测模型进行机械钻速预测。
作为优选,步骤一中,优选出的录井参数包括:深度、钻压、转速、立管压力、排量、扭矩、钻头直径、泥浆密度、当量泥浆密度、大钩载荷、泵冲、泥浆池体积、DC指数;优选出的测井参数包括:声波时差、自然伽马、自然电位、补偿中子、密度测井、电阻率、光电吸收截面指数。
作为优选,步骤二中,Savitzky-Golay滤波器实现数据降噪的原理如下式所示:
作为优选,K-means聚类分析的方法为:
(1)随机选取k个聚类质心点为μ1,μ2,……,μk;
(2)对于每一个样例i,计算其所属的类;
其中,c(i)为样例i与k个类中距离最近的那个类,其值为1到k中的一个;μj为质心代表对属于同一个类的样本中心点的猜测;x(i)为数据集中的元素;
(3)对于每一个簇j,重新计算该簇的质心μj;
(4)重复(2)、(3)直到收敛,为表述收敛性,定义畸变函数J,畸变函数J代表每个样本点到其质心的距离平方和,当畸变函数J最小时即为收敛;畸变函数J公式如下:
作为优选,采用深度残差神经网络ResNet建立ROP预测模型的方法为:
(1)确定每个残差块中包含的全连接层层数;对于一个ResNet残差块,神经网络的输入为步骤二中优选出的录井参数,记为x,期望输出是机械钻速ROP,记为H(x),则目标函数表示为:
H(x)=F(x)+x
其中F(x)为残差函数,变换上式可得:
F(x)=H(x)-x
ResNet的学习目标是目标值H(x)与x的差值,即残差F(x);当权重层效果差时,即F(x)=0时,H(x)=x,此时即为恒等映射,相当于网络没有加深;反之如果加入的层有效,就能使网络的性能得到提升;
(2)确定残差块个数NR,需保证模型全连接层总层数不少于20层;
(3)将输入层、NR个残差块以及输出层组合,得到ROP预测模型。
本发明提供了一种机械钻速预测装置,其采用上述的机械钻速预测方法。
本发明提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的机械钻速预测方法。
本发明提供了一种计算机存储介质,其存储有计算机程序,所述计算机程序被处理器执行时,实现上述的机械钻速预测方法。
本发明构建了一种新的智能ROP预测模型DKR,采用了Savitzky-Golay(SG)方法对数据进行降噪处理,大幅度提高了数据质量;通过K-means对测井数据进行聚类分析,将具有相似岩石特性的地层环境划分为同一簇类,再通过聚类标签表征地层岩性,消除了同一个区块中不同井测井数据中相同地层对应的范围并不一致的问题;基于ResNet构建了一个超20层的超大网络,用于最终的ROP预测任务,保证模型能够充分、高效的利用钻井大数据中隐藏的信息,实现对ROP的高精度预测,这是首次将ResNet技术引入到基于钻井大数据的ROP预测领域中,相较于传统的机器学习模型,基于ResNet技术的DKR对ROP的预测有着惊人的效果,在ROP预测领域展现出极强的竞争力。
附图说明
图1为实施例中一种机械钻速预测方法的流程图;
图2为实施例中DKR模型绝对误差分布的示意图;
图3为实施例中DKR模型相对误差分布的示意图;
图4为实施例中ROP的预测值与测量值之间的关系示意图;
图5为实施例中降噪前后ROP预测模型绝对误差和相对误差分布的示意图
图6为实施例中聚类前后ROP预测模型绝对误差和相对误差分布的示意图;
图7为实施例中使用ResNet与使用ANN后ROP预测模型绝对误差和相对误差分布的示意图。
具体实施方式
为进一步了解本发明的内容,结合附图和实施例对本发明作详细描述。应当理解的是,实施例仅仅是对本发明进行解释而并非限定。
实施例
本实施例提供了一种基于钻井大数据与深度残差神经网络的机械钻速预测方法,其包括以下步骤:
一、对机械钻速ROP表征参数进行优选,优选出录井参数和反应地层特征的测井参数;
二、利用Savitzky-Golay滤波器对收集的数据进行降噪;
三、以测井参数作为输入特征进行K-means聚类分析,将岩石特征相似的地层环境划分为同一簇类;
四、采用深度残差神经网络ResNet建立ROP预测模型,将聚类得到的结果与降噪后的录井参数作为输入特征;
五、通过ROP预测模型进行机械钻速预测。
本实施例提供了一种机械钻速预测装置,其采用上述的机械钻速预测方法。
本实施例提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的机械钻速预测方法。
本实施例提供了一种计算机存储介质,其存储有计算机程序,所述计算机程序被处理器执行时,实现上述的机械钻速预测方法。
下面进行具体说明:
1机械钻速表征参数优选
影响机械钻速的参数较多,按照数据的来源可分为录井参数与测井参数,我们使用的详细参数如表1所示。
表1影响ROP的特征参数
2模型框架
模型主要由数据降噪、地层特征聚类(K-means)和输出模块(ResNet)三部分组成,因此简称为DKR模型。模型输入包括优选出的录井参数和反应地层特征的测井参数。首先,输入参数将进入降噪模块中,消除异常值、缺失值对模型的影响。随后,为了消除地层特征对模型的影响,清洗后的测井参数将被送入到聚类模块中,将具有相似岩石特性的地层环境划分为同一簇类。最后,输出模块将根据聚类结果与降噪后的录井参数对机械钻速作出预测。
3数据降噪
数据降噪旨在提高数据质量,保证模型的准确性。钻井数据是从多个业务***(随钻录井数据、测井数据、地质录井数据等)中抽取整理而来,由于受到自然或人为因素而不可避免地受到噪声污染,从而影响了模型的准确性,并增加了训练时间。为了提高数据挖掘的质量,应当选择合适的降噪方法对收集到的数据进行降噪处理,提高数据的准确性、一致性和完整性。在本实施例中,我们使用Savitzky-Golay滤波法对数据集进行降噪处理。
S-G(Savitzky-Golay)滤波法是一种通过最小二乘卷积实现局部区间的多项式拟合的滤波方法,被广泛地运用于数据平滑除噪。这种滤波器最大的特点在于在滤除噪声的同时可以确保信号的形状、宽度不变。对需要滤波的数据选取其中某一连续的2m+1个数据点(滑动窗宽),以某一拟合阶数k进行最小二乘拟合,将拟合曲线在窗口中心处的取值作为滤波后的值,继续移动窗口,重复上述过程,从而完成对所有数据点的滤波。
应用该方法时需要确定两个关键的参数:滑动窗宽N和局部多项式拟合阶数k。合理选取N和k的取值可以减少信号的失真,提高滤波去噪质量。SG滤波器实现数据降噪的基本原理如下式所示:
4地层特征聚类
地层特征聚类旨在解决不同井的测井数据中相同地层对应的范围并不一致的问题。在机械钻速预测任务中,测井数据主要用于表征地层岩石特性,但由于地层存在抬升与下沉,同一地层在不同井中对应的深度并不相同,在同一深度上的地层的岩石特性存在较大差异,使用一个模型难以准确预测不同地层中的ROP。传统的方法不得不根据地层建立多个模型用以预测不同地层中的ROP,虽然能够在一定程度上保证预测的精度,但模型的训练与测试过程极为繁琐,并且增加了使用成本。为此,我们利用测井数据对研究区块进行地层特征聚类,将具有相似岩石特性的地层环境划分为同一簇类,然后将优选出的录井参数与聚类得到的结果共同作为ROP预测模型的输入参数,进行机械钻速预测,克服了不同井的测井数据中相同地层对应的范围并不一致的问题,实现使用一个通用模型完成对整口井的ROP预测。
在具体的实现过程中,我们使用了K-means算法来完成这一想法。K-means算法是一种无监督学习,一般用欧式距离作为衡量数据对象间相似度的指标,相似度与数据对象间的距离成反比。算法需要预先指定初始聚类数目k以及k个初始聚类中心,根据数据对象与聚类中心之间的相似度,不断更新聚类中心的位置,聚类结束,得到最终结果。
K-means算法本质是将给定的无标签数据集X聚类成k(k<m)个簇C=C1,C2,……,Ck;
式中,x(i)为数据集中的元素。
其基本框架如下:
(1)随机选取k(k为给定值)个聚类质心点为μ1,μ2,……,μk;
(2)对于每一个样例i,计算其所属的类;
其中,c(i)为样例i与k个类中距离最近的那个类,其值为1到k中的一个;μj为质心代表对属于同一个类的样本中心点的猜测;x(i)为数据集中的元素;
(3)对于每一个簇j,重新计算该簇的质心μj;
(4)重复(2)、(3)直到收敛,为表述收敛性,定义畸变函数J,畸变函数J代表每个样本点到其质心的距离平方和,当畸变函数J最小时即为收敛;畸变函数J公式如下:
但是由于畸变函数J的非凸性,收敛过程中可能陷入局部收敛,所以应该多次运行,避免偶然性。
K-means需要提前给定K值,K值不同聚类效果也不同,因此需要确定最佳K值以达到最佳聚类效果,本实施例采用手肘法确定最佳K值。
5输出模块
因为数据量较大,为了更好的捕捉特征参数与ROP之间复杂的非线性关系,需要更深更大网络。面对复杂海量的数据,浅层神经网络学习能力和泛化能力都比较差,而深层神经网络表达能力更强,能够用来表征更复杂的情况。随着网络层数的增加,神经网络能够提取到更多的特征,学习到更多的东西,有利于提高模型的准确度。然而随着网络深度的不断增加,模型并不是越来越好,不可避免地会产生过拟合、梯度消失和梯度***等问题。传统的深度神经网络难以适用于基于钻井大数据的ROP预测任务中。
残差神经网络(ResNet)的主要思想是通过在网络结构中添加捷径连接,用恒等映射直接将前一层输出传入到后面的层中,通过将网络单元进行一定的改造,可有效解决随着网络层数的增加,模型精度降低的难题。
因此,我们采用了ResNet来构建最终的预测模块,采用深度残差神经网络ResNet建立ROP预测模型的方法为:
(1)确定每个残差块中包含的全连接层层数,一般为3~5层;对于一个ResNet残差块,神经网络的输入为步骤二中优选出的录井参数,记为x,期望输出是机械钻速ROP,记为H(x),则目标函数表示为:
H(x)=F(x)+x
其中F(x)为残差函数,变换上式可得:
F(x)=H(x)-x
ResNet的学习目标是目标值H(x)与x的差值,即残差F(x);当权重层效果差时,即F(x)=0时,H(x)=x,此时即为恒等映射,相当于网络没有加深;反之如果加入的层有效,就能使网络的性能得到提升;
(2)确定残差块个数NR,需保证模型全连接层总层数不少于20层;
(3)将输入层、NR个残差块以及输出层组合,得到ROP预测模型。
6评价指标
我们使用了平均绝对误差(MAE);平均绝对百分比误差(MAPE);决定系数(R2)来评估模型的性能。其中平均绝对误差(MAE)定义为预测值ypre和真实值y之间的绝对误差,计算公式为:
式中n是样本数。
平均绝对百分比误差(MAPE)用于测量预测值ypre与真实值y之间的相对误差,计算公式为:
可决系数(R2)用于评估回归模型的拟合性能。R2的值越接近于1表示模型拟合程度越高、效果越好,其计算公式如下:
7现场数据
本实施例收集了NY地区40口井的243000组数据为原始数据集,数据集中包含了该地区主要的地质层系。数据集部分示例如表2、3所示。
表2NY地区部分录井数据集
表3NY地区部分测井数据集
结果与讨论
这里将对所提出的模型性能进行了评估。分析了数据降噪、聚类以及ResNet神经网络对ROP预测模型的影响,并将所提模型进行现场应用。
1)实验结果及分析
在这次测试中,DKR模型结构及主要参数如表4所示。
表4DKR模型结构及主要参数
在使用S-G滤波器对原始数据进行处理时,选取合理N和k的取值可以减少信号的失真,提高滤波去噪质量。在本次测试中,滤波器的局部区间内的点数N=25,多项式拟合阶数k=3,该数据值是通过多次测试后得出的。在聚类模块中,通过手肘法确定了最优的簇类个数K为23。在输出模块中,共构建了11个残差块,在每个残差块中包含两个权重层,该架构同样是通过多次测试后得出的最优结构。
我们将来自NY区块的GT1、GH6等8口井的数据用于测试数据集。这8口井以外的其余32口邻近井的数据作为模型训练数据,由于每次测试中模型产生的误差不同,为了充分检验模型的性能,我们对每口测试井都进行了10次测试,结果取平均值,测试结果如表5所示。
表5DKR模型测试结果
由表可知,DKR模型在8口测试井的测试中MAE最大为0.76、最小为0.48,平均值为0.56。MAPE最大为12.77%,最小为9.82%,平均值为11.44%。R2最大为0.94,最小为0.89,平均值为0.92。从测试结果来看,DKR模型拥有极高的预测精度。
为了进一步的了解DKR模型的误差,我们通过小提琴图对DKR模型产生的误差进行了分析。小提琴图(Violin Plot)结合了箱形图和密度图的特征,可以显示数据分布及其概率密度。其中黑线代表95%置信区间,中间的黑色方框表示四分位数范围,黑箱中的小白点为中位数。8口测试井的测试中DKR模型产生的绝对误差如图2、相对误差如图3所示。
由图2可以看出,绝对误差绝大多数分布在0~1之间;由图3可知,相对误差绝大多数分布在5%~15%区间内。绝对误差和相对误差都存在极个别的不令人满意的最大值,但这些值在整个训练过程中十分罕见。
图4描述了ROP的预测值与测量值之间的关系。在回归模型中,可决系数最高达到了0.94,说明ROP的预测值与ROP测量值之间密切相关,表明该模型预测精度高。
总的说来,测试结果表明DKR模型在对ROP的预测任务中,展现出了令人满意的性能,有较高的预测精度,同时具有良好的鲁棒性,较强的泛化能力。
2)消融实验
为了评估模型中每个模块的贡献,我们进行了消融实验。具体来讲,我们将依次进行以下实验:1)K-means+ResNet,模型中缺少Data denoising,以评估数据降噪对模型的贡献;2)Data denoising+ResNet,模型缺少K-means模块,以评估聚类对模型的贡献;3)Datadenoising+K-means+ANN,模型中缺少ResNet模块,此时最终的回归任务由一个23层的ANN完成,以评估ResNet对模型的贡献。我们同样对每个模型在8口测试井中各进行了10次测试,测试平均结果见表6。
表6消融实验结果
2.1)降噪
数据降噪在构建高精度的预测模型中起着至关重要的作用。在本次研究中我们使用了Savitzky-Golay滤波器降噪方法。经过多次实验确定:SG滤波器的滑动窗宽N取25,多项式拟合阶数k取3。通过结果可以得出,处理后的数据变化趋势与原始数据的变化趋势一致,异常值明显减少,降噪效果显著。
为了验证SG滤波器降噪对预测模型的影响,我们将降噪前后结果进行了对比。降噪前与降噪后对8口测试井均测试10次,结果取平均值。图5显示了降噪前后ROP预测模型绝对误差和相对误差的相关统计数据,通过小提琴图可直观地对比降噪前后的模型测试结果。降噪后绝对误差和相对误差的中位数、四分位数范围以及95%置信区间对应的纵坐标轴数值较降噪前都有较为明显的下降,降噪前后模型的R2分别为0.90和0.92,说明数据噪声对模型的预测精度有较大影响,通过数据降噪,ROP预测模型的预测精度可在一定程度上提高。
2.2)聚类
下面将对聚类前后模型的预测能力进行分析,两者均使用了SG滤波降噪并采用相同的深度残差神经网络结构,改变隐藏层神经元个数得到的最佳神经网络模型,聚类前与聚类后对8口测试井均测试10次,结果取平均值。图6显示了聚类前后ROP预测模型绝对误差和相对误差的相关统计数据,从图中我们可以很容易地看出聚类后绝对误差的中位数、四分位数范围以及95%置信区间对应的纵坐标轴数值较聚类前都有明显的下降,相对误差同样如此。通过计算,我们得出聚类前模型的绝对误差与相对误差的平均值分别为0.62m/h和13.47%。而聚类后模型的绝对误差与相对误差的平均值分别为0.56m/h和11.44%。聚类前后模型的可决系数分别为0.87和0.92,说明聚类在模型预测ROP过程中发挥了重要作用,在很大程度上提高了模型的预测精度。
为了验证地层聚类效果,本实施例以岩石抗压强度和内摩擦角作为典型岩石特征参数作为评价指标,选取NY区块深部地层(共4处地层:连木沁组K1l,呼图壁河组K1h,清水河组K1q,喀拉扎组J3k)进行地层聚类效果评价。其它较浅地层,这里不做详细介绍。NY区块深部地层有1、3、4、6、8、9共6个簇类。
通过下列公式计算聚类前后NY地区深部地层的标准差和变异系数,并用各地层的加权平均变异系数表征地层特征离散程度。变异系数用于表示样本的离散程度,变异系数越大离散程度越大,样本越不规则。
计算结果如表7所示。
表7聚类前后NY深部地层抗压强度变异系数
2.3)ResNet
为了评估ResNet神经网络对预测模型的影响,我们将一个相同层数的MLP引入模型中代替ResNet。将两者性能进行了对比。两者依旧对8口测试井各训练10次,结果取平均值结果。图7显示了使用ResNet与使用MLP后ROP预测模型绝对误差和相对误差的相关统计数据,从图中我们可以看出,使用ResNet的预测模型的绝对误差与相对误差分布较使用MLP的模型均大幅降低,前者绝对误差与相对误差的平均值分别为0.56m/h和11.44%,后者绝对误差与相对误差的平均值分别为0.81m/h和15.55%。使用ResNet与使用MLP时ROP预测模型的可决系数分别为0.84和0.92,说明ResNet对模型的贡献巨大,有利于提高模型性能,有效解决了随着网络层数的增加而使得模型精度降低的难题。
3)不同方法对比
我们将所提出的ROP预测模型的性能作为基准与其它三种主流的机器学***均值,测试结果见表8。四种方法均经过降噪和聚类处理后对机械钻速进行预测,调整各模型中的神经元,得到最佳神经网络模型。
从表中可以看出本实施例所提出的ROP预测模型的性能较其它三种机器学习模型更好,各项评价指标均优于其它三种机器学习模型。
表8模型与其它方法对比
结论
本实施例提出了一种全新的ROP智能预测模型。该模型首先利用SG平滑滤波器进行了数据降噪,然后应用K-means聚类算法对研究区块进行地层特征聚类,将具有相似岩石特性的地层环境划分为同一簇类,然后将簇类作为预测模型的输入参数之一进行机械钻速预测,有效提高了模型的预测精度。同时从录井参数中优选出井深、钻压、转速等13个参数作为模型输入特征。最后采用深度残差神经网络(ResNet)建立了ROP预测模型,最后,为了验证模型的性能,应用该模型对NY地区的数据集的ROP进行预测,并选取了MAE、R2及MAPE评估模型性能。结果表明,模型表现良好,有较高的预测精度,MAE、R2及MAPE十次测试的平均值分别为0.56、0.92和11.44%。为了评估模型中每个模块的贡献,我们进行了消融实验。与其它模型相比,DKR模型的各项评价指标均更优,模型性能更佳。因此,本实施例所提出的方法对于ROP预测方面可以提供更可靠和准确的输出。将K-means聚类算法与ResNet引入到ROP预测当中,取得了较好的效果,为ROP的预测提供了新的方向。
以上示意性的对本发明及其实施方式进行了描述,该描述没有限制性,附图中所示的也只是本发明的实施方式之一,实际的结构并不局限于此。所以,如果本领域的普通技术人员受其启示,在不脱离本发明创造宗旨的情况下,不经创造性的设计出与该技术方案相似的结构方式及实施例,均应属于本发明的保护范围。
Claims (8)
1.机械钻速预测方法,其特征在于:包括以下步骤:
一、对机械钻速ROP表征参数进行优选,优选出录井参数和反应地层特征的测井参数;
二、利用Savitzky-Golay滤波器对收集的数据进行降噪;
三、以测井参数作为输入特征进行K-means聚类分析,将岩石特征相似的地层环境划分为同一簇类;
四、采用深度残差神经网络ResNet建立ROP预测模型,将聚类得到的结果与降噪后的录井参数作为输入特征;
五、通过ROP预测模型进行机械钻速预测。
2.根据权利要求1所述的机械钻速预测方法,其特征在于:步骤一中,优选出的录井参数包括:深度、钻压、转速、立管压力、排量、扭矩、钻头直径、泥浆密度、当量泥浆密度、大钩载荷、泵冲、泥浆池体积、DC指数;优选出的测井参数包括:声波时差、自然伽马、自然电位、补偿中子、密度测井、电阻率、光电吸收截面指数。
5.根据权利要求1所述的机械钻速预测方法,其特征在于:采用深度残差神经网络ResNet建立ROP预测模型的方法为:
(1)确定每个残差块中包含的全连接层层数;对于一个ResNet残差块,神经网络的输入为步骤二中优选出的录井参数,记为x,期望输出是机械钻速ROP,记为H(x),则目标函数表示为:
H(x)=F(x)+x
其中F(x)为残差函数,变换上式可得:
F(x)=H(x)-x
ResNet的学习目标是目标值H(x)与x的差值,即残差F(x);当权重层效果差时,即F(x)=0时,H(x)=x,此时即为恒等映射,相当于网络没有加深;反之如果加入的层有效,就能使网络的性能得到提升;
(2)确定残差块个数NR,需保证模型全连接层总层数不少于20层;
(3)将输入层、NR个残差块以及输出层组合,得到ROP预测模型。
6.机械钻速预测装置,其特征在于:其采用如权利要求1-5中任一项所述的机械钻速预测方法。
7.电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,其特征在于:所述处理器执行所述计算机程序时实现权利要求1-5中任一项所述的机械钻速预测方法。
8.计算机存储介质,其存储有计算机程序,其特征在于:所述计算机程序被处理器执行时,实现权利要求1-5中任一项所述的机械钻速预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310232677.7A CN116384554A (zh) | 2023-03-10 | 2023-03-10 | 机械钻速预测方法、装置、电子设备及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310232677.7A CN116384554A (zh) | 2023-03-10 | 2023-03-10 | 机械钻速预测方法、装置、电子设备及计算机存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116384554A true CN116384554A (zh) | 2023-07-04 |
Family
ID=86968514
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310232677.7A Pending CN116384554A (zh) | 2023-03-10 | 2023-03-10 | 机械钻速预测方法、装置、电子设备及计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116384554A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117349798A (zh) * | 2023-12-05 | 2024-01-05 | 西南石油大学 | 一种基于非均衡回归的机械钻速预测方法及*** |
CN117763466A (zh) * | 2024-02-22 | 2024-03-26 | 中石化经纬有限公司 | 一种基于聚类算法的地层可钻性评价方法及*** |
CN118134539A (zh) * | 2024-05-06 | 2024-06-04 | 山东传奇新力科技有限公司 | 基于智慧厨房多源数据融合的用户行为预测方法 |
-
2023
- 2023-03-10 CN CN202310232677.7A patent/CN116384554A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117349798A (zh) * | 2023-12-05 | 2024-01-05 | 西南石油大学 | 一种基于非均衡回归的机械钻速预测方法及*** |
CN117349798B (zh) * | 2023-12-05 | 2024-02-23 | 西南石油大学 | 一种基于非均衡回归的机械钻速预测方法及*** |
CN117763466A (zh) * | 2024-02-22 | 2024-03-26 | 中石化经纬有限公司 | 一种基于聚类算法的地层可钻性评价方法及*** |
CN118134539A (zh) * | 2024-05-06 | 2024-06-04 | 山东传奇新力科技有限公司 | 基于智慧厨房多源数据融合的用户行为预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116384554A (zh) | 机械钻速预测方法、装置、电子设备及计算机存储介质 | |
CN110619353B (zh) | 一种基于深度学习的多尺度测井曲线自动识别方法 | |
Karkevandi-Talkhooncheh et al. | Application of hybrid adaptive neuro-fuzzy inference system in well placement optimization | |
Khoukhi | Hybrid soft computing systems for reservoir PVT properties prediction | |
CN114723095A (zh) | 缺失测井曲线预测方法及装置 | |
Hadi et al. | Modeling rate of penetration using artificial intelligent system and multiple regression analysis | |
Gowida et al. | Synthetic well-log generation: New approach to predict formation bulk density while drilling using neural networks and fuzzy logic | |
Chen et al. | Prediction of the rate of penetration in offshore large-scale cluster extended reach wells drilling based on machine learning and big-data techniques | |
Ji et al. | An advanced long short-term memory (LSTM) neural network method for predicting rate of penetration (ROP) | |
CN117035197B (zh) | 一种代价最低化的井漏智能预测方法 | |
Liu | Potential for evaluation of interwell connectivity under the effect of intraformational bed in reservoirs utilizing machine learning methods | |
Cao et al. | Feature investigation on the ROP machine learning model using realtime drilling data | |
WO2019023255A1 (en) | DEVELOPMENT OF OIL FIELD MODELS USING COGNITIVE CALCULATION | |
Zhu et al. | A physics-constrained data-driven workflow for predicting bottom hole pressure using a hybrid model of artificial neural network and particle swarm optimization | |
Zhang et al. | BP neural network with genetic algorithm optimization for prediction of geo-stress state from wellbore pressures | |
Ma et al. | Directional fast drilling technology in Yanchang gas field with quartz sandstone geology | |
CN115049173A (zh) | 深度学习和Eaton法耦合驱动地层孔隙压力预测方法 | |
Sharma et al. | Utilizing machine learning to improve reserves estimation and production forecasting accuracy | |
Zhu et al. | Prediction and Optimization of ROP in the Absence of Geological and Lithological Information | |
Ebrahimi et al. | Young’s Modulus Estimation Using Machine Learning Methods and Daily Drilling Reports | |
Tyree | Predicting Frac Hits Using Artificial Intelligence; Application in Marcellus Shale | |
Wang et al. | Comparative study on prediction models of EPB shield tunnelling parameters in the water-rich round-gravel formation | |
CN113344729B (zh) | 一种基于小样本学习的剩余油挖潜方法 | |
Pan et al. | An Intelligent Prediction Method of Horizontal Well ROP Based on Di-GRU | |
Shaker et al. | Development of Artificial Intelligence Models for Estimating Rate of Penetration in East Baghdad Field, Middle Iraq |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |