CN117688465A - 一种机械钻速预测方法及*** - Google Patents
一种机械钻速预测方法及*** Download PDFInfo
- Publication number
- CN117688465A CN117688465A CN202211011002.1A CN202211011002A CN117688465A CN 117688465 A CN117688465 A CN 117688465A CN 202211011002 A CN202211011002 A CN 202211011002A CN 117688465 A CN117688465 A CN 117688465A
- Authority
- CN
- China
- Prior art keywords
- data
- algorithm
- drilling
- mechanical drilling
- rate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005553 drilling Methods 0.000 title claims abstract description 200
- 238000000034 method Methods 0.000 title claims abstract description 68
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 120
- 238000012706 support-vector machine Methods 0.000 claims abstract description 33
- 230000008569 process Effects 0.000 claims abstract description 11
- 238000007781 pre-processing Methods 0.000 claims abstract description 9
- 230000006870 function Effects 0.000 claims description 47
- 238000012549 training Methods 0.000 claims description 37
- 239000013598 vector Substances 0.000 claims description 31
- 230000035515 penetration Effects 0.000 claims description 30
- 238000012545 processing Methods 0.000 claims description 30
- 238000012216 screening Methods 0.000 claims description 25
- 238000004140 cleaning Methods 0.000 claims description 16
- 230000002068 genetic effect Effects 0.000 claims description 15
- 238000012360 testing method Methods 0.000 claims description 13
- 230000004927 fusion Effects 0.000 claims description 10
- 239000012530 fluid Substances 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 8
- 238000005457 optimization Methods 0.000 claims description 7
- 230000003068 static effect Effects 0.000 claims description 7
- 238000004519 manufacturing process Methods 0.000 claims description 5
- 238000006073 displacement reaction Methods 0.000 claims description 4
- 208000004188 Tooth Wear Diseases 0.000 claims description 3
- 238000010276 construction Methods 0.000 abstract description 10
- 230000007547 defect Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 9
- 210000000349 chromosome Anatomy 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 6
- 230000001419 dependent effect Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 239000011435 rock Substances 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000005755 formation reaction Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 239000003208 petroleum Substances 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000000611 regression analysis Methods 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 240000000233 Melia azedarach Species 0.000 description 1
- 241000234479 Narcissus Species 0.000 description 1
- 208000002697 Tooth Abrasion Diseases 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 239000003245 coal Substances 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种机械钻速预测方法及***,基于现场获取的大量钻井机械钻速数据,进行数据预处理后,利用K近邻KNN算法、核岭回归KRR算法、支持向量机SVM算法共三种算法构建模型,再利用Stacking算法将三种算法进行融合形成最终的机械钻速预测模型,从而更精确地预测机械钻速。本申请避开了现有预测机械钻速方法存在的不足,且能精确地对机械钻速进行分类预测;在充分考虑多种影响机械钻速因素的同时,还充分利用钻井全过程的大数据价值,对数据进行了充分的挖掘可大幅提升机械钻速预测效率,其预测结果可以作为施工参数优化的依据。
Description
技术领域
本发明涉及油气井勘探技术领域,具体而言,涉及一种机械钻速预测方法及***。
背景技术
机械钻速是评估钻井工作的一项重要指标。我国进入二十一世纪以来,随着经济快速的发展,对油气资源的需求也日益增加。我国开发重心已从浅层油气藏转向深层油气藏、超深层油气藏,这无疑大大提高了钻井的周期和成本。若可以有效地预测机械钻速,就可以为钻井决策提供精准的依据、优化施工参数和资源分配、提高设备和人员的工作效率,从而达到降低开采成本、提高油田经济效益的目的。
影响机械钻速的因素多且复杂,各种因素之间相互影响、制约,研究起来十分复杂。为了提高机械钻速,钻井工程师们在施工前需要经过长时间的大量计算,并根据自己积累的工作经验来设计施工方案,但设计出来的施工方案多与实际相差较大,甚至因设计方案时某种因素考虑不周导致钻井工期严重超标。
在机械钻速预测方面,国内外学者初步建立了模型。国外A Bahari(Bahari A,Baradaran Seyed A.Trust-Region Approach To Find Constants of Bourgoyne andYoung Penetration Rate Model in Khangiran Iranian Gas Field[J].Society ofPetroleum Engineers.)、B Adebayo(Adebayo B,Akande J M.Textural Properties OfRock For Penetration Rate Prediction[J].Daffodil International UniversityJournal of Science and Technology,2011,6(1).)、KUMAR(KUMAR,SURAJ,MURTHY,etal.Experimental studies on drill penetration rate prediction in coal measurerocks through Cerchar hardness index tests.[J].Journal of Mines,2014.)、NVHung(Hung N V,Gerbaud L,Souchal R,et al.Penetration rate prediction forpercussive drilling with rotary in very hard rock[J].Vietnam Journal ofScience and Technology,2016,54(1).)等都得出了机械钻速的预测方法,但均存在考虑因素不够全面的问,使得方法有一定的适应性;国内巨满成(巨满成.岩石可钻性与钻头纯钻时线性回归及应用[J].石油钻采工艺,1992,14(1):6.)、杜镰(杜镰,水运震,邢纪国,等.钻井过程中预测钻速的一种新方法[J].江汉石油学院学报,1995(3).)、郭永峰(郭永峰.用回归分析法预测钻头最佳进尺及钻速[J].石油钻采工艺,1994(01):24-26+80-99.)等也对机械钻速的预测方法进行了研究,但其成果的共性是均只引用了少量的钻井参数,基于大量统计数据并应用各种数学方法进行处理而建立钻速方程,不具有普遍性,应用受到限制;景宁等(景宁,樊洪海,纪荣艺,等.基于数据挖掘技术的深井钻速预测方法研究[J].石油机械,2012,40(7):17-20.)结合钻头尺寸等5种影响因素进行分析,建立了一种基于层析分析法和神经网络的钻速预测模型,预测相对误差小于10%;李昌盛等(李昌盛.基于多元回归分析的钻速预测方法研究[J].科学技术与工程,2013,13(07):1740-1744.)利用多元回归的方法改进了B-Y钻速方程,使得不同地层的系数得到改变,但该方程只针对钻井液钻井。传统方法对机械钻速的预测提供了实际的贡献,但是这些方法大多依靠控制变量方法进行实验或者依靠经验、钻井理论公式推导,不仅费时费力,且在考虑多种影响因素的情况下已经无法满足当前钻井工程的需要。
有鉴于此,特提出本申请。
发明内容
本发明所要解决的技术问题是:传统的机械钻速预测方法效率低,不能适用于当前钻井工程。目的在于提供一种机械钻速预测方法及***,能够实现快速、准确地对机械钻速进行预测,为钻井工程施工提供参数优化的依据。
本发明通过下述技术方案实现:
一方面,
本申请提供一种一种机械钻速预测方法,包括以下步骤:
采集钻井数据,建立初始样本数据集;
对所述初始样本数据集进行预处理,得到训练集;
利用Stacking算法将K近邻KNN算法、核岭回归KRR算法和支持向量机SVN算法进行融合,得到Stacking机械钻速预测模型;
利用所述训练集对所述Stacking机械钻速预测模型进行训练;
利用训练后的Stacking机械钻速预测模型对机械钻速进行预测。
进一步的,
所述钻井数据包括:油气井钻井过程中的动态特征数据和静态特征数据;
所述动态特征数据包括:井新度、出井新度、牙齿磨损量、钻压、转速、钻井液排量、钻井液密度、漏斗粘度和钻头压降;
所述静态特征数据包括:钻头直径。
进一步的,
所述建立初始样本数据集包括以下步骤:
利用Excel或TXT文本对所述钻进数据进行整理;
对整理后的现场钻井数据进行清洗、筛选和去噪;
对经过清洗、筛选和去噪后的现场钻井数据进行缺失值处理;
对经过缺失值处理后的钻井数据中除机械钻速数据外的其余特征数据进行归一化处理;
将归一化处理后的特征数据随机划分为训练集和测试集;
获取影响机械钻速的多个影响因素;针对每一个影响因素,根据影响因素的特征属性,从所述经过缺失值处理后的钻井数据中筛选出具有相同特征属性的钻井数据,利用筛选出的钻井数据建立对应的输入特征向量,得到与所述多个影响因素一一对应的对个输入特征向量;针对每一个输入特征向量,将输入特征向量中的钻井数据作为输入变量X,将机械钻速作为输出变量Y。
进一步的,
所述得到训练集之后,包括以下步骤:分别对所述K近邻KNN算法的参数、所述核岭回归KRR算法的参数、所述支持向量机SVN算法的参数和所述Stacking融合模型的目标函数进行设置。
进一步的,
所述核岭回归KRR算法的参数包括:核函数类型、正则化参数和核函数参数;
所述K近邻KNN算法的参数包括:近邻样本数、近邻样本投票权重和近邻距离标准;
所述支持向量机SVM算法的参数包括:惩罚系数、核函数类型和核函数参数。
进一步的,
所述得到Stacking机械钻速预测模型之后,包括以下步骤:在Python语言环境下,通过geatpy库利用遗传算法GA对所述Stacking机械钻速预测模型进行优化。
另一方面,
本申请提供一种机械钻速预测***,包括:
数据采集模块,用于采集钻井数据,建立初始样本数据集;
数据处理模块,用于对所述初始样本数据集进行预处理,得到训练集;
模型融合模块,用于利用Stacking算法将K近邻KNN算法、核岭回归KRR算法和支持向量机SVN算法进行融合,得到Stacking机械钻速预测模型;
模型训练模块,用于利用所述训练集对所述Stacking机械钻速预测模型进行训练;
结果预测模块,用于利用训练后的Stacking机械钻速预测模型对机械钻速进行预测。
进一步的,
所述数据处理模块包括:
数据整理单元,用于利用Excel或TXT文本对所述钻进数据进行整理;
清洗/筛选/去噪单元,用于对整理后的现场钻井数据进行清洗、筛选和去噪处理;
缺失值处理单元,用于对经过清洗、筛选和去噪后的现场钻井数据进行缺失值处理;
归一化处理单元,用于对整理后的现场钻井数据进行去噪;
数据划分单元,用于将归一化处理后的特征数据随机划分为训练集和测试集;
数据筛选单元,用于获取影响机械钻速的多个影响因素;针对每一个影响因素,根据影响因素的特征属性,从所述经过缺失值处理后的钻井数据中筛选出具有相同特征属性的钻井数据;
特征向量获取单元,用于利用筛选出的钻井数据建立对应的输入特征向量,得到与所述多个影响因素一一对应的对个输入特征向量;
变量设置单元,用于针对每一个输入特征向量,将输入特征向量中的钻井数据作为输入变量X,将机械钻速作为输出变量Y。
进一步的,
所述机械钻速预测***,还包括:
参数设置模块,用于对所述K近邻KNN算法的参数、所述核岭回归KRR算法的参数和所述支持向量机SVN算法的参数进行设置;
模型设置模块,用于对所述Stacking融合模型的目标函数进行设置。
进一步的,
所述机械钻速预测***,还包括:模型优化模块,用于在Python语言环境下,通过geatpy库利用遗传算法GA对所述Stacking机械钻速预测模型进行优化。
本申请与现有技术相比,具有如下的优点和有益效果:本申请提供的提供一种机械钻速预测方法及***基于现场获取的大量钻井机械钻速数据,进行数据预处理后,利用K近邻KNN算法、核岭回归KRR算法、支持向量机SVM算法共三种算法构建模型,再利用Stacking算法将三种算法进行融合形成最终的机械钻速预测模型,从而更精确地预测机械钻速。通过机械钻速的多种影响因素做出了全面、***的分析,并结合钻井过程中多种影响因素的数据建立了机械钻速预测模型,并测试模型的精度和泛化性,操作简单、预测准确度高。该方法避开了现有预测机械钻速方法存在的不足,且能精确地对机械钻速进行分类预测;在充分考虑多种影响机械钻速因素的同时,还充分利用钻井全过程的大数据价值,对数据进行了充分的挖掘可大幅提升机械钻速预测效率,其预测结果可以作为施工参数优化的依据。
附图说明
为了更清楚地说明本发明示例性实施方式的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例1提供的K近邻KNN算法的示意图;
图2为本发明实施例1提供的核岭回归KRR算法的示意图;
图3为本发明实施例1提供的支持向量机SVM算法的示意图;
图4为本发明实施例1提供的Stacking算法的示意图;
图5为本发明实施例1提供的一种机械钻速预测方法的流程示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例1
如附图1所示为本发明实施例中K近邻KNN算法的示意图。K近邻KNN算法不会预先生成一个分类、预测模型,而是将建模与预测、分类的工作同时进行,模型构建好后分类、预测结果也将输出。该算法可以对离散型变量进行分类,也可以对连续型变量进行预测。其计算原理为:比较已知因变量的数据和未知因变量的数据之间的相似度,找到最相似的K个样本作为未知因变量的数据的预测值。其执行步骤主要包括:
步骤1,确定未知样本近邻个数K值。
步骤2,根据数据选择欧式距离、曼哈顿距离其中一个指标将每一个未知类别的样本的最近K个已知样本找出,找出的K个样本和未知样本形成一个簇。本发明选用欧式距离,计算方法为:
其中,两个样本分别为样本A(x1,x2,...,xn)和样本B(y1,y2,...,yn)。
如附图2所示为本发明实施例中核岭回归KRR算法的示意图。核岭回归KRR算法是一种由Cristianini和Shawe-Taylor两位学者在岭回归算法(Ridge Regression)的基础上利用了核函数技巧形成的一种算法。此算法在解决非线性问题上有较好的拟合效果,且具有运行速度快、参数少等优点。
为控制算法的复杂程度,减少训练所耗费的时间,岭回归算法在正则化项中引入了最小化均方差,目标函数计算方法为:
其中,i表示样本数;xi表示自变量;yi表示因变量;λ表示正则化参数。在岭回归算法的基础上利用核函数技巧,从样本空间到特征空间的非线性变化令自变量xi变为:Ψ=Ψ(xi),此时,经核函数技巧处理后,优化问题的最优解表示为:/>将以上的最优解的计算公式与目标函数联立起来,利用核函数(kernel)来表示特征空间中的内积,整理矩阵形式可得:
最终整理可得:α=(K+λI)-1Y,其中,K表示核矩阵,大小为i×1维;I表示单位矩阵;Y表示i维的坐标向量,Y=(y1,y2,y3,…,yi)T。
此时,对于新样本xn,可以得到估计值yn,计算方法为:yn=α·Φ(xi)。
如附图3所示为本实施例提供的支持向量机SVM算法的示意图(最优超平面示意图)。支持向量机的主要思想是结构风险最小化原则和统计学***面”将不同类别的样本点进行划分。若样本点线性可分,则可直接利用“超平面”将样本点切割开来。若样本点非线性可分,则需引入“核函数”,常见的核函数有Sigmoid核函数、多项式核函数、高斯核函数、线性核函数等,本发明选用高斯核函数,计算方法为:
k(xi,xj)=exp(||-γ(xi·xj)||2)
对应的“超平面”为:
以上两式中,k为高斯核函数,γ参数定义了从样本空间到某高维特征空间中的非线性变换,此核函数将原来K维的向量映射到无穷维上;i,j为样本序号;x为特征值。
如附图4所示为本发明实施例中Stacking算法的示意图。Stacking算法属于集成学习中结合策略内的一种算法。该算法需要多个学习器支撑其训练过程,这些学习器分为初级学习器和元学习器,前者训练个体数据,后者训练结合数据。Stacking算法会先利用训练数据集训练初级学习器(初级模型),然后基于初级学习器生成新的训练数据集用以训练元学习器(元模型)。其执行步骤主要包括:
步骤1,输入数据集K={(a1,b1),(a2,b2),…,(an,bn)},定义初级学习器H1,H2,…,Ht,次级学习器H0。其中,a1,a2,…,an为特征,b1,b2,…,bn为标签。
步骤2,将K随机均分为k个数量相近的集合Kk(k=1,2,…,k),依次从K中取出测试集Kk进行k折训练,直至覆盖数据集K。假设训练集为此时有/>
步骤3,遵循K折交叉验证法,将k组数据集依次放入初级学习器训练。其中,对应的t个初级学习器以Kk为测试集的结果。
步骤4,对Kk中的样本am,令则am生成了Zm=(Zm1;Zm2;…;Zmt)。最后合并t组基学习器结果,构建新数据集/>
基于上述算法理论分析,本实施例提供的一种机械钻速预测方法,其方法流程如图5所示,包括以下步骤:
步骤1:从油气田钻井现场获取大量钻井数据,利用EXCEL或TXT文本进行整理,作为建立机械钻速预测模型的原始数据,建立初始样本数据集。
其中,钻井数据包括:油气井钻井过程中的动态特征数据和静态特征数据;所述动态特征数据包括:井新度、出井新度、牙齿磨损量、钻压、转速、钻井液排量、钻井液密度、漏斗粘度和钻头压降;所述静态特征数据包括:钻头直径。
步骤2:对所述初始样本数据集进行预处理,具体包括以下步骤:
步骤2.1:对整理后的现场钻井数据进行清洗、筛选和去噪。对所述相关数据进行清洗和筛选,去除大量因为传感器误差和人工输入不仔细等原因导致所述动态特征和所述静态特征的数据,即去除噪声数据。
步骤2.2:对经过清洗、筛选和去噪后的现场钻井数据进行缺失值处理。
步骤2.3:选择Min-Max Scaling归一化算法对经过缺失值处理后的钻井数据中除机械钻速数据外的其余特征数据进行归一化处理,归一化处理的公式为:其中,其中,x′i为归一化后的数据;xi表示为归一化前的原始机械钻速样本数据;xmin表示为原始机械钻速样本数据特征值的最小值;xmax表示为原始机械钻速样本数据特征值的最大值。
步骤2.4,结合相关领域的专家经验将不同直径钻头的机械钻速进行分级,分为低钻速、中钻速和高钻速。
步骤2.5:将归一化处理后的特征数据随机划分为训练集和测试集,训练集与测试集的划分比例为9:1。
步骤2.6:获取影响机械钻速的多个影响因素;针对每一个影响因素,根据影响因素的特征属性,从所述经过缺失值处理后的钻井数据中筛选出具有相同特征属性的钻井数据,利用筛选出的钻井数据建立对应的输入特征向量,得到与所述多个影响因素一一对应的对个输入特征向量;针对每一个输入特征向量,将输入特征向量中的钻井数据作为输入变量X,将机械钻速作为输出变量Y。
具体的,将影响油气井钻井机械钻速的10个因素作为输入特征向量,包括:入井新度、出井新度、牙齿磨损量、钻压、转速、钻井液排量、钻井液密度、漏斗粘度、钻头压降和钻头直径,每个特征属性里面所包含的相关钻井数据作为输入变量X;待预测标签为机械钻速,作为输出变量Y。
步骤3:分别对所述K近邻KNN算法的参数、所述核岭回归KRR算法的参数、所述支持向量机SVN算法的参数和所述Stacking融合模型的目标函数进行设置。具体的,包括以下步骤:
步骤3.1:设置K近邻KNN算法的各参数。具体的,K近邻KNN算法的参数包括:近邻样本数、近邻样本投票权重和近邻距离标准,近邻样本数K为5,近邻样本投票权重相同,近邻距离标准采用欧式距离。
步骤3.2:设置核岭回归KRR算法的各参数。具体的,核岭回归KRR算法的参数包括:核函数类型、正则化参数和核函数参数,其中,核函数采用rbf函数,正则化参数L与核函数参数g均使用默认值。
步骤3.3:设置支持向量机SVM的各参数。具体的,支持向量机SVM算法的参数包括:惩罚系数、核函数类型和核函数参数,其中,惩罚系数用C表示,核函数采用rbf函数,核函数参数g使用特征数的倒数。
需说明的是,在对所述初始样本数据集进行预处理时,出得到训练集外还得到测试集,在测试集中的表现为:K近邻KNN算法的分类准确率为76.9%;核岭回归KRR的分类准确率为73.8%;支持向量机SVM的分类准确率为80.6%。
步骤4:利用Stacking算法将K近邻KNN算法、核岭回归KRR算法和支持向量机SVN算法进行融合,得到Stacking机械钻速预测模型。具体的,在python语言的环境下,通过自编函数实现利用Stacking算法将K近邻KNN算法、核岭回归KRR算法、支持向量机SVM算法三种算法进行融合。基于多算法融合的Stacking模型在测试集中的表现为:分类准确率为88.7%。
步骤5:在Python语言环境下,通过geatpy库利用遗传算法GA对所述Stacking机械钻速预测模型进行优化。包括以下步骤:
步骤5.1:设置遗传算法GA的各参数,包括种群数量、繁衍最大代数。染色体长度、染色体交叉概率、染色体变异概率、适应值函数,设置情况见下表:
设置参数 | 设置数值 |
种群数量 | 200 |
繁衍最大代数 | 80 |
染色体长度 | 100 |
交叉概率 | 0.8 |
变异概率 | 0.01 |
适应值函数 | 绝对误差 |
步骤5.2:确定输入、输出变量,通过编码将最优解问题转换为种群繁衍问题。
针对通过编码将最优解问题转换为种群繁衍问题,说明如下:
编码是将数据转换成染色体,即遗传空间内固定形式与长度的基因串结构数据。本发明设计使用二进制编码,即使用二进制字符集{0,1}中的0和1代表问题的候选解。后续迭代时,转化成编码问题的染色体即可按照文献“Whitley D.A Genetic AlgorithmTutorial[J].Statistics&Computing,1994,4(2):65-85.”进行交叉操作。
步骤5.3:随机产生具有若干个个体的种群,设置种群大小,遗传算法着眼于种群,即多个给定初始解的集合,每个初始解均被称为个体,即染色体。迭代运算时,种群大小保持不变,种群中的染色体在问题解空间内不断发生变化。
计算初始种群中每个个体的适应度值,将预测的机械钻速进行反归一化处理,并计算出预测机械钻速的分类准确率,反归一化公式为:y′i=yi*(xmax-xmin)+xmin,其中,y’i表示反归一化后的第i个样本点的机械钻速,yi表示归一化的第i个样本点的机械钻速,xmix表示为原始机械钻速样本数据特征值的最小值;xmax表示为原始机械钻速样本数据特征值的最大值。
步骤5.4:将经过遗传算法GA寻优得到的各算法建立的模型最优参数值带入对应模型中。
遗传算法GA优化各模型后的参数设置情况如下:
设置K近邻KNN算法的各参数,包括:近邻样本数K为30,近邻样本投票权重与距离成反比,近邻距离标准采用曼哈顿距离;设置核岭回归KRR算法的各参数,包括:核函数采用rbf函数,正则化参数L取0.00052,核函数参数g取0.63941;设置支持向量机SVM的各参数,包括:惩罚系数C为12,核函数采用rbf函数,核函数参数g取0.1。
步骤6:利用所述训练集对所述Stacking机械钻速预测模型进行训练,直至预测机械钻速的分类准确度达到要求。
具体的,利用测试集评价最终机械钻速预测模型的评价结果为:K近邻KNN算法的分类准确率为89.7%;核岭回归KRR的分类准确率为79.4%;支持向量机SVM的分类准确率为86.9%;Stacking模型的分类准确率为94.2%。
可见,遗传算法GA优化后各模型的准确率都有提升,K近邻KNN算法的分类准确率提高了12.8%;核岭回归KRR的分类准确率提高了5.6%;Stacking模型与支持向量机SVM的分类准确率均提高了5.5%。
经遗传算法GA优化后,显而易见,基于多算法融合的Stacking模型预测机械钻速的分类准确率最高,为94.2%。
步骤7:利用训练后的Stacking机械钻速预测模型对机械钻速进行预测,得到机械钻速预测结果。
通过本实施例提供的上述机械钻速预测方法,基于现场获取的大量钻井机械钻速数据,进行数据预处理后,利用K近邻KNN算法、核岭回归KRR算法、支持向量机SVM算法共三种算法构建模型,再利用Stacking算法将三种算法进行融合形成最终的机械钻速预测模型,从而更精确地预测机械钻速。通过机械钻速的多种影响因素做出了全面、***的分析,并结合钻井过程中多种影响因素的数据建立了机械钻速预测模型,并测试模型的精度和泛化性,操作简单、预测准确度高。该方法避开了现有预测机械钻速方法存在的不足,且能精确地对机械钻速进行分类预测;在充分考虑多种影响机械钻速因素的同时,还充分利用钻井全过程的大数据价值,对数据进行了充分的挖掘可大幅提升机械钻速预测效率,其预测结果可以作为施工参数优化的依据。
实施例1
本实施例提供一种用于执行实施例1所述机械钻速预测方法的***,该***包括:
数据采集模块,用于采集钻井数据,建立初始样本数据集;
数据处理模块,用于对所述初始样本数据集进行预处理,得到训练集;
模型融合模块,用于利用Stacking算法将K近邻KNN算法、核岭回归KRR算法和支持向量机SVN算法进行融合,得到Stacking机械钻速预测模型;
模型训练模块,用于利用所述训练集对所述Stacking机械钻速预测模型进行训练;
结果预测模块,用于利用训练后的Stacking机械钻速预测模型对机械钻速进行预测;
参数设置模块,用于对所述K近邻KNN算法的参数、所述核岭回归KRR算法的参数和所述支持向量机SVN算法的参数进行设置;
模型设置模块,用于对所述Stacking融合模型的目标函数进行设置;
模型优化模块,用于在Python语言环境下,通过geatpy库利用遗传算法GA对所述Stacking机械钻速预测模型进行优化。
其中,
数据处理模块包括:
数据整理单元,用于利用Excel或TXT文本对所述钻进数据进行整理;
清洗/筛选/去噪单元,用于对整理后的现场钻井数据进行清洗、筛选和去噪处理;
缺失值处理单元,用于对经过清洗、筛选和去噪后的现场钻井数据进行缺失值处理;
归一化处理单元,用于对整理后的现场钻井数据进行去噪;
数据划分单元,用于将归一化处理后的特征数据随机划分为训练集和测试集;
数据筛选单元,用于获取影响机械钻速的多个影响因素;针对每一个影响因素,根据影响因素的特征属性,从所述经过缺失值处理后的钻井数据中筛选出具有相同特征属性的钻井数据;
特征向量获取单元,用于利用筛选出的钻井数据建立对应的输入特征向量,得到与所述多个影响因素一一对应的对个输入特征向量;
变量设置单元,用于针对每一个输入特征向量,将输入特征向量中的钻井数据作为输入变量X,将机械钻速作为输出变量Y。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种机械钻速预测方法,其特征在于,包括以下步骤:
采集钻井数据,建立初始样本数据集;
对所述初始样本数据集进行预处理,得到训练集;
利用Stacking算法将K近邻KNN算法、核岭回归KRR算法和支持向量机SVN算法进行融合,得到Stacking机械钻速预测模型;
利用所述训练集对所述Stacking机械钻速预测模型进行训练;
利用训练后的Stacking机械钻速预测模型对机械钻速进行预测。
2.根据权利要求1所述的一种机械钻速预测方法,其特征在于,
所述钻井数据包括:油气井钻井过程中的动态特征数据和静态特征数据;
所述动态特征数据包括:井新度、出井新度、牙齿磨损量、钻压、转速、钻井液排量、钻井液密度、漏斗粘度和钻头压降;
所述静态特征数据包括:钻头直径。
3.根据权利要求1所述的一种机械钻速预测方法,其特征在于,所述建立初始样本数据集包括以下步骤:
利用Excel或TXT文本对所述钻进数据进行整理;
对整理后的现场钻井数据进行清洗、筛选和去噪;
对经过清洗、筛选和去噪后的现场钻井数据进行缺失值处理;
对经过缺失值处理后的钻井数据中除机械钻速数据外的其余特征数据进行归一化处理;
将归一化处理后的特征数据随机划分为训练集和测试集;
获取影响机械钻速的多个影响因素;针对每一个影响因素,根据影响因素的特征属性,从所述经过缺失值处理后的钻井数据中筛选出具有相同特征属性的钻井数据,利用筛选出的钻井数据建立对应的输入特征向量,得到与所述多个影响因素一一对应的对个输入特征向量;针对每一个输入特征向量,将输入特征向量中的钻井数据作为输入变量X,将机械钻速作为输出变量Y。
4.根据权利要求1所述的一种机械钻速预测方法,其特征在于,所述得到训练集之后,包括以下步骤:分别对所述K近邻KNN算法的参数、所述核岭回归KRR算法的参数、所述支持向量机SVN算法的参数和所述Stacking融合模型的目标函数进行设置。
5.根据权利要求4所述的一种机械钻速预测方法,其特征在于,
所述核岭回归KRR算法的参数包括:核函数类型、正则化参数和核函数参数;
所述K近邻KNN算法的参数包括:近邻样本数、近邻样本投票权重和近邻距离标准;
所述支持向量机SVM算法的参数包括:惩罚系数、核函数类型和核函数参数。
6.根据权利要求1所述的一种机械钻速预测方法,其特征在于,所述得到Stacking机械钻速预测模型之后,包括以下步骤:在Python语言环境下,通过geatpy库利用遗传算法GA对所述Stacking机械钻速预测模型进行优化。
7.一种机械钻速预测***,其特征在于,包括:
数据采集模块,用于采集钻井数据,建立初始样本数据集;
数据处理模块,用于对所述初始样本数据集进行预处理,得到训练集;
模型融合模块,用于利用Stacking算法将K近邻KNN算法、核岭回归KRR算法和支持向量机SVN算法进行融合,得到Stacking机械钻速预测模型;
模型训练模块,用于利用所述训练集对所述Stacking机械钻速预测模型进行训练;
结果预测模块,用于利用训练后的Stacking机械钻速预测模型对机械钻速进行预测。
8.根据权利要求7所述的一种机械钻速预测***,其特征在于,
所述数据处理模块包括:
数据整理单元,用于利用Excel或TXT文本对所述钻进数据进行整理;
清洗/筛选/去噪单元,用于对整理后的现场钻井数据进行清洗、筛选和去噪处理;
缺失值处理单元,用于对经过清洗、筛选和去噪后的现场钻井数据进行缺失值处理;
归一化处理单元,用于对整理后的现场钻井数据进行去噪;
数据划分单元,用于将归一化处理后的特征数据随机划分为训练集和测试集;
数据筛选单元,用于获取影响机械钻速的多个影响因素;针对每一个影响因素,根据影响因素的特征属性,从所述经过缺失值处理后的钻井数据中筛选出具有相同特征属性的钻井数据;
特征向量获取单元,用于利用筛选出的钻井数据建立对应的输入特征向量,得到与所述多个影响因素一一对应的对个输入特征向量;
变量设置单元,用于针对每一个输入特征向量,将输入特征向量中的钻井数据作为输入变量X,将机械钻速作为输出变量Y。
9.根据权利要求7所述的一种机械钻速预测***,其特征在于,包括:
参数设置模块,用于对所述K近邻KNN算法的参数、所述核岭回归KRR算法的参数和所述支持向量机SVN算法的参数进行设置;
模型设置模块,用于对所述Stacking融合模型的目标函数进行设置。
10.根据权利要求7所述的一种机械钻速预测***,其特征在于,包括:模型优化模块,用于在Python语言环境下,通过geatpy库,利用遗传算法GA对所述Stacking机械钻速预测模型进行优化。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211011002.1A CN117688465A (zh) | 2022-08-23 | 2022-08-23 | 一种机械钻速预测方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211011002.1A CN117688465A (zh) | 2022-08-23 | 2022-08-23 | 一种机械钻速预测方法及*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117688465A true CN117688465A (zh) | 2024-03-12 |
Family
ID=90126936
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211011002.1A Pending CN117688465A (zh) | 2022-08-23 | 2022-08-23 | 一种机械钻速预测方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117688465A (zh) |
-
2022
- 2022-08-23 CN CN202211011002.1A patent/CN117688465A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109611087B (zh) | 一种火山岩油藏储层参数智能预测方法及*** | |
CN108009716B (zh) | 一种水平井体积压裂效果影响因素多层次评价方法 | |
CN112487582B (zh) | 一种基于cart算法的油气钻井机械钻速预测与优化方法 | |
CN112529341B (zh) | 一种基于朴素贝叶斯算法的钻井漏失机率预测方法 | |
CN110134719B (zh) | 一种结构化数据敏感属性的识别与分类分级方法 | |
CN111797364B (zh) | 一种基于复合云模型的滑坡多层次安全评价方法 | |
CN111126865B (zh) | 一种基于科技大数据的技术成熟度判断方法和*** | |
CN112364560B (zh) | 矿山凿岩装备作业工时智能预测方法 | |
CN111723949A (zh) | 基于选择性集成学习的孔隙度预测方法 | |
CN113537609A (zh) | 一种基于文本智能挖掘的政策热点预测方法 | |
CN111914943A (zh) | 倾倒式岩溶危岩稳定综合判别的信息向量机方法及装置 | |
CN109597944B (zh) | 一种基于深度信念网络的单分类微博谣言检测模型 | |
CN117272841B (zh) | 一种基于混合神经网络的页岩气甜点预测方法 | |
CN116822971B (zh) | 一种井壁风险等级预测方法 | |
Gunawan et al. | C4. 5, K-Nearest Neighbor, Naïve Bayes, and Random Forest Algorithms Comparison to Predict Students' on TIME Graduation | |
CN117688465A (zh) | 一种机械钻速预测方法及*** | |
CN111539616A (zh) | 一种基于混合型特征选择的新钻井潜力评价方法 | |
CN114818493A (zh) | 一种隧道岩体完整程度定量评价的方法 | |
CN113887049A (zh) | 一种基于机器学习的石油钻井的钻速预测方法及*** | |
CN117540277B (zh) | 一种基于WGAN-GP-TabNet算法的井漏预警方法 | |
Nidhi et al. | Predictive Model for Students' Academic Performance Using Classification and Feature Selection Techniques | |
CN115983088B (zh) | 一种基于集成学习建立的海相页岩原地气量预测模型 | |
Silalahi et al. | Analysis of Iterative Dichotomiser 3 Algorithm Uses Fuzzy Curves Shoulder as a Determinant of Grade Value | |
Paśko et al. | Bootstrap aggregation technique for evaluating the significance of manufacturing process parameters in the glass industry | |
CN109614584B (zh) | 一种资源测井数据的重建方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |