CN113283180A - 基于K-means与SVR组合的致密油藏水平井压裂产能预测方法与应用 - Google Patents

基于K-means与SVR组合的致密油藏水平井压裂产能预测方法与应用 Download PDF

Info

Publication number
CN113283180A
CN113283180A CN202110718754.0A CN202110718754A CN113283180A CN 113283180 A CN113283180 A CN 113283180A CN 202110718754 A CN202110718754 A CN 202110718754A CN 113283180 A CN113283180 A CN 113283180A
Authority
CN
China
Prior art keywords
data
svr
fracturing
combination
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110718754.0A
Other languages
English (en)
Inventor
张晓东
邓杰
刘新平
杨鹏磊
陈远行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Petroleum East China
Original Assignee
China University of Petroleum East China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Petroleum East China filed Critical China University of Petroleum East China
Priority to CN202110718754.0A priority Critical patent/CN113283180A/zh
Publication of CN113283180A publication Critical patent/CN113283180A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • EFIXED CONSTRUCTIONS
    • E21EARTH OR ROCK DRILLING; MINING
    • E21BEARTH OR ROCK DRILLING; OBTAINING OIL, GAS, WATER, SOLUBLE OR MELTABLE MATERIALS OR A SLURRY OF MINERALS FROM WELLS
    • E21B43/00Methods or apparatus for obtaining oil, gas, water, soluble or meltable materials or a slurry of minerals from wells
    • E21B43/25Methods for stimulating production
    • E21B43/26Methods for stimulating production by forming crevices or fractures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Economics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Mining & Mineral Resources (AREA)
  • Geology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Geometry (AREA)
  • Computer Hardware Design (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Environmental & Geological Engineering (AREA)
  • Fluid Mechanics (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • General Life Sciences & Earth Sciences (AREA)
  • Geochemistry & Mineralogy (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于k‑means的支持向量回归(SVR)组合的致密油藏水平井压裂产能组合预测方法与应用,属于油气勘探开发技术领域。该方法包括获取有关影响产能数据集;进行数据清洗、数据预处理;主成分分析算法计算特征权重并进行特征加权;灰度关联分析算法找出主控因素;对地质因素和物性因素根据K‑means聚类分析算法进行聚类;根据聚类结果结合压裂施工数据进行SVR算法模型建立,寻找出最优精度模型来进行预测;利用SVR模型对低产油井进行压裂施工建议指导。本发明由于采取以上技术方案,可以更好的解决由于压裂施工设计等原因造成油井低产的主要因素和巨大经济损失,为致密油产能预测提供一种新的产能组合预测方式。

Description

基于K-means与SVR组合的致密油藏水平井压裂产能预测方法 与应用
技术领域
本发明涉及一种产能预测方法,特别涉及一种基于K-means与SVR组合的致密油藏水平井压裂产能预测方法与应用,属于油气勘探开发技术领域。
背景技术
致密油藏是当今非常规油气开采的主要来源之一,随着近年钻井水平和开发技术的进步影响,多数油田已采用水平井配合体积压裂技术的开采方式来替换原有开发手段而达到增产和提高采收率的重要方法。在这样的开采模式下,研究致密油水平压裂井长时间持续高产的主要因素以及准确预测油藏产能,对后序致密油的高效开发具有重要指导意义和经济效益。
目前有关油藏产能预测的方法大致分为两类:一类是纵向预测,主要是以非达西渗流为基础推导出产能公式;另一类是横向预测,主要是用模式识别等数学方法来处理参数,从而建立产能预测模型。其中基于机理分析的公式预测需要与生产实际情况相结合,准确率和合理性有待进一步提高,而采用单一机器学习算法对致密油产能预测未能解决:1.不同特征参数贡献度不同的问题;2.致密油产能影响参数众多,直接带入可能导致过拟合;3.其中地质参数和流体物性参数属于静态参数,其相近区块井静态参数基本一致。因此从数据挖掘角度出发,结合现场实际情况,提出基于聚类分析算法与回归算法的组合模型则可解决以上问题。通过主成分分析算法进行特征赋权,灰度关联算法分析主控因素,网格遍历算法寻找最优精度模型来提高模型准确率具有重要的理论和实际意义,通过对低产油井的压裂施工参数研究与优化将大幅度提高油田整体开发经济效益。
发明内容
针对上述问题,本发明的目的是避免由于压裂施工参数的不确定性造成的人力资源和财力资源大量浪费,从而提高致密油田压裂施工队伍的施工质量和整体经济效益。
为实现上述目的,本发明采取以下技术方案:基于K-means与SVR组合的致密油藏水平井压裂产能预测方法与应用,其包括以下几个步骤:
(1)采集致密油藏地质数据、流体物性数据、压裂施工数据和压后产能数据。
(2)对采集的数据进行数据清洗和数据预处理。
(3)对不同类型数据特征计算权重并进行加权。
(4)找出不同类型数据的主控因素。
(5)对地质参数和流体物性参数处理后的数据进行聚类分析建模。
(6)聚类结果结合压裂施工数据进行预测算法建模,寻找最优模型参数。
(7)构建SVR算法模型。
所述步骤1),采集的地质数据、流体物性数据和压裂施工数据作为模型自变量,选取压后产能数据中的“投产当年累计产油”作为因变量。
所述步骤2),通过均方差法对异常数据进行去除,通过最大-最小标准化将数据映射到[0,1]区间。
所述步骤3),通过主成分分析算法对地质类、流体物性类和压裂施工类因素进行特征赋权,将赋权后的数据替换原有数据。
所述步骤4),通过灰度关联算法对所有特征值进行一个关联性大小排序,从而来筛选地质类、流体物性类和压裂施工类因素中主要影响输出的特征值。
所述步骤5),通过步骤4)所选取的特征值重构后的数据体,选取其中属于地质参数和流体物性参数的特征作为k-means模型的数据体来建模。使用网格搜索算法来寻找最优簇数k。
所述步骤6),通过步骤5)所得到的类别特征和压裂施工参数结合重构数据体,选取投产当年累计产油作为算法的输出值来构建SVR预测模型。使用网格搜索算法来寻找最优惩罚参数c和核函数参数g。
所述步骤7),通过步骤6)寻找的最优值来设置SVR的参数,并将数据输入SVR模型,得到最优预测精确度的模型。
本发明由于采取以上技术方案,其具有以下优点:1、本发明通过均方差法去除了异常数据,提高了数据的准确性,通过标准化去除量纲,使不同的特征具有可比性,消除量纲引起的特征数值量级别对分析结果的影响。2、通过主成分分析算法计算不同特征权重,解决了k-means算法的硬聚类问题。3、采用灰度关联分析算法找出最具有代表性的影响产能变化的特征,提高模型预测的准确性。4、能对相近区块低产井的压裂施工参数进行优化指导。
附图说明
图1.致密油藏水平井压裂产能预测算法流程图;
图2.SVR示意图;
图3.组合模型示意图。
具体实施方式
为了更加清晰的阐述本发明的技术方案,下面结合附图和实施例对本发明进行详细的描述。
本实施方式所述的一种基于K-means与SVR组合的致密油藏水平井压裂产能预测方法与应用流程图如图1,该方法具体通过以下步骤实现:
1.采集了致密油藏多个区块的地质数据、流体物性数据、压裂施工数据和压后产能数据。具体得到了如地质类:渗透率、孔隙率、自然伽马、有效厚度;流体物性类:地层原油粘度、地层原油密度、含有饱和度;压裂施工类:支撑剂用量、压裂液用量、压裂液类型、段数、平均砂比等作为算法所需自变量,压后产能类:投产当年累计产油作为算法所需因变量。
2.对每个特征数据进行统计和分布查询,通过均方差法筛选异常数据。由于油井数据具有不同的量纲和数量级,如果直接使用筛选后的数据进行建模训练,数据中值较高的对算法影响较大,从而忽略了数值均值较低的特征。因此要对筛选后的数据,进行min-max标准化,将每个特征值结果映射到[0,1]之间,具体转换函数如下:
Figure BDA0003135830430000041
其中x,min,max分别是特征值的样本数据,特征值样本数据中最小值,特征值样本数据中最大值。
3.对步骤2的数据进行主成分分析,对所有特征值计算权重进行特征赋权构建新的数据体。
4.对步骤3加权后的数据进行灰度关联算法分析,对所有特征值(子序列)与投产当年累计产油(母序列)进行关联度计算,得到关联度大小排序,分别找出地质、流体物性和压裂施工数据与产油量关联性最大的前3个特征值作为之后模型的输入。其中关于子序列的各个指标与母序列的关联系数计算方法如下:
Figure BDA0003135830430000051
式中ρ为分辨系数,0<ρ<1,若ρ越小,关联系数间差异越大,区分能力越强。通常ρ取0.5。x0(k),xi(k)分别表示母序列第k个数,子序列第i个特征值的第k个数。ζi(k)则表示第i个特征的第k个值与母序列第k个值的关联系数。通过关联系数来计算关联度再进行最后的排序。其中关联度得计算如下:
Figure BDA0003135830430000052
其中ri为第i个特征与母序列的关联度大小,n为样本数量。最后对所有进ri行排序即可得到关联度排序,最终所选地质主控因素为:渗透率,孔隙度,有效厚度;流体物性主控因素为:地层原油粘度,地层原油密度,含油饱和度;压裂施工主控因素为:支撑剂用量,压裂液用量,压裂液类型,段数。
5.对步骤4选取后的地质和流体物性数据建立k-means聚类分析模型。
6.对步骤5得到的聚类特征值与步骤4的压裂施工类型数据联立构建新数据体,如图3所示示意图。对更改后的样本进行划分训练集和测试集,进行SVR算法建模,通过网格遍历搜索算法来遍历SVR算法中的核函数参数g和惩罚参数c,使用预测值与真实值的均方误差MSE作为模型的性能指标,均方误差越小模型越优,通过找到最小均方误差所设的参数来设置SVR最终模型参数。其中均方误差MSE计算方式为:
Figure BDA0003135830430000053
其中
Figure BDA0003135830430000054
为第i个样本的预测值,yi为第i个样本的实际值,n为样本数量。
上述实施例仅用于说明本发明,其中各方法的实施步骤等都是可以有所变化的,凡是在本发明技术方案的基础上进行的等同变换和改进,均不应排除在本发明的保护范围之外。

Claims (7)

1.基于K-means与SVR组合的致密油藏水平井压裂产能预测方法与应用,其包括如下步骤:
1)采集影响产能的样本数据,包括渗透率,孔隙度,地层原油粘度,地层原油密度,支撑剂用量,压裂液用量,压裂液类型,段数;
2)对采集的数据进行数据清洗,去除重复数据,奇异数据构建数据体;
3)对数据体进行去量纲预处理;
4)采用主成分分析算法计算特征权重进行特征赋权;
5)采用灰度关联分析算法进行主控因素提取;
6)对地质参数和流体物性参数进行聚类分析建模;
7)基于支持向量回归建立预测模型。
2.如权利要求1中所述的基于K-means与SVR组合的致密油藏水平井压裂产能预测方法与应用,其特征在于,所述步骤2)对原始样本进行数据筛选,对每个特征值的均值和方差进行统计,选取数值范围为[均值-方差,均值+方差]。
3.如权利要求1中所述的基于K-means与SVR组合的致密油藏水平井压裂产能预测方法与应用,其特征在于,所述步骤3)对筛选后的数据再进行最大-最小标准化预处理,使数据分布在区间[0,1]。
4.如权利要求1中所述的基于K-means与SVR组合的致密油藏水平井压裂产能预测方法与应用,其特征在于,所述步骤4)采用主成分分析算法,对标准化后的数据体进行特征权重计算,对计算后的特征赋权重构数据体。
5.如权利要求1中所述的基于K-means与SVR组合的致密油藏水平井压裂产能预测方法与应用,其特征在于,所述步骤5)采用灰度关联分析算法,对标准化后的数据体进行关联度计算和排序,最终所选地质主控因素为:渗透率,孔隙度,有效厚度;流体物性主控因素为:地层原油粘度,地层原油密度,含油饱和度;压裂施工主控因素为:支撑剂用量,压裂液用量,压裂液类型,段数作为自变量,投产当年累计产油作为因变量。
6.如权利要求1中所述的基于K-means与SVR组合的致密油藏水平井压裂产能预测方法与应用,其特征在于,所述步骤6)对地质参数和流体物性参数进行k-means聚类建模。
7.如权利要求1或权利要求6中所述的基于K-means与SVR组合的致密油藏水平井压裂产能预测方法与应用,其特征在于,所述步骤7)对聚类后的类别特征与压裂参数联立建立新数据体进行算法训练SVR(kernel,C,gamma)其中kernel为为核函数类型,C为惩罚系数,gamma为核函数系数,通过网格遍历搜索算法遍历参数,使用均方误差MSE作为模型评价标准确定最优参数采用参数kernel=RBF,C=0.13,g=0.035。
CN202110718754.0A 2021-06-28 2021-06-28 基于K-means与SVR组合的致密油藏水平井压裂产能预测方法与应用 Withdrawn CN113283180A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110718754.0A CN113283180A (zh) 2021-06-28 2021-06-28 基于K-means与SVR组合的致密油藏水平井压裂产能预测方法与应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110718754.0A CN113283180A (zh) 2021-06-28 2021-06-28 基于K-means与SVR组合的致密油藏水平井压裂产能预测方法与应用

Publications (1)

Publication Number Publication Date
CN113283180A true CN113283180A (zh) 2021-08-20

Family

ID=77285778

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110718754.0A Withdrawn CN113283180A (zh) 2021-06-28 2021-06-28 基于K-means与SVR组合的致密油藏水平井压裂产能预测方法与应用

Country Status (1)

Country Link
CN (1) CN113283180A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114320266A (zh) * 2021-11-17 2022-04-12 陕西延长石油(集团)有限责任公司 一种基于支持向量机的致密油藏常规井产量预测方法
CN114461704A (zh) * 2022-04-14 2022-05-10 浙江理工大学 一种基于织机产能预测织机了机的方法及***
CN115828130A (zh) * 2023-02-14 2023-03-21 中国石油天然气股份有限公司 基于聚类算法的多参数优势水流通道自动识别方法及***
CN117351300A (zh) * 2023-09-14 2024-01-05 北京市燃气集团有限责任公司 一种目标检测模型的小样本训练方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109871997A (zh) * 2019-02-14 2019-06-11 国网宁夏电力有限公司经济技术研究院 一种适应复杂环境的降温负荷组合测算***
CN112561144A (zh) * 2020-12-07 2021-03-26 西安石油大学 一种致密油压裂水平井产能主控因素评判与产能预测方法
CN112664184A (zh) * 2020-12-23 2021-04-16 中国石油大学(华东) 基于支持向量回归算法的抽油机井检泵周期预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109871997A (zh) * 2019-02-14 2019-06-11 国网宁夏电力有限公司经济技术研究院 一种适应复杂环境的降温负荷组合测算***
CN112561144A (zh) * 2020-12-07 2021-03-26 西安石油大学 一种致密油压裂水平井产能主控因素评判与产能预测方法
CN112664184A (zh) * 2020-12-23 2021-04-16 中国石油大学(华东) 基于支持向量回归算法的抽油机井检泵周期预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王宇: "致密油藏压裂水平井产能模型与应用研究", 《中国优秀博硕士学位论文全文数据库(硕士)工程科技Ⅰ辑》 *
郭菊娥 等: "基于GMDH-SVR致密气开发过程参数优化", 《运筹与管理》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114320266A (zh) * 2021-11-17 2022-04-12 陕西延长石油(集团)有限责任公司 一种基于支持向量机的致密油藏常规井产量预测方法
CN114320266B (zh) * 2021-11-17 2023-11-28 陕西延长石油(集团)有限责任公司 一种基于支持向量机的致密油藏常规井产量预测方法
CN114461704A (zh) * 2022-04-14 2022-05-10 浙江理工大学 一种基于织机产能预测织机了机的方法及***
CN114461704B (zh) * 2022-04-14 2022-06-24 浙江理工大学 一种基于织机产能预测织机了机的方法及***
CN115828130A (zh) * 2023-02-14 2023-03-21 中国石油天然气股份有限公司 基于聚类算法的多参数优势水流通道自动识别方法及***
CN117351300A (zh) * 2023-09-14 2024-01-05 北京市燃气集团有限责任公司 一种目标检测模型的小样本训练方法及装置
CN117351300B (zh) * 2023-09-14 2024-05-14 北京市燃气集团有限责任公司 一种目标检测模型的小样本训练方法及装置

Similar Documents

Publication Publication Date Title
CN113283180A (zh) 基于K-means与SVR组合的致密油藏水平井压裂产能预测方法与应用
CN108009716B (zh) 一种水平井体积压裂效果影响因素多层次评价方法
CN109102180B (zh) 致密砂岩储层双甜点评价的综合参数评价方法
CN104747185B (zh) 非均质油藏储层综合分类评价方法
CN110674841B (zh) 一种基于聚类算法的测井曲线识别方法
CN111046341A (zh) 一种基于主成分分析的非常规天然气压裂效果评价及产能预测方法
CN114997496B (zh) 一种基于时空序列数据约束的无监督储层智能分段方法
CN115438823A (zh) 一种井壁失稳机制分析与预测方法及***
CN109184677A (zh) 用于非均质互层砂体的储层评价方法
CN107038505A (zh) 基于机器学习的找矿模型预测方法
CN112664184A (zh) 基于支持向量回归算法的抽油机井检泵周期预测方法
CN113537585A (zh) 基于随机森林和梯度提升决策树的油田增产措施推荐方法
CN116384554A (zh) 机械钻速预测方法、装置、电子设备及计算机存储介质
CN115438090A (zh) 基于掉块图像特征的井壁失稳类型分析及预测方法及***
CN116562428A (zh) 一种基于机器学习的压裂施工参数优化方法
CN113537706A (zh) 一种基于智能集成的油田增产措施优选方法
CN117312919A (zh) 基于bo-cnn-lstm模型的冲击地压预警方法
CN110956388A (zh) 一种海上油气藏增产方案生成方法
CN116011351A (zh) 一种基于聚类算法和WideDeep网络的油井合理沉没度确定方法
CN117332668A (zh) 一种基于数据驱动的页岩气井压裂效果分析方法和***
CN113988410A (zh) 一种基于knn算法与多项式回归算法组合的跨区域致密油藏油井产能预测方法
CN114109374B (zh) 页岩气储层靶窗位置的确定方法及装置
CN114004151A (zh) 基于LSTM-VGGNet的抽油机井故障预测方法
CN113627640A (zh) 一种针对缝洞型油藏油气井的产能试井预测方法及***
CN113344729B (zh) 一种基于小样本学习的剩余油挖潜方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20210820