CN113807021A - 一种基于指标分析及多模型融合的气井产能等级预测方法 - Google Patents
一种基于指标分析及多模型融合的气井产能等级预测方法 Download PDFInfo
- Publication number
- CN113807021A CN113807021A CN202111152813.9A CN202111152813A CN113807021A CN 113807021 A CN113807021 A CN 113807021A CN 202111152813 A CN202111152813 A CN 202111152813A CN 113807021 A CN113807021 A CN 113807021A
- Authority
- CN
- China
- Prior art keywords
- parameters
- correlation coefficient
- historical
- well layer
- unimpeded flow
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000004458 analytical method Methods 0.000 title claims abstract description 27
- 230000004927 fusion Effects 0.000 title claims abstract description 16
- 238000007637 random forest analysis Methods 0.000 claims abstract description 13
- 238000012706 support-vector machine Methods 0.000 claims abstract description 13
- 239000007789 gas Substances 0.000 claims description 47
- 229930195733 hydrocarbon Natural products 0.000 claims description 35
- 150000002430 hydrocarbons Chemical class 0.000 claims description 35
- 239000004215 Carbon black (E152) Substances 0.000 claims description 30
- 239000007788 liquid Substances 0.000 claims description 22
- 239000004576 sand Substances 0.000 claims description 21
- 238000010219 correlation analysis Methods 0.000 claims description 20
- 238000010276 construction Methods 0.000 claims description 18
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 claims description 14
- 238000010220 Pearson correlation analysis Methods 0.000 claims description 11
- 239000011159 matrix material Substances 0.000 claims description 11
- 230000035699 permeability Effects 0.000 claims description 10
- 238000010586 diagram Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 229910052757 nitrogen Inorganic materials 0.000 claims description 7
- 238000012216 screening Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 description 7
- 238000005259 measurement Methods 0.000 description 6
- 230000000875 corresponding effect Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000035515 penetration Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 238000005086 pumping Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A10/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
- Y02A10/40—Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Marketing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Game Theory and Decision Science (AREA)
- Evolutionary Biology (AREA)
- Educational Administration (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Primary Health Care (AREA)
- Geometry (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种基于指标分析及多模型融合的气井产能等级预测方法,包括获取目标储层数据;并计算出各历史井层的产能等级;确定出影响无阻流量的q个参数;对各参数进行偏相关系数排序;对各参数进行灰色关联系数排序;确定参数的最终排序结果,选取模型准确度最高的参数作为模型的指标参数;建立支持向量机、K近邻、随机森林三个分类器用于产能等级预测,将三种分类器的结果通过投票法进行融合,及取预测结果的众数作为最终的结果;如果没有众数,则找出所有与预测结果相同等级的历史井数据组成历史分析数据库;如果有多个众数,则找出与众数预测结果相同等级的历史井数据组成历史分析数据库;通过对比目标井层与历史井层最相似的结果作为最终结果。
Description
技术领域
本发明涉及一种基于指标分析及多模型融合的气井产能等级预测方法。
背景技术
致密低渗气藏在开发过程中,为了获得工业气流,需要对气藏采取适当的压裂增产措施。在压裂施工结束后,储层产能评价与预测对于气田的开发有着重要的意义,它既能评价压裂施工的效果,判断增产措施的有效性,又可以为后期的单井陪产、井网部署等生产规划提供依据。
压裂施工后的产能是地质数据、施工数据等多因素影响的结果,目前常用的方法是产能试井,通过多次改变气井的工作制度,测量在各个不同工作制度下的稳定产量与井底压力,从而确定气井的产能。这种测试方法需要改变工作制度,容易伤害储层,引起储层出砂。同时测试时间较长,增加测试费用。
发明内容
为了克服现有技术中的问题,本发明提供一种基于指标分析及多模型融合的气井产能等级预测方法。
本发明解决上述技术问题所提供的技术方案是:一种基于指标分析及多模型融合的气井产能等级预测方法,包括以下步骤:
步骤S1、获取目标储层各历史井层的无阻流量a、各历史井层储层参数和历史井施工参数以及目标井层储层参数、目标井施工参数;
步骤S2、根据各历史井的无阻流量a确定历史井层无阻流量最大值S,并计算出各历史井层的产能等级;
当a≥0.5S时,该历史井层的产能等级为4;当0.5S>a≥0.25S时,该历史井层的产能等级为3;当0.25S>a≥0.125S时,该历史井层的产能等级为2;当a<0.125S时,该历史井层的产能等级为1;
步骤S3、根据目标井层储层参数、目标井施工参数确定出影响无阻流量的q个参数;
步骤S4、将q个参数进一步计算出Pearson相关系数矩阵,并做出相关系数矩阵热力图,得到各影响参数之间的相关系数;
步骤S5、通过比较各参数两两之间相关系数的大小,筛选出参数之间相关系数大于0.8的参数组成一组,最终得到n组共m个参数,并将剩下的q-m个数据组成一组;保留筛选出的n组中每一组与无阻流量相关系数最大的参数,其余参数全部删掉,得到n个参数,并将这n个参数放入之前q-m个数据中,共q-m+n个参数;
步骤S6、将q-m+n个参数在Pearson相关分析的基础上,对影响无阻流量的因素进行偏相关分析,得到各参数与无阻流量的偏相关系数,并根据偏相关系数绝对值的大小对各参数进行偏相关系数排序;
步骤S7、将q-m+n个参数再在Pearson相关分析的基础上,对影响无阻流量的因素进行灰色关联分析,得到各参数与无阻流量的灰色关联系数,并根据灰色关联系数对各参数进行灰色关联系数排序;
步骤S8、根据偏相关系数排序和灰色关联系数排序确定参数的最终排序结果;
步骤S9、根据参数的最终排序结果,首先选取排在前面的5个参数作为初始输入参数,将参数输入SVM模型,记录模型准确度,然后根据排序结果依次递增参数个数,记录模型准确度;对比分析参数个数对模型准确度的影响,选取模型准确度最高的参数作为模型的指标参数;
步骤S10、建立支持向量机、K近邻、随机森林三个分类器用于产能等级预测,再将步骤S9中确定的模型的指标参数分别带入支持向量机、K近邻、随机森林三个分类器中预测目标井的产能等级,将三种分类器的结果通过投票法进行融合,及取预测结果的众数作为最终的结果;如果没有众数,则找出所有与预测结果相同等级的历史井数据组成历史分析数据库;如果有多个众数,则找出与众数预测结果相同等级的历史井数据组成历史分析数据库;通过对比目标井层与历史井层最相似的结果作为最终结果。
进一步的技术方案是,所述储层参数包括有效厚度、渗透率、含气饱和度、温度、水平段长度、平均全烃、孔隙度;所述施工参数包括平均每段加砂量、排量、泵压、返排率、总液量、压裂段数、液氮用量。
进一步的技术方案是,所述步骤S3中首先定性分析影响无阻流量的参数,做出各参数与无阻流量的散点图,并画出数据趋势线,分析各参数对无阻流量的影响,选取与无阻流量有变化趋势的参数为影响无阻流量的q个参数。
进一步的技术方案是,所述步骤S6中各参数与无阻流量的偏相关系数的计算过程为:
将q-m+n个参数再一次计算Pearson相关系数,得到新的Pearson相关系数矩阵R;
对新的Pearson相关系数矩阵R求逆;
再计算出各参数与无阻流量的偏相关系数;
式中:cij为参数与无阻流量的偏相关系数。
进一步的技术方案是,所述步骤S7中各参数与无阻流量的灰色关联系数的计算过程为:
将q-m+n个参数组成一个原始序列;该原始序列中无阻流量为参考数列,除无阻流量外的其他参数构成比较数列,其数列分别表示为:
x0={x0(1),x0(2),x0(3),…,x0(n)}
xi={xi(1),xi(2),xi(3),…,xi(n)}(i=1,2,…,m)
式中:x0为参考数列;xi为比较数列;i为比较数列的序号;m为数列中数据样品的个数;n为自变量因素的个数;
通过数据归一化方法将原始数据进行无量纲化处理;
根据下式计算各参数与无阻流量的灰色关联系数;
Δoi(k)=|Yi(k)-Y0(k)|
式中:ρ为分辨系数,通常取0.5。
进一步的技术方案是,所述步骤S8中的具体过程为:将偏相关系数排序和灰色关联系数排序中都排在前面的参数也排在前面,将两者排序相差较大的指标以灰色关联系数排序的结果作为结论,得到各参数的最终排序结果。
进一步的技术方案是,所述步骤S10中通过对比目标井层与历史井层最相似的结果作为最终结果的具体过程为:
分别根据支持向量机、K近邻、随机森林三个分类器的预测产能等级确定出相同预测产能等级的历史井层数据;
再根据下式分别计算目标井层与支持向量机、K近邻、随机森林三个分类器相同预测产能等级的历史井层的差异;
r=(r1,r2,…,rn)
X=(X1,X2,…,Xn)
L=(L1,L2,…,Ln)
式中:σ为井层间的差异;
选取差异最小对应的预测产能等级为最终结果。
本发明具有以下有益效果:提出了一种基于指标筛选及多模型融合的气井产能等级预测方法。综合考虑多种指标分析的结果,提高了单一指标筛选方法的可靠性,通过多模型的融合,在单一模型的基础上提高了模型的准确度。同时该方法预测气井产能时不需要进行产能试井,规避了产能试井对储层带来的伤害,降低了产能试井成本。并基于本发明,选取实例某气田的井层进行应用,通过验证发现本模型的准确度与单一模型准确度相比提高了7%,说明了该方法的有效性。
附图说明
图1为地质参数与无阻流量的关系图;
图2为部分地质参数与无阻流量的关系图;
图3为测井参数与无阻流量的关系图;
图4为不同烃含量水平段长度与无阻流量的关系图;
图5为施工参数与无阻流量的关系图;
图6为相关系数热力图;
图7为指标个数与准确度图关系图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的一种基于指标分析及多模型融合的气井产能等级预测方法,包括以下步骤:
步骤S1、获取目标储层各历史井层的无阻流量a、各历史井层储层参数和历史井施工参数以及目标井层储层参数、目标井施工参数;
步骤S2、根据各历史井的无阻流量a确定历史井层无阻流量最大值S,并计算出各历史井层的产能等级;
当a≥0.5S时,该历史井层的产能等级为4;当0.5S>a≥0.25S时,该历史井层的产能等级为3;当0.25S>a≥0.125S时,该历史井层的产能等级为2;当a<0.125S时,该历史井层的产能等级为1;
步骤S3、根据目标井层储层参数、目标井施工参数确定出影响无阻流量的q个参数;
1)储层参数
储层参数表征了地层的油气含量和油气渗流条件,包括有效厚度、渗透率、含气饱和度、温度、水平段长度、平均全烃、孔隙度等。有效厚度、含气饱和度和平均全烃越大,说明储层油气含量越多,更容易获得工业产能。渗透率、孔隙度说明了油气渗流条件,越大越有利于油气的流动。温度影响着油气的粘度,粘度的大小也影响着油气渗流。水平段长度,一方面可以表征油气的含量,同时还能表示油气的渗流面积。各影响因素与无阻流量的关系如图1和2所示:
从图1和2中可以看出气测显示砂岩段长度、含气饱额度、水平段长度、砂岩长度等参数与无阻流量成正相关。砂岩长度、气测显示砂岩长度、含气饱合度都可以表示烃含量的大小,这些参数越大,烃含量就越多;水平段长度越长可以增加井筒与地层的接触面积。同时泥岩长度与无阻流量成负相关,因为泥岩越长砂岩越短。
除此之外GR(自然伽马)、AC(声波时差)、CNL(补偿中子)、DEN(补偿密度)、LLD(深感应电阻率)也表征了储层的特征。GR可以分析地层的岩性;AC可以分析地层孔隙度、地层岩性和判断气层;CNL可用于分析储层的孔隙度等参数;DEN可用于储层划分和孔隙度确定等;LLD可分析地层流体性质,用于确定油气饱和度。各影响因素与无阻流量的关系如图3所示:
从图3中分析,这些测井参数似乎与无阻流量的关系不大,但这些测井参数也可以反映储层特征,因此可以用来分析无阻流量。
最后根据147口水平井的录井数据,分析了近5000个与全烃有关的数据,统计出全烃含量大于等于10%、全烃含量大于等于20%、全烃含量大于等于30%、全烃含量大于等于40%对应的水平段长,与无阻流量的关系如图4所示:
从图4可以发现,因为这一参数与烃含量直接相关,因此也会影响无阻流量。但是这四个参数具有线性关系,在下一步分析中可以删去一些参数。
2)施工参数
施工参数表征了地下裂缝的发展情况,说明了油气渗流环境的改善条件,包括平均每段加砂量、排量、泵压、返排率、总液量、压裂段数、液氮用量等。各影响因素与无阻流量间的关系如图5所示:
压裂段数、总液量、液氮用量、总砂量、平均每段加砂量与无阻流量正相关。压裂段数越多总液量总砂量等参数越大,越可能形成有效的支撑裂缝,无阻流量也就越高,同时返排液量与无阻流量成负相关,当返排液少时,留在地层中的流体可能对地层造成伤害。
步骤S4、将q个参数进一步计算出Pearson相关系数矩阵,并做出相关系数矩阵热力图,得到各影响参数之间的相关系数;
步骤S5、通过比较各参数两两之间相关系数的大小,筛选出参数之间相关系数大于0.8的参数组成一组,最终得到n组共m个参数,并将剩下的q-m个数据组成一组;保留筛选出的n组中每一组与无阻流量相关系数最大的参数,其余参数全部删掉,得到n个参数,并将这n个参数放入之前q-m个数据中,共q-m+n个参数;
步骤S6、将q-m+n个参数在Pearson相关分析的基础上,对影响无阻流量的因素进行偏相关分析,得到各参数与无阻流量的偏相关系数,并根据偏相关系数绝对值的大小对各参数进行偏相关系数排序;
将上一步确定的q个影响因素进行Pearson相关分析,Pearson相关用于评估两个连续变量之间的线性关联强度,其目的是剔除彼此之间线性关系较高的参数,降低数据的维度。设X、Y为样本数据,其计算公式为:
式中:Cov(X,Y)为X,Y的协方差,D(X),D(Y)分别为X,Y的方差。
上式可写为:
计算出Pearson相关系数矩阵后,做出相关系数矩阵热力图,可直观的看到各参数之间的相关系数大小。通过比较各参数两两之间相关系数的大小,筛选出影响因素之间相关系数大于0.8的参数组成一组,最终得到n组共m个参数(m>n),并将剩下的q-m个数据组成一组。保留筛选出的n组中每一组与无阻流量相关系数最大的参数,其余参数全部删掉,得到n个参数,并将这n个参数放入之前q-m个数据中,共q-m+n个参数,准备下一步分析,完成指标的初次筛选。
得到相关系数热力图如图6所示:
通过分析相关系数结果发现,有效厚度与砂厚之间;水平段长度、砂岩长度之间;平均全烃、全烃最大值、全烃含量大于30%长度、全烃含量大于40%长度之间;泥岩长度、砂岩长度、气测显示砂岩长度、全烃含量大于10%长度之间;总砂量与平均每段加砂量、总液量、压裂段数、液氮用量之间有较高的线性相关性。储层砂岩越厚则有效厚度也就越大,同样的,水平段长度越长,砂岩长度也就越长。平均全烃、全烃最大值、全烃含量大于30%长度、全烃含量大于40%长度都是反映的烃含量,因此也有线性关系。而全烃含量大于10%长度与气测显示砂岩长度相差不大,因此具有线性关系。平均每段加砂量、总液量、压裂段数、液氮用量越大则泵入地层的砂量越大,因此线性相关。通过对比这些线性参数与无阻流量相关性的大小,最终删除砂厚、平均每段加砂量、总液量、压裂段数、液氮用量、水平段长度、泥岩长度、全烃最大值11个参数。另外孔隙度与AC的相关性较高,而且孔隙度与AC存在联系,因此删除AC。
偏相关分析
Pearson相关分析在计算变量间相关程度过程中,只考虑所涉及的两个变量之间的关系。如果实际的问题模型仅有两个变量,那么通过这种方法可以获得代表他们之间相关程度的数值。但是对于一个包含多个变量的问题模型,由于任意两个变量间都可能存在不同程度的相关性,如果只考虑所涉及两个变量间的简单相关系数往往不能确切地反映他们之间的关系。因为两个变量之间本身存在着相互影响,同时,一个变量可能通过这两个变量之外的一个或多个变量间接对另一个变量产生影响。为了考察两个变量间的真实关联程度,就要去掉其他所有可能的变量所产生的影响。因此,可以进行偏相关分析,其对应的相关度可以用偏相关系数来表示。
其计算方法为:
将上一步分析得到的q-m+n个参数再一次计算Pearson相关系数,得到新的Pearson相关系数矩阵:
对矩阵R求逆:
则可求得xi和xj间的偏相关系数为:
根据偏相关系数绝对值的大小,对各参数进行排序。
根据上述方法,在Pearson相关分析的基础上,对影响无阻流量的因素进行偏相关分析,得到各参数与无阻流量的相关系数如下表所示:
表1偏相关系数表
指标 | 总砂量 | DEN | 返排液量 | 泵压 | LLD | 排量 |
相关 | 0.2466 | 0.2332 | 0.1900 | 0.1602 | 0.1590 | 0.1305 |
指标 | 平均全烃 | CNL | 返排率 | 砂岩长度 | 含气饱和度 | 有效厚度 |
相关 | 0.1097 | 0.0990 | 0.0957 | 0.0564 | 0.0482 | 0.0327 |
指标 | 烃含量大 | GR | 温度 | 渗透率 | 孔隙度 | 气测显示 |
相关 | 0.0257 | 0.0255 | 0.0128 | 0.0022 | 0.0020 | 0.0003 |
偏相关分析的排序与前面相关分析结果对比发现,相关系数大的指标如总砂量、返排液量等排序变化不大,而相关系数小的指标排序变化较大,其原因可能是在进行偏相关分析时,删掉了部分参数,从而影响了剩下参数相关系数的变化。
步骤S7、将q-m+n个参数再在Pearson相关分析的基础上,对影响无阻流量的因素进行灰色关联分析,得到各参数与无阻流量的灰色关联系数,并根据灰色关联系数对各参数进行灰色关联系数排序;
灰色关联法分析步骤如下:
(1)原始序列确定
将第二步Pearson相关分析得到的q-m+n个参数组成一个原始序列。该序列由一个因变量和多个自变量因素组成。其中,因变量因素反映***的行为特征,因素的多个样品数据值构成参考数列,因此无阻流量即为参考数列;自变量因素为影响***行为特征的因素,每一个因素的多个样品数据值可构成一个比较数列,因此除无阻流量外的其他参数构成比较数列。数列分别表示为:
x0={x0(1),x0(2),x0(3),…,x0(n)} (6)
xi={xi(1),xi(2),xi(3),…,xi(n)}(i=1,2,…,m) (7)
式中:x0为参考数列;xi为比较数列;i为比较数列的序号;m为数列中数据样品的个数;n为自变量因素的个数。
(2)原始数据处理
由于原始数据序列中各因素的计量单位不尽相同,不同的数列有不同的数量级和量纲,需要数据归一化方法将原始数据无量纲化。
(3)关联系数计算
根据邓氏关联度模型对原始数据进行无量纲化处理后,将比较数列(第i个)中每一个样品数值和参考数列中所对应的样品数值之间的绝对差值用下式表示:
Δoi(k)=|Yi(k)-Y0(k)| (9)
在全部比较数列中,最大和最小样品数据绝对差值为:
邓氏关联系数表示为:
式中:ρ为分辨系数,ρ∈(0,1),通常取0.5。
(4)关联度计算
由单个关联系数反映出的信息具有分散性,如果仅仅用n个关联系数对比较数列和参考数列之间的关联程度进行表示,根本无法反映各个因素对产量影响程度的大小。因此,需要集中处理关联信息,用其平均值对数列间的关联程度进行定量反映。
式中:roi为第i个比较数列和参考数列之间关联度。将各参数的灰色关联系数进行排序。
通过比较偏相关系数排序与灰色关联系数排序确定最终的排序结果。将两种排序方法都排在前面的参数也排在前面,将两者排序相差较大的指标以灰色关联分析的结果作为结论,得到各参数最终排序。
根据上述方法,在Pearson相关分析的基础上,对影响无阻流量的因素进行灰色关联分析,得到各参数与无阻流量的灰色关联系数如下表所示:
表2灰色关联度系数表
指标 | 总砂 | 砂岩长度 | 气测显 | LLD | 排量 | DEN |
相关 | 0.8197 | 0.8116 | 0.8096 | 0.8041 | 0.8012 | 0.8006 |
指标 | GR | 含气饱和度 | 泵压 | 温度 | 平均全烃 | CNL |
相关 | 0.7994 | 0.7986 | 0.7962 | 0.7955 | 0.7939 | 0.7895 |
指标 | 孔隙 | 有效厚度 | 烃含量 | 返排液量 | 渗透率 | 返排率 |
相关 | 0.7885 | 0.7881 | 0.7766 | 0.7663 | 0.7578 | 0.7460 |
步骤S8、根据偏相关系数排序和灰色关联系数排序确定参数的最终排序结果;
通过对比灰色关联分析结果与偏相关分析结果,同样可以得到,相关系数较大的指标最终排序结果变化不大,为了得到最终排序结果,对比分析灰色关联分析结论与偏相关分析结论,将两种方法都排在前面的指标最终也排在前面,将两者排序相差较大的指标以灰色关联分析的结果作为结论,最终排序结果如下:总砂量、LLD、排量、DEN、砂岩长度、含气饱和度、气测显示砂岩段长、GR、泵压、平均全烃、有效厚度、CNL、温度、返排液量、孔隙度、全烃含量大于20%段长、返排率、渗透率。
步骤S9、根据参数的最终排序结果,首先选取排在前面的5个参数作为初始输入参数,将参数输入SVM模型,记录模型准确度,然后根据排序结果依次递增参数个数,记录模型准确度;对比分析参数个数对模型准确度的影响,选取模型准确度最高的参数作为模型的指标参数;
根据参数最终排序结果,首先选取排在前面的5个参数作为初始输入参数,将参数输入SVM模型,记录模型准确度,然后根据排序结果依次递增参数个数,记录模型准确度。对比分析参数个数对模型准确度的影响,选取模型准确度最高的参数作为模型的指标。
首先选取总砂量、LLD、排量、DEN、砂岩长度5个指标用SVM进行无阻流量预测,得到准确度为39.39%,增加指标个数时,结果如下表所示:
表3SVM训练准确度
将上表数据绘制成如图7所示的折线图:
通过图7可以发现:随着指标个数增多,准确度会趋于平稳,最终会下降,选取准确度最高,指标个数最小的点为指标个数。根据现场经验,需要考虑地质因素,故增加渗透率。训练后发现准度提高,为51.51%。因此最终选择总砂量、LLD、排量、DEN、砂岩长度、含气饱和度、气测显示砂岩段长、GR、泵压、平均全烃、有效厚度、CNL、温度、返排液量、渗透率15个指标;
步骤S10、建立支持向量机、K近邻、随机森林三个分类器用于产能等级预测,再将步骤S9中确定的模型的指标参数分别带入支持向量机、K近邻、随机森林三个分类器中预测目标井的产能等级,将三种分类器的结果通过投票法进行融合,及取预测结果的众数作为最终的结果;如果没有众数,则找出所有与预测结果相同等级的历史井数据组成历史分析数据库;如果有多个众数,则找出与众数预测结果相同等级的历史井数据组成历史分析数据库;通过对比目标井层与历史井层最相似的结果作为最终结果。
分别根据支持向量机、K近邻、随机森林三个分类器的预测产能等级确定出相同预测产能等级的历史井层数据;
再根据下式分别计算目标井层与支持向量机、K近邻、随机森林三个分类器相同预测产能等级的历史井层的差异;
r=(r1,r2,…,rn)
X=(X1,X2,…,Xn)
L=(L1,L2,…,Ln)
式中:σ为井层间的差异;
选取差异最小对应的预测产能等级为最终结果。
以上所述,并非对本发明作任何形式上的限制,虽然本发明已通过上述实施例揭示,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,可利用上述揭示的技术内容作出些变动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
Claims (7)
1.一种基于指标分析及多模型融合的气井产能等级预测方法,其特征在于,包括以下步骤:
步骤S1、获取目标储层各历史井层的无阻流量a、各历史井层储层参数和历史井施工参数以及目标井层储层参数、目标井施工参数;
步骤S2、根据各历史井的无阻流量a确定历史井层无阻流量最大值S,并计算出各历史井层的产能等级;
当a≥0.5S时,该历史井层的产能等级为4;当0.5S>a≥0.25S时,该历史井层的产能等级为3;当0.25S>a≥0.125S时,该历史井层的产能等级为2;当a<0.125S时,该历史井层的产能等级为1;
步骤S3、根据目标井层储层参数、目标井施工参数确定出影响无阻流量的q个参数;
步骤S4、将q个参数进一步计算出Pearson相关系数矩阵,并做出相关系数矩阵热力图,得到各影响参数之间的相关系数;
步骤S5、通过比较各参数两两之间相关系数的大小,筛选出参数之间相关系数大于0.8的参数组成一组,最终得到n组共m个参数,并将剩下的q-m个数据组成一组;保留筛选出的n组中每一组与无阻流量相关系数最大的参数,其余参数全部删掉,得到n个参数,并将这n个参数放入之前q-m个数据中,共q-m+n个参数;
步骤S6、将q-m+n个参数在Pearson相关分析的基础上,对影响无阻流量的因素进行偏相关分析,得到各参数与无阻流量的偏相关系数,并根据偏相关系数绝对值的大小对各参数进行偏相关系数排序;
步骤S7、将q-m+n个参数再在Pearson相关分析的基础上,对影响无阻流量的因素进行灰色关联分析,得到各参数与无阻流量的灰色关联系数,并根据灰色关联系数对各参数进行灰色关联系数排序;
步骤S8、根据偏相关系数排序和灰色关联系数排序确定参数的最终排序结果;
步骤S9、根据参数的最终排序结果,首先选取排在前面的5个参数作为初始输入参数,将参数输入SVM模型,记录模型准确度,然后根据排序结果依次递增参数个数,记录模型准确度;对比分析参数个数对模型准确度的影响,选取模型准确度最高的参数作为模型的指标参数;
步骤S10、建立支持向量机、K近邻、随机森林三个分类器用于产能等级预测,再将步骤S9中确定的模型的指标参数分别带入支持向量机、K近邻、随机森林三个分类器中预测目标井的产能等级,将三种分类器的结果通过投票法进行融合,及取预测结果的众数作为最终的结果;如果没有众数,则找出所有与预测结果相同等级的历史井数据组成历史分析数据库;如果有多个众数,则找出与众数预测结果相同等级的历史井数据组成历史分析数据库;通过对比目标井层与历史井层最相似的结果作为最终结果。
2.根据权利要求1所述的一种基于指标分析及多模型融合的气井产能等级预测方法,其特征在于,所述储层参数包括有效厚度、渗透率、含气饱和度、温度、水平段长度、平均全烃、孔隙度;所述施工参数包括平均每段加砂量、排量、泵压、返排率、总液量、压裂段数、液氮用量。
3.根据权利要求2所述的一种基于指标分析及多模型融合的气井产能等级预测方法,其特征在于,所述步骤S3中首先定性分析影响无阻流量的参数,做出各参数与无阻流量的散点图,并画出数据趋势线,分析各参数对无阻流量的影响,选取与无阻流量有变化趋势的参数为影响无阻流量的q个参数。
5.根据权利要求1所述的一种基于指标分析及多模型融合的气井产能等级预测方法,其特征在于,所述步骤S7中各参数与无阻流量的灰色关联系数的计算过程为:
将q-m+n个参数组成一个原始序列;该原始序列中无阻流量为参考数列,除无阻流量外的其他参数构成比较数列,其数列分别表示为:
x0={x0(1),x0(2),x0(3),…,x0(n)}
xi={xi(1),xi(2),xi(3),…,xi(n)}(i=1,2,…,m)
式中:x0为参考数列;xi为比较数列;i为比较数列的序号;m为数列中数据样品的个数;n为自变量因素的个数;
通过数据归一化方法将原始数据进行无量纲化处理;
根据下式计算各参数与无阻流量的灰色关联系数;
Δoi(k)=|Yi(k)-Y0(k)|
式中:ρ为分辨系数,通常取0.5。
6.根据权利要求1所述的一种基于指标分析及多模型融合的气井产能等级预测方法,其特征在于,所述步骤S8中的具体过程为:将偏相关系数排序和灰色关联系数排序中都排在前面的参数也排在前面,将两者排序相差较大的指标以灰色关联系数排序的结果作为结论,得到各参数的最终排序结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111152813.9A CN113807021B (zh) | 2021-09-29 | 2021-09-29 | 一种基于指标分析及多模型融合的气井产能等级预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111152813.9A CN113807021B (zh) | 2021-09-29 | 2021-09-29 | 一种基于指标分析及多模型融合的气井产能等级预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113807021A true CN113807021A (zh) | 2021-12-17 |
CN113807021B CN113807021B (zh) | 2022-08-26 |
Family
ID=78897091
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111152813.9A Active CN113807021B (zh) | 2021-09-29 | 2021-09-29 | 一种基于指标分析及多模型融合的气井产能等级预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113807021B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115539026A (zh) * | 2022-09-27 | 2022-12-30 | 西南石油大学 | 一种复杂储层水平井初期产量融合预测方法 |
CN117172381A (zh) * | 2023-09-05 | 2023-12-05 | 薪海科技(上海)有限公司 | 基于大数据的风险预测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108446797A (zh) * | 2018-03-06 | 2018-08-24 | 西南石油大学 | 一种致密油藏水平井体积压裂初期产能预测方法 |
CN108960651A (zh) * | 2018-07-11 | 2018-12-07 | 西南石油大学 | 一种致密油气藏多级压裂水平井完井效率的综合评价方法 |
CN110992200A (zh) * | 2019-12-11 | 2020-04-10 | 长江大学 | 基于随机森林的页岩气井分段压裂效果评价和产量预测方法 |
CN112733340A (zh) * | 2020-12-30 | 2021-04-30 | 成都北方石油勘探开发技术有限公司 | 一种基于数据驱动储层改造候选井的选井方法及设备 |
-
2021
- 2021-09-29 CN CN202111152813.9A patent/CN113807021B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108446797A (zh) * | 2018-03-06 | 2018-08-24 | 西南石油大学 | 一种致密油藏水平井体积压裂初期产能预测方法 |
CN108960651A (zh) * | 2018-07-11 | 2018-12-07 | 西南石油大学 | 一种致密油气藏多级压裂水平井完井效率的综合评价方法 |
CN110992200A (zh) * | 2019-12-11 | 2020-04-10 | 长江大学 | 基于随机森林的页岩气井分段压裂效果评价和产量预测方法 |
CN112733340A (zh) * | 2020-12-30 | 2021-04-30 | 成都北方石油勘探开发技术有限公司 | 一种基于数据驱动储层改造候选井的选井方法及设备 |
Non-Patent Citations (2)
Title |
---|
唐凯等: "子洲气田二叠系山2气藏气井产能影响因素分析", 《物探化探计算技术》 * |
黄力等: "超低渗透储层产能主要影响因素确定方法研究", 《科学技术与工程》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115539026A (zh) * | 2022-09-27 | 2022-12-30 | 西南石油大学 | 一种复杂储层水平井初期产量融合预测方法 |
CN115539026B (zh) * | 2022-09-27 | 2023-11-14 | 西南石油大学 | 一种复杂储层水平井初期产量融合预测方法 |
CN117172381A (zh) * | 2023-09-05 | 2023-12-05 | 薪海科技(上海)有限公司 | 基于大数据的风险预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113807021B (zh) | 2022-08-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111425193B (zh) | 一种基于聚类分析测井岩石物理相划分的储层可压性评价方法 | |
CN113807021B (zh) | 一种基于指标分析及多模型融合的气井产能等级预测方法 | |
CN108897066B (zh) | 碳酸盐岩裂缝密度定量预测方法及装置 | |
CN110284873B (zh) | 一种油井储集性质的检测方法及检测装置 | |
US20190120022A1 (en) | Methods, systems and devices for modelling reservoir properties | |
CN109115987B (zh) | 一种基于岩石物理模型的流体因子的评价方法及装置 | |
CN106897544B (zh) | 对来自压裂的非常规地层的油气生产进行建模的方法 | |
EP2963235A1 (fr) | Procede d'exploitation d'un gisement petrolier a partir d'une technique de positionnement des puits a forer | |
CN116127675A (zh) | 一种页岩油水平井体积压裂最大可采储量的预测方法 | |
US9652565B2 (en) | System and method for producing display of petrophysical property height profile for both vertical and horizontal wellbores | |
CN114781951A (zh) | 一种页岩油藏二氧化碳吞吐开发选井决策方法及*** | |
CN110717270B (zh) | 一种基于数据的油气藏仿真模拟方法 | |
Uguru et al. | Permeability prediction using genetic unit averages of flow zone indicators (FZIs) and neural networks | |
Hudson et al. | Unsupervised machine learning for detecting soil layer boundaries from cone penetration test data | |
CN114114414A (zh) | 一种页岩储层“甜点”信息人工智能预测方法 | |
CN114638147A (zh) | 一种油气藏压裂工艺参数确定方法 | |
CN111781638A (zh) | 一种有效裂缝带预测方法及装置 | |
CN116562428A (zh) | 一种基于机器学习的压裂施工参数优化方法 | |
CN115012903B (zh) | 判别泥页岩层理构造发育的测井评价方法 | |
CN111335871A (zh) | 一种基于分层产能评价的查层补孔技术方法 | |
CN108661629B (zh) | 一种针对页岩地层的工程甜点定量评价方法 | |
CN111488666A (zh) | 一种气藏水平井产能预测模型建立、预测方法及装置 | |
CN115705452A (zh) | 整装砂岩油藏开发中后期的新型采收率预测方法 | |
CN108898286B (zh) | 储层裂缝发育程度的评价方法及装置 | |
Ganiev et al. | Waterflood Optimization Planning Based on MRT Analysis of Long-Term Bottom-Hole Pressure Records |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |