CN114386647A - 一种油气田行业能耗的预测方法及*** - Google Patents

一种油气田行业能耗的预测方法及*** Download PDF

Info

Publication number
CN114386647A
CN114386647A CN202011132359.6A CN202011132359A CN114386647A CN 114386647 A CN114386647 A CN 114386647A CN 202011132359 A CN202011132359 A CN 202011132359A CN 114386647 A CN114386647 A CN 114386647A
Authority
CN
China
Prior art keywords
energy consumption
yield
data
natural gas
crude oil
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011132359.6A
Other languages
English (en)
Inventor
李峻
郭以东
祁滢
王亦然
曾丽花
余洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Petrochina Co Ltd
Original Assignee
Petrochina Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Petrochina Co Ltd filed Critical Petrochina Co Ltd
Priority to CN202011132359.6A priority Critical patent/CN114386647A/zh
Publication of CN114386647A publication Critical patent/CN114386647A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P80/00Climate change mitigation technologies for sector-wide applications
    • Y02P80/10Efficient use of energy, e.g. using compressed air or pressurized fluid as energy carrier

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Operations Research (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Probability & Statistics with Applications (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Water Supply & Treatment (AREA)
  • Quality & Reliability (AREA)
  • Public Health (AREA)

Abstract

本发明公开了一种油气田行业能耗的预测方法及***,该方法包括:采集原油产量、天然气产量及能源消耗量,生成历史生产能耗数据集;采用k均值聚类算法对原油产量及天然气产量两项属性数据进行分类,得到分类结果并对每一类别进行标记;对标记的每一类别对应的数据集分别做归一化处理,记录每个类别的归一化法则,将所述原油产量和天然气产量作为输入,能源消耗量作为输出,分别建立并训练每个类别对应的神经网络能耗预测模型;获取原油计划产量和天然气计划产量,以所述分类结果为基础确定计划产量所属的类别,并根据所述的类别对应的归一化法则,进行归一化处理,将归一化后的数据输入到所属的类别对应的能耗预测模型,得到能源消耗量预测结果。

Description

一种油气田行业能耗的预测方法及***
技术领域
本发明涉及油气田生产技术领域,尤指一种油气田行业能耗的预测方法及***。
背景技术
能源是经济发展的基础,随着世界范围内社会经济的迅速发展,能源的消耗量也急剧增加,能源问题在全球变得越来越突出。同时,油气田企业在日常生产过程中,也面临着生产能耗增加,产量相对较低等问题。
为了响应石化行业节能减排的要求,技术节能和管理节能已经成为油气田企业关注的重点。能耗预测通过对历史能耗数据的分析,依托人工智能算法,最终实现对企业未来能源消耗量的预测,它可以作为一种有效的节能措施帮助企业实现节能降耗,帮助油气田企业合理安排生产,减少生产过程中的能源放散,提高油气田企业的能源管理效率。
在现有技术中,能耗预测问题仅仅被当作一个回归问题,即确定出能耗的影响因子,将它们作为特征向量,输入到选取的回归模型中,然后将此特征向量对应的能耗量作为输出,训练模型,直到模型的损失函数收敛。在此过程中,没有考虑数据集的内部空间分布特征,在整个数据集中,它们的空间分布会形成分布不同的簇,每个簇都是一个小的子集,内部有较强的关联关系。在预测的过程中,由于没有充分考虑每个簇的特征,预测结果的准确率较低,参考价值较差。
综上来看,亟需一种可以克服上述问题,能够充分考虑数据集的特征,提高预测结果准确率的技术方案。
发明内容
为克服上述问题,本发明提出了一种油气田行业能耗的预测方法及***,可以解决油气田企业生产过程中能源消耗量预测问题,帮助油气田企业合理安排生产,减少生产过程中能源放散,提高油气田企业能源管理效率。
在本发明实施例的第一方面,提出了一种油气田行业能耗的预测方法,该方法包括:
采集原油产量、天然气产量及能源消耗量,生成历史生产能耗数据集;
选取所述原油产量及天然气产量作为属性数据,采用k均值聚类算法按照属性数据对所述历史生产能耗数据集进行分类,得到分类结果并对每一类别进行标记;
对标记的每一类别对应的数据集分别做归一化处理,将天然气产量和原油产量两项属性映射到0到1之间,记录每个类别的归一化法则,将所述原油产量和天然气产量作为输入,能源消耗量作为输出,分别建立并训练每个类别对应的神经网络能耗预测模型,得到每个类别对应的能耗预测模型;
获取原油计划产量和天然气计划产量,以所述分类结果为基础确定所述原油计划产量和天然气计划产量所属的类别,并根据所述的类别对应的归一化法则,进行归一化处理,将归一化后的数据输入到所属的类别对应的能耗预测模型,得到能源消耗量预测结果。
在本发明实施例的第二方面,提出了一种油气田行业能耗的预测***,该***包括:
数据采集模块,用于采集原油产量、天然气产量及能源消耗量,生成历史生产能耗数据集;
分类模块,用于选取所述原油产量及天然气产量作为属性数据,采用k均值聚类算法按照属性数据对所述历史生产能耗数据集进行分类,得到分类结果并对每一类别进行标记;
数据处理模块,用于对标记的每一类别对应的数据集分别做归一化处理,将天然气产量和原油产量两项属性映射到0到1之间,记录每个类别的归一化法则,将所述原油产量和天然气产量作为输入,能源消耗量作为输出,分别建立并训练每个类别对应的神经网络能耗预测模型,得到每个类别对应的能耗预测模型;
预测模块,用于获取原油计划产量和天然气计划产量,以所述分类结果为基础确定所述原油计划产量和天然气计划产量所属的类别,并根据所述的类别对应的归一化法则,进行归一化处理,将归一化后的数据输入到所属的类别对应的能耗预测模型,得到能源消耗量预测结果。
在本发明实施例的第三方面,提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现油气田行业能耗的预测方法。
在本发明实施例的第四方面,提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现油气田行业能耗的预测方法。
本发明提出的油气田行业能耗的预测方法及***,通过采集原油产量、天然气产量及能源消耗量,生成历史生产能耗数据集;选取所述原油产量及天然气产量作为属性数据,采用k均值聚类算法按照属性数据对所述历史生产能耗数据集进行分类,得到分类结果并对每一类别进行标记;对标记的每一类别对应的数据集分别做归一化处理,将天然气产量和原油产量两项属性映射到0到1之间,记录每个类别的归一化法则,将所述原油产量和天然气产量作为输入,能源消耗量作为输出,分别建立并训练每个类别对应的神经网络能耗预测模型,得到每个类别对应的能耗预测模型;获取原油计划产量和天然气计划产量,以所述分类结果为基础确定所述原油计划产量和天然气计划产量所属的类别,并根据所述的类别对应的归一化法则,进行归一化处理,将归一化后的数据输入到所属的类别对应的能耗预测模型,得到能源消耗量预测结果,有效解决油气田企业生产过程中能源消耗量预测问题,减少油气田企业生产过程中能源放散,提高油气田企业能源管理效率和智能化管理水平。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明一实施例的油气田行业能耗的预测方法流程示意图。
图2是本发明一具体实施例的采集历史生产能耗数据集的流程示意图。
图3是本发明一具体实施例的数据分类的流程示意图。
图4是本发明一具体实施例的数据处理的流程示意图。
图5是本发明一具体实施例的油气田能耗预测的流程示意图。
图6是本发明一实施例的油气田行业能耗的预测***架构示意图。
图7是本发明一实施例的计算机设备结构示意图。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本领域技术人员知道,本发明的实施方式可以实现为一种***、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
根据本发明的实施方式,提出了一种油气田行业能耗的预测方法及***。
下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。
图1是本发明一实施例的油气田行业能耗的预测方法流程示意图。如图1所示,该方法包括:
步骤S101,采集原油产量、天然气产量及能源消耗量,生成历史生产能耗数据集;
步骤S102,选取所述原油产量及天然气产量作为属性数据,采用k均值聚类算法按照属性数据对所述历史生产能耗数据集进行分类,得到分类结果并对每一类别进行标记;
步骤S103,对标记的每一类别对应的数据集分别做归一化处理,将天然气产量和原油产量两项属性映射到0到1之间,记录每个类别的归一化法则,将所述原油产量和天然气产量作为输入,能源消耗量作为输出,分别建立并训练每个类别对应的神经网络能耗预测模型,得到每个类别对应的能耗预测模型;
步骤S104,获取原油计划产量和天然气计划产量,以所述分类结果为基础确定所述原油计划产量和天然气计划产量所属的类别,并根据所述的类别对应的归一化法则,进行归一化处理,将归一化后的数据输入到所属的类别对应的能耗预测模型,得到能源消耗量预测结果。
在一实施例中,步骤S101还包括:
在历史生产能耗数据集中检查是否存在缺失数据;
若存在,利用相邻数据的算术平均值对缺失数据进行填充;
填充后由人工确认合理性,若不合理进行修正,得到数据完整且合理的历史生产能耗数据集。
在步骤S101中,至少采集60条历史数据,每条历史数据对应其中一个月的原油产量、天然气产量及能源消耗量。即,至少采集连续5年内的历史生产数据和能耗数据。
在步骤S102中,采用k均值聚类算法按照属性数据对所述历史生产能耗数据集进行分类时,分类类别数为2-4;其中,可以根据实际情况调整历史数据的条数和分类类别数,以确保每个类别中包含的数据项不能少于20条。
在步骤S103中,具体过程还包括:
将历史生产能耗数据集中每月的原油产量和天然气产量作为输入,每月能源消耗量作为输出,分别建立并训练包含输入层节点为2个及输出层节点为1个的三层神经网络能耗预测模型,训练结束后,得到每个类别对应的能耗预测模型。
其中,三层神经网络能耗预测模型中间层神经元个数可以介于2到4之间,具体情况可以根据每个类别中的数据集规模来确定。
在步骤S104中,具体过程还包括:
获取原油计划产量和天然气计划产量,以所述分类结果为基础,采用KNN算法确定所述原油计划产量和天然气计划产量所属的类别。
为了对上述油气田行业能耗的预测方法进行更为清楚的解释,下面结合一个具体的实施例来对每一步进行说明,然而值得注意的是该实施例仅是为了更好地说明本发明,并不构成对本发明不当的限定。
步骤S101:
参考图2,为本发明一具体实施例的采集历史生产能耗数据集的流程示意图。如图2所示,具体过程为:
步骤S11,按照三元组数据格式D(X1,X2,Y)依照时间顺序,采集一段时间内油气田企业历史每月天然气产量、原油产量和综合能耗数据,其中,X1代表企业每月天然产量,X2代表企业每月原油产量,Y代表企业每月综合能耗量。
在采集历史数据时,需要确保采集的三元组数据量不低于60条,即至少5年内企业的每月历史生产数据和能耗数据。
步骤S12,按照时间顺序对所有的三元组数据进行排列,检查是否存在缺失值;若存在缺失值,执行步骤S13;若不存在缺失值,执行步骤S14。
步骤S13,采用相邻数据的算术平均值来代替缺失值,并且咨询业务专家确保新计算缺失值的有效性和准确性。
由于填充的缺失值是通过相邻数据的算术平均值,可能存在不合理的情况,因此可以由人工进行确认,以保证缺失值的有效性和准确性。
步骤S14,将此数据集作为历史生产能耗数据集,标记为Di(X1,X2,Y)。
步骤S102:
参考图3,为本发明一具体实施例的数据分类的流程示意图。如图3所示,具体过程为:
步骤S21,采用K均值聚类算法,对步骤S101的所述数据集Di(X1,X2,Y)按照属性(X1,X2)对其进行分类。在分类的过程中,确保类别数M介于2到4之间,并且确保每个类别中包含的数据项不能少于20条。
步骤S22,得到分类结果,将每个类别标记为Ci(i=1,2,3….)
步骤S103:
参考图4,为本发明一具体实施例的数据处理的流程示意图。如图4所示,具体过程为:
步骤S31,针对每个类别Ci中的数据集Di(X1,X2,Y),将其中的(X1,X2)属性进行归一化处理处理,对着两个属性的值分别映射到0到1之间,同时记录其归一化法则。
步骤S32,将类别Ci中,经过归一化处理的数据标记为di(x1,x2,Y);在每一个类别中,构建三层神经网络能耗预测模型,输入节点包含两个神经元,中间层包含3个神经元(具体神经元的个数,可以根据数据集规模而确定),输出层包含1个神经元。在训练过程中,将(x1,x2)属性作为网络的输入,Y作为网络的输出。训练结束以后,采用均方根误差RMSE作为网络的评价指标,将每个类别Ci(i=1,2,…,M)所对应的神经网络标记为Ni(i=1,2,…,M)
步骤S104:
参考图5,为本发明一具体实施例的油气田能耗预测的流程示意图。如图5所示,具体过程为:
步骤S41,采集企业未来某几个月份内的原油产量,天然气产量用二元组Ti(Z1,Z2)标记,属性(Z1,Z2)代表天然气产量和原油产量。
步骤S42,将二元组数据集Ti采用KNN算法,判断其所属具体的类别Ci(如步骤S102所述)。
步骤S43,按照其类别对应的归一化法则,对数据集进行归一化处理处理,将归一化后的数据集标记为ti(z1,z2);
步骤S44,将数据集的(z1,z2)属性输入到此类别Ci对应的神经网络Ni中,将网络的输出标记为R’,得到最终的能耗预测结果。
需要说明的是,尽管在上述实施例及附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
在介绍了本发明示例性实施方式的方法之后,接下来,参考图6对本发明示例性实施方式的油气田行业能耗的预测***进行介绍。
油气田行业能耗的预测***的实施可以参见上述方法的实施,重复之处不再赘述。以下所使用的术语“模块”或者“单元”,可以是实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
基于同一发明构思,本发明还提出了一种油气田行业能耗的预测***,如图6所示,该***包括:
数据采集模块610,用于采集原油产量、天然气产量及能源消耗量,生成历史生产能耗数据集;
分类模块620,用于选取所述原油产量及天然气产量作为属性数据,采用k均值聚类算法按照属性数据对所述历史生产能耗数据集进行分类,得到分类结果并对每一类别进行标记;
数据处理模块630,用于对标记的每一类别对应的数据集分别做归一化处理,将天然气产量和原油产量两项属性映射到0到1之间,记录每个类别的归一化法则,将所述原油产量和天然气产量作为输入,能源消耗量作为输出,分别建立并训练每个类别对应的神经网络能耗预测模型,得到每个类别对应的能耗预测模型;
预测模块640,用于获取原油计划产量和天然气计划产量,以所述分类结果为基础确定所述原油计划产量和天然气计划产量所属的类别,并根据所述的类别对应的归一化法则,进行归一化处理,将归一化后的数据输入到所属的类别对应的能耗预测模型,得到能源消耗量预测结果。
在一实施例中,所述数据采集模610块还用于:
在历史生产能耗数据集中检查是否存在缺失数据;
若存在,利用相邻数据的算术平均值对缺失数据进行填充;
填充后由人工确认合理性,若不合理进行修正,得到数据完整且合理的历史生产能耗数据集。
在一实施例中,所述数据采集模块610至少采集60条历史数据,每条历史数据对应其中一个月的原油产量、天然气产量及能源消耗量。
在一实施例中,所述分类模块620采用k均值聚类算法按照属性数据对所述历史生产能耗数据集进行分类时,分类类别数为2-4。
在一实施例中,所述数据处理模块630具体用于:
将历史生产能耗数据集中每月的原油产量和天然气产量作为输入,每月能源消耗量作为输出,分别建立并训练包含输入层节点为2个及输出层节点为1个的三层神经网络能耗预测模型,训练结束后,得到每个类别对应的能耗预测模型。
在一实施例中,所述预测模块640具体用于:
获取原油计划产量和天然气计划产量,以所述分类结果为基础,采用KNN算法确定所述原油计划产量和天然气计划产量所属的类别。
应当注意,尽管在上文详细描述中提及了油气田行业能耗的预测***的若干模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块的特征和功能可以在一个模块中具体化。反之,上文描述的一个模块的特征和功能可以进一步划分为由多个模块来具体化。
基于前述发明构思,如图7所示,本发明还提出了一种计算机设备700,包括存储器710、处理器720及存储在存储器710上并可在处理器720上运行的计算机程序730,所述处理器720执行所述计算机程序730时实现前述油气田行业能耗的预测方法。
基于前述发明构思,本发明提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现前述油气田行业能耗的预测方法。
本发明提出的油气田行业能耗的预测方法及***,通过采集原油产量、天然气产量及能源消耗量,生成历史生产能耗数据集;选取所述原油产量及天然气产量作为属性数据,采用k均值聚类算法按照属性数据对所述历史生产能耗数据集进行分类,得到分类结果并对每一类别进行标记;对标记的每一类别对应的数据集分别做归一化处理,将天然气产量和原油产量两项属性映射到0到1之间,记录每个类别的归一化法则,将所述原油产量和天然气产量作为输入,能源消耗量作为输出,分别建立并训练每个类别对应的神经网络能耗预测模型,得到每个类别对应的能耗预测模型;获取原油计划产量和天然气计划产量,以所述分类结果为基础确定所述原油计划产量和天然气计划产量所属的类别,并根据所述的类别对应的归一化法则,进行归一化处理,将归一化后的数据输入到所属的类别对应的能耗预测模型,得到能源消耗量预测结果,有效解决油气田企业生产过程中能源消耗量预测问题,减少油气田企业生产过程中能源放散,提高油气田企业能源管理效率和智能化管理水平。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (14)

1.一种油气田行业能耗的预测方法,其特征在于,该方法包括:
采集原油产量、天然气产量及能源消耗量,生成历史生产能耗数据集;
选取所述原油产量及天然气产量作为属性数据,采用k均值聚类算法按照属性数据对所述历史生产能耗数据集进行分类,得到分类结果并对每一类别进行标记;
对标记的每一类别对应的数据集分别做归一化处理,将天然气产量和原油产量两项属性映射到0到1之间,记录每个类别的归一化法则,将所述原油产量和天然气产量作为输入,能源消耗量作为输出,分别建立并训练每个类别对应的神经网络能耗预测模型,得到每个类别对应的能耗预测模型;
获取原油计划产量和天然气计划产量,以所述分类结果为基础确定所述原油计划产量和天然气计划产量所属的类别,并根据所述的类别对应的归一化法则,进行归一化处理,将归一化后的数据输入到所属的类别对应的能耗预测模型,得到能源消耗量预测结果。
2.根据权利要求1所述的油气田行业能耗的预测方法,其特征在于,采集原油产量、天然气产量及能源消耗量,生成历史生产能耗数据集,还包括:
在历史生产能耗数据集中检查是否存在缺失数据;
若存在,利用相邻数据的算术平均值对缺失数据进行填充;
填充后由人工确认合理性,若不合理进行修正,得到数据完整且合理的历史生产能耗数据集。
3.根据权利要求2所述的油气田行业能耗的预测方法,其特征在于,该方法还包括:
至少采集60条历史数据,每条历史数据对应其中一个月的原油产量、天然气产量及能源消耗量。
4.根据权利要求3所述的油气田行业能耗的预测方法,其特征在于,采用k均值聚类算法按照属性数据对所述历史生产能耗数据集进行分类时,分类类别数为2-4。
5.根据权利要求1所述的油气田行业能耗的预测方法,其特征在于,将所述原油产量和天然气产量作为输入,能源消耗量作为输出,分别建立并训练每个类别对应的神经网络能耗预测模型,得到每个类别对应的能耗预测模型,包括:
将历史生产能耗数据集中每月的原油产量和天然气产量作为输入,每月能源消耗量作为输出,分别建立并训练包含输入层节点为2个及输出层节点为1个的三层神经网络能耗预测模型,训练结束后,得到每个类别对应的能耗预测模型。
6.根据权利要求1所述的油气田行业能耗的预测方法,其特征在于,获取原油计划产量和天然气计划产量,以所述分类结果为基础确定所述原油计划产量和天然气计划产量所属的类别,包括:
获取原油计划产量和天然气计划产量,以所述分类结果为基础,采用KNN算法确定所述原油计划产量和天然气计划产量所属的类别。
7.一种油气田行业能耗的预测***,其特征在于,该***包括:
数据采集模块,用于采集原油产量、天然气产量及能源消耗量,生成历史生产能耗数据集;
分类模块,用于选取所述原油产量及天然气产量作为属性数据,采用k均值聚类算法按照属性数据对所述历史生产能耗数据集进行分类,得到分类结果并对每一类别进行标记;
数据处理模块,用于对标记的每一类别对应的数据集分别做归一化处理,将天然气产量和原油产量两项属性映射到0到1之间,记录每个类别的归一化法则,将所述原油产量和天然气产量作为输入,能源消耗量作为输出,分别建立并训练每个类别对应的神经网络能耗预测模型,得到每个类别对应的能耗预测模型;
预测模块,用于获取原油计划产量和天然气计划产量,以所述分类结果为基础确定所述原油计划产量和天然气计划产量所属的类别,并根据所述的类别对应的归一化法则,进行归一化处理,将归一化后的数据输入到所属的类别对应的能耗预测模型,得到能源消耗量预测结果。
8.根据权利要求7所述的油气田行业能耗的预测***,其特征在于,所述数据采集模块还用于:
在历史生产能耗数据集中检查是否存在缺失数据;
若存在,利用相邻数据的算术平均值对缺失数据进行填充;
填充后由人工确认合理性,若不合理进行修正,得到数据完整且合理的历史生产能耗数据集。
9.根据权利要求8所述的油气田行业能耗的预测***,其特征在于,所述数据采集模块还用于:
至少采集60条历史数据,每条历史数据对应其中一个月的原油产量、天然气产量及能源消耗量。
10.根据权利要求9所述的油气田行业能耗的预测***,其特征在于,所述分类模块采用k均值聚类算法按照属性数据对所述历史生产能耗数据集进行分类时,分类类别数为2-4。
11.根据权利要求7所述的油气田行业能耗的预测***,其特征在于,所述数据处理模块具体用于:
将历史生产能耗数据集中每月的原油产量和天然气产量作为输入,每月能源消耗量作为输出,分别建立并训练包含输入层节点为2个及输出层节点为1个的三层神经网络能耗预测模型,训练结束后,得到每个类别对应的能耗预测模型。
12.根据权利要求7所述的油气田行业能耗的预测***,其特征在于,所述预测模块具体用于:
获取原油计划产量和天然气计划产量,以所述分类结果为基础,采用KNN算法确定所述原油计划产量和天然气计划产量所属的类别。
13.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6任一所述方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至6任一所述方法。
CN202011132359.6A 2020-10-21 2020-10-21 一种油气田行业能耗的预测方法及*** Pending CN114386647A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011132359.6A CN114386647A (zh) 2020-10-21 2020-10-21 一种油气田行业能耗的预测方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011132359.6A CN114386647A (zh) 2020-10-21 2020-10-21 一种油气田行业能耗的预测方法及***

Publications (1)

Publication Number Publication Date
CN114386647A true CN114386647A (zh) 2022-04-22

Family

ID=81193937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011132359.6A Pending CN114386647A (zh) 2020-10-21 2020-10-21 一种油气田行业能耗的预测方法及***

Country Status (1)

Country Link
CN (1) CN114386647A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116523181A (zh) * 2023-05-22 2023-08-01 中国标准化研究院 一种基于大数据的智慧绿色能源监测分析方法及***

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116523181A (zh) * 2023-05-22 2023-08-01 中国标准化研究院 一种基于大数据的智慧绿色能源监测分析方法及***
CN116523181B (zh) * 2023-05-22 2024-01-26 中国标准化研究院 一种基于大数据的智慧绿色能源监测分析方法及***

Similar Documents

Publication Publication Date Title
CN104798043B (zh) 一种数据处理方法和计算机***
CN101782743A (zh) 神经网络建模方法及***
CN115841250A (zh) 一种基于集成学习的电费拖欠风险预警方法及***
CN114139490B (zh) 一种自动数据预处理的方法、装置以及设备
CN115564071A (zh) 一种电力物联网设备数据标签生成方法及***
CN114970926A (zh) 一种模型训练方法、企业经营风险预测方法和装置
CN113449919A (zh) 一种基于特征和趋势感知的用电量预测方法及***
CN114548494B (zh) 一种可视化造价数据预测智能分析***
CN115330435A (zh) 一种碳排放权价格指标体系建立方法、装置、设备及介质
CN113127537B (zh) 融合时序预测模型和机器学习模型的备件需求预测方法
CN114386647A (zh) 一种油气田行业能耗的预测方法及***
CN117575328A (zh) 一种基于图注意力神经网络的产业链风险评估方法及装置
CN117291575A (zh) 设备检修方法、装置、计算机设备和存储介质
CN111738870A (zh) 基于特征工程的工程履约保证保险风险识别方法与平台
CN115238583B (zh) 一种支持增量日志的业务流程剩余时间预测方法与***
CN111160715A (zh) 基于bp神经网络新旧动能转换绩效评价方法和装置
Tyagi et al. An extension of interpretive structural modeling using linguistic term sets for business decision-making
WO2022227213A1 (zh) 行业推荐方法、装置、计算机设备及存储介质
CN115829144B (zh) 电网业务优化模型的建立方法及电子设备
CN117934209B (zh) 一种基于知识图谱的区域电力***碳排放大数据分析方法
CN117539520B (zh) 固件自适应升级方法、***以及设备
Yang et al. Research of Data-driven Iterative Optimization Scheme for Machine Learning Models
CN116128332A (zh) 一种基于知识图谱的电网综合评价指标处理方法及***
Li et al. Case-based reasoning approach for decision-making in building retrofit: A review
Wang Accounting Resource Sharing Management Risk Assessment Model of Artificial Intelligence Algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination