CN114386647A

CN114386647A - 一种油气田行业能耗的预测方法及***

Info

Publication number: CN114386647A
Application number: CN202011132359.6A
Authority: CN
Inventors: 李峻; 郭以东; 祁滢; 王亦然; 曾丽花; 余洋
Original assignee: Petrochina Co Ltd
Current assignee: Petrochina Co Ltd
Priority date: 2020-10-21
Filing date: 2020-10-21
Publication date: 2022-04-22

Abstract

本发明公开了一种油气田行业能耗的预测方法及***，该方法包括：采集原油产量、天然气产量及能源消耗量，生成历史生产能耗数据集；采用k均值聚类算法对原油产量及天然气产量两项属性数据进行分类，得到分类结果并对每一类别进行标记；对标记的每一类别对应的数据集分别做归一化处理，记录每个类别的归一化法则，将所述原油产量和天然气产量作为输入，能源消耗量作为输出，分别建立并训练每个类别对应的神经网络能耗预测模型；获取原油计划产量和天然气计划产量，以所述分类结果为基础确定计划产量所属的类别，并根据所述的类别对应的归一化法则，进行归一化处理，将归一化后的数据输入到所属的类别对应的能耗预测模型，得到能源消耗量预测结果。

Description

一种油气田行业能耗的预测方法及***

技术领域

本发明涉及油气田生产技术领域，尤指一种油气田行业能耗的预测方法及***。

背景技术

能源是经济发展的基础，随着世界范围内社会经济的迅速发展，能源的消耗量也急剧增加，能源问题在全球变得越来越突出。同时，油气田企业在日常生产过程中，也面临着生产能耗增加，产量相对较低等问题。

为了响应石化行业节能减排的要求，技术节能和管理节能已经成为油气田企业关注的重点。能耗预测通过对历史能耗数据的分析，依托人工智能算法，最终实现对企业未来能源消耗量的预测，它可以作为一种有效的节能措施帮助企业实现节能降耗，帮助油气田企业合理安排生产，减少生产过程中的能源放散，提高油气田企业的能源管理效率。

在现有技术中，能耗预测问题仅仅被当作一个回归问题，即确定出能耗的影响因子，将它们作为特征向量，输入到选取的回归模型中，然后将此特征向量对应的能耗量作为输出，训练模型，直到模型的损失函数收敛。在此过程中，没有考虑数据集的内部空间分布特征，在整个数据集中，它们的空间分布会形成分布不同的簇，每个簇都是一个小的子集，内部有较强的关联关系。在预测的过程中，由于没有充分考虑每个簇的特征，预测结果的准确率较低，参考价值较差。

综上来看，亟需一种可以克服上述问题，能够充分考虑数据集的特征，提高预测结果准确率的技术方案。

发明内容

为克服上述问题，本发明提出了一种油气田行业能耗的预测方法及***，可以解决油气田企业生产过程中能源消耗量预测问题，帮助油气田企业合理安排生产，减少生产过程中能源放散，提高油气田企业能源管理效率。

在本发明实施例的第一方面，提出了一种油气田行业能耗的预测方法，该方法包括：

采集原油产量、天然气产量及能源消耗量，生成历史生产能耗数据集；

选取所述原油产量及天然气产量作为属性数据，采用k均值聚类算法按照属性数据对所述历史生产能耗数据集进行分类，得到分类结果并对每一类别进行标记；

对标记的每一类别对应的数据集分别做归一化处理，将天然气产量和原油产量两项属性映射到0到1之间，记录每个类别的归一化法则，将所述原油产量和天然气产量作为输入，能源消耗量作为输出，分别建立并训练每个类别对应的神经网络能耗预测模型，得到每个类别对应的能耗预测模型；

获取原油计划产量和天然气计划产量，以所述分类结果为基础确定所述原油计划产量和天然气计划产量所属的类别，并根据所述的类别对应的归一化法则，进行归一化处理，将归一化后的数据输入到所属的类别对应的能耗预测模型，得到能源消耗量预测结果。

在本发明实施例的第二方面，提出了一种油气田行业能耗的预测***，该***包括：

数据采集模块，用于采集原油产量、天然气产量及能源消耗量，生成历史生产能耗数据集；

分类模块，用于选取所述原油产量及天然气产量作为属性数据，采用k均值聚类算法按照属性数据对所述历史生产能耗数据集进行分类，得到分类结果并对每一类别进行标记；

数据处理模块，用于对标记的每一类别对应的数据集分别做归一化处理，将天然气产量和原油产量两项属性映射到0到1之间，记录每个类别的归一化法则，将所述原油产量和天然气产量作为输入，能源消耗量作为输出，分别建立并训练每个类别对应的神经网络能耗预测模型，得到每个类别对应的能耗预测模型；

预测模块，用于获取原油计划产量和天然气计划产量，以所述分类结果为基础确定所述原油计划产量和天然气计划产量所属的类别，并根据所述的类别对应的归一化法则，进行归一化处理，将归一化后的数据输入到所属的类别对应的能耗预测模型，得到能源消耗量预测结果。

在本发明实施例的第三方面，提出了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现油气田行业能耗的预测方法。

在本发明实施例的第四方面，提出了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现油气田行业能耗的预测方法。

本发明提出的油气田行业能耗的预测方法及***，通过采集原油产量、天然气产量及能源消耗量，生成历史生产能耗数据集；选取所述原油产量及天然气产量作为属性数据，采用k均值聚类算法按照属性数据对所述历史生产能耗数据集进行分类，得到分类结果并对每一类别进行标记；对标记的每一类别对应的数据集分别做归一化处理，将天然气产量和原油产量两项属性映射到0到1之间，记录每个类别的归一化法则，将所述原油产量和天然气产量作为输入，能源消耗量作为输出，分别建立并训练每个类别对应的神经网络能耗预测模型，得到每个类别对应的能耗预测模型；获取原油计划产量和天然气计划产量，以所述分类结果为基础确定所述原油计划产量和天然气计划产量所属的类别，并根据所述的类别对应的归一化法则，进行归一化处理，将归一化后的数据输入到所属的类别对应的能耗预测模型，得到能源消耗量预测结果，有效解决油气田企业生产过程中能源消耗量预测问题，减少油气田企业生产过程中能源放散，提高油气田企业能源管理效率和智能化管理水平。

附图说明

为了更清楚地说明本申请实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1是本发明一实施例的油气田行业能耗的预测方法流程示意图。

图2是本发明一具体实施例的采集历史生产能耗数据集的流程示意图。

图3是本发明一具体实施例的数据分类的流程示意图。

图4是本发明一具体实施例的数据处理的流程示意图。

图5是本发明一具体实施例的油气田能耗预测的流程示意图。

图6是本发明一实施例的油气田行业能耗的预测***架构示意图。

图7是本发明一实施例的计算机设备结构示意图。

具体实施方式

下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解，给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明，而并非以任何方式限制本发明的范围。相反，提供这些实施方式是为了使本公开更加透彻和完整，并且能够将本公开的范围完整地传达给本领域的技术人员。

本领域技术人员知道，本发明的实施方式可以实现为一种***、装置、设备、方法或计算机程序产品。因此，本公开可以具体实现为以下形式，即：完全的硬件、完全的软件(包括固件、驻留软件、微代码等)，或者硬件和软件结合的形式。

根据本发明的实施方式，提出了一种油气田行业能耗的预测方法及***。

下面参考本发明的若干代表性实施方式，详细阐释本发明的原理和精神。

图1是本发明一实施例的油气田行业能耗的预测方法流程示意图。如图1所示，该方法包括：

步骤S101，采集原油产量、天然气产量及能源消耗量，生成历史生产能耗数据集；

步骤S102，选取所述原油产量及天然气产量作为属性数据，采用k均值聚类算法按照属性数据对所述历史生产能耗数据集进行分类，得到分类结果并对每一类别进行标记；

步骤S103，对标记的每一类别对应的数据集分别做归一化处理，将天然气产量和原油产量两项属性映射到0到1之间，记录每个类别的归一化法则，将所述原油产量和天然气产量作为输入，能源消耗量作为输出，分别建立并训练每个类别对应的神经网络能耗预测模型，得到每个类别对应的能耗预测模型；

步骤S104，获取原油计划产量和天然气计划产量，以所述分类结果为基础确定所述原油计划产量和天然气计划产量所属的类别，并根据所述的类别对应的归一化法则，进行归一化处理，将归一化后的数据输入到所属的类别对应的能耗预测模型，得到能源消耗量预测结果。

在一实施例中，步骤S101还包括：

在历史生产能耗数据集中检查是否存在缺失数据；

若存在，利用相邻数据的算术平均值对缺失数据进行填充；

填充后由人工确认合理性，若不合理进行修正，得到数据完整且合理的历史生产能耗数据集。

在步骤S101中，至少采集60条历史数据，每条历史数据对应其中一个月的原油产量、天然气产量及能源消耗量。即，至少采集连续5年内的历史生产数据和能耗数据。

在步骤S102中，采用k均值聚类算法按照属性数据对所述历史生产能耗数据集进行分类时，分类类别数为2-4；其中，可以根据实际情况调整历史数据的条数和分类类别数，以确保每个类别中包含的数据项不能少于20条。

在步骤S103中，具体过程还包括：

将历史生产能耗数据集中每月的原油产量和天然气产量作为输入，每月能源消耗量作为输出，分别建立并训练包含输入层节点为2个及输出层节点为1个的三层神经网络能耗预测模型，训练结束后，得到每个类别对应的能耗预测模型。

其中，三层神经网络能耗预测模型中间层神经元个数可以介于2到4之间，具体情况可以根据每个类别中的数据集规模来确定。

在步骤S104中，具体过程还包括：

获取原油计划产量和天然气计划产量，以所述分类结果为基础，采用KNN算法确定所述原油计划产量和天然气计划产量所属的类别。

为了对上述油气田行业能耗的预测方法进行更为清楚的解释，下面结合一个具体的实施例来对每一步进行说明，然而值得注意的是该实施例仅是为了更好地说明本发明，并不构成对本发明不当的限定。

步骤S101：

参考图2，为本发明一具体实施例的采集历史生产能耗数据集的流程示意图。如图2所示，具体过程为：

步骤S11，按照三元组数据格式D(X₁,X₂,Y)依照时间顺序，采集一段时间内油气田企业历史每月天然气产量、原油产量和综合能耗数据，其中，X₁代表企业每月天然产量，X₂代表企业每月原油产量，Y代表企业每月综合能耗量。

在采集历史数据时，需要确保采集的三元组数据量不低于60条，即至少5年内企业的每月历史生产数据和能耗数据。

步骤S12，按照时间顺序对所有的三元组数据进行排列，检查是否存在缺失值；若存在缺失值，执行步骤S13；若不存在缺失值，执行步骤S14。

步骤S13，采用相邻数据的算术平均值来代替缺失值，并且咨询业务专家确保新计算缺失值的有效性和准确性。

由于填充的缺失值是通过相邻数据的算术平均值，可能存在不合理的情况，因此可以由人工进行确认，以保证缺失值的有效性和准确性。

步骤S14，将此数据集作为历史生产能耗数据集，标记为D_i(X₁,X₂,Y)。

步骤S102：

参考图3，为本发明一具体实施例的数据分类的流程示意图。如图3所示，具体过程为：

步骤S21，采用K均值聚类算法，对步骤S101的所述数据集D_i(X₁,X₂,Y)按照属性(X₁,X₂)对其进行分类。在分类的过程中，确保类别数M介于2到4之间，并且确保每个类别中包含的数据项不能少于20条。

步骤S22，得到分类结果，将每个类别标记为C_{i(i＝1,2,3….)}。

步骤S103：

参考图4，为本发明一具体实施例的数据处理的流程示意图。如图4所示，具体过程为：

步骤S31，针对每个类别C_i中的数据集D_i(X₁,X₂,Y)，将其中的(X₁,X₂)属性进行归一化处理处理，对着两个属性的值分别映射到0到1之间，同时记录其归一化法则。

步骤S32，将类别C_i中，经过归一化处理的数据标记为d_i(x₁,x₂,Y)；在每一个类别中，构建三层神经网络能耗预测模型，输入节点包含两个神经元，中间层包含3个神经元(具体神经元的个数，可以根据数据集规模而确定)，输出层包含1个神经元。在训练过程中，将(x₁,x₂)属性作为网络的输入，Y作为网络的输出。训练结束以后，采用均方根误差RMSE作为网络的评价指标，将每个类别C_{i(i＝1，2，…,M)}所对应的神经网络标记为N_{i(i＝1，2，…,M)}。

步骤S104：

参考图5，为本发明一具体实施例的油气田能耗预测的流程示意图。如图5所示，具体过程为：

步骤S41，采集企业未来某几个月份内的原油产量，天然气产量用二元组T_i(Z₁,Z₂)标记，属性(Z₁,Z₂)代表天然气产量和原油产量。

步骤S42，将二元组数据集T_i采用KNN算法，判断其所属具体的类别C_i(如步骤S102所述)。

步骤S43，按照其类别对应的归一化法则，对数据集进行归一化处理处理，将归一化后的数据集标记为t_i(z₁,z₂)；

步骤S44，将数据集的(z₁,z₂)属性输入到此类别C_i对应的神经网络N_i中，将网络的输出标记为R’，得到最终的能耗预测结果。

需要说明的是，尽管在上述实施例及附图中以特定顺序描述了本发明方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

在介绍了本发明示例性实施方式的方法之后，接下来，参考图6对本发明示例性实施方式的油气田行业能耗的预测***进行介绍。

油气田行业能耗的预测***的实施可以参见上述方法的实施，重复之处不再赘述。以下所使用的术语“模块”或者“单元”，可以是实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

基于同一发明构思，本发明还提出了一种油气田行业能耗的预测***，如图6所示，该***包括：

数据采集模块610，用于采集原油产量、天然气产量及能源消耗量，生成历史生产能耗数据集；

分类模块620，用于选取所述原油产量及天然气产量作为属性数据，采用k均值聚类算法按照属性数据对所述历史生产能耗数据集进行分类，得到分类结果并对每一类别进行标记；

数据处理模块630，用于对标记的每一类别对应的数据集分别做归一化处理，将天然气产量和原油产量两项属性映射到0到1之间，记录每个类别的归一化法则，将所述原油产量和天然气产量作为输入，能源消耗量作为输出，分别建立并训练每个类别对应的神经网络能耗预测模型，得到每个类别对应的能耗预测模型；

预测模块640，用于获取原油计划产量和天然气计划产量，以所述分类结果为基础确定所述原油计划产量和天然气计划产量所属的类别，并根据所述的类别对应的归一化法则，进行归一化处理，将归一化后的数据输入到所属的类别对应的能耗预测模型，得到能源消耗量预测结果。

在一实施例中，所述数据采集模610块还用于：

在历史生产能耗数据集中检查是否存在缺失数据；

若存在，利用相邻数据的算术平均值对缺失数据进行填充；

在一实施例中，所述数据采集模块610至少采集60条历史数据，每条历史数据对应其中一个月的原油产量、天然气产量及能源消耗量。

在一实施例中，所述分类模块620采用k均值聚类算法按照属性数据对所述历史生产能耗数据集进行分类时，分类类别数为2-4。

在一实施例中，所述数据处理模块630具体用于：

在一实施例中，所述预测模块640具体用于：

应当注意，尽管在上文详细描述中提及了油气田行业能耗的预测***的若干模块，但是这种划分仅仅是示例性的并非强制性的。实际上，根据本发明的实施方式，上文描述的两个或更多模块的特征和功能可以在一个模块中具体化。反之，上文描述的一个模块的特征和功能可以进一步划分为由多个模块来具体化。

基于前述发明构思，如图7所示，本发明还提出了一种计算机设备700，包括存储器710、处理器720及存储在存储器710上并可在处理器720上运行的计算机程序730，所述处理器720执行所述计算机程序730时实现前述油气田行业能耗的预测方法。

基于前述发明构思，本发明提出了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现前述油气田行业能耗的预测方法。

本领域内的技术人员应明白，本发明的实施例可提供为方法、***、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

最后应说明的是：以上所述实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种油气田行业能耗的预测方法，其特征在于，该方法包括：

2.根据权利要求1所述的油气田行业能耗的预测方法，其特征在于，采集原油产量、天然气产量及能源消耗量，生成历史生产能耗数据集，还包括：

在历史生产能耗数据集中检查是否存在缺失数据；

若存在，利用相邻数据的算术平均值对缺失数据进行填充；

3.根据权利要求2所述的油气田行业能耗的预测方法，其特征在于，该方法还包括：

至少采集60条历史数据，每条历史数据对应其中一个月的原油产量、天然气产量及能源消耗量。

4.根据权利要求3所述的油气田行业能耗的预测方法，其特征在于，采用k均值聚类算法按照属性数据对所述历史生产能耗数据集进行分类时，分类类别数为2-4。

5.根据权利要求1所述的油气田行业能耗的预测方法，其特征在于，将所述原油产量和天然气产量作为输入，能源消耗量作为输出，分别建立并训练每个类别对应的神经网络能耗预测模型，得到每个类别对应的能耗预测模型，包括：

6.根据权利要求1所述的油气田行业能耗的预测方法，其特征在于，获取原油计划产量和天然气计划产量，以所述分类结果为基础确定所述原油计划产量和天然气计划产量所属的类别，包括：

7.一种油气田行业能耗的预测***，其特征在于，该***包括：

8.根据权利要求7所述的油气田行业能耗的预测***，其特征在于，所述数据采集模块还用于：

在历史生产能耗数据集中检查是否存在缺失数据；

若存在，利用相邻数据的算术平均值对缺失数据进行填充；

9.根据权利要求8所述的油气田行业能耗的预测***，其特征在于，所述数据采集模块还用于：

10.根据权利要求9所述的油气田行业能耗的预测***，其特征在于，所述分类模块采用k均值聚类算法按照属性数据对所述历史生产能耗数据集进行分类时，分类类别数为2-4。

11.根据权利要求7所述的油气田行业能耗的预测***，其特征在于，所述数据处理模块具体用于：

12.根据权利要求7所述的油气田行业能耗的预测***，其特征在于，所述预测模块具体用于：

13.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至6任一所述方法。

14.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1至6任一所述方法。