CN115526420A

CN115526420A - 一种基于外部影响因素关联性的电力负荷预测方法及***

Info

Publication number: CN115526420A
Application number: CN202211281471.5A
Authority: CN
Inventors: 朱耿; 王波; 马旭; 陈东海; 虞殷树; 贺旭; 吉晏平; 周宏辉; 周飞; ***; 王晴; 黄亮; 朱晓杰; 葛起予; 施超; 李琪; 葛凯梁; 严浩军; 罗玉鹤; 白文博
Original assignee: State Grid Zhejiang Yuyao Power Supply Co ltd; Ningbo Electric Power Design Institute Co ltd; Ningbo Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Current assignee: State Grid Zhejiang Yuyao Power Supply Co ltd; Ningbo Electric Power Design Institute Co ltd; Ningbo Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Priority date: 2022-10-19
Filing date: 2022-10-19
Publication date: 2022-12-27

Abstract

本申请实施例公开了一种基于外部影响因素关联性的电力负荷预测方法，包括：获取原始数据，基于平均轮廓系数优化的k‑means聚类模型和标准互信息相结合的关联性分析方法，对原始数据所包含的历史电力负荷数据和外部影响因素数据之间的非线性关联性进行量化分析，得到关联性分析结果；将所述关联性分析结果、采用卷积神经网络提取到的历史电力负荷数据特征向量和外部影响因素数据特征向量，输入预先训练完成的行业电力负荷预测模型，获得当前时刻的行业电力负荷预测值。本申请对历史电力负荷数据和外部影响因素数据之间的非线性关联性进行准确的量化分析，将关联性分析结果应用于电力负荷预测，有效地提高了行业内短期的电力负荷预测的精度和稳定性。

Description

一种基于外部影响因素关联性的电力负荷预测方法及***

技术领域

本申请涉及电力负荷预测领域，尤其涉及一种基于外部影响因素关联性的电力负荷预测方法及***。

背景技术

对行业进行短期的电力负荷预测是调度计划安排的重要依据，对于电力***的安全经济运行具有重要意义。针对行业内短期的电力负荷预测已有不少研究，例如：通过集合经验模态分解将电力负荷分解为低频和高频分量，再分别使用线性回归和神经网络方法对低频和高频分量进行预测；采用长短期记忆(Long Short Term Memory，LSTM)网络和极端梯度增强(Extreme Gradient Boosting，XGBoost)模型分别进行负荷预测后，使用误差倒数法对两者的预测结果进行组合，得到最终预测结果；对用户负荷数据进行聚类处理，得到不同负荷特性的用户群，并针对不同用户群进行负荷预测模型构建，最终将各个用户群的预测负荷整合为全局预测结果；采用卷积神经网络和循环神经网络对历史负荷序列的规律进行特征学习和提取，并引入注意力机制提升短期负荷预测的精度。

但上述研究仅利用历史电力负荷数据进行行业内短期的电力负荷预测，而电力负荷不仅与历史电力负荷数据有内在的相关性，也受到气象、日类型等外部影响因素的显著影响，需要对外部影响因素加以考虑，以提升负荷预测的准确性。随着各个行业的历史电力负荷数据、气象数据等多元数据的积累，利用大数据、机器学习技术对各行业的负荷特性和外部影响因素进行分析，有助于更精细化地对不同性质的负荷进行预测，进一步提升短期电力负荷预测的准确性。为此，有相关研究在进行短期负荷预测时考虑了外部影响因素数据与历史电力负荷数据的关联性，例如：采用Pearson相关系数分析电力负荷与外部影响因素的相关性，为负荷相似日的选择提供依据，但Pearson相关系数只适用于线性相关性的分析，无法捕捉到电力负荷与外部影响因素的非线性相关性；采用Copula函数衡量电力负荷与外部影响因素之间的非线性相关性，但是Copula函数的具体形式需要人为确定，关联分析的准确性容易受到主观因素的影响；采用机器学习方法对电力负荷与外部影响因素之间的非线性关联性进行自动提取，但机器学习方法的可解释性较差，且在没有足够大的数据量时容易受到变量随机波动的影响而陷入过拟合。

现有技术中无法准确分析历史电力负荷数据与外部影响因素数据的关联性，因此无法准确预测行业内短期的电力负荷。

发明内容

有鉴于此，本申请提供了一种基于外部影响因素关联性的电力负荷预测方法及***，用以解决现有技术中无法准确分析历史电力负荷数据与外部影响因素数据的关联性，导致无法准确预测行业内短期的电力负荷的问题。具体方案如下：

第一方面，本申请提供一种基于外部影响因素关联性的电力负荷预测方法，包括：

获取原始数据，所述原始数据包括历史时间段内的历史电力负荷数据和影响电力负荷预测的外部影响因素数据；

基于优化的k-means聚类模型和标准互信息相结合的关联性分析方法，对所述历史电力负荷数据和所述外部影响因素数据之间的非线性关联性进行量化分析，得到关联性分析结果；所述优化的k-means聚类模型为采用平均轮廓系数对初始k值进行优化的k-means聚类模型；

采用卷积神经网络对所述历史电力负荷数据和所述外部影响因素数据进行特征提取，得到历史电力负荷数据特征向量和外部影响因素数据特征向量；

将所述历史电力负荷数据特征向量、所述外部影响因素数据特征向量以及所述关联性分析结果输入预先训练完成的行业电力负荷预测模型，获得当前时刻的行业电力负荷预测值。

在一种可能实现的方式中，所述基于优化的k-means聚类模型和标准互信息相结合的关联性分析方法，对所述历史电力负荷数据和所述外部影响因素数据之间的非线性关联性进行量化分析，得到关联性分析结果，包括：

基于优化的k-means聚类模型对所述历史电力负荷数据和所述外部影响因素数据分别进行聚类处理，得到所述历史电力负荷数据的多个聚类簇分别对应的聚类中心值和所述外部影响因素数据的多个聚类簇分别对应的聚类中心值；

以所述历史电力负荷数据的多个聚类簇分别对应的聚类中心值替换所述历史电力负荷数据的多个聚类簇的采样值，获得替换后的历史电力负荷数据；

以所述外部影响因素数据的多个聚类簇分别对应的聚类中心值替换所述外部影响因素数据的多个聚类簇的采样值，获得替换后的外部影响因素数据；

利用所述替换后的历史电力负荷数据和替换后的外部影响因素数据进行标准互信息的计算，得到关联性分析结果，所述关联性分析结果包括通过标准互信息计算得到的标准互信息值。

在一种可能实现的方式中，所述基于优化的k-means聚类模型对所述历史电力负荷数据和所述外部影响因素数据分别进行聚类处理，得到所述历史电力负荷数据的多个聚类簇分别对应的聚类中心值和所述外部影响因素数据的多个聚类簇分别对应的聚类中心值，包括：

输入所述历史电力负荷数据和所述外部影响因素数据在所述历史时间段内的采样值；

对所述采样值进行一维聚类，生成k-means聚类模型的当前k值对应的k个簇；

计算所述采样值的轮廓系数；

根据所述轮廓系数计算所述当前k值对应的平均轮廓系数；

令当前k值自加1，得到更新后的k值；

若所述更新后的k值大于上限k_max，则取所有平均轮廓系数中的最大值所对应的k值作为最佳的聚类簇数k₀，以聚类簇数为k₀时的聚类结果为最终的聚类结果，得到所述历史电力负荷数据的多个聚类簇分别对应的聚类中心值和所述外部影响因素数据的多个聚类簇分别对应的聚类中心值；

若所述更新后的k值不大于所述上限k_max，则返回重新执行所述对所述采样值进行一维聚类的步骤。

在一种可能实现的方式中，所述采用卷积神经网络对所述历史电力负荷数据和所述外部影响因素数据进行特征提取，得到历史电力负荷数据特征向量和外部影响因素数据特征向量，包括：

对所述历史电力负荷数据进行归一化处理，得到归一化处理后的历史电力负荷数据；

从所述归一化处理后的历史电力负荷数据中获取所述卷积神经网络的t1维的输入向量，所述t1维的输入向量为当前时刻的前t1个时刻对应的归一化处理后的历史电力负荷数据；

采用多个卷积窗口对所述t1维输入向量进行卷积运算和最大值池化，得到多个特征值；

将所述多个特征值进行拼接，得到所述历史电力负荷数据特征向量。

在一种可能实现的方式中，所述采用卷积神经网络对所述历史电力负荷数据和所述外部影响因素数据进行特征提取，得到历史电力负荷数据特征向量和外部影响因素数据特征向量，还包括：

对所述外部影响因素数据进行归一化处理，得到归一化处理后的外部影响因素数据；

从所述归一化处理后的外部影响因素数据中获取所述卷积神经网络的t2维的输入向量，所述t2维的输入向量为当前时刻的前t2个时刻对应的归一化处理后的外部影响因素数据；

将所述当前时刻的后t3个时刻的外部影响因素数据作为所述卷积神经网络的t3维的输入向量；

将所述t2维的输入向量与所述t3维的输入向量组合为(t2+t3)维的输入向量；

采用多个卷积窗口对所述(t2+t3)维的输入向量进行卷积运算，生成所述外部影响因素数据特征向量。

在一种可能实现的方式中，所述预先训练完成的行业电力负荷预测模型包括支持向量回归模型，所述将所述历史电力负荷数据特征向量、所述外部影响因素特征向量及所述关联性分析结果输入预先训练完成的行业电力负荷预测模型，获得当前时刻的行业电力负荷预测值，包括：

对所述标准互信息值进行归一化处理，得到归一化标准互信息值；

以所述归一化标准互信息值作为所述外部影响因素数据特征向量的权重，对所述外部影响因素数据特征向量进行加权求和，得到融合向量；

将所述历史电力负荷数据特征向量与所述融合向量进行拼接，得到拼接向量；

使用所述支持向量回归模型对所述拼接向量进行预测，获得当前时刻的行业电力负荷预测值。

第二方面，本申请提供一种基于外部影响因素关联性的电力负荷预测***，包括：

获取模块，用于获取原始数据，所述原始数据包括历史时间段内的历史电力负荷数据和影响电力负荷预测的外部影响因素数据；

量化分析模块，用于基于优化的k-means聚类模型和标准互信息相结合的关联性分析方法，对所述历史电力负荷数据和所述外部影响因素数据之间的非线性关联性进行量化分析，得到关联性分析结果；所述优化的k-means聚类模型为采用平均轮廓系数对初始k值进行优化的k-means聚类模型；

特征提取模块，用于采用卷积神经网络对所述历史电力负荷数据和所述外部影响因素数据进行特征提取，得到历史电力负荷数据特征向量和外部影响因素数据特征向量；

预测模块，用于将所述历史电力负荷数据特征向量、所述外部影响因素数据特征向量以及所述关联性分析结果输入预先训练完成的行业电力负荷预测模型，获得当前时刻的行业电力负荷预测值。

在一种可能实现的方式中，所述量化分析模块包括：

聚类子模块，用于基于优化的k-means聚类模型对所述历史电力负荷数据和所述外部影响因素数据分别进行聚类处理，得到所述历史电力负荷数据的多个聚类簇分别对应的聚类中心值和所述外部影响因素数据的多个聚类簇分别对应的聚类中心值；

第一替换子模块，用于以所述历史电力负荷数据的多个聚类簇分别对应的聚类中心值替换所述历史电力负荷数据的多个聚类簇的采样值，获得替换后的历史电力负荷数据；

第二替换子模块，用于以所述外部影响因素数据的多个聚类簇分别对应的聚类中心值替换所述外部影响因素数据的多个聚类簇的采样值，获得替换后的外部影响因素数据；

计算子模块，用于利用所述替换后的历史电力负荷数据和替换后的外部影响因素数据进行标准互信息的计算，得到关联性分析结果，所述关联性分析结果包括通过标准互信息计算得到的标准互信息值。

在一种可能实现的方式中，所述聚类子模块包括：

输入单元，用于输入所述历史电力负荷数据和所述外部影响因素数据在所述历史时间段内的采样值；

聚类单元，用于对所述采样值进行一维聚类，生成k-means聚类模型的当前k值对应的k个簇；

第一计算单元，用于计算所述采样值的轮廓系数；

第二计算单元，用于根据所述轮廓系数计算所述当前k值对应的平均轮廓系数；

自加单元，用于令k值自加1，得到更新后的k值；

第一判断单元，用于若所述更新后的k值大于上限k_max，则取所有平均轮廓系数中的最大值所对应的k值作为最佳的聚类簇数k₀，以聚类簇数为k₀时的聚类结果为最终的聚类结果，得到所述历史电力负荷数据的多个聚类簇分别对应的聚类中心值和所述外部影响因素数据的多个聚类簇分别对应的聚类中心值；

第二判断单元，用于若所述更新后的k值不大于所述上限k_max，则返回重新执行所述对所述采样值进行一维聚类的步骤。

在一种可能实现的方式中，所述预先训练完成的行业电力负荷预测模型包括支持向量回归模型，所述预测模块包括：

标准互信息值归一化子模块，用于对所述标准互信息值进行归一化处理，得到归一化标准互信息值；

加权求和子模块，用于以所述归一化标准互信息值作为所述外部影响因素数据特征向量的权重，对所述外部影响因素数据特征向量进行加权求和，得到融合向量；

特征向量拼接子模块，用于将所述历史电力负荷数据特征向量与所述融合向量进行拼接，得到拼接向量；

电力负荷预测子模块，用于使用所述支持向量回归模型对所述拼接向量进行预测，获得当前时刻的行业电力负荷预测值。

与现有技术相比，本发明包括以下优点：

本申请实施例公开了一种基于外部影响因素关联性的电力负荷预测方法及***，所述方法包括：获取历史时间段内的历史电力负荷数据和影响电力负荷预测的外部影响因素数据；基于采用平均轮廓系数进行优化的k-means聚类模型和标准互信息相结合的关联性分析方法，对所述历史电力负荷数据和所述外部影响因素数据之间的非线性关联性进行量化分析，得到关联性分析结果；采用卷积神经网络进行特征提取以得到历史电力负荷数据特征向量和外部影响因素数据特征向量；将所述历史电力负荷数据特征向量、所述外部影响因素数据特征向量以及所述关联性分析结果输入预先训练完成的行业电力负荷预测模型，获得当前时刻的行业电力负荷预测值。本申请实施例基于采用平均轮廓系数进行优化的k-means聚类模型和标准互信息相结合的关联性分析方法，对历史电力负荷数据和外部影响因素数据之间的非线性关联性进行准确的量化分析，将关联性分析结果应用于基于卷积神经网络的行业短期电力负荷预测模型中，有效地提高了行业内短期的电力负荷预测的精度和稳定性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例公开的一种基于外部影响因素关联性的电力负荷预测方法流程图；

图2为本申请实施例公开的行业电力负荷预测模型预测示意图；

图3为本申请实施例公开的一种基于外部影响因素关联性的电力负荷预测***结构框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

发明人发现，行业内短期的电力负荷预测不仅与历史电力负荷数据有内在的相关性，还受到气象、日类型等外部影响因素数据的影响，在同时考虑历史电力负荷数据与外部影响因素数据的情况下，现有技术中无法准确分析历史电力负荷数据与外部影响因素数据之间的非线性关联性，可能会造成行业内短期的电力负荷预测的准确性不高的问题。

本申请实施例采用优化后的k-means聚类模型和标准互信息相结合的关联性分析方法，对电力负荷与各个外部影响因素的关联性进行量化分析，再利用卷积神经网络提取历史电力负荷与外部影响因素原始数据的特征向量，并考虑历史电力负荷与外部影响因素的关联性，对特征向量进行融合和预测，最终得到行业内短期的电力负荷预测结果，在对行业内历史电力负荷数据与外部影响因素数据的非线性关联性进行准确分析的基础上，将关联性分析结果应用到电力负荷预测的过程中，以提升行业内短期的电力负荷预测精度。

为了便于理解本申请实施例提供的技术方案，下面结合附图对本申请实施例提供的一种基于外部影响因素关联性的电力负荷预测方法进行说明。

参见图1，该图为本申请实施例提供的一种基于外部影响因素关联性的电力负荷预测方法的流程示意图，该方法应用于各行业中对电力负荷进行短期的分析预测的场景，包括如下步骤S1至S4：

S1：获取原始数据，所述原始数据包括历史时间段内的历史电力负荷数据和影响电力负荷预测的外部影响因素数据。

本申请实施例中，获取原始数据可以从数据库中获取，原始数据可以包括历史时间段内的历史电力负荷数据和影响电力负荷预测的外部影响因素数据，其中所述外部影响因素数据类型包括温度、湿度、风速、降水量、是否节假日等等，进行行业短期的电力负荷预测所使用的外部影响因素数据类型可以根据实际情况进行选择，本申请并不做限定。

S2：基于优化的k-means聚类模型和标准互信息相结合的关联性分析方法，对所述历史电力负荷数据和所述外部影响因素数据之间的非线性关联性进行量化分析，得到关联性分析结果；所述优化的k-means聚类模型为采用平均轮廓系数对初始k值进行优化的k-means聚类模型。

本申请实施例中，采用平均轮廓系数优化k-means聚类模型，基于优化后的k-means聚类模型与标准互信息相结合的关联性分析方法，分析历史电力负荷数据和外部影响因素数据之间的非线性相关性，使得分析所得的关联性分析结果能够有效的反映行业电力负荷与外部影响因素之间的关联性。本实施例中得到关联性分析结果具体的实现步骤如S21至S23所示：

S21：基于优化的k-means聚类模型对所述历史电力负荷数据和所述外部影响因素数据分别进行聚类处理，得到所述历史电力负荷数据的多个聚类簇分别对应的聚类中心值和所述外部影响因素数据的多个聚类簇分别对应的聚类中心值。

使用k-means聚类模型对无监督的聚类问题进行聚类，但是k-means聚类模型需要人为指定聚类簇数k，具有较弱的适应性和较强的主观性，聚类效果容易受到数据数量和分布情况的影响。本申请中采用平均轮廓系数进行最佳k值的确定，以实现对k-means聚类模型的优化，优化后的k-means聚类模型能够避免聚类过程中对于人工经验的依赖，提高了聚类模型的适应性。优化后的k-means聚类模型对历史电力负荷数据和外部影响因素数据进行聚类的过程具体如步骤S211至S217所示：

S211：输入待聚类数据在历史时间段内的采样值z(c)，其中(c∈{1,2,…,C})。

待聚类数据的采样值z(c)包括历史电力负荷数据y(c)和外部影响因素数据x(c)，在下述计算过程中，以采样值z(c)进行聚类为例，实际应用中分别对历史电力负荷数据y(c)和外部影响因素数据x(c)进行聚类，对历史电力负荷数据y(c)进行聚类和对外部影响因素数据x(c)进行聚类的过程相同。此处仅以采样值z(c)进行聚类方式的演示：

S212：对所述采样值进行一维聚类，生成k-means聚类模型的当前k值对应的k个簇。

可选的，聚类时以采样值和聚类簇中心值之差的绝对值作为划分聚类簇的标准。在初次聚类时，令k值等于2以进行后续计算。

S213：聚类完成后，计算所述采样值z(c)的轮廓系数l(c)。

若采样值z(c)为孤立点，即z(c)所在簇内只有一个z(c)采样值，则其轮廓系数l(c)为0；否则，按照如下公式计算采样值z(c)的轮廓系数l(c)。

式中，l₁(c)为簇内凝聚度，l₂(p,c)为z(c)所在的簇内与其他第p个簇的簇间分离度，l₃(c)为所有簇间分离度的最小值，z(j)为z(c)所在的簇内的其他采样值，n₁(c)为所在的簇内的采样值数目z(c)，z(q)为除z(c)所在的簇外第p个簇内的采样值，n₂(p,c)为除z(c)所在的簇外第p个簇内的采样值数目。

S214：根据所述轮廓系数计算所述当前k值对应的平均轮廓系数。

计算出每个采样值z(c)对应的轮廓系数l(c)后，利用下述公式求出当前k值对应的平均轮廓系数l₀(k)：

S215：令当前k值自加1，得到更新后的k值。

S216：若所述更新后的k值大于上限k_max，则取所有平均轮廓系数中的最大值所对应的k值作为最佳的聚类簇数k₀，以聚类簇数为k₀时的聚类结果为最终的聚类结果，得到所述历史电力负荷数据的多个聚类簇分别对应的聚类中心值和所述外部影响因素数据的多个聚类簇分别对应的聚类中心值。

在获得当前k值对应的平均轮廓系数后，令当前k值自加1，若更新后的k值大于上限k_max，则取所有平均轮廓系数l₀(k)(k∈{2,3,…,k_max})中的最大值者所对应的k值，作为最佳的聚类簇数，并记为k₀，将步骤S212中以聚类簇数为k₀时的聚类结果为最终的聚类结果，得到所述聚类中心值。在此步骤中，优化后的k-means聚类模型进行聚类后能够形成k₀个簇，每个簇都有1个聚类中心值，聚类中心值为簇内所有采样值的平均值。可选的，设定k值的上限k_max为10。

S217：若所述更新后的k值不大于所述上限k_max，则返回重新执行步骤S212，重新对所述采样值进行一维聚类。

以上述步骤S211至S216，分别对历史电力负荷数据y(c)和外部影响因素数据x(c)进行聚类，获得不同数据中每个聚类簇的聚类中心值。以所述聚类中心值替换所述簇内的采样值，得到替换后的历史电力负荷数据和外部影响因素数据，可以用于关联性分析结果的计算。

S22：以所述历史电力负荷数据的多个聚类簇分别对应的聚类中心值替换所述历史电力负荷数据的多个聚类簇的采样值，获得替换后的历史电力负荷数据；以所述外部影响因素数据的多个聚类簇分别对应的聚类中心值替换所述外部影响因素数据的多个聚类簇的采样值，获得替换后的外部影响因素数据。

本申请实施例中，将每个聚类簇对应的聚类中心值替换聚类中心值对应的聚类簇中的采样值，获得替换后的历史电力负荷数据和替换后的外部影响因素数据，将替换后的历史电力负荷数据和替换后的外部影响因素数据用于标准互信息的计算。

S23：利用所述替换后的历史电力负荷数据和替换后的外部影响因素数据进行标准互信息的计算，得到关联性分析结果，所述关联性分析结果包括通过标准互信息计算得到的标准互信息值。

本申请实施例中，对历史电力负荷数据与外部影响因素数据的关联性进行分析，充分考虑二者的非线性相关性；分析所得的关联性分析结果包括以标准互信息方法计算所得的标准互信息值。以标准互信息计算所得的标准互信息值作为衡量关联性量化的指标，使得能够捕捉到准确的非线性相关性。具体的标准互信息计算如下：

历史时段内的采样值包括待分析的历史电力负荷数据y(c)和外部影响因素数据x(c)，其中(c∈{1,2,…,C})，所有的外部影响因素数据x(c)构成外部影响因素数据序列X，所有的历史电力负荷数据y(c)构成历史电力负荷数据序列Y。外部影响因素数据x(c)中，x(c)共有M种可能的取值(M≤C)，记为x₁(m)(m∈{1,2,…,M})，历史电力负荷数据y(c)中，y(c)共有N种可能的取值(N≤C)，记为y₁(c)(n∈{1,2,…,N})。

在使用标准互信息计算历史电力负荷数据与外部影响因素数据的关联性时，如果直接计算外部影响因素数据序列X和历史电力负荷数据序列Y的标准互信息值，则计算公式为：

其中，I(X；Y)为序列X与序列Y的互信息值，H(X)和H(Y)分别为序列X和序列Y的信息熵，P(x₁(m),y₁(n))表示同时满足x(c)＝x₁(m)和y(c)＝y₁(n)的采样时刻在所有采样时刻中的占有比例，P(x₁(m))表示满足x(c)＝x₁(m)的采样时刻在所有采样时刻中的占有比例，P(y₁(n))表示满足y(c)＝y₁(n)的采样时刻在所有采样时刻中的占有比例。J(X；Y)取值范围为[0,1]，标准互信息值越大，表明外部影响因素数据与历史电力负荷数据的关联性越强。

但是直接采用序列X和序列Y进行标准互信息计算，会使得关联性分析受到数值细微差异的影响，无法把握变量的主要变化趋势。例如，对于表1的两组数据，按照上述标准互信息计算得到标准互信息值J(X；Y)分别为1和0，但是实际上对应的数据仅仅存在小数点后数值的细微差别。在实际实践过程中，当外部影响因素温度值x(c)出现较明显的变化时，历史电力负荷数据y(c)的分布基本没有变化，则应当认为温度值与历史电力负荷数据的关联性很弱，因此，取J(X；Y)＝0的结果更为合理。

表1温度与负荷采样数据示例

为了避免关联性分析结果受到数值细微差异的影响，本申请实施例采用步骤S21中优化的k-means聚类模型聚类生成的聚类中心值替换聚类簇里的采样值，进行聚类后的标准互信息计算。

记外部影响因素数据x(c)所在聚类簇的聚类中心值为u(c)，所有的聚类中心值u(c)构成序列U，记历史电力负荷数据y(c)和所在聚类簇的聚类中心值为v(c)，所有的聚类中心值v(c)构成序列V。其中，u(c)共有F种可能的取值(F≤C)，记为u₁(f)(f∈{1,2,…,F})；v(c)共有G种可能的取值(G≤C)，记为v₁(g)(g∈{1,2,…,G})。历史电力负荷数据和外部影响因素数据经过聚类中心值替换后的标准互信息值J₀(U；V)计算方法如下：

其中，I₀(U；V)为序列U与序列V的互信息值，H₀(U)和H₀(V)分别为序列U和序列V的信息熵，P(u₁(f),v₁(g))表示同时满足u(c)＝u₁(f)和v(c)＝v₁(g)的采样时刻在所有采样时刻中的占有比例，P(u₁(f))表示满足u(c)＝u₁(f)的采样时刻在所有采样时刻中的占有比例，P(v₁(g))表示满足v(c)＝v₁(g)的采样时刻在所有采样时刻中的占有比例。J₀(U；V)取值范围为[0,1]，标准互信息值越大，表明外部影响因素数据与历史电力负荷数据的关联性越强。

表1的两组数据经过聚类中心值替换后，得到的数据如表2所示，表2的两组数据按照上述聚类中心值替换后的标准互信息值计算方法，得到的J₀(U；V)均为0，与实际应用相符，可知，经过聚类中心值替换后的进行标准互信息计算的标准互信息值能够有效的反应历史电力负荷数据与外部影响因素数据的关联性。

表2聚类中心替换后温度与负荷采样数据示例

上述步骤中，采用了优化后的k-means聚类模型和标准互信息相结合的关联性分析方法，对历史电力负荷数据与外部影响因素数据之间的非线性相关性进行准确分析计算，通过采用平均轮廓系数优化的k-means聚类模型避免了变量数值细微差异对分析结果的影响，基于此，能够采用标准互信息捕捉到准确的非线性相关性。

S3：采用卷积神经网络对所述历史电力负荷数据和所述外部影响因素数据进行特征提取，得到历史电力负荷数据特征向量和外部影响因素数据特征向量；

本申请实施例中，采用卷积神经网络对原始数据进行特征提取。所述卷积神经网络可通过多尺寸窗口同时提取多种时间跨度的信息，以挖掘原始数据中的关键信息，用于短期负荷预测。

以下分别对历史电力负荷数据和外部影响因素数据进行特征提取进行详细说明。

对历史电力负荷数据进行特征提取的步骤如S311至S314所示：

S311：对所述历史电力负荷数据进行归一化处理，得到归一化处理后的历史电力负荷数据。

采用Min-Max标准化的方法对历史电力负荷数据进行归一化，得到归一化处理后的历史电力负荷数据，具体为：

历史电力负荷数据y(c)(c∈{1,2,…,C})，其中最大值为y_max，最小值为y_min，则每个历史电力负荷数据y(c)归一化后的值y_norm(c)为：

S312：从所述归一化处理后的历史电力负荷数据中获取所述卷积神经网络的t1维的输入向量，所述t1维的输入向量为当前时刻的前t1个时刻对应的归一化处理后的历史电力负荷数据。

采用当前时刻的前t1个时刻的归一化处理后的历史电力负荷数据作为输入数据，构成一个n维的输入向量，记为A。可选的，t1具体为当前时刻的前72小时。

S313：采用多个卷积窗口对所述t1维输入向量进行卷积运算和最大值池化，得到多个特征值。

用多个h×1维的卷积窗口W对A进行卷积运算，并进行最大值池化，得到特征值e。可选的，h具有多种取值，不同取值对应不同的时间段。

其中，A_a:a+h-1表示由输入向量A的第a至a+h-1维的值组成的向量，b为偏置项。

S314：将所述多个特征值进行拼接，得到所述历史电力负荷数据特征向量。

将多个卷积窗口得到的特征值进行拼接，得到历史电力负荷数据特征向量e₀。

对外部影响因素数据进行特征提取的步骤如S321至S325所示：

S321：对所述外部影响因素数据进行归一化处理，得到归一化处理后的外部影响因素数据。

采用Min-Max标准化的方法对外部影响因素数据进行归一化，得到归一化处理后的外部影响因素数据，具体为：

外部影响因素数据x(c)(c∈{1,2,…,C})，其中最大值为x_max，最小值为x_min，则每个外部影响因素数据x(c)归一化后的值x_norm(c)为：

S322：从所述归一化处理后的外部影响因素数据中获取所述卷积神经网络的t2维的输入向量，所述t2维的输入向量为当前时刻的前t2个时刻对应的归一化处理后的外部影响因素数据。

S323：将所述当前时刻的后t3个时刻的外部影响因素数据作为所述卷积神经网络的t3维的输入向量。

S324：将所述t2维的输入向量与所述t3维的输入向量组合为(t2+t3)维的输入向量。

采用当前时刻前t2个时刻的所有采样值以及从当前时刻起t3个时刻的所有外部影响因素数据预报值作为输入数据，构成(t2+t3)维的输入向量。可选的，t2具体为当前时刻的前72小时，t3具体为当前时刻的前24小时。所述外部影响因素数据预报值为对外部影响因素数据进行预测所得。

S325：采用多个卷积窗口对所述(t2+t3)维的输入向量进行卷积运算，生成各个所述外部影响因素数据特征向量。

与步骤S313类似，采用多个卷积窗口对(t2+t3)维的输入向量进行卷积运算，每个外部影响因素数据均生成一个特征向量，其中第r个外部影响因素数据的特征向量为e_1,r，r∈{1,2,…,R}，R为外部影响因素数据个数。

S4：将所述历史电力负荷数据特征向量、所述外部影响因素数据特征向量以及所述关联性分析结果输入预先训练完成的行业电力负荷预测模型，获得当前时刻的行业电力负荷预测值。

不同外部影响因素数据对行业电力负荷的影响程度不尽相同，因此在进行各个行业的电力负荷预测时，应充分考虑行业电力负荷数据与各个外部影响因素数据的关联性强弱。因此，在生成历史电力负荷数据特征向量和外部影响因素数据特征向量后，基于短期的行业电力负荷预测模型进行电力负荷预测值的计算，具体包括步骤S41至S44：

采用如图2所示的行业电力负荷预测模型对下述步骤S41至S44的流程进行简化说明，根据箭头指示的方向，图2中的外部影响因素特征向量e_1,r以归一化后的标准互信息值J_1,r作为权重，加权求和后得到融合向量e₂；将融合向量e₂与历史电力负荷数据特征向量e₀进行拼接，得到拼接向量e₃，使用SVR模型对拼接向量e₃进行预测，得到电力负荷预测值。针对每个步骤，详见下述。

S41：对标准互信息值进行归一化处理，得到归一化标准互信息值。

在预测某一行业的电力负荷时，利用历史电力负荷数据和外部影响因素数据，按照步骤S22计算历史电力负荷数据与各个外部影响因素数据之间的标准互信息值。

将历史电力负荷数据与第r个外部影响因素数据的标准互信息值记为J_0,r，对标准互信息值进行归一化处理，得到历史电力负荷数据与第r个外部影响因素数据的归一化标准互信息值J_1,r：

S42：以所述归一化标准互信息值作为所述外部影响因素数据特征向量的权重，对所述外部影响因素数据特征向量进行加权求和，得到融合向量。

以归一化标准互信息值J_1,r作为第r个外部影响因素数据卷积运算后的特征向量e_1,r的权重，将所有外部影响因素数据特征向量进行加权求和，得到融合向量e₂：

S43：将所述历史电力负荷数据特征向量与所述融合向量进行拼接，得到拼接向量。

将历史电力负荷数据特征向量e₀和融合向量e₂进行拼接，得到拼接向量e₃：

S44：使用所述支持向量回归模型对所述拼接向量进行预测，获得当前时刻的行业电力负荷预测值。

本申请实施例中，采用支持向量回归模型(support vector regression，SVR)对拼接向量进行预测，得到当前时刻的行业电力负荷预测值。

将历史电力负荷数据与外部影响因素数据的关联性分析结果应用于基于卷积神经网络的行业电力负荷预测模型中，能够有效的提高行业内短期的电力负荷预测的准确性。

本申请实施例中，在进行预测之前，需要先对卷积神经网络和行业电力负荷预测模型进行整体训练，训练过程如下：

选择一个历史时间段的历史电力负荷数据与外部影响因素数据作为训练集，所述历史时间段可以为40000个小时的历史时间段，所述历史电力负荷数据为历史时间段中实际的电力负荷数据。按照步骤S3-S4的方法构建相应的输入向量和输出值，采用后向传播方法对卷积神经网络和行业电力负荷预测模型进行整体训练，训练的过程中，卷积神经网络和SVR模型的参数将自动计算调整，训练后所有参数将被保留。利用训练后的卷积神经网络和行业电力负荷预测模型进行电力负荷预测，对于某个待预测时刻的预测，按照步骤S1-S4的方法进行计算，最终得到待预测时刻的电力负荷预测值。

本申请实施例中提供了一种基于外部影响因素关联性的电力负荷预测方法，所述方法包括：获取历史时间段内的历史电力负荷数据和影响电力负荷预测的外部影响因素数据；基于采用平均轮廓系数进行优化的k-means聚类模型和标准互信息相结合的关联性分析方法，对所述历史电力负荷数据和所述外部影响因素数据之间的非线性关联性进行量化分析，得到关联性分析结果；采用卷积神经网络进行特征提取以得到历史电力负荷数据特征向量和外部影响因素数据特征向量；将所述历史电力负荷数据特征向量、所述外部影响因素数据特征向量以及所述关联性分析结果输入预先训练完成的行业电力负荷预测模型，获得当前时刻的行业电力负荷预测值。本申请实施例基于采用平均轮廓系数进行优化的k-means聚类模型和标准互信息相结合的关联性分析方法，对历史电力负荷数据和外部影响因素数据之间的非线性关联性进行准确的量化分析，将关联性分析结果应用于基于卷积神经网络的行业短期电力负荷预测模型中，有效地提高了行业内短期的电力负荷预测的精度和稳定性。

前述本申请实施例提供基于上述的一种基于外部影响因素关联性的电力负荷预测方法。接下来说明本申请实施例中还提供的一种基于外部影响因素关联性的电力负荷预测***，该***执行前述图1所示的方法，接下来对基于外部影响因素关联性的电力负荷预测***的功能进行说明，所述电力负荷预测***的结构框图如图3所示，包括：

获取模块51、量化分析模块52、特征提取模块53以及预测模块54。

其中，

所述获取模块51，用于获取原始数据，所述原始数据包括历史时间段内的历史电力负荷数据和影响电力负荷预测的外部影响因素数据；

所述量化分析模块52，用于基于优化的k-means聚类模型和标准互信息相结合的关联性分析方法，对所述历史电力负荷数据和所述外部影响因素数据之间的非线性关联性进行量化分析，得到关联性分析结果；所述优化的k-means聚类模型为采用平均轮廓系数对初始k值进行优化的k-means聚类模型；

所述特征提取模块53，用于采用卷积神经网络对所述历史电力负荷数据和所述外部影响因素数据进行特征提取，得到历史电力负荷数据特征向量和外部影响因素数据特征向量；

所述预测模块54，用于将所述历史电力负荷数据特征向量、所述外部影响因素数据特征向量以及所述关联性分析结果输入预先训练完成的行业电力负荷预测模型，获得当前时刻的行业电力负荷预测值。

在一种可能实现的方式中，所述量化分析模块52可以包括：

在一种可能实现的方式中，所述聚类子模块可以包括：

第一计算单元，用于计算所述采样值的轮廓系数；

自加单元，用于令当前k值自加1，得到更新后的k值；

在一种可能实现的方式中，所述特征提取模块53可以包括：

历史电力负荷数据归一化子模块，用于对所述历史电力负荷数据进行归一化处理，得到归一化处理后的历史电力负荷数据；

第一获取子模块，用于从所述归一化处理后的历史电力负荷数据中获取所述卷积神经网络的t1维的输入向量，所述t1维的输入向量为当前时刻的前t1个时刻对应的归一化处理后的历史电力负荷数据；

第一卷积子模块，用于采用多个卷积窗口对所述t1维输入向量进行卷积运算和最大值池化，得到多个特征值；

特征值拼接子模块，用于将所述多个特征值进行拼接，得到所述历史电力负荷数据特征向量。

在一种可能实现的方式中，所述特征提取模块53还可以包括：

外部影响因素数据归一化子模块，用于对所述外部影响因素数据进行归一化处理，得到归一化处理后的外部影响因素数据；

第二获取子模块，用于从所述归一化处理后的外部影响因素数据中获取所述卷积神经网络的t2维的输入向量，所述t2维的输入向量为当前时刻的前t2个时刻对应的归一化处理后的外部影响因素数据；

第三获取子模块，用于将所述当前时刻的后t3个时刻的外部影响因素数据作为所述卷积神经网络的t3维的输入向量；

组合子模块，用于将所述t2维的输入向量与所述t3维的输入向量组合为(t2+t3)维的输入向量；

第二卷积子模块，用于采用多个卷积窗口对所述(t2+t3)维的输入向量进行卷积运算，生成所述外部影响因素数据特征向量。

在一种可能实现的方式中，所述预测模块54可以包括：

本申请实施例中提供了一种基于外部影响因素关联性的电力负荷预测***，所述***包括：用于获取历史时间段内的历史电力负荷数据和影响电力负荷预测的外部影响因素数据的获取模块；用于基于采用平均轮廓系数进行优化的k-means聚类模型和标准互信息相结合的关联性分析方法，对所述历史电力负荷数据和所述外部影响因素数据之间的非线性关联性进行量化分析，得到关联性分析结果的量化分析模块；用于利用卷积神经网络进行特征提取以得到历史电力负荷数据特征向量和外部影响因素数据特征向量的特征提取模块；以及用于将所述历史电力负荷数据特征向量、所述外部影响因素数据特征向量以及所述关联性分析结果输入预先训练完成的行业电力负荷预测模型，获得当前时刻的行业电力负荷预测值的预测模块。本申请实施例基于采用平均轮廓系数进行优化的k-means聚类模型和标准互信息相结合的关联性分析方法，对历史电力负荷数据和外部影响因素数据之间的非线性关联性进行准确的量化分析，将关联性分析结果应用于基于卷积神经网络的行业短期电力负荷预测模型中，有效地提高了行业内短期的电力负荷预测的精度和稳定性。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本发明时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。

以上对本发明所提供的一种基于外部影响因素关联性的电力负荷预测方法及***进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种基于外部影响因素关联性的电力负荷预测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于优化的k-means聚类模型和标准互信息相结合的关联性分析方法，对所述历史电力负荷数据和所述外部影响因素数据之间的非线性关联性进行量化分析，得到关联性分析结果，包括：

3.根据权利要求2所述的方法，其特征在于，所述基于优化的k-means聚类模型对所述历史电力负荷数据和所述外部影响因素数据分别进行聚类处理，得到所述历史电力负荷数据的多个聚类簇分别对应的聚类中心值和所述外部影响因素数据的多个聚类簇分别对应的聚类中心值，包括：

计算所述采样值的轮廓系数；

根据所述轮廓系数计算所述当前k值对应的平均轮廓系数；

令当前k值自加1，得到更新后的k值；

4.根据权利要求1所述的方法，其特征在于，所述采用卷积神经网络对所述历史电力负荷数据和所述外部影响因素数据进行特征提取，得到历史电力负荷数据特征向量和外部影响因素数据特征向量，包括：

5.根据权利要求1所述的方法，其特征在于，所述采用卷积神经网络对所述历史电力负荷数据和所述外部影响因素数据进行特征提取，得到历史电力负荷数据特征向量和外部影响因素数据特征向量，还包括：

6.根据权利要求2所述的方法，其特征在于，所述预先训练完成的行业电力负荷预测模型包括支持向量回归模型，所述将所述历史电力负荷数据特征向量、所述外部影响因素特征向量及所述关联性分析结果输入预先训练完成的行业电力负荷预测模型，获得当前时刻的行业电力负荷预测值，包括：

7.一种基于外部影响因素关联性的电力负荷预测***，其特征在于，包括：

8.根据权利要求7所述的***，其特征在于，所述量化分析模块包括：

9.根据权利要求8所述的***，其特征在于，所述聚类子模块包括：

第一计算单元，用于计算所述采样值的轮廓系数；

自加单元，用于令k值自加1，得到更新后的k值；

10.根据权利要求7所述的***，其特征在于，所述预先训练完成的行业电力负荷预测模型包括支持向量回归模型，所述预测模块包括：