CN114118530A

CN114118530A - 一种基于多户电力消耗预测模型的预测方法及装置

Info

Publication number: CN114118530A
Application number: CN202111301260.9A
Authority: CN
Inventors: 黄晶; 严珂; 钟宜国; 张伟; 陈青海
Original assignee: Hangzhou Jingwei Information Technology Co ltd
Current assignee: Hangzhou Jingwei Information Technology Co ltd
Priority date: 2021-11-04
Filing date: 2021-11-04
Publication date: 2022-03-01

Abstract

本申请提供一种基于多户电力消耗预测模型的预测方法及装置，其中，该方法包括：采集多个用电主体的电力消耗序列数据；对电力消耗数据进行采样，并对采样数据进行预处理，基于预处理后的数据确定训练集和测试集；用训练集和测试集对电力消耗预测模型进行本地训练得到通用模型，通过通用模型对待预测用户的用电情况进行预测，通过本申请，解决了电力消耗预测模型的训练效率低和数据易泄露的问题，在保证预测精度和数据隐私的前提下，仅用一个通用模型就能实现对各种家庭电力数据的预测，具有强大的泛化能力。

Description

一种基于多户电力消耗预测模型的预测方法及装置

技术领域

本申请涉及计算机技术领域，具体而言，涉及一种基于多户电力消耗预测模型的预测方法及装置。

背景技术

准确预测高波动性家庭用电量(HEC)在当代社会中具有重要作用。使政府能够及时响应需求，制定更加合理的可持续发展战略。此外，也有利于智能电网的发展，使智能电网能够毫不延迟地传输电能，满足用户的需求。然而，在家庭用电量预测的研究中也存在一些障碍。

首先，传统的HEC预测研究方法表明，我们需要使用一个模型来预测一组数据，这使得不同数据的训练需要使用不同的模型。当对一组数据进行训练时，将丢弃之前的模型，需要对下一个模型进行初始化，然后重新开始训练。经过训练的模型在完成当前预测任务后就失去了使用价值。在实际应用中，在数据量或者模型规模非常大的情况下，需要花大量时间进行模型训练。

其次，技术的发展提高了分析用户数据的能力。人们有能力从用户行为数据推断出用户信息。如果用户的行为数据流入不法人士手中，将会给用户带来很多麻烦。因此，近年来，人们越来越重视对个人隐私的保护。然而，目前流行的深度学习模型需要大量的数据来获得更好的性能。海量用户数据的采集已经成为深度学习进一步发展的障碍。

因此，在保证数据隐私的前提下，使用模型对多个HEC数据集进行准确预测具有重要意义。减少模型的训练时间和保护数据隐私是当前研究中的两个最重要的问题。

发明内容

本申请实施例的目的在于提供一种基于多户电力消耗预测模型的预测方法及装置，用以减少模型训练时间和保护数据隐私。

第一方面，本申请实施例提供了一种基于多户电力消耗预测模型的预测方法，所述方法包括：

采集多个用电主体的电力消耗数据，所述电力消耗数据为按照时间顺序记录的各个时段数据；

对所述电力消耗数据进行采样，并对采样数据进行预处理，基于预处理后的数据确定训练集和测试集；

基于所述训练集和所述测试集，对电力消耗预测模型进行训练得到通用模型；

通过所述通用模型对待预测用户的用电情况进行预测。

在其中一些实施例中，基于所述训练集和所述测试集，对电力消耗预测模型进行训练得到通用模型包括：

基于所述训练集和所述测试集，对每个用电主体的电力消耗预测模型进行训练，并将训练好的模型参数传递给中央服务器；

所述中央服务器对所述模型参数进行融合，将融合数据下发到各个所述电力消耗预测模型中进行循环训练，直到生成通用模型。

在其中一些实施例中，基于预处理后的数据确定训练集和测试集包括：

将预处理后的数据划分为87％训练集和13％测试集。

在其中一些实施例中，基于所述训练集和所述测试集，对每个用电主体的电力消耗预测模型进行训练包括：

所述电力消耗预测模型为联邦学习和BiLSTM结合的模型，即Fed_BiLSTM模型，所述联邦学习和BiLSTM结合的模型包括五个并行任务模块和一个中心模块，其中，每个所述任务模块由一个BiLSTM神经网络层和一个全连接层组成；

所述中心模块中的服务器与客户端通过TCP协议建立连接后，基于所述训练集和所述测试集，通过所述任务模块训练每个用电主体的电力消耗预测模型。

在其中一些实施例中，将融合数据下发到各个所述电力消耗预测模型中进行循环训练，直到生成通用模型包括：

将融合数据下发到各个所述电力消耗预测模型中，通过所述电力消耗预测模型的损失函数

以及通用模型的损失函数

进行循环训练；

通过最小化平均绝对误差

平均绝对百分比误差

和均方根误差

对每次训练后的模型进行评估优化，直至生成通用模型；

其中，m表示数量特征，y＝{y₁,y₂,…,y_N}表示预测值，

表示实际值。

在其中一些实施例中，对采样数据进行预处理包括：

将用电主体的数据集上传到各个节点，进行异常处理并且利用Z-Score对电力消耗数据进行放缩，得到平均值为0和标准差为1的预处理后的电力消耗数据。

第二方面，本申请实施例提供了一种基于多户电力消耗预测模型的装置，所述装置包括：

采集模块，用于采集待预测的电力消耗数据，所述电力消耗数据为按照时间顺序记录的各个时段数据；

分析模块，用于对所述电力消耗数据进行异常处理和预处理；

确认模块，用于基于预处理后的数据确定训练集和测试集；

训练模块，用于基于训练集和测试集，对初始电力消耗预测模型进行训练得到通用模型；

预测模块，用于通过训练好的通用模型对待预测用电主体的用电情况进行预测。

在其中一些实施例中，所述训练模块还包括：

所述训练模块基于所述训练集和所述测试集，对每个用电主体的电力消耗预测模型进行训练，并将训练好的模型参数传递给中央服务器；

所述训练模块通过中央服务器对所述模型参数进行融合，将融合数据下发到各个所述电力消耗预测模型中进行循环训练，直到生成通用模型。

第三方面，本申请实施例提供了一种电子设备，包括处理器和存储器，所述存储器上存储有计算机程序，所述计算机程序在被所述处理器运行时实现上述第一方面所述基于多户电力消耗预测模型的预测方法

第四方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器运行时实现上述第一方面所述基于多户电力消耗预测模型的预测方法。

相比于相关技术，本申请提供的一种基于多户电力消耗预测模型的预测方法及装置。采集多个用电主体的电力消耗序列数据；对所述电力消耗数据进行采样，基于采样数据确定训练集和测试集；基于所述训练集和所述测试集，对每个用电主体的电力消耗预测模型进行本地训练，并将训练好的参数传递给中央服务器；中央服务器对接收到的模型参数进行融合，然后将其分布到各个本地模型中；本地模型接收到参数后，进行局部更新，循环进行上述操作，直到生成最优通用模型。减少数据的处理和训练时间，数据是在分布式计算机***上同步训练的。本发明在保证预测精度和数据隐私的前提下，仅用一个通用模型就能实现对各种家庭能耗数据的预测，具有强大的泛化能力。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1是示例电子设备的结构框图；

图2是根据本申请实施例的基于多户电力消耗预测模型的预测方法步骤流程图；

图3是将参数传递给中央服务器的流程示意图；

图4是整体算法框架的示意图；

图5是双向长短期记忆神经网络模型的示意图；

图6是五个家庭电力消耗预测通用模型的拟合示意图；

图7是根据本申请实施例的基于多户电力消耗预测模型的装置结构框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合附图对本发明的技术方案进行描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。

本申请实施例提供了一种电子设备，图1是示例电子设备的结构框图，如图1所示，电子设备100包括一个或多个处理设备102、一个或多个存储装置104、输入装置106以及输出装置108，这些组件通过总线***112和/或其它形式的连接机构(未示出)互连。应当注意，图1所示的电子设备100的组件和结构只是示例性的，而非限制性的，根据需要，电子设备也可以具有其他组件和结构。

处理设备102可以是中央处理单元(CPU)、图形处理单元(GPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元，并且可以控制电子设备100中的其它组件以执行期望的功能。

存储装置104可以包括一个或多个计算机程序产品，计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在计算机可读存储介质上可以存储一个或多个计算机程序指令，处理设备102可以运行程序指令，以实现下文的本发明实施例中(由处理器实现)的客户端功能以及/或者其它期望的功能。在计算机可读存储介质中还可以存储各种应用程序和各种数据，例如应用程序使用和/或产生的各种数据等。

输入装置106可以是用户用来输入指令的装置，并且可以包括键盘、鼠标、麦克风和触摸屏等中的一个或多个。

输出装置108可以向外部(例如，用户)输出各种信息(例如，图像或声音)，并且可以包括显示器、扬声器等中的一个或多个。

示例性地，用于实现根据本发明实施例的电力消耗预测模型训练方法的示例电子设备可以被实现为诸如智能手机、平板电脑等移动终端上。

下面将结合具体的实施例多户电力消耗预测的通用模型训练方法进行详细的介绍。

本申请实施例提供了一种基于多户电力消耗预测模型的预测方法，图2是根据本申请实施例的基于多户电力消耗预测模型的预测方法步骤流程图，如图2所示，该方法包括以下步骤：

步骤S210，采集多个用电主体的电力消耗数据，电力消耗数据为按照时间顺序记录的各个时段数据；

具体地，可以按采集点采集5个不同的家庭的电力消耗数据，依次按时间顺序记录各时段数据。

步骤S220，对电力消耗数据进行采样，并对采样数据进行预处理，基于预处理后的数据确定训练集和测试集；

具体地，设置6秒为一步，分别生成时间序列数据，去除无效数据，然后对生成的时间序列利用Z-Score对数据集进行标准化成平均值为0，标准差为1的数据。该采集点可以指用电主体。

可以使用滑动时间窗的方法将子序列从单维的时间序列数据拓展成多维数据，滑动时间窗长度可以设置为8。可以使用前八个点的数据预测第九个点的电力消耗情况，将单维样本数据拓展成为多维样本数据。基于这样的预测方式，将原来的单维时间序列样本数据拓展成为多维样本数据，即每个预测目标值与它对应历史数据的集合。

步骤S230，基于训练集和测试集，对电力消耗预测模型进行训练得到通用模型；

步骤S240，通过通用模型对待预测用户的用电情况进行预测。

通过本申请实施例中的步骤S210至步骤S240，解决了电力消耗预测模型的训练效率低和数据易泄露的问题，在保证预测精度和数据隐私的前提下，仅用一个通用模型就能实现对各种家庭电力数据的预测，具有强大的泛化能力。

在其中一些实施例中，步骤S230，基于训练集和测试集，对电力消耗预测模型进行训练得到通用模型包括：

基于训练集和测试集，对每个用电主体的电力消耗预测模型进行训练，并将训练好的模型参数传递给中央服务器；

图3是将参数传递给中央服务器的流程示意图，如图3所示，训练好后的参数会通过TCP协议传送到中央服务器。TCP是一种高效、可靠、稳定、面向连接的通信协议，使用TCP协议在服务器和客户端之间建立连接。当客户端通过TCP与服务器建立通信时，会向服务器发送通信请求，通信双方经过三次握手后，客户端和服务器端之间就建立了全双工通信；当通信双方挥手四次后，连接将断开。通过TCP协议，客户端可以上传或下载更新参数，实现服务器与客户端之间的交互。

中央服务器对模型参数进行融合，将融合数据下发到各个电力消耗预测模型中进行循环训练，直到生成通用模型。

具体地，图4是整体算法框架的示意图，如图4所示，在传统预测方法中引入联邦学习，可以使用单一的通用模型对多户数据库进行预测，本发明减少了数据采集人员的工作量和数据采集的工作量。且数据只在本地模型中流动，不会上传到服务器。服务器聚合所有本地模型并生成一个通用模型来预测多个不同的数据集。

每个数据库部署在一个本地模型上，每个客户机用唯一的的梯度来更新本地模型。本地模型训练完成后，将本地参数上传到服务器，服务器根据参数融合机制对接收到的模型参数进行融合，然后将其分布到各个本地模型中。TCP通信被设计用来在服务器和客户端之间传输参数。局部模型接收到参数后，进行局部更新，循环进行上述操作，直到生成最优通用模型。

为了使模型具有更强的泛化能力没有使用SGD对模型进行优化，而是使用了Adam。HEC数据具有波动大、突变明显的特点。Adam优化器在SGD的基础上增加了一阶动量m_i和二阶动量v_i，比SGD更有效地更新网络权重w_i+1，得到目标函数在当前参数下的梯度

可以得到更好的预测结果。

m_i基于以下公式确定：

v_i基于以下公式确定：

w_i+1基于以下公式确定：

基于以下公式确定：

式中，β₁和β₂为控制动量的超参数。

该各个电力消耗本地预测模型的损失函数为J_h(w)，通用模型的损失函数为

并以最小化平均绝对误差MAE、均方根误差RMSE、平均绝对百分比误差MAPE指标为目标进行设计和优化。

在其中一些实施例中，步骤S220，对采样数据进行预处理包括：

在其中一些实施例中，步骤S220，基于预处理后的数据确定训练集和测试集包括：

将预处理后的数据划分为87％训练集和13％测试集。

在其中一些实施例中，基于训练集和测试集，对每个用电主体的电力消耗预测模型进行训练包括：

电力消耗预测模型为联邦学习和BiLSTM结合的模型，即Fed_BiLSTM模型，联邦学习和BiLSTM结合的模型包括五个并行任务模块和一个中心模块，其中，每个任务模块由一个BiLSTM神经网络层和一个全连接层组成；

具体地，图5是双向长短期记忆神经网络模型的示意图，如图5所示，5个本地模型都是使用BiLSTM进行训练，BiLSTM的结构主要是一个四层结构。这四个层分别是:输入层、前向层、后向层和输出层。前向层和后向层互不干涉，依赖关系清晰。每一层都有相应的权值，每一层的权值在每一个时间步骤中被重用。最后的结果是前向层输出和后向层输出的元素相加。

中心模块中的服务器与客户端通过TCP协议建立连接后，基于训练集和测试集，通过任务模块训练每个用电主体的电力消耗预测模型。

每个所述任务模块由一个BiLSTM神经网络层和一个全连接层组成；

BiLSTM中包括两层的LSTM，LSTM有三个门：遗忘门F_t,输入门I_t和C′_t，输出门O_t。F_t实现了一个sigmoid层来确定之前LSTM层的输出和当前LSTM层的输入中哪些信息将被丢弃。I_t使用sigmoid层，C′_t使用tanh层，确定要存储在单元格状态中的新信息。O_t确定哪些信息将输出到LSTM的下一层。另外，细胞状态C_t在LSTM中起长期存储作用的，根据所选单元进行更新。最后输出h_t由输出门O_t和当前细胞状态C_t决定。

遗忘门Ft基于如下公式确定：

F_t＝σ(W_F·[h_t-1,x_t]+b_F)

输入门I_t基于如下公式确定：

I_t＝σ(W_I·[h_t-1,x_t]+b_I)

输入门C′_t基于如下公式确定：

C′_t＝tanh(W_C·[h_t-1,x_t]+b_C)

细胞状态C_t基于如下公式确定：

C_t＝F_t⊙C_t-1+I_t⊙C′_t

输出门O_t基于如下公式确定：

O_t＝σ(W_o·[h_t-1,x_t]+b_o)

最后输出h_t基于如下公式确定：

h_t＝O_t⊙tanh(C_t)

在上述公式中，w和b表示对应的权重和偏置。[,]表示两个矩阵的连接，⊙表示hadamard结果。

在其中一些实施例中，将融合数据下发到各个电力消耗预测模型中进行循环训练，直到生成通用模型包括：

将融合数据下发到各个电力消耗预测模型中，通过电力消耗预测模型的损失函数J_h(w)，以及通用模型的损失函数

进行循环训练；

通过最小化平均绝对误差

平均绝对百分比误差

和均方根误差

对每次训练后的模型进行评估优化，直至生成通用模型；

其中，m表示数量特征，y＝{y₁,y₂,…,y_N}表示预测值，

表示实际值。MAE、RMSE和MAPE用于评估所提出的预测方法的有效性和泛化性。

具体地，上述评价指标可用于量化预测效果，并评估预测方法的准确性和性能。表1是几种预测方法的实验预测结果，以进一步证明本发明在家庭电力消耗时间序列预测中的通用性。使用相同的评估指标，计算和比较预测每个家庭用电变量的不同方法的预测误差和拟合效果。不同的家庭结构有着不同的用电习惯，因此对预测方法的泛用性提出了挑战。

这几种预测方法所基于的机器学习模型包括LSTM、BiLSTM、引入联邦学习的Fed_LSTM和引入联邦学习的Fed_BiLSTM(本预测方法)。从表中可以看出，BiLSTM的预测结果并不比LSTM好。它表明，在家庭电力预测数据中，双向LSTM不一定比单向LSTM更擅长学习数据趋势。而引入联邦学习后的BiLSTM的预测性能明显优于引入联邦学习后的LSTM，这说明融合模型在联邦学习中的运行大大提高了BiLSTM的学习能力。此外，本发明所提出的模型各方面的评价值也表明它比单一模型更优越。由Fed_BiLSTM训练的通用模型在5种不同分布的数据上取得了较高的预测精度。因此，Fed_BiLSTM的优势不仅体现在预测精度的提高，还体现在模型的通用性较高。

表1

图6是五个家庭电力消耗预测通用模型的拟合示意图。如图6所示，Real Value为用电数据的真实值，Predicted Value为用电数据的预测值，由于家庭本身的原因，这5个家庭的数据分布有明显的差异。同一时段，1、2、4户用电量波动较大，3、5户用电量数据波动较大。在这种情况下，利用一个通用模型来预测波形差异如此之大的不同数据集是一项具有挑战性的任务。观察波动数据，可以发现不同家庭的用电量峰值在不同的位置，波动较大，突变明显。普通神经网络很难预测突发变化和不规则数据。

由于经过长时间的训练，传统的模型只适用于当前的单一数据集。当进入下一个场景时，模型需要重新训练。在实际应用中，等待模型培训的过程成本很高，花费大量时间一次性培训一个模型是不现实的。建立一个能够准确预测多户家庭的模型是时间序列预测研究的必然趋势。从预测结果来看，本发明与期望值吻合，准确预测了能源消耗趋势。

而预测方法中的本地模型由五个平行的双向记忆神经网络(PLSTM)层和一个全连接(dense)层组成。BiLSTM能够捕获数据从前到后、从后到前的双向长期依赖，前向层和后向层互不干涉，依赖关系清晰。每一层都有相应的权值，每一层的权值在每一个时间步骤中被重用。BiLSTM的双向结构使得它既继承了LSTM的优点，又弥补了LSTM的不足。

通过本申请实施例的基于联邦学习的双向长短期记忆神经网络模型的多个家庭电力消耗时间序列预测方法，分布式结构有效地减少了模型的训练时间。Fed_LSTM模型数据只在本地模型中流动，保护了用户的隐私。服务器接收到从本地模型上传的梯度信息，然后通过安全聚合机制将融合参数发送到每个本地模型。循环上述操作，直到得到一个预测精度高的通用模型。前向LSTM和反向LSTM的结构也使模型能够更好地捕捉数据的长期依赖性，提高最终的预测精度。所提出的发明优于现有的多种预测家庭电力消耗的模型，该深度学习模型预测了五个不同家庭在在多种情景下的评价指标都优于多个单一模型和组合模型。可以有效的应用于保护数据隐私和减少训练时间中对电力消耗数据的预测，并且能够有效解决目前电力消耗预测模型中存在的预测精度较低、泛化性差、预测滞后、数据隐私泄露等问题，具有良好的鲁棒性和泛化性。

本申请实施例提供了一种基于多户电力消耗预测模型的装置，图7是根据本申请实施例的基于多户电力消耗预测模型的装置结构框图，如图7所示，该装置包括：

采集模块701，用于采集待预测的电力消耗数据，电力消耗数据为按照时间顺序记录的各个时段数据；

分析模块702，用于对电力消耗数据进行异常处理和预处理；

确认模块703，用于基于预处理后的数据确定训练集和测试集；

训练模块704，用于基于训练集和测试集，对初始电力消耗预测模型进行训练得到通用模型；

预测模块705，用于通过训练好的通用模型对待预测用电主体的用电情况进行预测。

通过本申请实施例中的采集模块701、分析模块702、确认模块703、训练模块704和预测模块705，解决了电力消耗预测模型的训练效率低和数据易泄露的问题，在保证预测精度和数据隐私的前提下，仅用一个通用模型就能实现对各种家庭电力数据的预测，具有强大的泛化能力。

在其中一些实施例中，训练模块704还包括：

训练模块704基于训练集和测试集，对每个用电主体的电力消耗预测模型进行训练，并将训练好的模型参数传递给中央服务器；

训练模块704通过中央服务器对模型参数进行融合，将融合数据下发到各个电力消耗预测模型中进行循环训练，直到生成通用模型。

本申请实施例所提供的装置，其实现原理及产生的技术效果和前述方法实施例相同，为简要描述，装置实施例部分未提及之处，可参考前述方法实施例中相应内容。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的***、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的***、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。