CN113344279B

CN113344279B - 基于lstm-sam模型和池化的居民负荷预测方法

Info

Publication number: CN113344279B
Application number: CN202110684640.9A
Authority: CN
Inventors: 臧海祥; 许瑞琦; 刘冲冲; 徐雨森; 卫志农; 孙国强
Original assignee: Hohai University HHU
Current assignee: Hohai University HHU
Priority date: 2021-06-21
Filing date: 2021-06-21
Publication date: 2022-03-01
Anticipated expiration: 2041-06-21
Also published as: CN113344279A

Abstract

本发明公开了基于LSTM‑SAM模型和池化的居民负荷预测方法，属于电力***技术领域，通过获取多个居民用户的历史负荷数据和数值气象预报数据，随机选择某个用户作为目标用户；采用二阶段特征工程对每个用户的数据进行预处理；对非目标用户进行排序，选择不同数量的非目标用户为互联用户，与目标用户共同构成不同的池化组合，基于池化构建训练数据池，并保留目标用户的测试集数据；将训练数据池和目标用户的测试集数据输入LSTM‑SAM混合模型，获取各负荷分量的预测值并将其相加，输出目标用户待预测时刻的日前负荷预测结果及最佳池化用户个数。本发明提高了居民负荷的预测精度，为***调度和需求响应实施提供指导，保障了电力***的安全稳定经济运行。

Description

基于LSTM-SAM模型和池化的居民负荷预测方法

技术领域

本发明属于电力***技术领域，涉及基于LSTM-SAM模型和池化的居民负荷预测方法。

背景技术

电力***需要保持电力供应和电力需求间的动态平衡，负荷预测在维持电力***稳定运行及指导电力调度中具有十分重要的现实意义。由于受到外部因素的影响，电力负荷具有一定的波动性和不确定性。相较于***总负荷，用户级居民负荷由于缺少负荷平滑更加难以预测。此外，电力用户自发参与需求响应，导致居民负荷预测更加复杂。因此，研究精准的居民负荷预测方法是至关重要的。

现有负荷预测方法可分为传统统计方法和人工智能法。其中，传统的统计负荷预测方法容易实现，不需要获取额外的输入。但在很多情况下，由于只考虑了历史负荷数据，其准确性往往受到限制。基于人工智能的负荷预测方法可以将多个变量作为输入。具备非线性特征提取能力和容错能力的人工神经网络以及具有较强泛化能力的支持向量机是机器学习的常用算法，在小数据样本情况下表现性能优越。另一方面，高级量测体系的部署导致负荷数据量显著增加。大规模数据降低了机器学习的有效性，这一不足可通过采用深度学习算法进行克服，深度学习为有效处理海量数据提供了解决方案。相较于单一模型架构，混合模型集成了不同模型的优点，因而其预测性能得到改善，近年来被广泛关注并大量应用。除了开发性能更强的模型，改进模型输入是提高预测性能的另一种有效方法。特征工程作为一种构建有价值的模型输入的方法，已被深入研究，用于促进特征提取，提高模型泛化能力。在此背景下，使用基于LSTM-SAM模型和池化的居民负荷预测方法，以学习居民用户的用电行为特征，提高负荷预测的准确性，为电力***运行和调度提供更可靠的指导。

发明内容

发明目的：本发明针对目前用户级居民负荷预测方法的不足，包括预测精度低、未利用除目标用户数据以外的有用信息等问题，提出基于LSTM-SAM模型和池化的居民负荷预测方法，基于LSTM-SAM混合模型，学习训练数据池中的隐藏信息，使得预测精度进一步提升。

技术方案：本发明提供了基于LSTM-SAM模型和池化的居民负荷预测方法，包括以下步骤：

(1)获取多个居民用户的历史负荷数据和数值气象预报数据，随机选择某个用户作为目标用户；

(2)采用二阶段特征工程对每个用户的数据进行预处理；

(3)对非目标用户进行排序，选择不同数量的非目标用户为互联用户，与目标用户共同构成不同的池化组合，基于池化构建训练数据池，并保留目标用户的测试集数据；

(4)将训练数据池和目标用户的测试集数据输入LSTM-SAM混合模型，分别进行训练和预测，获取各负荷分量的预测值并将其相加，输出目标用户待预测时刻的日前负荷预测结果及最佳池化用户个数。

进一步地，步骤(2)采用二阶段特征工程对每个用户的数据进行预处理，所述二阶段特征工程方法为：

2.1历史负荷序列分解阶段，采用变分模态分解算法将观测到的负荷序列分解为多个频率分量，分别对各历史负荷分量进行后续数据预处理；

2.2多源输入维度重构阶段，分别对负荷分量和数值气象预报数据采用不同方法重构输入维度，具体方法如下：

2.2.1负荷分量输入维度重构方法：

假设待预测时刻为t，从第i个负荷分量中取一段固定长度的连续滞后负荷值，表示为：

i＝1,2,3

其中，T是转置；

为待预测时刻t第i个负荷分量对应的滞后负荷时间序列；

是第i个负荷分量在时刻r的值，r＝t-h-lag+1,t-h-lag+2,…,t-h；i是负荷分量的序号；lag是连续滞后负荷的数量；h是预测时间步长；

利用滑动窗口获取负荷数据，将获取的数据作为输入至LSTM网络一个时间步的特征向量，以一步为间隔连续滑动，获取输入至LSTM网络相邻时间步的特征向量，则第j个滑动窗口获取的向量为：

j＝1,2,…,T₀

其中，T是转置；

为第j个滑动窗口从待预测时刻t第i个负荷分量对应的滞后负荷时间序列中获取的向量；

为第i个负荷分量在时刻q的值，q＝t-h-lag+j,t-h-lag+j+1,…,t-h-lag+j+n-1；j为滑动窗口的序号；n是滑动窗口的宽度；T₀是滑动窗口的总数量，T₀由连续滞后负荷的数量和滑动窗口的宽度决定：

T₀＝lag+1-n

将T₀个滑动窗口获取的向量依次进行堆叠，构成如下二维特征图：

其中，T是转置；

为维度重构后待预测时刻t第i个负荷分量对应的二维输入特征，其大小为T₀×n，分别对应LSTM输入中的时间步数和输入特征维度；

2.2.2数值气象预报输入维度重构方法：

融合预测时刻t的温度、相对湿度和风速预报值，并将融合后的结果重复T₀次，则预测时刻t对应的二维气象特征为：

其中，NWP_t为维度重构后待预测时刻t对应的数值气象预报特征，其大小为T₀×3，T₀是滑动窗口总数量；T_t、H_t和W_t分别指预测时刻t的温度、湿度和风速。

将该特征分别与预测时刻t各负荷分量的加权隐藏特征相结合。

进一步地，步骤(3)对非目标用户进行排序，选择不同数量的非目标用户为互联用户，与目标用户共同构成不同的池化组合，基于池化构建训练数据池，并保留目标用户的测试集数据，所述训练数据池构建包括：

3.1计算目标用户负荷序列和各非目标用户负荷序列的互信息，并按照互信息降序排列非目标用户，互信息计算公式为：

其中，X_z指第z个非目标用户的负荷数据，Y指目标用户的负荷数据，N_o是非目标用户的数量；

3.2将池化用户数k从1依次增加至其上限K，共形成K种池化组合。对于每种池化组合，先引入目标用户的数据，再根据排序结果从最大互信息对应的互联用户开始依次引入数据，直到引入池中的用户数量等于k；

3.3在每种池化组合中，对各池化用户经特征工程处理后的数据划分训练集和测试集，通过合并组内池化用户的训练集分别构建各负荷分量和数值气象预报的训练数据池，将其用于训练LSTM-SAM混合模型；保留目标用户的测试集数据，并将其应用于模型测试阶段，最佳池化用户个数通过比较测试集基于不同池化组合的误差指标获取。

进一步地，步骤(4)将训练数据池和目标用户的测试集数据输入LSTM-SAM混合模型，分别进行训练和预测，获取各负荷分量的预测值并将其相加，输出目标用户待预测时刻的日前负荷预测结果及最佳池化用户个数，所述LSTM-SAM混合模型为：

4.1将LSTM模型作为混合模型的基础，LSTM模型中具体计算过程如下，假设LSTM的时间步数为T_s：

f_p＝σ(W_fx_p+V_fh_p-1+b_f)

C′_p＝tanh(W_cx_p+V_ch_p-1+b_c)

i_p＝σ(W_ix_p+V_ih_p-1+b_i)

C_p＝C_p-1⊙f_p+i_p⊙C′_p

O_p＝σ(W_ox_p+V_oh_p-1+b_o)

h_p＝O_p⊙tanh(C_p)

其中，p＝1,2,…,T_s，p为LSTM内时间步的序号；x_p为对应时间步p的输入；h_p-1为对应时间步p-1的隐藏状态；f_p，i_p和O_p分别为对应时间步p的遗忘门输出、输入门输出和输出门输出；C′_p为对应时间步p的记忆单元候选值；C_p为对应时间步p的记忆单元状态，h_p为对应时间步p的隐藏状态；V_f，V_c，V_i和V_o分别为LSTM遗忘门、候选值、输入门和输出门的递归权重；W_f，W_c，W_i和W_o分别表示遗忘门、候选值、输入门和输出门的权重矩阵；b_f，b_c，b_i和b_o分别表示LSTM中遗忘门、候选值、输入门和输出门的偏置；σ(·)代表sigmoid激活函数，输出介于0和1之间，0表示将信息完全遗忘，1表示将信息全部保留；tanh(·)代表双曲正切激活函数；⊙代表逐点相乘；

4.2引入SAM，帮助LSTM识别输入重要性，SAM具体计算过程如下：

假设隐藏特征维度为m，计算不同时间步的隐藏特征相关性，则隐藏特征第d维第j个时间步的得分为：

s_j,d＝f_sco(W_j,d[h_1d,h_2d,…,h_Tsd]),d＝1,…,m,j＝1,…T_s

其中，h_jd为第d维第j个时间步的隐藏特征值；W_j,d为对应第d维第j个时间步得分的权重向量，在训练阶段学习；函数fsco(·)为得分函数；j为LSTM内时间步的序号；T_s为LSTM的时间步数；d为隐藏特征维度的序号；

通过使用Softmax函数进行归一化，获取和为1的特定维度得分：

其中，

是隐藏特征第d维第j个时间步的归一化得分；k为LSTM内时间步的序号；T_s为LSTM的时间步数；exp(·)为以e为底的指数函数；

平均各时间步上所有维度的归一化得分，分别获取对应时间步的权重，将隐藏特征向量与权重相乘，并将加权结果作为后续层的输入：

其中，α_j是对应第j个时间步的权重；h_j是隐藏特征第j个时间步的向量；

是隐藏特征第j个时间步的加权向量；

4.3基于LSTM和SAM构建具有两个输入通道的混合模型，模型包含LSTM层、注意层、concatenate层和Dense层；LSTM层分别用于提取负荷分量中隐藏的时间相关性特征以及提取考虑气象因素后的高级特征；注意力层用于加权隐藏特征，其输出结果与数值气象预报在concatenate层进行融合，并将融合结果输入后续层；经过两Dense层输出各负荷分量对应的预测结果，将其相加获取每个池化组合对应的居民负荷预测结果，并比较各池化组合下的测试集误差指标输出最佳池化用户个数。

有益效果：与现有技术相比，本发明的技术方案基于目标用户和其互联用户的历史负荷数据和数值气象预报数据，采用二阶段特征工程对数据进行预处理，经池化构建不同池化组合及相应的训练数据池，输入LSTM-SAM混合模型，对目标用户的负荷数据进行预测，提高了居民负荷的预测精度，为***调度和需求响应实施提供指导，保障了电力***的安全稳定经济运行。

附图说明

图1为本发明基于LSTM-SAM模型和池化的居民负荷预测方法的流程示意图。

图2为本发明负荷分量输入维度重构的示意图。

图3为本发明基于池化构建训练数据池的流程图。

图4为本发明采用的LSTM-SAM混合模型结构示意图。

图5为本发明实施例中采用所提方法的最终预测结果展示图。

具体实施方式

下面结合具体实施例，进一步阐明本发明，应理解这些实施例仅用于说明本发明而不用于限制本发明的范围，在阅读了本发明之后，本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。

本发明提供了基于LSTM-SAM模型和池化的居民负荷预测方法，如图1所示，该方法包括以下步骤：

(2)采用二阶段特征工程对每个用户的数据进行预处理；

下面结合具体实施例，详细说明使用本发明中的方法进行居民负荷预测的具体实施过程。以江苏某地区的居民负荷和气象站预报数据为例，按1小时的采样频率获取从2017年8月至2018年7月某27个用户的负荷数据和125个气象站的气象预报数据，为每个用户选择与之最近的气象站，获取气象变量，包括温度、相对湿度和风速，并将历史负荷数据和各气象变量作为模型输入。为测试模型泛化能力，将每月最后七天的数据作为测试集，其余数据作为训练集，提前一天预测居民负荷，所用预测误差评价指标为平均绝对百分比误差MAPE，平均绝对误差MAE和均方根误差RMSE。具体实施步骤如下：

步骤(2)采用二阶段特征工程对每个用户的数据进行预处理，所述二阶段特征工程方法为：

2.1历史负荷序列分解阶段，采用变分模态分解算法将观测到的负荷序列分解为趋势分量、周期分量和不确定性分量，分别对各历史负荷分量进行后续数据预处理；

2.2多源输入维度重构阶段，分别对负荷分量和数值气象预测数据采用不同方法重构输入维度，具体方法如下：

2.2.1负荷分量输入维度重构方法：

假设待预测时刻为t，从第i个历史负荷分量中取一段固定长度的连续滞后负荷值，如下式所示，本方法设置连续滞后负荷值数量的取值为24的整数倍，其上限为168：

其中，T是转置；

为待预测时刻t第i个负荷分量对应的滞后负荷时间序列；

是第i个负荷分量在时刻r的值，r＝t-h-lag+1,t-h-lag+2,…,t-h；i是负荷分量的序号；lag是连续滞后负荷的数量；h是预测时间步长，本发明针对日前负荷预测，故h取24；

利用滑动窗口获取负荷数据，将获取的数据作为输入至LSTM网络一个时间步的特征向量，以一步为间隔连续滑动，获取输入至LSTM网络相邻时间步的特征向量，设置滑动窗口长度的取值为24的整数倍，其上限为144，则第j个滑动窗口获取的向量为：

j＝1,2,…,T₀

其中，T是转置；

为第i个负荷分量在时刻q的值，q＝t-h-lag+j,t-h-lag+j+1,…,t-h-lag+j+n-1；j为滑动窗口的序号；n是滑动窗口的宽度；T₀是滑动窗口的总数量，T₀由连续滞后负荷的数量和滑动窗口的宽度决定，经计算其值为25、49、73、97、121和145：

T₀＝lag+1-n

其中，T是转置；

负荷分量输入维度重构的示意图如图2所示。经负荷分量输入维度重构后，得到21种可能的输入形式，每种输入形式中，滞后负荷值数量、时间步数及输入特征维度间的对应关系如表1所示；本方法在不同输入形式下的居民负荷预测误差如表2所示，从表2可以看出，不论在哪一种池化组合下，本方法的预测精度随输入形式变化而变化，在同一池化组合、相同滞后负荷值数量下，通常具有适中时间步数和适中输入特征维度的预测精度更高，本方法当历史负荷分量输入形式为72历史负荷值、49时间步数和24输入特征维度时，其预测误差最小。

表1滞后负荷值数量、时间步数及输入特征维度之间的对应关系

2.2.2数值气象预报输入维度重构方法：

步骤(3)对非目标用户进行排序，选择不同数量的非目标用户为互联用户，与目标用户共同构成不同的池化组合，基于池化构建训练数据池，并保留目标用户的测试集数据，具体步骤的流程图如图3所示；本方法从27个居民用户中随机选择一个用户作为目标用户，其余用户为非目标用户；考虑到计算效率，设置池化用户数上限K为5，具体实际步骤包括：

3.1计算目标用户负荷序列和各非目标用户负荷序列的互信息，并按照互信息降序排列非目标用户，鉴于池化用户数上限为5，本方法实施过程中仅需考虑前4个最相关的互联用户，其与目标用户的互信息数值分别为0.855，0.835，0.832和0.830；

3.2将池化用户数k从1依次增加至上限5，共可形成5种池化组合。对于每种池化组合，先引入目标用户的数据，再根据排序结果从最大互信息对应的互联用户开始依次引入数据，直到引入池中的用户数量等于k；

3.3在每种池化组合中，对各池化用户经特征工程处理后的数据划分训练集和测试集，将每月最后7天的数据作为测试集，其余数据作为训练集；通过沿样本维度合并组内池化用户的训练集分别构建各负荷分量和数值气象预报的训练数据池，将其用于训练LSTM-SAM混合模型；保留目标用户的测试集数据，并将其应用于模型测试阶段，最佳池化用户个数为测试集预测误差最小的池化组合用户数量。

本方法基于不同池化组合的预测结果如表2所示，从表2可以看出池化用户数量将影响预测精度，综合对比所有池化组合的误差指标，四个池化用户构成的组合的预测效果最好。

表2基于不同输入形式和不同池化组合的预测结果

步骤(4)将训练数据池和目标用户的测试集数据输入LSTM-SAM混合模型，分别进行训练和预测，获取各负荷分量的预测值并将其相加，输出目标用户待预测时刻的日前负荷预测结果及最佳池化用户个数，所述LSTM-SAM混合模型为：

4.1将LSTM模型作为混合模型的基础，LSTM模型中具体计算过程如下，假设LSTM的时间步数为T_s，由LSTM输入中的时间步数决定，即T_s＝T₀：

f_p＝σ(W_fx_p+V_fh_p-1+b_f)

C′_p＝tanh(W_cx_p+V_ch_p-1+b_c)

i_p＝σ(W_ix_p+V_ih_p-1+b_i)

C_p＝C_p-1⊙f_p+i_p⊙C′_p

O_p＝σ(W_ox_p+V_oh_p-1+b_o)

h_p＝O_p⊙tanh(C_p)

4.2引入SAM，帮助LSTM识别输入重要性，SAM具体计算过程如下：

d＝1,…,m,j＝1,…T_s

其中，h_jd为第d维第j个时间步的隐藏特征值；W_j,d为对应第d维第j个时间步得分的权重向量，在训练阶段可学习；j为LSTM内时间步的序号；T_s为LSTM的时间步数；d为隐藏特征维度的序号；得分函数fsco(·)通过全连接层实现，其网络神经元数量等于LSTM网络的时间步数量；

其中，

是隐藏特征第j个时间步的加权向量；

4.3基于LSTM和SAM构建具有两个输入通道的混合模型，其中，LSTM-SAM混合模型结构如图4所示：该模型由两个LSTM层，一个注意力层，一个concatenate层和两个Dense层组成，其中，SAM位于注意力层；该模型具有两个输入通道，历史负荷分量的输入通道位于第一个LSTM层，数值气象预报数据的输入通道位于concatenate层；第一个LSTM层从负荷分量中提取时间相关性，将所提隐藏特征输入注意力层，经SAM加权后输入至concatenate层，加权隐藏特征与数值气象预报在concatenate层进行融合，并将其输入第二个LSTM层，用于提取更加抽象的特征，经过两Dense层输出各负荷分量所对应的预测结果，将其相加获取每个池化组合对应的居民负荷预测结果，且根据表2中误差指标对比结果可知，本方法的最佳池化用户个数为4。将待预测时刻负荷的预测值与真实值进行比较，计算误差指标MAPE、MAE和RMSE，公式分别如下：

其中，l_e和

分别为负荷的真实值和预测值；n_test为测试样本数；

此外，本发明提出的基于LSTM-SAM模型和池化的居民负荷预测方法选取基于ARIMA、SVR、ANN以及普通LSTM的负荷预测法作为基准预测方法，用于验证本发明所提方法提高预测精度的有效性。不同负荷预测方法进行提前一天预测的误差比较如表3所示，结果表明，不论滞后负荷值数量的多少，本发明所提方法能进一步提高居民负荷预测的准确性。图5给出了本方法基于最佳池化用户组合在不同季节下的日负荷预测曲线以及负荷的真实值曲线，图5(a)、(c)和(d)分别对应春季、秋季和冬季某日的日负荷，可以看出，本发明所提方法的相应曲线较为准确地预测了日负荷的整体趋势以及局部变化，尤其在负荷上升和下降阶段，十分贴近真实值；图5(b)为2018年夏季7月25日负荷的真实值和预测值曲线，由于负荷受温度等气象因素的影响更为显著，导致用电不确定性增加、负荷预测难度加大、所提方法的预测准确度相较其他季节略有下降，但仍然能够预测日负荷的整体变化趋势。综上所述，本发明所提方法较好地拟合了负荷真实值，能较为准确地预测不同季节的居民负荷，具有一定的可行性和实用性。

表3不同负荷预测方法的性能

综上所述，本发明的预测方法可用于预测用户级电力负荷，对电力***调度、能量管理以及需求响应实施起到重要的指导作用。本发明的方法相较于其他基准负荷预测法，利用了通常被忽略的来自互联用户的有用信息，其预测精度得到明显提升，能更准确地预测居民用户负荷，进而为电力***调度提供有价值的参考，有利于保证电网稳定经济运行。

Claims

1.基于LSTM-SAM模型和池化的居民负荷预测方法，其特征在于，包括以下步骤：

(2)采用二阶段特征工程对每个用户的数据进行预处理；

（ 4 ）将训练数据池和目标用户的测试集数据输入LSTM-SAM混合模型，分别进行训练和预测，获取各负荷分量的预测值并将其相加，输出目标用户待预测时刻的日前负荷预测结果及最佳池化用户个数；

所述的步骤(2)中，采用二阶段特征工程对每个用户的数据进行预处理，具体包括如下步骤：

2.1)历史负荷序列分解阶段，采用变分模态分解算法将观测到的负荷序列分解为多个频率分量，分别对各历史负荷分量进行后续数据预处理；

2.2)多源输入维度重构阶段，分别对负荷分量和数值气象预报数据采用不同方法重构输入维度；

所述的步骤2.2)的具体方法如下：

2.2.1)负荷分量输入维度重构方法：

其中，T是转置；

为待预测时刻t第i个负荷分量对应的滞后负荷时间序列；

其中，T是转置；

T₀＝lag+1-n

其中，T是转置；

2.2.2)数值气象预报输入维度重构方法：

其中，NWP_t为维度重构后待预测时刻t对应的数值气象预报特征，其大小为T₀×3，T₀是滑动窗口总数量；T_t、H_t和W_t分别指预测时刻t的温度、湿度和风速；

2.根据权利要求1所述的基于LSTM-SAM模型和池化的居民负荷预测方法，其特征在于，所述的步骤(3)中，所述的基于池化构建训练数据池包括：

3.1)计算目标用户负荷序列和各非目标用户负荷序列的互信息，并按照互信息降序排列非目标用户，互信息计算公式为：

3.2)将池化用户数k从1依次增加至其上限K，共形成K种池化组合；对于每种池化组合，先引入目标用户的数据，再根据排序结果从最大互信息对应的互联用户开始依次引入数据，直到引入池中的用户数量等于k；

3.3)在每种池化组合中，对各池化用户经特征工程处理后的数据划分训练集和测试集，通过合并组内池化用户的训练集分别构建各负荷分量和数值气象预报的训练数据池，将其用于训练LSTM-SAM混合模型；保留目标用户的测试集数据，并将其应用于模型测试阶段，最佳池化用户个数通过比较测试集基于不同池化组合的误差指标获取。

3.根据权利要求2所述的基于LSTM-SAM模型和池化的居民负荷预测方法，其特征在于，所述的步骤(4)中，所述的LSTM-SAM混合模型为：

4.1)将LSTM模型作为混合模型的基础，LSTM模型中具体计算过程如下，假设LSTM的时间步数为T_s：

f_p＝σ(W_fx_p+V_fh_p-1+b_f)

C′_p＝tanh(W_cx_p+V_ch_p-1+b_c)

i_p＝σ(W_ix_p+V_ih_p-1+b_i)

C_p＝C_p-1⊙f_p+i_p⊙C′_p

O_p＝σ(W_ox_p+V_oh_p-1+b_o)

h_p＝O_p⊙tanh(C_p)

其中，p＝1,2,…,T_s，p为LSTM内时间步的序号；x_p为对应时间步p的输入；h_p-1为对应时间步p-1的隐藏状态；f_p，i_p和O_p分别为对应时间步p的遗忘门输出、输入门输出和输出门输出；C’_p为对应时间步p的记忆单元候选值；C_p为对应时间步p的记忆单元状态，h_p为对应时间步p的隐藏状态；V_f，V_c，V_i和V_o分别为LSTM遗忘门、候选值、输入门和输出门的递归权重；W_f，W_c，W_i和W_o分别表示遗忘门、候选值、输入门和输出门的权重矩阵；b_f，b_c，b_i和b_o分别表示LSTM中遗忘门、候选值、输入门和输出门的偏置；σ(·)代表sigmoid激活函数，输出介于0和1之间，0表示将信息完全遗忘，1表示将信息全部保留；tanh(·)代表双曲正切激活函数；⊙代表逐点相乘；

4.2)引入自注意力机制(SAM)，帮助LSTM识别输入重要性，SAM具体计算过程如下：

s_j,d＝f_sco(W_j,d[h_1d,h_2d,…,h_Tsd]),d＝1,…,m,j＝1,…T_s

其中，

是隐藏特征第j个时间步的加权向量；

4.3)基于LSTM和SAM构建具有两个输入通道的混合模型，模型包含LSTM层、注意层、concatenate层和Dense层；LSTM层分别用于提取负荷分量中隐藏的时间相关性特征以及提取考虑气象因素后的高级特征；注意力层用于加权隐藏特征，其输出结果与数值气象预报数据在concatenate层进行融合，并将融合结果输入后续层；经过两Dense层输出各负荷分量对应的预测结果，将其相加获取每个池化组合对应的居民负荷预测结果，并比较各池化组合下的测试集误差指标输出最佳池化用户个数。