CN117114438A

CN117114438A - 一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法

Info

Publication number: CN117114438A
Application number: CN202311016643.0A
Authority: CN
Inventors: 余涵菲; 黄世芳; 钟凡; 张小松
Original assignee: Southeast University
Current assignee: Southeast University
Priority date: 2023-08-14
Filing date: 2023-08-14
Publication date: 2023-11-24

Abstract

本发明公开了一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法，包括：建立基于注意力机制的神经网络模型，利用预处理后的历史负荷数据、历史气象数据及时间纬度特征数据进行训练；对训练好的模型进行评估；利用评估后模型对负荷数据进行预测，进行可解释性分析；本发明方法仅需输入历史相关信息，实现了高精度的负荷预测，通过注意力系数分布热力图，实现了对模型可解释性分析；与传统负荷预测相比，该方法建立了更加灵活的模型结构，提高了预测精度，具有可解释性，可推动模型预测控制技术的实际应用，为建筑能源***的全局优化与储能用能***的多阶段决策提供基础，可解释性分析也将帮助能源管理人员理解和信任底层模型。

Description

一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法

技术领域

本发明涉及建筑负荷预测技术，具体涉及一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法。

背景技术

随着生活水平的提高，人民对舒适健康环境的需求愈加迫切，而建筑环境的营造需要消耗大量能源，这就造成了建筑碳排放和人居环境需求两者之间的突出矛盾。建筑区域能源***是解决上述矛盾的重要途经。通过对城市建筑能源体系的优化集成和可再生能源的规模化应用，实现低品位冷热源的提质增效、冷热输配以及存储，满足建筑终端的冷、热等各项需求。建筑区域能源具有减少碳基能源消耗、提升能源利用效率、改善建筑电气化水平三大优势，是***环境署和国际能源机构推荐的低碳能源***方案。

由于可再生能源的不稳定性、用能和储能设备的多样性以及用户侧能源消耗的不确定性，建筑区域能源***的控制面临着前所未有的困难，而对供热和制冷负荷的高精度预测是解决这一问题的有效方法。对下一小时的预测可用于实现用能***的全局运行优化，而对未来24～48小时的预测可用于规划储能设备和负荷转移。负荷特性方面，由用户行为驱动的单体建筑的负荷模式往往波动明显，而区域多体建筑则显示出更有规律的运作模式；运行调控方面，以区域建筑作为能源调控平台的单位所需的控制成本更低，可调资源更多，调节范围更大。然而，当前大多数的预测研究都集中在单个建筑上，对区域级别的建筑负荷预测的缺乏使得自上而下的城市能源管理困难重重。负荷预测常使用物理模型和数据驱动模型，然而基于热力学定律的物理模型对于涉及多个建筑物的大规模模拟来说过于复杂，而数据驱动模型在非线性和动态行为模拟上的高精度表现则获得了越来越多的关注。随着预测对象的复杂程度增高，数据驱动模型的结构日趋庞大，对数据数量和质量的要求不断提升，而其抽象的计算机制使其难以理解和解释，导致预测结果难以令人信服。针对建筑区域能源***负荷预测的上述困难，一个可以同时满足高预测精度，高应用灵活性和可解释性的数据驱动模型是迫切需要的。

发明内容

发明目的：本发明的目的是提供一种高预测精度，高应用灵活性和具有可解释性的建筑区域能源***冷热负荷数据驱动预测方法。

技术方案：本发明的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法，包括以下步骤：

建立基于注意力机制的神经网络模型，并利用预处理后的历史负荷数据、历史气象数据以及时间纬度特征数据集进行训练；对训练好的模型进行评估；利用评估后模型对负荷数据进行预测，并进行可解释性分析；

其中基于注意力机制的神经网络模型利用了编码器-解码器的模型架构，建立模型的过程包括：采用多步长输入-多步长输出的预测策略，利用了滑动窗口实现对任意需求步长的输入区间和输出区间的组合，并引入注意力机制；根据每个编码器隐层状态与当前解码器隐层状态的相关性来计算注意力权重；计算上下文向量作为编码器隐藏状态的加权和，模型输出由上下文向量和当前解码器隐层状态计算得出；

可解释性分析包括：利用评估后模型对负荷数据进行预测，输出预测结果，并导出注意力机制生成的注意力系数矩阵，根据注意力系数矩阵的权重分布，生成热力图，并分析研究对象的负荷变化特征和应用模型的适应性。

进一步的，历史负荷数据为历史热负荷数据或历史冷负荷数据；历史气象数据包括室外干球温度、室外相对湿度、室外露点温度、风速、风向、云量、大气压多种历史气象参数；时间纬度特征包括月份、日属性、小时数。

进一步的，对建筑区域能源***的负荷数据提取应以建筑群整体为目标设定测点，在条件允许时，在能源***总供冷/热水管干管处设置热量表，以避免对单栋建筑逐一测量造成的测量困难和误差累积；对气象站的选取应采用就近原则，以保证气象站气象参数与研究对象的一致性。

进一步的，数据预处理包括对原始数据时间单位的统一，对数据异常值、缺失值和空值的处理，数据归一化，以及对所有考虑的输入变量通过特征工程进行筛选；

其中，特征工程通过皮尔逊相关技术计算其他变量X和负荷变量Y之间的相关性，计算公式为：

其中，X_i是其他变量的真实值，Y_i是负荷变量的真实值，和/>分别是X和Y的平均值，N是负荷数据的数量；相关性系数的值将介于-1与1之间，当|r|>0.8时，负荷变量和其他变量之间被认为是强相关，而|r|<0.2表示弱相关，|r|＝0则无关；将|r|<0.2的其他变量剔除后，即获得了最终有效的输入变量；并划分训练集和测试集。

进一步的，注意力机制采用Luong注意力，其计算方法为：

首先，根据每个编码器隐层状态h_i与当前解码器隐层状态h_j的相关性来计算注意力权重a_ji，其中，/> 为h_j的转置，i＝1,…,s，j＝1,…,t，s为输入总步长数，t为输出总步长数；

然后，使用softmax函数计算上下文向量cv_j；

最终输出的预测值由cv_j和h_j计算得出。

进一步的，模型评估指标包括：

与尺度相关的指标，包括平均绝对误差MAE、均方误差MSE和均方根误差RMSE；

与尺度无关的指标，即均方根误差变异系数CV-RMSE，当使用小时数据时，若其值低于30％，则该模型在物理工程中具有实际意义；

拟合度R²，其值越高，表明模型与数据之间的对应关系越精确；

计算公式为：

其中，y_j是负荷数据真实值，是负荷数据预测值，/>是负荷数据真实值的平均值，t是输出预测负荷数据的数量。

进一步的，模型训练达到最佳预测精度前，需要对模型超参数调试，需要优化的超参数包括hidden units、batch size、learning rate、patience、dropout，其中后二者用于防止模型过拟合。

基于相同的发明构思，本发明的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测***，包括：

数据处理单元，用于对采集的历史负荷数据、历史气象数据以及时间纬度特征数据集进行预处理；

模型构建及训练单元，构建基于注意力机制的神经网络模型，并利用预处理后的历史负荷数据、历史气象数据以及时间纬度特征数据集进行训练；

模型评估单元，用于对训练好的模型进行评估；

以及预测及分析单元，用于利用评估后模型对负荷数据进行预测，并进行可解释性分析；

基于相同的发明构思，本发明的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测设备，所述设备中存储有训练好的并经过评估后的基于注意力机制的神经网络模型，用于对负荷数据进行预测，并进行可解释性分析；其中基于注意力机制的神经网络模型利用了编码器-解码器的模型架构，建立模型的过程包括：采用多步长输入-多步长输出的预测策略，利用了滑动窗口实现对任意需求步长的输入区间和输出区间的组合，并引入注意力机制；根据每个编码器隐层状态与当前解码器隐层状态的相关性来计算注意力权重；计算上下文向量作为编码器隐藏状态的加权和，模型输出由上下文向量和当前解码器隐层状态计算得出；可解释性分析包括：利用评估后模型对负荷数据进行预测，输出预测结果，并导出注意力机制生成的注意力系数矩阵，根据注意力系数矩阵的权重分布，生成热力图，并分析研究对象的负荷变化特征和应用模型的适应性。

基于相同的发明构思，本发明的一种电子设备，所述设备包括：

存储有可执行程序代码的存储器；

与所述存储器耦合的处理器；

所述处理器调用所述存储器中存储的所述可执行程序代码，执行如上述的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法。

有益效果：本发明与现有技术相比，具有以下优点：

(1)本发明针对建筑区域能源***整体进行冷热负荷预测，属于对多类负荷、多体建筑、多建筑类型的预测，补充了现有研究对区域级别建筑群体能耗分析的不足，为自上而下的城市能源管理提供规划和优化依据。

(2)本发明利用多步长输入-多步长输出的预测策略，仅需要输入历史变量信息即可实现对需求时长预测结果的同时输出，该策略可以灵活满足不同输入信息和不同输出需求组合构建的多种应用场景，如管理用能设备的实时预测和调度储能设备的提前规划，而传统预测方法通常无法实现对多步长预测结果的同时输出，或者需要天气预报数据滚动输入，因此本发明方法的对象适应性更好。

(3)本发明在神经网络模型的基础上引入注意力机制，可以有效提高预测精度，同时由注意力系数分布得到的热力图能便于模型使用者理解建筑负荷变化特性，比较不同神经网络模型的适应性和预测特性，因此本发明的基于注意力机制的神经网络模型具有较高的预测精度和可解释性。

附图说明

图1是本发明的流程图示意图；

图2是本发明建立的基于注意力机制的神经网络模型框架示意图；

图3是输入48小时预测未来24小时负荷的注意力系数分布热力图；其中，(a)为冷负荷-LSTM的注意力系数分布图，(b)为热负荷-LSTM的注意力系数分布图，(c)为冷负荷-GRU的注意力系数分布图，(d)为热负荷-GRU的注意力系数分布图；

图4是输入24小时预测未来24小时负荷的注意力系数分布热力图，其中，(a)为冷负荷-LSTM的注意力系数分布图，(b)为热负荷-LSTM的注意力系数分布图，(c)为冷负荷-GRU的注意力系数分布图，(d)为热负荷-GRU的注意力系数分布图。

具体实施方式

下面结合附图及实施例对本发明作进一步的描述。

如图1所示，本发明的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法，包括以下步骤：

S1、获取原始数据：包括历史负荷数据收集、历史气象数据收集以及时间纬度特征生成；

从应用对象建筑区域能源***和该地区气象站获取负荷相关的影响因素的原始数据，作为后续预测过程中的输入变量；能源***可以收集到建筑内的供冷、供热负荷数据，气象站则存储了如室外干球温度、室外相对湿度、室外露点温度、风速、风向、云量、大气压多种历史气象数据；此外，用于表征人员活动水平的时间变量，如月份、日属性(工作日或休息日)、小时数也应根据实际情况进行考虑作为标签变量，即时间纬度特征。

对建筑区域能源***的负荷提取应以建筑群整体为目标设定测点，如建筑冷热负荷预测，应在条件允许时，在***总供冷/热水管干管处设置热量表，以避免分别对单栋建筑逐一测量造成的测量困难和误差累积；对气象站的选取应采用就近原则，以保证气象站气象参数与研究对象的一致性。

S2、数据预处理：包括对原始数据时间单位的统一，对数据异常值、缺失值和空值的处理，数据归一化，以及对所有考虑的输入变量通过特征工程进行筛选；

数据预处理首先通过求和取平均值的方法将不同原始数据的时间单位统一至小时级别，对数据异常值利用工程经验和专家知识进行剔除，对缺失值和空值通过线性插值法进行补充；

数据归一化采用最大值-最小值归一方法，计算公式为：

其中，y_normaliz+是归一化后的数据；y是各类原始数据；y_min和y_maV分别是各类原始数据中最小值和最大值。

特征工程通过皮尔逊相关技术计算其他变量X和负荷变量Y之间的相关性，计算公式为：

其中，X_i是其他变量的真实值，Y_i是负荷变量的真实值，和/>分别是X和Y的平均值，N是负荷数据的数量；相关性系数的值将介于-1与1之间，当|r|>0.8时，负荷变量和其他变量之间被认为是强相关，而|r|<0.2表示弱相关，|r|＝0则无关；将|r|<0.2的其他变量剔除后，即获得了最终有效的输入变量(包括负荷变量和有效的其他变量)；并划分训练集和测试集。最终80％的数据用于训练，20％的数据用于测试。

S3、建立基于注意力机制的神经网络模型：基于编码器-解码器的模型架构，实施多步长输入-多步长输出的预测策略，利用了滑动窗口实现对任意需求步长的输入区间和输出区间的组合，并在神经网络模型的基础上引入注意力机制；

本发明在编码器-解码器的模型架构上建立了基于注意力机制的神经网络模型，实施多步长输入-多步长输出的预测策略；编码器-解码器的基本思想是利用编码器将输入序列的基本信息捕捉到上下文向量中，然后将上下文向量作为解码器的输入，生成所需的长度的输出序列，编码器-解码器架构的一个优点是能够管理长度可变的输入和输出序列，这使其在处理各种序列到序列任务时更加有效和灵活；在设定了需求的输出步长和可利用的输入步长后，通过滑动窗口实现对任意需求步长的输入区间和输出区间的组合；模型可采用的神经网络模型有RNN，LSTM，GRU等，并在此基础上进行注意力机制的引入；本方法采用的Luong注意力其计算原理如公式(3)～(5)所示，具体步骤如下：

首先，根据每个编码器隐层状态h_i与当前解码器隐层状态h_j的相关性来计算注意力权重a_ji，其中，i＝1,…,s，j＝1,…,t，s为输入总步长数，t为输出总步长数。然后，使用softmax函数计算上下文向量cv_j作为编码器隐藏状态的加权和，最终输出的预测值由cv_j和h_j计算得出。

其中，h_i和h_j分别对应编码器和解码器的隐层状态，a_ji是h_i和h_j对应的注意力权重，cv_j是上下文向量，为h_j的转置。

建立的基于注意力机制的神经网络模型结构如图2所示。图中x₁,x₂,…,x_i,…x_s是不同时刻的输入变量，比如利用过去6小时冷负荷/气象/时间参数，去预测未来12小时的冷负荷，则输入步长s＝6，输出步长t＝12。

多步长输入-多步长输出的预测策略，不同于递归预测策略使用单一模型提前一步进行预测，并将预测值作为下一步预测的输入，也不同于直接预测策略在每个时间步骤的预测中使用不同的模型，而是直接输出需求的多步长预测结果；这种策略避免了递归预测容易出现的误差累积，也避免了直接策略中应用多个独立模型造成的长计算时间，在实际应用中更加灵活，精确。

S4、模型评估：选定误差评估指标后对模型的预测性能进行分析，若误差不满足应用需求，则对模型进行超参数调试，重新进行预测评估，直至预测精度满足需求后，输出预测结果；

模型的预测结果应经过预测指标评估，此处列举三组指标来评估所提出方法的性能：①与尺度相关的指标，包括平均绝对误差(MAE)、均方误差(MSE)和均方根误差(RMSE)，它们反映了预测值与实际值之间的偏差；②与尺度无关的指标，即均方根误差变异系数(CV-RMSE)，当使用小时数据时其值低于30％时，该指标被认为在物理工程中具有实际意义；③拟合度(R²)，其值越高，表明模型与数据之间的对应关系越精确。其计算公式如下：

其中，y_j是负荷数据真实值，是负荷数据预测值，/>是负荷数据平均值，t是输出预测负荷数据的数量。

在模型达到最佳预测精度前，模型应进行超参数调试，本发明方法采用网格搜索法，需要优化的超参数包含hidden units、batch size、learning rate、patience、dropout，其中后二者用于防止模型过拟合。

S5、模型可解释性分析：训练模型达到最优精度后，导出注意力机制生成的注意力系数矩阵，根据注意力系数矩阵的权重分布，生成热力图，并分析研究对象的负荷变化特征和应用模型的适应性；

注意力系数矩阵是一个s×t矩阵，即输入步长数×输出步长数，由注意力权重组成，代表预测过程中分配给每个输入变量的权重。注意力系数矩阵的每一行对应一个输出变量，每一列对应一个输入变量。矩阵中的值表示每个输入在预测相应输出时的重要性。该矩阵可视化为热图，其中每个单元格的颜色与相应输入的重要性相对应。根据注意力系数矩阵的权重分布，对应生成热力图，可以直观体现不同时间输入变量对各个输出步长影响的权重分布，其中深色对应高权重系数，通过归纳分析热力图上权重分布，可以总结出建筑能源***的周期性和热惯性特征；应用不同的神经网络模型，可以对比不同模型对建筑用能的理解模式。因此热力图可以分析研究对象的负荷变化特征和应用模型的适应性。

综上，本发明的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法，预测过程包括：①获取原始数据；②数据预处理；③建立基于注意力机制的神经网络模型；④模型评估；⑤模型可解释性分析；该方法利用了基于注意力机制的神经网络模型，在编码器-解码器的架构下实现了多步长输入-多步长输出的预测策略，仅需输入历史相关信息，即实现了高精度的负荷预测，并通过注意力系数分布热力图，实现了对模型的可解释性分析；与传统的负荷预测相比，该方法建立了更加灵活的模型结构，提高了预测精度，可推动模型预测控制技术的实际应用，为建筑能源***的全局优化与储能用能***的多阶段决策提供基础，可解释性分析也将帮助能源管理人员理解和信任底层模型。

实施例1：

本实施例以武汉市某建筑区域能源***为例，该区域包含六栋建筑，其中五栋为办公建筑，一栋为商业建筑。园区及周边气象站分别记录了长达两年的历史负荷和历史气象数据，共计7327条的小时级冷负荷数据和7081条的小时级热负荷数据。通过特征工程分析，冷负荷预测采用历史冷负荷、干球温度、风速、相对湿度、大气压力、日属性和小时数共七个变量作为输入；热负荷预测采用历史供热负荷、风速、相对湿度、露点温度、日属性、小时数共六个变量作为输入。

实施例针对管理用能设备的实时预测和调度储能设备的提前规划两种预测场景，分别设置了对未来一小时和未来一天的冷热负荷预测情景，下述通过用“输入步长数-输出步长数”的形式简称不同的模拟组合，以对比分析最佳预测精度的实施条件；其中基于注意力机制的模型采用“A-”的前缀表达。

通过表1和表2可以分析得出，在不同的输入间隔长度下，所有模型对提前一小时的预测都表现良好，整体来看LSTM的表现优于GRU。在最佳精度下，制冷负荷预测的CV-RMSE为14.64％，R²为0.973；制热负荷预测的CV-RMSE为12.52％，R²为0.954。

表1 1小时冷负荷预测结果汇总表

表2 1小时热负荷预测结果汇总表

通过表3和表4可以分析得出，除了供热负荷预测中的“24-24”(GRU)组外，所有条件下的CV-RMSE值均低于30％的临界值，这意味着模型具有工程应用价值。由于建筑负荷的变化通常以24小时为周期，因此48小时的输入包含了两个负荷周期，可略微改善预测情况。在制冷和供热负荷预测中，最准确的条件是"48-24"(A-LSTM)，CV-RMSE值分别为26.61％和27.58％。在所有条件下，LSTM的性能都是最好的，从而证明了它在短期预测方面的优势。采用注意力机制后，LSTM和GRU的精确度都提高了约1.00％。GRU在"24-24"供热负荷预测条件下的提升最为明显，CV-RMSE降低了2.01％。48-24"(LSTM)、"24-24"(LSTM)、"48-24"(GRU)和"24-24"(GRU)的平均提升幅度分别为0.58％、0.89％、0.68％和1.55％。在"24-24"条件下，由于输入历史长度较短，相关信息学习较少，从而放大了注意力机制的效果，因此各组的改进尤为明显。

表3 24小时冷负荷预测结果汇总表

表4 24小时热负荷预测结果汇总表

对应最优预测工况的超参数调试过程如表5：

表5超参数汇总表

导出注意力系数后，生成系数分布热力图如图3中(a)至(d)以及图4中(a)至(d)所示。对A-LSTM模型和A-GRU模型进行比较后发现，A-GRU模型的注意力权重分布更为集中，较高的权重主要出现在每个周期的前六个小时。这种分布差异凸显了A-LSTM模型和A-GRU模型对负荷模式的不同适应性。LSTM对不同时间步长的历史信息的关注相对均衡，这有助于它更好地捕捉长期依赖关系和时间序列中的复杂模式，从而实现更高的预测精度。通过分析热图，我们可以了解建筑物与负荷之间的内在联系是如何通过关注权重的分布来描述的。两个关键如下：1)负荷周期性：在图3中，所有实例的第23至26个输入小时都有明显的分界线，分界线所划分的两个区块内的关注权重分布相似。这表明负荷模式具有周期性。同时，A-LSTM模型对制冷负荷的预测显示，高权重值从左上方到右下方呈明显的对角线分布。这代表了历史上某个指定点的负荷与预测区间内该点对应的负荷之间的周期关系；2)建筑物热惯性：无论是在图3所示的两个相似区块中，还是在图4所示的整个热图中，右上角的权重在所有情况下都是最高的。这种模式表明，对未来几小时的预测主要受前几小时负荷的影响，这反映了建筑物的热惯性。可以看出，前4～5小时的负荷会对接下来2～3小时的负荷产生明显影响。热惯性的特征对储能设备的管理具有重要意义。

基于相同的发明构思，本发明实施例提供的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测***，包括：

模型评估单元，用于对训练好的模型进行评估；

基于相同的发明构思，本发明实施例提供的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测设备，所述设备中存储有训练好的并经过评估后的基于注意力机制的神经网络模型，用于对负荷数据进行预测，并进行可解释性分析；其中基于注意力机制的神经网络模型利用了编码器-解码器的模型架构，建立模型的过程包括：采用多步长输入-多步长输出的预测策略，利用了滑动窗口实现对任意需求步长的输入区间和输出区间的组合，并引入注意力机制；根据每个编码器隐层状态与当前解码器隐层状态的相关性来计算注意力权重；计算上下文向量作为编码器隐藏状态的加权和，模型输出由上下文向量和当前解码器隐层状态计算得出；可解释性分析包括：利用评估后模型对负荷数据进行预测，输出预测结果，并导出注意力机制生成的注意力系数矩阵，根据注意力系数矩阵的权重分布，生成热力图，并分析研究对象的负荷变化特征和应用模型的适应性。

基于相同的发明构思，本发明实施例提供的一种电子设备，所述设备包括：

存储有可执行程序代码的存储器；

与所述存储器耦合的处理器；

上述实施例仅是本发明的优选实施方式，应当指出：对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和等同替换，这些对本发明权利要求进行改进和等同替换后的技术方案，均落入本发明的保护范围。

Claims

1.一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法，其特征在于，历史负荷数据为历史热负荷数据或历史冷负荷数据；历史气象数据包括室外干球温度、室外相对湿度、室外露点温度、风速、风向、云量、大气压多种历史气象参数；时间纬度特征包括月份、日属性、小时数。

3.根据权利要求1所述的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法，其特征在于，对建筑区域能源***的负荷数据提取应以建筑群整体为目标设定测点，在条件允许时，在能源***总供冷/热水管干管处设置热量表，以避免对单栋建筑逐一测量造成的测量困难和误差累积；对气象站的选取应采用就近原则，以保证气象站气象参数与研究对象的一致性。

4.根据权利要求1所述的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法，其特征在于，数据预处理包括对原始数据时间单位的统一，对数据异常值、缺失值和空值的处理，数据归一化，以及对所有考虑的输入变量通过特征工程进行筛选；

5.根据权利要求1所述的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法，其特征在于，注意力机制采用Luong注意力，其计算方法为：

然后，使用softmax函数计算上下文向量cv_j；

最终输出的预测值由cv_j和h_j计算得出。

6.根据权利要求1所述的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法，其特征在于，模型评估指标包括：

计算公式为：

7.根据权利要求1所述的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法，其特征在于，模型训练达到最佳预测精度前，需要对模型超参数调试，需要优化的超参数包括hidden units、batch size、learning rate、patience、dropout，其中后二者用于防止模型过拟合。

8.一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测***，其特征在于，包括：

模型评估单元，用于对训练好的模型进行评估；

9.一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测设备，其特征在于，所述设备中存储有训练好的并经过评估后的基于注意力机制的神经网络模型，用于对负荷数据进行预测，并进行可解释性分析；其中基于注意力机制的神经网络模型利用了编码器-解码器的模型架构，建立模型的过程包括：采用多步长输入-多步长输出的预测策略，利用了滑动窗口实现对任意需求步长的输入区间和输出区间的组合，并引入注意力机制；根据每个编码器隐层状态与当前解码器隐层状态的相关性来计算注意力权重；计算上下文向量作为编码器隐藏状态的加权和，模型输出由上下文向量和当前解码器隐层状态计算得出；可解释性分析包括：利用评估后模型对负荷数据进行预测，输出预测结果，并导出注意力机制生成的注意力系数矩阵，根据注意力系数矩阵的权重分布，生成热力图，并分析研究对象的负荷变化特征和应用模型的适应性。

10.一种电子设备，其特征在于，所述设备包括：

存储有可执行程序代码的存储器；

与所述存储器耦合的处理器；

所述处理器调用所述存储器中存储的所述可执行程序代码，执行如权利要求1-7任一项所述的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法。