CN117114438A - 一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法 - Google Patents
一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法 Download PDFInfo
- Publication number
- CN117114438A CN117114438A CN202311016643.0A CN202311016643A CN117114438A CN 117114438 A CN117114438 A CN 117114438A CN 202311016643 A CN202311016643 A CN 202311016643A CN 117114438 A CN117114438 A CN 117114438A
- Authority
- CN
- China
- Prior art keywords
- model
- load data
- data
- load
- attention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 230000007246 mechanism Effects 0.000 claims abstract description 50
- 238000004458 analytical method Methods 0.000 claims abstract description 30
- 238000003062 neural network model Methods 0.000 claims abstract description 29
- 238000010586 diagram Methods 0.000 claims abstract description 20
- 238000012549 training Methods 0.000 claims abstract description 16
- 239000011159 matrix material Substances 0.000 claims description 24
- 230000008859 change Effects 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 10
- 238000011156 evaluation Methods 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 5
- 238000005259 measurement Methods 0.000 claims description 5
- 230000002159 abnormal effect Effects 0.000 claims description 4
- 238000009825 accumulation Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 230000002596 correlated effect Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 3
- 238000013075 data extraction Methods 0.000 claims description 2
- 238000004146 energy storage Methods 0.000 abstract description 6
- 238000007726 management method Methods 0.000 abstract description 6
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000005457 optimization Methods 0.000 abstract description 3
- 230000000875 corresponding effect Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 238000010438 heat treatment Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000000737 periodic effect Effects 0.000 description 3
- 238000005057 refrigeration Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
- G06Q10/06375—Prediction of business process outcome or impact based on a proposed change
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Entrepreneurship & Innovation (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Primary Health Care (AREA)
- Operations Research (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法,包括:建立基于注意力机制的神经网络模型,利用预处理后的历史负荷数据、历史气象数据及时间纬度特征数据进行训练;对训练好的模型进行评估;利用评估后模型对负荷数据进行预测,进行可解释性分析;本发明方法仅需输入历史相关信息,实现了高精度的负荷预测,通过注意力系数分布热力图,实现了对模型可解释性分析;与传统负荷预测相比,该方法建立了更加灵活的模型结构,提高了预测精度,具有可解释性,可推动模型预测控制技术的实际应用,为建筑能源***的全局优化与储能用能***的多阶段决策提供基础,可解释性分析也将帮助能源管理人员理解和信任底层模型。
Description
技术领域
本发明涉及建筑负荷预测技术,具体涉及一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法。
背景技术
随着生活水平的提高,人民对舒适健康环境的需求愈加迫切,而建筑环境的营造需要消耗大量能源,这就造成了建筑碳排放和人居环境需求两者之间的突出矛盾。建筑区域能源***是解决上述矛盾的重要途经。通过对城市建筑能源体系的优化集成和可再生能源的规模化应用,实现低品位冷热源的提质增效、冷热输配以及存储,满足建筑终端的冷、热等各项需求。建筑区域能源具有减少碳基能源消耗、提升能源利用效率、改善建筑电气化水平三大优势,是***环境署和国际能源机构推荐的低碳能源***方案。
由于可再生能源的不稳定性、用能和储能设备的多样性以及用户侧能源消耗的不确定性,建筑区域能源***的控制面临着前所未有的困难,而对供热和制冷负荷的高精度预测是解决这一问题的有效方法。对下一小时的预测可用于实现用能***的全局运行优化,而对未来24~48小时的预测可用于规划储能设备和负荷转移。负荷特性方面,由用户行为驱动的单体建筑的负荷模式往往波动明显,而区域多体建筑则显示出更有规律的运作模式;运行调控方面,以区域建筑作为能源调控平台的单位所需的控制成本更低,可调资源更多,调节范围更大。然而,当前大多数的预测研究都集中在单个建筑上,对区域级别的建筑负荷预测的缺乏使得自上而下的城市能源管理困难重重。负荷预测常使用物理模型和数据驱动模型,然而基于热力学定律的物理模型对于涉及多个建筑物的大规模模拟来说过于复杂,而数据驱动模型在非线性和动态行为模拟上的高精度表现则获得了越来越多的关注。随着预测对象的复杂程度增高,数据驱动模型的结构日趋庞大,对数据数量和质量的要求不断提升,而其抽象的计算机制使其难以理解和解释,导致预测结果难以令人信服。针对建筑区域能源***负荷预测的上述困难,一个可以同时满足高预测精度,高应用灵活性和可解释性的数据驱动模型是迫切需要的。
发明内容
发明目的:本发明的目的是提供一种高预测精度,高应用灵活性和具有可解释性的建筑区域能源***冷热负荷数据驱动预测方法。
技术方案:本发明的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法,包括以下步骤:
建立基于注意力机制的神经网络模型,并利用预处理后的历史负荷数据、历史气象数据以及时间纬度特征数据集进行训练;对训练好的模型进行评估;利用评估后模型对负荷数据进行预测,并进行可解释性分析;
其中基于注意力机制的神经网络模型利用了编码器-解码器的模型架构,建立模型的过程包括:采用多步长输入-多步长输出的预测策略,利用了滑动窗口实现对任意需求步长的输入区间和输出区间的组合,并引入注意力机制;根据每个编码器隐层状态与当前解码器隐层状态的相关性来计算注意力权重;计算上下文向量作为编码器隐藏状态的加权和,模型输出由上下文向量和当前解码器隐层状态计算得出;
可解释性分析包括:利用评估后模型对负荷数据进行预测,输出预测结果,并导出注意力机制生成的注意力系数矩阵,根据注意力系数矩阵的权重分布,生成热力图,并分析研究对象的负荷变化特征和应用模型的适应性。
进一步的,历史负荷数据为历史热负荷数据或历史冷负荷数据;历史气象数据包括室外干球温度、室外相对湿度、室外露点温度、风速、风向、云量、大气压多种历史气象参数;时间纬度特征包括月份、日属性、小时数。
进一步的,对建筑区域能源***的负荷数据提取应以建筑群整体为目标设定测点,在条件允许时,在能源***总供冷/热水管干管处设置热量表,以避免对单栋建筑逐一测量造成的测量困难和误差累积;对气象站的选取应采用就近原则,以保证气象站气象参数与研究对象的一致性。
进一步的,数据预处理包括对原始数据时间单位的统一,对数据异常值、缺失值和空值的处理,数据归一化,以及对所有考虑的输入变量通过特征工程进行筛选;
其中,特征工程通过皮尔逊相关技术计算其他变量X和负荷变量Y之间的相关性,计算公式为:
其中,Xi是其他变量的真实值,Yi是负荷变量的真实值,和/>分别是X和Y的平均值,N是负荷数据的数量;相关性系数的值将介于-1与1之间,当|r|>0.8时,负荷变量和其他变量之间被认为是强相关,而|r|<0.2表示弱相关,|r|=0则无关;将|r|<0.2的其他变量剔除后,即获得了最终有效的输入变量;并划分训练集和测试集。
进一步的,注意力机制采用Luong注意力,其计算方法为:
首先,根据每个编码器隐层状态hi与当前解码器隐层状态hj的相关性来计算注意力权重aji,其中,/> 为hj的转置,i=1,…,s,j=1,…,t,s为输入总步长数,t为输出总步长数;
然后,使用softmax函数计算上下文向量cvj;
最终输出的预测值由cvj和hj计算得出。
进一步的,模型评估指标包括:
与尺度相关的指标,包括平均绝对误差MAE、均方误差MSE和均方根误差RMSE;
与尺度无关的指标,即均方根误差变异系数CV-RMSE,当使用小时数据时,若其值低于30%,则该模型在物理工程中具有实际意义;
拟合度R2,其值越高,表明模型与数据之间的对应关系越精确;
计算公式为:
其中,yj是负荷数据真实值,是负荷数据预测值,/>是负荷数据真实值的平均值,t是输出预测负荷数据的数量。
进一步的,模型训练达到最佳预测精度前,需要对模型超参数调试,需要优化的超参数包括hidden units、batch size、learning rate、patience、dropout,其中后二者用于防止模型过拟合。
基于相同的发明构思,本发明的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测***,包括:
数据处理单元,用于对采集的历史负荷数据、历史气象数据以及时间纬度特征数据集进行预处理;
模型构建及训练单元,构建基于注意力机制的神经网络模型,并利用预处理后的历史负荷数据、历史气象数据以及时间纬度特征数据集进行训练;
模型评估单元,用于对训练好的模型进行评估;
以及预测及分析单元,用于利用评估后模型对负荷数据进行预测,并进行可解释性分析;
其中基于注意力机制的神经网络模型利用了编码器-解码器的模型架构,建立模型的过程包括:采用多步长输入-多步长输出的预测策略,利用了滑动窗口实现对任意需求步长的输入区间和输出区间的组合,并引入注意力机制;根据每个编码器隐层状态与当前解码器隐层状态的相关性来计算注意力权重;计算上下文向量作为编码器隐藏状态的加权和,模型输出由上下文向量和当前解码器隐层状态计算得出;
可解释性分析包括:利用评估后模型对负荷数据进行预测,输出预测结果,并导出注意力机制生成的注意力系数矩阵,根据注意力系数矩阵的权重分布,生成热力图,并分析研究对象的负荷变化特征和应用模型的适应性。
基于相同的发明构思,本发明的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测设备,所述设备中存储有训练好的并经过评估后的基于注意力机制的神经网络模型,用于对负荷数据进行预测,并进行可解释性分析;其中基于注意力机制的神经网络模型利用了编码器-解码器的模型架构,建立模型的过程包括:采用多步长输入-多步长输出的预测策略,利用了滑动窗口实现对任意需求步长的输入区间和输出区间的组合,并引入注意力机制;根据每个编码器隐层状态与当前解码器隐层状态的相关性来计算注意力权重;计算上下文向量作为编码器隐藏状态的加权和,模型输出由上下文向量和当前解码器隐层状态计算得出;可解释性分析包括:利用评估后模型对负荷数据进行预测,输出预测结果,并导出注意力机制生成的注意力系数矩阵,根据注意力系数矩阵的权重分布,生成热力图,并分析研究对象的负荷变化特征和应用模型的适应性。
基于相同的发明构思,本发明的一种电子设备,所述设备包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行如上述的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法。
有益效果:本发明与现有技术相比,具有以下优点:
(1)本发明针对建筑区域能源***整体进行冷热负荷预测,属于对多类负荷、多体建筑、多建筑类型的预测,补充了现有研究对区域级别建筑群体能耗分析的不足,为自上而下的城市能源管理提供规划和优化依据。
(2)本发明利用多步长输入-多步长输出的预测策略,仅需要输入历史变量信息即可实现对需求时长预测结果的同时输出,该策略可以灵活满足不同输入信息和不同输出需求组合构建的多种应用场景,如管理用能设备的实时预测和调度储能设备的提前规划,而传统预测方法通常无法实现对多步长预测结果的同时输出,或者需要天气预报数据滚动输入,因此本发明方法的对象适应性更好。
(3)本发明在神经网络模型的基础上引入注意力机制,可以有效提高预测精度,同时由注意力系数分布得到的热力图能便于模型使用者理解建筑负荷变化特性,比较不同神经网络模型的适应性和预测特性,因此本发明的基于注意力机制的神经网络模型具有较高的预测精度和可解释性。
附图说明
图1是本发明的流程图示意图;
图2是本发明建立的基于注意力机制的神经网络模型框架示意图;
图3是输入48小时预测未来24小时负荷的注意力系数分布热力图;其中,(a)为冷负荷-LSTM的注意力系数分布图,(b)为热负荷-LSTM的注意力系数分布图,(c)为冷负荷-GRU的注意力系数分布图,(d)为热负荷-GRU的注意力系数分布图;
图4是输入24小时预测未来24小时负荷的注意力系数分布热力图,其中,(a)为冷负荷-LSTM的注意力系数分布图,(b)为热负荷-LSTM的注意力系数分布图,(c)为冷负荷-GRU的注意力系数分布图,(d)为热负荷-GRU的注意力系数分布图。
具体实施方式
下面结合附图及实施例对本发明作进一步的描述。
如图1所示,本发明的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法,包括以下步骤:
S1、获取原始数据:包括历史负荷数据收集、历史气象数据收集以及时间纬度特征生成;
从应用对象建筑区域能源***和该地区气象站获取负荷相关的影响因素的原始数据,作为后续预测过程中的输入变量;能源***可以收集到建筑内的供冷、供热负荷数据,气象站则存储了如室外干球温度、室外相对湿度、室外露点温度、风速、风向、云量、大气压多种历史气象数据;此外,用于表征人员活动水平的时间变量,如月份、日属性(工作日或休息日)、小时数也应根据实际情况进行考虑作为标签变量,即时间纬度特征。
对建筑区域能源***的负荷提取应以建筑群整体为目标设定测点,如建筑冷热负荷预测,应在条件允许时,在***总供冷/热水管干管处设置热量表,以避免分别对单栋建筑逐一测量造成的测量困难和误差累积;对气象站的选取应采用就近原则,以保证气象站气象参数与研究对象的一致性。
S2、数据预处理:包括对原始数据时间单位的统一,对数据异常值、缺失值和空值的处理,数据归一化,以及对所有考虑的输入变量通过特征工程进行筛选;
数据预处理首先通过求和取平均值的方法将不同原始数据的时间单位统一至小时级别,对数据异常值利用工程经验和专家知识进行剔除,对缺失值和空值通过线性插值法进行补充;
数据归一化采用最大值-最小值归一方法,计算公式为:
其中,ynormaliz+是归一化后的数据;y是各类原始数据;ymin和ymaV分别是各类原始数据中最小值和最大值。
特征工程通过皮尔逊相关技术计算其他变量X和负荷变量Y之间的相关性,计算公式为:
其中,Xi是其他变量的真实值,Yi是负荷变量的真实值,和/>分别是X和Y的平均值,N是负荷数据的数量;相关性系数的值将介于-1与1之间,当|r|>0.8时,负荷变量和其他变量之间被认为是强相关,而|r|<0.2表示弱相关,|r|=0则无关;将|r|<0.2的其他变量剔除后,即获得了最终有效的输入变量(包括负荷变量和有效的其他变量);并划分训练集和测试集。最终80%的数据用于训练,20%的数据用于测试。
S3、建立基于注意力机制的神经网络模型:基于编码器-解码器的模型架构,实施多步长输入-多步长输出的预测策略,利用了滑动窗口实现对任意需求步长的输入区间和输出区间的组合,并在神经网络模型的基础上引入注意力机制;
本发明在编码器-解码器的模型架构上建立了基于注意力机制的神经网络模型,实施多步长输入-多步长输出的预测策略;编码器-解码器的基本思想是利用编码器将输入序列的基本信息捕捉到上下文向量中,然后将上下文向量作为解码器的输入,生成所需的长度的输出序列,编码器-解码器架构的一个优点是能够管理长度可变的输入和输出序列,这使其在处理各种序列到序列任务时更加有效和灵活;在设定了需求的输出步长和可利用的输入步长后,通过滑动窗口实现对任意需求步长的输入区间和输出区间的组合;模型可采用的神经网络模型有RNN,LSTM,GRU等,并在此基础上进行注意力机制的引入;本方法采用的Luong注意力其计算原理如公式(3)~(5)所示,具体步骤如下:
首先,根据每个编码器隐层状态hi与当前解码器隐层状态hj的相关性来计算注意力权重aji,其中,i=1,…,s,j=1,…,t,s为输入总步长数,t为输出总步长数。然后,使用softmax函数计算上下文向量cvj作为编码器隐藏状态的加权和,最终输出的预测值由cvj和hj计算得出。
其中,hi和hj分别对应编码器和解码器的隐层状态,aji是hi和hj对应的注意力权重,cvj是上下文向量,为hj的转置。
建立的基于注意力机制的神经网络模型结构如图2所示。图中x1,x2,…,xi,…xs是不同时刻的输入变量,比如利用过去6小时冷负荷/气象/时间参数,去预测未来12小时的冷负荷,则输入步长s=6,输出步长t=12。
多步长输入-多步长输出的预测策略,不同于递归预测策略使用单一模型提前一步进行预测,并将预测值作为下一步预测的输入,也不同于直接预测策略在每个时间步骤的预测中使用不同的模型,而是直接输出需求的多步长预测结果;这种策略避免了递归预测容易出现的误差累积,也避免了直接策略中应用多个独立模型造成的长计算时间,在实际应用中更加灵活,精确。
S4、模型评估:选定误差评估指标后对模型的预测性能进行分析,若误差不满足应用需求,则对模型进行超参数调试,重新进行预测评估,直至预测精度满足需求后,输出预测结果;
模型的预测结果应经过预测指标评估,此处列举三组指标来评估所提出方法的性能:①与尺度相关的指标,包括平均绝对误差(MAE)、均方误差(MSE)和均方根误差(RMSE),它们反映了预测值与实际值之间的偏差;②与尺度无关的指标,即均方根误差变异系数(CV-RMSE),当使用小时数据时其值低于30%时,该指标被认为在物理工程中具有实际意义;③拟合度(R2),其值越高,表明模型与数据之间的对应关系越精确。其计算公式如下:
其中,yj是负荷数据真实值,是负荷数据预测值,/>是负荷数据平均值,t是输出预测负荷数据的数量。
在模型达到最佳预测精度前,模型应进行超参数调试,本发明方法采用网格搜索法,需要优化的超参数包含hidden units、batch size、learning rate、patience、dropout,其中后二者用于防止模型过拟合。
S5、模型可解释性分析:训练模型达到最优精度后,导出注意力机制生成的注意力系数矩阵,根据注意力系数矩阵的权重分布,生成热力图,并分析研究对象的负荷变化特征和应用模型的适应性;
注意力系数矩阵是一个s×t矩阵,即输入步长数×输出步长数,由注意力权重组成,代表预测过程中分配给每个输入变量的权重。注意力系数矩阵的每一行对应一个输出变量,每一列对应一个输入变量。矩阵中的值表示每个输入在预测相应输出时的重要性。该矩阵可视化为热图,其中每个单元格的颜色与相应输入的重要性相对应。根据注意力系数矩阵的权重分布,对应生成热力图,可以直观体现不同时间输入变量对各个输出步长影响的权重分布,其中深色对应高权重系数,通过归纳分析热力图上权重分布,可以总结出建筑能源***的周期性和热惯性特征;应用不同的神经网络模型,可以对比不同模型对建筑用能的理解模式。因此热力图可以分析研究对象的负荷变化特征和应用模型的适应性。
综上,本发明的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法,预测过程包括:①获取原始数据;②数据预处理;③建立基于注意力机制的神经网络模型;④模型评估;⑤模型可解释性分析;该方法利用了基于注意力机制的神经网络模型,在编码器-解码器的架构下实现了多步长输入-多步长输出的预测策略,仅需输入历史相关信息,即实现了高精度的负荷预测,并通过注意力系数分布热力图,实现了对模型的可解释性分析;与传统的负荷预测相比,该方法建立了更加灵活的模型结构,提高了预测精度,可推动模型预测控制技术的实际应用,为建筑能源***的全局优化与储能用能***的多阶段决策提供基础,可解释性分析也将帮助能源管理人员理解和信任底层模型。
实施例1:
本实施例以武汉市某建筑区域能源***为例,该区域包含六栋建筑,其中五栋为办公建筑,一栋为商业建筑。园区及周边气象站分别记录了长达两年的历史负荷和历史气象数据,共计7327条的小时级冷负荷数据和7081条的小时级热负荷数据。通过特征工程分析,冷负荷预测采用历史冷负荷、干球温度、风速、相对湿度、大气压力、日属性和小时数共七个变量作为输入;热负荷预测采用历史供热负荷、风速、相对湿度、露点温度、日属性、小时数共六个变量作为输入。
实施例针对管理用能设备的实时预测和调度储能设备的提前规划两种预测场景,分别设置了对未来一小时和未来一天的冷热负荷预测情景,下述通过用“输入步长数-输出步长数”的形式简称不同的模拟组合,以对比分析最佳预测精度的实施条件;其中基于注意力机制的模型采用“A-”的前缀表达。
通过表1和表2可以分析得出,在不同的输入间隔长度下,所有模型对提前一小时的预测都表现良好,整体来看LSTM的表现优于GRU。在最佳精度下,制冷负荷预测的CV-RMSE为14.64%,R2为0.973;制热负荷预测的CV-RMSE为12.52%,R2为0.954。
表1 1小时冷负荷预测结果汇总表
表2 1小时热负荷预测结果汇总表
通过表3和表4可以分析得出,除了供热负荷预测中的“24-24”(GRU)组外,所有条件下的CV-RMSE值均低于30%的临界值,这意味着模型具有工程应用价值。由于建筑负荷的变化通常以24小时为周期,因此48小时的输入包含了两个负荷周期,可略微改善预测情况。在制冷和供热负荷预测中,最准确的条件是"48-24"(A-LSTM),CV-RMSE值分别为26.61%和27.58%。在所有条件下,LSTM的性能都是最好的,从而证明了它在短期预测方面的优势。采用注意力机制后,LSTM和GRU的精确度都提高了约1.00%。GRU在"24-24"供热负荷预测条件下的提升最为明显,CV-RMSE降低了2.01%。48-24"(LSTM)、"24-24"(LSTM)、"48-24"(GRU)和"24-24"(GRU)的平均提升幅度分别为0.58%、0.89%、0.68%和1.55%。在"24-24"条件下,由于输入历史长度较短,相关信息学习较少,从而放大了注意力机制的效果,因此各组的改进尤为明显。
表3 24小时冷负荷预测结果汇总表
表4 24小时热负荷预测结果汇总表
对应最优预测工况的超参数调试过程如表5:
表5超参数汇总表
导出注意力系数后,生成系数分布热力图如图3中(a)至(d)以及图4中(a)至(d)所示。对A-LSTM模型和A-GRU模型进行比较后发现,A-GRU模型的注意力权重分布更为集中,较高的权重主要出现在每个周期的前六个小时。这种分布差异凸显了A-LSTM模型和A-GRU模型对负荷模式的不同适应性。LSTM对不同时间步长的历史信息的关注相对均衡,这有助于它更好地捕捉长期依赖关系和时间序列中的复杂模式,从而实现更高的预测精度。通过分析热图,我们可以了解建筑物与负荷之间的内在联系是如何通过关注权重的分布来描述的。两个关键如下:1)负荷周期性:在图3中,所有实例的第23至26个输入小时都有明显的分界线,分界线所划分的两个区块内的关注权重分布相似。这表明负荷模式具有周期性。同时,A-LSTM模型对制冷负荷的预测显示,高权重值从左上方到右下方呈明显的对角线分布。这代表了历史上某个指定点的负荷与预测区间内该点对应的负荷之间的周期关系;2)建筑物热惯性:无论是在图3所示的两个相似区块中,还是在图4所示的整个热图中,右上角的权重在所有情况下都是最高的。这种模式表明,对未来几小时的预测主要受前几小时负荷的影响,这反映了建筑物的热惯性。可以看出,前4~5小时的负荷会对接下来2~3小时的负荷产生明显影响。热惯性的特征对储能设备的管理具有重要意义。
基于相同的发明构思,本发明实施例提供的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测***,包括:
数据处理单元,用于对采集的历史负荷数据、历史气象数据以及时间纬度特征数据集进行预处理;
模型构建及训练单元,构建基于注意力机制的神经网络模型,并利用预处理后的历史负荷数据、历史气象数据以及时间纬度特征数据集进行训练;
模型评估单元,用于对训练好的模型进行评估;
以及预测及分析单元,用于利用评估后模型对负荷数据进行预测,并进行可解释性分析;
其中基于注意力机制的神经网络模型利用了编码器-解码器的模型架构,建立模型的过程包括:采用多步长输入-多步长输出的预测策略,利用了滑动窗口实现对任意需求步长的输入区间和输出区间的组合,并引入注意力机制;根据每个编码器隐层状态与当前解码器隐层状态的相关性来计算注意力权重;计算上下文向量作为编码器隐藏状态的加权和,模型输出由上下文向量和当前解码器隐层状态计算得出;
可解释性分析包括:利用评估后模型对负荷数据进行预测,输出预测结果,并导出注意力机制生成的注意力系数矩阵,根据注意力系数矩阵的权重分布,生成热力图,并分析研究对象的负荷变化特征和应用模型的适应性。
基于相同的发明构思,本发明实施例提供的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测设备,所述设备中存储有训练好的并经过评估后的基于注意力机制的神经网络模型,用于对负荷数据进行预测,并进行可解释性分析;其中基于注意力机制的神经网络模型利用了编码器-解码器的模型架构,建立模型的过程包括:采用多步长输入-多步长输出的预测策略,利用了滑动窗口实现对任意需求步长的输入区间和输出区间的组合,并引入注意力机制;根据每个编码器隐层状态与当前解码器隐层状态的相关性来计算注意力权重;计算上下文向量作为编码器隐藏状态的加权和,模型输出由上下文向量和当前解码器隐层状态计算得出;可解释性分析包括:利用评估后模型对负荷数据进行预测,输出预测结果,并导出注意力机制生成的注意力系数矩阵,根据注意力系数矩阵的权重分布,生成热力图,并分析研究对象的负荷变化特征和应用模型的适应性。
基于相同的发明构思,本发明实施例提供的一种电子设备,所述设备包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行如上述的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法。
上述实施例仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和等同替换,这些对本发明权利要求进行改进和等同替换后的技术方案,均落入本发明的保护范围。
Claims (10)
1.一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法,其特征在于,包括以下步骤:
建立基于注意力机制的神经网络模型,并利用预处理后的历史负荷数据、历史气象数据以及时间纬度特征数据集进行训练;对训练好的模型进行评估;利用评估后模型对负荷数据进行预测,并进行可解释性分析;
其中基于注意力机制的神经网络模型利用了编码器-解码器的模型架构,建立模型的过程包括:采用多步长输入-多步长输出的预测策略,利用了滑动窗口实现对任意需求步长的输入区间和输出区间的组合,并引入注意力机制;根据每个编码器隐层状态与当前解码器隐层状态的相关性来计算注意力权重;计算上下文向量作为编码器隐藏状态的加权和,模型输出由上下文向量和当前解码器隐层状态计算得出;
可解释性分析包括:利用评估后模型对负荷数据进行预测,输出预测结果,并导出注意力机制生成的注意力系数矩阵,根据注意力系数矩阵的权重分布,生成热力图,并分析研究对象的负荷变化特征和应用模型的适应性。
2.根据权利要求1所述的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法,其特征在于,历史负荷数据为历史热负荷数据或历史冷负荷数据;历史气象数据包括室外干球温度、室外相对湿度、室外露点温度、风速、风向、云量、大气压多种历史气象参数;时间纬度特征包括月份、日属性、小时数。
3.根据权利要求1所述的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法,其特征在于,对建筑区域能源***的负荷数据提取应以建筑群整体为目标设定测点,在条件允许时,在能源***总供冷/热水管干管处设置热量表,以避免对单栋建筑逐一测量造成的测量困难和误差累积;对气象站的选取应采用就近原则,以保证气象站气象参数与研究对象的一致性。
4.根据权利要求1所述的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法,其特征在于,数据预处理包括对原始数据时间单位的统一,对数据异常值、缺失值和空值的处理,数据归一化,以及对所有考虑的输入变量通过特征工程进行筛选;
其中,特征工程通过皮尔逊相关技术计算其他变量X和负荷变量Y之间的相关性,计算公式为:
其中,Xi是其他变量的真实值,Yi是负荷变量的真实值,和/>分别是X和Y的平均值,N是负荷数据的数量;相关性系数的值将介于-1与1之间,当|r|>0.8时,负荷变量和其他变量之间被认为是强相关,而|r|<0.2表示弱相关,|r|=0则无关;将|r|<0.2的其他变量剔除后,即获得了最终有效的输入变量;并划分训练集和测试集。
5.根据权利要求1所述的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法,其特征在于,注意力机制采用Luong注意力,其计算方法为:
首先,根据每个编码器隐层状态hi与当前解码器隐层状态hj的相关性来计算注意力权重aji,其中,/> 为hj的转置,i=1,…,s,j=1,…,t,s为输入总步长数,t为输出总步长数;
然后,使用softmax函数计算上下文向量cvj;
最终输出的预测值由cvj和hj计算得出。
6.根据权利要求1所述的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法,其特征在于,模型评估指标包括:
与尺度相关的指标,包括平均绝对误差MAE、均方误差MSE和均方根误差RMSE;
与尺度无关的指标,即均方根误差变异系数CV-RMSE,当使用小时数据时,若其值低于30%,则该模型在物理工程中具有实际意义;
拟合度R2,其值越高,表明模型与数据之间的对应关系越精确;
计算公式为:
其中,yj是负荷数据真实值,是负荷数据预测值,/>是负荷数据真实值的平均值,t是输出预测负荷数据的数量。
7.根据权利要求1所述的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法,其特征在于,模型训练达到最佳预测精度前,需要对模型超参数调试,需要优化的超参数包括hidden units、batch size、learning rate、patience、dropout,其中后二者用于防止模型过拟合。
8.一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测***,其特征在于,包括:
数据处理单元,用于对采集的历史负荷数据、历史气象数据以及时间纬度特征数据集进行预处理;
模型构建及训练单元,构建基于注意力机制的神经网络模型,并利用预处理后的历史负荷数据、历史气象数据以及时间纬度特征数据集进行训练;
模型评估单元,用于对训练好的模型进行评估;
以及预测及分析单元,用于利用评估后模型对负荷数据进行预测,并进行可解释性分析;
其中基于注意力机制的神经网络模型利用了编码器-解码器的模型架构,建立模型的过程包括:采用多步长输入-多步长输出的预测策略,利用了滑动窗口实现对任意需求步长的输入区间和输出区间的组合,并引入注意力机制;根据每个编码器隐层状态与当前解码器隐层状态的相关性来计算注意力权重;计算上下文向量作为编码器隐藏状态的加权和,模型输出由上下文向量和当前解码器隐层状态计算得出;
可解释性分析包括:利用评估后模型对负荷数据进行预测,输出预测结果,并导出注意力机制生成的注意力系数矩阵,根据注意力系数矩阵的权重分布,生成热力图,并分析研究对象的负荷变化特征和应用模型的适应性。
9.一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测设备,其特征在于,所述设备中存储有训练好的并经过评估后的基于注意力机制的神经网络模型,用于对负荷数据进行预测,并进行可解释性分析;其中基于注意力机制的神经网络模型利用了编码器-解码器的模型架构,建立模型的过程包括:采用多步长输入-多步长输出的预测策略,利用了滑动窗口实现对任意需求步长的输入区间和输出区间的组合,并引入注意力机制;根据每个编码器隐层状态与当前解码器隐层状态的相关性来计算注意力权重;计算上下文向量作为编码器隐藏状态的加权和,模型输出由上下文向量和当前解码器隐层状态计算得出;可解释性分析包括:利用评估后模型对负荷数据进行预测,输出预测结果,并导出注意力机制生成的注意力系数矩阵,根据注意力系数矩阵的权重分布,生成热力图,并分析研究对象的负荷变化特征和应用模型的适应性。
10.一种电子设备,其特征在于,所述设备包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行如权利要求1-7任一项所述的一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311016643.0A CN117114438A (zh) | 2023-08-14 | 2023-08-14 | 一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311016643.0A CN117114438A (zh) | 2023-08-14 | 2023-08-14 | 一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117114438A true CN117114438A (zh) | 2023-11-24 |
Family
ID=88806784
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311016643.0A Pending CN117114438A (zh) | 2023-08-14 | 2023-08-14 | 一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117114438A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118131642A (zh) * | 2024-04-30 | 2024-06-04 | 北京华清鼎立物业管理有限公司 | 冷热源水***的控制方法和装置、存储介质、电子装置 |
-
2023
- 2023-08-14 CN CN202311016643.0A patent/CN117114438A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118131642A (zh) * | 2024-04-30 | 2024-06-04 | 北京华清鼎立物业管理有限公司 | 冷热源水***的控制方法和装置、存储介质、电子装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113962364B (zh) | 一种基于深度学习的多因素用电负荷预测方法 | |
Ye et al. | Predicting electricity consumption in a building using an optimized back-propagation and Levenberg–Marquardt back-propagation neural network: Case study of a shopping mall in China | |
Amasyali et al. | A review of data-driven building energy consumption prediction studies | |
US20150317589A1 (en) | Forecasting system using machine learning and ensemble methods | |
CN112149890A (zh) | 基于用户用能标签的综合能源负荷预测方法及*** | |
CN113554466A (zh) | 一种短期用电量预测模型构建方法、预测方法和装置 | |
CN114119273A (zh) | 一种园区综合能源***非侵入式负荷分解方法及*** | |
CN117114438A (zh) | 一种具备灵活性与可解释性的建筑区域能源***冷热负荷数据驱动预测方法 | |
CN112183877A (zh) | 一种基于迁移学习的光伏电站故障智能诊断方法 | |
CN115481918A (zh) | 一种基于源网荷储的单元状态主动感知及预测分析*** | |
CN116014722A (zh) | 基于季节分解和卷积网络的次日光伏发电预测方法及*** | |
Ahmad et al. | Efficient energy planning with decomposition-based evolutionary neural networks | |
CN115238854A (zh) | 一种基于tcn-lstm-am的短期负荷预测方法 | |
Kumar et al. | Forecasting indoor temperature for smart buildings with ARIMA, SARIMAX, and LSTM: A fusion approach | |
Alharbi et al. | Short-term wind speed and temperature forecasting model based on gated recurrent unit neural networks | |
CN113887809A (zh) | 双碳目标下配电网供需平衡方法、***、介质及计算设备 | |
CN116307287B (zh) | 一种光伏发电有效时段的预测方法、***及预测终端 | |
CN112365082A (zh) | 一种基于机器学习的公共能源消耗预测方法 | |
CN111476437A (zh) | 一种光伏发电功率超短期区间预测的方法及设备 | |
CN116646917A (zh) | 一种校园多步概率电力负荷预测方法及*** | |
CN115577856A (zh) | 一种变电工程造价预测与结余控制方法及*** | |
CN115310355A (zh) | 考虑多能耦合的综合能源***多元负荷预测方法及*** | |
CN114372615A (zh) | 一种考虑空间相关性的短期光伏功率预测方法及*** | |
Shen et al. | An interval analysis scheme based on empirical error and MCMC to quantify uncertainty of wind speed | |
Zahraoui et al. | ANN-LSTM Based Tool For Photovoltaic Power Forecasting. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |