CN116796141A - 一种基于gbdt回归模型的办公建筑能耗预测方法 - Google Patents
一种基于gbdt回归模型的办公建筑能耗预测方法 Download PDFInfo
- Publication number
- CN116796141A CN116796141A CN202210246202.9A CN202210246202A CN116796141A CN 116796141 A CN116796141 A CN 116796141A CN 202210246202 A CN202210246202 A CN 202210246202A CN 116796141 A CN116796141 A CN 116796141A
- Authority
- CN
- China
- Prior art keywords
- energy consumption
- data
- building
- gbdt
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005265 energy consumption Methods 0.000 title claims abstract description 111
- 238000000034 method Methods 0.000 title claims abstract description 35
- 230000006870 function Effects 0.000 claims abstract description 40
- 239000013598 vector Substances 0.000 claims abstract description 37
- 238000012549 training Methods 0.000 claims abstract description 35
- 238000010606 normalization Methods 0.000 claims abstract description 15
- 238000012545 processing Methods 0.000 claims abstract description 10
- 230000000694 effects Effects 0.000 claims abstract description 9
- 238000003066 decision tree Methods 0.000 claims abstract description 5
- 238000004364 calculation method Methods 0.000 claims description 16
- 238000005259 measurement Methods 0.000 claims description 5
- 238000002759 z-score normalization Methods 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 4
- 230000008859 change Effects 0.000 claims description 3
- 238000009826 distribution Methods 0.000 claims description 3
- 238000012935 Averaging Methods 0.000 claims description 2
- 238000007781 pre-processing Methods 0.000 claims 1
- 230000002159 abnormal effect Effects 0.000 abstract description 5
- 238000010276 construction Methods 0.000 abstract description 5
- 230000005855 radiation Effects 0.000 description 5
- 238000011161 development Methods 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 230000036299 sexual function Effects 0.000 description 2
- 229920002430 Fibre-reinforced plastic Polymers 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 238000004146 energy storage Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000011151 fibre-reinforced plastic Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000011425 standardization method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/11—Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/08—Construction
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- Computational Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Operations Research (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- Entrepreneurship & Innovation (AREA)
- Public Health (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Algebra (AREA)
- Game Theory and Decision Science (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明适用于建筑能耗技术领域,公开了一种基于梯度提升决策树(GBDT)回归模型的办公建筑能耗预测方法。预测方法包括获取建筑物历史能耗数据及其影响特征数据,整理数据并以季节划分;根据Pearson相关系数和ETC的特征影响度进行特征选择;训练方法包括对不同季节的数据归一化处理;设定平方损失函数、绝对损失函数、回归树学***均绝对误差MAE验证GBDT模型效果。本发明说明了GBDT预测的流程与方法,能够消除不同量纲对预测结果的影响,降低输入向量的维度,提高模型的训练速度,减少样本中异常值对训练和预测结果的影响,具有较高的预测准确度,对建筑节能建设具有一定的实际意义。
Description
技术领域
本发明涉及建筑能耗技术领域,尤其涉及一种基于梯度提升决策树(GBDT)回归模型的办公建筑能耗预测方法。
背景技术
随着社会经济的发展,城市化进程加快,建筑能耗在全国能源消耗中占比日益增大,使得全社会不得不关注建筑节能改造。能耗预测的准确性成为了建筑领域寻求节能方式的一个重要着眼点。同时,国家正大力推进“近零能耗”、“超低能耗”建筑建设,通过高精确度的能耗预测技术,可为平衡建筑用能与供能以及储能***运行方案提供决策依据,提高建筑的优化运行效益,从而促进“近零能耗建筑”和“超低能耗建筑”在我国健康持久发展。
建筑能耗预测受环境温度、气象条件等各种因素的影响,建模精度也随之受到影响而降低;另外,能耗预测数据中,由于各种特殊情况的存在,不免会包含异常值,导致误差增大,目前存在的问题使得建立一个高精确度的预测模型成为难题。
发明内容
本发明的目的在于提供一种基于GBDT回归模型的办公建筑能耗预测方法,效果在于:能够消除不同量纲对预测结果的影响,降低输入向量的维度,提高模型的训练速度,减少样本中异常值对训练和预测结果的影响,具有较高的预测准确度。
通过一种基于GBDT回归模型的办公建筑能耗预测方法,如附图1所示,其特征在于,包括如下步骤:获取建筑物历史能耗数据及其影响特征数据。所述影响特征数据不仅仅包括采集的建筑所处的气候环境数据、建筑自身的围护结构,应特别包括建筑物内人员情况、建筑物内部用能设备的性能,所述建筑物历史能耗数据为建筑物的各种设备的能耗数据、制冷机组的能耗数据等。
整理已获取的数据并以季节划分;通过Pearson相关系数,分析建筑物能耗的影响因素与建筑物能耗的相关性,根据相关性程度选择主要特征;同时,同时将所述数据分别输入ETC模型,输出其特征重要性指数;最后加权平均每个特征对应的Pearson相关系数与特征重要性指数,选出其中相关性高的几种特征为主要影响特征。
将所述主要特征数据以及特征数据所对应的建筑物历史能耗数据进行归一化处理,得到训练样本数据。其主要实现步骤如下:
以划分后的主要特征数据分别生成输入向量,其对应的建筑物历史能耗数据作为输出向量。
对所述划分后的输入向量和输出向量进行归一化处理,即采用Z-score标准化方法将原数据的每一个特征维度属性值更改为均值为0,标准差为1的高斯分布,生成不同季节的无量纲化训练样本集,从而消除量纲不一致导致的预测结果差别较大的情况。所述Z-score标准化方法表示为:
式中,x为输入向量,μ为输入向量x所在列的均值,δ为输入向量x所在列的标准差,x'为输入向量x经Z-score标准差标准化后的值。
分别输入所述归一化处理后的不同季节的训练样本集构建GBDT回归预测模型,样本集为,其中x为输入向量,y为输出向量;利用平方损失与绝对损失GBDT算法以及回归树的学习率进行回归预测。如图2所示,GBDT模型通过多轮迭代,每轮迭代产生一个弱分类器,每个分类器在上一轮分类器的负梯度基础上进行训练,训练经过最大次数迭代后输出结果得到最终的建筑物能耗预测值。
优选地,设定的平方损失函数为:
公式(1)
优选地,设定的绝对损失函数为:
公式(2)
公式(1)和公式(2)中,y为建筑物能耗实际值,f(x)为建筑物能耗预测值。
进一步地,输入所述训练样本集T,初始化GBDT回归预测模型。设定回归树个数k=1,2…,K,对于样本 i=1,2,…,N;计算第k-1棵树的初始值f0(x)。当f0 (xi)为样本T中建筑物能耗实际值的均值时fa0 (xi),计算第i个样本位置的残差Ai;当f0 (xi)为样本T中建筑物能耗实际值的中位数fb0 (xi)时,计算第i个样本位置的残差Bi。
进一步地,由于平方损失函数对于异常点非常敏感,导致异常点处预测误差过大,而绝对损失函数对于异常点有更好的鲁棒性,因此优化负梯度的计算方法。
优选地,损失函数L的负梯度rki的计算方法为:
1、当Ai<Bi时,rki计算公式如下:
公式(3)
2、当Ai>Bi时,rki计算公式如下:
公式(4)
公式(3)和公式(4)中,yi为T样本中第k-1棵树的第i个样本的建筑物能耗实际值,fk-1(xi)为第k-1棵树的第i个样本的建筑物能耗预测值,sign为符号函数。
遍历样本集T中的每个特征,根据公式(1)和公式(2),并根据第i个样本位置的某个特征作为划分节点,计算所有可能划分的情况的建筑物能耗实际值的总损失函数,取第一个总损失函数最小的组合对应的特征值作为划分节点。
优选地,根据负梯度计算得到的新的训练集,拟合一棵回归树,得到第k棵树的叶节点区域Rkj,对j=1,2,…,J,利用线性搜索,估计使损失函数L的极小化的常数值Ckj。由于负梯度的计算结合了平方损失与绝对损失,为避免Ckj的值不准确,计算公式如下:
公式(5)
公式(5)中,γkj为第k棵树的第j个叶节点中伪残差的均值,N为第k棵树的第j个叶节点的样本数量,min()表示取其中的最小值。
进一步地,更新回归树,得到第k棵树输出的i个建筑物能耗预测值fk(x)
公式(6)
公式(6)中,fk-1(x)为第k-1棵树的建筑物能耗预测值,J为回归树的叶子节点的个数,Ckj为迭代k次的第j个节点中使损失函数最小的常数值,I(x∈Rkj)为示性函数,lr为学习率。
优选地,由于原始的学习率为1,通常会使GBDT模型训练时得到相同的数,导致预测过拟合,极大地降低了模型的预测精度。因此,依据Shrinkage(收缩率)的思想,本发明设定学习率lr=0.08。
优选地,经过最大迭代次数K次拟合回归树后,输出最终的GBDT预测模型 F(x)为:
公式(7)
优选地,通过所述归一化方法,归一化处理所述对应季节的待预测日的输入向量,输入对应的最终的GBDT模型,输出预测数据,经过反归一化方法处理后得到待预测日的建筑物能耗预测值。
优选地,通过所述评价指标,包括平均绝对误差MAE、均方根误差RMSE;根据待预测日的建筑物能耗实际值与所述建筑物能耗预测值计算RMSE、MAE,评价模型预测精度,其中,RMSE、MAE越小表示该模型预测效果越佳,反之则越差。
本发明提供的特征选择方法,结合Pearson相关系数度量和ETC特征影响度度量,提取主要特征,降低输入向量的维度,能够提高训练效率,减少过拟合;本发明所述的归一化处理方法,能够消除不同量纲对预测结果的影响;最重要的,本发明提供的基于GBDT回归模型的办公建筑能耗预测方法,使用平方损失算法与绝对损失算法结合,减少样本中异常值对训练和预测结果的影响,提高预测精度,同时使用学习率进行模型训练,使模型具有较高的预测准确度,能够得到更准确的能耗预测值,有效地帮助提升建筑节能建设质量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。附图中:
图1为本发明中建筑能耗预测过程示意图;
图2为GBDT模型构建的流程图。
具体实施方式
下面结合具体实施例对本发明进行详细说明,流程见附图1。
采集数据。由于办公建筑能耗中照明设备、制冷机房空调耗能以及办公设备用能是耗能最高的,本实施例以照明设备用电能耗预测为例,建筑物能耗的影响因素数据以及建筑物历史能耗数据的来源为某栋办公楼所采集的数据,其中原始输入向量x包括如室外温度、日光水平、太阳辐射、建筑物面积、朝向、出勤人数、照明设备数量、照明设备运行时间等;输出向量y包括建筑物内照明设备用电量。
数据划分及特征选择。建筑物能耗的影响因素较为复杂,主要包括当地的太阳辐射、降水、风速及日照时间,围护结构的位置、朝向及其热工性能,建筑的不同功能类型、使用对象以及用能设备种类等。模型训练时,过多的特征向量使模型训练速度大大减慢。因此,为提高训练效率,需要选择出主要的特征向量。
以季节划分所采集的数据;通过Pearson相关系数,分析建筑物能耗的影响因素与建筑物能耗的相关性,根据相关性程度选择主要特征;同时,同时将所述数据分别输入ETC模型,输出其特征重要性指数,最后加权平均每个特征对应的Pearson相关系数与特征重要性指数,选出其中相关性高的几种特征为主要影响特征。最终确定的特征为室外温度、太阳辐射、出勤人数、照明设备数量、照明设备运行时间。
将以上主要特征数据的输入向量以及特征所对应的输出向量进行归一化处理,使数据规范到[0,1]之间,以方便统一进行***的建模与计算。具体为采用Z-score标准化方法将原数据的每一个特征维度属性值更改为均值为0,标准差为1的高斯分布,生成无量纲化训练样本集,从而消除量纲不一致导致的预测结果差别较大的情况。所述Z-score标准化方法表示为
公式(1)
公式(1)中,x为输入向量,μ为输入向量x所在列的均值,δ为输入向量x所在列的标准差,x′为输入向量x经Z-score标准差标准化后的值。由此得到训练样本数据。
利用所得训练样本集构建GBDT模型。样本集为,其中x为输入向量,包括采集的室外温度、太阳辐射、出勤人数、照明设备数量、照明设备运行时间数据,y为输出向量,包括采集的建筑物内照明设备用电量;利用平方损失与绝对损失GBDT算法进行回归预测。GBDT模型通过多轮迭代,每轮迭代产生一个弱分类器,每个分类器在上一轮分类器的负梯度基础上进行训练,训练经过最大次数迭代后输出结果得到最终的建筑物能耗预测值。
首先设定平方损失函数为:
公式(2)
设定绝对损失函数为
公式(3)
公式(2)和公式(3)中,y为建筑物能耗实际值,f(x)为建筑物能耗预测值。
输入所述训练样本集T,初始化GBDT模型。设定回归树数量k = 1, 2, …, K,样本数量i=1,2,…,N;由于第一棵树之前为第0棵树,因此计算第一棵树的f(x)可根据使用的损失函数取得初始值f0(x),之后f(x)为第k-1棵树的预测值。当f0 (xi)为样本T中建筑物能耗实际值的均值时fa0 (xi),计算第i个样本位置的残差Ai;当f0 (xi)为样本T中建筑物能耗实际值的中位数fb0 (xi)时,计算第i个样本位置的残差Bi。
计算损失函数L的负梯度。由于平方损失函数对于异常点非常敏感,导致异常点处预测误差过大,而绝对损失函数对于异常点有更好的鲁棒性。因此,损失函数L的负梯度rki的计算方法为:
1、当Ai<Bi时,rki计算公式如下:
公式(4)
2、当Ai>Bi时,rki计算公式如下:
公式(5)
公式(4)和公式(5)中,yi为T样本中第k-1棵树的第i个样本的建筑物能耗实际值,fk-1(xi)为第k-1棵树的第i个样本的建筑物能耗预测值,sign为符号函数。
遍历样本集T中的每个特征,根据公式(2)和公式(3),并根据第i个样本位置的某个特征作为划分节点,计算所有可能划分的情况的建筑物能耗实际值的总损失函数,取第一个总损失函数最小的组合对应的特征值作为划分节点。
根据负梯度计算得到的新的训练集,拟合一棵回归树,得到第k棵树的叶节点区域Rkj,对j=1,2,…,J,利用线性搜索,估计使损失函数L的极小化的常数值Ckj。由于负梯度的计算结合了平方损失与绝对损失,为避免Ckj的值不准确,公式如下:
公式(6)
公式(6)中,γkj为第k棵树的第j个叶节点中伪残差的均值,N为第k棵树的第j个叶节点的样本数量,min()表示取其中的最小值。
更新回归树,得到第k棵树输出的i个建筑物能耗预测值fk(x)
公式(7)
公式(7)中,fk-1(x)为第k-1棵树的建筑物能耗预测值,J为回归树的叶子节点的个数,Ckj为迭代k次的第j个节点中使损失函数最小的常数值,I(x∈Rkj)为示性函数,lr为学习率。
其中,由于原始的学习率为1,通常会使GBDT模型训练时得到相同的数,导致预测过拟合,极大地降低了模型的预测精度。因此,依据Shrinkage(收缩率)的思想,本发明设定学习率lr=0.08。
经过最大迭代次数K次拟合回归树后,输出最终的GBDT预测模型 F(x)如下:
公式(8)
通过所述归一化方法,归一化处理所述对应季节的待预测日的输入向量,包括不同季节训练集对应的室外温度、太阳辐射、出勤人数、照明设备数量、照明设备运行时间数据;输入对应的最终的GBDT模型,输出预测数据,经过反归一化方法处理后得到待预测日的建筑物能耗预测值。
最后通过所述评价指标,包括平均绝对误差MAE、均方根误差RMSE;根据待预测日的建筑物能耗实际值与所述建筑物能耗预测值计算RMSE、MAE,评价模型预测精度;其中,RMSE、MAE越小表示该模型预测效果越佳,反之则越差。为进一步验证模型的效果,使用多元回归模型对相同的数据集进行预测,利用采集的6月30日的建筑物内照明设备用电量实际值与预测值,比较多元回归模型预测误差与本实施例预测误差,得出表1的结如下:
通过对比照明设备两种不同模型的能耗预测精度可知,GBDT决策树能耗预测模型的误差小于多元回归能耗预测模型,且对于照明设备日能耗预测,该预测误差较小。
本发明实施例基于GBDT回归模型对办公建筑能耗进行预测,预测结果具有较高的准确度,能够有效地帮助提升建筑节能建设质量,具体体现在:
第一,特征选择方法结合了Pearson相关系数度量和ETC特征影响度度量,提取主要特征,降低输入向量的维度,能够提高训练效率,减少过拟合;
第二,使用Z-score归一化处理方法,能够消除不同量纲对预测结果的影响;
第三,基于GBDT回归模型的办公建筑能耗预测方法,训练模型时使用平方损失算法与绝对损失算法结合,减少样本中异常值对训练和预测结果的影响,提高预测精度;
第四,使用合适的学习率进行模型训练,能够更好地学习办公建筑能耗的规律,得到更准确的能耗预测值。
可以理解地,本发明实施例的基于GBDT回归模型的办公建筑能耗预测方法还可以应用在其他的建筑能耗预测方法。
本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行***,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。
Claims (10)
1.一种基于梯度提升决策树(GBDT)回归模型的办公建筑能耗预测方法,如附图1所示,其特征在于,包括如下步骤:
步骤S1、获取建筑物历史能耗数据及其影响因素数据;
步骤S2、整理所述获取的数据并以季节划分,采用Pearson相关系数和ETC的特征影响度度量影响因素,确定主要特征;
步骤S3、将所述主要特征数据以及对应的建筑物历史能耗数据进行归一化处理,得到训练样本数据;
步骤S4、设定平方损失函数、绝对损失函数、回归树学习率,利用所得训练样本数据构建不同季节的GBDT回归预测模型;
步骤S5、获取所述训练样本对应季节的待预测数据,包括待预测日的建筑物能耗影响特征数据,归一化处理后得到待预测集;
步骤S6、将所述待预测集输入对应季节的GBDT模型,反归一化方法处理预测输出数据,得到待预测日的建筑物能耗预测值;
步骤S7、以均方根误差RMSE、平均绝对误差MAE作为GBDT模型的评价指标,验证模型效果;其中,RMSE、MAE越小表示预测效果越佳,反之则越差。
2.根据权利要求1所述的基于GBDT回归模型的办公建筑能耗预测方法,其特征在于,所述步骤S1中,建筑物能耗的影响特征数据不仅仅包括采集的建筑所处的气候环境数据、建筑自身的围护结构,应特别包括建筑物内人员情况、建筑物内部用能设备的性能,所述建筑物历史能耗数据为建筑物的各种设备的能耗数据、制冷机组的能耗数据等。
3.根据权利要求1所述的基于GBDT回归模型的办公建筑能耗预测方法,其特征在于,将所述步骤S2中,以季节划分原始数据,通过Pearson相关系数,分析建筑物能耗的影响因素与建筑物能耗的相关性,根据相关性程度选择主要特征;同时将所述数据分别输入ETC模型,输出其特征重要性指数,最后加权平均每个特征对应的Pearson相关系数与特征重要性指数,选出其中相关性高的特征为主要影响特征。
4.根据权利要求3所述的基于GBDT回归模型的办公建筑能耗预测方法,其特征在于,所述步骤S3中,通过所述预处理,包括输入向量和输出数据划分和归一化处理;以划分后的主要特征数据分别生成输入向量,其对应的建筑物历史能耗数据作为输出向量;对所述划分后的输入向量和输出向量进行归一化处理,即采用Z-score标准化方法将原数据的每一个特征维度属性值更改为均值为0,标准差为1的高斯分布,生成不同季节的无量纲化训练样本集,从而消除量纲不一致导致的预测结果差别较大的情况。
5.根据权利要求1所述的基于GBDT回归模型的办公建筑能耗预测方法,其特征在于,所述步骤S4中,训练方法包括分别输入所述归一化处理后的不同季节的训练样本集构建GBDT模型,样本集为,其中x为特征向量,y为目标向量;利用平方损失与绝对损失GBDT算法以及回归树的学习率进行回归预测。
6. 根据权利要求5所述的基于GBDT回归模型的办公建筑能耗预测方法,其特征在于,设定平方损失函数和绝对损失函数如下:
公式(1)
公式(2)
公式(1)和公式(2)中,y为建筑物能耗实际值,f(x)为建筑物能耗预测值。
7.根据权利要求5所述的基于GBDT回归模型的办公建筑能耗预测方法,其特征在于,原始的学习率为1,通常会使GBDT模型训练时得到相同的数值,导致预测过拟合;因此,依据Shrinkage(收缩率)的思想,设定学习率lr=0.08。
8.根据权利要求1所述的基于GBDT回归模型的办公建筑能耗预测方法,其特征在于,根据公式(1)所述平方损失函数和公式(2)所述绝对损失函数,根据权利要求7所述学习率,进行梯度提升决策树回归预测;GBDT模型通过多轮迭代,每轮迭代产生一个弱分类器,每个分类器在上一轮分类器的负梯度基础上进行训练,训练经过最大次数迭代后输出结果得到最终的建筑物能耗预测值,具体步骤如下:
(1) 初始化GBDT模型,设定回归树个数k=1,2…,K,对于样本T的样本位置i=1,2,…,N,计算第k-1棵树的初始值f0(x),当f0 (xi)为样本T中建筑物能耗实际值的均值时fa0 (xi),计算残差Ai,当f0 (xi)为样本T中建筑物能耗实际值的中位数fb0 (xi)时,计算残差Bi;
(2) 计算损失函数L的负梯度,由于平方损失函数对于异常点非常敏感,导致异常点处预测误差过大,而绝对损失函数对于异常点有更好的鲁棒性,因此,损失函数L的负梯度rki的计算方法为:
(a) 当Ai<Bi时,rki计算公式如下:
公式(3)
(b) 当Ai>Bi时,rki计算公式如下:
公式(4)
公式(3)和公式(4)中,yi为T样本中第k-1棵树的第i个样本的建筑物能耗实际值, fk-1(xi)为第k-1棵树的第i个样本的建筑物能耗预测值,sign为符号函数;
(3) 遍历样本集T中的每个特征,根据公式(1)和公式(2),并根据第i个样本位置的某个特征作为划分节点,计算所有可能划分的情况的建筑物能耗实际值的总损失函数,取第一个总损失函数最小的组合对应的特征值作为划分节点;
(4) 由步骤(2)得到,结合步骤(3),拟合一棵回归树,得到第k棵树的叶节点区域Rkj,对j=1,2,…,J,利用线性搜索,估计使损失函数L的极小化的常数值Ckj,由于负梯度的计算结合了平方损失与绝对损失,为避免Ckj的值不准确,计算公式如下:
公式(5)
公式(5)中,γkj为第k棵树的第j个叶节点中伪残差的均值,N为第k棵树的第j个叶节点的样本数量,min()表示取其中的最小值;
(5) 更新回归树,得到第k棵树输出的i个建筑物能耗预测值fk(x)
公式(6)
公式(6)中,fk-1(x)为第k-1棵树的建筑物能耗预测值,J为回归树的叶子节点的个数,Ckj为迭代k次的第j个节点中使损失函数最小的常数值,I(x∈Rkj)为示性函数,lr为学习率,其中,由于原始的学习率为1,通常会使GBDT模型训练时得到相同的数,导致预测过拟合,极大地降低了模型的预测精度,因此,依据Shrinkage(收缩率)的思想,本发明设定学习率lr=0.08;
(6) 经过最大迭代次数K次拟合回归树后,输出最终的GBDT预测模型 F(x)为
公式(7)。
9.根据权利要求1所述的基于GBDT回归模型的办公建筑能耗预测方法,其特征在于,所述步骤S5中,通过所述归一化方法,归一化处理所述对应季节的待预测日的输入向量,输入对应的GBDT回归预测模型,输出预测数据,经过反归一化处理后得到待预测日的建筑物能耗预测值。
10.根据权利要求7所述的基于GBDT回归模型的办公建筑能耗预测方法,其特征在于,所述步骤S7中,通过所述评价指标,包括平均绝对误差MAE、均方根误差RMSE;根据待预测日的建筑物能耗实际值与所述建筑物能耗预测值计算RMSE、MAE,评价模型预测精度,其中,RMSE、MAE越小表示该模型预测效果越佳,反之则越差。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210246202.9A CN116796141A (zh) | 2022-03-14 | 2022-03-14 | 一种基于gbdt回归模型的办公建筑能耗预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210246202.9A CN116796141A (zh) | 2022-03-14 | 2022-03-14 | 一种基于gbdt回归模型的办公建筑能耗预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116796141A true CN116796141A (zh) | 2023-09-22 |
Family
ID=88040605
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210246202.9A Pending CN116796141A (zh) | 2022-03-14 | 2022-03-14 | 一种基于gbdt回归模型的办公建筑能耗预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116796141A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117235679A (zh) * | 2023-11-15 | 2023-12-15 | 长沙金码测控科技股份有限公司 | 一种基于lucc的基坑监测用拉压荷载评估方法及*** |
CN117236522A (zh) * | 2023-11-10 | 2023-12-15 | 四川智源能诚售电有限公司 | 一种电力能耗管理方法、***、电子设备及介质 |
CN117251814A (zh) * | 2023-09-28 | 2023-12-19 | 广东省交通开发有限公司 | 一种高速公路充电桩电量损耗异常的分析方法 |
-
2022
- 2022-03-14 CN CN202210246202.9A patent/CN116796141A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117251814A (zh) * | 2023-09-28 | 2023-12-19 | 广东省交通开发有限公司 | 一种高速公路充电桩电量损耗异常的分析方法 |
CN117236522A (zh) * | 2023-11-10 | 2023-12-15 | 四川智源能诚售电有限公司 | 一种电力能耗管理方法、***、电子设备及介质 |
CN117236522B (zh) * | 2023-11-10 | 2024-02-13 | 四川智源能诚售电有限公司 | 一种电力能耗管理方法、***、电子设备及介质 |
CN117235679A (zh) * | 2023-11-15 | 2023-12-15 | 长沙金码测控科技股份有限公司 | 一种基于lucc的基坑监测用拉压荷载评估方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116796141A (zh) | 一种基于gbdt回归模型的办公建筑能耗预测方法 | |
CN106842914A (zh) | 一种温度控制节能处理方法、装置及*** | |
CN113554466A (zh) | 一种短期用电量预测模型构建方法、预测方法和装置 | |
CN104463381A (zh) | 基于kpca与wlssvm的建筑能耗预测方法 | |
CN112183826A (zh) | 基于深度级联生成对抗网络的建筑能耗预测方法及相关产品 | |
CN112418495A (zh) | 一种基于天牛须优化算法和神经网络的建筑能耗预测方法 | |
CN114862032B (zh) | 一种基于XGBoost-LSTM的电网负荷预测方法及装置 | |
CN105787259A (zh) | 一种多元气象因素对负荷变化影响相关性的分析方法 | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及*** | |
CN114282730A (zh) | 一种用于建筑负荷预测的数据完备性检验与特征学习方法 | |
CN117613883A (zh) | 发电功率预测方法、装置、计算机设备及存储介质 | |
CN113762387A (zh) | 一种基于混合模型预测的数据中心站多元负荷预测方法 | |
CN115759389A (zh) | 基于天气类型的相似日组合策略的日前光伏功率预测方法 | |
CN116822672A (zh) | 一种空调冷负荷预测优化方法、*** | |
CN110598947A (zh) | 一种基于改进布谷鸟-神经网络算法的负荷预测方法 | |
CN114372631A (zh) | 一种基于小样本学习和lstm的缺资料地区径流预测方法 | |
CN116245259B (zh) | 基于深度特征选择的光伏发电预测方法、装置和电子设备 | |
CN110276478B (zh) | 基于分段蚁群算法优化svm的短期风电功率预测方法 | |
CN116595895A (zh) | 短时电量预测模型的训练方法及短时电量预测方法 | |
CN114811858B (zh) | 一种空调负荷在线学习方法 | |
CN113449466B (zh) | 基于pca和混沌gwo优化relm的太阳辐射预测方法及*** | |
CN115796327A (zh) | 一种基于vmd和iwoa-f-gru模型的风电功率区间预测方法 | |
Geng et al. | Study on index model of tropical cyclone intensity change based on projection pursuit and evolution strategy | |
Lee et al. | Application of temperature prediction model based on LSTNet in telecommunication Room | |
CN116753561B (zh) | 供热控制方法、控制装置和供热*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |