CN109345011A - 一种基于深度回归森林的空调负荷预测方法及*** - Google Patents

一种基于深度回归森林的空调负荷预测方法及*** Download PDF

Info

Publication number
CN109345011A
CN109345011A CN201811094430.9A CN201811094430A CN109345011A CN 109345011 A CN109345011 A CN 109345011A CN 201811094430 A CN201811094430 A CN 201811094430A CN 109345011 A CN109345011 A CN 109345011A
Authority
CN
China
Prior art keywords
training
layer
value
forest
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811094430.9A
Other languages
English (en)
Inventor
史春燕
李锋
曾祥宁
童建林
刘明
肖鑫
冯应柱
张存琼
周明霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongye Saidi Chongqing Information Technology Co Ltd
Original Assignee
Zhongye Saidi Chongqing Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongye Saidi Chongqing Information Technology Co Ltd filed Critical Zhongye Saidi Chongqing Information Technology Co Ltd
Priority to CN201811094430.9A priority Critical patent/CN109345011A/zh
Publication of CN109345011A publication Critical patent/CN109345011A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于深度回归森林的空调负荷预测方法,包括以下步骤:根据空调负荷的影响因素采集空调负荷值和影响因素值,所述空调负荷值和影响因素值构成训练样本集;根据所述训练样本集训练一个深度回归森林网络,所述深度回归森林网络包含多个层次,每个层次包括多个随机森林预测器和多个完全随机森林预测器;获取待预测时刻的影响因素值构成预测样本集,将所述预测样本集输入所述深度回归森林网络,得到负荷预测值。本发明能够有效地分析影响因素与空调负荷之间的非线性关系,在一个统一的框架下处理各种不同性质的影响因素,计算简单高效,预测精度较高。

Description

一种基于深度回归森林的空调负荷预测方法及***
技术领域
本发明涉及环境技术管理领域,具体涉及一种基于深度回归森林的空调负荷预测方法及***。
背景技术
随着社会经济的发展,空调***的应用日益普及。在建筑中,特别是公共建筑中,空调的能耗在建筑总能耗中占的比重也日益提高,空调节能有着迫切需求。空调负荷的预测是优化空调机组调度、降低空调***能耗的重要依据。快速、准确地预测空调负荷具有重要的经济价值和环保意义。
主流的空调负荷预测方法大致可以分为三类。第一类是基于时间序列模型的方法。这类方法的基本思想是利用过去一段时间的负荷变化规律来预测未来的负荷值。这类方法的优点是模型简单、计算速度快、只需少量的近期历史数据即可进行预测。其缺点是要求序列满足平稳性假设,实际的空调负荷数据很难满足该假设,此外时间序列模型只分析负荷数据自身的变化规律,而忽略了影响负荷的变量因素,因此这类方法的预测精度不够理想。第二类是基于回归分析的方法。这类方法首先找出若干种与负荷变化相关的影响因素,然后通过历史数据拟合出表示空调负荷的函数。这类方法的优点是能够显式地分析影响因素与空调负荷之间的关系,且数学意义明确。缺点是能同时考虑的影响因素数量有限,当影响因素增加时,计算复杂度将急剧提高,此外这类方法难以描述影响因素和负荷之间复杂的非线性关系,因此预测精度不高。第三类方法是基于机器学习的方法,例如神经网络、支持向量机等。这类方法能够较好的捕捉影响因素和负荷之间的非线性关系,预测精度较高。但是这类方法训练过程复杂,涉及到较多的超参数调节,超参数的设置对预测性能影响较大,且训练耗时很长。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种基于深度回归森林的空调负荷预测方法,以解决现有技术预测精度不高的问题。
为实现上述目的及其他相关目的,本发明提供一种基于深度回归森林的空调负荷预测方法,所述基于深度回归森林的空调负荷预测方法包括以下步骤:
根据空调负荷的影响因素采集空调负荷值和影响因素值,所述空调负荷值和影响因素值构成样本集;
根据所述训练样本集训练一个深度回归森林网络,所述深度回归森林网络包含多个层次,每个层次包括多个随机森林预测器和多个完全随机森林预测器;
获取待预测时刻的影响因素值构成预测样本集,将所述预测样本集输入所述深度回归森林网络,得到负荷预测值。
可选地,所述根据所述训练样本集训练一个深度回归森林网络,具体包括:
对第N层进行训练,计算第N层的预测误差值,N为大于或等于零的整数;
对第N+1层进行训练,计算第N+1层的预测误差值,所述第N+1层的随机森林预测器和完全随机森林预测器的数量在所述第N层的础上分别加一;
比较第N+1层的预测误差值与第N层的预测误差值,若第N+1层的预测误差值与第N层的预测误差值相等,则训练完成,否则进行下一层的训练。
可选地,所述随机森林预测器包括若干个随机树,所述完全随机森林预测器包括若干个完全随机树,在训练所述深度回归森林网络过程中,随机森林预测器和完全随机森林预测器中的每一棵树的节点***准则均为使预测误差值最小化。
可选地,所述随机森林预测器与所述完全随机森林预测器的训练方法:
记某颗树的某一个节点为R,对该节点进行***,得到R'和R”两个子节点,位于节点R 中的训练样本集合为{(Xi,yi)|i=1,2,...,NR},其中NR表示训练样本数量,yi表示负荷值,Xi表示影响因素,它是一个向量Xi=[xi1,xi2,...xim],m是备选特征的维数,则节点***准则为:
其中,分别为子节点R'和R”的负荷预测值,该负荷预测值为节点中的训练样本负荷值的均值,则:
其中,NR'和NR”分别为子节点R'和R”中的训练样本数量;
当某个节点中的样本数量小于等于设定的值时,则该节点停止***;
当所有节点都停止***时,生成一棵树;
重复上述过程生成所有的树,得到一个随机森林预测器和一个完全随机森林预测器。
可选地,所述负荷预测值由所述深度回归森林网络输出层的各个随机森林预测器的输出值和完全随机森林预测器加权融合得到。
为实现上述目的及其他相关目的,本发明还提供一种基于深度回归森林的空调负荷预测***,所述基于深度回归森林的空调负荷预测***包括:
训练集构建模块,用于根据空调负荷的影响因素采集空调负荷值和影响因素值,所述空调负荷值和影响因素值构成样本集;
训练模块,用于根据所述训练样本集训练一个深度回归森林网络,所述深度回归森林网络包含多个层次,每个层次包括多个随机森林预测器和多个完全随机森林预测器;
预测模块,用于获取待预测时刻的影响因素值,所述待预测时刻的影响因素值构成预测样本集,将所述预测样本集输入所述深度回归森林网络,得到负荷预测值。
可选地,所述训练模块包括:
第一训练模块,用于对第N层进行训练并计算第N层的预测误差值,N为大于或等于零的整数;
第二训练模块,用于对第N+1层进行训练,计算第N+1层的预测误差值,所述第N+1层的随机森林预测器和完全随机森林预测器的数量在所述第N层的础上分别加一;
比较模块,用于比较第N+1层的预测误差值与第N层的预测误差值,若第N+1层的预测误差值与第N层的预测误差值相等,则训练完成,否则进行下一层的训练。
可选地,所述随机森林预测器包括若干个随机树,所述完全随机森林预测器包括若干个完全随机树,在训练所述深度回归森林网络过程中,随机森林预测器和完全随机森林预测器中的每一棵树的节点***准则均为使预测误差值最小化。
可选地,所述负荷预测值由所述深度回归森林网络输出层的各个随机森林预测器的输出值和完全随机森林预测器加权融合得到。
如上所述,本发明的一种基于深度回归森林的空调负荷预测方法及***,具有以下有益效果:
(a)采集历史数据构成训练样本集,历史数据不需要在时间上连续,部分历史数据的缺少不会影响预测效果,且数据无需满足平稳性的假设,适用条件宽泛。
(b)能够实时的分析影响因素与负荷值之间的关系,且能在一个统一的框架下同时处理各种不同性质的影响因素,影响因素可以是连续数据、离散数据或二值数据。
(c)训练过程简单,易于编程实现,本发明自身具有并行结构,可通过并行计算大幅提高计算速度。
附图说明
图1为本发明所述的基于深度回归森林的空调负荷预测方法的流程图;
图2为深度回归森林结构示意图。
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效。
请参阅图1。须知,本说明书所附图式所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容能涵盖的范围内。同时,本说明书中所引用的如“上”、“下”、“左”、“右”、“中间”及“一”等的用语,亦仅为便于叙述的明了,而非用以限定本发明可实施的范围,其相对关系的改变或调整,在无实质变更技术内容下,当亦视为本发明可实施的范畴。
参照图1,本发明实施例提供一种基于深度回归森林的空调负荷预测方法,包括以下步骤:
S1:分析空调负荷的影响因素,总结出以下21项影响空调负荷的因素:
<1>采集或预测负荷数据的整点时刻;
<2>采集或预测负荷数据的日期为星期几,其取值为1至7之间的整数,代表星期一至星期天;
<3>采集或预测负荷数据的月份;
<4>采集或预测负荷数据的节假日属性,其取值为0或1,0代表工作日,1代表节假日,节假日包括国家法定假日和星期六、星期天;
<5>昨日同一时刻的负荷值;
<6>昨日同一时刻相对于前日同一时刻的负荷增量;
<7>昨日同一时刻相对于该时刻前一整点时刻的负荷增量;
<8>采集或预测负荷时刻的温度;
<9>采集或预测负荷时刻的日最高温度;
<10>采集或预测负荷时刻的日最低温度;
<11>采集或预测负荷时刻的日平均温度;
<12>相对于前一日的日最高温度增量;
<13>相对于前一日的日最低温度增量;
<14>相对于前一日的日平均温度增量;
<15>采集或预测负荷时刻的湿度;
<16>采集或预测负荷时刻的日最高湿度;
<17>采集或预测负荷时刻的日最低湿度;
<18>采集或预测负荷时刻的日平均湿度;
<19>采集或预测负荷时刻的一小时内平均人流量;
<20>相对于前一整点时刻的一小时平均人流量的增量;
<21>相对昨日同一时刻的一小时平均人流量的增量。
其中,<18>、<19>、<20>反映的是人流量的影响素,其难以直接测量,因此通过间接方法估计得到。对于训练样本,每10分钟测量空调覆盖区域内的所有WIFI接入点连接的用户总数,平均一小时内的测量数据得到平均人流量,在此基础上可计算平均人流量的增量;对于预测样本,历史平均人流量数据构成了一个时间序列,通过ARIMA模型(全称为自回归积分滑动平均模型,Autoregressive Integrated Moving Average Model,简记ARIMA)可估计待预测时刻的平均人流量,进而可以计算平均人流量的增量。
S2:在每天的整点时刻采集空调的负荷值,及影响因素值,采集若干天的数据,构成训练样本集T={(Xi,yi)|i=1,2,...,N},其中N为样本的数量,yi为第i个样本的负荷值,Xi=[xi1,xi2,...,xid]为一个向量,它是yi的影响因素,称Xi为yi的特征,d是Xi的维度,它表示影响因素的数量。
S3:利用步骤S2中的训练样本集训练一个深度回归森林网络。其具体过程是:
随机地将步骤S2中的训练样本集T分为两个子集,一个子集包含样本总数3/4的样本,记此子集为G;另一个子集包含剩余的1/4的样本,记此子集为V。G用于深度回归森林网络的生成,V用于对网络的预测精度进行评估,即计算预测误差值。
深度回归森林网络的结构如图2所示,逐层地对网络进行训练。首先训练第一层,该层初始时刻包含1个随机森林预测器和1个完全随机森林预测器,随机森林预测器包含500棵随机树,完全随机森林预测器包含500棵完全随机树。
于本实施例中,所述根据所述训练样本集训练一个深度回归森林网络,具体包括:
对第N层进行训练,计算第N层的预测误差值,N为大于或等于零的整数;
对第N+1层进行训练,计算第N+1层的预测误差值,所述第N+1层的随机森林预测器和完全随机森林预测器的数量在所述第N层的础上分别加一;
比较第N+1层的预测误差值与第N层的预测误差值,若第N+1层的预测误差值与第N层的预测误差值相等,则训练完成,否则进行下一层的训练。
更加具体地,训练一个深度回归森林网络可以采用以下方法:
对于1棵随机树,有放回地从集合G中随机抽取10%的样本用于树的生成,无放回地从所有特征中随机抽取个特征作为节点***备选特征。对于完全随机树,有放回地从集合G 中随机抽取10%的样本用于树的生成,取所有d个特征作为节点***的备选特征。随机树和完全随机树的节点***准则均为预测误差值最小化。
S31.假设一颗树的某一个节点为R,对节点R进行***,得到R'和R”两个子节点,位于节点R中的训练样本集合为{(Xi,yi)|i=1,2,...,NR},其中Xi=[xi1,xi2,...,xim],m是备选特征的维数,则节点***准则为:
其中,j表示最优***维度,S表示最优***阈值,xij为在最优***维度j下第i个训练样本的特征值,分别为子节点R'和R”的负荷预测值,该值为节点中的训练样本负荷值的均值,因此:
其中,NR'和NR”分别为子节点R'和R”中的训练样本数量。
S32.当某个节点中的样本数量小于等于10个时,该节点即停止***,
S33.当所有节点都停止***时就生成了一棵树。
S34.重复S31~S33即可生成所有的树,得到1个随机森林预测器和1个完全随机森林预测器。
然后,用集合V对该层生成的预测器的预测误差值进行评估:
其中,是由第Pj个预测器得到的第i个样本的预测值,yi是第i个样本的真实值,NP是该层的预测器总个数,NV是集合V中的样本总数。
在此基础上,采用与前述相同的方法新增生成随机森林预测器和完全随机森林预测器各1 个,并根据公式(4)重新计算本层的预测误差值,当误差值不再减小时,停止本层的训练,本层不再生成新的预测器。
然后开始网络下一层的训练,即生成下一层的预测器。其生成方法与之前一层的生成方法类似,只是此时训练样本加入了L维新的特征,此L维特征为网络的前一层中每一个预测器分别预测的该样本的预测值,前一层的预测器数量为L个,如图2所示。当网络新的一层训练结束后,比较该层与上一层的预测误差值,若误差不再减小,则停止整个网络的训练,得到最终的训练结果;否则,继续转入网络下一层的训练。
当得到训练好的深度回归森林网络后,利用集合V计算网络输出层的每个预测器的预测误差值:
该误差值将在预测时被用作各预测器的预测结果融合的权值。
S4:对于待预测时刻的负荷值,获取该时刻的影响因素值,将所述影响因素值输入步骤 S3得到的深度回归森林网络,该网络输出层的每一个预测器都将得到一个预测值,将这些预测值加权融合,得到最终的预测结果
其中,是输出层的第Pi个预测器输出的预测值,εPi是由公式(5)得到的第Pi个预测器和预测误差,K是输出层的预测器的总个数。
本发明还提供一种基于深度回归森林的空调负荷预测***,所述基于深度回归森林的空调负荷预测***包括:
训练集构建模块,用于根据空调负荷的影响因素采集空调负荷值和影响因素值,所述空调负荷值和影响因素值构成样本集。
于本实施例中,空调负荷的影响因素包括:
<1>采集或预测负荷数据的整点时刻;
<2>采集或预测负荷数据的日期为星期几,其取值为1至7之间的整数,代表星期一至星期天;
<3>采集或预测负荷数据的月份;
<4>采集或预测负荷数据的节假日属性,其取值为0或1,0代表工作日,1代表节假日,节假日包括国家法定假日和星期六、星期天;
<5>昨日同一时刻的负荷值;
<6>昨日同一时刻相对于前日同一时刻的负荷增量;
<7>昨日同一时刻相对于该时刻前一整点时刻的负荷增量;
<8>采集或预测负荷时刻的温度;
<9>采集或预测负荷时刻的日最高温度;
<10>采集或预测负荷时刻的日最低温度;
<11>采集或预测负荷时刻的日平均温度;
<12>相对于前一日的日最高温度增量;
<13>相对于前一日的日最低温度增量;
<14>相对于前一日的日平均温度增量;
<15>采集或预测负荷时刻的湿度;
<16>采集或预测负荷时刻的日最高湿度;
<17>采集或预测负荷时刻的日最低湿度;
<18>采集或预测负荷时刻的日平均湿度;
<19>采集或预测负荷时刻的一小时内平均人流量;
<20>相对于前一整点时刻的一小时平均人流量的增量;
<21>相对昨日同一时刻的一小时平均人流量的增量。
其中,<18>、<19>、<20>反映的是人流量的影响素,其难以直接测量,因此通过间接方法估计得到。对于训练样本,每10分钟测量空调覆盖区域内的所有WIFI接入点连接的用户总数,平均一小时内的测量数据得到平均人流量,在此基础上可计算平均人流量的增量;对于预测样本,历史平均人流量数据构成了一个时间序列,通过ARIMA模型(全称为自回归积分滑动平均模型,Autoregressive Integrated Moving Average Model,简记ARIMA)可估计待预测时刻的平均人流量,进而可以计算平均人流量的增量。
在训练深度回归森林网络时,先要采集空调的负荷值,及影响因素值。则在每天的整点时刻采集空调的负荷值,及影响因素值,采集若干天的数据,构成训练样本集 T={(Xi,yi)|i=1,2,...,N},其中N为样本的数量,yi为第i个样本的负荷值, Xi=[xi1,xi2,...,xid]为一个向量,它是yi的影响因素,称Xi为yi的特征,d是Xi的维度,它表示影响因素的数量。
所述训练模块,用于根据所述训练样本集训练一个深度回归森林网络,所述深度回归森林网络包含多个层次,每个层次包括多个随机森林预测器和多个完全随机森林预测器。
训练得到深度回归森林网络的过程是:随机地将步骤S2中的训练样本集T分为两个子集,一个子集包含样本总数3/4的样本,记此子集为G;另一个子集包含剩余的1/4的样本,记此子集为V。G用于深度回归森林网络的生成,V用于对网络的预测精度进行评估,即计算预测误差值。
深度回归森林网络的结构如图2所示,逐层地对网络进行训练。首先训练第一层,该层初始时刻包含1个随机森林预测器和1个完全随机森林预测器,随机森林预测器包含500棵随机树,完全随机森林预测器包含500棵完全随机树。
所述训练模块具体包括:
第一训练模块,用于对第N层进行训练并计算第N层的预测误差值,N为大于或等于零的整数;
第二训练模块,用于对第N+1层进行训练,计算第N+1层的预测误差值,所述第N+1层的随机森林预测器和完全随机森林预测器的数量在所述第N层的础上分别加一;
比较模块,用于比较第N+1层的预测误差值与第N层的预测误差值,若第N+1层的预测误差值与第N层的预测误差值相等,则训练完成,否则进行下一层的训练。
可选地,所述随机森林预测器包括若干个随机树,所述完全随机森林预测器包括若干个完全随机树,在训练所述深度回归森林网络过程中,随机森林预测器和完全随机森林预测器中的每一棵树的节点***准则均为使预测误差值最小化。
训练一个深度回归森林网络可以采用以下方法:
对于1棵随机树,有放回地从集合G中随机抽取10%的样本用于树的生成,无放回地从所有特征中随机抽取个特征作为节点***备选特征。对于完全随机树,有放回地从集合G 中随机抽取10%的样本用于树的生成,取所有d个特征作为节点***的备选特征。随机树和完全随机树的节点***准则均为预测误差最小化。
假设一颗树的某一个节点为R,对节点R进行***,得到R'和R”两个子节点,位于节点 R中的训练样本集合为{(Xi,yi)|i=1,2,...,NR},其中Xi=[xi1,xi2,...,xim],m是备选特征的维数,则节点***准则为:
其中,j表示最优***维度,S表示最优***阈值,xij为在最优***维度j下第i个训练样本的特征值,分别为子节点R'和R”的负荷预测值,该值为节点中的训练样本负荷值的均值,因此:
其中,NR'和NR”分别为子节点R'和R”中的训练样本数量。
当某个节点中的样本数量小于等于10个时,该节点即停止***,
当所有节点都停止***时就生成了一棵树。
重复上述过程即可生成所有的树,得到1个随机森林预测器和1个完全随机森林预测器。
然后,用集合V对该层生成的预测器的预测误差值进行评估:
其中,是由第Pj个预测器得到的第i个样本的预测值,yi是第i个样本的真实值,NP是该层的预测器总个数,NV是集合V中的样本总数。
在此基础上,采用与前述相同的方法新增生成随机森林预测器和完全随机森林预测器各1 个,并根据公式(4)重新计算本层的预测误差值,当误差值不再减小时,停止本层的训练,本层不再生成新的预测器。
然后开始网络下一层的训练,即生成下一层的预测器。其生成方法与之前一层的生成方法类似,只是此时训练样本加入了L维新的特征,此L维特征为网络的前一层中每一个预测器分别预测的该样本的预测值,前一层的预测器数量为L个,如图2所示。当网络新的一层训练结束后,比较该层与上一层的预测误差值,若误差不再减小,则停止整个网络的训练,得到最终的训练结果;否则,继续转入网络下一层的训练。
当得到训练好的深度回归森林网络后,利用集合V计算网络输出层的每个预测器的预测误差值:
该误差值将在预测时被用作各预测器的预测结果融合的权值。
预测模块,用于获取待预测时刻的影响因素值,所述待预测时刻的影响因素值构成预测样本集,将所述预测样本集输入所述深度回归森林网络,得到负荷预测值。
对于待预测时刻的负荷值,获取该时刻的影响因素值,将所述影响因素值输入深度回归森林网络,该网络输出层的每一个预测器都将得到一个预测值,将这些预测值加权融合,得到最终的预测结果
其中,是输出层的第Pi个预测器输出的预测值,εPi是由公式(5)得到的第Pi个预测器和预测误差,K是输出层的预测器的总个数。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (9)

1.一种基于深度回归森林的空调负荷预测方法,其特征在于,所述基于深度回归森林的空调负荷预测方法包括以下步骤:
根据空调负荷的影响因素采集空调负荷值和影响因素值,所述空调负荷值和影响因素值构成训练样本集;
根据所述训练样本集训练一个深度回归森林网络,所述深度回归森林网络包含多个层次,每个层次包括多个随机森林预测器和多个完全随机森林预测器;
获取待预测时刻的影响因素值构成预测样本集,将所述预测样本集输入所述深度回归森林网络,得到负荷预测值。
2.根据权利要求1所述的一种基于深度回归森林的空调负荷预测方法,其特征在于,所述根据所述训练样本集训练一个深度回归森林网络,具体包括:
对第N层进行训练,计算第N层的预测误差值,N为大于或等于零的整数;
对第N+1层进行训练,计算第N+1层的预测误差值,所述第N+1层的随机森林预测器和完全随机森林预测器的数量在所述第N层的础上分别加一;
比较第N+1层的预测误差值与第N层的预测误差值,若第N+1层的预测误差值与第N层的预测误差值相等,则训练完成,否则进行下一层的训练。
3.根据权利要求2所述的一种基于深度回归森林的空调负荷预测方法,其特征在于,所述随机森林预测器包括若干个随机树,所述完全随机森林预测器包括若干个完全随机树,在训练所述深度回归森林网络过程中,随机森林预测器和完全随机森林预测器中的每一棵树的节点***准则均为使预测误差值最小化。
4.根据权利要求3所述的一种基于深度回归森林的空调负荷预测方法,其特征在于,所述随机森林预测器与所述完全随机森林预测器的训练方法:
记某颗树的某一个节点为R,对该节点进行***,得到R'和R”两个子节点,位于节点R中的训练样本集合为{(Xi,yi)|i=1,2,...,NR},其中NR表示训练样本数量,yi表示负荷值,Xi表示影响因素,它是一个向量Xi=[xi1,xi2,...xim],m是备选特征的维数,则节点***准则为:
其中,分别为子节点R'和R”的负荷预测值,该负荷预测值为节点中的训练样本负荷值的均值,则:
其中,NR'和NR”分别为子节点R'和R”中的训练样本数量;
当某个节点中的样本数量小于等于设定的值时,则该节点停止***;
当所有节点都停止***时,生成一棵树;
重复上述过程生成所有的树,得到一个随机森林预测器和一个完全随机森林预测器。
5.根据权利要求1所述的一种基于深度回归森林的空调负荷预测方法,其特征在于,所述负荷预测值由所述深度回归森林网络输出层的各个随机森林预测器的输出值和完全随机森林预测器加权融合得到。
6.一种基于深度回归森林的空调负荷预测***,其特征在于,所述基于深度回归森林的空调负荷预测***包括:
训练集构建模块,用于根据空调负荷的影响因素采集空调负荷值和影响因素值,所述空调负荷值和影响因素值构成样本集;
训练模块,用于根据所述训练样本集训练一个深度回归森林网络,所述深度回归森林网络包含多个层次,每个层次包括多个随机森林预测器和多个完全随机森林预测器;
预测模块,用于获取待预测时刻的影响因素值,所述待预测时刻的影响因素值构成预测样本集,将所述预测样本集输入所述深度回归森林网络,得到负荷预测值。
7.根据权利要求6所述一种基于深度回归森林的空调负荷预测***,其特征在于,所述训练模块包括:
第一训练模块,用于对第N层进行训练并计算第N层的预测误差值,N为大于或等于零的整数;
第二训练模块,用于对第N+1层进行训练,计算第N+1层的预测误差值,所述第N+1层的随机森林预测器和完全随机森林预测器的数量在所述第N层的础上分别加一;
比较模块,用于比较第N+1层的预测误差值与第N层的预测误差值,若第N+1层的预测误差值与第N层的预测误差值相等,则训练完成,否则进行下一层的训练。
8.根据权利要求6所述的一种基于深度回归森林的空调负荷预测***,其特征在于,所述随机森林预测器包括若干个随机树,所述完全随机森林预测器包括若干个完全随机树,在训练所述深度回归森林网络过程中,随机森林预测器和完全随机森林预测器中的每一棵树的节点***准则均为使预测误差值最小化。
9.根据权利要求6所述的一种基于深度回归森林的空调负荷预测***,其特征在于,所述负荷预测值由所述深度回归森林网络输出层的各个随机森林预测器的输出值和完全随机森林预测器加权融合得到。
CN201811094430.9A 2018-09-19 2018-09-19 一种基于深度回归森林的空调负荷预测方法及*** Pending CN109345011A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811094430.9A CN109345011A (zh) 2018-09-19 2018-09-19 一种基于深度回归森林的空调负荷预测方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811094430.9A CN109345011A (zh) 2018-09-19 2018-09-19 一种基于深度回归森林的空调负荷预测方法及***

Publications (1)

Publication Number Publication Date
CN109345011A true CN109345011A (zh) 2019-02-15

Family

ID=65305998

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811094430.9A Pending CN109345011A (zh) 2018-09-19 2018-09-19 一种基于深度回归森林的空调负荷预测方法及***

Country Status (1)

Country Link
CN (1) CN109345011A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110517059A (zh) * 2019-07-08 2019-11-29 广东工业大学 一种基于随机森林的时尚手袋销售预测方法
CN110598923A (zh) * 2019-09-03 2019-12-20 深圳市得益节能科技股份有限公司 基于支持向量回归机优化与误差修正的空调负荷预测方法
CN111414875A (zh) * 2020-03-26 2020-07-14 电子科技大学 基于深度回归森林的三维点云头部姿态估计***
CN112728737A (zh) * 2021-01-05 2021-04-30 青岛海信日立空调***有限公司 一种空调器及云服务器

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105303262A (zh) * 2015-11-12 2016-02-03 河海大学 一种基于核主成分分析和随机森林的短期负荷预测方法
AU2016325186A1 (en) * 2016-09-09 2018-03-29 Beijing Guodiantong Corporation Bus load forecasting method
CN108011367A (zh) * 2017-12-04 2018-05-08 贵州电网有限责任公司电力科学研究院 一种基于深度决策树算法的电力负荷特性挖掘方法
CN108022001A (zh) * 2017-09-20 2018-05-11 河海大学 基于pca和分位数回归森林的短期负荷概率密度预测方法
CN108062720A (zh) * 2017-12-05 2018-05-22 贵州电网有限责任公司电力科学研究院 一种基于相似日选取及随机森林算法的负荷预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105303262A (zh) * 2015-11-12 2016-02-03 河海大学 一种基于核主成分分析和随机森林的短期负荷预测方法
AU2016325186A1 (en) * 2016-09-09 2018-03-29 Beijing Guodiantong Corporation Bus load forecasting method
CN108022001A (zh) * 2017-09-20 2018-05-11 河海大学 基于pca和分位数回归森林的短期负荷概率密度预测方法
CN108011367A (zh) * 2017-12-04 2018-05-08 贵州电网有限责任公司电力科学研究院 一种基于深度决策树算法的电力负荷特性挖掘方法
CN108062720A (zh) * 2017-12-05 2018-05-22 贵州电网有限责任公司电力科学研究院 一种基于相似日选取及随机森林算法的负荷预测方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
ZHI-HUA ZHOU 等: "Deep Forest:Towards an Alternative to Deep Neural Networks", 《ARXIV》 *
李万涛 等: "《运筹学》", 31 March 2018, 中国铁道出版社 *
沈文博 等: "深度森林与人工神经网络在光伏出力预测的比较", 《信息技术与网络安全》 *
王虹: "基于小波的电力***短期负荷预测", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 *
翁理国 等: "基于多维多粒度级联森林的高原地区云雪分类", 《计算机应用》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110517059A (zh) * 2019-07-08 2019-11-29 广东工业大学 一种基于随机森林的时尚手袋销售预测方法
CN110598923A (zh) * 2019-09-03 2019-12-20 深圳市得益节能科技股份有限公司 基于支持向量回归机优化与误差修正的空调负荷预测方法
CN111414875A (zh) * 2020-03-26 2020-07-14 电子科技大学 基于深度回归森林的三维点云头部姿态估计***
CN112728737A (zh) * 2021-01-05 2021-04-30 青岛海信日立空调***有限公司 一种空调器及云服务器

Similar Documents

Publication Publication Date Title
CN109345011A (zh) 一种基于深度回归森林的空调负荷预测方法及***
CN108280552B (zh) 基于深度学习的电力负荷预测方法和***、存储介质
Nichiforov et al. Deep learning techniques for load forecasting in large commercial buildings
CN109523021B (zh) 一种基于长短时记忆网络的动态网络结构预测方法
CN111144468A (zh) 电力用户信息标签化方法和装置、电子设备以及存储介质
CN109710404B (zh) 分布式***中的任务调度方法
CN107886160B (zh) 一种bp神经网络区间需水预测方法
Fan et al. Development of PCA-based cluster quantile regression (PCA-CQR) framework for streamflow prediction: Application to the Xiangxi river watershed, China
Muzumdar et al. Designing a robust and accurate model for consumer-centric short-term load forecasting in microgrid environment
WO2016188498A1 (zh) 一种无线网络吞吐量的评估方法及装置
CN113780684A (zh) 一种基于lstm神经网络的智慧楼宇用户用能行为预测方法
CN111723257A (zh) 基于用水规律的用户画像方法与***
Wang et al. Short-term load forecasting with LSTM based ensemble learning
CN116933318A (zh) 一种基于联邦学习的用电数据隐私保护方法
KR20170106686A (ko) 가정의 에너지 사용량 예측 방법 및 장치
CN115310355A (zh) 考虑多能耦合的综合能源***多元负荷预测方法及***
El Hanjri et al. Federated learning for water consumption forecasting in smart cities
CN113268929B (zh) 短期负荷区间预测方法及装置
CN116628534A (zh) 基于电力大数据的园区用能动态画像划分方法
CN113486933B (zh) 模型训练方法、用户身份信息预测方法及装置
CN115600498A (zh) 一种基于人工神经网络的风速预报订正方法
CN114021847A (zh) 基于isgu混合模型的短期电力负荷预测方法及***
CN111598390B (zh) 服务器高可用性评估方法、装置、设备和可读存储介质
Seresht et al. Application of fuzzy logic integrated with system dynamics in construction modeling
Goharian et al. Uncertainty propagation of hydrologic modeling in water supply system performance: Application of Markov chain Monte Carlo method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190215