CN113128113A - 一种基于深度学习和迁移学习的贫乏信息建筑负荷预测方法 - Google Patents
一种基于深度学习和迁移学习的贫乏信息建筑负荷预测方法 Download PDFInfo
- Publication number
- CN113128113A CN113128113A CN202110398185.6A CN202110398185A CN113128113A CN 113128113 A CN113128113 A CN 113128113A CN 202110398185 A CN202110398185 A CN 202110398185A CN 113128113 A CN113128113 A CN 113128113A
- Authority
- CN
- China
- Prior art keywords
- model
- data
- training
- building
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 238000013526 transfer learning Methods 0.000 title claims abstract description 33
- 238000013135 deep learning Methods 0.000 title claims abstract description 16
- 238000012549 training Methods 0.000 claims abstract description 51
- 238000007781 pre-processing Methods 0.000 claims abstract description 12
- 238000004088 simulation Methods 0.000 claims abstract description 4
- 238000005265 energy consumption Methods 0.000 claims description 26
- 238000013508 migration Methods 0.000 claims description 13
- 230000005012 migration Effects 0.000 claims description 13
- 238000010606 normalization Methods 0.000 claims description 10
- 238000012360 testing method Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000007774 longterm Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 230000036962 time dependent Effects 0.000 claims description 3
- 238000002474 experimental method Methods 0.000 abstract description 4
- 238000013527 convolutional neural network Methods 0.000 description 22
- 238000009826 distribution Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 10
- 238000013136 deep learning model Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 3
- 238000013486 operation strategy Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000001816 cooling Methods 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 238000013434 data augmentation Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000005338 heat storage Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 230000001617 migratory effect Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000005381 potential energy Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000011425 standardization method Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/08—Construction
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Strategic Management (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Primary Health Care (AREA)
- Operations Research (AREA)
- Computer Hardware Design (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Geometry (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Medical Informatics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于深度学习和迁移学习的贫乏信息建筑负荷预测方法,属电力领域。包括数据预处理;搭建一个带有注意层的2D‑CNN模型和一个基于迁移学习框架的seq2seq模型,用于模拟训练以及观察预测结果;采用预训练的方法从源域数据中提取知识,并将知识转移到目标域的任务中,用以提高模型的泛化性和鲁棒性;在目标域数据上训练一个预训练的模型,更新预训练的模型学习到的知识和表示,从而使预训练的结果得到利用。通过使用来自相似建筑的历史数据,提高目标建筑在信息贫乏情况下的负荷预测的准确性,并通过不同的实验来验证迁移学习模型在不同的预训练数据下的性能,从而提高了预测方法的精度。可广泛用于区域综合能源***的规划或设计领域。
Description
技术领域
本发明属于相连电力网络之间负荷分配的控制领域,尤其涉及一种用于区域综合能源***的模型预测方法。
背景技术
区域综合能源***(District Integrated Energy System,DIES)是指分布在用户端的能源综合利用***,以传统三联供CCHP(Combined Cooling Heating and Power,亦称冷热电三联供)为基础,结合当地可再生资源,向一定园区或建筑群同时提供冷、热、电和蒸汽需求。
在全球范围内,建筑能耗目前约占总能耗的40%,这使得建筑运营性能的优化在当今的世界建筑节能会议中至关重要。以我国建筑能耗为例,我国已成为第二大能源消费国,建筑能耗约占我国能源消耗总量的30%。因此,建筑能耗具有相当大的节能潜力。这就需要对建筑能耗进行准确的预测,因为预测的准确性将直接影响到建筑能源设备的控制策略,从而影响到建筑的潜在节能。因此,准确的建筑能耗预测对电网和需求管理的最终用户都有好处,可以进一步降低电网的运营风险。
准确预测建筑能耗可以极大地优化建筑设备的运行策略,释放建筑的节能潜力。随着计算机科学和智能电表的进步,数据驱动的能源预测模型,特别是深度学习模型,因其可以实现良好的预测精度,正变得越来越流行。然而,这些模型需要大量来自预测建筑物的历史数据来进行训练,而这些数据对于新建建筑物或有新测量设备的建筑物(简称为“贫乏信息建筑”)来说很难获得。
授权公告日为2020年9月25日,授权公告号为CN 108879692 B的中国发明专利,公开了“一种区域综合能源***能流分布预测方法及***”,,该方法包括以下步骤:采集多能流网络数据;构建多能流网络数据表示模型;挖掘能流分布相关的多源时空特征;输出能流分布预测结果。该***包括以下模块:多能流网络数据表示模块;能流分布空间特征提取模块;能流分布时序特征提取模块;能流分布外部因素特征提取模块;能流分布特征融合模块;能流分布预测输出模块。该加护方案基于网络表示学习方法和深度学习方法对多能流网络数据进行转化和分析,挖掘能流分布相关的时空特征和外部因素特征,为区域综合能源***能流分布状态预测问题提供新的方法和技术基础。但是,该技术方案首先需要掌握各能源节点能流信息和影响能流分布的外部因素信息,在训练阶段基于历史数据计算各时段的能流时空分布张量预测值和对应实际值的交叉熵损失值,通过交叉熵损失值迭代更新前述步骤中的神经网络模型参数。如前所述,该技术方案需要大量来自预测建筑物的历史数据来进行训练,而这些数据对于新建建筑物或有新测量设备的建筑物来说很难获得。
申请公布日为2018年12月4日,申请公布号为CN 108932560 A的发明专利申请,公开了一种“基于模型预测控制的园区综合能源***优化调度方法”,:根据选定的园区综合能源***,输入园区综合能源***的结构和参数;建立园区综合能源***运行约束;设定园区综合能源***滚动优化阶段预测域内运行费用和设备启停费用之和最小为目标函数,动态调整阶段单个时间间隔内运行费用和功率调整惩罚费用之和最小为目标函数;采用基于滚动优化的多时间尺度优化调度方法进行优化调度;输出***一个调度周期内调度计划:运行费用、太阳能热水***供热水功率、地源热泵和电锅炉启停指令、运行工况、供能功率、蓄热水箱运行工况和供能功率。该技术方案是在现有园区综合能源***的基础上,对园区综合能源***进行优化调度,可有效减小负荷以及可再生能源出力预测误差的影响,经济可靠地满足***用能需求。但是其不能应用于新建建筑物或有新测量设备的建筑物,在实际应用时受到一定的限制。
在区域综合能源***的规划或设计过程中,基于供需侧动态变化预测,及时调整***运行方式和运行策略是区域综合能源***运行的关键技术手段,也是目前区域综合能源***发展迫切需要解决的问题。在对于新建筑物的能耗预测过程中,如何能够通过对建筑能耗的准确预测,从而减少建筑的总能耗,是一个急待解决的实际技术问题。
发明内容
本发明所要解决的技术问题是提供一种基于深度学习和迁移学习的贫乏信息建筑负荷预测方法。其采用一个带有注意层的2D-CNN模型和一个基于迁移学习框架的seq2seq模型,通过使用来自相似建筑的历史数据,提高目标建筑在信息贫乏情况下的负荷预测的准确性,并通过不同的实验来验证迁移学习模型在不同的预训练数据下的性能,从而提高了传统预测方法的精度。
本发明的技术方案,提供了一种基于深度学习和迁移学习的贫乏信息建筑负荷预测方法,其特征在于,包括以下步骤:
第一步:数据预处理,将所有训练数据和测试数据加工成一个相对较小的规模,来提高模型的收敛速度和计算;
第二步:搭建一个带有注意层的2D-CNN模型和一个基于迁移学习框架的seq2seq模型,用于模拟训练以及观察预测结果;
第三步:采用预训练的方法从源域数据中提取知识,并将知识转移到目标域的任务中;数据增强被提出作为一种增加训练数据量的技术,用以提高模型的泛化性和鲁棒性;
第四步:微调在目标域数据上训练一个预训练的模型,可以更新预训练的模型学习到的知识和表示,从而使预训练的结果得到利用。
具体的,在第一步中所述数据预处理的方法,包括最大最小值法、z-score方法、对数标准化和独热编码one-hot code。
具体的,在第二步中,所述带注意层的2D-CNN模型带有注意层作为迁移学习和预测能量消耗的框架,并采用多注意层来捕捉时间依赖性特征;所述的基于迁移学习框架的seq2seq模型作为迁移学习的主要模型,为提高该模型的性能,使其记住长期信息,使用LSTM的两层作为编码器和解码器。
具体的,在第三步中所述的预训练中,预训练从源域获得一个完整的上下文向量,为了提取足够数量的高级特征,在类似的领域进行训练;在较大的源域上预训练模型,然后冻结一些顶层,并使用目标域数据微调这些层。
具体的,在第四步中,所述的微调在目标域数据上训练一个预训练的模型,从而更新预训练学习到的知识和表示,从而使预训练的结果得到利用。
与现有技术比较,本发明的优点是:
1.本发明的技术方案,将迁移学习应用到训练数据贫乏的区域综合能源***建筑负荷预测当中,通过使用来自相似建筑的历史数据,将其他相同类型建筑的能耗数据作为训练集的一部分进行训练,以期通过其他建筑的历史数据获取知识,来提高目标建筑在能源相关信息贫乏情况下的负荷预测的准确性;
2.本技术方案提出了两个新颖的深度学习模型:一个带有注意层的2D-CNN和一个基于迁移学习框架的seq2seq模型;搭建这些模型的目的是通过使用来自相似建筑的历史数据,提高目标建筑在信息贫乏情况下的负荷预测性能;
3.本技术方案采用两种深度学习模型和迁移学习框架对建筑能耗进行预测,通过不同的实验来验证迁移学习模型在不同的预训练数据下的性能,提升目标建筑的预测性能并获得更好的预测精度,而提高了传统预测方法的精度。
附图说明
图1为本发明基于深度学习和迁移学习的贫乏信息建筑负荷预测方法的方框图。
图2为本发明迁移学习方法示意图。
图3为简单的RNN网络图。
图4为LSTM单元的结构图。
图5为本发明seq2seq模型的框架图。
图6为本发明2D-CNN框架图。
图7为一个简单的数据增强的方法示意图。
图8为本发明微调策略示意图。
具体实施方式
下面结合附图对本发明做进一步说明。
精确预测建筑能耗可以显著优化建筑设备运行策略,释放建筑节能潜力。随着计算机科学和智能电表的进步,数据驱动的能源预测模型,特别是深度学***台的建筑来说,其建筑能耗信息通常来说较为稀缺,不足以单独使用自身的历史负荷数据训练模型。为了在这种不良信息状态下获得令人满意的预测精度,本技术方案中使用其他相同类型建筑的能耗数据作为训练集的一部分进行训练,使用两种不同方向中具有代表性的网络层,提出了两种迁移学习模型:(1)序列到序列(Sequence to Sequence)模型(以下简写为seq2seq),它使用LSTM作为编码器和解码器;(2)结合注意力(Attention)机制的二维卷积神经网络(2D Convolutional NeuralNetwork)模型(以下简写为2DCNN);它具有一个关注层,通过转移从类似建筑物中学习的知识来提高预测精度。并转移学习框架以提高目标建筑物的预测精度;以期通过其他建筑的历史数据获取知识,并提升目标建筑的预测性能并获得更好的预测精度。
如图1所示,本发明的技术方案,提供了一种基于深度学习和迁移学习的贫乏信息建筑负荷预测方法,包括以下步骤:
第一步:数据预处理,将所有训练数据和测试数据加工成一个相对较小的规模来提高模型的收敛速度和计算;
第二步:搭建一个带有注意层的2D-CNN模型和一个基于迁移学习框架的seq2seq模型,用于模拟训练以及观察预测结果;
第三步:采用预训练的方法从源域数据中提取知识,并将知识转移到目标域的任务中;数据增强被提出作为一种增加训练数据量的技术,用以提高模型的泛化性和鲁棒性;
第四步:微调在目标域数据上训练一个预训练的模型,可以更新预训练的模型学习到的知识和表示,从而使预训练的结果得到利用。为了满足迁移学习的要求,从源数据集中提取知识,所述的seq2seq模型和2D-CNN模型需要一个微调过程。
其中,步骤S1中数据预处理,将所有训练数据和测试数据加工成一个相对较小的规模来提高模型的收敛速度和计算,是机器学习模型和深度学习模型的关键步骤,可以显著提高模型的性能。如果不进行预处理,模型就会将价值相对较大的特征识别为对模型贡献更大的特征,性能将严重下降,模型可能无法收敛。当数据预处理过程运行时,模型中的每个特性可以保持相似的权重并对模型做出相似的贡献。因此,整个尺度范围的特征可以作为模型不可分割的一部分。
本技术方案中的数据预处理主要有四种方法:最大最小值法(min max)、z-score方法、对数标准化(log归一化)和独热编码法(one-hot code)。
最小最大方法是机器学习和深度学习领域中最有用的归一化方法之一。对于方差相对较小的数据,能保持数据的稳定性。此外,它可以在稀疏矩阵中保持一个0的条目。最小最大方法由方程表示:
式中,其中x为目标特征的值;Xmin和Xmax分别为该特征的最小值和最大值。这个方程限制了特征值,使它在提交给模型之前处于0到1之间;
z-score也称为标准化法,是另一种广泛使用的标准化方法。z分数可以表示为:
其中μ是所有x值的均值,σ表示它们的标准差。z是标准化x的结果;
由于测试数据集中标签的均值和标准差是未知的,因此使用z-score从测试数据集中获得合适的归一化结果可能比较困难,而采用log归一化方法可以解决上述问题,log归一化方法的表达式为:
对数规范化可以减轻数值稳定性差所造成的不利影响。此外,对数标准化也有利于物理意义参数的估计。
以上的标准化方法往往是对于数值型数据的预处理方法(如温度,湿度,能耗等),但数据中的类别特征(例如是否今日是否放假)往往需要独热编码进行处理。独热编码又称One-Hot编码,其方法是使用N位状态寄存器来对N个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候,其中只有一位有效。对于每一个特征,如果它有m个可能值,那么经过独热编码后,就变成了m个二元特征(例如,成绩这个特征,有“好”、“中”、“差”;变成独热编码就是100,010,001)。并且,这些特征互斥,每次只有一个激活。因此,数据的维度会变大,同时也较为稀疏。
单热编码对于具有分类值而非连续值的特性的场景是有效的。单热码是一组位,其中唯一合法的值组合是只有一个高(1)位,其他所有位都是低(0)的值。该方法能够对属性数据进行处理,对特征的扩展起到一定的作用。本技术方案中,对每种分类特征采用单热编码。
步骤S2中搭建了一个带有注意层的2D-CNN模型和一个基于迁移学习框架的seq2seq模型。
由于新建筑物和具有新能源监测平台的建筑物的良好信息的稀疏性,本技术方案使用来自相似建筑物的额外数据作为训练集的一部分,以提高预测性能并获得更好的预测结果。由于两栋建筑的能耗数据互不相同,该任务可归类为归纳迁移学习。
图2提供了迁移学习的技术流程,其整体过程大体可以分为五个部分组成:
(1)数据预处理:将所有的训练数据与测试数据归一化到一个相对小的范围内,这样有利于加速模型的计算与收敛速度;
(2)序列到序列(seq2seq)模型的构建:本技术方案通过构建一种seq2seq模型,用于迁移学习的能耗预测;
(3)二维卷积神经网络(2D CNN)与注意力(Attention)机制模型的构建:除去seq2seq模型外,本技术方案还将二维卷积神经网络与注意力机制相结合,构建了一种深度学习网络用于迁移学习预测;
(4)模型预训练(pretraining)与数据增强(data augmentation)方法:通过对源域的预训练让网络学习源域中的知识,保存权重为迁移学习做好准备,同时针对seq2seq模型使用数据量较大的问题,使用一种数据增强的方法专门解决seq2seq模型数据不足的问题;
(5)微调(fine-tuning):模型将源域的知识和权重保存并迁移至目标域的过程。
图3所示为一个简单的RNN网络图。其中X和o分别表示输入数据和输出数据;h为隐含层;U为连接输入层和隐含层的权值矩阵;V为隐含层与输出层之间的权值矩阵;W为两个隐含层在不同时间步长的权重矩阵。因此,时间步长t的输出Ot会受到时间步长t的输入Xt1和隐含层状态h的影响。因此,隐含层状态的传输过程使一个简单的RNN拥有前一个序列的内存。传统的人工神经网络只能对输入和输出分别进行寻址,并试图了解输入和输出之间的关系。但是,有些任务需要更好的处理序列信息的能力,这意味着前面的输出与后面的输出相关。LSTM是一种有效的递归神经网络(RNN)。它可以预测时间序列数据,比简单的RNNS更适合于长期时间序列的预测。LSTM神经网络由LSTM单元组成,LSTM单元包含三个特殊的门,分别为遗忘门,输入门,输出门。
图4所示为LSTM单元的结构图,在LSTM中,细胞状态类似于传送带,可以表示为从Ct 1到Ct的一条线。细胞状态可以直接在链上运行,只需要很少的线***互作用。这样,就很容易储存长期信息。然而,这条单线无法添加或删除信息。为了选择信息,LSTM单元把信息通过称为门的结构。
本发明的技术方案使用seq2seq作为迁移学习的主要模型框架。为了提高模型的性能,使其能够记住长期信息,本技术方案分别使用LSTM的两层作为编码器和解码器。
图5显示了该seq2seq模型的结构。图中,x和o分别为模型的输入数据和输出结果,c为编码器中的上下文向量,编码器和解码器中的隐藏状态分别由ht和st提供,其方程为:
ht=LSTMenc(xt,ht-1)
st=LSTMdec(Ot-1,St-1)
为了获得高水平的特征,本技术方案采用二维CNN进行特征提取,并提出了一种新的二维CNN模型,该模型带有注意层作为迁移学习和预测能量消耗的框架。在计算机视觉领域,二维CNN是特征提取的有效工具。由于卷积核的灵活性,通过特征映射很容易提取大量的特征。为了利用二维CNN提取特征,将一维数据特征重构为二维数据特征。
图6显示了这个特征提取过程是如何运作的。为了实现二维CNN,将原始的一维特征重新塑造为二维特征。在这种情况下,可以灵活地应用不同大小和数量的卷积核来提取高级特征。这些特征可以提高模型的性能,因为卷积核可以设置为不同的大小和不同的位置。该模型采用了多注意力层来捕捉时间依赖性特征。
步骤S3中采用预训练的方法从源域数据中提取知识,并将知识转移到目标域的任务中;数据增强被提出作为一种增加训练数据量的技术,用以提高模型的泛化性和鲁棒性。在具有注意力层模型和seq2seq迁移学习模型的2D CNN中,预训练是一个关键步骤,特别是因为预训练可以从源域获得一个完整的上下文向量。
图7所示是一个简单的数据增强的方法图。在数据增强之前,T1=m/n;在数据增强之后,T2=m-n;只要T2>T1,这个技术就会增加训练的样本。由于n通常会远远小于m,所以训练数据的数量肯定会增加。另外,在整个过程中,样品窗口的长度是相同的。考虑到办公楼的周期性,LSTM模型输入数据的时间步长均为7,即m=7。此外,由于CNN模型将使用一个多注意力层来考虑时间依赖性,这种数据增强将只适用于与LSTM层相关的模型。考虑到数据增强后的训练样本数量会远远超过预测目标,本技术方案中在模型的LSTM层和卷积层中添加正则化,防止过拟合,增强模型的泛化能力。
步骤S4中微调是指在目标域数据上训练一个预训练的模型,可以更新预训练的模型学习到的知识和表示,从而使预训练的结果得到利用。在深度学习和迁移学习领域,微调是一种非常重要的方法,因为它具有可行性和方便性。为了满足迁移学习的要求,从源数据集中提取知识,seq2seq模型和2D-CNN模型需要一个微调过程。在深度神经网络中,较低层通常包含较多的一般性特征。相比之下,顶层可能包含更多的特殊特性。根据神经网络的特点,本技术方案中可能会遇到四种不同的场景,以及四种相应的类别。
图8描述了对四种场景进行分类并指出处理每种类型的方法的坐标***。在图7的象限1中,目标域数据集与源域数据集不同,但大小较大。因此,由于有大量的数据,可以从头开始训练一个新的模型,而不是对预先训练的模型进行微调。该模型可以作为特征提取器。在象限2中,来自目标域的数据集大小较大,与源域的数据集相似。在这种情况下,尽管可能获得一个好的结果与任何策略,使用目标数据来调整预训练模型可能是最有效的,因为模型可以利用知识从源域和微调过程会比从头开始培训。象限3说明了一个非常困难的情况,其中目标数据集很小,并且与源域几乎没有相似之处。因此,可以只考虑对较低的层进行微调,但这可能不会产生令人满意的结果,因为数据集的大小很小。因此,也应该考虑应用数据增强技术。象限4描述与源域数据集类似的小目标数据集。在这里,可以微调模型的顶层(通常是一个密集的层),以从源领域转移知识。在本技术方案中,当迁移学习中存在seq2seq模型时,预训练的主要目的是训练上下文向量。在预训练完成后,需要从目标集中提取少量相似的数据进行微调。
经验算比对可知,与信息状态差的长短期记忆(LSTM)网络的结果相比,本技术方案采用seq2seq模型将具有少量数据的建筑物的平均绝对百分比误差(MAPE)提高了19.69个百分点,采用2D CNN模型平均提高了20.54个百分点。
鉴于DIES应用现状和风能城市适应性差的问题,本发明的技术方案,将迁移学习应用到训练数据贫乏的建筑负荷预测当中,通过使用来自相似建筑的历史数据,将其他相同类型建筑的能耗数据作为训练集的一部分进行训练,以期通过其他建筑的历史数据获取知识,来提高目标建筑在能源相关信息贫乏情况下的负荷预测的准确性,使用两种深度学习模型和迁移学习框架对建筑能耗进行预测,通过不同的实验来验证迁移学习模型在不同的预训练数据下的性能,提升目标建筑的预测性能并获得更好的预测精度,而提高了传统预测方法的精度。
本发明可广泛用于区域综合能源***的规划或设计领域。
Claims (5)
1.一种基于深度学习和迁移学习的贫乏信息建筑负荷预测方法,其特征在于,包括以下步骤:
第一步:数据预处理,将所有训练数据和测试数据加工成一个相对较小的规模,来提高模型的收敛速度和计算;
第二步:搭建一个带有注意层的2D-CNN模型和一个基于迁移学习框架的seq2seq模型,用于模拟训练以及观察预测结果;
第三步:采用预训练的方法从源域数据中提取知识,并将知识转移到目标域的任务中;数据增强被提出作为一种增加训练数据量的技术,用以提高模型的泛化性和鲁棒性;
第四步:微调在目标域数据上训练一个预训练的模型,可以更新预训练的模型学习到的知识和表示,从而使预训练的结果得到利用。
2.按照权利要求1所述的基于深度学习和迁移学习的贫乏信息建筑负荷预测方法,其特征在于第一步中所述数据预处理的方法,包括最大最小值法、z-score方法、对数标准化和独热编码one-hot code。
3.按照权利要求1所述的基于深度学习和迁移学习的贫乏信息建筑负荷预测方法,其特征在于在第二步中,所述带注意层的2D-CNN模型带有注意层作为迁移学习和预测能量消耗的框架,并采用多注意层来捕捉时间依赖性特征;所述的基于迁移学习框架的seq2seq模型作为迁移学习的主要模型,为提高该模型的性能,使其记住长期信息,使用LSTM的两层作为编码器和解码器。
4.按照权利要求1所述的基于深度学习和迁移学习的贫乏信息建筑负荷预测方法,其特征在于在第三步中所述的预训练中,预训练从源域获得一个完整的上下文向量,为了提取足够数量的高级特征,在类似的领域进行训练;在较大的源域上预训练模型,然后冻结一些顶层,并使用目标域数据微调这些层。
5.按照权利要求1所述的基于深度学习和迁移学习的贫乏信息建筑负荷预测方法,其特征在于在第四步中,所述的微调在目标域数据上训练一个预训练的模型,从而更新预训练学习到的知识和表示,从而使预训练的结果得到利用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110398185.6A CN113128113B (zh) | 2021-04-14 | 2021-04-14 | 一种基于深度学习和迁移学习的贫乏信息建筑负荷预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110398185.6A CN113128113B (zh) | 2021-04-14 | 2021-04-14 | 一种基于深度学习和迁移学习的贫乏信息建筑负荷预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113128113A true CN113128113A (zh) | 2021-07-16 |
CN113128113B CN113128113B (zh) | 2024-04-12 |
Family
ID=76776217
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110398185.6A Active CN113128113B (zh) | 2021-04-14 | 2021-04-14 | 一种基于深度学习和迁移学习的贫乏信息建筑负荷预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113128113B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108985268A (zh) * | 2018-08-16 | 2018-12-11 | 厦门大学 | 基于深度迁移学习的归纳式雷达高分辨距离像识别方法 |
CN113554361A (zh) * | 2021-09-22 | 2021-10-26 | 广东电网有限责任公司东莞供电局 | 一种综合能源***数据处理计算方法及处理*** |
CN113837464A (zh) * | 2021-09-22 | 2021-12-24 | 浙大城市学院 | 一种基于CNN-LSTM-Attention的热电联产锅炉负荷预测方法 |
CN115879190A (zh) * | 2022-10-17 | 2023-03-31 | 中国建筑科学研究院有限公司 | 模型构建方法及装置、建筑负荷预测方法及装置 |
CN116128049A (zh) * | 2023-04-04 | 2023-05-16 | 厦门大学 | 一种基于XGBoost模型的水质预测模型迁移条件选择方法 |
CN116644320A (zh) * | 2023-07-27 | 2023-08-25 | 浙江大有实业有限公司配电工程分公司 | 一种基于seq2seq的楼宇迁移非侵入式负荷监测方法 |
WO2024078530A1 (zh) * | 2022-10-11 | 2024-04-18 | 山东建筑大学 | 一种基于迁移学习的建筑冷热电负荷预测方法及*** |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110765966A (zh) * | 2019-10-30 | 2020-02-07 | 哈尔滨工业大学 | 一种面向手写文字的一阶段自动识别与翻译方法 |
CN111160628A (zh) * | 2019-12-13 | 2020-05-15 | 重庆邮电大学 | 一种基于CNN和双注意力seq2seq的空气污染物浓度预测方法 |
CN111191841A (zh) * | 2019-12-30 | 2020-05-22 | 润联软件***(深圳)有限公司 | 一种电力负荷预测方法、装置、计算机设备及存储介质 |
WO2021052159A1 (zh) * | 2019-09-20 | 2021-03-25 | 五邑大学 | 基于对抗迁移学习的人脸美丽预测方法及装置 |
-
2021
- 2021-04-14 CN CN202110398185.6A patent/CN113128113B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021052159A1 (zh) * | 2019-09-20 | 2021-03-25 | 五邑大学 | 基于对抗迁移学习的人脸美丽预测方法及装置 |
CN110765966A (zh) * | 2019-10-30 | 2020-02-07 | 哈尔滨工业大学 | 一种面向手写文字的一阶段自动识别与翻译方法 |
CN111160628A (zh) * | 2019-12-13 | 2020-05-15 | 重庆邮电大学 | 一种基于CNN和双注意力seq2seq的空气污染物浓度预测方法 |
CN111191841A (zh) * | 2019-12-30 | 2020-05-22 | 润联软件***(深圳)有限公司 | 一种电力负荷预测方法、装置、计算机设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
D’INCECCO M ET AL.: "Transfer learning for non-intrusive load monitoring", 《IEEE TRANSACTIONS ON SMART GRID》, vol. 11, no. 2, 31 December 2020 (2020-12-31), pages 1419 - 1429, XP011772402, DOI: 10.1109/TSG.2019.2938068 * |
王轲 等: "基于 seq2seq 和 Attention 机制的 居民用户非侵入式负荷分解", 《中国电机工程学报》, vol. 39, no. 1, 5 January 2019 (2019-01-05), pages 75 - 83 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108985268A (zh) * | 2018-08-16 | 2018-12-11 | 厦门大学 | 基于深度迁移学习的归纳式雷达高分辨距离像识别方法 |
CN108985268B (zh) * | 2018-08-16 | 2021-10-29 | 厦门大学 | 基于深度迁移学习的归纳式雷达高分辨距离像识别方法 |
CN113554361A (zh) * | 2021-09-22 | 2021-10-26 | 广东电网有限责任公司东莞供电局 | 一种综合能源***数据处理计算方法及处理*** |
CN113837464A (zh) * | 2021-09-22 | 2021-12-24 | 浙大城市学院 | 一种基于CNN-LSTM-Attention的热电联产锅炉负荷预测方法 |
WO2024078530A1 (zh) * | 2022-10-11 | 2024-04-18 | 山东建筑大学 | 一种基于迁移学习的建筑冷热电负荷预测方法及*** |
CN115879190A (zh) * | 2022-10-17 | 2023-03-31 | 中国建筑科学研究院有限公司 | 模型构建方法及装置、建筑负荷预测方法及装置 |
CN116128049A (zh) * | 2023-04-04 | 2023-05-16 | 厦门大学 | 一种基于XGBoost模型的水质预测模型迁移条件选择方法 |
CN116644320A (zh) * | 2023-07-27 | 2023-08-25 | 浙江大有实业有限公司配电工程分公司 | 一种基于seq2seq的楼宇迁移非侵入式负荷监测方法 |
CN116644320B (zh) * | 2023-07-27 | 2023-11-07 | 浙江大有实业有限公司配电工程分公司 | 一种基于seq2seq的楼宇迁移非侵入式负荷监测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113128113B (zh) | 2024-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113128113B (zh) | 一种基于深度学习和迁移学习的贫乏信息建筑负荷预测方法 | |
CN110705743B (zh) | 一种基于长短期记忆神经网络的新能源消纳电量预测方法 | |
CN111079989B (zh) | 一种基于dwt-pca-lstm的供水公司供水量预测装置 | |
CN112990556A (zh) | 一种基于Prophet-LSTM模型的用户用电能耗预测方法 | |
CN115688579B (zh) | 一种基于生成对抗网络的流域多点水位预测预警方法 | |
CN111915092B (zh) | 基于长短时记忆神经网络的超短期风电功率预测方法 | |
CN113554466A (zh) | 一种短期用电量预测模型构建方法、预测方法和装置 | |
CN112329990A (zh) | 一种基于lstm-bp神经网络的用户用电负荷预测方法 | |
CN114462718A (zh) | 基于时间滑动窗口的cnn-gru风电功率预测方法 | |
CN115409258A (zh) | 一种混合深度学习短期辐照度预测方法 | |
CN114781744A (zh) | 基于编码解码器的深度学习多步长辐照度预测方法 | |
CN115828768A (zh) | 一种数据驱动的配电网无功功率预测方法 | |
CN116345555A (zh) | 一种基于cnn-isca-lstm模型的短期光伏发电功率预测方法 | |
CN117748495A (zh) | 一种基于残差神经网络的光伏电站短期发电功率预测方法 | |
CN117132132A (zh) | 基于气象数据的光伏发电功率预测方法 | |
CN117709540A (zh) | 一种识别异常天气的短期母线负荷预测方法和*** | |
CN116014722A (zh) | 基于季节分解和卷积网络的次日光伏发电预测方法及*** | |
CN113762591B (zh) | 一种基于gru和多核svm对抗学习的短期电量预测方法及*** | |
CN117113086A (zh) | 一种储能机组负荷预测方法、***、电子设备及介质 | |
CN114254828B (zh) | 一种基于混合卷积特征提取器和gru的电力负荷预测方法 | |
CN115936062A (zh) | 基于场景生成与深度学习的光伏功率日前区间预测方法 | |
CN113128754A (zh) | 一种基于gru神经网络的居民用水预测***及预测方法 | |
Wu et al. | SSDP model with inflow clustering for hydropower system operation | |
Duong et al. | Application of Seasonal Trend Decomposition using Loess and Long Short-Term Memory in Peak Load Forecasting Model in Tien Giang | |
CN113836814B (zh) | 一种基于多流神经网络的太阳能能量预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |