CN116596112A - 一种通用冷热电负荷预测方法及*** - Google Patents

一种通用冷热电负荷预测方法及*** Download PDF

Info

Publication number
CN116596112A
CN116596112A CN202310374025.7A CN202310374025A CN116596112A CN 116596112 A CN116596112 A CN 116596112A CN 202310374025 A CN202310374025 A CN 202310374025A CN 116596112 A CN116596112 A CN 116596112A
Authority
CN
China
Prior art keywords
parameter
parameters
model
load
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310374025.7A
Other languages
English (en)
Inventor
刘伟
须钢
朱明华
牛松
沈罡
周小慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Habo Energy Technology Suzhou Co ltd
Original Assignee
Habo Energy Technology Suzhou Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Habo Energy Technology Suzhou Co ltd filed Critical Habo Energy Technology Suzhou Co ltd
Priority to CN202310374025.7A priority Critical patent/CN116596112A/zh
Publication of CN116596112A publication Critical patent/CN116596112A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • G06F18/15Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/0985Hyperparameter optimisation; Meta-learning; Learning-to-learn
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种通用冷热电负荷预测方法及***,所述方法包括:获取历史时间中与将预测的目标负荷相关的影响参数,计算各影响参数与目标负荷之间的相关性,保留相关性较高的参数,实现数据降维;对数据进行预处理;建立多种机器学习的基础模型;将训练集数据带入多种机器学习模型中学习,完成学习参数的调整以及各项超参数的调整,获得不同机器学习算法适用于该类型或该项目的负荷预测的精度最高预测模型;将测试集数据带入各机器学习的精度最高预测模型进行精度验证,对各模型的拟合精度指标进行竞争评价对比,得到最优负荷预测模型。本发明的优势在于:具有通用性,降低了获取预测方法的人工成本,大幅提高了负荷预测的精度。

Description

一种通用冷热电负荷预测方法及***
技术领域
本发明属于建筑和工业的需求侧用能负荷预测领域,具体涉及一种通用冷热电负荷预测方法及***。
背景技术
随着城镇化进程和工业制造业的快速发展、人民生活水平的提高,对整体能源的需求量和品质越来越高,并且能源的种类更加多元化。新能源发电具有较大的不确定性,对电力的调度带来了更多的挑战;近些年在用电高峰时也出现部分限电的现象。因此实现对各类能源的消耗量的***,实现能源***的合理调度、提高能源***的稳定性显得尤为重要。
目前已有的基于数据驱动的机器学习方法应用于负荷预测领域,但是单一的模型和模型中的参数大多只适用于的一种或少数场景,不同类型的机器学习模型可能适用不同种类不同场景的负荷预测,例如:冷热负荷通常具有较强的滞后性,电力负荷通常与当前的状态关系较大;并且各类机器学习模型在为了获得较好的拟合精度时需要算法研究人员针对场景和类型进行多次参数调整,耗时耗力。
通过以上分析可以得出负荷预测有效支撑能源安全稳定的调度供应,在技术方面已有较多基于数据驱动的负荷预测方法可应用于单一场景,但未能实现多个算法并行并且自动调整参数提高拟合精度,方法通用性有待提高。因此建立一种基于多机器学习算法的自适应通用冷热电负荷预测方法,实现自动参数调整寻优,可适用于多场景多类型的负荷预测是亟待解决的问题。
发明内容
本发明的目的在于克服现有技术中单一的模型和模型中的参数大多只适用于的一种或少数场景,且各类机器学习模型在为了获得较好的拟合精度时需要算法研究人员针对场景和类型进行多次参数调整,耗时耗力的缺陷。
为了实现上述目的,本发明提出了一种通用冷热电负荷预测方法,所述方法包括:
步骤S1:获取历史时间中与将预测的目标负荷相关的影响参数,计算各影响参数与目标负荷之间的相关性,设置相关系数阈值,保留相关性超过相关系数阈值的参数,实现数据降维;
步骤S2:对数据异常值进行删除,补充缺失数据,对数据进行预处理;
步骤S3:建立多种机器学习的基础模型;
步骤S4:将训练集数据代入多种机器学习模型中学习,完成学习参数的调整以及各项超参数的调整,获得不同机器学习算法适用于该类型或该项目的负荷预测的精度最高预测模型;
步骤S5:将测试集数据带入各机器学习的精度最高预测模型进行精度验证,对各模型的拟合精度指标进行竞争评价对比,得到最优负荷预测模型。
作为上述方法的一种改进,步骤S1的所述计算各影响参数与目标负荷的之间的相关性具体为:
采用的相关系数计算方法为:
其中:r表示两个参数之间的相关系数;X表示自变量参数的值;X'表示自变量参数的平均值;Y表示因变量参数的值,Y'表示因变量参数的平均值。
作为上述方法的一种改进,步骤S3建立机器学习的基础模型包括XGBoost算法和LSTM长短期记忆神经网络。
作为上述方法的一种改进,XGBoost算法参数设置为:分类类型为reg:squarederror;树深度为4~16;树数量为20~200;学习率为0.1~0.7;正则化参数L2为0.8;最小的子节点权重阈值为1×10-7~1×10-4,损失减小阈值0;损失函数为RMSE。
作为上述方法的一种改进,LSTM长短期记忆神经网络参数设置为:随机失活参数为0.1~0.4;神经网络层数为3层;每层节点数为40~200;损失函数为MSE;迭代次数为15~45;优化器为Adam、Adadelta、SGD;学习率为1×10-4、批次大小8~32。
作为上述方法的一种改进,超参数调参方式具体为:遍历所有可能的超参数组合,得到最佳性能的超参数组合,搜索区间限定于离散数值,采用分参数搜索的方式降低搜索次数。
作为上述方法的一种改进,XGBoost算法使用的超参数调优步骤如下:
步骤B1:使用设定的离散区间实现对最大树深度和树数量的初步调节;所述设定的离散区间为:树深度的离散调参区间为[4,8,12,16],树数量的离散调参区间为[20,50,100,150,200];通过网络搜索获得初步优选树深度为Depth_1,树数量为Num_1;
步骤B2:在步骤B1的结果上缩小该2项参数的调参范围进行精细调参,在Depth_1±3范围内调整,离散间隔为1,在Num_1±20范围内调整,离散间隔为5,获得最优树深度Depth_2和树数量为Num_2;
步骤B3:对学习速率范围进行调节,调节范围区间为[0.1,0.3,0.5,0.7],获得最优学习速率lr;
步骤B4:在步骤B2的结果上比较测试集和训练集的拟合优度,判断是否过拟合,若拟合优度差大于0.1,则为过拟合,调整最小子节点权重阈值,调整区间为[10-4,10-5,10-6,10-7],直到测试集和训练集的拟合优度差小于0.1,最终获得最优参数以及模型。
作为上述方法的一种改进,LSTM长短期记忆神经网络超参数调优步骤如下:
步骤C1:对优化器和批次大小进行参数调节,优化器调参范围为[Adam、Adadelta、SGD],批次大小调参范围为[8,16,24,32],获得适用优化器和最优批次;
步骤C2:对各层网络节点数量进行初步调节,使用设定的离散区间实现对第一层隐含层节点数量进行初步调节;所述设定的离散区间为:第一层隐含层离散调参区间为[40,80,120,160,200];获得初步优选隐含层为Hid_1;
步骤C3:在步骤C2的结果上缩小第一层的隐含层节点调参范围进行精细调参,在Hid_1±2范围内调整,离散间隔为5,获得最优第一层隐含层节点数量为Hid_1_1。
步骤C4:重复步骤C2和步骤C3的步骤,获得第2、3层隐含层最优节点数量为Hid_2_2,Hid_3_3;
步骤C5:对随机失活参数进行调节,调节区间为[0.1,0.2,0.3,0.4],获得最优随机失活参数;
步骤C6:对迭代次数进行调节,调节区间为[15,20,25,30,35,40,45],获得最优迭代次数。
作为上述方法的一种改进,所述精度验证具体包括:
将测试集数据带入各机器学习的精度最高预测模型,分别计算各模型的拟合精度指标;
拟合精度指标包括:拟合优度、均方误差和平均绝对误差;
选择拟合优度高且均方误差和平均绝对误差低的模型作为最优负荷预测模型。
本发明还提供一种通用冷热电负荷预测***,基于上述任一方法实现,所述***包括:
数据处理模块:用于获取与负荷相关的历史数据,分析参数与负荷相关性,降低数据维度,对相关数据进行清洗并进行归一化处理,最后将数据集划分为训练集和测试集;
负荷预测模型建立模块:用于建立多个机器学习预测模型的初步模型,带入训练集数据,进行学习计算,调整模型中各项学习参数以及超参数,获得多个机器学习模型适用于该项目负荷预测的最佳模型;
模型评价保存模块:用于将测试集数据带入负荷预测模型建立模块输出的多个预测模型,获得预测结果,将预测结果与真值进行比较,运用多个指标评价模型精度,保留最佳预测模型。
与现有技术相比,本发明的优势在于:
本发明所述的通用冷热电负荷预测方法及***,获取与负荷相关的历史数据和当前状态数据后,可自动实现数据的相关性分析,降低数据维度和拟合成本,自动清洗数据对异常值进行处理,建立多种机器学习模型,实现除了学习参数以外各项超参数的自动调整,引入评价模型,实现模型择优保存,可获得适用于该类型该场景的最优模型。本发明对单一建筑、区域园区、工业领域均可自动实现以上过程,方法及***具有较强的通用性,降低人工成本的同时又大幅提高了负荷预测的精度。
附图说明
图1所示为通用冷热电负荷预测方法流程示意图
图2所示为本发明一个实例实现过程示意图;
图3所示为本发明一个实例运行流程图;
图4所示为负荷预测相关因素相关性分析结果示意图;
图5所示为LSTM神经网络原理示意图;
图6所示为XGBoost算法训练集模型预测结果示意图;
图7所示为XGBoost算法测试集模型预测结果示意图;
图8所示为LSTM神经网络算法训练集模型预测结果示意图;
图9所示为LSTM神经网络算法测试集模型预测结果示意图。
具体实施方式
下面结合附图对本发明的技术方案进行详细的说明。
本发明提供了一种通用冷热电负荷预测方法及***,实现了常规能源的负荷全过程自动化预测,机器学习模型的自动调参适应,人工成本低,预测精度高,满足工程实际要求。如图1所示,该方法包括:
步骤S1:获取历史时间中可能与将预测的目标负荷相关的影响参数,计算各影响参数与目标负荷之间的相关性,设置相关系数阈值,保留相关性较高的参数,实现数据主动降维;
步骤S2:利用非监督学习算法对数据异常值进行删除或补充缺失数据,并对数据进行预处理;
步骤S3:建立多种机器学习的基础模型,设置模型中各项关键参数以及主要参数调参寻优范围;
步骤S4:将训练集数据带入多种机器学习模型中学习,完成学习参数自动调整以及各项超参数的自动调整,获得不同机器学习算法适用于该类型或该项目的负荷预测的精度最高预测模型,并暂时保存;
步骤S5:将测试集数据带入各机器学习的最优模型进行精度验证,对各模型的拟合精度指标进行竞争评价对比,保存适用的最优负荷预测模型。
如图2、图3所示,作为本发明的一个实例,利用通用冷热电负荷预测方法对某项目的冷负荷的进行逐时预测,过程如下:
步骤S1:获取历史时间中可能与将预测的目标负荷相关的影响参数,自动识别计算各影响参数与目标负荷之间的相关系数,设置相关系数阈值,保留相关性较高的参数,实现数据主动降维。
可能与将预测的目标负荷相关的影响参数包括:当前室外温度、当前室外湿度、当前辐照度、人员作息、前1小时室外温度、前1小时室外湿度、前1小时辐照度、前24小时负荷、前2小时负荷、前1小时负荷。
所采用的相关系数计算方法为Pearson相关系数法,计算公式为:
其中:r为两个参数之间的相关系数,X为自变量参数的值,X'为自变量参数的平均值,Y为因变量参数的值,Y'为因变量参数的平均值。
分别计算各相关参数与预测负荷的相关系数,结果如图4和下表所示:
相关参数 Pearson相关系数
当前室外温度 0.38
当前室外湿度 0.15
当前辐照度 0.58
人员作息 0.88
前1小时室外温度 0.31
前1小时室外湿度 0.14
前1小时辐照度 0.58
前24小时负荷 0.70
前2小时负荷 0.74
前1小时负荷 0.89
通常相关系数0.8-1.0为极强相关,0.6-0.8为强相关,0.4-0.6为中等程度相关,0.2-0.4为弱相关,0.0-0.2为极弱相关或无相关;设置相关系数筛选阈值为0.2,即相关系数小于0.2的参数:当前室外湿度和前1小时室外湿度将被剔除,实现数据降维过程。
步骤S2:利用非监督学习算法对数据异常值进行删除或补充缺失数据,并对数据进行预处理。
非监督学习算法为K-means聚类算法,其技术原理为:在数据当中随机生成K个聚类中心,后计算数据当中每个样本到这K个聚类中心的距离,并将对应的样本分到距离最小的聚类中心所对应的簇当中,将所有样本归类之后,对于每一个簇重新计算每个簇的聚类中心,也就是每个簇中的所有样本的质心,重复上述操作,直到聚类中心不发生改变为止。
K-means聚类算法实现流程包括5个步骤:
步骤A1:随机选择K个点作为初始质心;
步骤A2:计算各点与各质心之间的欧式距离;
步骤A3:将每个点指派分到距离最小的质心,形成K个簇;
步骤A4:计算每个簇的均值,并将其更新为新的质心;
步骤A5:重复上述A2~A4的步骤,直至簇不再发生变化或达到最大迭代次数。
本实例中处理1个制冷季的冷负荷及相关参数,处理前数据总量为4104组,处理后数据总量为3805组,删除异常数据数量为299组。
数据进行预处理方法为:数据归一化处理,计算公式为:
其中:xi为原数据,min(x为参数中的最小值,maxx为参数中的最大值,x'为归一化后的数据,将处理后的数据分为训练集和测试集。
步骤S3:建立2种或2种以上机器学习的基础模型,设置模型中各项关键参数以及主要参数调参寻优范围;
建立机器学习包括XGBoost(Extreme Gradient Boosting)算法和LSTM(LongShort-Term Memory)长短期记忆神经网络,可应对大部分负荷预测场景。
XGBoost算法,是一种基于梯度增强树的集成算法,属于监督学习算法。该算法采用了多个决策树进行集成学习,每个决策树都对数据进行了不同的划分和特征选择,从而提高了负荷预测模型的准确率;该算法采用了正则化技术,可以有效地避免过拟合和欠拟合的问题,从而提高了负荷预测模型的鲁棒性;该算法可以输出每个特征的重要性,从而帮助我们了解模型是如何进行预测的,负荷预测模型可解释性较强;该算法采用了梯度提升算法,可以有效地减少计算量,从而提高了负荷预测模型的训练速度,综上所述,XGBoost算法在负荷预测领域具有高准确率、鲁棒性强、可解释性强、训练速度快等优点。
如图5所示,LSTM长短期记忆神经网络是一种特殊的RNN网络,具有四个神经网络层,且通过一种特殊的方式交互,其能够学习到长序列间的依赖,解决时间序列预测中梯度***或梯度消失问题,通过“门”(gate)来控制丢弃或者增加信息,从而实现遗忘或记忆的功能遗忘门ft根据上一时刻的单元状态Ct–1和xt决定要丢弃和保留的信息;输入门将输入xt分别经过σ和tanh决定要更新的数值并生成新的候选值来进行更新;输出门更新运算后的数值再与遗忘门ft一起更新单元状态。更新后的单元状态Ct经过tanh函数与输出门ot一起运算后输出ht,根据输出损失计算各个参数的下降梯度,根据下降梯度更新网络参数。
LSTM神经网络算法能够处理时间序列数据,这是因为它具有记忆单元和门控机制,可以有效地捕捉在负荷预测中时间序列数据中的长期依赖关系,从而提高了模型的准确率;该算法采用了正则化技术,可以有效地避免过拟合和欠拟合的问题,从而提高了负荷预测模型的鲁棒性;该算法可以同时考虑多个因素对负荷的影响,从而提高了预测模型的准确率。综上所述,LSTM神经网络算法在负荷预测领域具有能够处理时间序列数据、鲁棒性强、精度高等优点。
各项关键参数以及主要参数调参寻优范围过程:
对于XGBoost算法:
分类类型为reg:squarederror、树深度为4~16、树数量(迭代次数)为20~200、学习率为0.1~0.7、正则化参数L2为0.8、最小的子节点权重阈值为1×10-7~1×10-4、损失减小阈值0、损失函数为RMSE,其他参数采用缺省值。
对于LSTM长短期记忆神经网络:
数据维度即步骤B1中所保留的参数数量个数;随机失活参数为0.1~0.4;神经网络层数为3层;每层节点数为40~200;损失函数为MSE;迭代次数为15~45;优化器为Adam、Adadelta、SGD;学习率为1×10-4、批次大小8~32,其他参数采用缺省值。
步骤S4:将训练集数据带入步骤S3所述的2种以上机器学习模型中学习,利用超参数调优的方式实现对机器学习模型中各项参数自动调参,获得不同机器学习算法适用于该类型或该项目的负荷预测的精度最高预测模型,并暂时保存。
超参数调优为机器学习超参数调优,在常规机器学习中,除了内部需要学习训练的参数以外,还存在很多超参数,这些超参数对网络的影响也很大,在负荷预测领域面向不同场景时,机器学习为满足较好的预测精度通常需要不同的超参数,但这类参数的调整往往需要人工去完成费时费力,常见的超参数有:
1、网络结构:神经元之间的连接关系、层数、各层的神经元数量、激活函数等;
2、优化参数:优化方法、学习率、样本批量;
3、正则化参数等。
本实例的超参数调参方式为:遍历所有可能的超参数组合,得到最佳性能的超参数组合,搜索区间限定于离散数值,采用分参数搜索的方式降低搜索次数,节省计算时间。
XGBoost算法通常对树深度和树的数量较为敏感,因此进行粗调和细调;XGBoost超参数调优步骤如下:
步骤B1:使用较大的离散区间实现对最大树深度和树数量的初步调节,树深度的离散调参区间为[4,8,12,16],树数量的离散调参区间为[20,50,100,150,200],通过网络搜索获得初步优选树深度为Depth_1,树数量为Num_1;
步骤B2:在步骤B1的结果上缩小该2项参数的调参范围进行精细调参,在Depth_1±3范围内调整,离散间隔为1,在Num_1±20范围内调整,离散间隔为5,获得最优树深度Depth_2和树数量为Num_2。
步骤B3:对学习速率范围进行精细调节,调节范围区间为[0.1,0.3,0.5,0.7],获得最优学习速率lr;
步骤B4:在步骤B2的结果上比较测试集和训练集的拟合优度R2(如图7和图8所示),判断是否过拟合,若拟合优度R2差大于0.1,则为过拟合,调整最小子节点权重阈值,调整区间为[10-4,10-5,10-6,10-7],直到测试集和训练集的拟合优度差小于0.1,最终获得最优参数以及模型并保存。
本实例中获得的各项最优参数如下:
最大树深度为:6;
树数量为:190;
学习速率为:0.1;
最小的子节点权重阈值为缺省值,无需调整。
通常LSTM神经网络精度对网络对各层节点数量较为敏感,因此进行粗调和细调;LSTM长短期记忆神经网络超参数调优步骤如下:
步骤C1:首先对优化器和批次大小进行参数调节,优化器调参范围为[Adam、Adadelta、SGD],批次大小调参范围为[8,16,24,32],获得适用优化器和最优批次。
步骤C2:对各层网络节点数量进行初步调节,首先使用较大的离散区间实现对第一层隐含层节点数量进行初步调节,第一层隐含层离散调参区间为[40,80,120,160,200],获得初步优选隐含层为Hid_1。
步骤C3:在步骤C2的结果上缩小第一层的隐含层节点调参范围进行精细调参,在Hid_1±2范围内调整,离散间隔为5,获得最优第一层隐含层节点数量为Hid_1_1。
步骤C4:重复步骤C2和步骤C3的步骤,获得第2,3层隐含层最优节点数量为Hid_2_2,Hid_3_3。
步骤C5:对随机失活参数进行调节,调节区间为[0.1,0.2,0.3,0.4],获得最优随机失活参数。
步骤C6:对迭代次数进行调节,调节区间为[15,20,25,30,35,40,45],获得最优迭代次数。
本实例中获得的各项最优参数如下:
批次大小为:16
迭代次数为:35
优化器为:Adma
各层网络节点数量为:120,120,60
随机失活参数:0.2
LSTM神经网络算法训练集模型预测结果如图7所示。
步骤S5:将测试集数据带入步骤S4中获得最优模型进行精度验证,对各模型的拟合精度指标进行竞争评价对比,保存适用的最优负荷预测模型。
对各模型精度验证指标包括:拟合优度(R2)、均方误差(MSE)、平均绝对误差(MAE)。
拟合优度(R2)的计算公式为:
其中:yi为需预测的真值,fi为模型预测值,y'为预测真值的平均值,n为数据的数量。拟合优度值越高表明模型精度越高。
均方误差(MSE)的计算公式为:
其中:yi为需预测的真值,fi为模型预测值,n为数据的数量。均方误差越低表明模型精度越高。
平均绝对误差(MAE)的计算公式为:
其中:yi为需预测的真值,fi为模型预测值,n为数据的数量。平均绝对误差越低表明模型精度越高。
将测试集数据带入各模型的计算精度指标结果如下表所示:
XGBoost算法 LSTM长短期记忆神经网络
拟合优度(R2) 0.97 0.94
均方误差(MSE) 559 905
平均绝对误差(MAE) 9.47 13.24
XGBoost算法和LSTM神经网络算法测试集模型预测结果如图7和图9所示。
从计算结果可以看出,XGBoost算法在该场景下具有更高的拟合精度,***将保存该模型为最终模型用于未来负荷预测。
本发明还提供了一种通用冷热电负荷预测***,该***中包含的模块为:
数据处理模块:用于获取与负荷相关的历史数据,分析参数与负荷相关性,降低数据维度,对相关数据进行清洗并进行归一化处理,最后将数据集划分为训练集和测试集。
负荷预测模型建立模块:用于建立多个机器学习预测模型的初步模型,带入训练集数据,进行学习计算,自动调整模型中各项学习参数以及超参数,获得多个机器学习模型适用于该项目负荷预测的最佳模型。
模型评价保存模块:用于将测试集数据带入负荷预测模型建立模块输出的多个预测模型,获得预测结果,将预测结果与真值进行比较,运用多个指标评价模型精度,保留最佳预测模型。
本发明还可提供一种计算机设备,包括:至少一个处理器、存储器、至少一个网络接口和用户接口。该设备中的各个组件通过总线***耦合在一起。可理解,总线***用于实现这些组件之间的连接通信。总线***除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。
其中,用户接口可以包括显示器、键盘或者点击设备。例如,鼠标,轨迹球(trackball)、触感板或者触摸屏等。
可以理解,本申请公开实施例中的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(RandomAccess Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double DataRate SDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM,DRRAM)。本文描述的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
在一些实施方式中,存储器存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:操作***和应用程序。
其中,操作***,包含各种***程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序,包含各种应用程序,例如媒体播放器(Media Player)、浏览器(Browser)等,用于实现各种应用业务。实现本公开实施例方法的程序可以包含在应用程序中。
在本上述的实施例中,还可通过调用存储器存储的程序或指令,具体的,可以是应用程序中存储的程序或指令,处理器用于:
执行上述方法的步骤。
上述方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、现场可编程门阵列(Field Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行上述公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合上述公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
可以理解的是,本发明描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(Application Specific Integrated Circuits,ASIC)、数字信号处理器(Digital SignalProcessing,DSP)、数字信号处理设备(DSP Device,DSPD)、可编程逻辑设备(ProgrammableLogic Device,PLD)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。
对于软件实现,可通过执行本发明的功能模块(例如过程、函数等)来实现本发明技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
本发明还可提供一种非易失性存储介质,用于存储计算机程序。当该计算机程序被处理器执行时可以实现上述方法实施例中的各个步骤。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (10)

1.一种通用冷热电负荷预测方法,所述方法包括:
步骤S1:获取历史时间中与将预测的目标负荷相关的影响参数,计算各影响参数与目标负荷之间的相关性,设置相关系数阈值,保留相关性超过相关系数阈值的参数,实现数据降维;
步骤S2:对数据异常值进行删除,补充缺失数据,对数据进行预处理;
步骤S3:建立多种机器学习的基础模型;
步骤S4:将训练集数据代入多种机器学习模型中学习,完成学习参数的调整以及各项超参数的调整,获得不同机器学习算法适用于该类型或该项目的负荷预测的精度最高预测模型;
步骤S5:将测试集数据带入各机器学习的精度最高预测模型进行精度验证,对各模型的拟合精度指标进行竞争评价对比,得到最优负荷预测模型。
2.根据权利要求1所述的通用冷热电负荷预测方法,其特征在于,步骤S1的所述计算各影响参数与目标负荷之间的相关性具体为:
采用的相关系数计算方法为:
其中:r表示两个参数之间的相关系数;X表示自变量参数的值;X'表示自变量参数的平均值;Y表示因变量参数的值,Y'表示因变量参数的平均值。
3.根据权利要求1所述的通用冷热电负荷预测方法,其特征在于,步骤S3建立机器学习的基础模型包括XGBoost算法和LSTM长短期记忆神经网络。
4.根据权利要求3所述的通用冷热电负荷预测方法,其特征在于,XGBoost算法参数设置为:分类类型为reg:squarederror;树深度为4~16;树数量为20~200;学习率为0.1~0.7;正则化参数L2为0.8;最小的子节点权重阈值为1×10-7~1×10-4,损失减小阈值0;损失函数为RMSE。
5.根据权利要求3所述的通用冷热电负荷预测方法,其特征在于,LSTM长短期记忆神经网络参数设置为:随机失活参数为0.1~0.4;神经网络层数为3层;每层节点数为40~200;损失函数为MSE;迭代次数为15~45;优化器为Adam、Adadelta、SGD;学习率为1×10-4、批次大小8~32。
6.根据权利要求3所述的通用冷热电负荷预测方法,其特征在于,超参数调参方式具体为:遍历所有可能的超参数组合,得到最佳性能的超参数组合,搜索区间限定于离散数值,采用分参数搜索的方式降低搜索次数。
7.根据权利要求6所述的通用冷热电负荷预测方法,其特征在于,XGBoost算法使用的超参数调优步骤如下:
步骤B1:使用设定的离散区间实现对最大树深度和树数量的初步调节;所述设定的离散区间为:树深度的离散调参区间为[4,8,12,16],树数量的离散调参区间为[20,50,100,150,200];通过网络搜索获得初步优选树深度为Depth_1,树数量为Num_1;
步骤B2:在步骤B1的结果上缩小该2项参数的调参范围进行精细调参,在Depth_1±3范围内调整,离散间隔为1,在Num_1±20范围内调整,离散间隔为5,获得最优树深度Depth_2和树数量为Num_2;
步骤B3:对学习速率范围进行调节,调节范围区间为[0.1,0.3,0.5,0.7],获得最优学习速率lr;
步骤B4:在步骤B2的结果上比较测试集和训练集的拟合优度,判断是否过拟合,若拟合优度差大于0.1,则为过拟合,调整最小子节点权重阈值,调整区间为[10-4,10-5,10-6,10-7],直到测试集和训练集的拟合优度差小于0.1,最终获得最优参数以及模型。
8.根据权利要求6所述的通用冷热电负荷预测方法,其特征在于,LSTM长短期记忆神经网络超参数调优步骤如下:
步骤C1:对优化器和批次大小进行参数调节,优化器调参范围为[Adam、Adadelta、SGD],批次大小调参范围为[8,16,24,32],获得适用优化器和最优批次;
步骤C2:对各层网络节点数量进行初步调节,使用设定的离散区间实现对第一层隐含层节点数量进行初步调节;所述设定的离散区间为:第一层隐含层离散调参区间为[40,80,120,160,200];获得初步优选隐含层为Hid_1;
步骤C3:在步骤C2的结果上缩小第一层的隐含层节点调参范围进行精细调参,在Hid_1±2范围内调整,离散间隔为5,获得最优第一层隐含层节点数量为Hid_1_1;
步骤C4:重复步骤C2和步骤C3的步骤,获得第2、3层隐含层最优节点数量为Hid_2_2,Hid_3_3;
步骤C5:对随机失活参数进行调节,调节区间为[0.1,0.2,0.3,0.4],获得最优随机失活参数;
步骤C6:对迭代次数进行调节,调节区间为[15,20,25,30,35,40,45],获得最优迭代次数。
9.根据权利要求1所述的通用冷热电负荷预测方法,其特征在于,所述精度验证具体包括:
将测试集数据带入各机器学习的精度最高预测模型,分别计算各模型的拟合精度指标;
拟合精度指标包括:拟合优度、均方误差和平均绝对误差;
选择拟合优度高且均方误差和平均绝对误差低的模型作为最优负荷预测模型。
10.一种通用冷热电负荷预测***,基于权利要求1-9所述任一方法实现,其特征在于,所述***包括:
数据处理模块:用于获取与负荷相关的历史数据,分析参数与负荷相关性,降低数据维度,对相关数据进行清洗并进行归一化处理,最后将数据集划分为训练集和测试集;
负荷预测模型建立模块:用于建立多个机器学习预测模型的初步模型,带入训练集数据,进行学习计算,调整模型中各项学习参数以及超参数,获得多个机器学习模型适用于该项目负荷预测的最佳模型;和
模型评价保存模块:用于将测试集数据带入负荷预测模型建立模块输出的多个预测模型,获得预测结果,将预测结果与真值进行比较,运用多个指标评价模型精度,保留最佳预测模型。
CN202310374025.7A 2023-04-10 2023-04-10 一种通用冷热电负荷预测方法及*** Pending CN116596112A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310374025.7A CN116596112A (zh) 2023-04-10 2023-04-10 一种通用冷热电负荷预测方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310374025.7A CN116596112A (zh) 2023-04-10 2023-04-10 一种通用冷热电负荷预测方法及***

Publications (1)

Publication Number Publication Date
CN116596112A true CN116596112A (zh) 2023-08-15

Family

ID=87599704

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310374025.7A Pending CN116596112A (zh) 2023-04-10 2023-04-10 一种通用冷热电负荷预测方法及***

Country Status (1)

Country Link
CN (1) CN116596112A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117236800A (zh) * 2023-11-14 2023-12-15 齐信科技(北京)有限公司 一种多场景自适应的用电负荷预测方法及***
CN117648383A (zh) * 2024-01-30 2024-03-05 中国人民解放军国防科技大学 一种异构数据库实时数据同步方法、装置、设备及介质
CN117674302A (zh) * 2024-02-01 2024-03-08 浙江省白马湖实验室有限公司 一种基于两阶段集成学习的热电联供负荷调度方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113762534A (zh) * 2021-09-10 2021-12-07 广东电网有限责任公司 一种建筑冷热负荷预测方法、装置、设备及存储介质
CN114548509A (zh) * 2022-01-18 2022-05-27 湖南大学 一种多能源***多类型负荷联合预测方法及***
CN115470862A (zh) * 2022-10-06 2022-12-13 东南大学 动态自适应负荷预测模型组合方法
CN115587672A (zh) * 2022-11-09 2023-01-10 国网湖南省电力有限公司 一种配变负荷预测及重过载预警方法及***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113762534A (zh) * 2021-09-10 2021-12-07 广东电网有限责任公司 一种建筑冷热负荷预测方法、装置、设备及存储介质
CN114548509A (zh) * 2022-01-18 2022-05-27 湖南大学 一种多能源***多类型负荷联合预测方法及***
CN115470862A (zh) * 2022-10-06 2022-12-13 东南大学 动态自适应负荷预测模型组合方法
CN115587672A (zh) * 2022-11-09 2023-01-10 国网湖南省电力有限公司 一种配变负荷预测及重过载预警方法及***

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117236800A (zh) * 2023-11-14 2023-12-15 齐信科技(北京)有限公司 一种多场景自适应的用电负荷预测方法及***
CN117236800B (zh) * 2023-11-14 2024-02-20 齐信科技(北京)有限公司 一种多场景自适应的用电负荷预测方法及***
CN117648383A (zh) * 2024-01-30 2024-03-05 中国人民解放军国防科技大学 一种异构数据库实时数据同步方法、装置、设备及介质
CN117648383B (zh) * 2024-01-30 2024-06-11 中国人民解放军国防科技大学 一种异构数据库实时数据同步方法、装置、设备及介质
CN117674302A (zh) * 2024-02-01 2024-03-08 浙江省白马湖实验室有限公司 一种基于两阶段集成学习的热电联供负荷调度方法
CN117674302B (zh) * 2024-02-01 2024-05-03 浙江省白马湖实验室有限公司 一种基于两阶段集成学习的热电联供负荷调度方法

Similar Documents

Publication Publication Date Title
CN116596112A (zh) 一种通用冷热电负荷预测方法及***
CN113609779B (zh) 分布式机器学习的建模方法、装置及设备
Fan et al. Design for auto-tuning PID controller based on genetic algorithms
CN112734135A (zh) 一种电力负荷预测方法、智能终端及计算机可读存储介质
CN113887801A (zh) 建筑冷负荷预测方法、***、设备及可读存储介质
CN115049019B (zh) 金属有机框架对砷的吸附性能评估方法、装置及相关设备
CN115470862A (zh) 动态自适应负荷预测模型组合方法
CN115906399A (zh) 一种改进的小样本数据下产品关键工艺质量预测方法
CN115758912A (zh) 一种空调能耗优化***
CN116796141A (zh) 一种基于gbdt回归模型的办公建筑能耗预测方法
CN113762591B (zh) 一种基于gru和多核svm对抗学习的短期电量预测方法及***
CN116822672A (zh) 一种空调冷负荷预测优化方法、***
CN113239503B (zh) 基于改进k-means聚类算法的新能源出力场景分析方法及***
CN113408802B (zh) 能耗预测网络的训练、能耗预测方法、装置和计算机设备
CN113592064A (zh) 环抛机工艺参数预测方法、***、应用、终端及介质
CN117477561A (zh) 居民家用负荷概率预测方法及***
CN117277312A (zh) 一种基于灰色关联分析的电力负荷影响因素方法及设备
CN111027760B (zh) 一种基于最小二乘向量机的电力负荷预测方法
CN113033898A (zh) 基于k均值聚类与bi-lstm神经网络的电负荷预测方法及***
CN112862216A (zh) 一种基于深度置信网络的多行业能源需求预测方法
CN110059871B (zh) 光伏发电功率预测方法
CN112990603B (zh) 考虑频域分解后数据特征的空调冷负荷预测方法及***
CN113963758A (zh) 无序材料热力学稳定结构的预测推荐方法、设备、终端
CN110782950A (zh) 基于偏好网格和莱维飞行的多目标粒子群算法的肿瘤关键基因识别方法
CN111639799B (zh) 基于卷积轻量级梯度提升树的负荷总功率预测方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination