CN112990556A - 一种基于Prophet-LSTM模型的用户用电能耗预测方法 - Google Patents
一种基于Prophet-LSTM模型的用户用电能耗预测方法 Download PDFInfo
- Publication number
- CN112990556A CN112990556A CN202110209867.8A CN202110209867A CN112990556A CN 112990556 A CN112990556 A CN 112990556A CN 202110209867 A CN202110209867 A CN 202110209867A CN 112990556 A CN112990556 A CN 112990556A
- Authority
- CN
- China
- Prior art keywords
- data
- model
- prediction
- prophet
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000012545 processing Methods 0.000 claims abstract description 18
- 230000000694 effects Effects 0.000 claims abstract description 14
- 230000002159 abnormal effect Effects 0.000 claims abstract description 12
- 238000007781 pre-processing Methods 0.000 claims abstract description 11
- 238000011156 evaluation Methods 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 27
- 238000012549 training Methods 0.000 claims description 27
- 230000008859 change Effects 0.000 claims description 13
- 238000012360 testing method Methods 0.000 claims description 12
- 238000013528 artificial neural network Methods 0.000 claims description 10
- 230000005611 electricity Effects 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 9
- 230000001932 seasonal effect Effects 0.000 claims description 8
- 230000000737 periodic effect Effects 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 7
- 238000013527 convolutional neural network Methods 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000011161 development Methods 0.000 claims description 4
- 238000010845 search algorithm Methods 0.000 claims description 4
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 claims description 3
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 125000004122 cyclic group Chemical group 0.000 claims description 3
- 238000000354 decomposition reaction Methods 0.000 claims description 3
- 230000008034 disappearance Effects 0.000 claims description 3
- 230000005284 excitation Effects 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 230000000306 recurrent effect Effects 0.000 claims description 3
- 238000007619 statistical method Methods 0.000 claims description 3
- 210000004027 cell Anatomy 0.000 description 6
- 238000005265 energy consumption Methods 0.000 description 5
- 239000002131 composite material Substances 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012731 temporal analysis Methods 0.000 description 2
- 238000000700 time series analysis Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Game Theory and Decision Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于Prophet‑LSTM模型的用户用电能耗预测方法,包括如下步骤:S1、通过智能电表获取用户用电能耗的历史数据,历史数据包括时序数据、天气温度数据和节假日数据;S2、历史数据数据预处理归一化:原始用电能耗数据为:X={x1,x2,...,xn},对原始数据预处理包括对缺失值、异常值、重复值以及无效值进行处理;S3、构建Prophet预测模型,将处理后历史用电能耗数据X′={x′1,x′2,...,x′n}输入到Prophet模型中,进行Prophet预测;S4、为防止预测过拟合,结合改进的长短时记忆网络LSTM模型进行组合预测;S5、衡量和验证组合模型的拟合度与预测效果,用常用评价指标。本发明分析用电能耗数据的特征和规律,提高预测模型的精确度,对国家电网及各供电公司制定有效的供电服务有重要的指导意义。
Description
技术领域
本发明设计时间序列分析和能耗预测领域,具体涉及一种基于Prophet-LSTM模型的用户用电能耗预测方法。
背景技术
对用户用电能耗进行分析预测,能够为国家电网或供电公司提供判断用户用电是否出现异常状况并提供相应的解决方案,相关的供电公司可以参照用电能耗的预测趋势,及时调整供电决策方案计划,提高供电服务的高效性和可靠性,促进节能减排意识发展,构建节约用电型社会。许多学者在此方面了一定的研究,但是用户用电能耗预测受到用户用电行为、负荷变化、节假日以及季节变化等诸多因素的综合影响,从而导致时间序列出现不平衡的趋势变化,而常用的预测模型没有对数据进行细致分解,导致预测结果欠佳。因此,建立高效的用户用电能耗预测模型是电力领域研究的热点之一。而Prophet是一种时间序列预测模型,一开始用于商业预测,如经济金融业等。它具有操作简单,参数模型复杂度低,计算预测时间短以及预测效果好等优点,迅速在各领域流行起来,但Prophet模型存在着在特殊时间点陷入过拟合的缺点,在展现时间序列的复合特征方面也存在不足,因此针对单一的预测模型存在的这弊端,会导致预测效果不好,本文提出利用改进的LSTM模型与Prophet模型结合的策略,融合两个模型的优势,来减少预测误差。
发明内容
本发明针对现有技术存在的技术问题,对用户用电历史能耗数据进行处理分析预测,提出一种基于Prophet-LSTM模型的用户用电能耗预测方法,组合模型不仅可以对用户历史能耗数据进行处理,还对数据中的趋势变化、节假日效应以及季节性趋势进行预测处理,能够很好的处理异常值、缺失值以及时间序列的复合特征,以提高预测结果精确度。
为了实现上述发明的目的,本发明采取如下的技术方案:
一种基于Prophet-LSTM模型的用户用电能耗预测方法,所述方法包括如下步骤:
S1、通过智能电表获取用户用电能耗的历史数据,历史数据包括时序数据、天气温度数据和节假日数据;其中时序数据包括不同时间的用电能耗数据,用来描述供电量需求量随着时间变化的情况。
S2、历史数据数据预处理归一化
原始用电能耗数据为:X={x1,x2,...,xn},对原始数据预处理包括对缺失值、异常值、重复值以及无效值进行处理;
进一步地,步骤2的具体实现:
(1)缺失数据与重复数据采用平均值、最大最小值计算方法代替缺失值或删除重复值;
(2)异常数据和无效数据采用统计方法计算出异常值和无效值进行删除或替代;
S3、构建Prophet预测模型,将处理后历史用电能耗数据X′={x′i,x′2,...,x′n}输入到Prophet模型中,进行Prophet预测;
进一步地,步骤3的具体实现:
(1)选取历史用电能耗数据样本数据,将选取的数据分成训练集数据Xr′={x′r1,x′r2,...,x′rn}和测试集数据Xt′={x′r1,x′t2,...,x′tn}。
(2)对训练数据建立的Prophet模型进行检验,步骤下:
a)Prophet模型将用电能耗时间序列数据分解为三个部分:趋势变化、节假日和季节趋势;分解函数公式如下:y(t)=g(t)+h(t)+s(t)+εt,其中g(t)是趋势变化函数,用来处理预测值中的非周期性变化;h(t)是节假日项表示假期节日对时序数据的影响;s(t)是周期项,用来处理时序数据中的周期性变化;εt是误差项表示模型中没有预测到的波动。
c)其中c表示预测模型的容量大小,k是趋势增长率,n是偏移参数,t是时间;
d)通过节假日数据信息,可知不同的节假日在不同的时间点是独立模型,因此节假日模型公式表示:其中ki表示节假日对预测值的影响,i是节假日,Di是窗口期中包含的时间t(若时间t是虚拟变量则Di为1,否则为0:
(3)训练集数据进行模型训练,测试集数据初步评估模型,并进行测试结果的参数调整,确定最终模型的趋势函数模型、周期个数和增长率、季节性和节假日拟合度,以此来进行用电能耗序列变化的分析和预测;
(4)通过Prophet预测模型可以很好的表现出时间序列发展过程,描绘时间序列趋势变化,得到不同的量化值;最终得到Prophet模型预测值P(t)。
S4、为防止预测过拟合,结合改进的LSTM模型进行组合预测;
进一步地,改进的LSTM模型预测的具体实现:
(1)针对传统的LSTM模型因记忆能力不足带有预测滞后的问题,对LSTM模型进行改进,在LSTM模型处理数据前,用卷积神经网络(CNN)提取高阶特征信息,同时去除无用的信息,改进后的LSTM模型减小了处理的数据量,提高了LSTM模型处理速度,两者使用相同的权重,不仅降低了网络负载增量,而且还提高LSTM网络记忆能力。
(2)LSTM(长短时记忆网络)通过增加门限解决梯度消失或梯度膨胀问题,在循环神经网络的基础上增加三个逻辑控制单元:输入门、输出门和遗忘门;在t时刻有改进的LSTM神经网络公式:
ft=(Wf·[ht-1,xt]+bf)
it=σ(Wi·[ht-1,xt]+bi)
ot=σ(Wo·[ht-1,xt]+bo)
ht=ot*tanhct
其中xt是t时刻的输入向量,xi′是经过卷积神经网络处理后输出向量,σ是sigmoid函数和tanh是双曲线正切函数,σ,tanh均为激活函数,遗忘门ft,输入门it和输出门ot对应的各门限的加权矩阵为Wf,Wi和Wo,各转换偏差值bf,bi和bo,*表示矩阵相乘,ct是在t时刻网络单元状态输出,即记忆单元,记忆单元的加权矩阵为Wc,转换偏差值bc,ct-1是遗忘门确定上一时刻记忆单元丢弃的信息,是更新记忆单元信息,ht是记忆单元输出的隐含信息,ht-1是记忆单元输入的隐含信息。
改进的LSTM模型训练步骤:
a、将t时刻的用电能耗值输入到输入层,通过激励函数计算输出结果;
b、用改进的LSTM网络模型对训练数据进行训练,多次训练后,选择误差最小的超参数作为预测模型参数,通过网络搜索算法确定模型的超参数,循环遍历的每一种参数组合,从中选取性能最好的最优参数;
c、对测试集数据使用改进的LSTM预测模型,得到第i天用户用电能耗预测值L(t)。
(3)最终将在t时刻的Prophet模型预测值P(t)与改进的LSTM模型预测值L(t)t=1,2,...,n组合预测后,与真实值进行对比,判断组合模型的预测效果。
S5、衡量和验证组合模型的拟合度与预测效果,用以下两个常用评价指标:均方根误差RMSE和平均绝对百分比MAPE,公式如下:
其中xi表示第i时刻时间序列真实值,di表示同一时刻时间序列预测值。
与现有技术相比,本发明的有益效果在于:
(1)传统的时间序列预测方法,通过建立数学模型拟合历史时间趋势曲线,数据简单有滞后性的问题,本发明采用的Prophet模型不仅是对历史时间数据曲线的拟合,还对数据中的周期趋势变化、节假日效应以及季节性趋势进行适应,尤其在对异常值和缺失值的鲁棒性起有效的作用。
(2)本发明分析用电能耗数据的特征和规律,提高预测模型的精确度,对国家电网及各供电公司制定有效的供电服务有重要的指导意义。
(3)单一的预测方法对于时间序列的复合特征的捕捉能力较差,为优化模型的预测效果,以不同时间序列处理分析方法融合复合模型,对用电能耗数据进行预测分析,本发明采用改进的LSTM模型与Prophet模型进行组合预测,再利用网络搜索算法来优化模型参数,可以提高预测效果。
附图说明
图1:基于Prophet-LSTM组合模型算法流程图
图2:Prophet模型预测工作流程图
图3:改进的LSTM神经网络结构图
具体实施方式
本实施例中,一种基于Prophet-LSTM模型的用户用电能耗预测方法,如图一所示,包括:
S1、通过智能电表获取用户用电能耗的历史数据,历史数据包括时序数据、天气温度数据和节假日数据;其中时序数据包括不同时间的用电能耗数据,用来描述供电量需求量随着时间变化的情况。
S2、历史数据数据预处理归一化
原始用电能耗数据为:X={x1,x2,...,xn},对原始数据预处理包括对缺失值、异常值、重复值以及无效值进行处理;
进一步地,步骤2的具体实现:
(1)缺失数据与重复数据采用平均值、最大最小值计算方法代替缺失值或删除重复值;
(2)异常数据和无效数据采用统计方法计算出异常值和无效值进行删除或替代;
S3、构建Prophet预测模型,如图二所示,将处理后历史用电能耗数据X′={x′1,x′2,...,x′n}输入到Prophet模型中,进行Prophet预测;
进一步地,步骤3的具体实现:
(1)选取历史用电能耗数据样本数据,将选取的数据分成训练集数据Xr′={x′r1,x′r2,...,x′rn}
和测试集数据Xt′={x′t1,x′t2,...,x′tn}。
(2)对训练数据建立的Prophet模型进行检验,步骤下:
a)Prophet模型将用电能耗时间序列数据分解为三个部分:趋势变化、节假日和季节趋势;分解函数公式如下:y(t)=g(t)+h(t)+s(t)+εt,其中g(t)是趋势变化函数,用来处理预测值中的非周期性变化;h(t)是节假日项表示假期节日对时序数据的影响;s(t)是周期项,用来处理时序数据中的周期性变化;εt是误差项表示模型中没有预测到的波动。
c)通过节假日数据信息,可知不同的节假日在不同的时间点是独立模型,因此节假日模型公式表示:其中ki表示节假日对预测值的影响,i是节假日,Di是窗口期中包含的时间t(若时间t是虚拟变量则Di为1,否则为0;
(3)训练集数据进行模型训练,测试集数据初步评估模型,并进行测试结果的参数调整,确定最终模型的趋势函数模型、周期个数和增长率、季节性和节假日拟合度,以此来进行用电能耗序列变化的分析和预测;
(4)通过Prophet预测模型可以很好的表现出时间序列发展过程,描绘时间序列趋势变化,得到不同的量化值;最终得到Prophet模型预测值P(t)。
S4、为防止预测过拟合,结合改进的LSTM模型进行组合预测,如图三所示;
进一步地,改进的LSTM模型预测的具体实现:
(1)针对传统的LSTM模型因记忆能力不足带有预测滞后的问题,对LSTM模型进行改进,在LSTM模型处理数据前,用卷积神经网络(CNN)提取高阶特征信息,同时去除无用的信息,改进后的LSTM模型减小了处理的数据量,提高了LSTM模型处理速度,两者使用相同的权重,不仅降低了网络负载增量,而且还提高LSTM网络记忆能力。
(2)LSTM(长短时记忆网络)通过增加门限解决梯度消失或梯度膨胀问题,在循环神经网络的基础上增加三个逻辑控制单元:输入门、输出门和遗忘门;在t时刻改进的LSTM神经网络公式:
ft=(Wf·[ht-1,xt]+bf)
it=σ(Wi·[ht-1,xt]+bi)
ot=σ(Wo·[ht-1,xt]+bo)
ht=ot*tanhct
其中xt是t时刻的输入向量,xt′是经过卷积神经网络处理后输出向量,σ是sigmoid函数和tanh是双曲线正切函数,σ,tanh均为激活函数,遗忘门ft,输入门it和输出门ot对应的各门限的加权矩阵为Wf,Wi和Wo,各转换偏差值bf,bi和bo,*表示矩阵相乘,ct是在t时刻网络单元状态输出,即记忆单元,记忆单元的加权矩阵为Wc,转换偏差值bc,ct-1是遗忘门确定上一时刻记忆单元丢弃的信息,是更新记忆单元信息,ht是记忆单元输出的隐含信息,ht-1是记忆单元输入的隐含信息。
改进的LSTM模型训练步骤:
a)将t时刻的用电能耗值输入到输入层,通过激励函数计算输出结果;
b)用改进的LSTM网络模型对训练数据进行训练,多次训练后,选择误差最小的超参数作为预测模型参数,通过网络搜索算法确定模型的超参数,循环遍历的每一种参数组合,从中选取性能最好的最优参数:以本发明数据集为例,建立三层LSTM模型,使其分别包含128、64、16个神经元,学习率learning_rate=0.3,激活函数activation_function=″tanh〞,batch_size=1000,epochs=10,损失函数loss=”MAE”;
c)对测试集数据使用改进的LSTM预测模型,得到第i天用户用电能耗预测值L(t)。
(3)最终将在t时刻的Prophet模型预测值P(t)与改进的LSTM模型预测值L(t)t=1,2,...,n组合预测后,与真实值进行对比,判断组合模型的预测效果。
S5、衡量和验证组合模型的拟合度与预测效果,用以下两个常用评价指标:均方根误差RMSE和平均绝对百分比MAPE,公式如下:
其中xi表示第i时刻时间序列真实值,di表示同一时刻时间序列预测值。
本发明通过组合Prophet模型和改进的LSTM模型并充分发挥了两种预测模型的优势,利用了网络搜索算法,将模型的参数进行了最优选择,可以提高预测模型的精确度,在时间序列分析和能耗预测领域,可以提供一定的参考。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
Claims (5)
1.一种基于Prophet-LSTM模型的用户用电能耗预测方法,其特征在于,包括如下步骤:
S1、通过智能电表获取用户用电能耗的历史数据,历史数据包括时序数据、天气温度数据和节假日数据;其中时序数据包括不同时间的用电能耗数据,用来描述供电量需求量随着时间变化的情况;
S2、历史数据数据预处理归一化:原始用电能耗数据为:X={x1,x2,...,xn},对原始数据预处理包括对缺失值、异常值、重复值以及无效值进行处理;
S3、构建Prophet预测模型,将处理后历史用电能耗数据X′={x′1,x′2,...,x′n}输入到Prophet模型中,进行Prophet预测;
S4、为防止预测过拟合,结合改进的长短时记忆网络LSTM模型进行组合预测;
S5、衡量和验证组合模型的拟合度与预测效果,用以下两个常用评价指标:均方根误差RMSE和平均绝对百分比MAPE,公式如下:
其中xi表示第i时刻时间序列真实值,di表示同一时刻时间序列预测值。
3.根据权利要求1所述的一种基于Prophet-LSTM模型的用户用电能耗预测方法,其特征在于,步骤S3的具体实现过程为:
3.1、选取历史用电能耗数据样本数据,将选取的数据分成训练集数据Xr′={x′r1,x′r2,...,x′rn}和测试集数据Xt′={x′r1,x′t2,...,x′tn};
3.2、对训练数据建立的Prophet模型进行检验;
3.3、训练集数据进行模型训练,测试集数据初步评估模型,并进行测试结果的参数调整,确定最终模型的趋势函数模型、周期个数和增长率、季节性和节假日拟合度,以此来进行用电能耗序列变化的分析和预测;通过Prophet预测模型能够表现出时间序列发展过程,描绘时间序列趋势变化,得到不同的量化值;最终得到Prophet模型预测值P(t)。
4.根据权利要求3所述的一种基于Prophet-LSTM模型的用户用电能耗预测方法,其特征在于,对训练数据建立的Prophet模型进行检验的步骤如下:
a、Prophet模型将用电能耗时间序列数据分解为三个部分:趋势变化、节假日和季节趋势;分解函数公式如下:y(t)=g(t)+h(t)+s(t)+εt,其中g(t)是趋势变化函数,用来处理预测值中的非周期性变化;h(t)是节假日项表示假期节日对时序数据的影响;s(t)是周期项,用来处理时序数据中的周期性变化;εt是误差项表示模型中没有预测到的波动;
c、通过节假日数据信息,可知不同的节假日在不同的时间点是独立模型,因此节假日模型公式表示:其中ki表示节假日对预测值的影响,i是节假日,Di是窗口期中包含的时间t,若时间t是虚拟变量则Di为1,否则为0;
5.根据权利要求1所述的一种基于Prophet-LSTM模型的用户用电能耗预测方法,其特征在于,所述步骤S4的具体实现为:
4.1、针对传统的LSTM模型因记忆能力不足带有预测滞后的问题,对LSTM模型进行改进,在LSTM模型处理数据前,用卷积神经网络CNN提取高阶特征信息,同时去除无用的信息,改进后的LSTM模型减小了处理的数据量,提高了LSTM模型处理速度,两者使用相同的权重,不仅降低了网络负载增量,而且还提高LSTM网络记忆能力;
4.2、LSTM通过增加门限解决梯度消失或梯度膨胀问题,在循环神经网络的基础上增加三个逻辑控制单元:输入门、输出门和遗忘门;在t时刻有改进的LSTM神经网络公式:
ft=(Wf·[ht-1,xt′]+bf)
it=σ(Wi·[ht-1,xt′]+bi)
ot=σ(Wo·[ht-1,xt′]+bo)
ht=ot*tanhct
其中xt是t时刻的输入向量,xt′是经过卷积神经网络处理后输出向量,σ是sigmoid函数和tanh是双曲线正切函数,σ,tanh均为激活函数,遗忘门ft,输入门it和输出门ot对应的各门限的加权矩阵为Wf,Wi和Wo,各转换偏差值bf,bi和bo,*表示矩阵相乘,ct是在t时刻网络单元状态输出,即记忆单元,记忆单元的加权矩阵为Wc,转换偏差值bc,ct-1是遗忘门确定上一时刻记忆单元丢弃的信息,是更新记忆单元信息,ht是记忆单元输出的隐含信息,ht-1是记忆单元输入的隐含信息;改进的LSTM模型训练步骤:
a、将t时刻的用电能耗值输入到输入层,通过激励函数计算输出结果;
b、用改进的LSTM网络模型对训练数据进行训练,多次训练后,选择误差最小的超参数作为预测模型参数,通过网络搜索算法确定模型的超参数,循环遍历的每一种参数组合,从中选取性能最好的最优参数;
c、对测试集数据使用改进的LSTM预测模型,得到第i天用户用电能耗预测值L(t)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110209867.8A CN112990556A (zh) | 2021-02-24 | 2021-02-24 | 一种基于Prophet-LSTM模型的用户用电能耗预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110209867.8A CN112990556A (zh) | 2021-02-24 | 2021-02-24 | 一种基于Prophet-LSTM模型的用户用电能耗预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112990556A true CN112990556A (zh) | 2021-06-18 |
Family
ID=76350440
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110209867.8A Pending CN112990556A (zh) | 2021-02-24 | 2021-02-24 | 一种基于Prophet-LSTM模型的用户用电能耗预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112990556A (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113537591A (zh) * | 2021-07-14 | 2021-10-22 | 北京琥珀创想科技有限公司 | 长期天气预测方法、装置、计算机设备及存储介质 |
CN113554464A (zh) * | 2021-07-22 | 2021-10-26 | 四川中烟工业有限责任公司 | 一种基于数据分析实现卷烟需求预测的方法及装置 |
CN113644834A (zh) * | 2021-10-14 | 2021-11-12 | 广东电网有限责任公司珠海供电局 | 一种模块化多电平换流器损耗评估方法及*** |
CN113705867A (zh) * | 2021-08-16 | 2021-11-26 | 浙江浙大中控信息技术有限公司 | 一种基于能耗区间预测的设备异常诊断方法 |
CN113743665A (zh) * | 2021-09-03 | 2021-12-03 | 国网湖南省电力有限公司 | 一种基于供电电网典型用户群用电负荷预测的方法 |
CN113837487A (zh) * | 2021-10-13 | 2021-12-24 | 国网湖南省电力有限公司 | 基于组合模型的电力***负荷预测方法 |
CN113835341A (zh) * | 2021-09-18 | 2021-12-24 | 中邮科通信技术股份有限公司 | 一种基于智能建筑ai的能耗分析诊断方法 |
CN114065667A (zh) * | 2021-11-19 | 2022-02-18 | 国网上海市电力公司 | 一种基于Prophet-LSTM模型的SF6设备气体压力预测方法 |
CN114169568A (zh) * | 2021-11-03 | 2022-03-11 | 国网浙江省电力有限公司瑞安市供电公司 | 基于Prophet模型的配电线路电流预测与重过载预警及*** |
CN114756604A (zh) * | 2022-06-13 | 2022-07-15 | 西南交通大学 | 一种基于Prophet组合模型的监测时序数据预测方法 |
CN115412567A (zh) * | 2022-08-09 | 2022-11-29 | 浪潮云信息技术股份公司 | 一种基于时间序列预测的云平台存储容量规划***及方法 |
CN115795255A (zh) * | 2022-09-21 | 2023-03-14 | 深圳大学 | 一种湿地的时间序列变化检测方法、装置、介质及终端 |
CN116011312A (zh) * | 2022-06-15 | 2023-04-25 | 盐城师范学院 | 一种基于多模型的桥梁应变应力数据预测方法 |
CN116090637A (zh) * | 2023-01-19 | 2023-05-09 | 国网江苏省电力有限公司苏州供电分公司 | 一种用电短时预测方法与*** |
CN116780658A (zh) * | 2023-08-17 | 2023-09-19 | 国网浙江省电力有限公司金华供电公司 | 考虑源-荷双侧不确定性的多能互补优化调度方法 |
CN117057488A (zh) * | 2023-10-12 | 2023-11-14 | 江南大学附属医院 | 基于人工智能模型的放射医疗设备工作量预测方法及*** |
CN117370330A (zh) * | 2023-12-07 | 2024-01-09 | 浙江有数数智科技有限公司 | 一种基于Prophet-SVM模型的大数据采集***的数据监控预警方法 |
CN117977815A (zh) * | 2024-03-29 | 2024-05-03 | 杭州互为综合能源服务有限公司 | 一种带用电预测功能的电能计量采集*** |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108830487A (zh) * | 2018-06-21 | 2018-11-16 | 王芊霖 | 基于长短时神经网络的电力负荷预测方法 |
CN109992608A (zh) * | 2019-03-26 | 2019-07-09 | 浙江大学 | 一种基于频域的多模型融合预测方法和*** |
CN110111036A (zh) * | 2019-03-28 | 2019-08-09 | 跨越速运集团有限公司 | 基于lstm模型融合的物流货量预测方法及*** |
CN111241755A (zh) * | 2020-02-24 | 2020-06-05 | 国网(苏州)城市能源研究院有限责任公司 | 电力负荷预测方法 |
CN111784043A (zh) * | 2020-06-29 | 2020-10-16 | 南京工程学院 | 一种基于模态gru学习网络的配电台区售电量精准预测方法 |
-
2021
- 2021-02-24 CN CN202110209867.8A patent/CN112990556A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108830487A (zh) * | 2018-06-21 | 2018-11-16 | 王芊霖 | 基于长短时神经网络的电力负荷预测方法 |
CN109992608A (zh) * | 2019-03-26 | 2019-07-09 | 浙江大学 | 一种基于频域的多模型融合预测方法和*** |
CN110111036A (zh) * | 2019-03-28 | 2019-08-09 | 跨越速运集团有限公司 | 基于lstm模型融合的物流货量预测方法及*** |
CN111241755A (zh) * | 2020-02-24 | 2020-06-05 | 国网(苏州)城市能源研究院有限责任公司 | 电力负荷预测方法 |
CN111784043A (zh) * | 2020-06-29 | 2020-10-16 | 南京工程学院 | 一种基于模态gru学习网络的配电台区售电量精准预测方法 |
Non-Patent Citations (1)
Title |
---|
赵英等: "基于LSTM-Prophet非线性组合的时间序列预测模型", 《计算机与现代化》, no. 09, 30 September 2020 (2020-09-30), pages 6 - 11 * |
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113537591A (zh) * | 2021-07-14 | 2021-10-22 | 北京琥珀创想科技有限公司 | 长期天气预测方法、装置、计算机设备及存储介质 |
CN113554464A (zh) * | 2021-07-22 | 2021-10-26 | 四川中烟工业有限责任公司 | 一种基于数据分析实现卷烟需求预测的方法及装置 |
CN113705867A (zh) * | 2021-08-16 | 2021-11-26 | 浙江浙大中控信息技术有限公司 | 一种基于能耗区间预测的设备异常诊断方法 |
CN113743665A (zh) * | 2021-09-03 | 2021-12-03 | 国网湖南省电力有限公司 | 一种基于供电电网典型用户群用电负荷预测的方法 |
CN113835341A (zh) * | 2021-09-18 | 2021-12-24 | 中邮科通信技术股份有限公司 | 一种基于智能建筑ai的能耗分析诊断方法 |
CN113835341B (zh) * | 2021-09-18 | 2024-05-17 | 中邮科通信技术股份有限公司 | 一种基于智能建筑ai的能耗分析诊断方法 |
CN113837487A (zh) * | 2021-10-13 | 2021-12-24 | 国网湖南省电力有限公司 | 基于组合模型的电力***负荷预测方法 |
CN113644834B (zh) * | 2021-10-14 | 2022-02-15 | 广东电网有限责任公司珠海供电局 | 一种模块化多电平换流器损耗评估方法及*** |
CN113644834A (zh) * | 2021-10-14 | 2021-11-12 | 广东电网有限责任公司珠海供电局 | 一种模块化多电平换流器损耗评估方法及*** |
CN114169568A (zh) * | 2021-11-03 | 2022-03-11 | 国网浙江省电力有限公司瑞安市供电公司 | 基于Prophet模型的配电线路电流预测与重过载预警及*** |
CN114065667A (zh) * | 2021-11-19 | 2022-02-18 | 国网上海市电力公司 | 一种基于Prophet-LSTM模型的SF6设备气体压力预测方法 |
CN114756604A (zh) * | 2022-06-13 | 2022-07-15 | 西南交通大学 | 一种基于Prophet组合模型的监测时序数据预测方法 |
CN114756604B (zh) * | 2022-06-13 | 2022-09-09 | 西南交通大学 | 一种基于Prophet组合模型的监测时序数据预测方法 |
CN116011312A (zh) * | 2022-06-15 | 2023-04-25 | 盐城师范学院 | 一种基于多模型的桥梁应变应力数据预测方法 |
CN115412567A (zh) * | 2022-08-09 | 2022-11-29 | 浪潮云信息技术股份公司 | 一种基于时间序列预测的云平台存储容量规划***及方法 |
CN115412567B (zh) * | 2022-08-09 | 2024-04-30 | 浪潮云信息技术股份公司 | 一种基于时间序列预测的云平台存储容量规划***及方法 |
CN115795255B (zh) * | 2022-09-21 | 2024-03-26 | 深圳大学 | 一种湿地的时间序列变化检测方法、装置、介质及终端 |
CN115795255A (zh) * | 2022-09-21 | 2023-03-14 | 深圳大学 | 一种湿地的时间序列变化检测方法、装置、介质及终端 |
CN116090637A (zh) * | 2023-01-19 | 2023-05-09 | 国网江苏省电力有限公司苏州供电分公司 | 一种用电短时预测方法与*** |
CN116780658A (zh) * | 2023-08-17 | 2023-09-19 | 国网浙江省电力有限公司金华供电公司 | 考虑源-荷双侧不确定性的多能互补优化调度方法 |
CN116780658B (zh) * | 2023-08-17 | 2023-11-10 | 国网浙江省电力有限公司金华供电公司 | 考虑源-荷双侧不确定性的多能互补优化调度方法 |
CN117057488A (zh) * | 2023-10-12 | 2023-11-14 | 江南大学附属医院 | 基于人工智能模型的放射医疗设备工作量预测方法及*** |
CN117057488B (zh) * | 2023-10-12 | 2023-12-26 | 江南大学附属医院 | 基于人工智能模型的放射医疗设备工作量预测方法及*** |
CN117370330A (zh) * | 2023-12-07 | 2024-01-09 | 浙江有数数智科技有限公司 | 一种基于Prophet-SVM模型的大数据采集***的数据监控预警方法 |
CN117977815A (zh) * | 2024-03-29 | 2024-05-03 | 杭州互为综合能源服务有限公司 | 一种带用电预测功能的电能计量采集*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112990556A (zh) | 一种基于Prophet-LSTM模型的用户用电能耗预测方法 | |
Ke et al. | Short-term electrical load forecasting method based on stacked auto-encoding and GRU neural network | |
Zhang et al. | Wind speed forecasting based on quantile regression minimal gated memory network and kernel density estimation | |
CN110705743B (zh) | 一种基于长短期记忆神经网络的新能源消纳电量预测方法 | |
CN111260136A (zh) | 一种基于arima-lstm组合模型的楼宇短期负荷预测方法 | |
CN113554466B (zh) | 一种短期用电量预测模型构建方法、预测方法和装置 | |
CN110598854A (zh) | 一种基于gru模型的台区线损率预测方法 | |
CN111241755A (zh) | 电力负荷预测方法 | |
CN111680786B (zh) | 一种基于改进权重门控单元的时序预测方法 | |
CN112329990A (zh) | 一种基于lstm-bp神经网络的用户用电负荷预测方法 | |
CN112434848A (zh) | 基于深度信念网络的非线性加权组合风电功率预测方法 | |
CN114218872B (zh) | 基于dbn-lstm半监督联合模型的剩余使用寿命预测方法 | |
CN113449919B (zh) | 一种基于特征和趋势感知的用电量预测方法及*** | |
CN113780684A (zh) | 一种基于lstm神经网络的智慧楼宇用户用能行为预测方法 | |
CN112803398A (zh) | 基于经验模态分解和深度神经网络的负荷预测方法及*** | |
CN113868938A (zh) | 基于分位数回归的短期负荷概率密度预测方法、装置及*** | |
Bian et al. | Load forecasting of hybrid deep learning model considering accumulated temperature effect | |
CN113762591B (zh) | 一种基于gru和多核svm对抗学习的短期电量预测方法及*** | |
CN115456287A (zh) | 一种基于长短时记忆网络的综合能源***多元负荷预测方法 | |
CN114819395A (zh) | 一种基于长短期记忆神经网络和支持向量回归组合模型的行业中长期负荷预测方法 | |
CN113033898A (zh) | 基于k均值聚类与bi-lstm神经网络的电负荷预测方法及*** | |
CN113128666A (zh) | 基于Mo-S-LSTMs模型的时间序列多步预测方法 | |
CN112232570A (zh) | 一种正向有功总电量预测方法、装置及可读存储介质 | |
CN117151770A (zh) | 一种基于注意力机制的lstm碳价预测方法和*** | |
Wang et al. | Cloud computing and extreme learning machine for a distributed energy consumption forecasting in equipment-manufacturing enterprises |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |