CN116090637A - 一种用电短时预测方法与*** - Google Patents
一种用电短时预测方法与*** Download PDFInfo
- Publication number
- CN116090637A CN116090637A CN202310060036.8A CN202310060036A CN116090637A CN 116090637 A CN116090637 A CN 116090637A CN 202310060036 A CN202310060036 A CN 202310060036A CN 116090637 A CN116090637 A CN 116090637A
- Authority
- CN
- China
- Prior art keywords
- power consumption
- electricity consumption
- consumption data
- short
- gate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005611 electricity Effects 0.000 title claims abstract description 92
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000003860 storage Methods 0.000 claims description 27
- 230000004913 activation Effects 0.000 claims description 12
- 238000011176 pooling Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000006467 substitution reaction Methods 0.000 claims description 3
- 238000012549 training Methods 0.000 abstract description 15
- 238000013528 artificial neural network Methods 0.000 abstract description 13
- 238000009826 distribution Methods 0.000 abstract description 5
- 230000002349 favourable effect Effects 0.000 abstract description 4
- 230000007787 long-term memory Effects 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 28
- 238000013527 convolutional neural network Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 12
- 230000015654 memory Effects 0.000 description 9
- 238000012545 processing Methods 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000002679 ablation Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000005612 types of electricity Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Operations Research (AREA)
- Primary Health Care (AREA)
- Life Sciences & Earth Sciences (AREA)
- Quality & Reliability (AREA)
- Biomedical Technology (AREA)
- Entrepreneurship & Innovation (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种用电短时预测方法与***,主要提供了一种能够有强适应性,准确度高的企业用电量短时预测方法,其在传统的长短期记忆人工神经网络上增加了二分类对企业用电量进行分类,将其分为工作日用电量与节假日用电量,并且引入了外部影响因素,例如:平均股价,净利润,总营收等等,进行神经网络的模型训练之后在注意力层进行权重的分配,最后输出短时预测结果;能够在对于电力数据的短时预测结果上产生更为准确的结果,有助于以数据为驱动,结合企业的情况更好地进行管理与实施战略部署。
Description
技术领域
本发明属于数据预测技术领域,具体涉及一种用电短时预测方法与***。
背景技术
对于企业的用电量短时预测研究能够帮助企业进行数据分析,能够进行对于企业的具体情况进行分析,随时进行计划的调整。
传统的数据分析方法虽然在一定程度上可以解决相关的预测问题,却仍然有一定缺陷:
基于支持向量机的方法:支持向量机性能的优劣主要取决于核函数的选取,所以对于一个实际问题而言,如何根据实际的数据模型选择合适的核函数从而构造SVM算法。目前比较成熟的核函数及其参数的选择都是人为的,根据经验来选取的,带有一定的随意性。
基于BP神经网络的方法:一般情况下,训练能力差时,预测能力也差,并且一定程度上,随着训练能力地提高,预测能力会得到提高。但这种趋势不是固定的,其有一个极限,当达到此极限时,随着训练能力的提高,预测能力反而会下降,也即出现所谓“过拟合”现象。出现该现象的原因是网络学习了过多的样本细节导致,学习出的模型已不能反映样本内含的规律,所以如何把握好学习的度,解决网络预测能力和训练能力间矛盾问题也是BP神经网络的重要研究内容。
基于长短期记忆人工神经网络的方法:LSTM与RNNs一样比CNN能更好地处理时间序列的任务;同时LSTM解决了RNN的长期依赖问题,并且缓解了RNN在训练时反向传播带来的“梯度消失”问题。LSTM本身的模型结构就相对复杂,训练比起CNN来说更加耗时;此外,RNN网络的特性决定了它们不能很好的并行化处理数据;再者,LSTM虽然一定程度上缓解了RNN的长期依赖问题,但对于更长的序列数据,LSTM也是很棘手的。
发明内容
为解决现有技术中存在的不足,本发明提供一种用电短时预测方法与***,主要提供了一种能够有强适应性,准确度高的企业用电量短时预测方法,其在传统的长短期记忆人工神经网络上增加了二分类对企业用电量进行分类,将其分为工作日用电量与节假日用电量,并且引入了外部影响因素,例如:平均股价,净利润,总营收等等,进行神经网络的模型训练之后在注意力层进行权重的分配,最后输出短时预测结果;能够在对于电力数据的短时预测结果上产生更为准确的结果,有助于以数据为驱动,结合企业的情况更好地进行管理与实施战略部署。
本发明采用如下的技术方案。
一种用电短时预测方法,包括如下步骤:
步骤1,获取企业的多个用电量数据,并对其进行分类;
步骤2,将多个用电量数据,代入到CNN模型中;
步骤3,将所有特征值lt按照时间顺序,输入LSTM模型中。
优选地,所述步骤1中的多个用电量数据X如下式所示:
X=[x1,x2,…xt…,xn]
xt=[Pt,ht,…]
其中,xt为第t个用电量数据,Pt为作为第t个用电量数据的用电量的总用电能耗,ht为第t个用电量数据的分类参数,n为用电量数据数量,t的取值范围为从1到n的正整数。
优选地,ht=0or 1,其中,0表示节假日,1表示工作日。
优选地,xt如下式所示:
xt=[Pt,ht,pt,st,mt,…]
其中,pt为第t个用电量数据所属的那一天企业的净利润,st为第t个用电量数据所属的那一天企业的平均股价,mt为第t个用电量数据所属的那一天企业的营收总额。
优选地,所述步骤2具体包括:
步骤2.1,利用CNN模型中的卷积层,提取出多个用电量数据的特征值lt:
lt=tanh(xt*kt+bt)
其中,tanh为激活函数,xt为作为输入向量的第t个用电量数据,kt为针对第t个用电量数据的卷积核的权值,bt为针对第t个用电量数据的卷积核的偏置;
步骤2.2,将特征值lt代入到CNN模型中的池化层,从而降低特征值lt的维数。
优选地,所述步骤3具体包括:
步骤3.1,计算遗忘门的输出值ft:
ft=σ(wf·[lt-1,xt]+bf)
其中,ft的取值范围为(0,1),wf为遗忘门的权重,bf为遗忘门的偏置;
it=σ(wi*[lt-1,xt]+bi)
其中it取值范围为(0,1),wi为输入门的权重,bi为输入门的偏置,wk为候选输入门的权重,bk为候选输入门的偏置;
步骤3.3,更新得到当前单元格状态Ct,如下式所示:
其中Ct的取值范围是(0,1);
步骤3.4,计算输出门的输出值Ot,如下式所示:
Ot=σ(wh·[ht-1,xt]+bh)
其中Ot的取值范围为(0,1),wh为输出门的权值,bh为输出门的偏置;
步骤3.5,通过计算输出门的输出Ot和当前单元格状态Ct得到LSTM的输出值ht,如下式所示:
ht=Ot*tanh(Ct)。
一种用电短时预测***,包括:
获取模块,所述获取模块用于获取企业的多个用电量数据,并对其进行分类;
代入模块,所述代入模块用于将多个用电量数据,代入到CNN模型中;
输入模块,所述输入模块用于将所有特征值lt按照时间顺序,输入LSTM模型中。
优选地,所述多个用电量数据X如下式所示:
X=[x1,x2,…xt…,xn]
xt=[Pt,ht,…]
其中,xt为第t个用电量数据,Pt为作为第t个用电量数据的用电量的总用电能耗,ht为第t个用电量数据的分类参数,n为用电量数据数量,t的取值范围为从1到n的正整数。
优选地,ht=0or 1,其中,0表示节假日,1表示工作日。
优选地,xt如下式所示:
xt=[Pt,ht,pt,st,mt,…]
其中,pt为第t个用电量数据所属的那一天企业的净利润,st为第t个用电量数据所属的那一天企业的平均股价,mt为第t个用电量数据所属的那一天企业的营收总额。
优选地,所述代入模块还用于利用CNN模型中的卷积层,提取出多个用电量数据的特征值lt:
lt=tanh(xt*kt+bt)
其中,tanh为激活函数,xt为作为输入向量的第t个用电量数据,kt为针对第t个用电量数据的卷积核的权值,bt为针对第t个用电量数据的卷积核的偏置;用于将特征值lt代入到CNN模型中的池化层,从而降低特征值lt的维数。
优选地,所述输入模块还用于计算遗忘门的输出值ft:
ft=σ(wf·[lt-1,xt]+bf)
it=σ(wi·[lt-1,xt]+bi)
其中it取值范围为(0,1),wi为输入门的权重,bi为输入门的偏置,wk为候选输入门的权重,bk为候选输入门的偏置;用于更新得到当前单元格状态Ct,如下式所示:
其中Ct的取值范围是(0,1);用于计算输出门的输出值Ot,如下式所示:
Ot=σ(wh·[ht-1,xt]+bh)
其中Ot的取值范围为(0,1),wh为输出门的权值,bh为输出门的偏置;用于通过计算输出门的输出Ot和当前单元格状态Ct得到LSTM的输出值ht,如下式所示:
ht=Ot*tanh(Ct)。
一种终端,包括处理器及存储介质;其特征在于:
所述存储介质用于存储指令;
所述处理器用于根据所述指令进行操作以执行所述用电短时预测方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现所述用电短时预测方法的步骤。
本发明的有益效果在于,与现有技术相比,本发明在传统的长短期记忆人工神经网络上增加了二分类对企业用电量进行分类,将其分为工作日用电量与节假日用电量,并且引入了外部影响因素,例如:平均股价,净利润,总营收等等,进行神经网络的模型训练之后在注意力层进行权重的分配,最后输出短时预测结果;能够在对于电力数据的短时预测结果上产生更为准确的结果,有助于以数据为驱动,结合企业的情况更好地进行管理与实施战略部署。
附图说明
图1是本发明中所述步骤1到步骤3的流程图;
图2是本发明中所述步骤2.1到步骤2.2的流程图;
图3是本发明中所述步骤3.1到步骤3.5的流程图;
图4是本发明中所述类CNN的encoder与decoder结构模型示意图;
图5是本发明中所述用电短时预测***的结构示意图。
具体实施方式
本发明属于数据预测技术领域,特别涉及一种时间序列数据预测方法。
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明的技术方案进行清楚、完整地描述。本申请所描述的实施例仅仅是本发明一部分的实施例,而不是全部实施例。基于本发明精神,本领域普通技术人员在没有作出创造性劳动前提下所获得的有所其它实施例,都属于本发明的保护范围。
对于企业的用电量短时预测研究能够帮助企业进行数据分析,能够进行对于企业的具体情况进行分析,随时进行计划的调整。本发明在传统的长短期记忆人工神经网络上增加了二分类对企业用电量进行分类,将其分为工作日用电量与节假日用电量,并且引入了外部影响因素,例如:平均股价,净利润,总营收等等,进行神经网络的模型训练之后在注意力层进行权重的分配,最后输出短时预测结果。
如图1所示,本发明所述的一种用电短时预测方法,包括如下步骤:
步骤1,获取企业的多个用电量数据,并对其进行分类;
在本发明优选但非限制性的实施方式中,所述步骤1中的多个用电量数据X如下式所示:
X=[x1,x2,…xt…,xn]
xt=[Pt,ht,…]
其中,xt为第t个用电量数据,Pt为作为第t个用电量数据的用电量的总用电能耗,ht为第t个用电量数据的分类参数,n为用电量数据数量,t的取值范围为从1到n的正整数。
在本发明优选但非限制性的实施方式中,xt可以是企业某一天的用电量数据,而ht=0or 1,其中,0表示节假日,1表示工作日。
在本发明优选但非限制性的实施方式中,xt如下式所示:
xt=[Pt,ht,pt,st,mt,…]
其中,pt为第t个用电量数据所属的那一天企业的净利润,st为第t个用电量数据所属的那一天企业的平均股价,mt为第t个用电量数据所属的那一天企业的营收总额。
对于企业的用电量而言,其内部有节假日的影响导致其用电量的不规律,外部有净利润,平均股价,营收总额等等的因素影响,因此为了能够获取到更为准确的短时用电量预测结果。对于企业的用电量而言,其内部有节假日的影响导致其用电量的不规律,外部有净利润,平均股价,营收总额等等的因素影响,因此为了能够获取到更为准确的短时用电量预测结果。这样就需要对用电量进行分类,假设用电量为P=[P1,P2,…,Pn]。
然后设置h参数,h={0或1},用h来给用电量P打上标签,1代表工作日,0代表节假日,并且输入了各种外部影响因素K,外部因素例如营业总收入,净利润,平均股价等等因素。
步骤2,将多个用电量数据,代入到CNN模型中;
在本发明优选但非限制性的实施方式中,如图2所示,所述步骤2具体包括:
步骤2.1,利用CNN模型中的卷积层,提取出多个用电量数据的特征值lt:
lt=tanh(xt*kt+bt)
其中,tanh为激活函数,xt为作为输入向量的第t个用电量数据,kt为针对第t个用电量数据的卷积核的权值,bt为针对第t个用电量数据的卷积核的偏置;
具体的,CNN模型主要包括卷积层与池化层,每个卷积层包含一个多元化的卷积核。用电量数据经过卷积运算层后进行特征提取,由于提取的特征维度很高,为了解决这个问题,降低培训成本的网络,在卷积层之后增加池化层以降低特征维数。
因此,本发明步骤2进一步还包括:步骤2.2,将特征值lt代入到CNN模型中的池化层,从而降低特征值lt的维数。
步骤3,将所有特征值lt按照时间顺序,输入LSTM模型中。
在本发明优选但非限制性的实施方式中,如图3所示,所述步骤3具体包括:
步骤3.1,计算遗忘门的输出值ft:
ft=σ(wf·[lt-1,xt]+bf)
其中,ft的取值范围为(0,1),wf为遗忘门的权重,bf为遗忘门的偏置;
具体的,步骤3.1就是将作为上一时刻的输出值的特征值lt-1和作为当前时间的输入值的第t个用电量数据xt输入到遗忘门,经过计算得到遗忘门的输出值。
it=σ(wi·[lt-1,xt]+bi)
其中it取值范围为(0,1),wi为输入门的权重,bi为输入门的偏置,wk为候选输入门的权重,bk为候选输入门的偏置;
具体的,步骤3.2就是将上次时间的输出值和当前时间的输入值输入到输入门,计算后得到输入门的输出值和候选单元状态。
步骤3.3,更新得到当前单元格状态Ct,如下式所示:
其中Ct的取值范围是(0,1);
步骤3.4,计算输出门的输出值Ot,如下式所示:
Ot=σ(wh·[ht-1,xt]+bh)
其中Ot的取值范围为(0,1),wh为输出门的权值,bh为输出门的偏置;
步骤3.5,通过计算输出门的输出Ot和当前单元格状态Ct得到LSTM的输出值ht,如下式所示:
ht=Ot*tanh(Ct)。
如下表1是CNN-LSTM模型的具体参数
表1
对于CNN的相关模型参数修改是基于用电量的特性进行参数设置的,对于卷积层的激活函数的选择ReLu函数的原因在于峰时用电量是会产生极大值的,而对于激活函数ReLu函数而言对于数值的提取即为最大值,但是对于谷时用电量而言,其主要表现为较为平稳且用电量较少的形式,因此选用Sigmod激活函数能够将数据更加完全的进行提取,确保其提取的特征的准确性。而对于Batch-size的选择是对于本网络结构的大小来看结合实验来选取了128保证了实验的准确性与速度。
受到CNN模型的启发,采用了如下的类CNN的encoder与decoder结构模型对数据进行特征提取,首先对于输入的用电量数据输入到卷积层中,然后进行最大池化,由于用电量数据的特性,用Arcface进行分类。对于此我们会获取到两种数据分别为峰时电量与谷时电量,再对此进行运用两种不同的激活函数来进行最大池化,峰时用电量是会产生极大值的,对于激活函数ReLu函数而言对于数值的提取即为最大值,但是对于谷时用电量而言,其主要表现为较为平稳且用电量较少的形式,因此选用Sigmod激活函数能够将数据更加完全的进行提取,确保其提取的特征的准确性。至此encoder完成,进行decoder,即需要将数据返回至原来的形式,即为卷积与上采样的操作,具体结构如图4所示。
如上所述,对于外部影响因素K来说,其中K=(K1,K2,...,Ki)在第i个外部影响因素的取值为Ki,因此本发明采用了PCA,PCA的主要原理是找到适当的线性变换将相关变量转换为彼此独立的新变量,其中方差较大的变量可以反映原始多个变量中包含的主要信息。
本发明将用电量的模型分为了工作日用电量与节假日用电量两种类型,而对于两类用电量的情况是大不相同的,对于节假日用电量而言,相较而言是变化较小,较为稳定的,然而对于工作日而言,其用电量相对变化与起伏较大,不稳定。岭回归最大的优点是它的稳定性和对模型输入的小变化有很强的鲁棒性,这样能够将节假日的用电量极大程度的保留完整。与此相反,LASSO回归可以通过将其参数缩小到零来完全排除意外的预测器,因此LASSO回归模型适用于工作日用电量预测。
因此公式如下:
f(k)=w1k1+w2k2+…+wnkn
式中,w=(w1,w2,…,wn)是各外部影响因素的权重值.损失函数定义为:
loss2(w)=||f(k)-y(1)||2+α1||w||1
式中,y(0)代表节假日的实际用电量,y(1)代表工作日的实际用电量,通过求解loss1(w),loss2(w)来获取最终的主要外部影响因素,将之分别输入到CNN-LSTM模型之中进行训练来获取预测结果。
如上所述,对于外部影响因素K来说,其中K=(K1,K2,...,Ki)在第i个外部影响因素的取值为Ki,因此本发明采用了PCA,PCA的主要原理是找到适当的线性变换将相关变量转换为彼此独立的新变量,其中方差较大的变量可以反映原始多个变量中包含的主要信息。
如上所述,对于外部影响因素K来说,其中K=(K1,K2,...,Ki)在第i个外部影响因素的取值为Ki,因此本发明采用了PCA,PCA的主要原理是找到适当的线性变换将相关变量转换为彼此独立的新变量,其中方差较大的变量可以反映原始多个变量中包含的主要信息。
本发明对于用电量模型的输入数据进行了分类处理,因为其用电量的实际情况在相应的时间段内会产生高与低的用电量时段,但如果仅仅如此分类会产生越界的数据。因此考虑采用Arcface方法来对将用电量分为两种类型,对于ArcFace而言可以发现他可以保持类内的紧密性,凸显类间的差异性。就将用电量高的时段称为峰时用电量时间段,用电量低的时间段称为谷时用电量时间段,由于谷时用电量输入到CNN模型中,而对于峰时的用电量来说这是会有极大幅度变化的,因次将相关因素与峰时用电量进行PCA主成分相关性分析,再加入弹性网正则化的方法来修正相关数据,弹性网允许学习一个比lasso更少的零权重的稀疏模型,同时保持岭回归的稳定性。
因此对于ArcFace函数公式如下:
而对于峰时用电量而言,其相关公式如下
f(k)=w1k1+w2k2+…+wnkn
式中,w=(w1,w2,…,wn)是各外部影响因素的权重值.损失函数定义为:
式中,y(1)代表工作日的实际用电量,通过求解loss(w),来获取最终的主要外部影响因素,将之分别输入到CNN-LSTM模型之中进行训练来获取预测结果。相应的ArcFace函数的伪代码如表2所示:
表2
对于ArcFace方法将用电量数据作为x进行输入,并且通过寻找到了最优的超参m,对于本发明而言n=2,Ground-Truth ID即为之前对于用电量数据人工标注区分的用电量峰时与谷时的标签,通过ArcFace函数的训练可以输出权值分别为0的谷时用电量,1的峰时用电量的两种类进行分类并进行判断输入到下一层级。
对于margin的超参数获取是通过消融实验得出的,通过保留除了margin参数之外的参数,调整margin的数值来进行消融实验,本发明选取了0.5,0.55,1.0,1.25,1.5,5,10等多个margin数值的实验,证明在选取1.25的margin参数时我们取得了更为有效且准确的效果。
本发明的方法使用插值法对收集的电力数据求最优解,通过调参实验发现,在margin超参数为1.25时获取了最佳的效果。
如图5所示,本发明所述的一种用电短时预测***,包括:
获取模块,所述获取模块用于获取企业的多个用电量数据,并对其进行分类;
在本发明优选但非限制性的实施方式中,所述多个用电量数据X如下式所示:
X=[x1,x2,…xt…,xn]
xt=[Pt,ht,…]
其中,xt为第t个用电量数据,Pt为作为第t个用电量数据的用电量的总用电能耗,ht为第t个用电量数据的分类参数,n为用电量数据数量,t的取值范围为从1到n的正整数。
在本发明优选但非限制性的实施方式中,xt可以是企业某一天的用电量数据,而ht=0or 1,其中,0表示节假日,1表示工作日。
在本发明优选但非限制性的实施方式中,xt如下式所示:
xt=[Pt,ht,pt,st,mt,…]
其中,pt为第t个用电量数据所属的那一天企业的净利润,st为第t个用电量数据所属的那一天企业的平均股价,mt为第t个用电量数据所属的那一天企业的营收总额。
代入模块,所述代入模块用于将多个用电量数据,代入到CNN模型中;
在本发明优选但非限制性的实施方式中,所述代入模块还用于利用CNN模型中的卷积层,提取出多个用电量数据的特征值lt:
lt=tanh(xt*kt+bt)
其中,tanh为激活函数,xt为作为输入向量的第t个用电量数据,kt为针对第t个用电量数据的卷积核的权值,bt为针对第t个用电量数据的卷积核的偏置;用于将特征值lt代入到CNN模型中的池化层,从而降低特征值lt的维数。
输入模块,所述输入模块用于将所有特征值lt按照时间顺序,输入LSTM模型中。
在本发明优选但非限制性的实施方式中,所述输入模块还用于计算遗忘门的输出值ft:
ft=σ(wf·[lt-1,xt]+bf)
it=σ(wi·[lt-1,xt]+bi)
其中it取值范围为(0,1),wi为输入门的权重,bi为输入门的偏置,wk为候选输入门的权重,bk为候选输入门的偏置;用于更新得到当前单元格状态Ct,如下式所示:
其中Ct的取值范围是(0,1);用于计算输出门的输出值Ot,如下式所示:
Ot=σ(wh·[ht-1,xt]+bh)
其中Ot的取值范围为(0,1),wh为输出门的权值,bh为输出门的偏置;用于通过计算输出门的输出Ot和当前单元格状态Ct得到LSTM的输出值ht,如下式所示:
ht=Ot*tanh(Ct)。
一种终端,包括处理器及存储介质;其特征在于:
所述存储介质用于存储指令;
所述处理器用于根据所述指令进行操作以执行所述用电短时预测方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现所述用电短时预测方法的步骤。
本发明的有益效果在于,与现有技术相比,本发明在传统的长短期记忆人工神经网络上增加了二分类对企业用电量进行分类,将其分为工作日用电量与节假日用电量,并且引入了外部影响因素,例如:平均股价,净利润,总营收等等,进行神经网络的模型训练之后在注意力层进行权重的分配,最后输出短时预测结果;能够在对于电力数据的短时预测结果上产生更为准确的结果,有助于以数据为驱动,结合企业的情况更好地进行管理与实施战略部署。
本公开可以是***、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其它自由传播的电磁波、通过波导或其它传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(***)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其它设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
Claims (14)
1.一种用电短时预测方法,其特征在于,包括如下步骤:
步骤1,获取企业的多个用电量数据,并对其进行分类;
步骤2,将多个用电量数据,代入到CNN模型中;
步骤3,将所有特征值lt按照时间顺序,输入LSTM模型中。
2.根据权利要求1所述的用电短时预测方法,其特征在于,所述步骤1中的多个用电量数据X如下式所示:
X=[x1,x2,...xt...,xn]
xt=[Pt,ht,...]
其中,xt为第t个用电量数据,Pt为作为第t个用电量数据的用电量的总用电能耗,ht为第t个用电量数据的分类参数,n为用电量数据数量,t的取值范围为从1到n的正整数。
3.根据权利要求2所述的用电短时预测方法,其特征在于,ht=0 or 1,其中,0表示节假日,1表示工作日。
4.根据权利要求2所述的用电短时预测方法,其特征在于,xt如下式所示:
xt=[Pt,ht,pt,st,mt,...]
其中,pt为第t个用电量数据所属的那一天企业的净利润,st为第t个用电量数据所属的那一天企业的平均股价,mt为第t个用电量数据所属的那一天企业的营收总额。
5.根据权利要求1所述的用电短时预测方法,其特征在于,所述步骤2具体包括:
步骤2.1,利用CNN模型中的卷积层,提取出多个用电量数据的特征值lt:
lt=tanh(xt*kt+bt)
其中,tanh为激活函数,xt为作为输入向量的第t个用电量数据,kt为针对第t个用电量数据的卷积核的权值,bt为针对第t个用电量数据的卷积核的偏置;
步骤2.2,将特征值lt代入到CNN模型中的池化层,从而降低特征值lt的维数。
6.根据权利要求1所述的用电短时预测方法,其特征在于,所述步骤3具体包括:
步骤3.1,计算遗忘门的输出值ft:
ft=σ(wf·[lt-1,xt]+bf)
其中,ft的取值范围为(0,1),wf为遗忘门的权重,bf为遗忘门的偏置;
it=σ(wi·[lt-1,xt]+bi)
其中it取值范围为(0,1),wi为输入门的权重,bi为输入门的偏置,wk为候选输入门的权重,bk为候选输入门的偏置;
步骤3.3,更新得到当前单元格状态Ct,如下式所示:
其中Ct的取值范围是(0,1);
步骤3.4,计算输出门的输出值Ot,如下式所示:
Ot=σ(Wh·[ht-1,xt]+bh)
其中Ot的取值范围为(0,1),wh为输出门的权值,bh为输出门的偏置;
步骤3.5,通过计算输出门的输出Ot和当前单元格状态Ct得到LSTM的输出值ht,如下式所示:
ht=Ot*tanh(Ct)。
7.一种用电短时预测***,其特征在于,包括:
获取模块,所述获取模块用于获取企业的多个用电量数据,并对其进行分类;
代入模块,所述代入模块用于将多个用电量数据,代入到CNN模型中;
输入模块,所述输入模块用于将所有特征值lt按照时间顺序,输入LSTM模型中。
8.根据权利要求7所述的用电短时预测***,其特征在于,所述多个用电量数据X如下式所示:
X=[x1,x2,...xt...,xn]
xt=[Pt,ht,...]
其中,xt为第t个用电量数据,Pt为作为第t个用电量数据的用电量的总用电能耗,ht为第t个用电量数据的分类参数,n为用电量数据数量,t的取值范围为从1到n的正整数。
9.根据权利要求8所述的用电短时预测***,其特征在于,ht=0 or 1,其中,0表示节假日,1表示工作日。
10.根据权利要求8所述的用电短时预测***,其特征在于,xt如下式所示:
xt=[Pt,ht,pt,st,mt,...]
其中,pt为第t个用电量数据所属的那一天企业的净利润,st为第t个用电量数据所属的那一天企业的平均股价,mt为第t个用电量数据所属的那一天企业的营收总额。
11.根据权利要求7所述的用电短时预测***,其特征在于,所述代入模块还用于利用CNN模型中的卷积层,提取出多个用电量数据的特征值lt:
lt=tanh(xt*kt+bt)
其中,tanh为激活函数,xt为作为输入向量的第t个用电量数据,kt为针对第t个用电量数据的卷积核的权值,bt为针对第t个用电量数据的卷积核的偏置;用于将特征值lt代入到CNN模型中的池化层,从而降低特征值lt的维数。
12.根据权利要求7所述的用电短时预测***,其特征在于,所述输入模块还用于计算遗忘门的输出值ft:
ft=σ(wf·[lt-1,xt]+bf)
it=σ(wi·[lt-1,xt]+bi)
其中it取值范围为(0,1),wi为输入门的权重,bi为输入门的偏置,wk为候选输入门的权重,bk为候选输入门的偏置;用于更新得到当前单元格状态Ct,如下式所示:
其中Ct的取值范围是(0,1);用于计算输出门的输出值Ot,如下式所示:
Ot=σ(wh·[ht-1,xt]+bh)
其中Ot的取值范围为(0,1),wh为输出门的权值,bh为输出门的偏置;用于通过计算输出门的输出Ot和当前单元格状态Ct得到LSTM的输出值ht,如下式所示:
ht=Ot*tanh(Ct)。
13.一种终端,包括处理器及存储介质;其特征在于:
所述存储介质用于存储指令;
所述处理器用于根据所述指令进行操作以执行根据权利要求l-6任一项所述方法的步骤。
14.计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-6任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310060036.8A CN116090637A (zh) | 2023-01-19 | 2023-01-19 | 一种用电短时预测方法与*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310060036.8A CN116090637A (zh) | 2023-01-19 | 2023-01-19 | 一种用电短时预测方法与*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116090637A true CN116090637A (zh) | 2023-05-09 |
Family
ID=86213587
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310060036.8A Pending CN116090637A (zh) | 2023-01-19 | 2023-01-19 | 一种用电短时预测方法与*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116090637A (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108830487A (zh) * | 2018-06-21 | 2018-11-16 | 王芊霖 | 基于长短时神经网络的电力负荷预测方法 |
CN109886444A (zh) * | 2018-12-03 | 2019-06-14 | 深圳市北斗智能科技有限公司 | 一种交通短时客流预测方法、装置、设备和存储介质 |
AU2020101900A4 (en) * | 2020-08-21 | 2020-11-05 | Qinghu Rising Sunshine Data Technology (Beijing) Co., Ltd. | A method, device and equipment for detecting abnormal electric meter |
CN112241802A (zh) * | 2019-07-18 | 2021-01-19 | 内蒙古电力(集团)有限责任公司内蒙古电力科学研究院分公司 | 一种风电功率的区间预测方法 |
KR20210023388A (ko) * | 2019-08-23 | 2021-03-04 | 주식회사 화성 | 기계 학습을 기반으로 한 태양광 발전량 예측 시스템 |
CN112990556A (zh) * | 2021-02-24 | 2021-06-18 | 江苏大学 | 一种基于Prophet-LSTM模型的用户用电能耗预测方法 |
CN113516271A (zh) * | 2021-04-05 | 2021-10-19 | 东北电力大学 | 一种基于时空神经网络的风电集群功率日前预测方法 |
KR20210131160A (ko) * | 2020-04-23 | 2021-11-02 | 한국전력공사 | 딥러닝 모델 기반의 전력 수요 예측 장치 및 방법 |
CN114169639A (zh) * | 2021-12-23 | 2022-03-11 | 重庆工商大学 | 一种企业用电量预测方法 |
CN114595874A (zh) * | 2022-02-24 | 2022-06-07 | 武汉大学 | 一种基于动态神经网络的超短期电力负荷预测方法 |
CN114692947A (zh) * | 2022-02-28 | 2022-07-01 | 江苏大学 | 一种基于VMD-Lasso-CNN-LSTM的用户用电能耗预测方法 |
KR20220096406A (ko) * | 2020-12-31 | 2022-07-07 | 계명대학교 산학협력단 | Cnn을 이용한 전력수요 예측 방법, 이를 수행하기 위한 기록 매체 및 장치 |
CN115169703A (zh) * | 2022-07-12 | 2022-10-11 | 广东电网有限责任公司广州供电局 | 一种基于长短时记忆网络组合的短期电力负荷预测方法 |
-
2023
- 2023-01-19 CN CN202310060036.8A patent/CN116090637A/zh active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108830487A (zh) * | 2018-06-21 | 2018-11-16 | 王芊霖 | 基于长短时神经网络的电力负荷预测方法 |
CN109886444A (zh) * | 2018-12-03 | 2019-06-14 | 深圳市北斗智能科技有限公司 | 一种交通短时客流预测方法、装置、设备和存储介质 |
CN112241802A (zh) * | 2019-07-18 | 2021-01-19 | 内蒙古电力(集团)有限责任公司内蒙古电力科学研究院分公司 | 一种风电功率的区间预测方法 |
KR20210023388A (ko) * | 2019-08-23 | 2021-03-04 | 주식회사 화성 | 기계 학습을 기반으로 한 태양광 발전량 예측 시스템 |
KR20210131160A (ko) * | 2020-04-23 | 2021-11-02 | 한국전력공사 | 딥러닝 모델 기반의 전력 수요 예측 장치 및 방법 |
AU2020101900A4 (en) * | 2020-08-21 | 2020-11-05 | Qinghu Rising Sunshine Data Technology (Beijing) Co., Ltd. | A method, device and equipment for detecting abnormal electric meter |
KR20220096406A (ko) * | 2020-12-31 | 2022-07-07 | 계명대학교 산학협력단 | Cnn을 이용한 전력수요 예측 방법, 이를 수행하기 위한 기록 매체 및 장치 |
CN112990556A (zh) * | 2021-02-24 | 2021-06-18 | 江苏大学 | 一种基于Prophet-LSTM模型的用户用电能耗预测方法 |
CN113516271A (zh) * | 2021-04-05 | 2021-10-19 | 东北电力大学 | 一种基于时空神经网络的风电集群功率日前预测方法 |
CN114169639A (zh) * | 2021-12-23 | 2022-03-11 | 重庆工商大学 | 一种企业用电量预测方法 |
CN114595874A (zh) * | 2022-02-24 | 2022-06-07 | 武汉大学 | 一种基于动态神经网络的超短期电力负荷预测方法 |
CN114692947A (zh) * | 2022-02-28 | 2022-07-01 | 江苏大学 | 一种基于VMD-Lasso-CNN-LSTM的用户用电能耗预测方法 |
CN115169703A (zh) * | 2022-07-12 | 2022-10-11 | 广东电网有限责任公司广州供电局 | 一种基于长短时记忆网络组合的短期电力负荷预测方法 |
Non-Patent Citations (1)
Title |
---|
明悦: "多源视觉信息感知与识别", 31 August 2020, 北京:北京邮电大学出版社, pages: 126 - 127 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chou et al. | Forward forecast of stock price using sliding-window metaheuristic-optimized machine-learning regression | |
Oncharoen et al. | Deep learning for stock market prediction using event embedding and technical indicators | |
US20210303970A1 (en) | Processing data using multiple neural networks | |
US11586919B2 (en) | Task-oriented machine learning and a configurable tool thereof on a computing environment | |
Ying et al. | Prediction model of dow jones index based on lstm-adaboost | |
Moniz et al. | Smoteboost for regression: Improving the prediction of extreme values | |
Akşehir et al. | How to handle data imbalance and feature selection problems in CNN-based stock price forecasting | |
Cerqueira et al. | Vest: Automatic feature engineering for forecasting | |
CN110738363B (zh) | 一种光伏发电功率预测方法 | |
Singhania et al. | Forecasting the United States unemployment rate by using recurrent neural networks with Google Trends data | |
Dhanalakshmi et al. | A Logical Investigation of Stock Market Prediction and Analysis using Supervised Machine Learning Algorithm | |
Thangamayan et al. | Stock price prediction using hybrid deep learning technique for accurate performance | |
Co et al. | Comparison between ARIMA and LSTM-RNN for VN-index prediction | |
Al-Thelaya et al. | Forecasting of bahrain stock market with deep learning: Methodology and case study | |
Sun et al. | Short-term stock price forecasting based on an SVD-LSTM model | |
Raipitam et al. | Comparative study on stock market prediction using generic CNN-LSTM and ensemble learning | |
CN116090637A (zh) | 一种用电短时预测方法与*** | |
CN111340632A (zh) | 资源管控方法以及装置 | |
Khanpara et al. | Stock Trend Prediction: A Comparative Study using Different Approaches | |
Chu et al. | Boosting | |
Pebrianti et al. | XgBoost Hyper-Parameter Tuning Using Particle Swarm Optimization for Stock Price Forecasting | |
Supriyanto | Comparison of Grid Search and Evolutionary Parameter Optimization with Neural Networks on JCI Stock Price Movements during the Covid 19 | |
Qiao et al. | Singular spectrum analysis based long short-term memory for predicting bitcoin price | |
Zhang et al. | Boosting portfolio choice in the big data era | |
Lu et al. | Technology Stock Forecasting Based on Hybrid Model and Data Migration |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |