CN111461400A - 一种基于Kmeans和T-LSTM的负荷数据补全方法 - Google Patents
一种基于Kmeans和T-LSTM的负荷数据补全方法 Download PDFInfo
- Publication number
- CN111461400A CN111461400A CN202010128406.3A CN202010128406A CN111461400A CN 111461400 A CN111461400 A CN 111461400A CN 202010128406 A CN202010128406 A CN 202010128406A CN 111461400 A CN111461400 A CN 111461400A
- Authority
- CN
- China
- Prior art keywords
- data
- load
- day
- load data
- stm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000013499 data model Methods 0.000 claims description 33
- 238000012549 training Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 12
- 238000010606 normalization Methods 0.000 claims description 10
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 238000012795 verification Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000007418 data mining Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003631 expected effect Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Business, Economics & Management (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Economics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Strategic Management (AREA)
- Evolutionary Biology (AREA)
- Human Resources & Organizations (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Mathematical Optimization (AREA)
- Marketing (AREA)
- Mathematical Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Quality & Reliability (AREA)
- Databases & Information Systems (AREA)
Abstract
本发明公开了一种基于Kmeans和T‑LSTM的负荷数据补全方法,涉及一种数据补全方法。目前数据补全方法,数据偏差大,往往达不到预期效果。本发明包括以下步骤:构建数据模型;K种负荷区间的数据分别训练得到对应的K种数据模型;定时取待补全数据的当天负荷数据;计算当天负荷数据的平均值;根据平均值获取对应的数据模型;将待补全负荷数据输入对应的数据模型中,计算得到补全的完整负荷数据。本技术方案能够很好的把相似特征的负荷数据归为一类,排出不同特征数据的干扰;更能准确的反映缺失数据的真实负荷值。通过本方法实现准确补全数据,其具有误差小、收敛速度快的优点。
Description
技术领域
本发明涉及一种数据补全方法,尤其涉及一种基于Kmeans和T-LSTM的负荷数据补全方法。
背景技术
在当前时代背景下,信息产业技术的迅猛发展和多元化的数据获取途径使得各行业机构的数据量激增,例如国网的电力负荷数据拥有极大的数据存量,并且目前仍然以非常迅猛的速度在激增。经验表明这些数据中往往蕴藏着诸多可用的内容,如果能对数据隐含的内容进行更加有效且完备的分析,提取出潜在的数据价值,并进行上层应用是非常有意义的事情。
但是目前数据挖掘领域内的绝大多数理论创新、发展和技术具体实现都是基于理想的、完备的数据集,然而现实终端采集上来的负荷数据因为终端损坏、无通讯等种种原因导致数据都有缺失、不完整,不完整的负荷数据会使得数据挖掘的结果扭曲、无效甚至得出错误的结论。所以对缺失数据的补全处理是数据挖掘过程中尤为重要、不可忽略的环节。
目前数据补全方法有线性补全、差值法补全等,线性补全算法的思想是用缺失点的前一时刻数据和后一时刻数据之和平均得到缺失数据值,这种方法简单但是相比真实值的偏差很大,往往达不到我们的预期效果。而且很多补全算法未对历史负荷数据分类,模型受到负荷数据突变的影响,也会导致误差过大。另外,基于时间序列的LSTM(Long ShortTerm Memory)网络是对连续和时间间隔有规律的情况下补全的效果比较好,但是实际情况是缺失数据都是随机的,所以LSTM网络数据补全也不能够满足要求。
发明内容
本发明要解决的技术问题和提出的技术任务是对现有技术方案进行完善与改进,提供一种基于Kmeans和T-LSTM的负荷数据补全方法,以达到对数据准确补全的目的。为此,本发明采取以下技术方案。
一种基于Kmeans和T-LSTM的负荷数据补全方法,包括以下步骤:
1)构建数据模型;
101)分批获取负荷数据;
102)随机挖出负荷数据中的连续点作为待补全负荷数据;
103)对负荷数据进行Kmeans聚类;
104)通过Kmeans聚类获得最佳的K种分类方式,根据K种分类方式,将总样本分成k个类别,每一类别对应不同的负荷区间,得到K种分类的负荷区间;
105)计算负荷平均值,并对负荷数据进行归一化处理;
106)根据负荷平均值确定所处的负荷区间,将经归一化处理的负荷数据输入至对应负荷区间的T-LSTM神经网络中进行训练,从而获得对应负荷区间的数据模型;K种负荷区间的数据分别训练得到对应的K种数据模型;
2)定时取待补全数据的当天负荷数据;
3)计算当天负荷数据的平均值;
4)根据平均值获取对应的数据模型;
5)将待补全负荷数据输入对应的数据模型中,计算得到补全的完整负荷数据。
作为优选技术手段:构建数据模型时:
在步骤101)中,获取的负荷数据包括某单位的某日和某日前1天以及第七天负荷数据;
在步骤102)中,随机挖出某日的负荷数据中的连续点作为待补全负荷数据;
在步骤105)中,计算某日的负荷平均值,并对某日及其前一天和前第七天的负荷数据归一化处理。
作为优选技术手段:在步骤2)中,定时取待补全数据的当天负荷数据外,还获取待补全的数据前一天及前第七天的负荷数据;
在步骤5)中,除了将待补全负荷数据输入对应的数据模型外,将经归一化处理的前一天及前第七天的负荷数据输入对应的数据模型;数据模型根据当天、前一天、前第七天的负荷数据对进行补全。
作为优选技术手段:步骤104),在进行Kmeans聚类时,使用手肘法得到K值。
作为优选技术手段:在步骤1)构建数据模型时,最后还包括校验步骤,将带缺失的数据归一化后输入对应的数据模型,并辅以这个时刻的历史信息,包含昨日和七日前的历史数据,最后得到完整的序列,然后与真实数据对比得到误差,当误差收敛后训练结束,得到最终数据模型并保存。
有益效果:本技术方案对采集上来公变负荷数据采用Kmeans方法聚类,能够很好的把相似特征的负荷数据归为一类,排出不同特征数据的干扰。再把相同类别的数据输入到T-LSTM神经网络中,因为T-LSTM设计考虑到负荷缺失数据的缺失规律,有些缺失数据是连续的,有些是不连续的,Δt能很好的区分,使神经网络学到间隔信息,更能准确的反映缺失数据的真实负荷值。通过本方法实现准确补全数据,其具有误差小、收敛速度快的优点。
附图说明
图1是本发明的流程图。
图2是本发明的聚类误差平方和与k的关系图。
图3是本发明LSTM网络结构图。
图4是本发明的T-LSTM结构图。
图5是本发明的数据模型训练图。
图6是本发明的测试流程图
具体实施方式
以下结合说明书附图对本发明的技术方案做进一步的详细说明。
如图1所示,本发明包括以下步骤:
1)构建数据模型;
101)分批获获取某单位的某日和某日前1天以及第七天负荷数据;
102)随机挖出负荷数据中的连续点作为待补全负荷数据;
103)对负荷数据进行Kmeans聚类;
104)通过Kmeans聚类获得最佳的K种分类方式,根据K种分类方式,将总样本分成k个类别,每一类别对应不同的负荷区间,得到K种分类的负荷区间;
105)计算某日的负荷平均值,并对某日及其前一天和前第七天的负荷数据归一化处理;
106)根据负荷平均值确定所处的负荷区间,将经归一化处理的负荷数据输入至对应负荷区间的T-LSTM神经网络中进行训练,从而获得对应负荷区间的数据模型;K种负荷区间的数据分别训练得到对应的K种数据模型;
2)定时取待补全数据的当天负荷数据、待补全的数据前一天及前第七天的负荷数据;
3)计算当天负荷数据的平均值;
4)根据平均值获取对应的数据模型;
5)将待补全负荷数据、将经归一化处理的前一天及前第七天的负荷数据输入对应的数据模型中,计算得到补全的完整负荷数据。
以下就部分步骤做进一步说明:
Kmeans聚类:使用手肘法得到K值,因为手肘处的曲率最大,聚类效果最好。
本技术方案采用手肘法确定聚类的k值(聚类个数)。手肘法的核心思想指的是当K小于真实聚类数时,由于k的增大会大幅增加每个簇的聚合程度,故所有样本的聚类误差平方和的下降幅度会很大,而当k到达真实聚类数时,再增加k所得到的聚合程度回报会迅速变小,所以聚类误差平方和的下降幅度会骤减,然后随着k值的继续增大而趋于平缓,也就是说聚类误差平方和和k的关系图是一个手肘的形状,而这个肘部对应的k(曲率最高)值就是数据的真实聚类个数,利用这个特点就确定了K值。
由于不同公变的供电特性不一样,它们的日负荷变化具有自身特点,而且负荷绝对值也相差很大,所以本文提出了利用聚类分析的方法对数据进行分类处理,消除不同供电特性样本之间的干扰。通过Kmeans聚类,将总祥本分成多个类别,作为每个数据补全网络的训练样本。具体步骤为:取金华本部4千台公变一天96个负荷值和它的负荷值作为样本的特征,输入到Kmeans聚类模型中,画出聚类误差平方和(样本的负荷值离中心点负荷值之差的总和)和k的关系图如图2。观察可知k在3之前下降比较迅速,从3之后开始比较平缓,因此可以拟定kmeans的聚类数量为3(曲率最高)。
T-LSTM(变体的长短时记忆网络):使用T-LSTM神经网络,考虑到负荷缺失数据的不确定性,有可能是连续多个点缺失的情况,T-LSTM能很好的处理这种缺失数据补全的问题。
LSTM最早由Hochreiter等提出,并由Graves进行改进,是针对原生RNN中的梯度***问题以及长期依赖问题提出的改进版的循环神经网络如图3所示。LSTM的主要工作就是对RNN网络内部结构进行改造,通过增加一些“门”来实现对记忆时长的控制,比如通过“遗忘门”来过滤一些信息,从而“记住”更长时间的信息。如图3所示。
公式如下:
gt=tanh(Wg xt+Ught-1+bg)
it=σ(Wixt+Uiht-1+bi)
ft=σ(Wfxt+Ufht-1+bf)
ot=σ(Woxt+Uoht-1+bf)
ct=ft·c{t-1}+it·gt
ht=ot·tanh(ct)
其中,ht,ct∈RH,h是隐层大小,而σ(·)是的sigmoid函数,i,f,o,g分别代表输入门,遗忘门,输出门和单元状态。
{Wf,Uf,bf},{Wi,Ui,bi},{Wo,Uo,bo},{Wc,Uc,bc}分别是是各个部分的网络参数。更具体地说,输入门i调节新值数据馈入单元的程度,遗忘门f调节忘记历史的程度,输出门o决定不同部分的权重来计算输出。
但是针对带缺失的数据,我们的输入是不连续的,时间间隔是不规律的,LSTM网络不能有很好的处理效果,因此本技术方案采用考虑了时间间隔的T-LSTM网络,如图4所示:在输入层增加了Δt,其它参数不改变,使网络学到时间间隔信息。
T-LSTM中相比LSTM改进的的部分如下:
g(δt)=1/log(e+δt)
ht=ot·tanh(ct)
其中δt即为当前输入的时间间隔△t,,输入门、输出门和遗忘门的定义与LSTM一致,区别在于细胞状态的更新。相比于LSTM,T-LSTM不光考虑了当前输入的具体值而且考虑了这个输入的间隔,解决了带缺失的时间序列中间隔不一致的问题。在每一个T-LSTM单元中输入上一个时刻的细胞状态ct-1和隐层状态ht-1以及当前的输入值xt和时间间隔δt得到这个单元的细胞状态ct和隐层状态ht并继续传递给下一个T-LSTM单元。
求待补全负荷数据的平均值:为了判断待补全数据的属于哪一类的负荷区间。
数据模型训练:
如图5所示,为提高准确性,在步骤1)构建数据模型时,最后还包括校验步骤,将带缺失的数据归一化后输入对应的数据模型,并辅以这个时刻的历史信息,包含昨日和七日前的历史数据,最后得到完整的序列,然后与真实数据对比得到误差,当误差收敛后训练结束,得到最终数据模型并保存。其完整的模型训练流程为:抽取数据作为训练数据集,数据处理后,经过kmeans聚类得到n种负荷数据和负荷区间,将带缺失的数据归一化后用T-LSTM编码,得到Temporal context,随后输到以LSTM作为单元的解码器中,并辅以这个时刻的历史信息,包含昨日和七日前的历史数据,最后得到解码后完整的序列,然后与真实数据对比得到误差,当误差收敛后训练结束,得到K个模型并保存。
以下以金华本部数据为例进行数据模型训练说明:
1.准备金华本部5千台2018年11月到2019年5月总共8个月的公变负荷数据。
2.对训练数据集进行处理,主要是挖出连续缺失点作为待补全数据和求出待补全天的负荷的平均值。
3.把处理好的训练数据输入到输入到Kmeans进行聚类,得到K种分类。
4.把K种分类数据加前1天和前第7天负荷数据归一化后输入到T-LSTM网络中进行编码处理得到Temporal context
5.将得到的Temporal context输入到LSTM解码器中,然后与真实数据对比得到误差
6.如果误差未收敛,继续训练
7.当误差收敛后训练结束,得到K个模型并保存。
在得到K个模型的基础上,以金华本部数据为例进行数据补全的流程说明:
数据集来源于金华去年11月开始221天的数据,共有174个用户,每天有96个负荷点。我们手动挖去了大约1%的点的数据(近似于真实数据缺失率),并且是连续5个点全部缺失,这样更接近于真实情况的缺失。
具体步骤如下:
1.准备金华本部2018年11月开始221天的数据,共有174个公变用户,每天有96个负荷数据。
2.分批采集待补全的数据和前一天以及前第7天的负荷数据。
3.人为挖出待补全的连续5个点作为验证,求待补全日数据平均值。
4.判断该负荷平均值属于哪一类负荷区间。
5.数据归一化
5.再用哪一类训练好的模型加上缺失值这一时刻的历史信息,包含前一日和前第七日的历史数据,最后得出补全的负荷数据
将补全的负荷数据与原数据计算,得到测试数据的平均绝对误差和平均绝对百分比误差。数据如表一所示。
左边为通过本方法得到的结果,右边为线性模型(通过上一点和后一个点之和再平均得到缺失数据值)得到的结果,其中mae为平均绝对误差,mape为平均绝对百分比误差。可以看出本方法效果均好于线性模型并且在负荷值比较大的情况下百分比误差在10%左右。
表一:测试结果
以上图1-6所示的一种基于Kmeans和T-LSTM的负荷数据补全方法是本发明的具体实施例,已经体现出本发明实质性特点和进步,可根据实际的使用需要,在本发明的启示下,对其进行形状、结构等方面的等同修改,均在本方案的保护范围之列。
Claims (5)
1.一种基于Kmeans和T-LSTM的负荷数据补全方法,其特征在于包括以下步骤:
1)构建数据模型;
101)分批获取负荷数据;
102)随机挖出负荷数据中的连续点作为待补全负荷数据;
103)对负荷数据进行Kmeans聚类;
104)通过Kmeans聚类获得最佳的K种分类方式,根据K种分类方式,将总样本分成k个类别,每一类别对应不同的负荷区间,得到K种分类的负荷区间;
105)计算负荷平均值,并对负荷数据进行归一化处理;
106)根据负荷平均值确定所处的负荷区间,将经归一化处理的负荷数据输入至对应负荷区间的T-LSTM神经网络中进行训练,从而获得对应负荷区间的数据模型;K种负荷区间的数据分别训练得到对应的K种数据模型;
2)定时取待补全数据的当天负荷数据;
3)计算当天负荷数据的平均值;
4)根据平均值获取对应的数据模型;
5)将待补全负荷数据输入对应的数据模型中,计算得到补全的完整负荷数据。
2.根据权利要求1所述的一种基于Kmeans和T-LSTM的负荷数据补全方法,其特征在于:
构建数据模型时:
在步骤101)中,获取的负荷数据包括某单位的某日和某日前1天以及第七天负荷数据;
在步骤102)中,随机挖出某日的负荷数据中的连续点作为待补全负荷数据;
在步骤105)中,计算某日的负荷平均值,并对某日及其前一天和前第七天的负荷数据归一化处理。
3.根据权利要求2所述的一种基于Kmeans和T-LSTM的负荷数据补全方法,其特征在于:在步骤2)中,定时取待补全数据的当天负荷数据外,还获取待补全的数据前一天及前第七天的负荷数据;
在步骤5)中,除了将待补全负荷数据输入对应的数据模型外,将经归一化处理的前一天及前第七天的负荷数据输入对应的数据模型;数据模型根据当天、前一天、前第七天的负荷数据对进行补全。
4.根据权利要求3所述的一种基于Kmeans和T-LSTM的负荷数据补全方法,其特征在于:步骤104),在进行Kmeans聚类时,使用手肘法得到K值。
5.根据权利要求2所述的一种基于Kmeans和T-LSTM的负荷数据补全方法,其特征在于:在步骤1)构建数据模型时,最后还包括校验步骤,将带缺失的数据归一化后输入对应的数据模型,并辅以这个时刻的历史信息,包含昨日和七日前的历史数据,最后得到完整的序列,然后与真实数据对比得到误差,当误差收敛后训练结束,得到最终数据模型并保存。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010128406.3A CN111461400B (zh) | 2020-02-28 | 2020-02-28 | 一种基于Kmeans和T-LSTM的负荷数据补全方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010128406.3A CN111461400B (zh) | 2020-02-28 | 2020-02-28 | 一种基于Kmeans和T-LSTM的负荷数据补全方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111461400A true CN111461400A (zh) | 2020-07-28 |
CN111461400B CN111461400B (zh) | 2023-06-23 |
Family
ID=71682448
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010128406.3A Active CN111461400B (zh) | 2020-02-28 | 2020-02-28 | 一种基于Kmeans和T-LSTM的负荷数据补全方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111461400B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107833153A (zh) * | 2017-12-06 | 2018-03-23 | 广州供电局有限公司 | 一种基于k‑means聚类的电网负荷缺失数据补全方法 |
CN109598381A (zh) * | 2018-12-05 | 2019-04-09 | 武汉理工大学 | 一种基于状态频率记忆神经网络的短时交通流预测方法 |
CN109754113A (zh) * | 2018-11-29 | 2019-05-14 | 南京邮电大学 | 基于动态时间规整与长短时间记忆的负荷预测方法 |
US20190143517A1 (en) * | 2017-11-14 | 2019-05-16 | Arizona Board Of Regents On Behalf Of Arizona State University | Systems and methods for collision-free trajectory planning in human-robot interaction through hand movement prediction from vision |
CN109934375A (zh) * | 2018-11-27 | 2019-06-25 | 电子科技大学中山学院 | 一种电力负荷预测方法 |
CN110245801A (zh) * | 2019-06-19 | 2019-09-17 | 中国电力科学研究院有限公司 | 一种基于组合挖掘模型的电力负荷预测方法及*** |
CN110334726A (zh) * | 2019-04-24 | 2019-10-15 | 华北电力大学 | 一种基于密度聚类和lstm的电力负荷异常数据的识别与修复方法 |
CN110674999A (zh) * | 2019-10-08 | 2020-01-10 | 国网河南省电力公司电力科学研究院 | 基于改进聚类和长短期记忆深度学习的小区负荷预测方法 |
-
2020
- 2020-02-28 CN CN202010128406.3A patent/CN111461400B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190143517A1 (en) * | 2017-11-14 | 2019-05-16 | Arizona Board Of Regents On Behalf Of Arizona State University | Systems and methods for collision-free trajectory planning in human-robot interaction through hand movement prediction from vision |
CN107833153A (zh) * | 2017-12-06 | 2018-03-23 | 广州供电局有限公司 | 一种基于k‑means聚类的电网负荷缺失数据补全方法 |
CN109934375A (zh) * | 2018-11-27 | 2019-06-25 | 电子科技大学中山学院 | 一种电力负荷预测方法 |
CN109754113A (zh) * | 2018-11-29 | 2019-05-14 | 南京邮电大学 | 基于动态时间规整与长短时间记忆的负荷预测方法 |
CN109598381A (zh) * | 2018-12-05 | 2019-04-09 | 武汉理工大学 | 一种基于状态频率记忆神经网络的短时交通流预测方法 |
CN110334726A (zh) * | 2019-04-24 | 2019-10-15 | 华北电力大学 | 一种基于密度聚类和lstm的电力负荷异常数据的识别与修复方法 |
CN110245801A (zh) * | 2019-06-19 | 2019-09-17 | 中国电力科学研究院有限公司 | 一种基于组合挖掘模型的电力负荷预测方法及*** |
CN110674999A (zh) * | 2019-10-08 | 2020-01-10 | 国网河南省电力公司电力科学研究院 | 基于改进聚类和长短期记忆深度学习的小区负荷预测方法 |
Non-Patent Citations (2)
Title |
---|
LUNTIAN MOU: "T-LSTM: A Long Short-Term Memory Neural Network Enhanced by Temporal Information for Traffic Flow Prediction", IEEE ACCESS * |
许芳芳: "基于ST-LSTM 网络的位置预测模型", 计算机工程 * |
Also Published As
Publication number | Publication date |
---|---|
CN111461400B (zh) | 2023-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108764471B (zh) | 基于特征冗余分析的神经网络跨层剪枝方法 | |
CN110084610B (zh) | 一种基于孪生神经网络的网络交易欺诈检测*** | |
CN111950656B (zh) | 图像识别模型生成方法、装置、计算机设备和存储介质 | |
CN113593611B (zh) | 语音分类网络训练方法、装置、计算设备及存储介质 | |
WO2020215560A1 (zh) | 自编码神经网络处理方法、装置、计算机设备及存储介质 | |
CN111814956B (zh) | 一种基于多维度二次特征提取的多任务学习的空气质量预测方法 | |
CN110020712B (zh) | 一种基于聚类的优化粒子群bp网络预测方法和*** | |
CN110264407B (zh) | 图像超分辨模型训练及重建方法、装置、设备及存储介质 | |
CN112183742B (zh) | 基于渐进式量化和Hessian信息的神经网络混合量化方法 | |
CN114065653A (zh) | 电力负荷预测模型的构建方法与电力负荷预测方法 | |
CN113822419B (zh) | 一种基于结构信息的自监督图表示学习运行方法 | |
CN116542701A (zh) | 一种基于cnn-lstm组合模型的碳价预测方法及*** | |
CN109214444B (zh) | 基于孪生神经网络和gmm的游戏防沉迷判定***及方法 | |
CN113095484A (zh) | 基于lstm神经网络的股票价格预测方法 | |
CN110987436A (zh) | 基于激励机制的轴承故障诊断方法 | |
CN110688484B (zh) | 一种基于不平衡贝叶斯分类的微博敏感事件言论检测方法 | |
CN111368648A (zh) | 雷达辐射源个体识别方法、装置、电子设备及其存储介质 | |
CN109492816B (zh) | 一种基于混合智能的煤与瓦斯突出动态预测方法 | |
CN111652264B (zh) | 基于最大均值差异的负迁移样本筛选方法 | |
CN110288002B (zh) | 一种基于稀疏正交神经网络的图像分类方法 | |
CN111783688A (zh) | 一种基于卷积神经网络的遥感图像场景分类方法 | |
CN111461400A (zh) | 一种基于Kmeans和T-LSTM的负荷数据补全方法 | |
CN116415989A (zh) | 千兆潜在客户预测方法、装置、计算机设备及存储介质 | |
CN110837853A (zh) | 一种快速分类模型构建方法 | |
CN107402984B (zh) | 一种基于主题的分类方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |