CN103049651A - 一种用于电力负荷聚类的方法及装置 - Google Patents

一种用于电力负荷聚类的方法及装置 Download PDF

Info

Publication number
CN103049651A
CN103049651A CN2012105373292A CN201210537329A CN103049651A CN 103049651 A CN103049651 A CN 103049651A CN 2012105373292 A CN2012105373292 A CN 2012105373292A CN 201210537329 A CN201210537329 A CN 201210537329A CN 103049651 A CN103049651 A CN 103049651A
Authority
CN
China
Prior art keywords
class
sample
center
cluster
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012105373292A
Other languages
English (en)
Inventor
姚丽娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aerospace Science and Industry Shenzhen Group Co Ltd
Original Assignee
Aerospace Science and Industry Shenzhen Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aerospace Science and Industry Shenzhen Group Co Ltd filed Critical Aerospace Science and Industry Shenzhen Group Co Ltd
Priority to CN2012105373292A priority Critical patent/CN103049651A/zh
Publication of CN103049651A publication Critical patent/CN103049651A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Complex Calculations (AREA)

Abstract

本发明公开了一种用于电力负荷聚类的方法及装置,包括S1:获取n个变电站综合负荷静态特性的样本数据;S2:通过高斯核函数将样本数据映射到Hilbert空间并获得样本;S3:通过在
Figure DDA00002578237500011
样本中选取k个样本来确定初始聚类中心;S4:在核空间中采用k-means算法将映射后的样本
Figure DDA00002578237500012
进行聚类计算,并根据上、下近似集确定的方法将各样本分配给最近类的上下近似集中;S5:根据当前迭代次数t对权值ωl、ωbnr进行动态调整;S6:根据算法收敛准则计算Jw值,并判断|Jw(t)-Jw(t-1)|≤ε或t≥tmax,若是,则生成最终类聚并结束;若否,则进入步骤S7;S7:令t=t+1,重新确定聚类中心,并转入步骤S4。本发明简易快速有效,聚类结果合理,对负荷建模研究的实用化具有重要意义。

Description

一种用于电力负荷聚类的方法及装置
技术领域
本发明属于电力负荷聚类技术领域,更具体地,涉及一种用于电力负荷聚类的方法及装置。
背景技术
在进行电力***分析时,变电站负荷特性聚类就是将同一电网不同变电站以及不同时段中变电站特性接近或相似的聚为一类,如以重工业负荷为主的变电站,以市政生活为主的变电站,变电站中月季度负荷曲线,日季度负荷曲线等。并用同一模型描述每一类的特性,通过聚类能建立有效描述变电站特性的综合负荷模型。就负荷建模的实用化而言,负荷特性的分类与综合具有十分重要的意义,它能够到达减轻使用和维护工程的工作和劳动强度。负荷特性的分类与综合是实现负荷模型实用化的关键,为建立合适的变电站负荷模型,大多数算法都将聚类方法引入负荷特性分析中。
目前,应用于电力负荷聚类的方法具有几下模式:(1)传统聚类算法及改进算法:比如基于改进的k均值(k-means)的负荷聚类算法对电网进行仿真分析,基于网格的电力负荷分析,基于谱聚类的电力负荷分析等。这些聚类算法都是将传统聚类算法应用于电力***中。(2)基于智能优化算法的聚类算法:比如基于粒子群的电力负荷聚类分析,基于蚁群的电力负荷分析等。将这些算法进行结合并应用于电力负荷分析中,利用智能优化算法的全局寻优能力提高了聚类性能,也缩短了聚类时间。(3)基于多种算法的结合:比如基于ACO-PAM综合算法的电力负荷聚类分析,基于粒子群优化并行神经网络的电力***负荷特性聚类方法等,这些算法能有效结合各种算法的优点,提高聚类的准确性,同时也扩大了聚类方法的适用范围,聚类结果更容易理解,商业利用价值更广。
目前的电力***负荷数据都是复杂多样的,比如具有异常性、分布性、多源性、高维性、复杂性、非线性以及海量性的特点。以上几种聚类模式的适用性远远不能满足现时代电力***的需求,如不能处理非线性数据,不能处理边界对象,不能处理高维混合型数据等。这些缺点导致目前聚类出的结果不能完全的符合现实情况,聚类结果可用性也较差,不能准确高效地供管理者做出商业决策。
发明内容
针对现有技术的缺陷,本发明的目的在于提供一种用于电力负荷聚类的方法,旨在解决现有技术中的聚类方法不能处理非线性数据、不能处理边界对象且不能处理高维混合型数据导致聚类结果可用性差,不能准确高效地供管理者做出商业决策的问题。
为实现上述目的,本发明提供了一种用于电力负荷聚类的方法,包括下述步骤:
S1:获取样本矩阵
Figure BDA00002578237300021
该样本矩阵包括n行,具体每一行为一个样本,从
Figure BDA00002578237300022
Figure BDA00002578237300023
每个样本有d个属性,作为每个样本
Figure BDA00002578237300024
的d个列分量,即Φ(x)矩阵中的每个元素可以表示为
Figure BDA00002578237300025
其中i=1,2,…,n,j=1,2,…,d,样本均属于F空间;
S2:通过在样本矩阵Φ(x)的n个样本中选取k个样本来确定初始聚类中心C,C={C1,C2,...,Ck},其中C表示k类中心的矩阵集合,k为聚类数目,包括k行,具体每一行为每一类的中心,从C1到Ck,每一类的中心也相应的有d个属性,作为每类中心Cp的d个列分量,C矩阵中的每个元素可以表示为Cpj,其中p=1,2,…,k,j=1,2,…,d,
Figure BDA00002578237300027
S3:令迭代次数t=1;
S4:将所述样本矩阵Φ(x)进行聚类计算,并根据上、下近似集确定的方法将各样本分配给最近类的上、下近似集;
S5:根据当前迭代次数t对所述下近似集的权重因子ωl和所述上近似集的权重因子ωbnr进行动态调整;
S6:计算粗糙核聚类的目标函数值Jw,并判断|Jw(t)-Jw(t-1)|≤ε或t≥tmax是否成立,若是,则结束;若否,则进入步骤S7;ε为根据实际情况确定的一个参数,tmax为人为确定的迭代次数上限;
S7:令t=t+1,重新确定聚类中心Cp,并转入步骤S4。
更进一步地,所述步骤S1具体为:获取n个变电站综合负荷静态特性的准样本,构成准样本矩阵X={x1,x2,…,xn},xi∈Rd,并通过高斯核函数将所述准样本数据映射到Hilbert空间后获得样本
Figure BDA00002578237300031
准样本xi均属于空间Rd内;所述高斯核函数为:F(x,y)=exp(-β||x-y||2/2σ2),其中σ为函数的宽度参数,β为1,x为变换前的准样本,y为变化后的样本。
更进一步地,在步骤S4中,上、下近似集确定的方法具体为:
Figure BDA00002578237300032
Figure BDA00002578237300033
则令
Figure BDA00002578237300035
否则令
Figure BDA00002578237300036
其中γ=0.07;
Figure BDA00002578237300037
表示第i个样本
Figure BDA00002578237300038
到第p类中心的欧式距离,
Figure BDA00002578237300039
表示第i个样本
Figure BDA000025782373000310
到第q类中心的欧式距离中的最小值,其中p=1,2,…k,q=1,2,…k,p≠q;dist(Cp,Cq)表示第p类的中心到第q类的中心的欧式距离,
Figure BDA000025782373000311
为第q类的上近似集,
Figure BDA000025782373000314
为第p类的下近似集。
更进一步地,在步骤S5中,采用公式
Figure BDA000025782373000312
Figure BDA000025782373000313
对下近似集的权重因子ωl和所述上近似集的权重因子ωbnr进行动态调整。
更进一步地,在步骤S6中,采用公式
Figure BDA00002578237300041
i=1,2,…,n,计算粗糙核聚类的目标函数值Jw;其中,wj为特征加权系数,且
Figure BDA00002578237300042
表示下近似集中的对象到所属类中心距离的加权和,
Figure BDA00002578237300044
表示上近似集中的对象到所属类中心距离的加权和。
更进一步地,在步骤S7中,采用公式
Figure BDA00002578237300045
计算第p类聚类中心Cp;其中,
Figure BDA00002578237300046
表示第p类边界集;
Figure BDA000025782373000411
表示第p类下近似集,
Figure BDA00002578237300047
表示第p类的上近似集。
本发明采用k-means、核函数及粗糙集几种算法的结合,可以对目前复杂的电力负荷数据进行高效准确的聚类,尤其是负荷数据中存在非线性数据、边界对象数据及高维混合数据进行处理,同时也能对负荷数据中存在的噪音数据进行处理,减少其对最终聚类结果的影响,提高聚类精度。本发明还可以保证聚类出的结果能符合实际电力***的情况,结果可理解性较强。
本发明还提供了一种用于电力负荷聚类的装置,包括依次连接的数据采集模块、数据计算模块、动态调整模块、判断模块以及循环模块;所述数据采集模块用于获取样本矩阵
Figure BDA00002578237300048
该样本矩阵包括n行,具体每一行为一个样本,从
Figure BDA00002578237300049
Figure BDA000025782373000410
每个样本有d个属性,作为每个样本
Figure BDA00002578237300051
的d个列分量,即Φ(x)矩阵中的每个元素可以表示为
Figure BDA00002578237300052
所述数据计算模块包括依次连接的初始类聚中心确定模块和类聚计算模块,所述初始类聚中心确定模块通过在样本矩阵Φ(x)的n个样本中选取k个样本来确定初始聚类中心C,C={C1,C2,...,Ck},其中C表示k类中心的矩阵集合,k为聚类数目,包括k行,具体每一行为每一类的中心,从C1到Ck,每一类的中心也相应的有d个属性,作为每类中心Cp的d个列分量,C矩阵中的每个元素可以表示为Cpj;所述类聚计算模块用于将所述样本矩阵Φ(x)进行聚类计算,并根据上、下近似集确定的方法将各样本分配给最近类的上、下近似集;所述动态调整模块用于根据当前迭代次数t对所述下近似集的权重因子ωl和所述上近似集的权重因子ωbnr进行动态调整;所述判断模块用于计算粗糙核聚类的目标函数值Jw,并判断|Jw(t)-Jw(t-1)|≤ε或t≥tmax是否成立,若是,则生成最终聚类并结束;若否,则由所述循环模块进行循环计算;所述循环模块用于当t=t+1时重新确定聚类中心并返回至所述类聚计算模块并进行循环计算。
更进一步地,所述动态调整模块采用公式
Figure BDA00002578237300053
Figure BDA00002578237300054
对下近似集的权重因子ωl和所述上近似集的权重因子ωbnr进行动态调整。
更进一步地,所述判断模块采用公式
Figure BDA00002578237300055
计算粗糙核聚类的目标函数值Jw;其中,wj为特征加权系数,且
Figure BDA00002578237300056
Figure BDA00002578237300057
表示下近似集中的对象到所属类中心距离的加权和,
Figure BDA00002578237300061
表示上近似集中的对象到所属类中心距离的加权和。
更进一步地,所述循环模块采用公式
Figure BDA00002578237300062
计算第p类聚类中心Cp;其中,
Figure BDA00002578237300063
表示第p类边界集;
Figure BDA00002578237300065
表示第p类下近似集,
Figure BDA00002578237300064
表示第p类的上近似集。
本发明提供的装置基于粗糙集和核函数的聚类方法来研究负荷特性的相似性特征,能够更加客观、准确的提取同类负荷的功能本质特征,算法简易快速有效,聚类结果合理,可以作为基于量测负荷建模的负荷特性记录装置安装位置选择的根本依据,对负荷建模研究的实用化具有重要意义。
附图说明
图1是本发明实施例提供的用于电力负荷聚类的方法实现流程图;
图2是本发明实施例提供的集合X的下近似、上近似和边界域示意图;
图3是本发明实施例提供的用于电力负荷聚类的装置的模块结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
电力负荷变化受到诸多因素的影响,比如重工业负荷,轻工业负荷,采掘业负荷,农业负荷,第三产业负荷,市政生活负荷等,这些负荷同时也都会受诸如天气,温度,季节等的影响,短期电力负荷曲线变化形态都会出现较大的差异。针对这种电力负荷变化特点,利用粗糙核聚类算法将具有相似负荷曲线的历史数据聚为一类。
在本发明实施例中,针对电力负荷数据具有非线性,高维性及边界性等特性,核函数能将样本空间进行转换,使数据由非线性变得线性可分,同时核函数将m维空间的内积运算转化为n维低维空间的核函数计算,从而巧妙的解决了在高维特征空间中计算的“维数灾难”问题,提高高维混合数据聚类性能,也简化了聚类步骤;粗糙集通过上下近似集权重的动态调整处理边界对象,减少边界对象对聚类结果的影响,同时将样本归属于不同类的上下近似集,提高聚类精度。综合考虑各种算法的性能,将几种算法进行有效融合,提出一种基于粗糙集的核函数聚类算法。
图1示出了本发明实施例提供的用于电力负荷聚类的方法实现流程,具体包括:
S1:获取样本矩阵
Figure BDA00002578237300071
该样本矩阵包括n行,具体每一行为一个样本,从
Figure BDA00002578237300072
Figure BDA00002578237300073
每个样本有d个属性,作为每个样本
Figure BDA00002578237300074
的d个列分量,即Φ(x)矩阵中的每个元素可以表示为
Figure BDA00002578237300075
其中i=1,2,…,n,j=1,2,…,d,样本均属于F空间;
S2:通过在样本矩阵Φ(x)的n个样本中选取k个样本来确定初始聚类中心C,C={C1,C2,...,Ck},也就是说,初始聚类中心C矩阵中的每一行分量(从C1到Ck)都是从
Figure BDA00002578237300077
Figure BDA00002578237300078
选出的,其中C表示k类中心的矩阵集合,k为聚类数目,C包括k行,具体每一行为每一类的中心,从C1到Ck,每一类的中心也相应的有d个属性,作为每类中心Cp的d个列分量,C矩阵中的每个元素可以表示为Cpj,其中p=1,2,…,k,j=1,2,…,d,
Figure BDA000025782373000710
S3:令迭代次数t=1;
S4:将所述样本矩阵Φ(x)进行聚类计算,并根据上、下近似集确定的方法将各样本分配给最近类的上、下近似集;
S5:根据当前迭代次数t对所述下近似集的权重因子ωl和所述上近似集的权重因子ωbnr进行动态调整;
S6:计算粗糙核聚类的目标函数值Jw,并判断|Jw(t)-Jw(t-1)|≤ε或t≥tmax是否成立,若是,则结束;若否,则进入步骤S7;ε为根据实际情况确定的一个参数,tmax为人为确定的迭代次数上限;
S7:令t=t+1,重新确定聚类中心Cp,并转入步骤S4。
在本发明实施例中,F空间是向量空间或者线性空间,Hilbert空间是定义了内积的空间,F空间包含Hilbert空间;R表示实数空间,d表示维数,实数集合通常用Rd表示,即Rd表示d维的实数空间。Hilbert空间定义为在线性空间中定义了内积的空间,Hilbert空间是一种特殊的线性空间。
在本发明实施例中,X是准样本矩阵,其为准样本的集合,包括n行,具体每一行为准样本x1到xn,每个准样本有d个属性,作为每个样本的d个列分量,X矩阵中的每个元素可以表示为xij,i=1-n,j=1-d);准样本矩阵X具体为: X = x 11 . . . x 1 d . . . x ij . . . x n 1 . . . x nd ; 而Φ(x)是X经过映射以后得到的样本矩阵,与X类似,也包括n行,具体每一行为样本每个样本也相应的有d个属性,作为每个样本的d个列分量,Φ(x)矩阵中的每个元素可以表示为
Figure BDA00002578237300084
i=1-n,j=1-d,样本Φ(x)具体为:
Figure BDA00002578237300085
其中,k类中心的矩阵集合具体为: C = C 11 . . . C 1 d . . . C pj . . . C k 1 . . . C kd ; k的取值范围
Figure BDA00002578237300087
Figure BDA00002578237300088
是根据经验取得,也可以根据实际需要任意调整。
其中,步骤S1具体为:获取n个变电站综合负荷静态特性的准样本,构成准样本矩阵X={x1,x2,…,xn},xi∈Rd,并通过高斯核函数将所述准样本数据映射到Hilbert空间后获得样本
Figure BDA00002578237300091
准样本xi均属于空间Rd内;高斯核函数为:F(x,y)=exp(-β||x-y||2/2σ2),其中σ为函数的宽度参数,β为1,x为变换前的准样本,y为变化后的样本。
在本发明实施例中,如图2所示,上近似集、下近似集和边界集的定义如下:给定知识库K=(U,R)和U的等价分类族U/R,对每一个对象子集
Figure BDA00002578237300092
Figure BDA00002578237300093
X关于R的上近似和R的下近可分别定义为:
Figure BDA00002578237300094
Figure BDA00002578237300095
在R上近似和下近似定义的基础上,就能很方便的定义集合的正域、负域和边界域:X的R正域是POSR(X)=
Figure BDA000025782373000921
,也就是其下近似集;X的R负域是
Figure BDA00002578237300096
也就是其论域与上近似的差集;X的边界域是
Figure BDA00002578237300097
也就是X的上近似与下近似的差集。其中,X的R上近似等于其边界域与正域的并集;是根据知识R判断可能属于X的论域U中元素组成的集合;
Figure BDA000025782373000919
是根据知识R判断肯定属于X的论域U中元素组成的集合。
在本发明实施例中,在步骤S4中上、下近似集确定的方法具体为:
Figure BDA00002578237300099
Figure BDA000025782373000910
则令
Figure BDA000025782373000912
否则令
Figure BDA000025782373000913
其中γ=0.07;
Figure BDA000025782373000914
表示第i个样本到第p类中心的欧式距离,表示第i个样本
Figure BDA000025782373000917
到第q类中心的欧式距离中的最小值,其中p=1,2,…k,q=1,2,…k,p≠q;dist(Cp,Cq)表示第p类的中心到第q类的中心的欧式距离,
Figure BDA000025782373000918
为第q类的上近似集,
Figure BDA000025782373000920
为第p类的下近似集。
在本发明实施例中,随着迭代次数的不断增加,如果使得下近似集的权重ωl的比重不断增加,上近似集的权重ωbnr的相应比重不断减小,算法的效率和精度会有所增加。通过分析,可以确定:在初始化阶段,随机取得一点作为初始聚类中心,然后根据k-means算法将样本划分到具体的某一类中。这样在进行前几次的粗糙聚类时,上近似集中的数据量较大,因此给予上近似集权重因子ωbnr一个相对较大的数;同样的,在算法运行到后期时,大多数样本已经被归结为每类的下近似集,这时把ωl的值相对提高,自然会使算法的效率有所提高。因此,可以将ωl、ωbnr的值根据下述公式进行动态的调整,具体地,在步骤S5中,可以采用公式
Figure BDA00002578237300101
对下近似集的权重因子ωl进行动态调整;采用公式上近似集的权重因子ωbnr进行动态调整。其中t表示算法的当前的迭代次数,tmax表示算法最大迭代次数。
在本发明实施例中,在步骤S6中,采用公式
i=1,2,…,n,计算粗糙核聚类的目标函数值Jw;其中,wj为特征加权系数,且
Figure BDA00002578237300104
表示下近似集中的对象到所属类中心距离的加权和,表示上近似集中的对象到所属类中心距离的加权和。
在本发明实施例中,核空间中聚类中心的计算是个非常关键的问题,在高维空间中已经把全部的样本都分配到每个聚类中心的上,下近似集中,则对应样本空间中反映的是不同类别中的样本对聚类的贡献程度。而且根据粗糙集的性质可知下近似集中的对象一定包含在上近似集中,除了下近似集中的对象,簇也有可能包含同时属于其他簇的上近似集的对象。在步骤S7中,采用公式
Figure BDA00002578237300111
计算第p类聚类中心Cp;其中,
Figure BDA00002578237300112
表示第p类边界集;
Figure BDA000025782373001114
表示第p类下近似集,
Figure BDA00002578237300113
表示第p类的上近似集;ck是聚类中心,ωl表示类的下近似集权重,ωbnr表示类的上近似集的权重。
本发明实施例提供的基于粗糙集的核聚类算法采用高斯核函数将样本映射到特征空间,放大样本差异;结合粗糙集来有效处理边界对象,并动态地改变上下近似集权重ωl和ωbnr在每一次迭代中的比重,提高聚类精度;采用reliefF算法权衡不同属性对聚类结果的贡献程度,进一步保证聚类出的结果符合电力负荷聚类的实际情况。同时,通过本算法得出的聚类精度较高,算法的收敛时间也较快,聚类结果比较符合电力负荷数据的实际情况。也证明了该算法在电力***负荷聚类的优越性,同时基于该算法的负荷聚类为没有安装布测点的变电站建立实用模型提供了有效途径,同时本算法得出的聚类结果和聚类中心为进一步开展负荷建模实用化工作提供了重要的参考依据。
在本发明实施例中,在粗糙集聚类中,根据粗糙核的上、下近似集的理论,最终的聚类结果会存在簇边界较模糊的情况,即簇边界不会完全确定。那么粗糙集的上、下近似集范围的判定方法为:
Figure BDA00002578237300114
Figure BDA00002578237300115
Figure BDA00002578237300116
则令
Figure BDA00002578237300117
否则令其中γ=0.07;
Figure BDA00002578237300119
表示第i个样本
Figure BDA000025782373001110
到第p类中心的欧式距离,
Figure BDA000025782373001111
表示第i个样本到第q类中心的欧式距离中的最小值,其中p=1,2,…k,q=1,2,…k,p≠q;dist(Cp,Cq)表示第p类的中心到第q类的中心的欧式距离,为第q类的上近似集,Cp为第p类的下近似集。
在本发明实施例中,而电力负荷实际情况中,如温度、日期等某些属性在聚类过程中发挥的作用巨大,而如气压、风力等属性的作用却很小甚至可以忽略。因此,为了使作用强的属性的利用程度也最大,于是采用reliefF方法对样本属性进行加权处理,则粗糙核聚类的目标函数如下式所示:
Figure BDA00002578237300121
i=1,2,…,n,计算粗糙核聚类的目标函数值Jw;其中,wj为特征加权系数,且
Figure BDA00002578237300122
ωl和ωbnr表示计算时类中心的下近似集和上近似集的权重,
Figure BDA00002578237300123
表示下近似集中的对象到所属类中心距离的加权和,表示上近似集中的对象到所属类中心距离的加权和。
本发明是基于粗糙集和核函数的聚类方法来研究负荷特性的相似性特征,能够更加客观、准确的提取同类负荷的功能本质特征,其思路清晰,算法简易快速有效,聚类结果合理,可以作为基于量测负荷建模的负荷特性记录装置安装位置选择的根本依据,对负荷建模研究的实用化具有重要意义。该方法不仅对于以变电站负荷构成比例为基本特征量的分类,综合有效。而且可以推广到行业典型用户的筛选,还可应用于局域量测的负荷动特性分类与综合。
图3示出了本发明实施例提供的用于电力负荷聚类的装置的模块结构,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
该用于电力负荷聚类的装置包括依次连接的数据采集模块1、数据计算模块2、动态调整模块3、判断模块4以及循环模块5,其中,数据采集模块1用于获取样本矩阵
Figure BDA00002578237300131
该样本矩阵包括n行,具体每一行为一个样本,从
Figure BDA00002578237300132
每个样本有d个属性,作为每个样本的d个列分量,即Φ(x)矩阵中的每个元素可以表示为
Figure BDA00002578237300135
其中i=1,2,…,n,j=1,2,…,d,样本
Figure BDA00002578237300136
均属于F空间;数据计算模块2包括依次连接初始类聚中心确定模块21以及类聚计算模块22,初始类聚中心确定模块21通过在Φ(x)的n个样本中选取k个样本来确定初始聚类中心C,C={C1,C2,...,Ck},其中C表示k类中心的矩阵集合,k为聚类数目,包括k行,具体每一行为每一类的中心,从C1到Ck,每一类的中心也相应的有d个属性,作为每类中心Cp的d个列分量,C矩阵中的每个元素可以表示为Cpj,其中p=1,2,…,k,j=1,2,…,d,
Figure BDA00002578237300137
类聚计算模块22用于将所述样本Φ(x)进行聚类计算,并根据上、下近似集确定的方法将各样本分配给最近类的上、下近似集;动态调整模块3用于根据当前迭代次数t对所述下近似集的权重因子ωl和所述上近似集的权重因子ωbnr进行动态调整;判断模块4用于计算粗糙核聚类的目标函数值Jw,并判断|Jw(t)-Jw(t-1)|≤ε或t≥tmax是否成立,若是,则生成最终聚类并结束;若否,则由所述循环模块进行循环计算;循环模块5用于当t=t+1时重新确定聚类中心并返回至类聚计算模块22并进行循环计算。
在本发明实施例中,动态调整模块3可以采用公式
Figure BDA00002578237300138
Figure BDA00002578237300139
对下近似集的权重因子ωl和所述上近似集的权重因子ωbnr进行动态调整。
在本发明实施例中,判断模块4可以采用公式
Figure BDA000025782373001310
计算粗糙核聚类的目标函数值Jw;其中,wj为特征加权系数,且
Figure BDA00002578237300141
表示下近似集中的对象到所属类中心距离的加权和,
Figure BDA00002578237300143
表示上近似集中的对象到所属类中心距离的加权和。
在本发明实施例中,循环模块5可以采用公式
Figure BDA00002578237300144
计算第p类聚类中心Cp;其中,
Figure BDA00002578237300145
表示第p类中心的边界集;
Figure BDA00002578237300147
表示第p类中心的下近似集,
Figure BDA00002578237300146
表示第p类中心的上近似集。
本发明提供的装置基于粗糙集和核函数的聚类方法来研究负荷特性的相似性特征,能够更加客观、准确的提取同类负荷的功能本质特征,算法简易快速有效,聚类结果合理,可以作为基于量测负荷建模的负荷特性记录装置安装位置选择的根本依据,对负荷建模研究的实用化具有重要意义。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种用于电力负荷聚类的方法,其特征在于,包括下述步骤:
S1:获取样本矩阵
Figure FDA00002578237200011
该样本矩阵包括n行,具体每一行为一个样本,从
Figure FDA00002578237200012
Figure FDA00002578237200013
每个样本有d个属性,作为每个样本
Figure FDA00002578237200014
的d个列分量,即Φ(x)矩阵中的每个元素可以表示为
Figure FDA00002578237200015
其中i=1,2,…,n,j=1,2,…,d,样本
Figure FDA00002578237200016
均属于F空间;
S2:通过在样本矩阵Φ(x)的n个样本中选取k个样本来确定初始聚类中心C,C={C1,C2,...,Ck},其中C表示k类中心的矩阵集合,k为聚类数目,包括k行,具体每一行为每一类的中心,从C1到Ck,每一类的中心也相应的有d个属性,作为每类中心Cp的d个列分量,C矩阵中的每个元素可以表示为Cpj,其中p=1,2,…,k,j=1,2,…,d,k取
Figure FDA00002578237200017
中任一值;
S3:令迭代次数t=1;
S4:将所述样本矩阵Φ(x)进行聚类计算,并根据上、下近似集确定的方法将各样本分配给最近类的上、下近似集;
S5:根据当前迭代次数t对所述下近似集的权重因子ωl和所述上近似集的权重因子ωbnr进行动态调整;
S6:计算粗糙核聚类的目标函数值Jw,并判断|Jw(t)-Jw(t-1)|≤ε或t≥tmax是否成立,若是,则结束;若否,则进入步骤S7;ε为根据实际情况确定的一个参数,tmax为人为确定的迭代次数上限;
S7:令t=t+1,重新确定聚类中心Cp,并转入步骤S4。
2.如权利要求1所述的方法,其特征在于,所述步骤S1具体为:获取n个变电站综合负荷静态特性的准样本,构成准样本矩阵X={x1,x2,…,xn},xi∈Rd,并通过高斯核函数将所述准样本数据映射到Hilbert空间后获得样本
Figure FDA00002578237200021
准样本xi均属于空间Rd内;所述高斯核函数为:F(x,y)=exp(-β||x-y||2/2σ2),其中σ为函数的宽度参数,β为1,x为变换前的准样本,y为变化后的样本。
3.如权利要求1所述的方法,其特征在于,在步骤S4中,上、下近似集确定的方法具体为:
Figure FDA00002578237200022
Figure FDA00002578237200023
Figure FDA00002578237200024
则令
Figure FDA00002578237200025
否则令
Figure FDA00002578237200026
其中γ=0.07;
Figure FDA00002578237200027
表示第i个样本
Figure FDA00002578237200028
到第p类中心的欧式距离,表示第i个样本
Figure FDA000025782372000210
到第q类中心的欧式距离中的最小值,其中p=1,2,…k,q=1,2,…k,p≠q;dist(Cp,Cq)表示第p类的中心到第q类的中心的欧式距离,
Figure FDA000025782372000211
为第q类的上近似集,
Figure FDA000025782372000218
为第p类的下近似集。
4.如权利要求1所述的方法,其特征在于,在步骤S5中,采用公式
Figure FDA000025782372000212
Figure FDA000025782372000213
对下近似集的权重因子ωl和所述上近似集的权重因子ωbnr进行动态调整。
5.如权利要求4所述的方法,其特征在于,在步骤S6中,采用公式i=1,2,…,n,计算粗糙核聚类的目标函数值Jw;其中,wj为特征加权系数,且
Figure FDA000025782372000216
表示下近似集中的对象到所属类中心距离的加权和,
Figure FDA000025782372000217
表示上近似集中的对象到所属类中心距离的加权和。
6.如权利要求4所述的方法,其特征在于,在步骤S7中,采用公式计算第p类聚类中心Cp;其中,
Figure FDA00002578237200032
表示第p类边界集;表示第p类的下近似集,表示第p类的上近似集。
7.一种用于电力负荷聚类的装置,其特征在于,包括依次连接的数据采集模块、数据计算模块、动态调整模块、判断模块以及循环模块,
所述数据采集模块用于获取样本矩阵
Figure FDA00002578237200034
该样本矩阵包括n行,具体每一行为一个样本,从
Figure FDA00002578237200035
Figure FDA00002578237200036
每个样本有d个属性,作为每个样本
Figure FDA00002578237200037
的d个列分量,即Φ(x)矩阵中的每个元素可以表示为
Figure FDA00002578237200038
i=1,2,…,n,j=1,2,…,d,;
所述数据计算模块包括依次连接的初始类聚中心确定模块和类聚计算模块,所述初始类聚中心确定模块通过在样本矩阵Φ(x)的n个样本中选取k个样本来确定初始聚类中心C,C={C1,C2,...,Ck},其中C表示k类中心的矩阵集合,k为聚类数目,包括k行,具体每一行为每一类的中心,从C1到Ck,k取
Figure FDA00002578237200039
中任一值,每一类的中心也相应的有d个属性,作为每类中心Cp的d个列分量,C矩阵中的每个元素可以表示为Cpj,p=1,2,…,k;所述类聚计算模块用于将所述样本矩阵Φ(x)进行聚类计算,并根据上、下近似集确定的方法将各样本分配给最近类的上、下近似集;
所述动态调整模块用于根据当前迭代次数t对所述下近似集的权重因子ωl和所述上近似集的权重因子ωbnr进行动态调整;
所述判断模块用于计算粗糙核聚类的目标函数值Jw,并判断|Jw(t)-Jw(t-1)|≤ε或t≥tmax是否成立,若是,则生成最终聚类并结束;若否,则由所述循环模块进行循环计算;
所述循环模块用于当t=t+1时重新确定聚类中心并返回至所述类聚计算模块并进行循环计算。
8.如权利要求7所述的装置,其特征在于,所述动态调整模块采用公式
Figure FDA00002578237200041
对下近似集的权重因子ωl和所述上近似集的权重因子ωbnr进行动态调整。
9.如权利要求7所述的装置,其特征在于,所述判断模块采用公式计算粗糙核聚类的目标函数值Jw;其中,wj为特征加权系数,且
Figure FDA00002578237200045
表示下近似集中的对象到所属类中心距离的加权和,
Figure FDA00002578237200046
表示上近似集中的对象到所属类中心距离的加权和。
10.如权利要求7所述的装置,其特征在于,所述循环模块采用公式
Figure FDA00002578237200047
计算第p类聚类中心Cp;其中,
Figure FDA00002578237200048
表示第p类边界集;
Figure FDA000025782372000410
表示第p类的下近似集,
Figure FDA00002578237200049
表示第p类的上近似集。
CN2012105373292A 2012-12-13 2012-12-13 一种用于电力负荷聚类的方法及装置 Pending CN103049651A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012105373292A CN103049651A (zh) 2012-12-13 2012-12-13 一种用于电力负荷聚类的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012105373292A CN103049651A (zh) 2012-12-13 2012-12-13 一种用于电力负荷聚类的方法及装置

Publications (1)

Publication Number Publication Date
CN103049651A true CN103049651A (zh) 2013-04-17

Family

ID=48062285

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012105373292A Pending CN103049651A (zh) 2012-12-13 2012-12-13 一种用于电力负荷聚类的方法及装置

Country Status (1)

Country Link
CN (1) CN103049651A (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103872678A (zh) * 2014-03-06 2014-06-18 国家电网公司 一种基于变电站量测的负荷模型辨识方法
CN104063480A (zh) * 2014-07-02 2014-09-24 国家电网公司 一种基于电力大数据的负荷曲线并行聚类方法
CN104615722A (zh) * 2015-02-06 2015-05-13 浙江工业大学 基于密度搜索与快速划分的混合数据聚类方法
CN105021888A (zh) * 2015-07-06 2015-11-04 广州供电局有限公司 基于数据聚类的谐波数据监测方法
CN105719194A (zh) * 2016-01-11 2016-06-29 河南许继仪表有限公司 一种自动寻优型电力负荷分类方法
CN106055883A (zh) * 2016-05-25 2016-10-26 中国电力科学研究院 一种基于改进Sammon映射的暂稳评估输入特征有效性分析方法
CN106067034A (zh) * 2016-05-27 2016-11-02 中国电力科学研究院 一种基于高维矩阵特征根的配电网负荷曲线聚类方法
CN106257870A (zh) * 2015-06-16 2016-12-28 福特全球技术公司 用于预览数据的车辆总线消息传送的压缩算法
CN106446967A (zh) * 2016-10-28 2017-02-22 国网福建省电力有限公司 一种新型电力***负荷曲线聚类方法
US9829880B2 (en) 2014-11-20 2017-11-28 General Electric Company System and method for modelling load in an electrical power network
CN107423769A (zh) * 2017-08-03 2017-12-01 四川大学 基于形态特征的电力负荷曲线自适应聚类方法
CN107480731A (zh) * 2017-09-06 2017-12-15 西安西热电站信息技术有限公司 一种火电厂汽动给水泵组故障特征的早期识别方法
CN108306284A (zh) * 2018-01-05 2018-07-20 东南大学 一种基于局部智能量测的在线负荷建模方法
CN108805174A (zh) * 2018-05-18 2018-11-13 广东惠禾科技发展有限公司 聚类方法及装置
CN110165657A (zh) * 2018-08-30 2019-08-23 中国南方电网有限责任公司 考虑用户行业属性的变电站负荷聚类分析方法
CN110796159A (zh) * 2019-09-12 2020-02-14 国网浙江省电力有限公司杭州供电公司 基于k-means算法的电力数据分类方法及***
CN111476316A (zh) * 2020-04-28 2020-07-31 福建师范大学 一种基于云计算下电力负荷特征数据均值聚类的方法及***
CN112258231A (zh) * 2020-10-22 2021-01-22 国网新疆电力有限公司经济技术研究院 基于改进k均值算法的配电网变电站选址定容方法及装置
CN113761700A (zh) * 2020-06-05 2021-12-07 国家电网有限公司华东分部 基于动态聚类的负荷建模与在线修正方法及***

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101414366A (zh) * 2008-10-22 2009-04-22 西安交通大学 基于改进极端学习机方法的电力***短期负荷预测方法
CN101556464A (zh) * 2009-05-22 2009-10-14 天津大学 基于关联规则的城市电力负荷预测模型自动推荐方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101414366A (zh) * 2008-10-22 2009-04-22 西安交通大学 基于改进极端学习机方法的电力***短期负荷预测方法
CN101556464A (zh) * 2009-05-22 2009-10-14 天津大学 基于关联规则的城市电力负荷预测模型自动推荐方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
P LINGRAS: "Interval set clustering of web user with rough k-means", 《JOURNAL OF INTELLIGENT INFORMATION SYSTEM》, vol. 23, no. 1, 31 December 2004 (2004-12-31) *
周涛: "具有自适应参数的粗糙k-means聚类算法", 《计算机工程与应用》, vol. 46, no. 26, 31 December 2010 (2010-12-31) *
姚丽娟: "基于粒子群和粗糙集的聚类算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 09, 15 September 2012 (2012-09-15) *
姚丽娟等: "基于粒子群的粗糙核聚类算法", 《计算机应用研究》, vol. 29, no. 8, 31 August 2012 (2012-08-31), pages 2854 - 2857 *

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103872678B (zh) * 2014-03-06 2016-02-10 国家电网公司 一种基于变电站量测的负荷模型辨识方法
CN103872678A (zh) * 2014-03-06 2014-06-18 国家电网公司 一种基于变电站量测的负荷模型辨识方法
CN104063480A (zh) * 2014-07-02 2014-09-24 国家电网公司 一种基于电力大数据的负荷曲线并行聚类方法
US9829880B2 (en) 2014-11-20 2017-11-28 General Electric Company System and method for modelling load in an electrical power network
CN104615722A (zh) * 2015-02-06 2015-05-13 浙江工业大学 基于密度搜索与快速划分的混合数据聚类方法
CN104615722B (zh) * 2015-02-06 2018-04-27 浙江工业大学 基于密度搜索与快速划分的混合数据聚类方法
CN106257870A (zh) * 2015-06-16 2016-12-28 福特全球技术公司 用于预览数据的车辆总线消息传送的压缩算法
CN105021888A (zh) * 2015-07-06 2015-11-04 广州供电局有限公司 基于数据聚类的谐波数据监测方法
CN105021888B (zh) * 2015-07-06 2018-09-18 广州供电局有限公司 基于数据聚类的谐波数据监测方法
CN105719194A (zh) * 2016-01-11 2016-06-29 河南许继仪表有限公司 一种自动寻优型电力负荷分类方法
CN106055883A (zh) * 2016-05-25 2016-10-26 中国电力科学研究院 一种基于改进Sammon映射的暂稳评估输入特征有效性分析方法
CN106055883B (zh) * 2016-05-25 2022-09-02 中国电力科学研究院 一种基于改进Sammon映射的暂稳评估输入特征有效性分析方法
CN106067034B (zh) * 2016-05-27 2022-03-18 中国电力科学研究院 一种基于高维矩阵特征根的配电网负荷曲线聚类方法
CN106067034A (zh) * 2016-05-27 2016-11-02 中国电力科学研究院 一种基于高维矩阵特征根的配电网负荷曲线聚类方法
CN106446967A (zh) * 2016-10-28 2017-02-22 国网福建省电力有限公司 一种新型电力***负荷曲线聚类方法
CN107423769B (zh) * 2017-08-03 2019-10-01 四川大学 基于形态特征的电力负荷曲线自适应聚类方法
CN107423769A (zh) * 2017-08-03 2017-12-01 四川大学 基于形态特征的电力负荷曲线自适应聚类方法
CN107480731A (zh) * 2017-09-06 2017-12-15 西安西热电站信息技术有限公司 一种火电厂汽动给水泵组故障特征的早期识别方法
CN108306284A (zh) * 2018-01-05 2018-07-20 东南大学 一种基于局部智能量测的在线负荷建模方法
CN108805174A (zh) * 2018-05-18 2018-11-13 广东惠禾科技发展有限公司 聚类方法及装置
CN110165657A (zh) * 2018-08-30 2019-08-23 中国南方电网有限责任公司 考虑用户行业属性的变电站负荷聚类分析方法
CN110796159A (zh) * 2019-09-12 2020-02-14 国网浙江省电力有限公司杭州供电公司 基于k-means算法的电力数据分类方法及***
CN111476316A (zh) * 2020-04-28 2020-07-31 福建师范大学 一种基于云计算下电力负荷特征数据均值聚类的方法及***
CN111476316B (zh) * 2020-04-28 2023-04-14 福建师范大学 一种基于云计算下电力负荷特征数据均值聚类的方法及***
CN113761700A (zh) * 2020-06-05 2021-12-07 国家电网有限公司华东分部 基于动态聚类的负荷建模与在线修正方法及***
CN112258231A (zh) * 2020-10-22 2021-01-22 国网新疆电力有限公司经济技术研究院 基于改进k均值算法的配电网变电站选址定容方法及装置

Similar Documents

Publication Publication Date Title
CN103049651A (zh) 一种用于电力负荷聚类的方法及装置
Cai et al. Predicting the energy consumption of residential buildings for regional electricity supply-side and demand-side management
Ye et al. A data-driven bottom-up approach for spatial and temporal electric load forecasting
Wu et al. A data mining approach combining $ K $-means clustering with bagging neural network for short-term wind power forecasting
CN106022509B (zh) 考虑地域和负荷性质双重差异的配电网空间负荷预测方法
CN106485262A (zh) 一种母线负荷预测方法
CN109359786A (zh) 一种电力台区短期负荷预测方法
CN105701596A (zh) 一种基于大数据技术的配网抢修精益化方法以及管理***
CN112149873B (zh) 一种基于深度学习的低压台区线损合理区间预测方法
CN107730031A (zh) 一种超短期高峰负荷预测方法及其***
CN104881706A (zh) 一种基于大数据技术的电力***短期负荷预测方法
CN105389636A (zh) 一种低压台区kfcm-svr合理线损预测方法
CN109461025A (zh) 一种基于机器学习的电能替代潜在客户预测方法
CN111461921B (zh) 一种基于机器学习的负荷建模典型用户数据库更新方法
CN103679263A (zh) 基于粒子群支持向量机的雷电临近预测方法
CN108364187A (zh) 一种基于停电敏感特性的停电敏感用户确定方法和***
CN108345908A (zh) 电网数据的分类方法、分类设备及存储介质
CN110380444A (zh) 一种基于变结构Copula的多场景下分散式风电有序接入电网的容量规划方法
CN103942606A (zh) 基于果蝇智能优化算法的居民用电客户细分方法
CN111460001B (zh) 一种配电网理论线损率评估方法及***
CN110738232A (zh) 一种基于数据挖掘技术的电网电压越限成因诊断方法
CN104050547A (zh) 一种油田开发规划方案非线性优选决策方法
CN117272850B (zh) 配电网安全运行调度弹性空间分析方法
CN111415049A (zh) 一种基于神经网络及聚类的停电敏感性分析方法
Saffari et al. Deep convolutional graph rough variational auto-encoder for short-term photovoltaic power forecasting

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20130417