CN113344073A - 一种基于融合进化算法的日负荷曲线聚类方法及*** - Google Patents
一种基于融合进化算法的日负荷曲线聚类方法及*** Download PDFInfo
- Publication number
- CN113344073A CN113344073A CN202110613240.9A CN202110613240A CN113344073A CN 113344073 A CN113344073 A CN 113344073A CN 202110613240 A CN202110613240 A CN 202110613240A CN 113344073 A CN113344073 A CN 113344073A
- Authority
- CN
- China
- Prior art keywords
- individual
- data
- population
- load curve
- individuals
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请属于电力***分析与控制技术领域,提供一种基于融合进化算法的日负荷曲线聚类方法及***,所述一种基于融合进化算法的日负荷曲线聚类方法包括:获取多个用户的原始日负荷曲线负荷并预处理,随机生成S个遗传算法个体形成初始化种群,所述个体由聚类中心编码构成;根据模糊C均值算法更新每个个体的聚类中心编码,获得数据对象对于聚类中心的隶属度矩阵,选定适应度函数,计算个体适应度值;循环重复对种群中个体的遗传操作和个体的聚类中心编码更新操作,直至当前退火温度小于退火终止温度;选取种群中适应度值最大个体的聚类中心编码值确定为最终聚类中心。上述基于融合进化算法的日负荷曲线聚类方法有效提高了日负荷曲线聚类方法的准确性。
Description
技术领域
本申请属于电力***分析与控制技术领域,具体涉及一种基于融合进化算法的日负荷曲线聚类方法及***。
背景技术
随着智能电网建设的不断推进,数据采集设备可以收集到大量用户的用电情况。不同类型的用户,如民用、商业、工业和农业等,在电力消费模式上存在很大的差异,即使是同一类型的用户,他们的用电模式也可能不一样。如何采取有效的数据挖掘技术,在大数据背景下对不同类型的海量用户负荷曲线数据进行精细化划分,从而挖掘出不同类型负荷间的内在联系及对应的用电行为和用电特性等信息,无疑对负荷预测、电网规划和需求侧响应均有一定的指导意义。
传统的日负荷曲线聚类方法主要包括基于原始负荷数据的直接聚类方法和基于降维的间接聚类方法。直接聚类方法通常是将日负荷曲线各采样时刻点的负荷值经归一化后,采用K均值、模糊C均值和自组织映射等算法进行聚类。模糊C均值算法是一种基于划分的模糊聚类方法,该算法通过描述样本对不同类别的隶属度进行客观的分类,算法简单搜索速度快,但聚类结果过度依赖初始聚类中心,容易收敛于局部极值点,陷入局部最优解,导致日负荷曲线分类结果出现偏差。
为了克服模糊C均值算法的上述缺陷,可以结合遗传算法对模糊C均值算法进行改进,例如,可以利用模糊C均值算子来代替遗传算法中的交叉算子,提出了一种混合遗传聚类算法,还可以采用聚类中心的浮点编码方式,并设计了浮点数交叉和变异算法来提高搜索效率。
然而,当样本数目、样本维度和样本类别数较大时,这些算法常常出现过早的收敛于局部极优的现象。当算法出现早熟时,仅仅依靠较小的变异概率很难从局部极优点跳出。而且由于进化算法在进化过程中可能会产生退化现象,将导致迭代次数过长以及聚类准确率不高。
发明内容
本申请提供一种基于融合进化算法的日负荷曲线聚类方法及***,以提供一种准确率更高的日负荷曲线聚类方法及***。
本申请第一方面提供一种基于融合进化算法的日负荷曲线聚类方法,所述一种基于融合进化算法的日负荷曲线聚类方法包括:
步骤1:获取多个用户的原始日负荷曲线负荷,对原始日负荷曲线负荷进行预处理,获得负荷数据集,所述负荷数据集由多个数据对象组成,一个数据对象代表一条原始日负荷曲线的负荷;
步骤2:初始化模拟退火算法的当前退火温度和退火终止温度,基于负荷数据集预分类的类簇数目C,初始化遗传算法个体,随机生成S个个体形成初始化种群,所述个体由C个聚类中心编码构成;
步骤3:根据模糊C均值算法更新每个个体的聚类中心编码,获得数据对象相对于聚类中心的隶属度矩阵,选定适应度函数,计算个体适应度值;
步骤4:根据遗传算法对种群中个体进行遗传操作,根据当前退火温度和个体适应度值更新种群中个体的聚类中心编码,再对当前退火温度执行降温操作,获得更新后的当前退火温度;
步骤5:重复步骤4直至更新后的当前退火温度小于退火终止温度;
步骤6:选取种群中适应度值最大的个体作为最优个体,所述最优个体的聚类中心编码值确定为最终的C个聚类中心。
可选的,所述获取多个用户的原始日负荷曲线负荷,对原始日负荷曲线负荷进行预处理,获得负荷数据集的步骤,具体为:
查找每条原始日负荷曲线的负荷中缺失和异常数据,所述异常数据包括骤降、暴增或为负值的数据,若原始日负荷曲线的负荷异常数据达到采集量的10%,则将所述原始日负荷曲线剔除,获得第一备用负荷数据;
对第一备用负荷数据中缺失和异常数据进行补充和修正,获得第二备用负荷数据;
采用线性函数归一化方法对第二备用负荷数据进行归一化处理,获得负荷数据集。
可选的,所述对第一备用负荷数据中缺失和异常数据进行补充和修正采用重心拉格朗日插值法,所述重心拉格朗日插值法根据重心权来定义拉格朗日插值基函数。
可选的,所述个体由C个聚类中心编码构成采用二进制编码。
可选的,所述根据模糊C均值算法更新每个个体的聚类中心编码,获得数据对象相对于聚类中心的隶属度矩阵采用的隶属度函数为:
式中,uik为第i个数据对象属于第k类的隶属度,c为聚类中心个数,dik为第i个数据对象到第k类的距离,r为模糊指数;
所述选定适应度函数,计算个体适应度值采用的适应度函数为:
fi=ranking(Jr);
式中,fi代表种群中的第i个个体的适应度值,ranking()为基于排序的分配函数,Jr为:
式中,U为隶属度矩阵,V为聚类中心矩阵,c为聚类中心个数,n-x为数据对象数量,uik为第i个数据对象属于第k类的隶属度,dik为第i个数据对象到第k类的距离,r为模糊指数。
可选的,所述根据遗传算法对种群中个体进行遗传操作,根据当前退火温度和个体适应度值更新种群中个体的聚类中心编码,再对当前退火温度执行降温操作,获得更新后的当前退火温度的步骤,具体为:
步骤601:对种群中个体进行选择、交叉和变异遗传操作生成新个体;
步骤602:计算新个体适应度值,若新个体的适应度值大于或等于种群中个体的适应度值,则以新个体的聚类中心编码值更新种群中个体的聚类中心编码值,若新个体的适应度值小于种群中个体的适应度值,则按照预设概率以新个体的聚类中心编码值更新种群中个体的聚类中心编码值,所述预设概率为:
式中,fi'为新个体的适应度值,fi为种群中个体的适应度值,T为当前退火温度;
步骤603:循环重复步骤601至步骤602直到循环次数大于设定的最大循环次数;
步骤604:根据降温公式更新当前退火温度,所述降温公式为:
Ti+1=p×Ti;
式中,Ti+1为更新后的当前退火温度温度值,Ti为当前退火温度温度值,p为冷却系数。
可选的,所述对种群中个体进行选择、交叉和变异遗传操作的步骤中选择算子采用随机遍历抽样,交叉算子采用多点交叉算子,变异算子采用基本位变异算子。
本申请第二方面提供一种基于融合进化算法的日负荷曲线聚类***,所述一种基于融合进化算法的日负荷曲线聚类***用于执行本申请第一方面提供的一种基于基于融合进化算法的日负荷曲线聚类方法,包括:
数据获取模块,用于获取多个用户的原始日负荷曲线负荷;
数据预处理模块,用于对所述原始日负荷曲线负荷进行预处理,获得负荷数据集;
初始化模块,用于初始化模拟退火算法的当前退火温度和退火终止温度,以及用于初始化遗传算法个体,并随机生成S个个体形成初始化种群,所述个体由聚类中心编码构成;
模糊C均值模块,用于更新每个个体的聚类中心编码,获得数据对象相对于聚类中心的隶属度矩阵,选定适应度函数,计算个体适应度值;
遗传退火模块,用于对种群中个体进行遗传操作,并根据个体适应度值更新种群中个体的聚类中心编码,再对当前退火温度执行降温操作,获得更新后的当前退火温度,以及用于判断更新后的当前退火温度是否小于退火终止温度;
筛选模块,用于选取种群中适应度值最大的个体作为最优个体,所述最优个体的聚类中心编码值确定为最终的C个聚类中心。
可选的,所述数据预处理模块具体包括:
数据清洗单元,用于查找每条原始日负荷曲线的负荷中缺失和异常数据,所述异常数据包括骤降、暴增或为负值的数据,若原始日负荷曲线的负荷异常数据达到采集量的10%,则将所述原始日负荷曲线剔除,获得第一备用负荷数据;
数据插值单元,用于采用重心拉格朗日插值法对第一备用负荷数据中缺失和异常数据进行补充和修正,获得第二备用负荷数据;
数据归一化单元,用于采用线性函数归一化方法对第二备用负荷数据进行归一化处理,获得负荷数据集。
可选的,所述遗传退火模块具体包括:
遗传操作单元,用于对种群中个体进行选择、交叉和变异遗传操作生成新个体;
适应度筛选单元,用于计算新个体适应度值,若新个体的适应度值大于或等于种群中个体的适应度值,则以新个体的聚类中心编码值更新种群中个体的聚类中心编码值,若新个体的适应度值小于种群中个体的适应度值,则按照预设概率以新个体的聚类中心编码值更新种群中个体的聚类中心编码值,所述预设概率为:
式中,fi'为新个体的适应度值,fi为种群中个体的适应度值,T为当前退火温度;
循环判定模块,用于判断循环次数是否大于设定的最大循环次数;
退火单元,用于根据降温公式更新当前退火温度,所述降温公式为:
Ti+1=p×Ti;
式中,Ti+1为更新后的当前退火温度温度值,Ti为当前退火温度温度值,p为冷却系数。
本申请提供一种基于融合进化算法的日负荷曲线聚类方法及***,所述一种基于融合进化算法的日负荷曲线***用于执行一种基于融合进化算法的日负荷曲线聚类方法的步骤,获取多个用户的原始日负荷曲线负荷,对所述原始日负荷曲线负荷进行预处理,获得负荷数据集,初始化模拟退火算法的当前退火温度和退火终止温度,初始化遗传算法个体,并随机生成S个个体形成初始化种群,所述个体由聚类中心编码构成;根据模糊C均值算法更新每个个体的聚类中心编码,获得数据对象相对于聚类中心的隶属度矩阵,选定适应度函数,计算个体适应度值;循环重复对种群中个体的遗传操作和个体的聚类中心编码更新操作,直至更新后的当前退火温度小于退火终止温度;选取种群中适应度值最大的个体作为最优个体,所述最优个体的聚类中心编码值确定为最终的C个聚类中心。
本申请实施例提供的融合进化算法的日负荷曲线聚类方法,通过模糊模糊C均值算法、遗传算法以及模拟退火算法结合更新聚类中心,有效避免了陷入局部最优,提高了日负荷曲线聚类方法的准确性。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的基于融合进化算法的日负荷曲线聚类方法的流程示意图。
图2是本申请实施例提供的基于融合进化算法的日负荷曲线聚类***的结构示意图。
图3是本申请实施例重心拉格朗日插值法填补数据前后对比图。
图4是本申请实施例归一化后的不同行业日负荷曲线。
图5是本申请实施例的日负荷曲线聚类结果。
图6是本申请实施例的日负荷曲线分类结果。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。
如图1所示,为本申请实施例提供的一种基于融合进化算法的日负荷曲线聚类方法的流程示意图,所述一种基于融合进化算法的日负荷曲线聚类方法包括步骤1至步骤6。
步骤1,获取多个用户的原始日负荷曲线负荷,对原始日负荷曲线负荷进行预处理,获得负荷数据集。
很多聚类算法对异常和缺失数据都较为敏感,负荷数据中的异常数据可能会影响聚类的效果,产生错的分类,所以有必要对负荷数据进行预处理。负荷的缺失和异常数据产生的原因有很多,首先数据测量装置的损坏和异常可能会导致数据缺失,其次线路维护或者安检等电网的正常活动可能会导致负荷数据确实,而负荷数据本身从测量装置到分析端的传输也有可能导致数据异常,例如离群值、噪声和偏差等。对于负荷数据异常和缺失预处理方法有经验修正法、阈值判别法和曲线置换法等。
本申请实施例选取412条原始日负荷曲线,每条原始日负荷曲线上有96个负荷采样点,采样点时间间隔为15分钟,获取负荷数据后对其进行预处理,具体包括步骤S101至步骤S103。
步骤S101,查找每条原始日负荷曲线负荷中缺失和异常数据,异常的数据包括骤降、暴增或为负值的数据,若原始日负荷曲线的负荷异常数据达到采样数量的10%,则认为该条原始日负荷曲线无效,将其剔除,获得第一备用负荷数据,例如获取n条原始日负荷曲线,有x条原始日负荷曲线无效,则有效原始日负荷曲线为n-x条,形成(n-x)×m的矩阵为第一备用负荷数据。
在本申请实施例的412条原始日负荷曲线中,缺失和异常数据在10个采样点的曲线共计12条,剔除这12条曲线后进行下一步操作。
步骤S102,对第一备用负荷数据中缺失和异常数据进行补充和修正,采用重心拉格朗日插值法,获得第二备用负荷数据。
拉格朗日插值法因公式结构整齐紧凑,在理论分析中应用方便,但插值点增加或减少时,所对应的基函数要重新计算,过程繁琐,因此本申请实施例提出重心拉格朗日插值法,如图3所示,为本申请实施例重心拉格朗日插值法填补数据前后对比图。重心拉格朗日插值法在计算插值时不必计算基函数,可大幅度减少计算量,设有k+1个节点的多项式函数(x0,y0)(x1,y1)...(xk,yk),定义重心权为:
拉格朗日基函数可以定义为:
式中,l(x)=(x-x0)…(x-xk);
重心拉格朗日插值公式为:
式中,xj为自变量,yj为因变量。
步骤S103,对第二备用负荷数据进行归一化处理获得负荷数据集,负荷数据集由多个数据对象组成,一个数据对象代表一条日负荷曲线。
日负荷曲线因用户属性不同量纲往往也不相同,数据归一化处理可消除量纲的影响,使得分析结果更加准确。如图4所示,为本申请实施例归一化后的不同行业日负荷曲线,采用线性函数归一化方法,线性函数归一化公式如下:
式中,X′i为归一化后的负荷数据,Xi为归一化前的负荷数据,Xmin为归一化前最小的负荷数据,Xmax为归一化前最大的负荷数据。
步骤2,初始化模拟退火算法的当前退火温度和退火终止温度,基于负荷数据集预分类的类簇数目C,初始化遗传算法个体,随机生成S个个体形成初始化种群。
模拟退火算法是一种贪心算法,在预设的概率下接受较差解。本申请实施例将模拟退火算法和遗传算法结合,可以跳出局部最优解,寻找到全局最优解,避免遗传算法的早期早熟和后期进化停滞的收敛现象。本申请实施例设定当前退火温度为100,退火终止温度为1。
对于负荷数据集预分类类簇数目的确定有多种方法,例如间隙统计法、肘形判据法和有效性函数指标等,本申请实施例选取的用户样本来自工业、商业、农业和教育类,所以初步确定类簇数目C为4。随机生成4个96维的数据对象作为负荷数据集的4个初始聚类中心,采用二进制编码,用随机生成的4个数据对象代表遗传算法的个体,重复随机生成S个个体形成初始化种群。
步骤3,根据模糊C均值算法更新每个个体的聚类中心编码,获得数据对象相对于聚类中心的隶属度矩阵,选定适应度函数,计算个体适应度值。
模糊均值聚类融合了模糊理论的精髓,将模糊理论和聚类理论相结合,根据样本的内在规律,将样本分为多个模糊组,通过距离函数确定样本间的相似度,利用数学规划理论获得最优聚类结果。所述根据模糊C均值算法更新每个个体的聚类中心编码,获得数据对象相对于聚类中心的隶属度矩阵,选定适应度函数,计算个体适应度值的步骤具体包括步骤S301至步骤S303。
步骤S301,根据个体的初始聚类中心和隶属度函数计算数据对象相对于每个聚类中心的隶属度,获得每个个体的隶属度矩阵,再根据隶属度矩阵和聚类中心更新公式更新个体的聚类中心编码,所述隶属度函数为:
式中,uik为第i个数据对象属于第k类的隶属度,c为聚类中心个数,dik为第i个数据对象到第k个聚类中心的欧式距离,r为模糊指数,其中隶属度需要满足公式如下:
所述聚类中心更新公式为:
式中,Vk为第k个聚类中心,zi为第i个数据对象,uik为第i个数据对象属于第k类的隶属度,n-x为数据对象数量。
步骤S302,根据隶属度函数,获得数据对象相对于更新后的聚类中心的隶属度矩阵。
聚类中心更新后,数据对象相对于其的隶属度也会随之改变,重新计算隶属度,获得更新后聚类中心所属的隶属度矩阵。
步骤S303,选定适应度函数,计算个体适应度值,所述适应度函数为:
fi=ranking(Jr);
式中,fi代表种群中的第i个个体的适应度值,ranking()为基于排序的分配函数,Jr为:
式中,U为隶属度矩阵,V为聚类中心矩阵,c为聚类中心个数,n-x为数据对象数量,uik为第i个数据对象属于第k类的隶属度,dik为第i个数据对象到第k类的距离,r为模糊指数。
根据更新后的聚类中心和与其对应的隶属度矩阵,计算Jr的值并排序得到适应度值。
步骤4,根据遗传算法对种群中个体进行遗传操作,根据当前退火温度和个体适应度值更新种群中个体的聚类中心编码,再对当前退火温度执行降温操作,获得更新后的当前退火温度。
步骤401:对种群中个体进行选择、交叉和变异遗传操作生成新个体。
本申请实施例对种群中S个个体进行选择、交叉和变异遗传操作,生成与种群中个体一一对应的新个体,遗传操作中选择算子采用随机遍历抽样,交叉算子采用多点交叉算子,交叉概率为0.7,变异算子采用基本位变异算子,变异概率为0.01。
步骤402:计算新个体适应度值,若新个体的适应度值大于或等于种群中个体的适应度值,则以新个体的聚类中心编码值更新种群中个体的聚类中心编码值,若新个体的适应度值小于种群中个体的适应度值,则按照预设概率以新个体的聚类中心编码值更新种群中个体的聚类中心编码值,所述预设概率为:
式中,fi'为新个体的适应度值,fi为种群中个体的适应度值,T为当前退火温度。
步骤403:循环重复步骤401至步骤402直到循环次数大于设定的最大循环次数。
步骤404:根据降温公式更新当前退火温度,所述降温公式为:
Ti+1=p×Ti;
式中,Ti+1为更新后的当前退火温度温度值,Ti为当前退火温度温度值,p为冷却系数。
本申请实施例中,冷却系数选取0.8。
步骤5,重复步骤4直至更新后的当前退火温度小于退火终止温度。
步骤6,选取种群中适应度值最大的个体作为最优个体。
对最优个体的聚类中心编码值进行解码,获得最终的4个聚类中心,根据欧式距离将数据对象分类。如图5所示,为本申请实施例的日负荷曲线聚类结果,如图6所示,为本申请实施例的日负荷曲线分类结果,其中用户类别Ⅰ呈现双峰状态,此类用户多为教育类行业,此类行业清晨起负荷,上午和下午负荷较高,中午需要休息,所示负荷略微下降;用户类别Ⅱ多为农业,农业机组多数在白天运行,且运行周期不定,时长较短,如灌溉、畜牧;用户类别Ⅲ多为商业,上午9点起负荷,持续至晚上10点,符合商业运行模式;用户类别Ⅳ呈峰平状态,此类行业多为工业,工业包含各种大型机器,其负荷较高,而且为保证效益,需全天运行,因此呈高负荷峰平状态。
本申请实施例第二方面提供一种基于融合进化算法的日负荷曲线聚类***,所述一种基于融合进化算法的日负荷曲线聚类***用于执行本申请实施例第一方面提供的一种基于融合进化算法的日负荷曲线聚类方法,对于本申请实施例第二方面提供的聚类***中公开的细节,请参见本申请实施例第一方面提供的基于融合进化算法的日负荷曲线聚类方法。
如图2所示,为本申请实施例提供的一种基于融合进化算法的日负荷曲线聚类***的结构示意图。所述一种基于融合进化算法的日负荷曲线聚类***包括数据获取模块、数据预处理模块、初始化模块、模糊C均值模块、遗传退火模块和筛选模块。
数据获取模块,用于获取多个用户的原始日负荷曲线负荷。
数据预处理模块,用于对所述原始日负荷曲线负荷进行预处理,获得负荷数据集。
初始化模块,用于初始化模拟退火算法的当前退火温度和退火终止温度,以及用于初始化遗传算法个体,并随机生成S个个体形成初始化种群,所述个体由聚类中心编码构成。
模糊C均值模块,用于根据模糊C均值算法更新每个个体的聚类中心编码,获得数据对象相对于聚类中心的隶属度矩阵,选定适应度函数,计算个体适应度值。
遗传退火模块,用于对种群中个体进行遗传操作,并根据个体适应度值更新种群中个体的聚类中心编码,再对当前退火温度执行降温操作,获得更新后的当前退火温度,以及用于判断更新后的当前退火温度是否小于退火终止温度。
筛选模块,用于选取种群中适应度值最大的个体作为最优个体,所述最优个体的聚类中心编码值确定为最终的C个聚类中心。
进一步的,所述数据预处理模块具体包括:
数据清洗单元,用于查找每条原始日负荷曲线的负荷中缺失和异常数据,所述异常数据包括骤降、暴增或为负值的数据,若原始日负荷曲线的负荷异常数据达到采集量的10%,则将所述原始日负荷曲线剔除,获得第一备用负荷数据。
数据插值单元,用于采用重心拉格朗日插值法对第一备用负荷数据中缺失和异常数据进行补充和修正,获得第二备用负荷数据。
数据归一化单元,用于采用线性函数归一化方法对第二备用负荷数据进行归一化处理,获得负荷数据集。
进一步的,所述遗传退火模块具体包括:
遗传操作单元,用于对种群中个体进行选择、交叉和变异遗传操作生成新个体。
适应度筛选单元,用于计算新个体适应度值,若新个体的适应度值大于或等于种群中个体的适应度值,则以新个体的聚类中心编码值更新种群中个体的聚类中心编码值,若新个体的适应度值小于种群中个体的适应度值,则按照预设概率以新个体的聚类中心编码值更新种群中个体的聚类中心编码值,所述预设概率为:
式中,fi'为新个体的适应度值,fi为种群中个体的适应度值,T为当前退火温度。
循环判定模块,用于判断循环次数是否大于设定的最大循环次数。
退火单元,用于根据降温公式更新当前退火温度,所述降温公式为:
Ti+1=p×Ti;
式中,Ti+1为更新后的当前退火温度温度值,Ti为当前退火温度温度值,p为冷却系数。
本申请提供一种基于融合进化算法的日负荷曲线聚类方法及***,所述一种基于融合进化算法的日负荷曲线***用于执行一种基于融合进化算法的日负荷曲线聚类方法的步骤,获取多个用户的原始日负荷曲线负荷,对所述原始日负荷曲线负荷进行预处理,获得负荷数据集,初始化模拟退火算法的当前退火温度和退火终止温度,初始化遗传算法个体,并随机生成S个个体形成初始化种群,所述个体由聚类中心编码构成;根据模糊C均值算法更新每个个体的聚类中心编码,获得数据对象相对于聚类中心的隶属度矩阵,选定适应度函数,计算个体适应度值;循环重复对种群中个体的遗传操作和个体的聚类中心编码更新操作,直至更新后的当前退火温度小于退火终止温度;选取种群中适应度值最大的个体作为最优个体,所述最优个体的聚类中心编码值确定为最终的C个聚类中心。
本申请实施例提供的融合进化算法的日负荷曲线聚类方法,通过模糊模糊C均值算法、遗传算法以及模拟退火算法结合更新聚类中心,有效避免了陷入局部最优,提高了日负荷曲线聚类方法的准确性。
以上结合具体实施方式和范例性实例对本申请进行了详细说明,不过这些说明并不能理解为对本申请的限制。本领域技术人员理解,在不偏离本申请精神和范围的情况下,可以对本申请技术方案及其实施方式进行多种等价替换、修饰或改进,这些均落入本申请的范围内。本申请的保护范围以所附权利要求为准。
Claims (10)
1.一种基于融合进化算法的日负荷曲线聚类方法,其特征在于,包括:
步骤1:获取多个用户的原始日负荷曲线负荷数据,对负荷数据进行预处理,获得负荷数据集,所述负荷数据集由多个数据对象组成,一个数据对象代表一条原始日负荷曲线的负荷;
步骤2:初始化模拟退火算法的当前退火温度和退火终止温度,基于负荷数据集预分类的类簇数目C,初始化遗传算法个体,随机生成S个个体形成初始化种群,所述个体由C个聚类中心编码构成;
步骤3:根据模糊C均值算法更新每个个体的聚类中心编码,获得数据对象相对于聚类中心的隶属度矩阵,选定适应度函数,计算个体适应度值;
步骤4:根据遗传算法对种群中个体进行遗传操作,根据当前退火温度和个体适应度值更新种群中个体的聚类中心编码,再对当前退火温度执行降温操作,获得更新后的当前退火温度;
步骤5:重复步骤4直至更新后的当前退火温度小于退火终止温度;
步骤6:选取种群中适应度值最大的个体作为最优个体,所述最优个体的聚类中心编码值确定为最终的C个聚类中心。
2.根据权利要求1所述的一种基于融合进化算法的日负荷曲线聚类方法,其特征在于,所述获取多个用户的原始日负荷曲线负荷,对原始日负荷曲线负荷进行预处理,获得负荷数据集的步骤,具体为:
查找每条原始日负荷曲线的负荷数据中缺失和异常数据,所述异常数据包括骤降、暴增或为负值的数据,若原始日负荷曲线的负荷异常数据达到采集量的10%,则将所述原始日负荷曲线剔除,获得第一备用负荷数据;
对第一备用负荷数据中缺失和异常数据进行补充和修正,获得第二备用负荷数据;
采用线性函数归一化方法对第二备用负荷数据进行归一化处理,获得负荷数据集。
3.根据权利要求2所述的一种基于融合进化算法的日负荷曲线聚类方法,其特征在于,所述对第一备用负荷数据中缺失和异常数据进行补充和修正采用重心拉格朗日插值法,所述重心拉格朗日插值法根据重心权来定义拉格朗日插值基函数。
4.根据权利要求1所述的一种基于融合进化算法的日负荷曲线聚类方法,其特征在于,所述个体由C个聚类中心编码构成采用二进制编码。
5.根据权利要求1所述的一种基于融合进化算法的日负荷曲线聚类方法,其特征在于,所述根据模糊C均值算法更新每个个体的聚类中心编码,获得数据对象相对于聚类中心的隶属度矩阵采用的隶属度函数为:
式中,uik为第i个数据对象属于第k类的隶属度,c为聚类中心个数,dik为第i个数据对象到第k类的距离,r为模糊指数;
所述选定适应度函数,计算个体适应度值采用的适应度函数为:
fi=ranking(Jr);
式中,fi代表种群中的第i个个体的适应度值,ranking()为基于排序的分配函数,Jr为:
式中,U为隶属度矩阵,V为聚类中心矩阵,c为聚类中心个数,n-x为数据对象数量,uik为第i个数据对象属于第k类的隶属度,dik为第i个数据对象到第k类的距离,r为模糊指数。
6.根据权利要求1所述的一种基于融合进化算法的日负荷曲线聚类方法,其特征在于,所述根据遗传算法对种群中个体进行遗传操作,根据当前退火温度和个体适应度值更新种群中个体的聚类中心编码,再对当前退火温度执行降温操作,获得更新后的当前退火温度的步骤,具体为:
步骤601:对种群中个体进行选择、交叉和变异遗传操作生成新个体;
步骤602:计算新个体适应度值,若新个体的适应度值大于或等于种群中个体的适应度值,则以新个体的聚类中心编码值更新种群中个体的聚类中心编码值,若新个体的适应度值小于种群中个体的适应度值,则按照预设概率以新个体的聚类中心编码值更新种群中个体的聚类中心编码值,所述预设概率为:
式中,fi'为新个体的适应度值,fi为种群中个体的适应度值,T为当前退火温度;
步骤603:循环重复步骤601至步骤602直到循环次数大于设定的最大循环次数;
步骤604:根据降温公式更新当前退火温度,获得更新后的当前退火温度,所述降温公式为:
Ti+1=p×Ti;
式中,Ti+1为更新后的当前退火温度温度值,Ti为当前退火温度温度值,p为冷却系数。
7.根据权利要求6所述的一种基于融合进化算法的日负荷曲线聚类方法,其特征在于,所述对种群中个体进行选择、交叉和变异遗传操作的步骤中选择算子采用随机遍历抽样,交叉算子采用多点交叉算子,变异算子采用基本位变异算子。
8.一种基于融合进化算法的日负荷曲线聚类***,其特征在于,所述一种基于融合进化算法的日负荷曲线聚类***用于执行权利要求1-7任一项所述的一种基于融合进化算法的日负荷曲线聚类方法,包括:
数据获取模块,用于获取多个用户的原始日负荷曲线负荷;
数据预处理模块,用于对所述原始日负荷曲线负荷进行预处理,获得负荷数据集;
初始化模块,用于初始化模拟退火算法的当前退火温度和退火终止温度,以及用于初始化遗传算法个体,并随机生成S个个体形成初始化种群,所述个体由聚类中心编码构成;
模糊C均值模块,用于根据模糊C均值算法更新每个个体的聚类中心编码,获得数据对象相对于聚类中心的隶属度矩阵,选定适应度函数,计算个体适应度值;
遗传退火模块,用于对种群中个体进行遗传操作,并根据个体适应度值更新种群中个体的聚类中心编码,再对当前退火温度执行降温操作,获得更新后的当前退火温度,以及用于判断当前退火温度是否小于退火终止温度;
筛选模块,用于选取种群中适应度值最大的个体作为最优个体,所述最优个体的聚类中心编码值确定为最终的C个聚类中心。
9.根据权利要求8所述的一种基于融合进化算法的日负荷曲线聚类***,其特征在于,所述数据预处理模块具体包括:
数据清洗单元,用于查找每条原始日负荷曲线的负荷数据中缺失和异常数据,所述异常数据包括骤降、暴增或为负值的数据,若原始日负荷曲线的负荷异常数据达到采集量的10%,则将所述原始日负荷曲线剔除,获得第一备用负荷数据;
数据插值单元,用于采用重心拉格朗日插值法对第一备用负荷数据中缺失和异常数据进行补充和修正,获得第二备用负荷数据;
数据归一化单元,用于采用线性函数归一化方法对第二备用负荷数据进行归一化处理,获得负荷数据集。
10.根据权利要求8所述的一种基于融合进化算法的日负荷曲线聚类***,其特征在于,所述遗传退火模块具体包括:
遗传操作单元,用于对种群中个体进行选择、交叉和变异遗传操作生成新个体;
适应度筛选单元,用于计算新个体适应度值,若新个体的适应度值大于或等于种群中个体的适应度值,则以新个体的聚类中心编码值更新种群中个体的聚类中心编码值,若新个体的适应度值小于种群中个体的适应度值,则按照预设概率以新个体的聚类中心编码值更新种群中个体的聚类中心编码值,所述预设概率为:
式中,fi'为新个体的适应度值,fi为种群中个体的适应度值,T为当前退火温度;
循环判定模块,用于判断循环次数是否大于设定的最大循环次数;
退火单元,用于根据降温公式更新当前退火温度,所述降温公式为:
Ti+1=p×Ti;
式中,Ti+1为更新后的当前退火温度温度值,Ti为当前退火温度温度值,p为冷却系数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110613240.9A CN113344073A (zh) | 2021-06-02 | 2021-06-02 | 一种基于融合进化算法的日负荷曲线聚类方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110613240.9A CN113344073A (zh) | 2021-06-02 | 2021-06-02 | 一种基于融合进化算法的日负荷曲线聚类方法及*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113344073A true CN113344073A (zh) | 2021-09-03 |
Family
ID=77474612
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110613240.9A Pending CN113344073A (zh) | 2021-06-02 | 2021-06-02 | 一种基于融合进化算法的日负荷曲线聚类方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113344073A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114037006A (zh) * | 2021-11-01 | 2022-02-11 | 北方工业大学 | 电力***典型日负荷曲线生成方法 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003100557A2 (en) * | 2002-05-20 | 2003-12-04 | Rosetta Inpharmatics Llc | Computer systems and methods for subdividing a complex disease into component diseases |
EP1452993A1 (en) * | 2002-12-23 | 2004-09-01 | STMicroelectronics S.r.l. | Method of analysis of a table of data relating to expressions of genes and relative identification system of co-expressed and co-regulated groups of genes |
US7707148B1 (en) * | 2003-10-07 | 2010-04-27 | Natural Selection, Inc. | Method and device for clustering categorical data and identifying anomalies, outliers, and exemplars |
US20140147120A1 (en) * | 2012-11-25 | 2014-05-29 | Nec Laboratories America, Inc. | Grooming Multicast Traffic in Flexible Optical Wavelength Division Multiplexing WDM Networks |
CN104615869A (zh) * | 2015-01-22 | 2015-05-13 | 广西大学 | 一种基于相似度排挤的多种群模拟退火混合遗传算法 |
CN105488589A (zh) * | 2015-11-27 | 2016-04-13 | 江苏省电力公司电力科学研究院 | 一种基于遗传模拟退火算法的电网线损管理评价方法 |
CN106778826A (zh) * | 2016-11-25 | 2017-05-31 | 南昌航空大学 | 基于自适应元胞遗传与优选模糊c‑均值的混合聚类算法 |
US20170359754A1 (en) * | 2016-06-09 | 2017-12-14 | The Regents Of The University Of California | Learning-constrained optimal enhancement of cellular networks capacity |
CN109711460A (zh) * | 2018-12-25 | 2019-05-03 | 中科曙光国际信息产业有限公司 | 初始聚类中心的获取方法及装置 |
CN110188785A (zh) * | 2019-03-28 | 2019-08-30 | 山东浪潮云信息技术有限公司 | 一种基于遗传算法的数据聚类分析方法 |
CN111737924A (zh) * | 2020-08-17 | 2020-10-02 | 国网江西省电力有限公司电力科学研究院 | 一种基于多源数据选取典型负荷特性变电站的方法 |
-
2021
- 2021-06-02 CN CN202110613240.9A patent/CN113344073A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003100557A2 (en) * | 2002-05-20 | 2003-12-04 | Rosetta Inpharmatics Llc | Computer systems and methods for subdividing a complex disease into component diseases |
EP1452993A1 (en) * | 2002-12-23 | 2004-09-01 | STMicroelectronics S.r.l. | Method of analysis of a table of data relating to expressions of genes and relative identification system of co-expressed and co-regulated groups of genes |
US7707148B1 (en) * | 2003-10-07 | 2010-04-27 | Natural Selection, Inc. | Method and device for clustering categorical data and identifying anomalies, outliers, and exemplars |
US20140147120A1 (en) * | 2012-11-25 | 2014-05-29 | Nec Laboratories America, Inc. | Grooming Multicast Traffic in Flexible Optical Wavelength Division Multiplexing WDM Networks |
CN104615869A (zh) * | 2015-01-22 | 2015-05-13 | 广西大学 | 一种基于相似度排挤的多种群模拟退火混合遗传算法 |
CN105488589A (zh) * | 2015-11-27 | 2016-04-13 | 江苏省电力公司电力科学研究院 | 一种基于遗传模拟退火算法的电网线损管理评价方法 |
US20170359754A1 (en) * | 2016-06-09 | 2017-12-14 | The Regents Of The University Of California | Learning-constrained optimal enhancement of cellular networks capacity |
CN106778826A (zh) * | 2016-11-25 | 2017-05-31 | 南昌航空大学 | 基于自适应元胞遗传与优选模糊c‑均值的混合聚类算法 |
CN109711460A (zh) * | 2018-12-25 | 2019-05-03 | 中科曙光国际信息产业有限公司 | 初始聚类中心的获取方法及装置 |
CN110188785A (zh) * | 2019-03-28 | 2019-08-30 | 山东浪潮云信息技术有限公司 | 一种基于遗传算法的数据聚类分析方法 |
CN111737924A (zh) * | 2020-08-17 | 2020-10-02 | 国网江西省电力有限公司电力科学研究院 | 一种基于多源数据选取典型负荷特性变电站的方法 |
Non-Patent Citations (2)
Title |
---|
孙宏: ""基于数据流的模糊聚类算法分析与优化"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
殷旅江等: "基于混合遗传模拟退火的模糊C-均值聚类算法", 《湖北汽车工业学院学报》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114037006A (zh) * | 2021-11-01 | 2022-02-11 | 北方工业大学 | 电力***典型日负荷曲线生成方法 |
CN114037006B (zh) * | 2021-11-01 | 2024-03-15 | 北方工业大学 | 电力***典型日负荷曲线生成方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Adedeji et al. | Wind turbine power output very short-term forecast: A comparative study of data clustering techniques in a PSO-ANFIS model | |
CN111324642A (zh) | 一种面向电网大数据分析的模型算法选型与评价方法 | |
CN113378954B (zh) | 一种基于粒子群改进k均值算法的负荷曲线聚类方法及*** | |
CN106095639A (zh) | 一种集群亚健康预警方法及*** | |
CN111724278A (zh) | 一种面向电力多元负荷用户的精细分类方法及*** | |
KR102215690B1 (ko) | 시계열의 데이터를 모니터링 하는 방법 및 그 장치 | |
CN110245783B (zh) | 一种基于c-均值聚类模糊粗糙集的短期负荷预测方法 | |
CN114861788A (zh) | 一种基于dbscan聚类的负荷异常检测方法及*** | |
CN112734135A (zh) | 一种电力负荷预测方法、智能终端及计算机可读存储介质 | |
KR102628551B1 (ko) | 하이브리드 타입 단기 전력수요 예측 장치 및 방법 | |
CN113762591B (zh) | 一种基于gru和多核svm对抗学习的短期电量预测方法及*** | |
CN113344073A (zh) | 一种基于融合进化算法的日负荷曲线聚类方法及*** | |
CN114781520A (zh) | 基于改进lof模型的天然气行为异常检测方法及*** | |
CN114548575A (zh) | 基于迁移学习的自适应建筑日前负荷预测方法 | |
CN116365519B (zh) | 一种电力负荷预测方法、***、存储介质及设备 | |
CN117458544A (zh) | 一种基于多类型储能资源动态聚合的优化协同调控方法 | |
CN116628488A (zh) | 风电功率预测模型的训练方法、风电功率预测方法及设备 | |
CN115313522A (zh) | 一种考虑新能源出力预测偏差的备用容量配置方法及*** | |
CN115081551A (zh) | 基于K-Means聚类和优化RVM线损模型建立方法及*** | |
CN115186882A (zh) | 一种基于聚类的可控负荷空间密度预测方法 | |
KR20230066927A (ko) | 발전량 예측 방법 및 장치 | |
CN108205721A (zh) | 基于聚类的样条插值典型日负荷曲线选取装置 | |
CN111046321A (zh) | 光伏电站运维策略优化方法和装置 | |
CN112070200A (zh) | 一种谐波群优化方法及其应用 | |
CN116937552B (zh) | 基于区块链技术的智能电力交易方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210903 |