CN112560947A - 基于能源供需结构分析的聚类方法及装置 - Google Patents
基于能源供需结构分析的聚类方法及装置 Download PDFInfo
- Publication number
- CN112560947A CN112560947A CN202011476103.7A CN202011476103A CN112560947A CN 112560947 A CN112560947 A CN 112560947A CN 202011476103 A CN202011476103 A CN 202011476103A CN 112560947 A CN112560947 A CN 112560947A
- Authority
- CN
- China
- Prior art keywords
- clustering
- cluster
- supply
- target
- time period
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 91
- 238000004458 analytical method Methods 0.000 title claims abstract description 46
- 238000011156 evaluation Methods 0.000 claims abstract description 40
- 230000008569 process Effects 0.000 claims description 34
- 230000005611 electricity Effects 0.000 claims description 31
- 230000000694 effects Effects 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 11
- 238000003064 k means clustering Methods 0.000 claims description 5
- 230000007547 defect Effects 0.000 abstract description 8
- 238000010586 diagram Methods 0.000 description 13
- 238000003066 decision tree Methods 0.000 description 12
- 238000010248 power generation Methods 0.000 description 12
- 238000011160 research Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 3
- 238000005265 energy consumption Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000005622 photoelectricity Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012916 structural analysis Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Marketing (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Probability & Statistics with Applications (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明提供一种基于能源供需结构分析的聚类方法及装置,所述方法包括:基于待聚类的至少一个目标时间段的供用电数据,确定目标聚类簇的数量和每一簇的初始聚类中心;基于所述目标聚类簇的数量和每一簇的初始聚类中心,对所述至少一个目标时间段的供用电数据进行聚类;本发明提供通过在聚类前提前确定好准确的聚类簇的数量,并确定好聚类中心,避免了现有技术中供需关系评估方法在聚类时随机确定聚类簇的数量和聚类中心导致的聚类不准确的缺陷,提高了在分析电网供需关系进行聚类时的准确度。
Description
技术领域
本发明涉及电力技术领域,尤其涉及一种基于能源供需结构分析的聚类方法及装置质。
背景技术
国内现有关于供需关系研究方法较多,多从电网源、荷灵活性的角度研究面向新能源与随机负荷波动场景下的电网供需平衡关系分析方法与灵活性评估方法。
聚类分析是最常见的一种电网供需关系评估方法,其中kmeans应用最广泛,但其聚类效果受簇数和初始聚类中心的选取影响较大,二者的经验指定或根据传统的随机选取法、最大最小法将导致聚类结果存在较大误差。
发明内容
本发明提供一种基于能源供需结构分析的聚类方法及装置,用以解决现有技术中聚类误差较大的缺陷,实现对不同时间段电网供需关系的准确聚类。
第一方面,本发明提供一种基于能源供需结构分析的聚类方法,包括:
基于待聚类的至少一个目标时间段的供用电数据,确定目标聚类簇的数量和每一簇的初始聚类中心;
基于所述目标聚类簇的数量和每一簇的初始聚类中心,对所述至少一个目标时间段的供用电数据进行聚类。
根据本发明提供的基于能源供需结构分析的聚类方法,所述基于待聚类的至少一个目标时间段的供用电数据,确定目标聚类簇的数量和每一簇的初始聚类中心,包括:
对于每一个目标时间段的供用电数据,若所述目标时间段的供用电数据属于新的簇,则新增所述目标时间段的供用电数据所属的目标聚类簇,且所述目标聚类簇的数量加一;
将所述目标时间段的供用电数据作为新增的目标聚类簇的初始聚类中心。
根据本发明提供的基于能源供需结构分析的聚类方法,基于待聚类的至少一个目标时间段的供用电数据,确定目标聚类簇的数量和每一簇的初始聚类中心,还包括:
对于每一个目标时间段的供用电数据,若所述目标时间段的供用电数据属于已有的簇,则所述目标聚类簇的数量和每一簇的初始聚类中心不变。
根据本发明提供的基于能源供需结构分析的聚类方法,所述基于所述目标聚类簇的数量和每一簇的初始聚类中心,对所述至少一个时间段的供用电数据进行聚类,包括:
基于所述每一簇的初始聚类中心,对待聚类的目标时间段的供用电数据进行K-Meams聚类,获得K个簇;其中,K为所述目标聚类簇的数量。
根据本发明提供的基于能源供需结构分析的聚类方法,基于所述每一簇的初始聚类中心,对待聚类的目标时间段的供用电数据进行K-Meams聚类,获得K个簇,包括:
在每一次聚类过程中,基于上一次聚类过程中更新的每一簇的初始聚类中心,确定每一个目标时间段的供用电数据所属的簇;
更新所述每一簇的初始聚类中心;
确定所有聚类过程结束后,获得K个簇。
根据本发明提供的基于能源供需结构分析的聚类方法,所述方法还包括:
基于聚类效果评价算法,获得所述聚类的评价效果值。
根据本发明提供的基于能源供需结构分析的聚类方法,所述确定所有聚类过程结束,包括:
聚类次数达到预设次数;或
评价效果值达到预设值。
第二方面,本发明提供一种基于能源供需结构分析的聚类装置,包括:
确定模块,用于基于待聚类的至少一个目标时间段的供用电数据,确定目标聚类簇的数量和每一簇的初始聚类中心;
聚类模块,用于基于所述目标聚类簇的数量和每一簇的初始聚类中心,对所述至少一个目标时间段的供用电数据进行聚类。
第三方面,本发明提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所提供的基于能源供需结构分析的聚类方法的步骤。
第四方面,本发明提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所提供的基于能源供需结构分析的聚类方法的步骤
本发明提供的基于能源供需结构分析的聚类方法及装置,通过在聚类前提前确定好准确的聚类簇的数量,并确定好聚类中心,避免了现有技术中供需关系评估方法在聚类时随机确定聚类簇的数量和聚类中心导致的聚类不准确的缺陷,提高了在分析电网供需关系进行聚类时的准确度。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的基于能源供需结构分析的聚类方法的流程示意图;
图2是本发明提出的基于决策树层次指标的能源结构分析基本原理示意图;
图3是本发明提出的基于决策树层次指标的能源结构分析基本流程示意图;
图4是本发明提供的一组供用电数据中近三年发电量统计示意图;
图5是本发明提供的一组供用电数据中近三年用电量统计示意图;
图6是本发明提供的基于kmeans的供用电数据聚类示意图;
图7是本发明提供的供需关系评估结果示意图;
图8是本发明提供的基于能源供需结构分析的聚类装置的结构示意图;
图9是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
近年来,我国广泛开展、推进清洁能源替代传统化石能源进程,以水电、风电、光电为典型代表的清洁能源备受关注,尤其表现为风电、光电等新能源在电网中的渗透率逐年提高。特别地,对于我国以西北大型清洁能源基地为代表的清洁能源富集区域,能源结构侧表现为积极发展风、光新能源,大力开发水电,并以火电为备用,同时面临地区负荷与多类型电源的协调消纳与供需评估问题,因此,如何有效、准确评估清洁能源富集区域的电网供需关系是一个亟待解决的问题,其关键在于对发用大样本数据的分析、挖掘与透视。
一方面,针对需求侧(负荷侧)供需平衡关系,现有研究主要面向终端负荷的友好、优质、高效、清洁供应技术,通过削峰填谷、分时电价等手段或政策,同时挖掘灵活负荷的可调控特性,实现基于需求侧响应的电网供需平衡评估与优化。另一方面,针对供给侧(电源侧)供需平衡关系,现有研究主要面向间歇性、波动性特征显著的新能源并网的高效消纳技术与电网供需关系评估方法,同时关注高比例、大容量新能源并网场景下电网的安全可靠运行技术与调控策略。此外,还有研究关注考虑新能源与负荷特性的源、荷协调消纳与优化技术,但应用对象主要面向小容量、高分散的分布式电源并网后配电网灵活性评估与供需平衡分析。
总地来说,电网供需平衡关系评估主要基于发供用大样本数据,基于大数据分析技术,研究面向各层级电网、针对不同时间分辨率下电网灵活响应能力与供需关系评估方法。
现有关于电网供需平衡评估的研究在方法上比较完善,但在具体应用对象上还存在导向性不足的问题,对清洁能源富集区域、负荷密集区域、分布式电源分散而负荷水平适中的城乡配电区域等各类特征各异的电网未严格区分。
因此,本发明提出了一种聚类前提前确定好准确的聚类簇的数量,并确定好聚类中心的聚类方法,提高了在分析电网供需关系进行聚类时的准确度。
图1是本发明提供的基于能源供需结构分析的聚类方法的流程示意图,如图1所示,所述方法包括如下步骤:
步骤100,基于待聚类的至少一个目标时间段的供用电数据,确定目标聚类簇的数量和每一簇的初始聚类中心;
步骤110,基于所述目标聚类簇的数量和每一簇的初始聚类中心,对所述至少一个目标时间段的供用电数据进行聚类。
具体地,清洁能源富集区域供需平衡评估中可以着重对清洁能源、非清洁能源与全省用电量的供需关系加以分类分析,而传统以火电为主的社会用电量与地区发电量供需评估不再适用。
因此,本发明中的供用电数据可以为清洁能源、非清洁能源的供电量与全省用电量产生的数据,具体可以包括但不限于以下任意一项或其组合:
目标时间段的总用电量,目标时间段的第一产业用电量,目标时间段的第二产业用电量,目标时间段的第三产业用电量,目标时间段的生活用电量,目标时间段的总发电量,目标时间段的水力发电量,目标时间段的火力发电量,目标时间段的光能发电量,目标时间段的风力发电量,目标时间段的新能源发电量,目标时间段的新能源发电量,外送电量等。
以供用电数据包括清洁能源发(供)电量、非清洁能源发(供)电量、全省用电量(地区负荷)以及外送电量为例;在本发明中,可以首先对能源消费结构进行分类。
设P1为清洁能源发电量,P2为非清洁能源(火电)发电量,PD为地区负荷,PE为外送电量。按地区能源消费结构,其供需关系可分为3大类,共计7小类,如下表1地区能源结构分类表中(a)-(g)所示。
表1
具体可以分为以下a-g共计7类:
(1)供大于需
a.清洁能源供应全部负荷,剩余部分外送,无火电;
b.清洁能源供应全部负荷,剩余部分和火电外送;
c.清洁能源和火电共同供应地区负荷,剩余火电外送。
(2)供需平衡
d.清洁能源与负荷供需平衡,无火电;
e.火电与负荷供需平衡,无清洁能源;
f.清洁能源和火电共同供应地区负荷。
(3)供小于需
g.清洁能源和火电完全就地消纳,外部电网输入部分电能。
但事实上,并不是每一次进行聚类分析时的供用电数据都遍布这7类数据,可能只包括其中部分类别的数据,二而若在聚类时每次都强行将聚类的簇的数量定为7类,会导致聚类不准确,本来应该属于同一类的数据分在了多簇中,或者,由于簇的数量的不准确,也会导致聚类中心的偏移,进而导致聚类的不准确,进而影响分析结果。因此,为了更准确地进行聚类分析,本发明可以首先确定当前待聚类的供用电数据具体包括哪些类别的数据,并确定属于该类别的初始聚类中心,使得聚类更为准确。
可以理解的是,本发明中,对发供电数据进行聚类,可以以一个月的数据为最小单位,对N个月的发供电数据进行聚类。
还可以以预设时间段的数据为最小单位,进行聚类,本实施例对此不做限制。
本发明提供的聚类方法,通过在聚类前提前确定好准确的聚类簇的数量,并确定好聚类中心,避免了现有技术中供需关系评估方法在聚类时随机确定聚类簇的数量和聚类中心导致的聚类不准确的缺陷,提高了在分析电网供需关系进行聚类时的准确度。
可选地,在一个实施例中,所述基于待聚类的至少一个目标时间段的供用电数据,确定目标聚类簇的数量和每一簇的初始聚类中心,包括:
对于每一个目标时间段的供用电数据,若所述目标时间段的供用电数据属于新的簇,则新增所述目标时间段的供用电数据所属的目标聚类簇,且所述目标聚类簇的数量加一;
将所述目标时间段的供用电数据作为新增的目标聚类簇的初始聚类中心。
具体地,在确定目标聚类簇的数量和每一簇的初始聚类中心时,可以对于每一个目标时间段的供用电数据依次进行判断,是否属于当前所有待聚类数据中还未出现的类别,若是,则可以新增该目标时间段的供用电数据所属的目标聚类簇,且目标聚类簇的数量加一;
比如对于一个目标时间段的供用电数据A,在此之前已经确定当前这一批数据属于a,b,c这三个类别,即k=3,当确定供用电数据A属于类别d时,可以在此次聚类中新增类别d,且聚类的簇的数量增加1,即k的值增加1,变为4。
具体地,本发明提出一种基于“决策树”层次指标聚类算法的清洁能源富集区域供需平衡评估方法。
以kmeans聚类为例进行详细介绍,但本发明适用于所有类似的聚类方法,并不局限于kmeans聚类,此次举例也不作为对发明的限制。kmeans算法的聚类效果受聚类簇数k及初始聚类中心的影响较大,因此本发明可以基于“决策树-kmeans”的层次指标聚类算法,通过建立系列层次指标,基于决策树确定kmeans聚类的簇数k和k个初始聚类中心以保证kmeans良好的聚类效果。
图2是本发明提出的基于决策树层次指标的能源结构分析基本原理示意图;图3是本发明提出的基于决策树层次指标的能源结构分析基本流程示意图,如图2和3所示,例如,对于一个目标时间段的供用电数据B,当确定B中的PE=0,且P1=PD,P2=0,即可以确定供用电数据B属于类别d,且此前没有出现类别d,此时新增聚类类别d,k=1,且将供用电数据B作为类别d的初始聚类中心;进一步地,对于一个目标时间段的供用电数据C,当确定C中的PE=0,且P2=PD,P1=0,即可以确定供用电数据C属于类别e,且此前没有出现类别e,此时新增聚类类别e,k=2,且将供用电数据C作为类别e的初始聚类中心;进一步地,对于一个目标时间段的供用电数据D,当确定D中的PE<0,即可以确定供用电数据D属于类别g,且此前没有出现类别g,此时新增聚类类别g,k=3,且将供用电数据D作为类别g的初始聚类中心;依次类推,直至遍历完所有待聚类的供用电数据后最后确定k值。
可以理解的是,本实施例中,在判断某一供用电数据F时第一次出现某一类别后,则可以暂时确定该类别的初始聚类中心为供用电数据F,即使后续再出现该类别,该类别的初始聚类中心在正式聚类前可以保持不变。
可以理解的是,本发明在正式聚类之前,可以判断每一供用电数据的类别,但此次类别的判断结果不会带入至后续聚类中,即不会影响后续聚类结果,即此次判断仅用于确定这一批待聚类数据到底包括多少个类别的数据,并初步确定出一个属于对应类别的初始聚类中心,用于更好地聚类。
因此,本发明首先建立适用于清洁能源富集区域能源结构评估的系列层次分类指标,用于评估清洁能源区域能源结构。进而,提出一种基于“决策树”层次指标聚类算法的适用于清洁能源富集区域的供需平衡透视方法,通过基于决策树的发供大数据预分析,确定聚类的簇数和初始聚类中心集,从而有效提升聚类在分析地区供需关系时的准确度。
可选地,在一个实施例中,基于待聚类的至少一个目标时间段的供用电数据,确定目标聚类簇的数量和每一簇的初始聚类中心,还包括:
对于每一个目标时间段的供用电数据,若所述目标时间段的供用电数据属于已有的簇,则所述目标聚类簇的数量和每一簇的初始聚类中心不变。
具体地,在确定目标聚类簇的数量和每一簇的初始聚类中心时,可以对于每一个目标时间段的供用电数据依次进行判断,是否属于当前所有待聚类数据中还未出现的类别,若不是,则可以直接进行下一供用电数据的判断,目标聚类簇的数量和每一簇的初始聚类中心不变;
例如,对于一个目标时间段的供用电数据M,当确定M中的PE=0,且P1=PD,P2=0,即可以确定供用电数据B属于类别d,且此前没有出现类别d,此时新增聚类类别d,k=1,且将供用电数据B作为类别d的初始聚类中心,在此基础上,对于一个目标时间段的供用电数据N,当确定N中的PE=0,且P1=PD,P2=0,即可以确定供用电数据N属于类别d,此时已存在类别d,则针对目标时间段的供用电数据N的判断结束,直接进入下一供用电数据O的判断过程。
可选地,在一个实施例中,所述基于所述目标聚类簇的数量和每一簇的初始聚类中心,对所述至少一个时间段的供用电数据进行聚类,包括:
基于所述每一簇的初始聚类中心,对待聚类的目标时间段的供用电数据进行K-Meams聚类,获得K个簇;其中,K为所述目标聚类簇的数量。
具体地,在确定目标聚类簇的数量和每一簇的初始聚类中心后,则可以以目标聚类簇的数量为K,基于K和每一簇的初始聚类中心,对所有待聚类的供用电数据进行K-Meams聚类。
可以理解的是,本发明中除了K值的选取以及初始聚类中心是提前确定好的,而不是随机确定的以外,本发明中的K-Meams聚类的其他步骤可以均与常规K-Meams聚类步骤相同。
本发明聚焦清洁能源富集区域的基于多类型电源的能源结构,建立了适用于清洁能源富集区域能源结构评估的系列层次分类指标,提出了一种基于“决策树-kmeans”层次指标聚类算法的清洁能源富集区域供需平衡评估方法,基于决策树解决了常规kmeans聚类因簇数和初始聚类中心选取不当而造成的聚类效果不佳等问题,本发明所述方法适用于清洁能源富集区域电网的供需关系评估。
可选地,在一个实施例中,基于所述每一簇的初始聚类中心,对待聚类的目标时间段的供用电数据进行K-Meams聚类,获得K个簇,包括:
在每一次聚类过程中,基于上一次聚类过程中更新的每一簇的初始聚类中心,确定每一个目标时间段的供用电数据所属的簇;
更新所述每一簇的初始聚类中心;
确定所有聚类过程结束后,获得K个簇。
具体地,对于本发明的kmeans聚类算法,可以假设每一簇的初始聚类中心所组成的集合为Y=[Y1,Y2,…,Yk]T,由基于决策树的层次分类指标确定。对于发供大数据X=[X1,X2,…,Xn]T,其聚类分析步骤如下:
1)分别计算发供数据X的m个子行向量到k个聚类中心的距离。本发明采用欧式距离:
式中,Sk(i)为m维发供数据Xi到第k个聚类中心的欧式距离。
2)根据Xi到各个聚类中心的距离集合S=[S1,S2,…,Sk],确定其中最小值对应Xi所属类别,进而获得一次迭代后属于类别k的发供数据集合Z=[Z1,Z2,…,Zh]T,Z∈X,h≤n。
3)重新确定k个新的聚类中心,采用类中各数据的均值,类别k的新聚类中心Yk′:
具体地,在每一次聚类过程中,可以通过上述式子(1)确定每一个目标时间段的供用电数据到上一次聚类过程中更新的每一簇的初始聚类中心的距离,进而选取距离最小的聚类中心所在的簇为所属的簇,进而确定每一个目标时间段的供用电数据所属的簇;随后则可以确定每一簇中包括的所有供用电数据,并基于每一簇中包括的所有供用电数据通过上述式子(2)更新所述每一簇的初始聚类中心,用于下一次聚类过程;直至所有聚类过程结束后,获得K个聚类完成的簇。
具体地,在第一次聚类过程中,可以基于聚类之前确定的每一簇的初始聚类中心,确定每一个目标时间段的供用电数据所属的簇。
可选地,在一个实施例中,所述方法还包括:
基于聚类效果评价算法,获得所述聚类的评价效果值。
具体地,为了判断聚类效果,可以基于聚类效果评价算法,获得所述聚类的评价效果值。
具体地,Kmeans聚类的评价效果值如下述式子所示。具体可以建立指标I1和I2评价聚类效果:
δ′=δX-δk;
式中,δX表示发供大数据X的均方差和,μ表示X各列的均值。δk表示类别k的簇内均方差和,越小越好。δ′表示类别间距离平方和,越大越好。对应地,I1和I2越大越好。
可选地,在一个实施例中,所述确定所有聚类过程结束,包括:
聚类次数达到预设次数;或
评价效果值达到预设值。
具体地,在确定所有聚类过程结束时,可以基于预设迭代次数(即聚类次数)进行判断,还可以基于评价效果值进行判断。
具体地,可以在聚类次数达到预设次数时,确定所有聚类过程结束;
具体地,可以在评价效果值达到预设值时,确定所有聚类过程结束。
本发明提供的聚类方法,通过在聚类前提前确定好准确的聚类簇的数量,并确定好聚类中心,避免了现有技术中供需关系评估方法在聚类时随机确定聚类簇的数量和聚类中心导致的聚类不准确的缺陷,提高了在分析电网供需关系进行聚类时的准确度。
以针对一组电网供用电数据开展供需平衡关系研究为例,图4是本发明提供的一组供用电数据中近三年发电量统计示意图;图5是本发明提供的一组供用电数据中近三年用电量统计示意图;分别如图4和5所示,其中,第一产业用电量较小,图中未画出。
首先,可以基于决策树对该组电网供用电数据进行分类分析,确定该组电网供用电数据可分为四类:1)供大于需中的b,初始聚类中心为2018年7月供用电数据;2)供大于需中的c,初始聚类中心为2018年5月供用电数据;3)供需平衡中的f,初始聚类中心为2018年3月供用电数据;4)供小于需的g,初始聚类中心为2018年1-2月供用电数据。因此,可得出kmeans聚类的簇数k=4,依据选取的4个初始聚类中心,设置迭代次数10次,图6是本发明提供的基于kmeans的供用电数据聚类示意图,如图6所示,具体聚类结果如下表2所示。
表2
如表2所示,该组电网供用电数据聚类结果符合基于决策树的分类结果,可分为四类典型供需结构:1)类别1对应b:供大于需,全省清洁能源供应全部负荷,剩余部分和火电外送;2)类别2对应f:供需接***衡,清洁能源和火电共同供应全省负荷;3)类别3对应c:供大于需,火电供应少量负荷并外送;4)类别4对应g:供小于需,且火电占比较大。
还可以对各类别的聚类效果做具体分析,验证本发明基于“决策树-kmeans”层次聚类算法的优点,对比kmeans不同k取值下的聚类评价指标,如下表3所示。
表3
k=2 | k=3 | k=4 | k=5 | k=6 | |
I<sub>1</sub> | 0.718 | 0.901 | 0.938 | 0.95 | 0.959 |
I<sub>2</sub> | 66.27 | 113.14 | 121.13 | 108.13 | 102.53 |
由表3可知,基于本发明“决策树-kmeans”层次指标聚类算法对该省级电网供需关系的评估效果更好,而常规kmeans则可能由于簇数和初始聚类中心选取不当导致聚类效果不佳。
本发明提供的聚类方法,通过在聚类前提前确定好准确的聚类簇的数量,并确定好聚类中心,避免了现有技术中供需关系评估方法在聚类时随机确定聚类簇的数量和聚类中心导致的聚类不准确的缺陷,提高了在分析电网供需关系进行聚类时的准确度。
图7是本发明提供的供需关系评估结果示意图,如图7所示,还可以针对该组电网供用电数据给出其供需关系评估结果,其中,时间分辨率为月。
本发明提供的聚类装置,通过在聚类前提前确定好准确的聚类簇的数量,并确定好聚类中心,避免了现有技术中供需关系评估方法在聚类时随机确定聚类簇的数量和聚类中心导致的聚类不准确的缺陷,提高了在分析电网供需关系进行聚类时的准确度。
下面对本发明提供的基于能源供需结构分析的聚类装置进行描述,下文描述的基于能源供需结构分析的聚类装置与上文描述的基于能源供需结构分析的聚类方法可相互对应参照。
图8是本发明提供的基于能源供需结构分析的聚类装置的结构示意图,如图8所示,所述装置包括:确定模块810和聚类模块820;其中:
确定模块810用于基于待聚类的至少一个目标时间段的供用电数据,确定目标聚类簇的数量和每一簇的初始聚类中心;
聚类模块820用于基于所述目标聚类簇的数量和每一簇的初始聚类中心,对所述至少一个目标时间段的供用电数据进行聚类。
具体地,聚类装置通过确定模块810基于待聚类的至少一个目标时间段的供用电数据,确定目标聚类簇的数量和每一簇的初始聚类中心后,可以通过聚类模块820基于所述目标聚类簇的数量和每一簇的初始聚类中心,对所述至少一个目标时间段的供用电数据进行聚类。
本发明提供的聚类装置,通过在聚类前提前确定好准确的聚类簇的数量,并确定好聚类中心,避免了现有技术中供需关系评估方法在聚类时随机确定聚类簇的数量和聚类中心导致的聚类不准确的缺陷,提高了在分析电网供需关系进行聚类时的准确度。
图9是本发明提供的电子设备的结构示意图,如图9所示,该电子设备可以包括:处理器(processor)910、通信接口(Communications Interface)920、存储器(memory)930和通信总线940,其中,处理器910,通信接口920,存储器930通过通信总线940完成相互间的通信。处理器910可以调用存储器930中的逻辑指令,以执行基于能源供需结构分析的聚类方法,该方法包括:基于待聚类的至少一个目标时间段的供用电数据,确定目标聚类簇的数量和每一簇的初始聚类中心;
基于所述目标聚类簇的数量和每一簇的初始聚类中心,对所述至少一个目标时间段的供用电数据进行聚类。
此外,上述的存储器930中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的基于能源供需结构分析的聚类方法,该方法包括:基于待聚类的至少一个目标时间段的供用电数据,确定目标聚类簇的数量和每一簇的初始聚类中心;
基于所述目标聚类簇的数量和每一簇的初始聚类中心,对所述至少一个目标时间段的供用电数据进行聚类。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的基于能源供需结构分析的聚类方法,该方法包括:基于待聚类的至少一个目标时间段的供用电数据,确定目标聚类簇的数量和每一簇的初始聚类中心;
基于所述目标聚类簇的数量和每一簇的初始聚类中心,对所述至少一个目标时间段的供用电数据进行聚类。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种基于能源供需结构分析的聚类方法,其特征在于,包括:
基于待聚类的至少一个目标时间段的供用电数据,确定目标聚类簇的数量和每一簇的初始聚类中心;
基于所述目标聚类簇的数量和所述每一簇的初始聚类中心,对所述至少一个目标时间段的供用电数据进行聚类。
2.根据权利要求1所述的基于能源供需结构分析的聚类方法,其特征在于,所述基于待聚类的至少一个目标时间段的供用电数据,确定目标聚类簇的数量和每一簇的初始聚类中心,包括:
对于每一个目标时间段的供用电数据,若所述目标时间段的供用电数据属于新的簇,则新增所述目标时间段的供用电数据所属的目标聚类簇,且所述目标聚类簇的数量加一;
将所述目标时间段的供用电数据作为新增的目标聚类簇的初始聚类中心。
3.根据权利要求1所述的基于能源供需结构分析的聚类方法,其特征在于,基于待聚类的至少一个目标时间段的供用电数据,确定目标聚类簇的数量和每一簇的初始聚类中心,还包括:
对于每一个目标时间段的供用电数据,若所述目标时间段的供用电数据属于已有的簇,则所述目标聚类簇的数量和每一簇的初始聚类中心不变。
4.根据权利要求1所述的基于能源供需结构分析的聚类方法,其特征在于,所述基于所述目标聚类簇的数量和所述每一簇的初始聚类中心,对所述至少一个时间段的供用电数据进行聚类,包括:
基于所述每一簇的初始聚类中心,对待聚类的目标时间段的供用电数据进行K-Meams聚类,获得K个簇;其中,K为所述目标聚类簇的数量。
5.根据权利要求1所述的基于能源供需结构分析的聚类方法,其特征在于,基于所述每一簇的初始聚类中心,对待聚类的目标时间段的供用电数据进行K-Meams聚类,获得K个簇,包括:
在每一次聚类过程中,基于上一次聚类过程中更新的每一簇的初始聚类中心,确定每一个目标时间段的供用电数据所属的簇;
更新所述每一簇的初始聚类中心;
确定所有聚类过程结束后,获得K个簇。
6.根据权利要求5所述的基于能源供需结构分析的聚类方法,其特征在于,所述方法还包括:
基于聚类效果评价算法,获得所述聚类的评价效果值。
7.根据权利要求6所述的基于能源供需结构分析的聚类方法,其特征在于,所述确定所有聚类过程结束,包括:
聚类次数达到预设次数;或
评价效果值达到预设值。
8.一种基于能源供需结构分析的聚类装置,其特征在于,包括:
确定模块,用于基于待聚类的至少一个目标时间段的供用电数据,确定目标聚类簇的数量和每一簇的初始聚类中心;
聚类模块,用于基于所述目标聚类簇的数量和所述每一簇的初始聚类中心,对所述至少一个目标时间段的供用电数据进行聚类。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述的基于能源供需结构分析的聚类方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的基于能源供需结构分析的聚类方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011476103.7A CN112560947A (zh) | 2020-12-14 | 2020-12-14 | 基于能源供需结构分析的聚类方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011476103.7A CN112560947A (zh) | 2020-12-14 | 2020-12-14 | 基于能源供需结构分析的聚类方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112560947A true CN112560947A (zh) | 2021-03-26 |
Family
ID=75064771
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011476103.7A Pending CN112560947A (zh) | 2020-12-14 | 2020-12-14 | 基于能源供需结构分析的聚类方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112560947A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113947321A (zh) * | 2021-10-25 | 2022-01-18 | 国网天津市电力公司电力科学研究院 | 一种分布式信息能源网络拓扑结构构建方法和*** |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104090950A (zh) * | 2014-07-03 | 2014-10-08 | 浙江工商大学 | 融入簇存在强度的数据流聚类方法 |
CN105681298A (zh) * | 2016-01-13 | 2016-06-15 | 成都安信共创检测技术有限公司 | 公共信息平台中的数据安全异常监测方法及*** |
CN109685092A (zh) * | 2018-08-21 | 2019-04-26 | 中国平安人寿保险股份有限公司 | 基于大数据的聚类方法、设备、存储介质及装置 |
CN110555144A (zh) * | 2019-09-06 | 2019-12-10 | 北京奇艺世纪科技有限公司 | 一种流聚类的方法、装置、电子设备及介质 |
CN110570462A (zh) * | 2019-09-12 | 2019-12-13 | 中山大学 | 基于极化雷达遥感影像的洪水淹没范围自动提取方法 |
CN110826618A (zh) * | 2019-11-01 | 2020-02-21 | 南京信息工程大学 | 一种基于随机森林的个人信用风险评估方法 |
CN111860359A (zh) * | 2020-07-23 | 2020-10-30 | 江苏食品药品职业技术学院 | 一种基于改进随机森林算法的点云分类方法 |
CN111985577A (zh) * | 2020-09-02 | 2020-11-24 | 深圳壹账通智能科技有限公司 | 基于人工智能的客户价值标注方法、装置、设备及介质 |
-
2020
- 2020-12-14 CN CN202011476103.7A patent/CN112560947A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104090950A (zh) * | 2014-07-03 | 2014-10-08 | 浙江工商大学 | 融入簇存在强度的数据流聚类方法 |
CN105681298A (zh) * | 2016-01-13 | 2016-06-15 | 成都安信共创检测技术有限公司 | 公共信息平台中的数据安全异常监测方法及*** |
CN109685092A (zh) * | 2018-08-21 | 2019-04-26 | 中国平安人寿保险股份有限公司 | 基于大数据的聚类方法、设备、存储介质及装置 |
CN110555144A (zh) * | 2019-09-06 | 2019-12-10 | 北京奇艺世纪科技有限公司 | 一种流聚类的方法、装置、电子设备及介质 |
CN110570462A (zh) * | 2019-09-12 | 2019-12-13 | 中山大学 | 基于极化雷达遥感影像的洪水淹没范围自动提取方法 |
CN110826618A (zh) * | 2019-11-01 | 2020-02-21 | 南京信息工程大学 | 一种基于随机森林的个人信用风险评估方法 |
CN111860359A (zh) * | 2020-07-23 | 2020-10-30 | 江苏食品药品职业技术学院 | 一种基于改进随机森林算法的点云分类方法 |
CN111985577A (zh) * | 2020-09-02 | 2020-11-24 | 深圳壹账通智能科技有限公司 | 基于人工智能的客户价值标注方法、装置、设备及介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113947321A (zh) * | 2021-10-25 | 2022-01-18 | 国网天津市电力公司电力科学研究院 | 一种分布式信息能源网络拓扑结构构建方法和*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112186761A (zh) | 一种基于概率分布的风电功率场景生成方法及*** | |
CN112865089A (zh) | 一种改进的主动配电网大规模场景分析方法 | |
CN116821832A (zh) | 针对高压工商业用户用电负荷的异常数据辨识与修正方法 | |
CN115329899A (zh) | 一种聚类等效模型构建方法、***、设备和存储介质 | |
CN110909786A (zh) | 一种基于特性指标与决策树模型的新装用户负荷辨识方法 | |
CN113988558B (zh) | 基于盲区识别和电气坐标系扩展的电网动态安全评估方法 | |
CN112560947A (zh) | 基于能源供需结构分析的聚类方法及装置 | |
CN109840353B (zh) | 锂离子电池双因素不一致性预测方法及装置 | |
CN112564160B (zh) | 一种计及风电不确定性的储能***随机配置方法、终端及存储介质 | |
CN108694475B (zh) | 基于混合模型的短时间尺度光伏电池发电量预测方法 | |
CN110956304A (zh) | 一种基于ga-rbm的分布式光伏发电量短期预测方法 | |
Prahastono et al. | A review of electricity load profile classification methods | |
CN114358378A (zh) | 一种用于考虑需量管理的用户侧储能优化配置***及方法 | |
CN116826859A (zh) | 一种电源碳电协同规划方法、装置、设备及存储介质 | |
CN115545793A (zh) | 新型电力***电网基础模型构建方法、***、设备及介质 | |
CN116010831A (zh) | 一种基于潜在决策结果的组合聚类场景缩减方法及*** | |
CN113377683B (zh) | 软件测试用例的生成方法、***、设备、终端、介质及应用 | |
CN115759775A (zh) | 一种考虑公平性的ncfi碳排放责任分摊方法及装置 | |
CN114362239A (zh) | 一种综合考虑多因素的电网电源极限配置策略 | |
CN110298603B (zh) | 分布式光伏***容量估计方法 | |
CN112966982A (zh) | 台区线损异常的识别方法、***及电子设备 | |
CN115829144B (zh) | 电网业务优化模型的建立方法及电子设备 | |
CN117713176B (zh) | 源网荷储低碳运行方法、装置、电子设备及存储介质 | |
CN112332446B (zh) | 基于K-medoid聚类分析的分布式电源规划方法及装置 | |
Jiang et al. | Research on multi-type demand response user profile based on improved k-means clustering algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |