CN115146881B - 一种低压分布式光伏***不良数据检测方法和*** - Google Patents

一种低压分布式光伏***不良数据检测方法和*** Download PDF

Info

Publication number
CN115146881B
CN115146881B CN202211081062.0A CN202211081062A CN115146881B CN 115146881 B CN115146881 B CN 115146881B CN 202211081062 A CN202211081062 A CN 202211081062A CN 115146881 B CN115146881 B CN 115146881B
Authority
CN
China
Prior art keywords
data
cluster
clustering
meteorological
ave
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211081062.0A
Other languages
English (en)
Other versions
CN115146881A (zh
Inventor
陈钢
李波
武建平
邓瑞麒
郑广勇
晏梦璇
郭亮
柳军停
黄伟杰
陈锦洪
郑文杰
卢伟钿
易晋
黄定威
张锦添
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangmen Power Supply Bureau of Guangdong Power Grid Co Ltd
Original Assignee
Jiangmen Power Supply Bureau of Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangmen Power Supply Bureau of Guangdong Power Grid Co Ltd filed Critical Jiangmen Power Supply Bureau of Guangdong Power Grid Co Ltd
Priority to CN202211081062.0A priority Critical patent/CN115146881B/zh
Publication of CN115146881A publication Critical patent/CN115146881A/zh
Application granted granted Critical
Publication of CN115146881B publication Critical patent/CN115146881B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/004Generation forecast, e.g. methods or systems for forecasting future energy generation

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Power Engineering (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Photovoltaic Devices (AREA)

Abstract

本发明提供了一种基于二阶段模糊C算法的低压分布式光伏***不良数据检测方法和***,通过采集光伏出力数据对应的气象数据,构建气象数据向量集,并通过一阶段模糊C聚类分析,按照各时刻光伏出力的气象数据所属簇类,标记气象环境标签。在二阶段模糊C聚类过程中,将光伏出力数据与气象环境标签组合构建数据集合,依据偏离指标选择最佳聚类数,让二阶段聚类划分与一阶段的聚类划分尽可能贴合。根据最终光伏有功出力的划分簇类,依次剔除最***数据,并绘制平均距离指标DAVE的下降曲线,依据肘部法原则检测不良数据。本发明可以准确检测出传输到数据存储端的部分不良数据,降低其对光伏***的特性分析以及出力预测的影响。

Description

一种低压分布式光伏***不良数据检测方法和***
技术领域
本发明属于光伏出力预测技术领域,具体涉及一种基于二阶段模糊C算法的低压分布式光伏***不良数据检测方法和***。
背景技术
近年来随着国家政策的大力支持,光伏技术的日益成熟,光伏组件的安装成本也呈指数级下降。因此,在我国各个地区出现了集中式或分布式光伏***。然而,光伏电站的大规模建设也给此类可再生能源的准确监控带来技术难题。目前,用以监控光伏***数据的设备主要包括:SCADA***监控下光伏接入点可获取的有功功率以及无功功率;PMU***监控下光伏接入点可检测的高频相量数据。随着光伏容量的快速增加,各式数据采集设备也相应投入使用,导致***中的监控数据***式增长。由于数据采集装置的量测误差,以及数据传输过程中的通信故障,通常容易导致传输到数据存储端的数据存在部分不良数据。这些不良数据的存在对后续光伏***的特性分析以及出力预测都带来间接影响。
发明内容
有鉴于此,本发明提供一种基于二阶段模糊C算法的低压分布式光伏***不良数据检测方法和***,旨在准确检测传输到数据存储端的部分不良数据,降低其对光伏***的特性分析以及出力预测的影响。
为了解决上述技术问题,本发明提供以下技术方案:
第一方面,本发明提供了一种低压分布式光伏***不良数据检测方法,包括:
获取光伏阵列的历史出力数据以及对应的气象数据;
根据气象数据构建气象数据向量集Met 进行一阶段聚类分析,即采用模糊C聚类分析算法,将N条气象数据划分为c个不同的簇类,并确定最佳聚类数c*;
依据各个光伏阵列在各个出力时刻的气象数据所属簇类,增加光伏***的气象环境标签MetLabel;
根据光伏***的气象环境标签,继续采用模糊C聚类分析算法对数据集P=[PPV,MetLabel]数据做二阶段聚类分析,确定最佳聚类数k*,其中PPV为光伏有功出力;
分别计算按照最佳聚类数划分得到的k*个簇类中各条数据到聚类中心的距离dm
循环计算平均距离指标DAVE,并在每次计算后去掉各簇类中dm最大的一条数据,根据每次计算得到的平均距离指标结果生成平均距离指标DAVE曲线,依据肘部法原则确定不良数据。
进一步的,气象数据具体包括:气温Temp、光照强度Lux、空气湿度RH、云量TCC。
进一步的,一阶段聚类分析具体包括:
令初始聚类数c=2,采用模糊C聚类算法对气象数据向量集Met = [Temp, Lux,RH, TCC]做聚类分析;
根据XB聚类有效性指标确定最佳聚类数c*,构建气象环境指标1, 2,…, c*;
依据各个采样时刻光伏出力对应的气象数据所属簇类,对光伏处理数据标记气象环境标签MetLabel。
进一步的,二阶段聚类分析具体包括:
令初始聚类数k = 2,采用模糊C算法对N条数据集P = [PPV, MetLabel]做聚类分析,根据偏离指标最小选择最佳聚类数k*;
根据最佳聚类数结果,分别计算各个簇类的数据到聚类中心的距离dm
根据计算所得的各个簇类数据的距离值,计算平均距离指标DAVE
去掉各簇类中dm最大的一条数据,更新数据集并重新计算平均距离指标DAVE,按照每计算一次DAVE的同时去掉一条dm最大的数据的规则,生成平均距离指标DAVE曲线,依据肘部法原则筛除不良数据。
进一步的,依据肘部法原则确定不良数据具体为:
确定平均距离指标DAVE曲线中的拐点,将拐点对应的数据点记为不良数据点,做剔除处理。
第二方面,本发明提供了一种低压分布式光伏***不良数据检测***,包括:
数据获取单元,用于获取光伏阵列的历史出力数据以及对应的气象数据;
第一聚类分析单元,用于根据气象数据构建气象数据向量集Met 进行一阶段聚类分析,即采用模糊C聚类分析算法,将N条气象数据划分为c个不同的簇类,并确定最佳聚类数c*;还用于依据各个光伏阵列在各个出力时刻的气象数据所属簇类,增加光伏***的气象环境标签MetLabel;
第二聚类分析单元,用于根据光伏***的气象环境标签,继续采用模糊C聚类分析算法对数据集P=[PPV, MetLabel]数据做二阶段聚类分析,确定最佳聚类数k*,其中PPV为光伏有功出力;还用于分别计算按照最佳聚类数划分得到的k*个簇类中各条数据到聚类中心的距离dm;还用于循环计算平均距离指标DAVE,并在每次计算后去掉各簇类中dm最大的一条数据,根据每次计算得到的平均距离指标结果生成平均距离指标DAVE曲线,依据肘部法原则确定不良数据。
进一步的,气象数据具体包括:气温Temp、光照强度Lux、空气湿度RH、云量TCC。
进一步的,在第一聚类分析单元中,一阶段聚类分析具体包括:
令初始聚类数c=2,采用模糊C聚类算法对气象数据向量集Met = [Temp, Lux,RH, TCC]做聚类分析;
根据XB聚类有效性指标确定最佳聚类数c*,构建气象环境指标1, 2,…, c*;
依据各个采样时刻光伏出力对应的气象数据所属簇类,对光伏处理数据标记气象环境标签MetLabel。
进一步的,在第二聚类分析单元中,二阶段聚类分析具体包括:
令初始聚类数k = 2,采用模糊C算法对N条数据集P = [PPV, MetLabel]做聚类分析,根据偏离指标最小选择最佳聚类数k*;
根据最佳聚类数结果,分别计算各个簇类的数据到聚类中心的距离dm
根据计算所得的各个簇类数据的距离值,计算平均距离指标DAVE
去掉各簇类中dm最大的一条数据,更新数据集并重新计算平均距离指标DAVE,按照每计算一次DAVE的同时去掉一条dm最大的数据的规则,生成平均距离指标DAVE曲线,依据肘部法原则筛除不良数据。
进一步的,在第二聚类分析单元中,依据肘部法原则确定不良数据具体为:
确定平均距离指标DAVE曲线中的拐点,将拐点对应的数据点记为不良数据点,做剔除处理。
综上,本发明提供了一种基于二阶段模糊C算法的低压分布式光伏***不良数据检测方法和***,通过采集光伏出力数据对应的气象数据,构建气象数据向量集,并通过一阶段模糊C聚类分析,将气象环境的划分结果构建气象环境标签,按照各时刻光伏出力的气象数据所属簇类,标记气象环境标签。在二阶段模糊C聚类过程中,将光伏出力数据与气象环境标签组合构建数据集合,依据偏离指标选择最佳聚类数,让二阶段聚类划分与一阶段的聚类划分尽可能贴合。根据最终光伏有功出力的划分簇类,依次剔除最***数据,并绘制平均距离指标DAVE的下降曲线,依据肘部法原则检测不良数据。本发明可以准确检测出传输到数据存储端的部分不良数据,降低其对光伏***的特性分析以及出力预测的影响。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例提供的一种基于二阶段模糊C算法的低压分布式光伏***不良数据检测方法的流程图;
图2为本发明实施例提供的一种基于二阶段模糊C算法的低压分布式光伏***不良数据检测方法的流程框图。
具体实施方式
为使得本发明的目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
近年来随着国家政策的大力支持,光伏技术的日益成熟,光伏组件的安装成本也呈指数级下降。因此,在我国各个地区出现了集中式或分布式光伏***。然而,光伏电站的大规模建设也给此类可再生能源的准确监控带来技术难题。目前,用以监控光伏***数据的设备主要包括:SCADA***监控下光伏接入点可获取的有功功率以及无功功率;PMU***监控下光伏接入点可检测的高频相量数据。随着光伏容量的快速增加,各式数据采集设备也相应投入使用,导致***中的监控数据***式增长。由于数据采集装置的量测误差,以及数据传输过程中的通信故障,通常容易导致传输到数据存储端的数据存在部分不良数据。这些不良数据的存在对后续光伏***的特性分析以及出力预测都带来间接影响。
基于此,本发明提供一种基于二阶段模糊C算法的低压分布式光伏***不良数据检测方法和***。
以下对本发明的一种基于二阶段模糊C算法的低压分布式光伏***不良数据检测方法的实施例进行详细的介绍。
请参阅图1,本实施例提供了一种基于二阶段模糊C算法的低压分布式光伏***不良数据检测方法,包括:
S100:获取光伏阵列的历史出力数据以及对应的气象数据。
需要说明的是,光伏出力有功出力记为PPV,气象数据具体包括气温Temp、光照强度Lux、空气湿度RH、云量TCC。
S200:根据气象数据构建气象数据向量集Met 进行一阶段聚类分析,即采用模糊C聚类分析算法,将N条气象数据划分为c个不同的簇类,并确定最佳聚类数c*。
可以理解的是,每一个簇类物理意义即为光伏电站工作的一个气象环境。
S300:依据各个光伏阵列在各个出力时刻的气象数据所属簇类,增加光伏***的气象环境标签MetLabel。
需要说明的是,步骤S200-S300为一阶段聚类分析过程。具体的,本阶段的聚类分析过程如下:
令初始聚类数c = 2,采用模糊C算法对气象数据集Met = [Temp, Lux, RH, TCC]做聚类分析。修正聚类数c的值,并计算XB聚类有效性指标,循环采用模糊C算法划分得出c个簇类,直到XB指标达到谷值时,确定最佳聚类数c*个气象环境。其中,XB聚类有效性指标的计算方法表示如下:
Figure 443548DEST_PATH_IMAGE001
c表示聚类数,N表示所有待聚类数据样本数目,μij为样本xi隶属于i类隶属度值,vj是第j个簇类的聚类中心。XB聚类有效性指标越小,说明聚类结果中类内各点距离越小,类间各点之间距离越大,聚类划分越明显。
根据一阶段的气象数据集聚类结果,构建气象环境指标MetLabel=1, 2,…, c*。并按照各个采样时刻光伏出力PPV对应气象数据所属簇类,对光伏出力数据PPV标记气象环境指标MetLabel。气象环境标签MetLabel,可以有效依据气象环境数据,划分光伏阵列在各个时刻所属的工作气象环境。
S400:根据光伏***的气象环境标签,继续采用模糊C聚类分析算法对数据集P=[PPV, MetLabel]数据做二阶段聚类分析,确定最佳聚类数k*,其中PPV为光伏有功出力。
S500:分别计算按照最佳聚类数划分得到的k*个簇类中各条数据到聚类中心的距离dm
S600:循环计算平均距离指标DAVE,并在每次计算后去掉各簇类中dm最大的一条数据,根据每次计算得到的平均距离指标结果生成平均距离指标DAVE曲线,依据肘部法原则确定不良数据。
需要说明的是,步骤S400-S600为二阶段聚类分析过程。具体的,本阶段的聚类分析过程如下:
令初始聚类数k = 2,采用模糊C算法对N条由光伏出力和对应气象环境指标构建的数据集P = [PPV, MetLabel]做聚类分析。修正聚类数k的值,根据偏离指标(Dev)最小选择最佳聚类数k*。其中,偏离指标(Dev)计算方法如下:
Figure 772898DEST_PATH_IMAGE002
k表示聚类数,nj表示第j个簇类中的数据数目,
Figure 34115DEST_PATH_IMAGE003
表示第j个簇类所有数据的MetLabel构成数据集的众数。因此,偏离指标(Dev)主要用以衡量两阶段聚类划分的差异性。循环采用模糊C聚类算法划分得出k个簇类,直到Dev指标达到谷值时,取偏离指标(Dev)最小时的k值为最佳二阶段聚类数k*。
得出最佳二阶段聚类结果后,分别计算各个簇类的数据到聚类中心的距离dm。其中,dm计算方法如下ym,j表示第j个簇类的第m个样本,ej表示二阶段聚类中心:
Figure 702994DEST_PATH_IMAGE004
根据计算所得的各个簇类数据的距离值,计算平均距离指标DAVE如下:
Figure 758675DEST_PATH_IMAGE005
去掉各簇类中dm最大的一条数据,更新数据集并重新计算平均距离指标DAVE。以此方法,依次再次去掉各簇类剩余数据中dm最大的一个,并计算平均距离指标DAVE。观察平均距离指标DAVE曲线下降趋势,当DAVE曲线一直保持平稳下降,说明无不良数据;当DAVE曲线先急速下降,后转为平稳下降,依据肘部法原则,认为使得DAVE曲线急速下降的数据点为不良数据,做剔除处理。
另外,本实施例提供的不良数据检测方法的检测对象是低压分布式光伏阵列。
图2是根据上述步骤确定的不良数据检测方法的流程框图。
本实施例提供一种基于二阶段模糊C算法的低压分布式光伏***不良数据检测方法,通过采集光伏出力数据对应的气象数据,构建气象数据向量集,并通过一阶段模糊C聚类分析,将气象环境的划分结果构建气象环境标签,按照各时刻光伏出力的气象数据所属簇类,标记气象环境标签。在二阶段模糊C聚类过程中,将光伏出力数据与气象环境标签组合构建数据集合,依据偏离指标选择最佳聚类数,让二阶段聚类划分与一阶段的聚类划分尽可能贴合。根据最终光伏有功出力的划分簇类,依次剔除最***数据,并绘制平均距离指标DAVE的下降曲线,依据肘部法原则检测不良数据。本发明可以准确检测出传输到数据存储端的部分不良数据,降低其对光伏***的特性分析以及出力预测的影响。
以上是对本发明的一种基于二阶段模糊C算法的低压分布式光伏***不良数据检测方法的实施例进行的详细介绍,以下将对本发明的一种基于二阶段模糊C算法的低压分布式光伏***不良数据检测***的实施例进行详细的介绍。
本实施例提供一种基于二阶段模糊C算法的低压分布式光伏***不良数据检测***,包括:数据获取单元、第一聚类分析单元和第二聚类分析单元。
在本实施例中,数据获取单元用于获取光伏阵列的历史出力数据以及对应的气象数据。
需要说明的是,气象数据具体包括:气温Temp、光照强度Lux、空气湿度RH、云量TCC。
在本实施例中,第一聚类分析单元用于根据气象数据构建气象数据向量集Met 进行一阶段聚类分析,即采用模糊C聚类分析算法,将N条气象数据划分为c个不同的簇类,并确定最佳聚类数c*;还用于依据各个光伏阵列在各个出力时刻的气象数据所属簇类,增加光伏***的气象环境标签MetLabel。
在第一聚类分析单元中,一阶段聚类分析具体包括:
令初始聚类数c=2,采用模糊C聚类算法对气象数据向量集Met = [Temp, Lux,RH, TCC]做聚类分析;
根据XB聚类有效性指标确定最佳聚类数c*,构建气象环境指标1, 2,…, c*;
依据各个采样时刻光伏出力对应的气象数据所属簇类,对光伏处理数据标记气象环境标签MetLabel。
在本实施例中,第二聚类分析单元用于根据光伏***的气象环境标签,继续采用模糊C聚类分析算法对数据集P=[PPV, MetLabel]数据做二阶段聚类分析,确定最佳聚类数k*,其中PPV为光伏有功出力;还用于分别计算按照最佳聚类数划分得到的k*个簇类中各条数据到聚类中心的距离dm;还用于循环计算平均距离指标DAVE,并在每次计算后去掉各簇类中dm最大的一条数据,根据每次计算得到的平均距离指标结果生成平均距离指标DAVE曲线,依据肘部法原则确定不良数据。
在第二聚类分析单元中,二阶段聚类分析具体包括:
令初始聚类数k = 2,采用模糊C算法对N条数据集P = [PPV, MetLabel]做聚类分析,根据偏离指标最小选择最佳聚类数k*;
根据最佳聚类数结果,分别计算各个簇类的数据到聚类中心的距离dm
根据计算所得的各个簇类数据的距离值,计算平均距离指标DAVE
去掉各簇类中dm最大的一条数据,更新数据集并重新计算平均距离指标DAVE,按照每计算一次DAVE的同时去掉一条dm最大的数据的规则,生成平均距离指标DAVE曲线,依据肘部法原则筛除不良数据。
另外,依据肘部法原则确定不良数据具体为:
确定平均距离指标DAVE曲线中的拐点,将拐点对应的数据点记为不良数据点,做剔除处理。
需要说明的是,本实施例提供的不良数据检测***用于实现前述实施例提供的不良数据检测方法,各单元的具体设置均以完整实现该方法为准,在此不再赘述。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种低压分布式光伏***不良数据检测方法,其特征在于,包括:
获取光伏阵列的历史出力数据以及对应的气象数据;
根据所述气象数据构建气象数据向量集Met 进行一阶段聚类分析,即采用模糊C聚类分析算法,将N条气象数据划分为c个不同的簇类,并确定最佳聚类数c*;
依据各个光伏阵列在各个出力时刻的气象数据所属簇类,增加光伏***的气象环境标签MetLabel;
根据所述光伏***的气象环境标签,继续采用模糊C聚类分析算法对数据集P=[PPV,MetLabel]数据做二阶段聚类分析,确定最佳聚类数k*,其中PPV为光伏有功出力;
分别计算按照最佳聚类数划分得到的k*个簇类中各条数据到聚类中心的距离dm
循环计算平均距离指标DAVE,并在每次计算后去掉各簇类中dm最大的一条数据,根据每次计算得到的平均距离指标结果生成平均距离指标DAVE曲线,依据肘部法原则确定不良数据。
2.根据权利要求1所述的低压分布式光伏***不良数据检测方法,其特征在于,所述气象数据具体包括:气温Temp、光照强度Lux、空气湿度RH、云量TCC。
3.根据权利要求2所述的低压分布式光伏***不良数据检测方法,其特征在于,所述一阶段聚类分析具体包括:
令初始聚类数c=2,采用模糊C聚类算法对所述气象数据向量集Met = [Temp, Lux,RH, TCC]做聚类分析;
根据XB聚类有效性指标确定最佳聚类数c*,构建气象环境指标1, 2,…, c*;
依据各个采样时刻光伏出力对应的气象数据所属簇类,对光伏处理数据标记气象环境标签MetLabel。
4.根据权利要求1所述的低压分布式光伏***不良数据检测方法,其特征在于,所述二阶段聚类分析具体包括:
令初始聚类数k = 2,采用模糊C算法对N条数据集P = [PPV, MetLabel]做聚类分析,根据偏离指标最小选择最佳聚类数k*;
根据所述最佳聚类数结果,分别计算各个簇类的数据到聚类中心的距离dm
根据计算所得的各个簇类数据的距离值,计算平均距离指标DAVE
去掉各簇类中dm最大的一条数据,更新数据集并重新计算平均距离指标DAVE,按照每计算一次DAVE的同时去掉一条dm最大的数据的规则,生成平均距离指标DAVE曲线,依据肘部法原则筛除不良数据。
5.根据权利要求1或4所述的低压分布式光伏***不良数据检测方法,其特征在于,依据肘部法原则确定不良数据具体为:
确定所述平均距离指标DAVE曲线中的拐点,将所述拐点对应的数据点记为不良数据点,做剔除处理。
6.一种低压分布式光伏***不良数据检测***,其特征在于,包括:
数据获取单元,用于获取光伏阵列的历史出力数据以及对应的气象数据;
第一聚类分析单元,用于根据所述气象数据构建气象数据向量集Met 进行一阶段聚类分析,即采用模糊C聚类分析算法,将N条气象数据划分为c个不同的簇类,并确定最佳聚类数c*;还用于依据各个光伏阵列在各个出力时刻的气象数据所属簇类,增加光伏***的气象环境标签MetLabel;
第二聚类分析单元,用于根据所述光伏***的气象环境标签,继续采用模糊C聚类分析算法对数据集P=[PPV, MetLabel]数据做二阶段聚类分析,确定最佳聚类数k*,其中PPV为光伏有功出力;还用于分别计算按照最佳聚类数划分得到的k*个簇类中各条数据到聚类中心的距离dm;还用于循环计算平均距离指标DAVE,并在每次计算后去掉各簇类中dm最大的一条数据,根据每次计算得到的平均距离指标结果生成平均距离指标DAVE曲线,依据肘部法原则确定不良数据。
7.根据权利要求6所述的低压分布式光伏***不良数据检测***,其特征在于,所述气象数据具体包括:气温Temp、光照强度Lux、空气湿度RH、云量TCC。
8.根据权利要求7所述的低压分布式光伏***不良数据检测***,其特征在于,在所述第一聚类分析单元中,所述一阶段聚类分析具体包括:
令初始聚类数c=2,采用模糊C聚类算法对所述气象数据向量集Met = [Temp, Lux,RH, TCC]做聚类分析;
根据XB聚类有效性指标确定最佳聚类数c*,构建气象环境指标1, 2,…, c*;
依据各个采样时刻光伏出力对应的气象数据所属簇类,对光伏处理数据标记气象环境标签MetLabel。
9.根据权利要求6所述的低压分布式光伏***不良数据检测***,其特征在于,在所述第二聚类分析单元中,所述二阶段聚类分析具体包括:
令初始聚类数k = 2,采用模糊C算法对N条数据集P = [PPV, MetLabel]做聚类分析,根据偏离指标最小选择最佳聚类数k*;
根据所述最佳聚类数结果,分别计算各个簇类的数据到聚类中心的距离dm
根据计算所得的各个簇类数据的距离值,计算平均距离指标DAVE
去掉各簇类中dm最大的一条数据,更新数据集并重新计算平均距离指标DAVE,按照每计算一次DAVE的同时去掉一条dm最大的数据的规则,生成平均距离指标DAVE曲线,依据肘部法原则筛除不良数据。
10.根据权利要求6或9所述的低压分布式光伏***不良数据检测***,其特征在于,在所述第二聚类分析单元中,依据肘部法原则确定不良数据具体为:
确定所述平均距离指标DAVE曲线中的拐点,将所述拐点对应的数据点记为不良数据点,做剔除处理。
CN202211081062.0A 2022-09-05 2022-09-05 一种低压分布式光伏***不良数据检测方法和*** Active CN115146881B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211081062.0A CN115146881B (zh) 2022-09-05 2022-09-05 一种低压分布式光伏***不良数据检测方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211081062.0A CN115146881B (zh) 2022-09-05 2022-09-05 一种低压分布式光伏***不良数据检测方法和***

Publications (2)

Publication Number Publication Date
CN115146881A CN115146881A (zh) 2022-10-04
CN115146881B true CN115146881B (zh) 2023-01-13

Family

ID=83416577

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211081062.0A Active CN115146881B (zh) 2022-09-05 2022-09-05 一种低压分布式光伏***不良数据检测方法和***

Country Status (1)

Country Link
CN (1) CN115146881B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104123682A (zh) * 2014-07-28 2014-10-29 国家电网公司 一种基于气象影响因素的配网故障风险评估方法
CN106022528A (zh) * 2016-05-26 2016-10-12 上海电力学院 一种基于密度峰值层次聚类的光伏电站短期功率预测方法
CN108053149A (zh) * 2018-01-05 2018-05-18 东南大学 一种考虑气象因素的光伏电站并网风险评估方法
CN108846527A (zh) * 2018-08-27 2018-11-20 云南电网有限责任公司电力科学研究院 一种光伏发电功率预测方法
EP3640869A1 (en) * 2018-10-17 2020-04-22 Deutsches Zentrum für Luft- und Raumfahrt e.V. Method for predicting an energy demand, data processing system and renewable power plant with a storage

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015133635A1 (ja) * 2014-03-07 2015-09-11 株式会社日立製作所 データ分析システム及び方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104123682A (zh) * 2014-07-28 2014-10-29 国家电网公司 一种基于气象影响因素的配网故障风险评估方法
CN106022528A (zh) * 2016-05-26 2016-10-12 上海电力学院 一种基于密度峰值层次聚类的光伏电站短期功率预测方法
CN108053149A (zh) * 2018-01-05 2018-05-18 东南大学 一种考虑气象因素的光伏电站并网风险评估方法
CN108846527A (zh) * 2018-08-27 2018-11-20 云南电网有限责任公司电力科学研究院 一种光伏发电功率预测方法
EP3640869A1 (en) * 2018-10-17 2020-04-22 Deutsches Zentrum für Luft- und Raumfahrt e.V. Method for predicting an energy demand, data processing system and renewable power plant with a storage

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于电站群聚类和相似气象日的光伏电站不良数据修复;郭辉;《优秀硕士学位论文工程科技Ⅱ辑》;20190815;全文 *

Also Published As

Publication number Publication date
CN115146881A (zh) 2022-10-04

Similar Documents

Publication Publication Date Title
CN112699913B (zh) 一种台区户变关系异常诊断方法及装置
CN111488896B (zh) 一种基于多源数据挖掘的配电线路时变故障概率计算方法
CN110766200A (zh) 一种基于K-means均值聚类的风电机组发电功率预测方法
CN114006369B (zh) 区域风光场站功率联合预测方法、装置、电子设备和存储介质
US20150204922A1 (en) Method for Predicting Wind Power Density
CN111428942A (zh) 基于变网格技术提取微地形因子的线路覆冰厚度预测方法
CN113822418A (zh) 一种风电场功率预测方法、***、设备和存储介质
CN116227637A (zh) 一种面向有源配电网的精细化负荷预测方法和***
CN115796434A (zh) 一种用于配电网的管控方法、装置、电子设备及存储介质
CN110794485A (zh) 基于集成学习的强对流天气持续时间预报方法
Chen et al. Research on wind power prediction method based on convolutional neural network and genetic algorithm
CN114399081A (zh) 一种基于天气分类的光伏发电功率预测方法
CN113052386A (zh) 基于随机森林算法的分布式光伏日发电量预测方法和装置
CN116125204A (zh) 一种基于电网数字化的故障预测***
CN113866552B (zh) 一种基于机器学习的中压配网用户用电异常诊断方法
CN115146881B (zh) 一种低压分布式光伏***不良数据检测方法和***
CN114298132A (zh) 风电功率预测方法及装置、电子设备
CN105939014A (zh) 一种风电场站相关性指标获取方法
CN117200223A (zh) 日前电力负荷预测方法和装置
CN116628519B (zh) 一种生态脆弱区识别方法及***
CN116664098A (zh) 一种光伏电站的异常检测方法及***
Zhou et al. An explainable recurrent neural network for solar irradiance forecasting
CN115598459A (zh) 一种配电网10kV馈线故障停电预测方法
CN116359456B (zh) 一种基于厂站网一体化的水质动态监测预警方法及***
CN117540327B (zh) 一种企业环境自主管理数据采集处理***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant