CN111260503B - 一种基于聚类中心优化的风电机组功率曲线离群点检测方法 - Google Patents

一种基于聚类中心优化的风电机组功率曲线离群点检测方法 Download PDF

Info

Publication number
CN111260503B
CN111260503B CN202010029302.7A CN202010029302A CN111260503B CN 111260503 B CN111260503 B CN 111260503B CN 202010029302 A CN202010029302 A CN 202010029302A CN 111260503 B CN111260503 B CN 111260503B
Authority
CN
China
Prior art keywords
data
interval
fan
wind speed
outlier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010029302.7A
Other languages
English (en)
Other versions
CN111260503A (zh
Inventor
陈积明
柳泽波
杨秦敏
陈棋
孙勇
孙优贤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202010029302.7A priority Critical patent/CN111260503B/zh
Publication of CN111260503A publication Critical patent/CN111260503A/zh
Application granted granted Critical
Publication of CN111260503B publication Critical patent/CN111260503B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Water Supply & Treatment (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Computational Linguistics (AREA)
  • Wind Motors (AREA)

Abstract

本发明公开了一种基于聚类中心优化的风电机组功率曲线离群点检测方法。该方法基于风机数据采集与监控控制***(SCADA)获得风电机组的实时运行数据,利用聚类中心优化的密度峰值聚类进行风机功率的离群点检测。本发明检测方法能够根据风机功率曲线的空间分布特性进行准确地离群点检测,保证了SCADA获取的功率曲线尽可能地去除噪点数据,还原风机功率的真实数据分布情况,同时对数据格式等无特殊的要求,具有较快的检测速度和较强的可用性和实用性。

Description

一种基于聚类中心优化的风电机组功率曲线离群点检测方法
技术领域
本发明涉及风电机组异常检测领域,尤其涉及一种基于聚类中心优化的风电机组功率曲线离群点检测方法。
背景技术
随着社会发展,能源紧张的问题不断凸显,开发稳定可靠的新能源迫在眉睫。利用洁净的新能源是社会发展的趋势,如太阳能,潮汐能,生物能和风能等,这些都是取之不尽用之不竭的可再生能源,其中尤以风能最为成熟,经济可行性高,是目前来说相对比较理想的发展能源。在我国,近几十年来,风力发电逐渐得到大力发展,风力发电的电价正在逐步降低,进一步提高其可持续性。但随之而来的就是风电机组的老化问题,风机设备造价高昂,随着时间推移,设备逐步老化,也会带来一定的负面影响。现今风力发电机在使用的过程中,由于风速具有间歇性与高度不确定性的特点,对风力发电机本身的性能评估造成了较大的影响,而正确对风力发电机的性能与健康状况进行评估与诊断则是风力发电运维方面合理规划的重要之处。
在风电机组运行中,其在不同情况下发生的不同故障大多数会反映在风机的功率曲线当中,因此,准确获取并监控风机功率曲线对于研究风机性能及保障风机正常运行有重要意义。目前获取的风机监控数据及风机功率曲线大多数存在各种异常的情况,不能准确客观地反映真实的风机功率,因此如何将目前获取的包含各种异常数据点的风机功率数据转化为有效的、统一的、可靠的数据信息是目前获取真实准确地风机功率曲线的一个主要研究热点。目前来说,通过SCADA***获取的数据存在较大的数据噪点,即异常点和离群点,这些离群点的存在会导致后续对风机功率曲线的分析和研究产生偏差,从而影响分析结果的准确性,后续提高风机***效能产生负面影响。因此,目前获取准确的风机功率曲线需要对SCADA获取的数据进行离群点筛选和剔除,进而保证能提取到风电机组***有效且可靠的信息,以确定性能分析的准确性和可靠性。
发明内容
本发明目的在于对现有研究和技术存在的不足之处加以完善与规范化,提出一种基于聚类中心优化的聚类算法的风电机组功率曲线离群点检测方法,该方法对风电场风机功率曲线进行离群点检测筛选和剔除,可以提高获取功率曲线的准确性与可靠性,更具有实用价值;且有利于通过数据分析对潜在故障进行检测,方法应用的扩展性高。
本发明的目的通过以下的技术方案实现:一种基于聚类中心优化的风电机组功率曲线离群点检测方法,包括以下步骤:
1)选取待检测风机,获取其实时监控数据,形成数据集,获取的数据信息用于进行该风电机组的功率异常检测,该数据信息包括风速{vi}、有功功率{Pi}和桨距角{βi},将信息数据集记为其中i=1,2,3,…,N′;
2)对步骤1)获取的数据进行去重,剔除重复的数据点,并对数据点进行初步离群点筛除,得到集合{X′i},其中i=1,2,3,…,N,N≤N′;
3)对步骤2)去重及初步离群点筛除后的数据集进行标准化处理,形成预处理后的数据集,将该数据集记为{Xi},其中i=1,2,3,…,N;
4)对步骤3)获取的数据集{Xi}进行区间划分,将风机功率以一定的风速间隔进行划分,划分为M个区间,记第k个区间的数据个数为Nk、功率曲线数据集为其中k=1,2,3,…,M,i=1,2,3,…,Nk
5)对步骤4)获取的数据集按区间进行初步的离群点检测;首先确定各区间的聚类中心,对于各区间每一个点使用KNN算法计算各点领域内邻近点距离,以此计算各点的密度记为/>k=1,2,3,…,M,i=1,2,3,…,Nk
6)计算各区间所有数据点的平均密度大小将各区间内密度大于该区间内平均密度的数据点作为该区间待选的聚类中心,记为/>k=1,2,3,…,M,j=1,2,3,…,Rk,Rk为k区间待选聚类中心个数;
7)设置各区间的聚类数mk,对于各区间的待选聚类中心,先选择该区间的密度最大的待选聚类中心作为第一个聚类中心,并去除其周围最邻近的sk个数据点内所包含的待选聚类中心,同时从该区间数据集去除sk个邻近点,记为/>剩余待选聚类中心记为/>t为迭代次数;
8)令t=t+1,重复步骤7)直至选出的聚类中心数量达到mk个,或者为空集;
9)对于各个区间的数据集内的数据点计算其和该区间的所有聚类中心的欧式距离,并将各点分配给最近距离的聚类中心,形成该区间的聚类簇;
10)对于各个区间的数据集找出其数据点的密度小于该区间平均密度的子集,记为/>认为离群点均存在于该子集中;
11)计算步骤10)获得的子集内各个数据点到其分配到的聚类中心的欧式距离,并利用3-σ原则对该距离进行检测,检测出各个区间的离群点,得到整个数据集{Xi}的离群点集合,记为{Xi}outliers
作为更进一步描述,所述步骤2)中,利用基于时间序列的风机功率曲线离群点判据进行初步离群点筛除,包括两种情况:
情况1:根据风速{vi}、有功功率{Pi}以及桨距角{βi}定义基于时间序列的风机功率曲线离群点判据,如下表1所示:
表1风机功率曲线离群点基础判据
其中Prated为风机额定有功功率,vcut_in为风机切入风速,vrated为风机额定风速,vcut_off为风机切出风速,Pthres为有功功率阈值,βthres为桨距角阈值;
情况2:通过SCADA***获取风机状态{Condi},根据风速{vi}、有功功率{Pi}、桨距角{βi}以及风机状态{Condi}定义基于时间序列的风机功率曲线离群点判据,如下表2所示:
表2风机功率曲线离群点改进判据
其中Condnormal为风机正常运行状态,Condls为风机低风速正常运行状态,Condhs为风机高风速正常运行状态,Prated为风机额定有功功率,vcut_in为风机切入风速,Pthres为有功功率阈值,βthres为桨距角阈值。
作为更进一步描述,所述步骤3)中,数据集的标准化公式如下:
其中分别对应第i个标准化风速以及有功功率数据,/>分别为整个数据集内风速{vi}以及有功功率{Pi}的均值,σvP分别为整个数据集内风速{vi}以及有功功率{Pi}的标准差。
作为更进一步描述,所述步骤4)中,数据集{Xi}的区间划分方法如下:
a)确定数据集{Xi}中的风速{vi}中的最大值vm,并记其中vcut_off为风机切出风速;
b)确定划分区间数M,则第k个区间的功率曲线数据集{Xi}定义为:
其中为第k个区间的风速范围上界,同时为第k+1个区间的风速范围下界,其计算公式为:
此外,分别表示第1个区间的下界以及第M个区间的上界。
作为更进一步描述,所述步骤5)中,对于各区间每一个点使用KNN算法计算各点领域内邻近点距离,以此计算各点的密度记为具体为:
a)确定各个分区内的数据点集合;
b)确定KNN算法的超参数k值;
c)对于给定的数据点o,参数k,该数据点o的局部密度ρ计算如下:
其中numk为给定数据点o和其第k近邻的数据点ok的距离之内包含的数据点个数,dist(oi,oj)表示数据点oi和oj之间的欧式距离。
作为更进一步描述,所述步骤9)和步骤11)中,欧式距离的计算具体为:
a)设数据点为(v1,p1)和(v2,p2);
b)欧式距离
作为更进一步描述,所述步骤11)中,通过利用3-σ原则对该距离进行检测,检测出各个区间的离群点,得到整个数据集的离群点集合,记为/>具体为:
a)确定各区间内子集和其聚类中心的欧式距离,记为/>k表示分区,m表示子集/>的数据点;
b)计算各分区内距离集合的方差σk,计算方式如下:
其中n为子集数据点个数;
c)得到σk后,在每个区间内计算异常值,如果相对距离在以下区间内则认为是离群点:
d)以上可得到计算的离群点集合
与现有技术相比,本发明具有以下创新优势及显著效果:
1)针对风机功率曲线的离群点检测设计高稳定性、高准确性、高覆盖率和高检测速度的离群点识别检测方法,具有较强可解释性和实用性。
2)针对目前风机功率曲线由于离群点和异常值的存在导致获取的不准确性设计了解决方案,使用基于聚类中心改进的聚类方法来对风机功率曲线的离群点进行准确识别并进行剔除,使获取的风机功率曲线结果更贴近真实情况,有利于后续的数据分析获得更准确的结果。
附图说明
图1是本发明基于聚类中心优化的风电机组功率曲线离群点检测方法流程图;
图2是本发明应用于实施例的原始数据集风速-功率散点图;
图3是本发明步骤2处理后风机的离群点检测结果风速-功率散点图;
图4是本发明基于聚类中心优化的风电机组功率曲线离群点检测方法检测结果图。
具体实施方式
以下结合附图对本发明的具体实施方法与工作原理作如下详述:
实施例
本实施例对某风电场的某台风力发电机的SCADA***在2014年采集到的数据进行基于聚类中心优化的风电机组功率曲线离群点检测,其中风力发电机SCADA***的数据采样间隔为10min,数据信息为期1年,时间范围为2014.01.01 00:00:00至2014.12.31 23:50:00。数据集包括的具体变量以及相关数据信息如表3、表4所示:
表3某风电场某风机SCADA***数据集部分数据
数据序号 时间 风速 桨距角 有功功率
1 2014-01-01 00:00:00 2.53 88.96 0.06
2 2014-01-01 00:10:00 3 88.96 0.05
48489 2014-08-19 02:20:00 1.82 1.82 0.06
48490 2014-08-19 02:30:00 2.02 2.02 0.06
48491 2014-08-19 02:40:00 2.13 2.13 0.06
表4某风电场某风机SCADA***数据集变量信息
变量名称 变量含义 变量单位
时间戳 数据采集时间 年-月-日时:分:秒
风速v 当前风机机舱风速 m/s
桨距角 当前风机桨距角 deg
有功功率P 当前风机有功功率 kW
本实施例中默认风电机组功率曲线离群点检测的实施数据集即为上述某风机的1年运行数据,方法结果为基于流程判别出的该数据集对应的最终离群点集合方法实施步骤具体如下:
1)选取待检测风机,获取其实时监控数据,形成数据集,获取的数据信息用于进行该风电机组的功率异常检测,该数据信息包括风速{vi}、有功功率{Pi}和桨距角{βi},将信息数据集记为其中i=1,2,3,…,N′。根据表3与表4中列出的数据信息,其包括了本步骤中所需的必要信息,图2所示的结果为本步骤中的风机风速-功率曲线原始数据的散点图;
2)对步骤1)中的数据集进行去重,剔除重复的数据点,并对数据点进行初步离群点筛除,按照如下表5所示的离群点判断准则进行离群点判断:
表5风机功率曲线离群点判据
在本实施例中,Prated为1500kW,vcut_in为2m/s,vrated为14m/s,vcut_off为25m/s,Pthres为10kW,βthres为4°。图3所示的结果图展示了本步骤中离群点检测的结果图,包括正常点、离群点及其类别;
3)对步骤2)去重及初步离群点筛除后的数据集进行标准化处理,形成预处理后的数据集,将该数据集记为{Xi},其中i=1,2,3,…,N;
4)对步骤3)获取的数据集{Xi}进行区间划分,将风机功率以一定的风速间隔进行划分,划分为M个区间,记第k个区间的数据个数为Nk、功率曲线数据集为其中k=1,2,3,…,M,i=1,2,3,…,Nk;具体划分规则如下:
步骤1:首先确定数据集{Xi}中的风速{vi}中的最大值vm,记在本实施例中,vcut_off为25m/s,风速最大值vm为22.4528m/s,故vmax为23m/s;
步骤2:在本实施例中,确定划分区间数M为24,因此第k个区间与第k+1个区间相应风速范围界限的计算公式为:
此外,分别表示第1个区间的下界以及第24个区间的上界。特别地,划分区间的确定方式一般可以选为vmax+1或其整数倍。
5)对步骤4)获取的数据集按区间进行初步的离群点检测。首先确定各区间的聚类中心,对于各区间每一个点使用KNN算法计算各点领域内邻近点距离,以此计算各点的密度记为/>k=1,2,3,…,M,i=1,2,3,…,Nk。这里KNN算法的超参数k值设置为7;
6)计算各区间所有数据点的平局密度大小k=1,2,3,…,M,将各区间内密度大于该区间内平均密度的数据点作为该区间待选的聚类中心,记为/>k=1,2,3,…,M,j=1,2,3,…,Rk,Rk为k区间待选聚类中心个数;
7)设置各区间的聚类数mk=2,对于各区间的待选聚类中心,先选择该区间的密度最大的待选聚类中心作为第一个聚类中心,并去除其周围最邻近的sk=75个数据点内所包含的待选聚类中心,同时从该区间数据集去除sk个邻近点,记为/>剩余待选聚类中心记为/>t为迭代次数,初始值为1;
8)令t=t+1,重复步骤7)直至选出的聚类中心数量达到mk个,或者为空集;
9)对于各个区间的数据集内的数据点计算其和该区间的聚类中心的欧式距离,并将各点分配给最近距离的聚类中心,形成该区间的聚类簇;
10)对于各个区间的数据集找出其数据点的密度小于该区间平均密度的子集,记为/>认为离群点均存在于该子集中;
11)计算步骤10)获得的子集内各个数据点对其分配到的聚类中心的相对距离,并利用3-σ原则对该相对距离进行检测,检测出各个区间的离群点,得到整个数据集的离群点集合,记为/>图4为基于聚类中心优化的聚类算法的风电机组功率曲线离群点检测方法检测结果。
本发明基于聚类中心优化的聚类算法来进行风电机组的风机功率曲线的离群点检测,主要包括风机功率数据的清洗与预处理,风机功率数据离群点的初步识别检测,风机功率数据区间的划分,基于KNN并结合邻域内点相对距离的影响来优化局部密度计算,对聚类中心的确定进行优化提升数据点聚类的效果,基于3-σ原则对相对距离进行异常检测从而准确定位离群点。图1是本发明基于聚类中心优化的聚类算法的风电机组功率曲线离群点检测方法的流程图,整个实施例按照图示的处理流程来处理。图2-4为整个实施例实施过程中,实验过程的离群点分类处理图和最终检测结果的结果图。根据最终的结果显示,本发明基于聚类中心优化的聚类算法的风电机组功率曲线离群点检测方法能准确快速的识别风电机组的风机功率曲线的离群点,经过该方法处理后的风机功率曲线能更好更准确的反映整个风电机组的实际运行状态,得到的风机功率曲线具有真实性、可靠性和高准确性,对于后续利用该数据进行其他相关检测和数据分析提供了可靠的基础,对于数据分析的准确性的提高有重要作用。
以上所述仅是本发明的优选实施方式,虽然本发明已以较佳实施例披露如上,然而并非用以限定本发明。任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何的简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。

Claims (1)

1.一种基于聚类中心优化的风电机组功率曲线离群点检测方法,其特征在于,包括以下步骤:
1)选取待检测风机,获取其实时监控数据,形成数据集,获取的数据信息用于进行该风电机组的功率异常检测,该数据信息包括风速{vi}、有功功率{Pi}和桨距角{βi},将信息数据集记为其中i=1,2,3,…,N′;
2)对步骤1)获取的数据剔除重复的数据点,并对数据点进行初步离群点筛除,得到集合{X′i},其中i=1,2,3,…,N,N≤N′;利用基于时间序列的风机功率曲线离群点判据进行初步离群点筛除,包括两种情况:
情况1:根据风速{vi}、有功功率{Pi}以及桨距角{βi}定义基于时间序列的风机功率曲线离群点判据,如下表1所示:
表1风机功率曲线离群点基础判据
其中Prated为风机额定有功功率,vcut_in为风机切入风速,vrated为风机额定风速,vcut_off为风机切出风速,Pthres为有功功率阈值,βthres为桨距角阈值;
情况2:通过SCADA***获取风机状态{Condi},根据风速{vi}、有功功率{Pi}、桨距角{βi}以及风机状态{Condi}定义基于时间序列的风机功率曲线离群点判据,如下表2所示:
表2风机功率曲线离群点改进判据
其中Condnormal为风机正常运行状态,Condls为风机低风速正常运行状态,Condhs为风机高风速正常运行状态,Prated为风机额定有功功率,vcut_in为风机切入风速,Pthres为有功功率阈值,βthres为桨距角阈值;
3)对步骤2)去重及初步离群点筛除后的数据集进行标准化处理,形成预处理后的数据集{Xi},其中i=1,2,3,…,N;数据集的标准化公式如下:
其中分别对应第i个标准化风速以及有功功率数据,/>分别为整个数据集内风速{vi}以及有功功率{Pi}的均值,σv,σP分别为整个数据集内风速{vi}以及有功功率{Pi}的标准差;
4)对步骤3)获取的数据集{Xi}进行区间划分,将风机功率以一定的风速间隔进行划分,划分为M个区间,记第k个区间的数据个数为Nk、功率曲线数据集为其中k=1,2,3,…,M,i=1,2,3,…,Nk;所述步骤4)中,数据集{Xi}的区间划分方法如下:
a)确定数据集{Xi}中的风速{vi}中的最大值vm,并记其中vcut_off为风机切出风速;
b)确定划分区间数M,则第k个区间的功率曲线数据集{Xi}定义为:
其中为第k个区间的风速范围上界,同时为第k+1个区间的风速范围下界,其计算公式为:
此外,分别表示第1个区间的下界以及第M个区间的上界;
5)对步骤4)获取的数据集按区间进行初步的离群点检测;首先确定各区间的聚类中心,对于各区间每一个点使用KNN算法计算各点领域内邻近点距离,以此计算各点的密度记为/>k=1,2,3,…,M,i=1,2,3,…,Nk;所述步骤5)中,对于各区间每一个点使用KNN算法计算各点领域内邻近点距离,以此计算各点的密度记为/>具体为:
a)确定各个分区内的数据点集合;
b)确定KNN算法的超参数k值;
c)对于给定的数据点o,参数k,该数据点o的局部密度ρ计算如下:
其中numk为给定数据点o和其第k近邻的数据点ok的距离之内包含的数据点个数,dist(oi,oj)表示数据点oi和oj之间的欧式距离;
6)计算各区间所有数据点的平均密度大小k=1,2,3,…,M,将各区间内密度大于该区间内平均密度的数据点作为该区间待选的聚类中心,记为/>k=1,2,3,…,M,j=1,2,3,…,Rk,Rk为k区间待选聚类中心个数;
7)设置各区间的聚类数mk,对于各区间的待选聚类中心,先选择该区间的密度最大的待选聚类中心作为第一个聚类中心,并去除其周围最邻近的sk个数据点内所包含的待选聚类中心,同时从该区间数据集去除sk个邻近点,记为/>剩余待选聚类中心记为t为迭代次数;
8)令t=t+1,重复步骤7)直至选出的聚类中心数量达到mk个,或者为空集;
9)对于各个区间的数据集内的数据点计算其和该区间的所有聚类中心的欧式距离,并将各点分配给最近距离的聚类中心,形成该区间的聚类簇;欧式距离的计算具体为:
a)设数据点为(v1,p1)和(v2,p2);
b)欧式距离
10)对于各个区间的数据集找出其数据点的密度小于该区间平均密度的子集,记为/>认为离群点均存在于该子集中;
11)计算步骤10)获得的子集内各个数据点到其分配到的聚类中心的欧式距离,并利用3-σ原则对该距离进行检测,检测出各个区间的离群点,得到整个数据集{Xi}的离群点集合,记为{Xi}outliers
具体为:
a)确定各区间内子集和其聚类中心的欧式距离,记为/>k表示分区,m表示子集/>的数据点;
b)计算各分区内距离集合的方差σk,计算方式如下:
其中n为子集数据点个数;
c)得到σk后,在每个区间内计算异常值,如果相对距离在以下区间内则认为是离群点:
或/>
d)以上可得到计算的离群点集合
CN202010029302.7A 2020-01-13 2020-01-13 一种基于聚类中心优化的风电机组功率曲线离群点检测方法 Active CN111260503B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010029302.7A CN111260503B (zh) 2020-01-13 2020-01-13 一种基于聚类中心优化的风电机组功率曲线离群点检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010029302.7A CN111260503B (zh) 2020-01-13 2020-01-13 一种基于聚类中心优化的风电机组功率曲线离群点检测方法

Publications (2)

Publication Number Publication Date
CN111260503A CN111260503A (zh) 2020-06-09
CN111260503B true CN111260503B (zh) 2023-10-27

Family

ID=70950413

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010029302.7A Active CN111260503B (zh) 2020-01-13 2020-01-13 一种基于聚类中心优化的风电机组功率曲线离群点检测方法

Country Status (1)

Country Link
CN (1) CN111260503B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111881617B (zh) * 2020-07-02 2024-03-26 上海电气风电集团股份有限公司 数据处理方法、风力发电机组的性能评估方法及***
CN112800103B (zh) * 2020-12-09 2023-03-03 华能陕西发电有限公司 一种scada数据挖掘的风电机组功率曲线的获取***及方法
CN113094997B (zh) * 2021-04-19 2022-04-01 华北电力大学 一种风电机组运行模拟方法、装置、设备及存储介质
CN115600119B (zh) * 2022-12-13 2023-06-16 青岛左岸数据科技有限公司 适用于风力发电的数据处理方法及***
CN116665283B (zh) * 2023-07-31 2023-12-15 长春大学 一种课堂面部数据集的构建方法及***

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462819A (zh) * 2014-12-09 2015-03-25 国网四川省电力公司信息通信公司 一种基于密度聚类的局部离群点检测方法
CN104765879A (zh) * 2015-04-28 2015-07-08 无锡中科泛在信息技术研发中心有限公司 数据挖掘中基于密度的k中心点划分聚类方法
CN108171400A (zh) * 2017-12-06 2018-06-15 浙江大学 一种基于异常点及离群点检测的风机功率曲线数据预处理方法
CN108764307A (zh) * 2018-05-15 2018-11-06 江南大学 自然最近邻优化的密度峰值聚类方法
CN108985490A (zh) * 2018-06-14 2018-12-11 内蒙古大学 基于滑动窗口特征数据拟合的风力发电机功率曲线修正方法
CN109740175A (zh) * 2018-11-18 2019-05-10 浙江大学 一种面向风电机组功率曲线数据的离群点判别方法
WO2020097944A1 (zh) * 2018-11-18 2020-05-22 浙江大学 一种基于真实功率曲线的风电机组偏航误差固有偏差辨识及补偿方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10846308B2 (en) * 2016-07-27 2020-11-24 Anomalee Inc. Prioritized detection and classification of clusters of anomalous samples on high-dimensional continuous and mixed discrete/continuous feature spaces

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462819A (zh) * 2014-12-09 2015-03-25 国网四川省电力公司信息通信公司 一种基于密度聚类的局部离群点检测方法
CN104765879A (zh) * 2015-04-28 2015-07-08 无锡中科泛在信息技术研发中心有限公司 数据挖掘中基于密度的k中心点划分聚类方法
CN108171400A (zh) * 2017-12-06 2018-06-15 浙江大学 一种基于异常点及离群点检测的风机功率曲线数据预处理方法
CN108764307A (zh) * 2018-05-15 2018-11-06 江南大学 自然最近邻优化的密度峰值聚类方法
CN108985490A (zh) * 2018-06-14 2018-12-11 内蒙古大学 基于滑动窗口特征数据拟合的风力发电机功率曲线修正方法
CN109740175A (zh) * 2018-11-18 2019-05-10 浙江大学 一种面向风电机组功率曲线数据的离群点判别方法
WO2020097944A1 (zh) * 2018-11-18 2020-05-22 浙江大学 一种基于真实功率曲线的风电机组偏航误差固有偏差辨识及补偿方法

Also Published As

Publication number Publication date
CN111260503A (zh) 2020-06-09

Similar Documents

Publication Publication Date Title
CN111260503B (zh) 一种基于聚类中心优化的风电机组功率曲线离群点检测方法
CN108412710B (zh) 一种风电机组风功率数据清洗方法
CN109740175B (zh) 一种面向风电机组功率曲线数据的离群点判别方法
CN111539553B (zh) 基于svr算法和偏峰度的风电机组发电机故障预警方法
CN110362045B (zh) 一种考虑海洋气象因素的海上双馈风电机组故障判别方法
CN111275570A (zh) 一种基于迭代式统计与假设检验的风电机组功率异常值检测方法
CN114444382B (zh) 基于机器学习算法的风电机组齿轮箱故障诊断分析方法
CN106570790B (zh) 一种计及风速数据分段特性的风电场出力数据修复方法
CN110094310B (zh) 一种识别风力发电机偏航对风不正的方法
CN106230378B (zh) 一种光伏电站组串故障的诊断方法
CN110259648B (zh) 一种基于优化K-means聚类的风机叶片故障诊断方法
CN108734359B (zh) 一种风电功率预测数据预处理方法
CN111522808B (zh) 一种风电机组异常运行数据处理方法
CN113236508B (zh) 一种用于风力发电机组风速-功率异常数据检测的方法
CN114215706A (zh) 一种风电机组叶片开裂故障预警方法和装置
CN110991701A (zh) 一种基于数据融合的风电场风机风速预测方法及***
CN118013450B (zh) 一种基于太阳总辐射计算的光伏优化***
CN116771610A (zh) 一种调整风电机组变桨***故障评估值的方法
CN114968999A (zh) 一种基于时序匹配和双向四分位算法的异常数据清洗方法
CN114169681B (zh) 一种考虑时空离群点检测的风电机组功率曲线数据预处理方法
CN111209914A (zh) 一种异常风功率数据的剔除方法
CN113554203B (zh) 基于高维网格化和LightGBM的风电预测方法及装置
CN115545966A (zh) 一种光伏组串电量损失分析与识别方法及其存储介质
CN114936590A (zh) 一种光伏电站弃光数据识别方法、装置及存储介质
Souza et al. Evaluation of data based normal behavior models for fault detection in wind turbines

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant