CN111275570A - 一种基于迭代式统计与假设检验的风电机组功率异常值检测方法 - Google Patents

一种基于迭代式统计与假设检验的风电机组功率异常值检测方法 Download PDF

Info

Publication number
CN111275570A
CN111275570A CN202010029300.8A CN202010029300A CN111275570A CN 111275570 A CN111275570 A CN 111275570A CN 202010029300 A CN202010029300 A CN 202010029300A CN 111275570 A CN111275570 A CN 111275570A
Authority
CN
China
Prior art keywords
abnormal value
data
fan
abnormal
interval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010029300.8A
Other languages
English (en)
Inventor
杨秦敏
柳泽波
陈积明
陈棋
孙勇
孙优贤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202010029300.8A priority Critical patent/CN111275570A/zh
Publication of CN111275570A publication Critical patent/CN111275570A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Operations Research (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Wind Motors (AREA)

Abstract

本发明公开了一种基于迭代式统计与假设检验的风电机组功率异常值检测方法。该方法基于风机数据采集与监控控制***(SCADA)获得风电机组的实时运行数据,利用迭代式统计方法与假设检验方法融合进行异常值检测。本发明检测方法能根据风机功率曲线的分布特性进行准确的异常点识别,保证了实时运行数据处理的可靠性和有效性,同时具有较快检测速度,对数据无特殊要求,能适用复杂的风电机组***场景,具有较强的可用性和实用性。

Description

一种基于迭代式统计与假设检验的风电机组功率异常值检测 方法
技术领域
本发明涉及风电机组异常检测领域,尤其涉及一种基于迭代式统计与假设检验的风电机组功率异常值检测方法。
背景技术
在传统化石能源资源匮乏和污染严重的现代社会,风能作为一种无污染、可再生的新能源而广泛为大众所青睐,风电产业也由此成为国内外大力发展的新型可再生能源产业之一。在我国,近十年来有关风电场的建设与相关研究工作无论是从数量上还是质量上来说都有着显著的提升,但在大力发展风力发电行业的同时,也伴随着风机自身的不断退化所导致的一系列负面因素。现今风力发电机在使用的过程中,由于风速具有间歇性与高度不确定性的特点,对风力发电机本身的性能评估造成了较大的影响,而正确对风力发电机的性能与健康状况进行评估与诊断则是风力发电运维方面合理规划的重要之处。
考虑到风机在正常工作中,其不同情况下额故障大多数都会反映在风机的功率曲线中,因此对于风机功率曲线的准确获取是当前研究风机性能状况方面问题的潜在基础。而对于风机的功率曲线获取而言,如何将包含异常甚至错误的数据集信息转变为有效的、统一的、可靠的数据信息则是获取风机真实功率曲线的重中之重。然而,目前通过SCADA获取的风机功率数据存在较大的噪点,导致后续根据该功率曲线进行的数据分析存在偏差,从而影响分析结果的准确性。因此,现有的功率曲线获取技术无法有效提取风电机组***的有效且可靠信息,需要对SCADA获取的源数据进行异常值检测与剔除,以保证风机功率曲线的准确性和可靠性。
发明内容
本发明目的在于对现有研究和技术存在的不足之处加以完善与规范化,提出一种基于迭代式统计与假设检验的风电机组功率时序异常值检测方法,该方法对风电场风机功率曲线进行功率的异常值检测筛选和剔除,可以提高获取功率曲线的准确性与可靠性,更具有实用价值;且有利于通过数据分析对潜在故障进行检测,方法应用的扩展性高。
本发明的目的通过以下的技术方案实现:一种基于迭代式统计与假设检验的风电机组功率异常值检测方法,包括以下步骤:
1)选取待检测风机,获取其实时监控数据,形成数据集,获取的数据信息用于进行该风电机组的功率异常检测,该数据信息包括风速{vi}、有功功率{Pi}和桨距角{βi},将信息数据集记为
Figure BDA0002363686420000021
其中i=1,2,3,…,N′;
2)对步骤1)获取的数据
Figure BDA0002363686420000022
进行去重,剔除重复的数据点,并对数据点进行初步异常值筛除,得到集合{X′i},其中i=1,2,3,…,N,N≤N′;
3)对步骤2)去重及初步离群点筛除后的数据集进行标准化处理,形成预处理后的数据集,将该数据集记为{Xi},其中i=1,2,3,…,N;
4)对步骤3)获取的数据集{Xi}进行区间划分,将风机功率以一定的风速间隔进行划分,划分为M个区间,记第k个区间的数据个数为Nk、功率曲线数据集为
Figure BDA0002363686420000023
其中k=1,2,3,…,M,i=1,2,3,…,Nk
5)对步骤4)获取的数据集
Figure BDA0002363686420000024
按区间进行初步的异常值检测;首先使用3-σ原则在各个区间进行异常值的筛选,可以将3-σ原则的阈值设置为2,保证能有较高的异常值覆盖率,将检测出来的异常值记为
Figure BDA0002363686420000025
k=1,表示第一次3-σ检测出来的异常值;
6)对步骤4)获取的数据集
Figure BDA0002363686420000026
按区间进行初步的异常值检测;使用四分位法(Box-Plot)在各个区间进行异常值的筛选,将检测出来的异常值记为
Figure BDA0002363686420000027
k=1,表示第一次Box-Plot检测出来的异常值;
7)将步骤5)和步骤6)获取的异常值集合
Figure BDA0002363686420000028
Figure BDA0002363686420000029
做并处理,获得第一次迭代的异常值集合,记为
Figure BDA00023636864200000210
k=1;对该集合使用GESD算法进行二次异常值检测,检测出的异常值加入最终异常值结果集
Figure BDA00023636864200000211
k=1;
8)从步骤4)获取的预处理后的数据集
Figure BDA00023636864200000212
中剔除步骤7)检测出的异常值集合
Figure BDA00023636864200000213
9)对步骤8)获取的数据集,从步骤5)开始进行第二次迭代,直至步骤5)或步骤6)均无检出异常值,或步骤7)无检出异常值时,终止迭代;
10)假设直至终止时已迭代p次,则通过步骤7)获取的最终异常值结果集为
Figure BDA00023636864200000214
将该异常值集合作为最终的异常值检测结果。
作为更进一步描述,所述步骤2)中,利用基于时间序列的风机功率曲线异常点判据进行异常点检测,包括两种情况:
情况1:根据风速{vi}、有功功率{Pi}以及桨距角{βi}定义基于时间序列的风机功率曲线异常点判据,如下表1所示:
表1风机功率曲线异常点基础判据
Figure BDA0002363686420000031
其中Prated为风机额定有功功率,vcut_in为风机切入风速,vrated为风机额定风速,vcut_off为风机切出风速,Pthres为有功功率阈值,βthres为桨距角阈值;
情况2:通过SCADA***获取风机状态{Condi},根据风速{vi}、有功功率{Pi}、桨距角{βi}以及风机状态{Condi}定义基于时间序列的风机功率曲线异常点判据,如下表2所示:
表2风机功率曲线异常点改进判据
Figure BDA0002363686420000032
其中Condnormal为风机正常运行状态,Condls为风机低风速正常运行状态,Condhs为风机高风速正常运行状态,Prated为风机额定有功功率,vcut_in为风机切入风速,Pthres为有功功率阈值,βthres为桨距角阈值。
作为更进一步描述,所述步骤3)中,数据集的标准化公式如下:
Figure BDA0002363686420000033
其中
Figure BDA0002363686420000034
分别对应第i个标准化风速以及有功功率数据,
Figure BDA0002363686420000035
分别为整个数据集内风速{vi}以及有功功率{Pi}的均值,σvP分别为整个数据集内风速{vi}以及有功功率{Pi}的标准差。
作为更进一步描述,所述步骤4)中,数据集{Xi}的区间划分方法如下:
a)确定数据集{Xi}中的风速{vi}中的最大值vm,并记
Figure BDA0002363686420000048
其中vcut_off为风机切出风速;
b)确定划分区间数M,则第k个区间的功率曲线数据集{Xi}定义为:
Figure BDA0002363686420000041
其中
Figure BDA0002363686420000042
为第k个区间的风速范围上界,同时为第k+1个区间的风速范围下界,其计算公式为:
Figure BDA0002363686420000043
此外,
Figure BDA0002363686420000044
分别表示第1个区间的下界以及第M个区间的上界。
作为更进一步描述,所述步骤5)中,通过3-σ原则的异常值检测方法对各个区间进行初步的异常值检测,具体为:
a)确定各个分区内的数据点集合,集合的数据点数记为n′;
b)计算各分区内数据的风机功率的方差σk,k表示分区的标记,计算方式如下:
Figure BDA0002363686420000045
Figure BDA0002363686420000046
c)得到σk后,在每个区间内计算异常值,如果风机功率P在以下区间内则认为异常值:
P<μ-2.5*σk或P>μ+2.5*σk
d)以上可得到3-σ原则初步计算的异常值集合
Figure BDA0002363686420000047
作为更进一步描述,所述步骤6)中,通过四分位法的异常值检测方法对各个区间进行初步的异常值检测,具体为:
a)四分位数(Quartile),把所有风机功率按数值由小到大排列并分成四等份,处于三个分割点(25%,50%,75%)即为四分位数;
b)第一四分位数(Q1),又称“下四分位数”,等于该区间内样本由小到大排列的后第25%的数据;
c)第二四分位数(Q2),又称“中位数”,等于该区间内样本由小到大排列的后第50%的数据;
d)第三四分位数(Q3),又称“上四分位数”,等于该区间内样本由小到大排列的后第75%的数据;
e)第三四分位数和第一四分位数的差距又称四分位距(Inter Quartile Range,IQR);
f)根据以下计算方式确定异常值:
P<Q1-1.5*IQR或P>Q3+1.5*IQR;
g)以上可得到四分位法初步计算的异常值集合
Figure BDA0002363686420000051
作为更进一步描述,所述步骤7)中,通过GESD的假设检验方法对各个区间得到的3-σ异常值和box-plot异常值并集进行二次筛选,具体为:
a)3-σ异常值和box-plot异常值并集记为
Figure BDA0002363686420000052
b)原假设H0
Figure BDA0002363686420000053
集合中没有异常值,备择假设H1
Figure BDA0002363686420000054
集合中有异常值;
c)计算
Figure BDA0002363686420000055
集合中与方差均值最远的数据点的检验统计值,注意此时每次只能检测
Figure BDA0002363686420000056
集合中离均值方差最远的数据点,上一次检测出来的值需要剔除,第j次检测的检验统计值Rj计算方式如下:
Figure BDA0002363686420000057
其中s为
Figure BDA0002363686420000058
标准差,
Figure BDA0002363686420000059
Figure BDA00023636864200000510
均值,
Figure BDA00023636864200000511
Figure BDA00023636864200000512
的第i条数据;
d)计算假设检验的临界值λj,计算方式如下:
Figure BDA00023636864200000513
其中n为
Figure BDA00023636864200000514
数据点个数,tp,n-j-1表示显著度为p、自由度为n-j-1时的t分布临界值;
e)若Rj>λj,则拒绝原假设,即该数据点为异常点,加入
Figure BDA00023636864200000515
中,并从
Figure BDA00023636864200000516
中剔除该样本点,从步骤b)开始对剔除后的
Figure BDA00023636864200000517
进行下一轮的检验;
f)若Rj≤λj,则接受原假设,即该数据点为正常数据点,直接退出该轮次假设检验;
g)得到
Figure BDA00023636864200000518
作为异常值集合。
与现有技术相比,本发明具有以下创新优势及显著效果:
1)针对风机功率曲线的异常值检测设计高可靠性,高检测速度且具有强解释性的新的异常值检测方法,能准确识别异常值。
2)针对目前风机功率曲线获取的不准确性设计了解决方法,使用多统计学方式准确识别风机功率曲线,使获取的风机功率曲线结果更贴近真实情况,有利于后续的数据分析获得更准确的结果。
附图说明
图1是本发明基于迭代式统计与假设检验的风电机组功率异常值检测方法流程图;
图2是本发明应用于实施例的原始数据集风速-功率散点图;
图3是本发明步骤2处理后风机的异常点检测结果风速-功率散点图;
图4是本发明基于迭代式统计与假设检验的风电机组功率异常值检测方法检测结果图。
具体实施方式
以下结合附图对本发明的具体实施方法与工作原理作如下详述:
实施例
本实施例对某风电场的某台风力发电机的SCADA***在2014年采集到的数据进行基于迭代式统计与假设检验的风电机组功率异常值检测方法,其中风力发电机SCADA***的数据采样间隔为10min,数据信息为期1年,时间范围为2014.01.01 00:00:00至2014.12.31 23:50:00。数据集包括的具体变量以及相关数据信息如表3、表4所示:
表3某风电场某风机SCADA***数据集部分数据
数据序号 时间 风速 桨距角 有功功率
1 2014-01-01 00:00:00 2.53 88.96 0.06
2 2014-01-01 00:10:00 3 88.96 0.05
48489 2014-08-19 02:20:00 1.82 1.82 0.06
48490 2014-08-19 02:30:00 2.02 2.02 0.06
48491 2014-08-19 02:40:00 2.13 2.13 0.06
表4某风电场某风机SCADA***数据集变量信息
变量名称 变量含义 变量单位
时间戳 数据采集时间 年-月-日时:分:秒
风速v 当前风机机舱风速 m/s
桨距角 当前桨距角 deg
有功功率P 当前风机有功功率 kW
本实施例中默认风电机组功率异常值检测的实施数据集即为上述某风机的1年运行数据,方法结果为基于流程判别出的该数据集对应的最终异常值结果集
Figure BDA0002363686420000061
方法实施步骤具体如下:
1)选取待检测风机,获取其实时监控数据,形成数据集,获取的数据信息用于进行该风电机组的功率异常检测,该数据信息包括风速{vi}、有功功率{Pi}和桨距角{βi},将信息数据集记为
Figure BDA0002363686420000071
其中i=1,2,3,…,N′。根据表3与表4中列出的数据信息,其包括了本步骤中所需的必要信息,图2所示的结果为本步骤中的风机风速-功率曲线原始数据的散点图;
2)对步骤1)中的数据集
Figure BDA0002363686420000072
进行去重,剔除重复的数据点,并对数据点进行初步异常点筛除,按照如下表5所示的异常点判断准则进行异常点判断:
表5实施例功率异常点判断准则
Figure BDA0002363686420000073
在本实施例中,Prated为1500kW,vcut_in为2m/s,vrated为14m/s,vcut_off为25m/s,Pthres为10kW,βthres为4°。图3所示的结果图展示了本步骤中异常点检测的结果图,包括正常点、异常点及其类别;
3)对步骤2)去重及初步异常点筛除后的数据集进行标准化处理,形成预处理后的数据集,将该数据集记为{Xi},其中i=1,2,3,…,N;
4)对步骤3)获取的数据集{Xi}进行区间划分,将风机功率以一定的风速间隔进行划分,划分为M个区间,记第k个区间的数据个数为Nk、功率曲线数据集为
Figure BDA0002363686420000074
其中k=1,2,3,…,M,i=1,2,3,…,Nk;具体划分规则如下:
步骤1:首先确定数据集{Xi}中风速{vi}中的最大值vm,记
Figure BDA0002363686420000079
在本实施例中,vcut_off为25m/s,风速最大值vm为22.4528m/s,故vmax为23m/s;
步骤2:在本实施例中,确定划分区间数M为24,因此第k个区间与第k+1个区间相应风速范围界限
Figure BDA0002363686420000075
的计算公式为:
Figure BDA0002363686420000076
此外,
Figure BDA0002363686420000077
分别表示第1个区间的下界以及第24个区间的上界。特别地,划分区间的确定方式一般可以选为vmax+1或其整数倍。
5)对步骤4)获取的数据集
Figure BDA0002363686420000078
按区间进行初步的异常值检测。首先使用3-σ原则在各个区间进行异常值的筛选,首先计算各个区间内风机功率的均值和方差,根据3-σ原则进行初步的异常值检测,并将3-σ原则的阈值设置为2,保证能有较高的异常值覆盖率,将检测出来的异常值记为
Figure BDA0002363686420000081
k=1,表示第一次3-σ检测出来的异常值;
6)对步骤4)获取的数据集
Figure BDA0002363686420000082
按区间进行初步的异常值检测。首先将
Figure BDA0002363686420000083
由小到大进行排列,根据数据值得大小中找到25%,50%,75%的三个四分位数,再计算四分位距,使用四分位法(Box-Plot)在各个区间进行异常值的筛选将检测出来的异常值记为
Figure BDA0002363686420000084
k=1,表示第一次Box-Plot检测出来的异常值;
7)将步骤5)和步骤6)获取的异常值集合
Figure BDA0002363686420000085
Figure BDA0002363686420000086
做并处理,获得第一次迭代的异常值集合,记为
Figure BDA0002363686420000087
k=1。对该集合使用GESD算法进行二次异常值检测,首先找到
Figure BDA0002363686420000088
中离均值方差最大的数据进行检测,计算该点的统计检验值和检验阈值并进行比较,以
Figure BDA0002363686420000089
第一次检测为例,λj=0.02且Rj=0.45,该点检测为异常点,加入
Figure BDA00023636864200000810
并从
Figure BDA00023636864200000811
剔除该点,进行下一次的GESD二次筛选;
8)从步骤4)获取的预处理后的数据集
Figure BDA00023636864200000812
中剔除步骤7)检测出的异常值集合
Figure BDA00023636864200000813
9)对步骤8)获取的数据集,从步骤5)开始进行第二次迭代,直至步骤5)或步骤6)均无检出异常值,或步骤7)无检出异常值时,终止迭代;
10)实施例中直至终止时已迭代15次,则通过步骤7)获取的最终异常值结果集为
Figure BDA00023636864200000814
将该异常值集合作为最终的异常值检测结果。图4为基于迭代式统计方法与假设检验的异常值检测结果。
本发明基于迭代式统计和假设检验的方式来进行风机功率的异常值筛选,主要包括风机功率数据的清洗与预处理,风机功率数据区间的划分,基于3-σ和box-plot的初次高覆盖率筛选,基于GESD假设检验的高准确率二次精筛,迭代式的逐步检测等环节和部分组成。图1是本发明基于迭代式统计与假设检验的风电机组功率异常值检测方法的流程图,整个实施例是按照该流程来进行实操,具有强可用性和操作简便性。图2-4为整个实施例实施过程中,实验过程的部分关键环节的结果图和最终检测结果的结果图。根据最终的结果显示,本发明基于迭代式统计与假设检验的风电机组功率时序异常值检测方法能准确快速的识别风电机组的风机功率数据的异常值,使得经过处理后的数据能更真实的反映整个待测风电机组的***状态,让得到的数据具有强可用性,对后续进行风电机组的相关性能检测和状态分析等提供高可靠性数据,有利于分析准确性进一步提高。
以上所述仅是本发明的优选实施方式,虽然本发明已以较佳实施例披露如上,然而并非用以限定本发明。任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何的简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。

Claims (7)

1.一种基于迭代式统计与假设检验的风电机组功率异常值检测方法,其特征在于,包括以下步骤:
1)选取待检测风机,获取其实时监控数据,形成数据集,获取的数据信息用于进行该风电机组的功率异常检测,该数据信息包括风速{vi}、有功功率{Pi}和桨距角{βi},将信息数据集记为
Figure FDA0002363686410000011
其中i=1,2,3,…,N′;
2)对步骤1)获取的数据
Figure FDA0002363686410000012
剔除重复的数据点,并对数据点进行初步异常值筛除,得到集合{X′i},其中i=1,2,3,…,N,N≤N′;
3)对步骤2)去重及初步离群点筛除后的数据集进行标准化处理,形成预处理后的数据集,将该数据集记为{Xi},其中i=1,2,3,…,N;
4)对步骤3)获取的数据集{Xi}进行区间划分,将风机功率以一定的风速间隔进行划分,划分为M个区间,记第k个区间的数据个数为Nk、功率曲线数据集为
Figure FDA0002363686410000013
其中k=1,2,3,…,M,i=1,2,3,…,Nk
5)对步骤4)获取的数据集
Figure FDA0002363686410000014
按区间进行初步的异常值检测;使用3-σ原则在各个区间进行异常值的筛选,将检测出来的异常值记为
Figure FDA0002363686410000015
k=1,表示第一次3-σ检测出来的异常值;
6)对步骤4)获取的数据集
Figure FDA0002363686410000016
按区间进行初步的异常值检测;使用四分位法(Box-Plot)在各个区间进行异常值的筛选,将检测出来的异常值记为k=1,表示第一次Box-Plot检测出来的异常值;
7)将步骤5)和步骤6)获取的异常值集合
Figure FDA0002363686410000018
Figure FDA0002363686410000019
做并处理,获得第一次迭代的异常值集合,记为
Figure FDA00023636864100000110
k=1;对该集合使用GESD算法进行二次异常值检测,检测出的异常值加入最终异常值结果集
Figure FDA00023636864100000111
k=1;
8)从步骤4)获取的预处理后的数据集
Figure FDA00023636864100000112
中剔除步骤7)检测出的异常值集合
Figure FDA00023636864100000113
9)对步骤8)获取的数据集,从步骤5)开始进行第二次迭代,直至步骤5)或步骤6)均无检出异常值,或步骤7)无检出异常值时,终止迭代;
10)假设直至终止时已迭代p次,则通过步骤7)获取的最终异常值结果集为
Figure FDA00023636864100000114
将该异常值集合作为最终的异常值检测结果。
2.根据权利要求1所述的一种基于迭代式统计与假设检验的风电机组功率异常值检测方法,其特征在于,所述步骤2)中,利用基于时间序列的风机功率曲线异常点判据进行异常点检测,包括两种情况:
情况1:根据风速{vi}、有功功率{Pi}以及桨距角{βi}定义基于时间序列的风机功率曲线异常点判据,如下表1所示:
表1 风机功率曲线异常点基础判据
Figure FDA0002363686410000021
其中Prated为风机额定有功功率,vcut_in为风机切入风速,vrated为风机额定风速,vcut_off为风机切出风速,Pthres为有功功率阈值,βthres为桨距角阈值;
情况2:通过SCADA***获取风机状态{Condi},根据风速{vi}、有功功率{Pi}、桨距角{βi}以及风机状态{Condi}定义基于时间序列的风机功率曲线异常点判据,如下表2所示:
表2 风机功率曲线异常点改进判据
Figure FDA0002363686410000022
其中Condnormal为风机正常运行状态,Condls为风机低风速正常运行状态,Condhs为风机高风速正常运行状态,Prated为风机额定有功功率,vcut_in为风机切入风速,Pthres为有功功率阈值,βthres为桨距角阈值。
3.根据权利要求1所述的一种基于迭代式统计与假设检验的风电机组功率异常值检测方法,其特征在于,所述步骤3)中,数据集的标准化公式如下:
Figure FDA0002363686410000023
其中
Figure FDA0002363686410000031
分别对应第i个标准化风速以及有功功率数据,
Figure FDA0002363686410000032
分别为整个数据集内风速{vi}以及有功功率{Pi}的均值,σvP分别为整个数据集内风速{vi}以及有功功率{Pi}的标准差。
4.根据权利要求1所述的一种基于迭代式统计与假设检验的风电机组功率异常值检测方法,其特征在于,所述步骤4)中,数据集{Xi}的区间划分方法如下:
a)确定数据集{Xi}中的风速{vi}中的最大值vm,并记
Figure FDA0002363686410000033
其中vcut_off为风机切出风速;
b)确定划分区间数M,则第k个区间的功率曲线数据集{Xi}定义为:
Figure FDA0002363686410000034
其中
Figure FDA0002363686410000035
为第k个区间的风速范围上界,同时为第k+1个区间的风速范围下界,其计算公式为:
Figure FDA0002363686410000036
此外,
Figure FDA0002363686410000037
分别表示第1个区间的下界以及第M个区间的上界。
5.根据权利要求1所述的一种基于迭代式统计与假设检验的风电机组功率异常值检测方法,其特征在于,所述步骤5)中,通过3-σ原则的异常值检测方法对各个区间进行初步的异常值检测,具体为:
a)确定各个分区内的数据点集合,集合的数据点数记为n′;
b)计算各分区内数据的风机功率的方差σk,k表示分区的标记,计算方式如下:
Figure FDA0002363686410000038
Figure FDA0002363686410000039
c)得到σk后,在每个区间内计算异常值,如果风机功率P在以下区间内则认为异常值:
P<μ-2.5*σk或P>μ+2.5*σk
d)以上可得到3-σ原则初步计算的异常值集合
Figure FDA00023636864100000310
6.根据权利要求1所述的一种基于迭代式统计与假设检验的风电机组功率异常值检测方法,其特征在于,所述步骤6)中,通过四分位法的异常值检测方法对各个区间进行初步的异常值检测,具体为:
a)四分位数,把所有风机功率按数值由小到大排列并分成四等份,处于三个分割点即为四分位数;
b)第一四分位数(Q1),等于该区间内样本由小到大排列的后第25%的数据;
c)第二四分位数(Q2),等于该区间内样本由小到大排列的后第50%的数据;
d)第三四分位数(Q3),等于该区间内样本由小到大排列的后第75%的数据;
e)第三四分位数和第一四分位数的差距为四分位距IQR;
f)根据以下计算方式确定异常值:
P<Q1-1.5*IQR或P>Q3+1.5*IQR;
g)以上可得到四分位法初步计算的异常值集合
Figure FDA0002363686410000041
7.根据权利要求1所述的一种基于迭代式统计与假设检验的风电机组功率异常值检测方法,其特征在于,所述步骤7)中,通过GESD的假设检验方法对各个区间得到的3-σ异常值和box-plot异常值并集进行二次筛选,具体为:
a)3-σ异常值和box-plot异常值并集记为
Figure FDA0002363686410000042
b)原假设H0
Figure FDA0002363686410000043
集合中没有异常值,备择假设H1
Figure FDA0002363686410000044
集合中有异常值;
c)计算
Figure FDA0002363686410000045
集合中与方差均值最远的数据点的检验统计值,注意此时每次只能检测
Figure FDA0002363686410000046
集合中离均值方差最远的数据点,上一次检测出来的值需要剔除,第j次检测的检验统计值Rj计算方式如下:
Figure FDA0002363686410000047
其中s为
Figure FDA0002363686410000048
标准差,
Figure FDA0002363686410000049
Figure FDA00023636864100000410
均值,
Figure FDA00023636864100000411
Figure FDA00023636864100000412
的第i条数据;
d)计算假设检验的临界值λj,计算方式如下:
Figure FDA00023636864100000413
其中n为
Figure FDA00023636864100000414
数据点个数,tp,n-j-1表示显著度为p、自由度为n-j-1时的t分布临界值;
e)若Rj>λj,则拒绝原假设,即该数据点为异常点,加入
Figure FDA00023636864100000415
中,并从
Figure FDA00023636864100000416
中剔除该样本点,从步骤b)开始对剔除后的
Figure FDA00023636864100000417
进行下一轮的检验;
f)若Rj≤λj,则接受原假设,即该数据点为正常数据点,直接退出该轮次假设检验;
g)得到
Figure FDA00023636864100000418
作为异常值集合。
CN202010029300.8A 2020-01-13 2020-01-13 一种基于迭代式统计与假设检验的风电机组功率异常值检测方法 Pending CN111275570A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010029300.8A CN111275570A (zh) 2020-01-13 2020-01-13 一种基于迭代式统计与假设检验的风电机组功率异常值检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010029300.8A CN111275570A (zh) 2020-01-13 2020-01-13 一种基于迭代式统计与假设检验的风电机组功率异常值检测方法

Publications (1)

Publication Number Publication Date
CN111275570A true CN111275570A (zh) 2020-06-12

Family

ID=71000101

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010029300.8A Pending CN111275570A (zh) 2020-01-13 2020-01-13 一种基于迭代式统计与假设检验的风电机组功率异常值检测方法

Country Status (1)

Country Link
CN (1) CN111275570A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111881617A (zh) * 2020-07-02 2020-11-03 上海电气风电集团股份有限公司 数据处理方法、风力发电机组的性能评估方法及***
CN111984930A (zh) * 2020-08-19 2020-11-24 河海大学 一种地下水水位监测数据异常值识别方法及***
CN112032003A (zh) * 2020-09-01 2020-12-04 浙江运达风电股份有限公司 一种大型风电机组运行性能监测方法
CN113434823A (zh) * 2021-08-26 2021-09-24 企查查科技有限公司 数据采集任务异常预警方法、装置、计算机设备和介质
CN113657662A (zh) * 2021-08-13 2021-11-16 浙江大学 一种基于数据融合的降尺度风电功率预测方法
CN114033631A (zh) * 2021-11-08 2022-02-11 浙江运达风电股份有限公司 一种风电机组风能利用系数在线辨识方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106909793A (zh) * 2017-03-03 2017-06-30 北京北青厚泽数据科技有限公司 检验服从近似正态分布的时间序列的异常的方法
CN107330183A (zh) * 2017-06-29 2017-11-07 华北电力大学 一种基于运行数据的风电利用率计算方法
CN108171400A (zh) * 2017-12-06 2018-06-15 浙江大学 一种基于异常点及离群点检测的风机功率曲线数据预处理方法
CN109116243A (zh) * 2018-06-29 2019-01-01 上海科列新能源技术有限公司 一种动力电池的异常检测方法和装置
CN109740175A (zh) * 2018-11-18 2019-05-10 浙江大学 一种面向风电机组功率曲线数据的离群点判别方法
CN109918364A (zh) * 2019-02-28 2019-06-21 华北电力大学 一种基于二维概率密度估计和四分位法的数据清洗方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106909793A (zh) * 2017-03-03 2017-06-30 北京北青厚泽数据科技有限公司 检验服从近似正态分布的时间序列的异常的方法
CN107330183A (zh) * 2017-06-29 2017-11-07 华北电力大学 一种基于运行数据的风电利用率计算方法
CN108171400A (zh) * 2017-12-06 2018-06-15 浙江大学 一种基于异常点及离群点检测的风机功率曲线数据预处理方法
CN109116243A (zh) * 2018-06-29 2019-01-01 上海科列新能源技术有限公司 一种动力电池的异常检测方法和装置
CN109740175A (zh) * 2018-11-18 2019-05-10 浙江大学 一种面向风电机组功率曲线数据的离群点判别方法
CN109918364A (zh) * 2019-02-28 2019-06-21 华北电力大学 一种基于二维概率密度估计和四分位法的数据清洗方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111881617A (zh) * 2020-07-02 2020-11-03 上海电气风电集团股份有限公司 数据处理方法、风力发电机组的性能评估方法及***
CN111881617B (zh) * 2020-07-02 2024-03-26 上海电气风电集团股份有限公司 数据处理方法、风力发电机组的性能评估方法及***
CN111984930A (zh) * 2020-08-19 2020-11-24 河海大学 一种地下水水位监测数据异常值识别方法及***
CN112032003A (zh) * 2020-09-01 2020-12-04 浙江运达风电股份有限公司 一种大型风电机组运行性能监测方法
CN112032003B (zh) * 2020-09-01 2021-08-17 浙江运达风电股份有限公司 一种大型风电机组运行性能监测方法
CN113657662A (zh) * 2021-08-13 2021-11-16 浙江大学 一种基于数据融合的降尺度风电功率预测方法
CN113434823A (zh) * 2021-08-26 2021-09-24 企查查科技有限公司 数据采集任务异常预警方法、装置、计算机设备和介质
CN113434823B (zh) * 2021-08-26 2021-11-16 企查查科技有限公司 数据采集任务异常预警方法、装置、计算机设备和介质
CN114033631A (zh) * 2021-11-08 2022-02-11 浙江运达风电股份有限公司 一种风电机组风能利用系数在线辨识方法

Similar Documents

Publication Publication Date Title
CN111275570A (zh) 一种基于迭代式统计与假设检验的风电机组功率异常值检测方法
CN111539553B (zh) 基于svr算法和偏峰度的风电机组发电机故障预警方法
CN105677791B (zh) 用于分析风力发电机组的运行数据的方法和***
CN111260503B (zh) 一种基于聚类中心优化的风电机组功率曲线离群点检测方法
CN105846780A (zh) 一种基于决策树模型的光伏组件故障诊断方法
CN106570790B (zh) 一种计及风速数据分段特性的风电场出力数据修复方法
CN113298297A (zh) 一种基于孤立森林与wgan网络的风电输出功率预测方法
CN111522808B (zh) 一种风电机组异常运行数据处理方法
CN112598539B (zh) 一种风力发电机组风功率曲线优化计算及异常值检测方法
CN117849700B (zh) 可控制测量的模块化电能计量***
CN112417763A (zh) 输电线路的缺陷诊断方法、装置、设备及存储介质
CN115526258A (zh) 基于Spearman相关系数特征提取的电力***暂稳评估方法
CN114330486A (zh) 基于改进Wasserstein GAN的电力***不良数据辨识方法
CN111623905B (zh) 风电机组轴承温度预警方法及装置
CN116662829B (zh) 一种场群风机标准功率曲线定义规则和偏差验证方法
Elijorde et al. A wind turbine fault detection approach based on cluster analysis and frequent pattern mining
CN117630800A (zh) 一种电能表自动检定装置故障诊断方法及***
CN117093938A (zh) 一种基于深度学习的风机轴承的故障检测方法和***
CN111507374A (zh) 一种基于随机矩阵理论的电网海量数据异常检测方法
CN111062133A (zh) 风电机组性能分析方法及***
Souza et al. Evaluation of data based normal behavior models for fault detection in wind turbines
CN115392710A (zh) 一种基于数据过滤的风电机组运行决策方法及***
CN114154567A (zh) 一种基于机器学习的风电场站运行数据异常识别方法
CN114033631B (zh) 一种风电机组风能利用系数在线辨识方法
Qiao et al. Research on SCADA data preprocessing method of Wind Turbine

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination