CN109086793B - 一种风力发电机的异常识别方法 - Google Patents
一种风力发电机的异常识别方法 Download PDFInfo
- Publication number
- CN109086793B CN109086793B CN201810675216.6A CN201810675216A CN109086793B CN 109086793 B CN109086793 B CN 109086793B CN 201810675216 A CN201810675216 A CN 201810675216A CN 109086793 B CN109086793 B CN 109086793B
- Authority
- CN
- China
- Prior art keywords
- fan
- attributes
- data set
- data
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 230000009467 reduction Effects 0.000 claims abstract description 29
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 22
- 230000002159 abnormal effect Effects 0.000 claims description 38
- 230000005856 abnormality Effects 0.000 claims description 27
- 238000010586 diagram Methods 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000011176 pooling Methods 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 8
- 230000000694 effects Effects 0.000 claims description 8
- 238000003064 k means clustering Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 5
- 230000003203 everyday effect Effects 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 238000012512 characterization method Methods 0.000 claims description 3
- 230000002354 daily effect Effects 0.000 claims description 3
- 238000000354 decomposition reaction Methods 0.000 claims description 3
- 230000036541 health Effects 0.000 claims description 3
- 238000000926 separation method Methods 0.000 claims description 3
- 239000013598 vector Substances 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 abstract description 3
- 238000012360 testing method Methods 0.000 description 27
- 238000012423 maintenance Methods 0.000 description 5
- 238000005070 sampling Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000013021 overheating Methods 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000013535 sea water Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明的一种风力发电机的异常识别方法,将SCADA数据中异常的属性剔出,保留的其他属性经k‑means聚类;将属性分别经t‑SNE降低成固定维数;将降维后的有效数据进行皮尔森相关系数计算排序,转换为图片作为CNN的输入,通过对图片二分类实现风机的正异常判断。该异常识别方法在建立风机异常识别模型时,输入输出涉及所有属性,模型可以有效识别多类属性同时发生多种异常,模型具有通用性,适用于任何风场;采用先聚类后类内降维的数据预处理方法,去除了不必要的干扰,提高准确性;采用卷积神经网络进行属性异常识别可抑制噪声干扰,准确发现风机属性图片微小变化,较强的区别特征的能力和鲁棒性使其具有更好的准确性。
Description
技术领域
本发明属于故障诊断技术领域,具体涉及一种风力发电机的异常识别方法。
背景技术
随着全球风力发电能力持续增长和风电场的快速扩张、风机的不断应用,机组机舱体积随之增大,轮毂位置也更高,风机安全运行的挑战越来越大。风电机组长期暴露在大风、雷雨、冰雹等极端天气中,尤其海上风机还要受到长期的海水侵蚀,非常容易发生机械部件或电气***等异常或故障。风机不同部位故障皆有可能引起风机停电,研究发现,在风机维护领域,即使一些微小的故障都会带来价格昂贵的维护成本,风机的维护面临着众多挑战。据研究分析表明,如果对风电机组采用预知维护,将大大降低风电机组的事后修复与计划维护成本,这对大规模发展风电产业的经济投入方面有着巨大的影响,因此对风电机组的异常状态进行分析,进行故障预警有着十分重要的意义。为了减少风机的故障以及由故障带来的经济损失,风力发电机的状况监测和异常识别在降低停机时间和维护成本方面日益重要。
目前风机功率曲线可提供输出功率与风速之间的关系,是风机异常识别与性能分析最常用的工具之一,研究人员在风电场SCADA数据的基础上,采用不同的方法估算和监测风机功率曲线。当风机处于正常工作(即有功无功控制)状态下,基于SCADA参数建模是风机异常识别的另一个有效方法。与功率曲线监测技术相比,它可以充分利用SCADA***隐藏的运行信息识别风机组件的异常,通过使用SCADA参数挖掘方法,已经开发了多种条件参数预测模型以检测故障发生之前风机行为的显著变化。但前人研究时存在的问题主要如下:
(1)在建立风机异常识别模型时,通常会人为地选择几个关键属性作为模型的输入,这样容易选择错误的属性,导致建模失败,或者使得模型不通用。(2)训练模型时,只包含有功无功控制这一状态的样本,因自然因素导致的机组待风、机组待机等状态都纳入非正常工作状态,而上述仅是天气的干扰非风机的异常。(3)识别异常时,只能识别单类异常,不能同时识别多类异常。此外,残差法经常被用来确定风机的状态,但阈值的设置多数基于人为的经验,往往会干扰异常识别的准确性。
发明内容
针对现有技术的不足,本发明实施提供一种风力发电机的异常识别方法。
本发明的一种风力发电机的异常识别方法,包括以下步骤:
步骤1:从风场SCADA***采集多组包含多种风机属性的风机数据,构成初始风机数据集;
步骤2:删除初始风机数据集中的异常数据,以获得完整风机数据集,所述异常数据包括:某组大量缺失风机属性的风机数据;风机数据中某种每日、每月或每年都恒定不变的风机属性;处理后风机属性个数为n;
步骤3:采用小波阈值法对完整风机数据集进行降噪处理;
步骤4:采用k-means的聚类方法对降噪后的整个风机数据集中的风机属性分类,聚类后使得类内属性相似,类间属性相离;
步骤5:采用t-SNE算法对聚类处理后的风机数据集进行降维处理;
步骤6:将降维后的数据进行皮尔森相关系数的计算分析,把数据按照相关系数的大小进行排列,风机数据集组织为具有相同尺寸的图像;
步骤7:将进行皮尔森相关系数分析后组成的图像送到卷积神经网络,并进行风机的异常识别;
步骤8:确定风机发生异常后,通过准则判定发生异常的风机属性所属的类别;
步骤9:通过对风机属性异常的识别,验证该风力发电机异常识别方法的有效性。
在本发明的风力发电机的异常识别方法中,步骤3中所述小波为db5,分解层数为5。
在本发明的风力发电机的异常识别方法中,所述步骤4具体包括:
步骤4-1:将风机数据集中的元素根据下式进行归一处理:
其中,Vi表示任意元素,max(A)代表该风机属性的元素最大值,min(A)代表该风机属性的元素最小值,V是该风机属性的任意元素归一后的值;
其中,SC表示轮廓系数,ai表示一个元素Xi与同一分类中所有其他元素之间的平均距离,ai用于量化内部集中度;bi用于量化集群之间的分离度,在上述元素Xi之外选择一个分类b,计算该元素Xi和分类b中所有元素之间的平均距离bi,遍历所有其他分类,找到最近的平均距离bi,SC在-1到+1之间,值越大表示聚类效果越好,选取轮廓系数最大时对应的聚类数。
在本发明的风力发电机的异常识别方法中,所述步骤5具体包括:
步骤5-1:将聚类后的风机数据集按数据采集日分成为多个风机样本矩阵,对风机样本矩阵的数据进行归一化处理,变换为均值为0、方差为1的标准样本矩阵X={x1,x2,…xn};
步骤5-2:定义标准样本矩阵X={x1,x2,…xn}中两属性间的条件相似性表达式如下:
其中,σi为常数,代表了以xi为中心点的高斯分布的方差,因数据点不同而不同;xi,xj,xk表示标准样本矩阵中3个属性,根据下式计算两属性的相似度:
步骤5-3:根据经验设置困惑度Perp、迭代次数T、学习速率η、动量α(t),随机设置降维后的风机数据集为Y={y1,y2,…,yn},根据下式计算降维后的风机数据集中两属性间的相似度:
在给定Perp的情况下使用二分搜索的方式并根据下式寻找合适的σ,梯度公式如下:
其中,C代表损失函数,不断调整Perp、迭代次数T,直到找出上式最趋近于0时对应的Perp和T的值;
根据上式计算得到降维后的风机数据集;
步骤5-4:K-means聚类后将风机属性划分为K类,t-SNE算法降维后将每类降低成3维,降维后的风机数据集是Y=K×3维,即可作为卷积神经网络的有效行输入。
在本发明的风力发电机的异常识别方法中,所述步骤6具体包括:
步骤6-1:对排序后的K组数据进行皮尔森相关系数计算;
其中cov(M,N)代表从风机数据集Y中的K个类别中取出不同的类别M和类别N进行协方差系数计算,σM代表类别M的标准差,σN代表类别N的标准差。
步骤6-2:将计算完成的皮尔森相关系数按照大小进行两两比较排序,组合成具有连贯性的图像。
在本发明的风力发电机的异常识别方法中,所述步骤7具体包括:
步骤7-1:引入归一化层,将卷积神经网络的输入标准化为相同的尺寸;
步骤7-2:引入卷积层,通过卷积和非线性两个操作生成几个特征图来进行特征提取;
步骤7-3:引入池化层,通过池化操作减少特征图的大小;
步骤7-4:在获得较高级别的特征表征之后,将其转换为1-D矢量并馈送到分类层;
步骤7-5:分类层采用S型功能函数作为激活函数,对风机有无异常进行判断,其中输出0代表风机异常,1代表风机正常。
在本发明的风力发电机的异常识别方法中,所述步骤8具体包括:
步骤8-1:以天为单位计算降维后的健康状态的风机数据集中的3个属性的均值,分别记作a,b,c;
步骤8-2:改进经典公式推论:
进而推出:
本发明的一种风力发电机的异常识别方法与现有技术相比,至少具有以下有益效果:
1、建立风机异常识别模型时,输入输出涉及所有属性,模型可以有效识别多类属性同时发生多种异常,建立的模型具有通用性,可适用于任何风场;
2、训练模型时,将天气因素导致的机组待风、机组待机等天气干扰而非风机异常等情况纳入正常状态,这些可以避免误判断;
3、先聚类后类内降维的数据预处理方法,用最简洁的特征表达了风机的状态,去除了不必要的干扰,有助于准确性的提高;
4、卷积神经网络模型的输入样本由完整的风机图像片段提供,其中包含全面的异常信息;同时特征对噪音敏感,特别是针对异常不明显的情况,卷积神经网络模型可以抑制噪声的不利干扰,准确发现风机属性图片微小的变化,其较强的区别特征的能力和鲁棒性使其具有更好的准确性。
附图说明
图1为本发明的一种风力发电机的异常识别方法的流程图;
图2a为本发明实施方式的采样点数据值大量缺失的异常数据示意图,图2b为本发明实施方式的采集到的风机属性值恒定不变的示意图;
图3为本发明实施方式的卷积神经网络的结构图;
图4为本发明实施方式的卷积神经网络每层的输出特征图;
图5为本发明实施方式的第一类属性发生单项异常的五组输出图;
图6为本发明实施方式的第一类属性发生多项异常的准确率统计图;
图7为本发明实施方式的第六类属性发生多项异常的五组输出图;
图8为本发明实施方式的第六类属性发生多项异常的准确率统计图;
图9为本发明实施方式的多类属性发生多类异常的五组输出图;
图10为本发明实施方式的BPNN五组输出图。
具体实施方式
下面结合附图对本发明的一种实施方式做详细说明。
将采集到的风场SCADA数据中异常的属性剔出,保留的其他风机属性经k-means聚类,轮廓系数被用作评判聚类效果的标志,以确定聚类数目及各类属性;然后,将各类别的属性分别经t-SNE降低成固定维数,新属性为各类别降维后属性的集合,为卷积神经网络模型提供异常识别的有效数据,使卷积神经网络发挥最大作用;最后,将降维后的有效数据划分为方阵转换为图片作为卷积神经网络的输入,通过对图片二分类实现风机的正异常判断,所提出方法的有效性将通过三个试验来证明。
如图1所示,一种风力发电机的异常识别方法,包括如下步骤:
步骤1:从风场SCADA***采集多组包含多种风机属性的风机数据,构成初始风机数据集;具体实施时,每30秒采集一组风数据;
步骤2:删除初始风机数据集中的异常数据,以获得完整风机数据集,所述异常数据包括:某组大量缺失风机属性的风机数据;风机数据中某种每日、每月或每年都恒定不变的风机属性;处理后风机属性个数为n;
图2a为采样点数据值大量缺失的异常数据示意图,即某组大量缺失风机属性的风机数据,其中缺失点为第0-505个采样点;图2b为本发明实施方式的采集到的风机属性值恒定不变的示意图,即风机数据中某种每日、每月或每年都恒定不变的风机属性恒定不变的示意图。
步骤3:采用小波阈值法对完整风机数据集进行降噪处理,从而抑制信号中的无用部分,增强信号中有用的部分,所述小波为db5,分解层数为5;
步骤4:采用k-means的聚类方法将风机属性分为K类,聚类后使得类内属性相似,类间属性相离;具体实施时,本实施方式中将风机属性分为7类。所述步骤4具体包括:
步骤4-1:由于风机属性的量纲不同,不便于聚类,所以需要将风机数据集中的元素根据下式进行归一处理:
其中,Vi表示任意元素,max(A)代表该风机属性的元素最大值,min(A)代表该风机属性的元素最小值,V是该风机属性的任意元素归一后的值;
其中,SC表示轮廓系数,ai表示一个元素Xi与同一分类中所有其他元素之间的平均距离,ai用于量化内部集中度;bi用于量化集群之间的分离度,在上述元素Xi之外选择一个分类b,计算该元素Xi和分类b中所有元素之间的平均距离bi,遍历所有其他分类,找到最近的平均距离bi,SC在-1到+1之间,值越大表示聚类效果越好,选取轮廓系数最大时对应的聚类数K。
步骤5:采用t-SNE算法对聚类处理后的风机数据集进行降维处理,将每类属性分别降成3维,用固定的低维属性代替类内相似度较高的属性更具代表力和说服性。所述步骤5具体包括:
步骤5-1:将聚类后的风机数据集按数据采集日分成为多个风机样本矩阵,对风机样本矩阵的数据进行归一化处理,变换为均值为0、方差为1的标准样本矩阵X={x1,x2,…xn};
步骤5-2:定义标准样本矩阵X={x1,x2,…xn}中两属性间的条件相似性表达式如下:
其中,σi为常数,代表了以xi为中心点的高斯分布的方差,因数据点不同而不同;xi,xj,xk表示标准样本矩阵中3个属性,根据下式计算两属性的相似度:
步骤5-3:根据经验设置困惑度Perp、迭代次数T、学习速率η、动量α(t),随机设置降维后的风机数据集为Y={y1,y2,…,yn},根据下式计算降维后的风机数据集中两属性间的相似度:
在给定Perp的情况下使用二分搜索的方式并根据下式寻找合适的σ,梯度公式如下:
其中,C代表损失函数,不断调整Perp、迭代次数T,直到找出上式最趋近于0时对应的Perp和T的值;
根据上式计算得到降维后的风机数据集;
步骤5-4:K-means聚类后将风机属性划分为7类,t-SNE算法降维后将每类降低成3维,降维后的风机数据集是Y=K×3维,即可作为卷积神经网络的有效行输入。
步骤6:对降维后的7类风机属性进行皮尔森相关系数分析,将这7类属性按照皮尔森相关系数大小进行排列,组成具有相关性的连贯的图像。所述步骤6具体包括:
步骤6-1:对排序后的K组数据进行皮尔森相关系数计算,皮尔森相关系数公式如下:
其中cov(M,N)代表从风机数据集Y中的K个类别中取出不同的类别M和类别N进行协方差系数计算,σM代表类别M的标准差,σN代表类别N的标准差。
步骤6-2:将计算完成的皮尔森相关系数按照大小进行两两比较排序,组合成具有连贯性的图像。具体实施时,将风机数据集按照类别带入皮尔森相关系数公式中,得出7类数据间的相关系数表,根据关联系数的大小进行排序,把这7类数据进行排序,拼接成图像。
步骤7:将进行皮尔森相关系数分析后组成的图像送到卷积神经网络,并进行风机的异常识别,所述步骤7具体包括:
步骤7-1:引入归一化层,将卷积神经网络的输入标准化为相同的尺寸。
具体实施时,找到输入到归一化层的图像最大值和最小值及其对应位置;然后使用下采样方法将其归一化为所需大小;最后更换最大值和最小值;
步骤7-2:引入卷积层,通过卷积和非线性两个操作生成几个特征图来进行特征提取。
具体实施时,每个特征图是某些区域中输入风机属性图像的特定特征表示,卷积运算可以通过yj=∑ikij*xi表示。其中,*代表卷积操作;yj是输出的第j个特征图;kij是可训练的卷积核(也称过滤器);xi是第i个输入;
步骤7-3:引入池化层,通过池化操作减少特征图的大小。
具体实施时,首先将输入分成几个具有相同大小的非重叠矩形区域,最大池化操作得到矩形区域内的最大值;平均池化操作得到矩形区域内的平均值。
步骤7-4:在获得较高级别的特征表征之后,将其转换为1-D矢量并馈送到分类层。
步骤7-5:分类层采用S型功能函数作为激活函数,对风机有无异常进行判断,其中输出0代表风机异常,1代表风机正常。
步骤8:确定风机发生异常后,通过准则判定发生异常的风机属性所属的类别;所述步骤8具体包括:
步骤8-1:以天为单位计算降维后的健康状态的风机数据集中的3个属性的均值,分别记作a,b,c;
步骤8-2:改进经典公式推论:
进而推出:
步骤9:通过对风机属性异常的识别,验证该风力发电机异常识别方法的有效性。
图3为本发明实施方式的卷积神经网络的结构图,包括卷积层、池化层、卷积层、池化层和完全连接的分类层;
依据的卷积神经网络模型结构设置原则,本实验中X=21,每个输入图片在标准化层归一化为21×21的尺寸,这样每个输入图片代表风机10min内的属性特征,其他设置如表1所示。通过反复实验得到相对最优的模型具体学习细节如表2所示。
表1 提出的卷积神经网络的模型结构
表2 学习细节
其中,第二层卷积内核的数量3是通过多次实验优化性能进行选择的。以图3为例,如图所示的测试样本最终被正确分类,归一化的风机图像显示在最左边,之后从左到右依次是C1、S1、C2、S2。图4为本发明实施方式的每层的输出特征图。
下面通过不同类别的风机属性的发生异常的识别,来验证本发明的风力发电机的异常识别方法的有效性。
(1)通过对第一类属性(k=1)发生单项异常的识别,验证该风力发电机的异常识别方法的有效性;
训练样本为2万个大小为21×21的风机属性图片,其中包含多种异常,测试样本为100个大小为21×21的风机属性图片,其中只包含齿轮箱后轴承温度过热这一种异常。
基于CNN模型判断风机状态,为避免巧合性,随机选取测试样本,选取的测试样本在两种状态下交叉。进行的五组测试,其中正常样本为48,异常样本52。
用灰色标记的实际值即我们给定的标签,五组彩色的预测值是模型每组预测的结果,若输出大于等于0.5默认为1,输出小于0.5默认为0,以此准则判断风机状态。判断风机状态识别的准确性,结果如表3和图5所示。
表3 五组准确率的统计
表3记录了每一组测试的TA、FA、TH、FH值,图6为每组测试的准确率Q1、Q2、Q。五组测试对健康状态的风机正确识别率的平均值达到90.8%,并且每组都能达到85%及以上的准确率,对异常状态的风机识别准确率虽大部分略低于正常状态,并且每组都能达到83%及以上的准确率,综合准确率的平均值为90%。K=1时,δ1=-0.018;δ2=2.52×10-3,第一类属性的m值落在范围外,其余正常,风机第一类属性异常,经过多次试验得以验证。
(2)通过对第六类属性(k=6)发生多项异常的识别,验证该风力发电机的异常识别方法的有效性;
与第一类属性异常验证选取测试样本的原则相同,图7所示为进行的五组测试,并且正异常样本图片数量均为50。其中第一、二、四组异常程度较明显。表4为每一组测试TA、FA、TH、FH的数目统计,图8是准确率Q1、Q2、Q的统计对比图。
表4 五组准确率统计
五组测试对健康状态的风机正确识别率的平均值达到95.2%,并且每组都能达到84%及以上的准确率,对异常状态的风机正确识别率的平均值依然高达95.2%,但仍达到平均值为87.3%,并且每组都能达到84%及以上的准确率,综合准确率的平均值为95.4%,高于步骤7的90%。相比于步骤7,步骤8表明异常程度明显的情况下,该模型异常识别的准确率将会提升。K=6时,δ1=-0.028;δ2=1.12×10-3,第六类属性的m值落在范围外,其余正常,风机第六类属性异常,经过多次试验得以验证。
(3)通过对多类属性发生多项异常的识别,验证该风力发电机异常识别方法的有效性。
为避免样本只有某一类属性异常的单一性不足以说明异常识别的准确性,步骤9验证识别同时发生多类异常。图9的五组测试,每组测试的异常类型都不相同,并且都同时包含多种类别的异常。表5统计各组和整体的风机状态识别的准确率。
表5 组准确率统计
由表5可知,五组测试对健康状态的风机正确识别率的平均值达到95.6%,并且每组都能达到90%及以上的准确率,对异常状态的风机正确识别率的平均值高达96%,并且每组都能达到84%及以上的准确率,综合准确率的平均值为95.8%,结果表明,该方法对多类异常的识别仍持有较高的准确率,后三组测试因异常较明显,准确率极高。多类属性的m值异常。
表6为我们提出的方法与BPNN异常识别效果的比较,两个方法采用相同的数据进行测试,其中BPNN未经先聚类后类内降维的数据预处理过程,基于BPNN的异常识别结果如图10和表7所示。我们提出的方法与BPNN异常识别的效果比较如表7所示。
表6 组准确率统计
表7 各方法异常识别效果统计
结合三个案例,其一验证了我们提出的方法对风机异常识别的准确性;其二表明了异常程度越明显,异常识别准确率越高的特点。
以上所述仅为本发明的较佳实施例,并不用以限制本发明的思想,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.一种风力发电机的异常识别方法,其特征在于,包括以下步骤:
步骤1:从风场SCADA***采集多组包含多种风机属性的风机数据,构成初始风机数据集;
步骤2:删除初始风机数据集中的异常数据,以获得完整风机数据集,所述异常数据包括:某组大量缺失风机属性的风机数据;风机数据中某种每日、每月或每年都恒定不变的风机属性,处理后风机属性个数为n;
步骤3:采用小波阈值法对完整风机数据集进行降噪处理;
步骤4:采用k-means的聚类方法对降噪后的整个风机数据集中的风机属性分类,聚类后使得类内属性相似,类间属性相离;
步骤5:采用t-SNE算法对聚类处理后的风机数据集进行降维处理;
步骤6:将降维后的数据进行皮尔森相关系数的计算分析,把数据按照相关系数的大小进行排列,风机数据集组织为具有相同尺寸的图像,所述步骤6具体包括:
步骤6-1:对排序后的K组数据进行皮尔森相关系数计算;
其中cov(M,N)代表从风机数据集Y中的K个类别中取出不同的类别M和类别N进行协方差系数计算,σM代表类别M的标准差,σN代表类别N的标准差;
步骤6-2:将计算完成的皮尔森相关系数按照大小进行两两比较排序,组合成具有连贯性的图像;
步骤7:将进行皮尔森相关系数分析后组成的图像送到卷积神经网络,并进行风机的异常识别;
步骤8:确定风机发生异常后,通过准则判定发生异常的风机属性所属的类别,所述步骤8具体包括:
步骤8-1:以天为单位计算降维后的健康状态的风机数据集中的3个属性的均值,分别记作a,b,c;
步骤8-2:改进经典公式推论:
进而推出:
步骤9:通过对风机属性异常的识别,验证该风力发电机异常识别方法的有效性。
2.如权利要求1所述风力发电机的异常识别方法,其特征在于,步骤3中所述小波为db5,分解层数为5。
3.如权利要求1所述风力发电机的异常识别方法,其特征在于,所述步骤4具体包括:
步骤4-1:将风机数据集中的元素根据下式进行归一处理:
其中,Vi表示任意元素,max(A)代表该风机属性的元素最大值,min(A)代表该风机属性的元素最小值,V是该风机属性的任意元素归一后的值;
其中,SC表示轮廓系数,ai表示一个元素Xi与同一分类中所有其他元素之间的平均距离,ai用于量化内部集中度;bi用于量化集群之间的分离度,在上述元素Xi之外选择一个分类b,计算该元素Xi和分类b中所有元素之间的平均距离bi,遍历所有其他分类,找到最近的平均距离bi,SC在-1到+1之间,值越大表示聚类效果越好,选取轮廓系数最大时对应的聚类数K。
4.如权利要求1所述风力发电机的异常识别方法,其特征在于,所述步骤5具体包括:
步骤5-1:将聚类后的风机数据集按数据采集日分成为多个风机样本矩阵,对风机样本矩阵的数据进行归一化处理,变换为均值为0、方差为1的标准样本矩阵X={x1,x2,…xn};
步骤5-2:定义标准样本矩阵X={x1,x2,…xn}中两属性间的条件相似性表达式如下:
其中,σi为常数,代表了以xi为中心点的高斯分布的方差,因数据点不同而不同;xi,xj,xk表示标准样本矩阵中3个属性,根据下式计算两属性的相似度:
步骤5-3:根据经验设置困惑度Perp、迭代次数T、学习速率η、动量α(t),随机设置降维后的风机数据集为Y={y1,y2,…,yn},根据下式计算降维后的风机数据集中两属性间的相似度:
在给定Perp的情况下使用二分搜索的方式并根据下式寻找合适的σ,梯度公式如下:
其中,C代表损失函数,不断调整Perp、迭代次数T,直到找出上式最趋近于0时对应的Perp和T的值;
根据上式计算得到降维后的风机数据集;
步骤5-4:K-means聚类后将风机属性划分为K类,t-SNE算法降维后将每类降低成3维,降维后的风机数据集是Y=K×3维,即可作为卷积神经网络的有效行输入。
5.如权利要求1所述风力发电机的异常识别方法,其特征在于,所述步骤7具体包括:
步骤7-1:引入归一化层,将卷积神经网络的输入标准化为相同的尺寸;
步骤7-2:引入卷积层,通过卷积和非线性两个操作生成几个特征图来进行特征提取;
步骤7-3:引入池化层,通过池化操作减少特征图的大小;
步骤7-4:在获得较高级别的特征表征之后,将其转换为1-D矢量并馈送到分类层;
步骤7-5:分类层采用S型功能函数作为激活函数,对风机有无异常进行判断,其中输出0代表风机异常,1代表风机正常。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810675216.6A CN109086793B (zh) | 2018-06-27 | 2018-06-27 | 一种风力发电机的异常识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810675216.6A CN109086793B (zh) | 2018-06-27 | 2018-06-27 | 一种风力发电机的异常识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109086793A CN109086793A (zh) | 2018-12-25 |
CN109086793B true CN109086793B (zh) | 2021-11-16 |
Family
ID=64839830
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810675216.6A Expired - Fee Related CN109086793B (zh) | 2018-06-27 | 2018-06-27 | 一种风力发电机的异常识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109086793B (zh) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109409740B (zh) * | 2018-10-25 | 2021-08-10 | 江苏方天电力技术有限公司 | 一种基于皮尔森相关系数校核风力发电数据质量的方法 |
CN109978039B (zh) * | 2019-03-19 | 2020-10-16 | 南京邮电大学 | 一种基于不平衡数据集情况下的风机叶片结冰预测方法 |
CN110161408A (zh) * | 2019-05-31 | 2019-08-23 | 江铃汽车股份有限公司 | 积放链电机状态识别方法及*** |
CN110287233A (zh) * | 2019-06-18 | 2019-09-27 | 华北电力大学 | 一种基于深度学习神经网络的***异常预警方法 |
CN110262460B (zh) * | 2019-07-01 | 2020-07-03 | 浪潮集团有限公司 | 一种结合聚类思想进行特征提取的砼活塞故障预测方法 |
CN110610212A (zh) * | 2019-09-20 | 2019-12-24 | 云南电网有限责任公司电力科学研究院 | 一种配电网的变压器的故障分类方法和故障分类装置 |
CN110674864B (zh) * | 2019-09-20 | 2024-03-15 | 国网上海市电力公司 | 一种含同步相量量测装置的风电异常数据辨识方法 |
CN110751213B (zh) * | 2019-10-21 | 2022-09-20 | 东北电力大学 | 一种测风塔异常风速数据识别与补齐的方法 |
CN111796576B (zh) * | 2020-06-16 | 2023-03-31 | 北京工业大学 | 一种基于双核t分布随机近邻嵌入的过程监测可视化方法 |
CN112000831B (zh) * | 2020-08-13 | 2024-04-19 | 贵州电网有限责任公司 | 一种基于变电站图形转化的异常数据识别优化方法 |
CN112697268B (zh) * | 2020-12-04 | 2022-06-24 | 佳木斯电机股份有限公司 | 一种基于t-sne的电机异常检测集成算法 |
CN113723502B (zh) * | 2021-08-27 | 2024-07-05 | 西安热工研究院有限公司 | 一种基于电流波形的风力发电机组变频器网侧异常识别方法及*** |
CN115035988B (zh) * | 2022-08-15 | 2022-12-20 | 武汉明炀大数据科技有限公司 | 基于云计算的医学影像处理方法、***、设备及介质 |
CN116089843B (zh) * | 2023-04-10 | 2023-09-08 | 国网浙江省电力有限公司 | 一种基于数据聚类的新能源结算数据异常检测与预警方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104765964A (zh) * | 2015-04-15 | 2015-07-08 | 北京空间飞行器总体设计部 | 一种空间环境敏感参数筛选方法 |
CN105699080A (zh) * | 2015-12-18 | 2016-06-22 | 华北电力大学(保定) | 一种基于振动数据的风电机组轴承故障特征提取方法 |
CN105841961A (zh) * | 2016-03-29 | 2016-08-10 | 中国石油大学(华东) | 一种基于Morlet小波变换和卷积神经网络的轴承故障诊断方法 |
CN106014858A (zh) * | 2016-07-21 | 2016-10-12 | 浙江运达风电股份有限公司 | 一种风电机组对风误差自动校准方法及装置 |
CN106779200A (zh) * | 2016-12-07 | 2017-05-31 | 东北大学 | 基于在历史数据中进行相似搜索的风电机组状态预测方法 |
CN107132478A (zh) * | 2017-04-13 | 2017-09-05 | 南京师范大学 | 一种基于保偏光纤测量和神经网络分类的风力发电机故障诊断方法 |
CN107144569A (zh) * | 2017-04-27 | 2017-09-08 | 西安交通大学 | 基于选择性搜索分割的风机叶片表面缺陷诊断方法 |
CN107153842A (zh) * | 2017-04-27 | 2017-09-12 | 西安交通大学 | 基于边缘分割的风机叶片保护膜损伤检测方法 |
CN107301433A (zh) * | 2017-07-14 | 2017-10-27 | 南京华苏科技有限公司 | 基于聚类判别模型的网约车鉴别方法和*** |
CN107403194A (zh) * | 2017-07-26 | 2017-11-28 | 广州慧扬健康科技有限公司 | 基于t‑SNE的皮肤癌图像识别可视化模块 |
CN107560849A (zh) * | 2017-08-04 | 2018-01-09 | 华北电力大学 | 一种多通道深度卷积神经网络的风电机组轴承故障诊断方法 |
CN107704953A (zh) * | 2017-09-20 | 2018-02-16 | 河海大学 | Ewt分位数回归森林的短期风电功率概率密度预测方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105719002A (zh) * | 2016-01-18 | 2016-06-29 | 重庆大学 | 一种基于组合预测的风电机组状态参数异常辨识方法 |
CN107689059B (zh) * | 2017-06-30 | 2020-01-31 | 北京金风科创风电设备有限公司 | 风力发电机组变桨异常的识别方法及装置 |
CN107355342B (zh) * | 2017-06-30 | 2019-04-23 | 北京金风科创风电设备有限公司 | 风力发电机组变桨异常的识别方法及装置 |
-
2018
- 2018-06-27 CN CN201810675216.6A patent/CN109086793B/zh not_active Expired - Fee Related
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104765964A (zh) * | 2015-04-15 | 2015-07-08 | 北京空间飞行器总体设计部 | 一种空间环境敏感参数筛选方法 |
CN105699080A (zh) * | 2015-12-18 | 2016-06-22 | 华北电力大学(保定) | 一种基于振动数据的风电机组轴承故障特征提取方法 |
CN105841961A (zh) * | 2016-03-29 | 2016-08-10 | 中国石油大学(华东) | 一种基于Morlet小波变换和卷积神经网络的轴承故障诊断方法 |
CN106014858A (zh) * | 2016-07-21 | 2016-10-12 | 浙江运达风电股份有限公司 | 一种风电机组对风误差自动校准方法及装置 |
CN106779200A (zh) * | 2016-12-07 | 2017-05-31 | 东北大学 | 基于在历史数据中进行相似搜索的风电机组状态预测方法 |
CN107132478A (zh) * | 2017-04-13 | 2017-09-05 | 南京师范大学 | 一种基于保偏光纤测量和神经网络分类的风力发电机故障诊断方法 |
CN107144569A (zh) * | 2017-04-27 | 2017-09-08 | 西安交通大学 | 基于选择性搜索分割的风机叶片表面缺陷诊断方法 |
CN107153842A (zh) * | 2017-04-27 | 2017-09-12 | 西安交通大学 | 基于边缘分割的风机叶片保护膜损伤检测方法 |
CN107301433A (zh) * | 2017-07-14 | 2017-10-27 | 南京华苏科技有限公司 | 基于聚类判别模型的网约车鉴别方法和*** |
CN107403194A (zh) * | 2017-07-26 | 2017-11-28 | 广州慧扬健康科技有限公司 | 基于t‑SNE的皮肤癌图像识别可视化模块 |
CN107560849A (zh) * | 2017-08-04 | 2018-01-09 | 华北电力大学 | 一种多通道深度卷积神经网络的风电机组轴承故障诊断方法 |
CN107704953A (zh) * | 2017-09-20 | 2018-02-16 | 河海大学 | Ewt分位数回归森林的短期风电功率概率密度预测方法 |
Non-Patent Citations (1)
Title |
---|
基于风特征分析的风电机组异常数据识别算法;杨茂 等;《中国电机工程学报》;20170930;第37卷;第144-151页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109086793A (zh) | 2018-12-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109086793B (zh) | 一种风力发电机的异常识别方法 | |
CN110132598B (zh) | 旋转设备滚动轴承故障噪声诊断算法 | |
Liu et al. | Dislocated time series convolutional neural architecture: An intelligent fault diagnosis approach for electric machine | |
CN105738109B (zh) | 基于稀疏表示与集成学习的轴承故障分类诊断方法 | |
CN106843195B (zh) | 基于自适应集成半监督费舍尔判别的故障分类方法 | |
CN111444615B (zh) | 一种基于k近邻和iv曲线的光伏阵列故障诊断方法 | |
CN114067368B (zh) | 基于深度卷积特征的电网危害鸟种分类识别方法 | |
CN110795690A (zh) | 风电场运行异常数据检测方法 | |
CN112682273B (zh) | 基于代价敏感轻量级梯度提升机的风电机组故障检测方法 | |
CN112904810B (zh) | 基于有效特征选择的流程工业非线性过程监测方法 | |
CN111860775B (zh) | 基于cnn和rnn融合的船舶故障实时诊断方法 | |
CN111126820A (zh) | 反窃电方法及*** | |
CN108803555B (zh) | 一种基于性能监测数据的亚健康在线识别和诊断方法 | |
CN112504682A (zh) | 基于粒子群优化算法的底盘发动机故障诊断方法及*** | |
CN111259949A (zh) | 飞机环控***故障识别模型构建方法、模型及识别方法 | |
CN113240022A (zh) | 多尺度单分类卷积网络的风电齿轮箱故障检测方法 | |
CN112860183A (zh) | 基于高阶矩匹配的多源蒸馏-迁移机械故障智能诊断方法 | |
CN114067915A (zh) | 一种基于深度对抗变分自编码器的scRNA-seq数据降维方法 | |
CN116738204A (zh) | 基于生成对抗Transformer的电力负荷数据异常检测方法 | |
CN116735170A (zh) | 一种基于自注意力多尺度特征提取的智能故障诊断方法 | |
CN109902731B (zh) | 一种基于支持向量机的性能故障的检测方法及装置 | |
CN113673442A (zh) | 一种基于半监督单分类网络的变工况故障检测方法 | |
CN114330430A (zh) | 一种基于大数据特征分析的电梯故障判断方法及*** | |
CN114139614A (zh) | 一种基于典型相关分析特征提取的Fisher光伏组件热斑诊断方法和*** | |
CN116522993A (zh) | 一种基于对抗自编码网络的化工过程故障检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20211116 |
|
CF01 | Termination of patent right due to non-payment of annual fee |