CN115450864A - 一种基于合成少数类样本的风电机组叶片结冰诊断方法 - Google Patents

一种基于合成少数类样本的风电机组叶片结冰诊断方法 Download PDF

Info

Publication number
CN115450864A
CN115450864A CN202211341472.4A CN202211341472A CN115450864A CN 115450864 A CN115450864 A CN 115450864A CN 202211341472 A CN202211341472 A CN 202211341472A CN 115450864 A CN115450864 A CN 115450864A
Authority
CN
China
Prior art keywords
icing
wind turbine
samples
minority
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211341472.4A
Other languages
English (en)
Inventor
刘永前
陶丞
陶涛
韩爽
李莉
阎洁
孟航
闫亚敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North China Electric Power University
Original Assignee
North China Electric Power University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North China Electric Power University filed Critical North China Electric Power University
Priority to CN202211341472.4A priority Critical patent/CN115450864A/zh
Publication of CN115450864A publication Critical patent/CN115450864A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F03MACHINES OR ENGINES FOR LIQUIDS; WIND, SPRING, OR WEIGHT MOTORS; PRODUCING MECHANICAL POWER OR A REACTIVE PROPULSIVE THRUST, NOT OTHERWISE PROVIDED FOR
    • F03DWIND MOTORS
    • F03D80/00Details, components or accessories not provided for in groups F03D1/00 - F03D17/00
    • F03D80/40Ice detection; De-icing means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E10/00Energy generation through renewable energy sources
    • Y02E10/70Wind energy
    • Y02E10/72Wind turbines with rotation axis in wind direction

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Combustion & Propulsion (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Chemical & Material Sciences (AREA)
  • Medical Informatics (AREA)
  • Mechanical Engineering (AREA)
  • Sustainable Energy (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • General Physics & Mathematics (AREA)
  • Sustainable Development (AREA)
  • Wind Motors (AREA)

Abstract

本发明公开了属于风电机组状态预警及故障诊断技术领域的一种基于合成少数类样本的风电机组叶片结冰诊断方法。该方法包括步骤1:监测并记录风电机组的结冰状态,给相应的SCADA数据增加结冰标签,将瞬时特征、原始SCADA数据提取的特征及时序特征结合成最终特征;步骤2:拟合理论功率曲线,采用KBS2合成少数类样本过采样方法形成新的数据集;步骤3:对训练集进行多次迭代,并得出测试集的准确率指标;步骤4:离线训练、在线部署及应用风电机组叶片结冰状态预测模型。本发明能够解决风电机组叶片结冰特征提取及结冰数据占比过低的问题,为风电机组运行维护、状态预警及故障预测研究提供可靠的方法基础。

Description

一种基于合成少数类样本的风电机组叶片结冰诊断方法
技术领域
本发明涉及风电机组状态预警及故障诊断技术领域,尤其涉及一种基于合成少数类样本的风电机组叶片结冰诊断方法。
背景技术
风能是一种对环境无污染,来源广泛的可再生能源,是最具发展前景的可再生能源之一。大力发展风力发电有助于解决能源短缺、气候恶化等问题。风电机组叶片作为吸收、转换风能的重要部件,对风电机组的实际功率输出起到至关重要的作用。然而,风电场一般都处在高纬度地区,虽然高纬度地区风资源丰富,但是温度低、湿度大,导致风电机组叶片在冬季常常发生结冰现象。这大大降低风电机组对风能的利用效率和出力情况,重则导致叶片失控、断裂,存在着严重的安全隐患。现有对风电机组叶片结冰状态进行诊断的技术尚存在一些问题,尤其在处理风电机组叶片结冰类不平衡数据时,通常采用合成少数类样本过采样方法来平衡样本数据比例,但该方法拟合的数据存在噪声,影响模型对叶片结冰状态进行准确识别。因此,风电场亟需准确诊断机组叶片的状态。
发明内容
本发明的目的是提出一种基于合成少数类样本的风电机组叶片结冰诊断方法,其特征在于,所述方法包括:
步骤1:监测并记录风电机组的结冰状态,给相应的SCADA数据增加结冰标签,将叶片结冰的瞬时特征、原始SCADA数据提取的特征及叶片结冰时序特征三者结合成最终特征;
步骤2:采用四分位法和bin方法拟合理论功率曲线,基于最终特征构建新的数据,采用KBS2(BorderlineSMOTE-KNN-BorderlineSMOTE)合成少数类样本过采样方法形成新的数据集;
步骤3:将步骤2形成的新的数据集80%划分为训练集、20%划分为测试集,利用机器学习方法对训练集进行多次迭代以训练风电机组叶片结冰状态预测模型,并得出测试集的准确率指标;
步骤4:离线训练风电机组叶片结冰状态预测模型,在线部署及应用风电机组叶片结冰状态预测模型。
所述步骤1具体包括如下子步骤:
步骤11:选取n台处于结冰期间运行状态良好的风电机组的SCADA数据;
步骤12:记录观测期间风电机组的结冰时段及正常时段;
步骤13:对监测期间的SCADA数据增加结冰状态标签;
步骤14:构建叶片结冰瞬时特征;
步骤15:采用递归特征消除方法,提取出与叶片结冰相关性大的特征,包括发电机转速、环境温度、机舱温度、偏航角度、偏航位置、变桨电机温度;
步骤16:设定滑动窗口长度为h,宽度为j,滑动步长为d,采用滑动窗口方法计算连续时间段内步骤14和步骤15提取的每个特征的标准差,得到时序特征;
步骤17:将步骤14与步骤15提取的特征合并作为短时特征,将短时特征与时序特征相结合得到最终特征。
所述步骤14中的叶片结冰瞬时特征包括:
理论功率Ppred
Ppred=f(Preal) (1)
式(1)中,Preal为实际功率,f为拟合的多项式函数,Ppred为根据拟合的多项式函数得到的理论功率;
风速的平方V2
Figure BDA0003909599170000021
式(2)中,Vin为风速;
风速的三次方V3
Figure BDA0003909599170000022
叶尖速比λ:
Figure BDA0003909599170000031
式(4)中,ω为风电机组叶片旋转角速度,R为叶片半径;
结冰严重程度ξ:
Figure BDA0003909599170000032
所述短时特征包括风速、风速的平方、风速的三次方、网侧有功功率、理论功率、叶尖速比、结冰严重程度、发电机转速、环境温度、机舱温度、偏航角度、偏航位置、变桨电机温度;
时序特征包括风速的标准差、风速的平方的标准差、风速的三次方的标准差、网侧有功功率的标准差、理论功率的标准差、叶尖速比的标准差、结冰严重程度的标准差、发电机转速的标准差、环境温度的标准差、机舱温度的标准差、偏航角度的标准差、偏航位置的标准差、变桨电机温度的标准差。
所述步骤2具体包括如下子步骤:
步骤21:将风速分为等间隔的n个区间,采用四分位法进行数据清洗,剔除风速和功率的异常值;
步骤22:采用bin方法,计算n个区间内所有数据点风速和功率的平均值;
步骤23:根据每个区间内风速和功率的平均值拟合功率曲线及多项式函数,将实际功率代入该多项式函数中得到理论功率;
步骤24:根据步骤17得到的最终特征,形成新的数据集;
步骤25:将新的数据集的数据按公式(6)进行最大最小归一化,
Figure BDA0003909599170000033
式(6)中:xi为每个特征对应的数据,xmin为每个特征的最小值,xmax为每个特征的最大值;
步骤26:对步骤25归一化后的数据集分为包含特征的数据x和结冰标签数据y;
步骤27:对步骤26数据中的少数类样本按公式(7)计算与其最近的b个点的欧氏距离;
Figure BDA0003909599170000041
式(7)中:d表示样本x'(x1,y1)与样本x”(x2,y2)在二维空间的欧氏距离;
根据计算得到的欧氏距离d,确定与少数类样本最近的b个点中多数类样本与少数类样本的数量;
对危险少数类样本利用公式(7)计算该样本附近的c个点,随机选取其中的一个点,利用公式(8)合成一个新的少数类样本,直至数据集结冰样本与正常样本数量平衡;
xnew=x+rand(0,1)*(xneighbor-x) (8)
式(8)中:xnew为合成的新的少数类样本,x为危险少数类样本,rand(0,1)为0~1间的随机数,xneighbor为被选中的x的一个近邻样本;
步骤28:对危险少数类样本重采样过后的数据集代入KNN模型中进行反复训练,将KNN模型诊断为不结冰但实际为结冰的数据样本删除;
步骤29:对经步骤28得到的数据集重复步骤27的过程,直至数据集中结冰样本与正常样本数量平衡。
所述步骤28中的少数类样本分为以下类别:
若b个点中,少数类样本数量大于或等于多数类样本数量,则少数类样本属于安全少数类样本;
若b个点中,少数类样本数量小于多数类样本数量且少数类样本不为零,则少数类样本属于危险少数类样本;
若b个点中,少数类样本数量为零,则少数类样本属于噪声少数类样本。
所述步骤3中测试集的准确率指标为:
Figure BDA0003909599170000042
式(9)中,TN为模型将实际结冰数据预测为结冰状态的总次数;FN为模型将实际不结冰数据预测为结冰状态的总次数。
所述步骤4具体包括如下子步骤:
步骤41:设定时间分辨率m分钟,当更新的SCADA数据持续时间超过m分钟时,将更新数据加入到历史数据中,形成新的风电机组数据集;
步骤42:对更新的SCADA数据重复步骤2的操作,形成用于训练的新的数据集;
步骤43:对经步骤42得到的新的数据集进行步骤3的操作;
步骤44:根据步骤43得到训练的模型预测叶片结冰状态,并根据预测的叶片结冰状态发布预警。
本发明的有益效果在于:
本发明提供的方法提高了模型对结冰数据的学习能力,能够解决风电机组叶片结冰特征提取及结冰数据占比过低的问题,进而实现对风电机组叶片的结冰状态进行准确的结冰预测,为风电机组运行维护、状态预警及故障预测研究提供可靠的方法基础。
附图说明
图1为基于合成少数类样本的风电机组叶片结冰诊断方法的流程图;
图2为基于混合特征和KBS2合成少数类样本过采样方法的流程图;
图3为拟合理论功率曲线随时间变化关系图;
图4为不同算法采用不同合成少数类样本方法诊断准确率对比关系图。
具体实施方式
本发明提出一种基于合成少数类样本的风电机组叶片结冰诊断方法,下面结合附图和具体实施例对本发明做进一步说明。
图1为基于合成少数类样本的风电机组叶片结冰诊断方法的流程图,具体如下:
步骤1:监测并记录风电机组的结冰状态,给相应的SCADA数据增加结冰标签,将构建叶片结冰的瞬时特征、采用递归特征消除方法对原始SCADA数据提取的特征及采用滑动窗口方法构造的叶片结冰时序特征三者结合成最终特征,具体步骤如下:
步骤11:选取1台处于结冰期间运行状态良好的风电机组的SCADA数据;数据来源为2017届中国工业大数据创新竞赛,网址为http://www.industrial-bigdata.com;
步骤12:记录观测期间风电机组的结冰时段及正常时段;
步骤13:对监测期间的SCADA数据增加结冰状态标签,结冰状态标签如下表1所示:
表1
Figure BDA0003909599170000061
步骤14:构建叶片结冰瞬时特征,新构建的瞬时特征及公式如下所示:
理论功率Ppred
Ppred=f(Preal) (1)
式(1)中:Preal为实际功率,f为拟合的多项式函数,Ppred为根据拟合的多项式函数得到的理论功率。
风速平方V2
Figure BDA0003909599170000062
式(2)中:Vin为风速。
风速三次方V3
Figure BDA0003909599170000063
叶尖速比λ:
Figure BDA0003909599170000064
式(4)中:ω为风电机组叶片旋转角速度,R为叶片半径。
结冰严重程度ξ:
Figure BDA0003909599170000065
经叶片结冰瞬时特征提取的特征包括:风速、风速平方、风速三次方、网侧有功功率、理论功率、叶尖速比、结冰严重程度;
步骤15:采用递归特征消除方法,提取出与叶片结冰相关性较大的特征,包括:发电机转速、环境温度、机舱温度、偏航角度、偏航位置、变桨电机1温度、变桨电机2温度、变桨电机3温度风速;
步骤16:采用滑动窗口方法,对步骤14和步骤15提取出来的特征变量,计算连续时间段内每个特征变量的标准差,得到时序特征,设定滑动窗口长度为6,宽度为1;滑动步长为6;
步骤17:将步骤14通过挖掘叶片结冰过程提取的特征与通过步骤15人工智能方法提取的特征合并作为短时特征,短时特征包括:风速、风速平方、风速三次方、网侧有功功率、理论功率、叶尖速比、结冰严重程度、发电机转速、环境温度、机舱温度、偏航角度、偏航位置、变桨电机1温度、变桨电机2温度、变桨电机3温度风速;将该短时特征通过步骤16得到的特征作为时序特征,时序特征包括:1小时内风速的标准差、1小时内风速平方的标准差、1小时内风速三次方的标准差、1小时内网侧有功功率的标准差、1小时内理论功率的标准差、1小时内叶尖速比的标准差、1小时内结冰严重程度的标准差、1小时内发电机转速的标准差、1小时内环境温度的标准差、1小时内机舱温度的标准差、1小时内偏航角度的标准差、1小时内偏航位置的标准差、1小时内变桨电机1温度的标准差、1小时内变桨电机2温度的标准差、1小时内变桨电机3温度的标准差;将从风电机组原始SCADA数据中提取、构造的短时特征与时序特征相结合,得到最终特征;
步骤2:采用四分位法和bin方法拟合理论功率曲线,基于步骤17得到的最终特征,构建新的数据,采用KBS2合成少数类样本过采样方法形成新的数据集,图2为基于混合特征和KBS2合成少数类样本过采样方法的流程图,具体步骤如下:
步骤21:将风速分为等间隔的100个区间,采用四分位法进行数据清洗,剔除风速和功率的异常值;
步骤22:采用bin方法,计算100个区间内所有数据点风速和功率的平均值;
步骤23:根据每个区间内风速和功率的平均值拟合功率曲线及多项式函数,将风速代入该多项式函数中得到理论功率;图3为拟合理论功率曲线随时间变化关系图;
步骤24:根据步骤17得到的最终特征,形成新的数据集;
步骤25:将步骤24得到的新的SCADA数据中除结冰标签的数据进行最大最小归一化,最大最小归一化公式如下:
Figure BDA0003909599170000071
式(6)中:xi为每个特征变量对应的数据,xmin为每个特征变量的最小值,xmax为每个特征变量的最大值;
步骤26:将经步骤25归一化后的数据集分为x和y,x为包含特征变量的数据,y为结冰标签数据;
步骤27:对步骤26数据中的少数类样本计算与其最近的7个点的欧氏距离,公式如下:
Figure BDA0003909599170000072
式(7)中:d表示样本x'(x1,y1)与样本x”(x2,y2)在二维空间的欧氏距离;
根据计算得到的欧氏距离d,确定与少数类样本最近的7个点中多数类样本与少数类样本的数量,将少数类样本分为三个类别:
(1)若7个点中,少数类样本数量大于或等于多数类样本数量,则少数类样本属于安全少数类样本;
(2)若7个点中,少数类样本数量小于多数类样本数量且少数类样本不为零,则少数类样本属于危险少数类样本;
(3)若7个点中,少数类样本数量为零,则少数类样本属于噪声少数类样本;
对危险少数类样本利用公式(7)计算该样本附近的5个点,随机选取其中的一个点,利用公式(8)合成一个新的少数类样本,直至数据集结冰样本与正常样本数量平衡,公式(8)如下:
xnew=x+rand(0,1)*(xneighbor-x) (8)
式(8)中:xnew为合成的新的少数类样本,x为危险少数类样本,rand(0,1)为0~1间的随机数,xneighbor为被选中的x的一个近邻样本;
步骤28:对经步骤27对危险少数类样本重采样过后的数据集代入KNN模型中进行反复训练,将KNN模型诊断为不结冰但实际为结冰的数据样本删除;
步骤29:对经步骤28得到的数据集重复步骤27的过程,直至数据集中结冰样本与正常样本数量平衡;
步骤3:将数据集80%划分为训练集,20%划分为测试集,利用机器学习的方法对训练集进行多次迭代训练风电机组叶片结冰诊断模型,利用测试集对模型准确度进行评估,具体步骤如下:
步骤31:将经步骤2得到的数据集80%划分为训练集,20%划分为测试集;
步骤32:将经步骤31得到的训练集代入LSTM、GRU、BiLSTM模型,经过多次迭代训练风电机组叶片结冰诊断模型;
步骤33:将经步骤31得到的测试集代入训练好的风电机组叶片结冰诊断模型,得到测试集的准确率指标,公式如下:
Figure BDA0003909599170000081
式(9)中:TN为模型将实际结冰数据诊断为结冰状态的总次数;FN为模型将实际不结冰数据诊断为结冰状态的总次数;
步骤4:离线训练叶片结冰状态诊断模型,在线部署及应用叶片结冰状态诊断模型,具体步骤如下:
步骤41:设定时间分辨率10分钟,当更新的SCADA数据持续时间超过10分钟时,将更新数据加入到历史数据中,形成新的风电机组数据集;
步骤42:对新的SCADA数据重复步骤2所述操作,形成可用于训练的新的数据集;
步骤43:对经步骤42得到的新的数据集进行步骤3所述操作;
步骤44:根据步骤43得到训练的模型诊断叶片结冰状态,并根据模型诊断的叶片结冰状态发布预警;
步骤5:对比采用SMOTE合成少数类样本过采样方法、采用BorderlineSMOTE合成少数类样本过采样方法以及本文提出的KBS2合成少数类样本过采样方法对于不同机器学习模型诊断准确率的表现,图4为不同算法采用不同合成少数类样本方法诊断准确率对比关系图,对比结果如下表2所示:
表2
Figure BDA0003909599170000091
本发明首先基于风电机组叶片结冰物理过程和递归特征消除方法从原始SCADA数据提取、构建与叶片结冰相关性大的短时特征,采用滑动窗口方法构建与叶片结冰相关性大的时序特征,短时特征与时序特征相结合得到最终特征;针对结冰数据与正常数据比例过低的问题,提出一种KBS2合成少数类样本过采样方法增加结冰数据与正常数据比例;使用机器学习的方法进行模型的训练和诊断。本方法能够解决风电机组叶片结冰特征提取及结冰数据占比过低的问题,进而实现对风电机组叶片的结冰状态进行准确的结冰诊断,为风电机组运行维护、状态预警及故障诊断研究提供可靠的方法基础。

Claims (8)

1.一种基于合成少数类样本的风电机组叶片结冰诊断方法,其特征在于,所述方法包括:
步骤1:监测并记录风电机组的结冰状态,给相应的SCADA数据增加结冰标签,将叶片结冰的瞬时特征、原始SCADA数据提取的特征及叶片结冰时序特征三者结合成最终特征;
步骤2:采用四分位法和bin方法拟合理论功率曲线,基于最终特征构建新的数据,采用KBS2合成少数类样本过采样方法形成新的数据集;
步骤3:将步骤2形成的新的数据集80%划分为训练集、20%划分为测试集,利用机器学习方法对训练集进行多次迭代以训练风电机组叶片结冰状态预测模型,并得出测试集的准确率指标;
步骤4:离线训练风电机组叶片结冰状态预测模型,在线部署及应用风电机组叶片结冰状态预测模型。
2.根据权利要求1所述基于合成少数类样本的风电机组叶片结冰诊断方法,其特征在于,所述步骤1具体包括如下子步骤:
步骤11:选取n台处于结冰期间运行状态良好的风电机组的SCADA数据;
步骤12:记录观测期间风电机组的结冰时段及正常时段;
步骤13:对监测期间的SCADA数据增加结冰状态标签;
步骤14:构建叶片结冰瞬时特征;
步骤15:采用递归特征消除方法,提取出与叶片结冰相关性大的特征,包括发电机转速、环境温度、机舱温度、偏航角度、偏航位置、变桨电机温度;
步骤16:设定滑动窗口长度为h,宽度为j,滑动步长为d,采用滑动窗口方法计算连续时间段内步骤14和步骤15提取的每个特征的标准差,得到时序特征;
步骤17:将步骤14与步骤15提取的特征合并作为短时特征,将短时特征与时序特征相结合得到最终特征。
3.根据权利要求2所述基于合成少数类样本的风电机组叶片结冰诊断方法,其特征在于,所述步骤14中的叶片结冰瞬时特征包括:
理论功率Ppred
Ppred=f(Preal) (1)
式(1)中,Preal为实际功率,f为拟合的多项式函数,Ppred为根据拟合的多项式函数得到的理论功率;
风速的平方V2
Figure FDA0003909599160000021
式(2)中,Vin为风速;
风速的三次方V3
Figure FDA0003909599160000022
叶尖速比λ:
Figure FDA0003909599160000023
式(4)中,ω为风电机组叶片旋转角速度,R为叶片半径;
结冰严重程度ξ:
Figure FDA0003909599160000024
4.根据权利要求2所述基于合成少数类样本的风电机组叶片结冰诊断方法,其特征在于,所述短时特征包括风速、风速的平方、风速的三次方、网侧有功功率、理论功率、叶尖速比、结冰严重程度、发电机转速、环境温度、机舱温度、偏航角度、偏航位置、变桨电机温度;
时序特征包括风速的标准差、风速的平方的标准差、风速的三次方的标准差、网侧有功功率的标准差、理论功率的标准差、叶尖速比的标准差、结冰严重程度的标准差、发电机转速的标准差、环境温度的标准差、机舱温度的标准差、偏航角度的标准差、偏航位置的标准差、变桨电机温度的标准差。
5.根据权利要求1或2所述基于合成少数类样本的风电机组叶片结冰诊断方法,其特征在于,所述步骤2具体包括如下子步骤:
步骤21:将风速分为等间隔的n个区间,采用四分位法进行数据清洗,剔除风速和功率的异常值;
步骤22:采用bin方法,计算n个区间内所有数据点风速和功率的平均值;
步骤23:根据每个区间内风速和功率的平均值拟合功率曲线及多项式函数,将实际功率代入该多项式函数中得到理论功率;
步骤24:根据步骤17得到的最终特征,形成新的数据集;
步骤25:将新的数据集的数据按公式(6)进行最大最小归一化,
Figure FDA0003909599160000031
式(6)中:xi为每个特征对应的数据,xmin为每个特征的最小值,xmax为每个特征的最大值;
步骤26:对步骤25归一化后的数据集分为包含特征的数据x和结冰标签数据y;
步骤27:对步骤26数据中的少数类样本按公式(7)计算与其最近的b个点的欧氏距离;
Figure FDA0003909599160000032
式(7)中:d表示样本x'(x1,y1)与样本x”(x2,y2)在二维空间的欧氏距离;
根据计算得到的欧氏距离d,确定与少数类样本最近的b个点中多数类样本与少数类样本的数量;
对危险少数类样本利用公式(7)计算该样本附近的c个点,随机选取其中的一个点,利用公式(8)合成一个新的少数类样本,直至数据集结冰样本与正常样本数量平衡;
xnew=x+rand(0,1)*(xneighbor-x) (8)
式(8)中:xnew为合成的新的少数类样本,x为危险少数类样本,rand(0,1)为0~1间的随机数,xneighbor为被选中的x的一个近邻样本;
步骤28:对危险少数类样本重采样过后的数据集代入KNN模型中进行反复训练,将KNN模型诊断为不结冰但实际为结冰的数据样本删除;
步骤29:对经步骤28得到的数据集重复步骤27的过程,直至数据集中结冰样本与正常样本数量平衡。
6.根据权利要求5所述基于合成少数类样本的风电机组叶片结冰诊断方法,其特征在于,所述步骤28中的少数类样本分为以下类别:
若b个点中,少数类样本数量大于或等于多数类样本数量,则少数类样本属于安全少数类样本;
若b个点中,少数类样本数量小于多数类样本数量且少数类样本不为零,则少数类样本属于危险少数类样本;
若b个点中,少数类样本数量为零,则少数类样本属于噪声少数类样本。
7.根据权利要求1所述基于合成少数类样本的风电机组叶片结冰诊断方法,其特征在于,所述步骤3中测试集的准确率指标为:
Figure FDA0003909599160000041
式(9)中,TN为模型将实际结冰数据预测为结冰状态的总次数;FN为模型将实际不结冰数据预测为结冰状态的总次数。
8.根据权利要求1所述基于合成少数类样本的风电机组叶片结冰诊断方法,其特征在于,所述步骤4具体包括如下子步骤:
步骤41:设定时间分辨率m分钟,当更新的SCADA数据持续时间超过m分钟时,将更新数据加入到历史数据中,形成新的风电机组数据集;
步骤42:对更新的SCADA数据重复步骤2的操作,形成用于训练的新的数据集;
步骤43:对经步骤42得到的新的数据集进行步骤3的操作;
步骤44:根据步骤43得到训练的模型预测叶片结冰状态,并根据预测的叶片结冰状态发布预警。
CN202211341472.4A 2022-10-26 2022-10-26 一种基于合成少数类样本的风电机组叶片结冰诊断方法 Pending CN115450864A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211341472.4A CN115450864A (zh) 2022-10-26 2022-10-26 一种基于合成少数类样本的风电机组叶片结冰诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211341472.4A CN115450864A (zh) 2022-10-26 2022-10-26 一种基于合成少数类样本的风电机组叶片结冰诊断方法

Publications (1)

Publication Number Publication Date
CN115450864A true CN115450864A (zh) 2022-12-09

Family

ID=84310616

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211341472.4A Pending CN115450864A (zh) 2022-10-26 2022-10-26 一种基于合成少数类样本的风电机组叶片结冰诊断方法

Country Status (1)

Country Link
CN (1) CN115450864A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117892213A (zh) * 2024-03-18 2024-04-16 中国水利水电第十四工程局有限公司 一种风力发电机叶片覆冰侦测与预警的诊断方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117892213A (zh) * 2024-03-18 2024-04-16 中国水利水电第十四工程局有限公司 一种风力发电机叶片覆冰侦测与预警的诊断方法

Similar Documents

Publication Publication Date Title
CN107885959B (zh) 一种基于置信等效功率曲线带的风电建模及性能评估方法
Wang et al. SCADA data based condition monitoring of wind turbines
CN105134510A (zh) 一种风力发电机组变桨***的状态监测和故障诊断方法
EP2026160A1 (en) Event monitoring via combination of signals
CN110362045B (zh) 一种考虑海洋气象因素的海上双馈风电机组故障判别方法
CN110761958B (zh) 风力发电机组的叶片失速诊断方法及装置
CN112733283A (zh) 一种风电机组部件故障预测方法
CN111415070A (zh) 一种基于scada数据的风电机组齿轮箱油温过温故障预警方法
CN114215706B (zh) 一种风电机组叶片开裂故障预警方法和装置
CN112832960A (zh) 一种基于深度学习的风机叶片结冰检测方法和存储介质
CN112994101B (zh) 基于神经网络的风电场发电功率后评估及监测方法
CN115450864A (zh) 一种基于合成少数类样本的风电机组叶片结冰诊断方法
CN112431726A (zh) 一种风电机组齿轮箱轴承状态监测方法
CN109595130A (zh) 一种风机叶片结冰故障预测方法及***
CN117905638B (zh) 基于强化学习的风力发电机优化控制方法及***
CN111814848A (zh) 一种风电机组温度故障的自适应预警策略设计方法
Martinez et al. Predicting wind turbine blade erosion using machine learning
CN116771610A (zh) 一种调整风电机组变桨***故障评估值的方法
CN110273818B (zh) 一种基于轴变换粗细度分类的风机叶片结冰故障监测方法
CN110705581A (zh) 一种基于改进的隐马尔可夫模型的变桨轴承故障识别方法
CN111794921B (zh) 一种基于迁移成分分析的陆上风电机组叶片结冰诊断方法
CN112287621B (zh) 风电机组运行状态阈值曲线确定方法、评价方法及***
CN115111115A (zh) 用于操作发电资产的***和方法
CN114065618A (zh) 一种基于微分进化的参数模型拟合风机功率曲线的方法
CN114021992B (zh) 一种面向大型风电机组实时出力性能的评估方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination