CN107179503B - 基于随机森林的风电机组故障智能诊断预警的方法 - Google Patents

基于随机森林的风电机组故障智能诊断预警的方法 Download PDF

Info

Publication number
CN107179503B
CN107179503B CN201710266789.9A CN201710266789A CN107179503B CN 107179503 B CN107179503 B CN 107179503B CN 201710266789 A CN201710266789 A CN 201710266789A CN 107179503 B CN107179503 B CN 107179503B
Authority
CN
China
Prior art keywords
wind turbine
data
turbine generator
model
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710266789.9A
Other languages
English (en)
Other versions
CN107179503A (zh
Inventor
程宏亮
刘宏
白朝旭
饶思维
张会
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meritdata Technology Co ltd
Original Assignee
Meritdata Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meritdata Technology Co ltd filed Critical Meritdata Technology Co ltd
Priority to CN201710266789.9A priority Critical patent/CN107179503B/zh
Publication of CN107179503A publication Critical patent/CN107179503A/zh
Application granted granted Critical
Publication of CN107179503B publication Critical patent/CN107179503B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • G01R31/34Testing dynamo-electric machines
    • G01R31/343Testing dynamo-electric machines in operation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Wind Motors (AREA)

Abstract

本发明公开了一种基于随机森林的风电机组故障智能诊断预警的方法,包括:抽取风电机组状态的历史数据作为样本数据;对所述样本数据进行探索性分析及预处理;构建基于随机森林的风电机组故障智能诊断预警模型,根据模型结果进行分析并评价模型;利用分析评价后的模型对风电机组设备进行实时诊断,若诊断结果为不正常,该模型将发出告警信息。本发明采用随机森林算法,考虑指标整体的特征,这种方法不仅可以解决单个指标决定设备状态的问题,而且可以综合考虑众多指标之间隐藏知识相关性,对输出结果做出综合性的判断。

Description

基于随机森林的风电机组故障智能诊断预警的方法
技术领域
本发明涉及电力技术领域,更具体地说,是基于随机森林的风电机组故障智能诊断预警的方法。
背景技术
风力发电是世界上公认的最接近商业化的可再生能源技术之一。在当今强调保护环境、可持续发展的背景下,不消耗化石燃料、无环境污染的风力发电被认为是最清洁的能源利用形式。在过去的10年里,由于年平均增长率接近28%,风力发电已成为世界上增长最快的可再生能源。
随着风能的快速发展和大规模风电机组的投入运行,且由于大部分机组安装在偏远地区,负荷不稳定等因素,我国不少风电机组都出现了运行故障,直接影响了风力发电的安全性和经济性。为保持风电的长期稳定发展,增强它与传统能源的竞争力,必须不断提高风力发电效率,降低风电设备维护成本和运营成本,促使企业的经济利益最大化。
传统的故障诊断方法,虽然采用了一定的科学技术手段,但是维修人员技术的和经验占的因素比重比较大,对故障的定位基本都是先依靠维修人员的经验,然后在加以科学技术诊断方法进行准确定位,找到故障问题之所在,在一定程度上存在人为的主观错误和延长机组检修时间的缺点;
并且,由于风电场所处地区路途遥远,在加上自然环境比较恶劣,需要维护人员长期值守,随着风电场站数量增大,在一定程度上就会造成人员资本的浪费。
发明内容
本发明克服了传统的人工方法在故障诊断和监测上存在的寻找故障时间长、偏差大并且人员浪费的问题。为此,本发明提供了一种基于随机森林的风电机组故障智能诊断预警的方法。
为了实现上述目的,本发明提供如下技术方案:
基于随机森林的风电机组故障智能诊断预警的方法,包括:
抽取风电机组状态的历史数据作为样本数据;对所述样本数据进行探索性分析及预处理;
构建基于随机森林的风电机组故障智能诊断预警模型,根据模型结果进行分析并评价模型;
利用分析评价后的模型对风电机组设备进行实时诊断,若诊断结果为不正常,该模型将发出告警信息。
优选地,抽取风电机组状态的历史数据作为样本数据,包括:
通过对风电机组常见故障进行分析,构建风电机组故障指标体系;
从风电机组自动化***或设备后台控制***中抽取风电机组状态历史数据作为样本数据。
优选地,对所述样本数据进行探索性分析及预处理,包括:
对所述样本数据进行探索性分析,是指剔除老化设备、刚投产设备,初步审视风电机组正常与异常状态的特征情况;
对所述样本数据进行预处理,包括:数据清洗、缺失值处理、数据离散化、属性规约和数据变换。
优选地,构建基于随机森林的风电机组故障智能诊断预警模型,包括:
将预处理后的样本数据分成训练样本和测试样本,构建随机森林模型专家样本集;
利用样本集构建风电机组故障智能诊断预警模型。
优选地,分析并评价风电机组故障智能诊断预警模型,包括:
对模型在测试集上的预测结果进行分析诊断,
若预测全部正确,说明模型的诊断效果比较理想;
若诊断结果有误差,进一步优化模型。
优选地,利用训练好的模型对风电机组设备进行实时诊断,包括:
从风电机组自动化***或设备后台控制***中接入在线数据;
从在线数据中选择出风电机组故障指标体系中的属性作为输入属性;
对在线数据进行预处理,将预处理的在线数据接入分析评价后的模型,实时对设备数据进行监测诊断。
优选地,还包括收集风电机组更多的历史故障和正常数据,定期对模型进行训练,及时更新模型。
与现有技术相比,本发明的有益效果:
本发明是针对风电机组故障频有发生问题,构建了风电机组故障智能诊断预警模型,采用随机森林算法对风电机组历史数据进行训练学习,挖掘出影响风电机组故障发生的各因素的特征模式,确定出发生故障各指标的阈值,从而根据设备实时运行对风电机组进行在线故障诊断预警,有效的降低风电机组维修成本,提高风电机组的利用效率;
本发明采用随机森林算法,考虑指标整体的特征,这种方法不仅可以解决单个指标决定设备状态的问题,而且可以综合考虑众多指标之间隐藏知识相关性,对输出结果做出综合性的判断。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的基于随机森林的风电机组故障智能诊断预警的方法的流程图;
图2为本发明实时例提供的决策树的原理图;
图3为本发明实时例提供的随机森林的原理图;
图4为本发明实时例提供的基于随机森林的风电机组故障智能诊断预警的方法中构建基于随机森林的风电机组故障智能诊断预警模型的流程图;
图5为本发明实时例提供的随机森林的错判率与决策树棵数的关系图;
图6为本发明实时例提供的基于随机森林的风电机组故障智能诊断预警的方法中基于随机森林的风电机组故障智能诊断预警模型实现实时诊断的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:
基于随机森林的风电机组故障智能诊断预警的方法,包括:
构建风电机组故障指标体系,抽取风电机组状态历史数据作为样本数据;
对抽取的风电机组状态历史样本数据进行数据探索及预处理;
构建基于随机森林的风电机组故障智能诊断预警模型,根据模型结果进行分析并评价模型;
利用构建的基于随机森林的风电机组故障智能诊断预警模型实现实时诊断;
收集风电机组更多的历史故障和正常数据,定期对模型进行训练,及时更新模型。
优选的,所述构建风电机组故障指标体系,抽取风电机组状态历史数据作为样本数据,是指:
通过对风电机组常见故障进行分析,构建风电机组故障指标体系;
从风电机组自动化***、设备后台控制***中有选择的抽取部分风电机组状态历史数据。
优选的,所述对抽取的风电机组状态历史样本数据进行数据探索及预处理,包括:
对样本进行探索性分析,剔除老化设备、刚投产设备,初步审视风电机组正常与异常状态的特征情况;
对样本进行预处理,包括数据清洗、缺失值处理、数据离散化、属性规约和数据变换等。
优选的,所述构建基于随机森林的风电机组故障智能诊断预警模型,根据模型结果进行分析并评价模型,包括:
构建随机森林模型专家样本集;
构建风电机组故障智能诊断预警模型;
对模型结果进行分析及评价,根据分析及评价的结果进一步优化风电机组故障智能诊断预警模型。
优选的,所述利用构建的基于随机森林的风电机组故障智能诊断预警模型实现实时诊断,包括:
根据构建的风电机组故障智能诊断模型(训练完成后),将风电机组设备相关数据接入到模型中,实时对设备数据进行监测诊断,一旦发现诊断结果为“不正常”,就对风电机组发出告警信息。
优选的,所述收集风电机组更多的历史故障和正常数据,定期对模型进行训练,及时更新模型,包括:
收集风电机组更多的历史故障和正常数据,使得模型尽可能覆盖所有情况的特征,并且可以定期一个月对模型训练一次,及时更新模型,不断提高模型的准确性。
本发明公开了基于随机森林的风电机组故障智能诊断预警的方法,包括:针对风电机组故障频有发生问题,构建了风电机组故障智能诊断预警模型,采用随机森林算法对风电机组历史数据进行训练学习,挖掘出影响风电机组故障发生的各因素的特征模式,确定出发生故障各指标的阈值,从而根据设备实时运行对风电机组进行在线故障诊断预警,有效的降低风电机组维修成本,提高风电机组的利用效率。
由于构成风电机组运行状态异常的原因是多种多样的,以往的研究往往聚焦于单个指标的阈值范围来确定风电机组是否发出告警信息,这种方法存在一定的缺陷,本文对某些关键指标(往往直接决定设备状态)不做单独研究,而是采用随机森林算法,考虑指标整体的特征,这种方法不仅可以解决单个指标决定设备状态的问题,而且可以综合考虑众多指标之间隐藏知识相关性,对输出结果做出综合性的判断。
实施例2:
请参阅图1,其示出了本发明实施例提供的基于随机森林的风电机组故障智能诊断预警的方法的流程图,可以包括:
S101:构建风电机组故障指标体系,抽取风电机组状态数据作为样本数据。
通过对风电机组常见故障进行分析,选取13个属性(gear_temp,gear_raterotor_vol,…,motor_temp_sd,power_mean,is_running)作为输入属性,风电机组是否正常运行作为输出属性,构建风电机组故障指标体系;
从风电机组自动化***、设备后台控制***中有选择的抽取部分风电机组状态历史数据作为样本数据。需指出,本步骤中有选择的抽取部分风电机组状态历史数据是由于在设备后台控制***中有些需要的指标数据可能不完整,所以我们应尽量选择数据完整性比较高的数据作为样本数据。
S102:对抽取的风电机组状态历史样本数据进行数据探索及预处理。
对样本进行探索性分析,剔除老化设备、刚投产设备,初步审视风电机组正常与异常状态的特征情况;
对样本进行预处理,包括数据清洗、缺失值处理、数据离散化、属性规约和数据变换等。
S103:构建基于随机森林的风电机组故障智能诊断预警模型,根据模型结果进行分析并评价模型。
构建随机森林模型专家样本集;
构建风电机组故障智能诊断预警模型;
对模型结果进行分析及评价,根据分析及评价的结果进一步优化风电机组故障智能诊断预警模型。
S104:利用构建的基于随机森林的风电机组故障智能诊断预警模型实现实时诊断。
根据构建的风电机组故障智能诊断模型(训练完成后),将风电机组设备相关数据接入到模型中,实时对设备数据进行监测诊断,一旦发现诊断结果为“不正常”,就对风电机组发出告警信息。
S105:收集风电机组更多的历史故障和正常数据,定期对模型进行训练,及时更新模型。
收集风电机组更多的历史故障和正常数据,使得模型尽可能覆盖所有情况的特征,并且可以定期一个月对模型训练一次,及时更新模型,不断提高模型的准确性。
本实施例中,可选的,构建基于随机森林的风电机组故障智能诊断预警模型。如图6所示,包括:
首先构建随机森林模型专家样本集,包括:
S201:参数设置:随机森林算法选取500棵树,利用分层抽样把经过S102预处理的样本分成训练样本和测试样本占比为(0.8,0.2)。
对于S201中分层抽样,需要说明的是:
分层抽样是将科学分组法与抽样法结合起来,具体是将总体划分为若干个同质层,再在各层内随机抽样或机械抽样,分层抽样保证了所抽取的样本具有足够的代表性。
S202:利用可放回的随机抽样方式从S201的训练样本集中生成500个样本子集,每个样本子集的样本个数与S201的训练样本集的样本个数相同,理论上500个样本子集覆盖了原样本集中2/3的数据实例,未包含的数据称作袋外数据(Out-Of-Bag,OOB),袋外数据可以用来作为测试数据,随机森林算法中估计可以很好的评估该组合分类器的分类效果。
对于S202中对数据进行可放回的随机抽样后,理论上样本子集覆盖了原样本集中2/3的实例数据,需要说明的是:
假设对一个样本数目为N的样本集D进行有放回的随机采样,抽取N次,每个样本未被抽取的概率为(1-1/N)N,当N足够大时(1-1/N)N将收敛于1/e≈0.368,故我们认为样本子集覆盖了原样本2/3的实例数据。
然后构建风电机组故障智能诊断预警模型,包括:
S203:利用生成的500个自助样本集生长500棵决策树。这里在每棵树的各个节点上,分别从13个特征中随机的选出m(m<=13)个特征,在实际工程中通常取
Figure BDA0001276262040000071
每次从这随机选择的m个特征中按照一定的规则(信息增益)选择一个特征进行分支,直到这棵树充分生长,其间不做剪枝操作。
对于S203中所诉的信息熵与信息增益,需要说明的是:
信息熵:表示了信息的不确定性(混乱程度),熵越大,信息越混乱,越难预测,则该指标提供的信息量越小,该指标的权重越小,越不重要。对分类***来说,类别C是变量,它可能的取值是C1,C2,…,Cn,而每一个类别出现的概率是P(C1),P(C2),…,P(Cn),因此n就是类别的总数。此时分类***的熵就可以表示为:
Figure BDA0001276262040000072
信息增益是针对一个一个的特征而言的,就是看一个特征t,***有它和没它的时候信息量各是多少,两者的差值就是这个特征给***带来的信息量,即增益。***含有特征t的时候信息量就是上面的式子,它表示的是包含所有特征时***的信息量。
InfoGain=H(Y)-H(Y|X)
在分类***中,属性的选择以及决策树的***根据信息增益来进行选择,针对根节点以及子节点选择信息增益最大的属性变量,然后采用递归的方法构建整个决策树和随机森林。
S204:根据上述生成的500个决策树对测试样本集进行预测,综合每棵树的测试结果按照一定的投票机制确定最终结果。随机森林算法的很好的利用随机性(包括随机生成子样本集,随机选择子特征),最小化了各棵树之间的相关性,提高了整体的分类性能,同时,因为每棵树的生成时间非常短,并且森林可以实现并行化,随机森林的分类速度非常快。假设随机森林分类器{hi(x,θi,i=1,…,N)},分类结果的类标签就是由每个决策树hi(x,θi)和概率平均得到的,对于测试实例x,预测类标签cp,那么,
Figure BDA0001276262040000081
Figure BDA0001276262040000082
其中,argmaxc表示寻找具有最大评分的参量c,N表示随机森林中决策树的数目,I(*)表示性能函数,
Figure BDA0001276262040000084
表示决策树对C类别的分类结果,
Figure BDA0001276262040000085
表示决策树hi的叶子节点的数目,Wi表示随机森林中第i棵树的权重。
模型结果如下:
表1模型输出结果
Figure BDA0001276262040000083
从上表可以看出,针对风电机组是否正常运行,包外数据误差率OOB为2.7%,说明模型的整体分类效果非常理想。图5为随机森林OOB错判率和决策树棵数,从图5可以看出随机森林错判率随着决策树棵数的增加不断的减小,最终收敛为一个较小的定值。图5中的标号为1的虚线代表负样本误差率,标号为2的虚线代表正样本误差率,黑色实线代表总体误差率。
最后,对模型结果进行分析及评价,根据分析及评价的结果决定是否进一步优化风电机组故障智能诊断预警模型,包括:
S205:对模型在测试集上的预测结果进行分析诊断,模型诊断结果分析:
表2:测试数据诊断结果
Figure BDA0001276262040000091
通过对测试集的8条数据进行诊断分析,预测全部正确,说明模型的诊断效果比较理想,无需进一步优化风电机组故障智能诊断预警模型。如果模型的诊断效果不理想的情况下,可以通过调整决策树的个数、树的最大深度,信息度量方式以及特征选择方法等参数的设置来进一步优化模型。可以得知:根据测试结果,第1,4,6,8个风电机组正常运行,第2,3,5,7个风电机组发出预警信息,并且应该马上启动相应的预案措施,防止发生更大的安全事故及经济损失。
上述实施例中,可选的,利用构建的基于随机森林的风电机组故障智能诊断预警模型实现实时诊断。如图6所示,包括:
S301:从风电机组自动化***、设备后台控制***中接入在线数据。
S302:从在线数据中选择出风电机组故障指标体系中的13个属性(
gear_temp,gear_rate,rotor_vol,…,motor_temp_sd,power_mean,is_running)作为输入属性。
S303:对在线数据进行预处理,包括数据清洗、缺失值处理、数据离散化、属性规约和数据变换等。
S304:将预处理后的在线数据接入到模型中,实时对设备数据进行监测诊断,一旦发现诊断结果为“不正常”,就对风电机组发出告警信息,工作人员可以立刻针对各个参数采取相应的停机措施和备选方案。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (7)

1.基于随机森林的风电机组故障智能诊断预警的方法,其特征在于,包括:
抽取风电机组状态的历史数据作为样本数据;对所述样本数据进行探索性分析及预处理;
构建基于随机森林的风电机组故障智能诊断预警模型,根据模型结果进行分析并评价模型;
利用分析评价后的模型对风电机组设备进行实时诊断,若诊断结果为不正常,该模型将发出告警信息;
其中,对所述样本数据进行探索性分析,是指剔除老化设备、刚投产设备,初步审视风电机组正常与异常状态的特征情况;对所述样本数据进行预处理,包括:数据清洗、缺失值处理、数据离散化、属性规约和数据变换;
具体包括:
S101:构建风电机组故障指标体系,抽取风电机组状态数据作为样本数据;
通过对风电机组常见故障进行分析,选取以下13个属性gear_temp,gear_rate rotor_vol,…,motor_temp_sd,power_mean,is_running作为输入属性,风电机组是否正常运行作为输出属性,构建风电机组故障指标体系;
从风电机组自动化***、设备后台控制***中有选择的抽取部分风电机组状态历史数据作为样本数据;本步骤中有选择的抽取部分风电机组状态历史数据是由于在设备后台控制***中有些需要的指标数据可能不完整,因此尽量选择数据完整性比较高的数据作为样本数据;
S102:对抽取的风电机组状态历史样本数据进行数据探索及预处理;
对样本进行探索性分析,剔除老化设备、刚投产设备,初步审视风电机组正常与异常状态的特征情况;
对样本进行预处理,包括数据清洗、缺失值处理、数据离散化、属性规约和数据变换等;
S103:构建基于随机森林的风电机组故障智能诊断预警模型,根据模型结果进行分析并评价模型;
构建随机森林模型专家样本集;
构建风电机组故障智能诊断预警模型;
对模型结果进行分析及评价,根据分析及评价的结果进一步优化风电机组故障智能诊断预警模型;
S104:利用构建的基于随机森林的风电机组故障智能诊断预警模型实现实时诊断;
根据构建且训练完成后的风电机组故障智能诊断模型,将风电机组设备相关数据接入到模型中,实时对设备数据进行监测诊断,一旦发现诊断结果为“不正常”,就对风电机组发出告警信息;
S105:收集风电机组更多的历史故障和正常数据,定期对模型进行训练,及时更新模型;
收集风电机组更多的历史故障和正常数据,使得模型尽可能覆盖所有情况的特征,并且可以定期一个月对模型训练一次,及时更新模型,不断提高模型的准确性;
构建随机森林模型专家样本集,包括:
S201:参数设置:随机森林算法选取500棵树,利用分层抽样把经过S102预处理的样本分成训练样本和测试样本占比为(0.8,0.2);
对于S201中分层抽样,需要说明的是:
分层抽样是将科学分组法与抽样法结合起来,具体是将总体划分为若干个同质层,再在各层内随机抽样或机械抽样,分层抽样保证了所抽取的样本具有足够的代表性;
S202:利用可放回的随机抽样方式从S201的训练样本集中生成500个样本子集,每个样本子集的样本个数与S201的训练样本集的样本个数相同,理论上500个样本子集覆盖了原样本集中2/3的数据实例,未包含的数据称作袋外数据,如Out-Of-Bag,OOB,袋外数据可以用来作为测试数据,随机森林算法中估计可以很好的评估组合分类器的分类效果;
构建风电机组故障智能诊断预警模型,包括:
S203:利用生成的500个自助样本集生长500棵决策树;这里在每棵树的各个节点上,分别从13个特征中随机的选出m,m≤13个特征,在实际工程中通常取
Figure FDF0000008443060000021
每次从这随机选择的m个特征中按照一定的信息增益规则选择一个特征进行分支,直到这棵树充分生长,其间不做剪枝操作;
S204:根据上述生成的500个决策树对测试样本集进行预测,综合每棵树的测试结果按照一定的投票机制确定最终结果;
利用构建的基于随机森林的风电机组故障智能诊断预警模型实现实时诊断;包括:
S301:从风电机组自动化***、设备后台控制***中接入在线数据;
S302:从在线数据中选择出风电机组故障指标体系中的以下13个属性gear_temp,gear_rate,rotor_vol,…,motor_temp_sd,power_mean,
is_running作为输入属性;
S303:对在线数据进行预处理,包括数据清洗、缺失值处理、数据离散化、属性规约和数据变换等;
S304:将预处理后的在线数据接入到模型中,实时对设备数据进行监测诊断,一旦发现诊断结果为“不正常”,就对风电机组发出告警信息,工作人员可以立刻针对各个参数采取相应的停机措施和备选方案。
2.如权利要求1所述的基于随机森林的风电机组故障智能诊断预警的方法,其特征在于,抽取风电机组状态的历史数据作为样本数据,包括:
通过对风电机组常见故障进行分析,构建风电机组故障指标体系;
从风电机组自动化***或设备后台控制***中抽取风电机组状态历史数据作为样本数据。
3.如权利要求1所述的基于随机森林的风电机组故障智能诊断预警的方法,其特征在于,
对所述样本数据进行探索性分析及预处理,包括:
对所述样本数据进行探索性分析,是指剔除老化设备、刚投产设备,初步审视风电机组正常与异常状态的特征情况;
对所述样本数据进行预处理,包括:数据清洗、缺失值处理、数据离散化、属性规约和数据变换。
4.如权利要求1所述的基于随机森林的风电机组故障智能诊断预警的方法,其特征在于,构建基于随机森林的风电机组故障智能诊断预警模型,包括:
将预处理后的样本数据分成训练样本和测试样本,构建随机森林模型专家样本集;
利用样本集构建风电机组故障智能诊断预警模型。
5.如权利要求1所述的基于随机森林的风电机组故障智能诊断预警的方法,其特征在于,分析并评价风电机组故障智能诊断预警模型,包括:
对模型在测试集上的预测结果进行分析诊断,
若预测全部正确,说明模型的诊断效果比较理想;
若诊断结果有误差,进一步优化模型。
6.如权利要求1所述的基于随机森林的风电机组故障智能诊断预警的方法,其特征在于,利用训练好的模型对风电机组设备进行实时诊断,包括:
从风电机组自动化***或设备后台控制***中接入在线数据;
从在线数据中选择出风电机组故障指标体系中的属性作为输入属性;
对在线数据进行预处理,将预处理的在线数据接入分析评价后的模型,实时对设备数据进行监测诊断。
7.如权利要求1所述的基于随机森林的风电机组故障智能诊断预警的方法,其特征在于,还包括收集风电机组更多的历史故障和正常数据,定期对模型进行训练,及时更新模型。
CN201710266789.9A 2017-04-21 2017-04-21 基于随机森林的风电机组故障智能诊断预警的方法 Active CN107179503B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710266789.9A CN107179503B (zh) 2017-04-21 2017-04-21 基于随机森林的风电机组故障智能诊断预警的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710266789.9A CN107179503B (zh) 2017-04-21 2017-04-21 基于随机森林的风电机组故障智能诊断预警的方法

Publications (2)

Publication Number Publication Date
CN107179503A CN107179503A (zh) 2017-09-19
CN107179503B true CN107179503B (zh) 2020-07-07

Family

ID=59832129

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710266789.9A Active CN107179503B (zh) 2017-04-21 2017-04-21 基于随机森林的风电机组故障智能诊断预警的方法

Country Status (1)

Country Link
CN (1) CN107179503B (zh)

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107782442A (zh) * 2017-10-24 2018-03-09 华北电力大学(保定) 基于大数据和随机森林的变压器多特征参量选择方法
CN107967485B (zh) * 2017-11-16 2024-05-14 国网冀北电力有限公司电力科学研究院 用电计量设备故障分析方法及装置
CN109840666B (zh) * 2017-11-29 2020-12-18 中国电力科学研究院有限公司 一种预测未来风电机组发生故障的模型构建方法及***
CN108011367B (zh) * 2017-12-04 2020-12-18 贵州电网有限责任公司电力科学研究院 一种基于深度决策树算法的电力负荷特性挖掘方法
CN107958395B (zh) * 2017-12-13 2021-11-26 美林数据技术股份有限公司 一种电力***异常用户的识别方法
CN108020785A (zh) * 2017-12-14 2018-05-11 海安常州大学高新技术研发中心 一种基于微型主机的电机故障预测***及数据管理方法
CN110657072A (zh) * 2018-06-29 2020-01-07 中车株洲电力机车研究所有限公司 一种基于结构化知识库的风电故障检修方法及***
CN108535618A (zh) * 2018-07-11 2018-09-14 云南电网有限责任公司电力科学研究院 一种gis绝缘缺陷检测方法
CN109283378A (zh) * 2018-08-30 2019-01-29 番禺珠江钢管(珠海)有限公司 一种旋转电弧焊缝成形参数检测方法、***、装置和介质
CN109297689B (zh) * 2018-09-11 2020-11-06 中国水利水电科学研究院 一种引入权重因子的大型水力机械智能诊断方法
CN110968069B (zh) * 2018-09-28 2022-01-25 新疆金风科技股份有限公司 风力发电机组的故障预测方法、相应的装置及电子设备
CN109543210A (zh) * 2018-09-28 2019-03-29 国电电力宁夏新能源开发有限公司 一种基于机器学***台的风电机组故障预测***
CN109522599A (zh) * 2018-10-16 2019-03-26 国电南瑞科技股份有限公司 一种台风导致的输电线路突发故障预警方法
CN109544035A (zh) * 2018-12-12 2019-03-29 上海理工大学 基于随机森林的电力能效分析与评级方法
CN109800127A (zh) * 2019-01-03 2019-05-24 众安信息技术服务有限公司 一种基于机器学习的***故障诊断智能化运维方法及***
CN109855879B (zh) * 2019-01-26 2020-09-04 厦门华夏国际电力发展有限公司 一种汽轮机伺服机构故障在线检测预警方法及***
CN109887122A (zh) * 2019-02-19 2019-06-14 南京洛普股份有限公司 一种船闸机电故障远程智能诊断方法及***
CN111724184A (zh) * 2019-03-20 2020-09-29 北京嘀嘀无限科技发展有限公司 一种转化概率预测方法及装置
CN109936113B (zh) * 2019-03-29 2021-06-01 国网浙江省电力有限公司 一种基于随机森林算法的保护动作智能诊断方法及***
CN110007232B (zh) * 2019-05-23 2021-09-03 广东工业大学 一种鼠笼式异步电机运行效率的预测方法及相关装置
CN110188834A (zh) * 2019-06-04 2019-08-30 广东电网有限责任公司 一种电力通信网的故障诊断方法、装置及设备
CN110378427A (zh) * 2019-07-23 2019-10-25 上海电气风电集团有限公司 风电叶片的叶根螺栓的故障检测方法、***、设备及介质
CN111080466A (zh) * 2019-12-03 2020-04-28 广东工业大学 一种基于大数据的压延机压延质量预警***
CN111047215B (zh) * 2019-12-09 2023-06-23 中国兵器科学研究院 基于随机森林的现场可更换单元划分类别确定方法
CN111260201B (zh) * 2020-01-13 2023-04-28 北京科技大学 一种基于分层随机森林的变量重要性分析方法
CN111310786B (zh) * 2020-01-15 2023-07-25 青岛海信网络科技股份有限公司 基于随机森林分类器的交通检测器异常诊断方法及装置
CN111611146B (zh) * 2020-06-18 2023-05-16 南方电网科学研究院有限责任公司 一种微服务故障预测方法和装置
CN112398218A (zh) * 2020-09-28 2021-02-23 国网山东省电力公司冠县供电公司 一种电网安全稳定分析装置及方法
CN112308146A (zh) * 2020-11-02 2021-02-02 国网福建省电力有限公司 一种基于运行特征的配变故障识别方法
CN112446144A (zh) * 2020-11-17 2021-03-05 哈工大机器人(合肥)国际创新研究院 一种大型回转机组故障诊断方法及装置
CN112578794B (zh) * 2020-12-12 2023-09-01 云南昆船智能装备有限公司 基于机器学习的agv故障检测方法、存储介质及***
CN112561176A (zh) * 2020-12-21 2021-03-26 深圳供电局有限公司 一种电力计量装置在线运行状态的预警方法
CN112765878A (zh) * 2021-01-11 2021-05-07 龙源(北京)风电工程技术有限公司 风电机组发电机轴承异常智能诊断方法及装置
US11774324B2 (en) * 2021-03-12 2023-10-03 General Electric Renovables Espana, S.L. System and method for detecting actual slip in a coupling of a rotary shaft
CN113107785B (zh) * 2021-05-12 2022-05-31 浙江浙能技术研究院有限公司 一种风电机组功率性能异常的实时监测方法及装置
CN117642750A (zh) * 2021-08-11 2024-03-01 西门子股份公司 用于训练模型的方法和设备
CN113869578A (zh) * 2021-09-26 2021-12-31 合肥通用机械研究院有限公司 常减压装置电脱盐***脱后原油盐含量智能预测诊断方法
CN114483479B (zh) * 2021-12-23 2023-09-12 大唐可再生能源试验研究院有限公司 一种基于随机森林的风机高温降容状态评估方法
WO2023182944A1 (en) * 2022-03-25 2023-09-28 Nanyang Technological University Alternator monitoring systems and methods
CN115079626B (zh) * 2022-07-21 2022-11-22 东方电气风电股份有限公司 一种风力发电机组部件潜在运行风险的预警方法及***
CN116664096B (zh) * 2022-08-23 2024-02-13 国家电投集团科学技术研究院有限公司 基于联邦学习的风电螺栓数据处理方法和装置
CN117436569A (zh) * 2023-09-18 2024-01-23 华能核能技术研究院有限公司 基于随机森林的核电设备故障预测和智能标定方法及***

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104747368A (zh) * 2015-01-27 2015-07-01 风脉(武汉)可再生能源技术有限责任公司 一种风电机组功率优化的方法和***
CN105069476A (zh) * 2015-08-10 2015-11-18 国网宁夏电力公司 基于两阶段集成学习的风电异常数据识别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104747368A (zh) * 2015-01-27 2015-07-01 风脉(武汉)可再生能源技术有限责任公司 一种风电机组功率优化的方法和***
CN105069476A (zh) * 2015-08-10 2015-11-18 国网宁夏电力公司 基于两阶段集成学习的风电异常数据识别方法

Also Published As

Publication number Publication date
CN107179503A (zh) 2017-09-19

Similar Documents

Publication Publication Date Title
CN107179503B (zh) 基于随机森林的风电机组故障智能诊断预警的方法
Hsu et al. Wind turbine fault diagnosis and predictive maintenance through statistical process control and machine learning
Abdallah et al. Fault diagnosis of wind turbine structures using decision tree learning algorithms with big data
CN110929918B (zh) 一种基于CNN和LightGBM的10kV馈线故障预测方法
CN111582551B (zh) 风电场短期风速预测方法、***及电子设备
CN114723285B (zh) 一种电网设备安全性评估预测方法
CN110276372B (zh) 基于云平台的燃料电池发动机故障诊断方法
CN110362045B (zh) 一种考虑海洋气象因素的海上双馈风电机组故障判别方法
Bangalore et al. An approach for self evolving neural network based algorithm for fault prognosis in wind turbine
CN109492790A (zh) 基于神经网络与数据挖掘的风电机组健康管理方法
CN112115999A (zh) 一种时空多尺度神经网络的风电机组故障诊断方法
CN111931851A (zh) 一种基于一维残差神经网络的风机叶片结冰故障诊断方法
CN116842337A (zh) 基于LightGBM优选特征与COA-CNN模型的变压器故障诊断方法
Helsen et al. Wind farm operation and maintenance optimization using big data
CN103489041A (zh) 一种短期风电功率预测方法
CN117728587A (zh) 一种新能源发电设备运行数据的实时监控***及方法
CN114320773B (zh) 一种基于功率曲线分析与神经网络的风电机组故障预警方法
Shaaban et al. A decision tree approach for steam turbine-generator fault diagnosis
Zhenhao et al. Prediction of wind power ramp events based on deep neural network
CN114819248A (zh) 一种基于随机森林的风电发电量预测方法及设备
CN114021992B (zh) 一种面向大型风电机组实时出力性能的评估方法
Jankauskas et al. Short-term wind energy forecasting with advanced recurrent neural network models: a comparative study
CN112465404B (zh) 用于多时间窗口的光伏发电***运行状态评估方法及***
Chen et al. A Multivariate Time Series Anomaly Detection Method Based on Generative Model
CN117972535B (zh) 风电机组关键部件故障预警方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 710075 6th floor, national e-commerce demonstration base, No.528, tianguba Road, software new town, high tech Zone, Xi'an City, Shaanxi Province

Patentee after: MERITDATA TECHNOLOGY CO.,LTD.

Address before: 710000 C501, Hanyun Pavilion, Xi'an Software Park, No.68, Keji 2nd Road, high tech Zone, Xi'an City, Shaanxi Province

Patentee before: MERITDATA TECHNOLOGY CO.,LTD.