CN110685868A - 一种基于改进梯度提升机的风电机组故障检测方法及装置 - Google Patents
一种基于改进梯度提升机的风电机组故障检测方法及装置 Download PDFInfo
- Publication number
- CN110685868A CN110685868A CN201911025957.0A CN201911025957A CN110685868A CN 110685868 A CN110685868 A CN 110685868A CN 201911025957 A CN201911025957 A CN 201911025957A CN 110685868 A CN110685868 A CN 110685868A
- Authority
- CN
- China
- Prior art keywords
- parameter
- fault detection
- hyper
- wind turbine
- algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 107
- 238000000034 method Methods 0.000 claims abstract description 101
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 90
- 238000005457 optimization Methods 0.000 claims abstract description 69
- 238000010219 correlation analysis Methods 0.000 claims abstract description 26
- 238000011156 evaluation Methods 0.000 claims description 56
- 238000012549 training Methods 0.000 claims description 19
- 238000012795 verification Methods 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 35
- 230000008569 process Effects 0.000 description 15
- 238000012423 maintenance Methods 0.000 description 7
- 238000004519 manufacturing process Methods 0.000 description 7
- 238000003745 diagnosis Methods 0.000 description 5
- 238000003066 decision tree Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000010248 power generation Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 244000141353 Prunus domestica Species 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002015 leaf growth Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000002945 steepest descent method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Images
Classifications
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F03—MACHINES OR ENGINES FOR LIQUIDS; WIND, SPRING, OR WEIGHT MOTORS; PRODUCING MECHANICAL POWER OR A REACTIVE PROPULSIVE THRUST, NOT OTHERWISE PROVIDED FOR
- F03D—WIND MOTORS
- F03D17/00—Monitoring or testing of wind motors, e.g. diagnostics
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F03—MACHINES OR ENGINES FOR LIQUIDS; WIND, SPRING, OR WEIGHT MOTORS; PRODUCING MECHANICAL POWER OR A REACTIVE PROPULSIVE THRUST, NOT OTHERWISE PROVIDED FOR
- F03D—WIND MOTORS
- F03D7/00—Controlling wind motors
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E10/00—Energy generation through renewable energy sources
- Y02E10/70—Wind energy
- Y02E10/72—Wind turbines with rotation axis in wind direction
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P70/00—Climate change mitigation technologies in the production process for final industrial or consumer products
- Y02P70/50—Manufacturing or production processes characterised by the final manufactured product
Landscapes
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Sustainable Development (AREA)
- Sustainable Energy (AREA)
- Chemical & Material Sciences (AREA)
- Combustion & Propulsion (AREA)
- Mechanical Engineering (AREA)
- General Engineering & Computer Science (AREA)
- Wind Motors (AREA)
Abstract
本发明公开了一种基于改进梯度提升机的风电机组故障检测方法及装置,通过最大信息系数相关分析方法,选取目标状态特征,并且根据贝叶斯超参数寻优方法对梯度提升机进行了超参数优化,提升了复杂工况下的风电机组故障检测的效率及准确率,从而降低了风电机组的运维成本,提高了风场的生产效率。方法包括:获取风电机组的状态特征集,状态特征集包括至少一个状态特征;根据最大信息系数相关分析方法从状态特征集中选取目标状态特征;根据贝叶斯超参数寻优方法对梯度提升机算法的超参数进行优化,得到故障检测模型,超参数为对梯度提升机影响度达到预置值的算法参数;根据目标状态特征及故障检测模型,预测得到风电机组的故障检测结果。
Description
技术领域
本发明涉及风力发电领域,特别是涉及一种基于改进梯度提升机的风电机组故障检测方法及装置。
背景技术
风力发电技术作为新能源领域的一个重要方向,而风力资源丰富的地方往往位于偏远地区,外部环境恶劣易造成风电机组故障。风电机组齿轮箱的故障是导致停机时间最长、经济损失最大的原因,齿轮箱故障将直接影响设备的整体性能。因此,对风电机组齿轮箱部件进行故障检测、快速识别故障,对于减少风电机组的运维成本和提高整个风场的生产效率具有重要意义。
机器学习方法在风电机组故障诊断领域取得了广泛应用,机器学习方法不需要建立精确的数学模型,也不需要精深的专业知识,只需对数据进行分析与处理,建立故障诊断模型,利用数据模型实现故障诊断。梯度提升算法是经典的机器学习算法之一。梯度提升算法是一种将弱学习器集成为强学习器的算法,根据基学习器的表现,对训练样本进行调整,从而生成强学习器。提升算法多用于分类问题,通过提高错误样本所占的权重来调整算法,提升算法精度。由于提升算法需要预先知道弱分类器准确率识别的下限,实际故障诊断中应用受到限制。随着专家们对提升算法的研究不断深入,AdaBoost算法解决了提升算法的实际应用问题;GBDT算法有效解决了特征变换复杂性问题;XGBoost算法,采用并行处理,将树模型复杂度加入正则项,有效避免了过拟合。这些方法优化了提升算法模型。但是,由于传统梯度提升算法对异常值非常敏感,当数据样本是异常点时,会极大的干扰基分类器学习效果;传统提升算法训练效率不高,内存占用大;在实际的风电机组故障诊断过程中,由于存在较多的特征向量,传统的提升算法进行计算时,复杂度较大,不能处理海量大数据,进而影响计算效率和故障检测的实时性。
针对计算效率低和实时性差等问题,微软亚洲研究院提出了梯度提升机(LightGBM)算法。该算法通过叶子节点分割方法生成决策树,基于Histogram算法寻找特征分割点,支持并行学习,能高效地处理大数据,有效地解决计算效率低、实时性差等问题。
但是,LightGBM算法的缺点在于,需要对LightGBM模型中关键参数进行调参,才能获得理想的故障检测性能,而传统的优化算法又极易陷入局部最优和早熟收敛等问题。因此,对于复杂工况下的故障检测由于传统的优化算法优化LightGBM算法时,不能满足故障检测实时性问题,故障检测率不高,从而影响到了风电机组的运维成本和风场的生产效率。
发明内容
本发明的目的是提供一种基于改进梯度提升机的风电机组故障检测方法,通过最大信息系数相关分析方法,选取目标状态特征,并且根据贝叶斯超参数寻优方法对梯度提升机算法进行了超参数优化,得到故障检测模型,提升了复杂工况下的风电机组故障检测的效率及准确率,从而降低了风电机组的运维成本,提高了风场的生产效率。
本发明第一方面提供一种基于改进梯度提升机的风电机组故障检测方法,包括:
获取风电机组的状态特征集,状态特征集包括至少一个状态特征;
根据最大信息系数相关分析方法从状态特征集中选取目标状态特征;
根据贝叶斯超参数寻优方法对梯度提升机算法的超参数进行优化,得到故障检测模型,超参数为对梯度提升机影响度达到预置值的算法参数;
根据目标状态特征及故障检测模型,预测得到风电机组的故障检测结果。
进一步的,根据最大信息系数相关分析方法从状态特征集中选取目标状态特征,包括:
通过最大信息系数相关分析方法,计算状态特征与风电机组的故障的相关强度系数;
根据特征选取规则,选取处于预置系数区间范围内的相关强度系数所对应的状态特征,作为目标状态特征。
进一步的,根据贝叶斯超参数寻优方法对梯度提升机算法的超参数进行优化,得到故障检测模型,包括:
从梯度提升机算法中选择对梯度提升机影响度达到预置值的算法参数,作为超参数;
采用贝叶斯超参数寻优方法对超参数进行优化,得到最佳参数组合;
将最佳参数组合代入梯度提升机算法中,得到故障检测模型。
进一步的,采用贝叶斯超参数寻优方法对超参数进行优化,得到最佳参数组合,包括:
根据贝叶斯优化方法构建目标函数;
获取目标函数的历史评估结果,根据历史评估结果构建概率模型;
将超参数映射到目标函数在概率模型中的得分概率,采用树形结构Parzen估计方法得到最佳参数组合。
进一步的,最佳参数组合为两个以上时,方法还包括:
设置超参数的参数组合区间;
获取概率模型的训练数据集及验证数据集;
根据超参数、训练数据集及验证数据集,构建评价函数;
通过评价函数对所有的最佳参数组合对应的分类结果进行评价,得到评价结果;
根据评价结果从最佳参数组合中选取最优的最佳参数组合。
本发明的第二方面提供一种基于改进梯度提升机的风电机组故障检测装置,包括:
数据获取模块,用于获取风电机组的状态特征集,状态特征集包括至少一个状态特征;
特征选取模块,用于根据最大信息系数相关分析方法从状态特征集中选取目标状态特征;
故障检测模型参数优化模块,用于根据贝叶斯超参数寻优方法对梯度提升机算法的超参数进行优化,得到故障检测模型,超参数为对梯度提升机影响度达到预置值的算法参数;
故障预测模块,用于根据目标状态特征及故障检测模型,预测得到风电机组的故障检测结果。
进一步的,特征选取模块包括:
相关强度计算单元,用于通过最大信息系数相关分析方法,计算状态特征与风电机组的故障的相关强度系数;
故障检测模型参数选取单元,用于根据特征选取规则,选取处于预置系数区间范围内的相关强度系数所对应的状态特征,作为目标状态特征。
进一步的,故障检测模型参数优化模块包括:
超参数选取单元,具体用于从梯度提升机算法中选择对梯度提升机影响度达到预置值的算法参数,作为超参数;
超参数优化单元,还用于采用贝叶斯超参数寻优方法对超参数进行优化,得到最佳参数组合;
模型构建单元,还用于将最佳参数组合代入梯度提升机算法中,得到故障检测模型。
进一步的,
超参数优化单元,具体用于根据贝叶斯优化方法构建目标函数;
超参数优化单元,还用于获取目标函数的历史评估结果,根据历史评估结果构建概率模型;
超参数优化单元,还用于将超参数映射到目标函数在概率模型中的得分概率,采用树形结构Parzen估计方法得到最佳参数组合。
进一步的,最佳参数组合为两个以上时,模型构建模块还包括:
参数评估单元,用于设置超参数的参数组合区间;
参数评估单元,还用于获取概率模型的训练数据集及验证数据集;
参数评估单元,还用于根据超参数、训练数据集及验证数据集,构建评价函数;
参数评估单元,还用于通过评价函数对所有的最佳参数组合对应的分类结果进行评价,得到评价结果;
参数评估单元,还用于根据评价结果从最佳参数组合中选取最优的最佳参数组合。
由上可见,本发明中基于改进梯度提升机的风电机组故障检测方法及装置,获取风电机组的状态参数,根据最大信息系数相关分析方法从状态参数中选取目标状态特征,根据贝叶斯超参数寻优方法对梯度提升机算法的超参数进行优化,得到故障检测模型,超参数为对梯度提升机影响度达到预置值的算法参数,根据目标状态特征及故障检测模型,预测得到风电机组的故障检测结果。在本发明中通过最大信息系数相关分析方法,选取目标状态特征,从而删选掉了状态特征集中的部分状态特征,减少了故障检测过程的时耗;并且对根据贝叶斯超参数寻优方法对梯度提升机算法进行了超参数优化,得到故障检测模型,提高了使用故障检测模型进行故障检测的准确性。因此,风电机组故障检测方法提升了复杂工况下的风电机组故障检测的效率及准确率,从而降低了风电机组的运维成本,提高了风场的生产效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的基于改进梯度提升机的风电机组故障检测方法的一个实施例的流程示意图;
图2为本发明提供的故障检测精度比较图;
图3为本发明提供的基于改进梯度提升机的风电机组故障检测方法的另一个实施例的流程示意图;
图4为本发明提供的基于改进梯度提升机的风电机组故障检测方法的又一个实施例的流程示意图;
图5为本发明提供的基于改进梯度提升机的风电机组故障检测装置的一个实施例的结构示意图;
图6为本发明提供的基于改进梯度提升机的风电机组故障检测装置的另一个实施例的结构示意图;
图7为本发明提供的基于改进梯度提升机的风电机组故障检测装置的又一个实施例的结构示意图;
图8为本发明提供的基于改进梯度提升机的风电机组故障检测装置的再一个实施例的结构示意图。
具体实施方式
本发明的核心是提供一种基于改进梯度提升机的风电机组故障检测方法及装置,通过最大信息系数相关分析方法,选取目标状态特征,并且根据贝叶斯超参数寻优方法对梯度提升机算法进行了超参数优化,得到故障检测模型,提升了复杂工况下的风电机组故障检测的效率及准确率,从而降低了风电机组的运维成本,提高了风场的生产效率。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供一种基于改进梯度提升机的风电机组故障检测方法,包括:
101、获取风电机组的状态特征集,状态特征集包括至少一个状态特征;
本实施例中,在风电场中,一般都具有大量的风电机组,为了方便进行风电机组的调控和监视,使用数据采集与监视控制***(Supervisory Control And DataAcquisition,SCADA),对各个风电机组进行数据采集以及监控,获得的SCADA数据包括了多种类型,通过专家经验对SCADA数据进行包括数据归一化和缺失值处理特征提取,从而得到高信息丰富度的且具备可解释性的状态特征,将数量众多的状态特征整理为状态特征集,例如,状态特征集中的状态特征具体包括了机舱振动方向、风速、转子转速、环境温度、机舱温度、桨距角、有功功率等等。
102、根据最大信息系数相关分析方法从状态特征集中选取目标状态特征;
本实施例中,针对不同的故障类型,需要使用的参数不同,因此需要利用最大信息系数相关分析方法,从状态特征集中选取出与检测的故障相关度达到条件的状态特征,作为目标状态特征。
103、根据贝叶斯超参数寻优方法对梯度提升机算法的超参数进行优化,得到故障检测模型;
本实施例中,梯度提升机(LightGBM)算法是2017年提出的一种基于决策树算法的分布式梯度提升(Gradient Boosting Decision Tree,GBDT)框架。GBDT算法能处理离散化信息数据,但它在在对损失函数优化时,只利用一阶导数信息,并且在训练第n颗树时,需用到第n-1颗树的残差,难以实现并行化操作。而XGBoost算法,引入二阶导数对损失函数进行泰勒展开、参数的L2正则化等来整体评估模型的复杂度,支持并行计算,提高算法精度,但其叶子生长方式是按层展开方式,将产生不必要的节点,导致过拟合,高占用率。LightGBM在前者的基础上,提出基于Hisgram的决策树算法,利用带深度限制的叶子生长策略,采用多线程优化,使得LightGBM具有低内存占用率,能处理大规模数据,更加高效,精度更高。若给定监督学习数据集LightGBM的目的是找到一个映射关系来逼近函数F(x),使得损失函数Ψ(y,F(x))期望值最小化,具体公式如下:
回归树可用另一种形式来表示,即wq(x),q∈{1,2,...,J},J代表叶子节点数量,q代表树的决策规则,w代表样本权重,损失函数Lt可表示为:
传统的LightGBM采用最速下降法,这种方法只考虑损失函数的梯度。而在LightGBM中使用牛顿法来快速逼近目标函数,化简损失函数Lt后,可得:
其中,gi、hi分别代表一阶损失函数和二阶损失函数。即
用Ij来代表叶子j的样本集,损失函数Lt可化为如下:
给定树的结构q(x),则每个叶子结点的最佳权重和LK的极限值可通过二次规划得到:
增益计算公式为:
LightGBM算法使用最大树深度来修剪树并避免过度拟合,采用多线程优化,提高效率、节省时间。
在LightGBM算法中影响模型性能的主要参数有叶子数目、学习率等,而这些参数无法通过训练获得,需手动调整,这些参数称为超参数。贝叶斯优化的思想是根据目标函数过去的评估结果,使用这些结果形成概率模型,将超参数映射到目标函数的得分概率寻找最佳参数,因此,根据贝叶斯超参数寻优方法可以实现对梯度提升机算法的超参数进行优化,优化超参数之后得到的LightGBM算法为故障检测模型。
104、根据目标状态特征及故障检测模型,预测得到风电机组的故障检测结果。
本实施例中,通过故障检测模型对目标状态特征进行计算之后,就能预测得到风电机组的故障检测结果。通过AdaBoost、GBDT、LightGBM算法及LightGBM算法经贝叶斯超参数寻优后(即故障检测模型)对齿轮箱故障进行检测的结果,我们发现AdaBoost、GBDT、LightGBM算法精度均值分别为0.917、0.922、0.926,AdaBoost、GBDT、LightGBM算法的正确识别率均值分别为0.853、0.861、0.902,GBDT算法将决策树与提升算法结合,GBDT比AdaBoost故障诊断精度有所提高,LightGBM算法采用多线程优化,高效率,性能最好。如图2所示,为LightGBM算法和LightGBM算法经贝叶斯超参数寻优后(故障检测模型,LightGBM_TPE)的算法精度比较图,LightGBM算法的精度约为0.94,而LightGBM_TPE的算法精度约为0.97,故障检测精度明显提高,相比一般的梯度提升机算法,改进的梯度提升机能够较大的改善故障数据的精度,所提出的LightGBM_TPE方法能够提高正确率。
本发明实施例中,通过最大信息系数相关分析方法,选取目标状态特征,从而删选掉了状态特征集中一部分的状态特征,减少了故障检测过程的耗时;并且对根据贝叶斯超参数寻优方法对梯度提升机算法进行了超参数优化,得到故障检测模型,提高了使用故障检测模型进行故障检测的准确性。因此,风电机组故障检测方法提升了复杂工况下的风电机组故障检测的效率及准确率,从而降低了风电机组的运维成本,提高了风场的生产效率。
在以上图1所示的实施例中,步骤102中最大信息系数相关分析方法具体是如何实现目标状态特征选取的,下面通过实施例进行说明,可选的,本发明的一些实施例中,根据最大信息系数相关分析方法从状态特征集中选取目标状态特征,包括:
通过最大信息系数相关分析方法,计算状态特征与风电机组的故障的相关强度系数;
根据特征选取规则,选取处于预置系数区间范围内的相关强度系数所对应的状态特征,作为目标状态特征。
本发明实施例中,最大信息系数理论是用来衡量两个特征之间数值关联的强度。若X为离散变量,则X的信息熵为:
条件熵指当随机变量Y发生时,X发生的条件概率分布:
H(X|Y)=-∑y∈YP(y)∑x∈XP(x|y)log2P(x|y)
将X的信息熵减去X发生的条件概率分布,可得到互信息为:
对于随机变量X,Y的最大信息系数为:
其中|X|·|Y|表示网格数。参数B表示数据总量的0.6次方。
最大信息系数的范围在0到1之间,值越接近于1,两个变量之间的相关性越强,反之越弱。
因此,基于最大信息系数相关分析方法就能计算得到状态特征与风电机组的故障的相关强度系数,设置特征选取规则,特征选取规则可以是预先设置了相关强度系数的预置系数区间,只要状态特征对应的相关强度系数处于预置系数区间范围内,那么就选取该状态特征作为目标状态特征。因此,可以从众多的状态特征中,选取出与故障检测相关联的状态特征作为目标状态特征,减少了故障检测过程中的状态特征过多导致的时耗。
在以上图1所示的实施例中,步骤103中只描述了贝叶斯超参数寻优方法的理论,并未具体说明超参数的获取方式及如何得到故障检测模型,下面通过实施例对步骤103进行具体说明。
如图3所示,本发明实施例提供一种基于改进梯度提升机的风电机组故障检测方法,包括:
301、获取风电机组的状态特征集,状态特征集包括至少一个状态特征;
详情请参考步骤101。
302、根据最大信息系数相关分析方法从状态特征集中选取目标状态特征;
详情请参考以上实施例中对步骤102的说明。
303、从梯度提升机算法中选择对梯度提升机影响度达到预置值的算法参数,作为超参数;
本实施例中,在LightGBM算法中影响模型性能的主要参数有叶子数目、学习率等,而这些参数无法通过训练获得,需手动调整,这些参数称为超参数。
304、采用贝叶斯超参数寻优方法对超参数进行优化,得到最佳参数组合;
本实施例中,采用贝叶斯超参数寻优方法对超参数进行优化具体包括:
(1)、根据贝叶斯优化方法构建目标函数;
(2)、获取目标函数的历史评估结果,根据历史评估结果构建概率模型;
(3)、将超参数映射到目标函数在概率模型中的得分概率,采用树形结构Parzen估计方法(Tree-structured Parzen Estimator,TPE)得到最佳参数组合,表示为P(Y|X)。
概率模型的选择,可分为高斯过程、随机森林回归和树状结构Parzen估计方法(Tree-structured Parzen Estimator,TPE),而TPE取得了很好的结果,因此,采用贝叶斯树状结构Parzen估计方法对LightGBM进行超参数优化。
305、将最佳参数组合代入梯度提升机算法中,得到故障检测模型;
本实施例中,在得到了最佳参数组合之后,将最佳参数组合代入梯度提升机算法中,从而实现了梯度提升机算法的超参数优化,得到故障检测模型。
306、根据目标状态特征及故障检测模型,预测得到风电机组的故障检测结果。
详情请参考步骤104。
在以上图3所示实施例中,最佳参数组合可能为多个,那么还需要对不同的最佳参数组合进行验证,从而选取最优解,具体的方法如下:
可选的,如图4所示,本发明的一些实施例中,最佳参数组合为两个以上时,方法还包括:
401、设置超参数的参数组合区间;
402、获取概率模型的训练数据集及验证数据集;
403、根据超参数、训练数据集及验证数据集,构建评价函数;
404、通过评价函数对所有的最佳参数组合对应的分类结果进行评价,得到评价结果;
405、根据评价结果从最佳参数组合中选取最优的最佳参数组合。
本发明实施例中,假设θ={θ1、θ2…θn}表示机器学习算法A(如LightGBM)中的超参数,Dtrain数据集表示训练数据集,Dvalid数据集表示验证数据集(即超参数优化),二者独立分布。用L(A,θ,Dvalid,Dtrain)来表示算法A的验证损失,一般用K折交叉验证来解决优化问题,构建评价函数如下:
先设定将要选择超参数的参数组合区间,在参数寻优的过程中,通过训练数据集不断地训练模型,通过评价函数f(θ)对所有的最佳参数组合得到的分类结果进行评价,得到评价结果,根据评价结果从最佳参数组合中选取最优的最佳参数组合。
在以上的实施例中对基于改进梯度提升机的风电机组故障检测方法进行了详细的说,下面通过实施例对应用该方法的基于改进梯度提升机的风电机组故障检测装置进行详细的说明,具体如下:
如图5所示,本发明实施例提供一种基于改进梯度提升机的风电机组故障检测装置,包括:
数据获取模块501,用于获取风电机组的状态特征集,状态特征集包括至少一个状态特征;
特征选取模块502,用于根据最大信息系数相关分析方法从状态特征集中选取目标状态特征;
故障检测模型参数优化模块503,用于根据贝叶斯超参数寻优方法对梯度提升机算法的超参数进行优化,得到故障检测模型,超参数为对梯度提升机影响度达到预置值的算法参数;
故障预测模块504,用于根据目标状态特征及故障检测模型,预测得到风电机组的故障检测结果。
本发明实施例中,特征选取模块502通过最大信息系数相关分析方法,从数据获取模块501获取的风电机组的状态参数集中选取目标状态特征,从而删选掉了部分状态特征,减少了故障检测过程的时耗;并且故障检测模型参数优化模块503对根据贝叶斯超参数寻优方法对梯度提升机算法进行了超参数优化,得到故障检测模型,故障预测模块504根据目标状态特征及故障检测模型,计算得到风电机组的故障检测结果,提高了使用故障检测模型进行故障检测的准确性。因此,风电机组故障检测方法提升了复杂工况下的风电机组故障检测的效率及准确率,从而降低了风电机组的运维成本,提高了风场的生产效率。
可选的,结合图5所示的实施例,如图6所示,本发明的一些实施例中,特征选取模块502包括:
相关强度计算单元601,用于通过最大信息系数相关分析方法,计算状态特征与风电机组的故障的相关强度系数;
故障检测模型参数选取单元602,用于根据特征选取规则,选取处于预置系数区间范围内的相关强度系数所对应的状态特征,作为目标状态特征。
可选的,结合图5或图6所示的实施例,如图7所示,故障检测模型参数优化模块503包括:
超参数选取单元701,具体用于从梯度提升机算法中选择对梯度提升机影响度达到预置值的算法参数,作为超参数;
超参数优化单元702,还用于采用贝叶斯超参数寻优方法对超参数进行优化,得到最佳参数组合;
模型构建单元703,还用于将最佳参数组合代入梯度提升机算法中,得到故障检测模型。
可选的,结合图7所示,
超参数优化单元702,具体用于根据贝叶斯优化方法构建目标函数;
超参数优化单元702,还用于获取目标函数的历史评估结果,根据历史评估结果构建概率模型;
超参数优化单元702,还用于将超参数映射到目标函数在概率模型中的得分概率,采用树形结构Parzen估计方法得到最佳参数组合。
可选的,结合图7所示的实施例,如图8所示,最佳参数组合为两个以上时,故障检测模型参数优化模块503还包括:
参数评估单元801,用于设置超参数的参数组合区间;
参数评估单元801,还用于获取概率模型的训练数据集及验证数据集;
参数评估单元801,还用于根据超参数、训练数据集及验证数据集,构建评价函数;
参数评估单元801,还用于通过评价函数对所有的最佳参数组合对应的分类结果进行评价,得到评价结果;
参数评估单元801,还用于根据评价结果从最佳参数组合中选取最优的最佳参数组合。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种基于改进梯度提升机的风电机组故障检测方法,其特征在于,包括:
获取风电机组的状态特征集,所述状态特征集包括至少一个状态特征;
根据最大信息系数相关分析方法从所述状态特征集中选取目标状态特征;
根据贝叶斯超参数寻优方法对梯度提升机算法的超参数进行优化,得到故障检测模型,所述超参数为对梯度提升机影响度达到预置值的算法参数;
根据所述目标状态特征及所述故障检测模型,预测得到所述风电机组的故障检测结果。
2.根据权利要求1所述的方法,其特征在于,所述根据最大信息系数相关分析方法从所述状态特征集中选取目标状态特征,包括:
通过最大信息系数相关分析方法,计算所述状态特征与所述风电机组的故障的相关强度系数;
根据特征选取规则,选取处于预置系数区间范围内的相关强度系数所对应的状态特征,作为目标状态特征。
3.根据权利要求1或2所述的方法,其特征在于,所述根据贝叶斯超参数寻优方法对梯度提升机算法的超参数进行优化,得到故障检测模型,包括:
从梯度提升机算法中选择对梯度提升机影响度达到预置值的算法参数,作为超参数;
采用贝叶斯超参数寻优方法对所述超参数进行优化,得到最佳参数组合;
将所述最佳参数组合代入所述梯度提升机算法中,得到故障检测模型。
4.根据权利要求3所述的方法,其特征在于,所述采用贝叶斯超参数寻优方法对所述超参数进行优化,得到最佳参数组合,包括:
根据贝叶斯优化方法构建目标函数;
获取所述目标函数的历史评估结果,根据所述历史评估结果构建概率模型;
将所述超参数映射到所述目标函数在所述概率模型中的得分概率,采用树形结构Parzen估计方法得到最佳参数组合。
5.根据权利要求4所述的方法,其特征在于,所述最佳参数组合为两个以上时,所述方法还包括:
设置所述超参数的参数组合区间;
获取所述概率模型的训练数据集及验证数据集;
根据所述超参数、所述训练数据集及所述验证数据集,构建评价函数;
通过所述评价函数对所有的所述最佳参数组合对应的分类结果进行评价,得到评价结果;
根据所述评价结果从所述最佳参数组合中选取最优的最佳参数组合。
6.一种基于改进梯度提升机的风电机组故障检测装置,其特征在于,包括:
数据获取模块,用于获取风电机组的状态特征集,所述状态特征集包括至少一个状态特征;
特征选取模块,用于根据最大信息系数相关分析方法从所述状态特征集中选取目标状态特征;
故障检测模型参数优化模块,用于根据贝叶斯超参数寻优方法对梯度提升机算法的超参数进行优化,得到故障检测模型,所述超参数为对梯度提升机影响度达到预置值的算法参数;
故障预测模块,用于根据所述目标状态特征及所述故障检测模型,预测得到所述风电机组的故障检测结果。
7.根据权利要求6所述的装置,其特征在于,所述特征选取模块包括:
相关强度计算单元,用于通过最大信息系数相关分析方法,计算所述状态特征与所述风电机组的故障的相关强度系数;
故障检测模型特征选取单元,用于根据特征选取规则,选取处于预置系数区间范围内的相关强度系数所对应的状态特征,作为目标状态特征。
8.根据权利要求6或7所述的装置,其特征在于,所述故障检测模型参数优化模块包括:
超参数选取单元,具体用于从梯度提升机算法中选择对梯度提升机影响度达到预置值的算法参数,作为超参数;
超参数优化单元,还用于采用贝叶斯超参数寻优方法对所述超参数进行优化,得到最佳参数组合;
模型构建单元,还用于将所述最佳参数组合代入所述梯度提升机算法中,得到故障检测模型。
9.根据权利要求8所述的装置,其特征在于,
所述超参数优化单元,具体用于根据贝叶斯优化方法构建目标函数;
所述超参数优化单元,还用于获取所述目标函数的历史评估结果,根据所述历史评估结果构建概率模型;
所述超参数优化单元,还用于将所述超参数映射到所述目标函数在所述概率模型中的得分概率,采用树形结构Parzen估计方法得到最佳参数组合。
10.根据权利要求9所述的装置,其特征在于,所述最佳参数组合为两个以上时,所述模型构建模块还包括:
参数评估单元,用于设置所述超参数的参数组合区间;
所述参数评估单元,还用于获取所述概率模型的训练数据集及验证数据集;
所述参数评估单元,还用于根据所述超参数、所述训练数据集及所述验证数据集,构建评价函数;
所述参数评估单元,还用于通过所述评价函数对所有的所述最佳参数组合对应的分类结果进行评价,得到评价结果;
所述参数评估单元,还用于根据所述评价结果从所述最佳参数组合中选取最优的最佳参数组合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911025957.0A CN110685868A (zh) | 2019-10-25 | 2019-10-25 | 一种基于改进梯度提升机的风电机组故障检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911025957.0A CN110685868A (zh) | 2019-10-25 | 2019-10-25 | 一种基于改进梯度提升机的风电机组故障检测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110685868A true CN110685868A (zh) | 2020-01-14 |
Family
ID=69114788
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911025957.0A Pending CN110685868A (zh) | 2019-10-25 | 2019-10-25 | 一种基于改进梯度提升机的风电机组故障检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110685868A (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111488946A (zh) * | 2020-04-28 | 2020-08-04 | 东南大学 | 基于信息融合的雷达伺服***故障诊断方法 |
CN112100575A (zh) * | 2020-09-11 | 2020-12-18 | 石化盈科信息技术有限责任公司 | 设备状态趋势预测方法、装置、计算机设备和存储介质 |
CN112598148A (zh) * | 2020-09-30 | 2021-04-02 | 新天绿色能源股份有限公司 | 基于协同表达和LightGBM算法的风机变桨电机温度故障预警方法 |
CN112682273A (zh) * | 2020-12-31 | 2021-04-20 | 长沙理工大学 | 基于代价敏感轻量级梯度提升机的风电机组故障检测方法 |
CN112734130A (zh) * | 2021-01-21 | 2021-04-30 | 河北工业大学 | 一种双馈型风机主轴的故障预警方法 |
CN112990255A (zh) * | 2020-12-23 | 2021-06-18 | 中移(杭州)信息技术有限公司 | 设备故障的预测方法、装置、电子设备、以及存储介质 |
CN113095390A (zh) * | 2021-04-02 | 2021-07-09 | 东北大学 | 基于云数据库和改进集成学习的手杖运动分析***及方法 |
CN113326883A (zh) * | 2021-06-03 | 2021-08-31 | 中创三优(北京)科技有限公司 | 充电站功率利用率预测模型的训练方法、装置及介质 |
CN113339208A (zh) * | 2021-07-21 | 2021-09-03 | 申能新能源(青海)有限公司 | 风电机组振动异常片段的选取方法 |
CN113361186A (zh) * | 2021-04-28 | 2021-09-07 | 山东大学 | 一种基于完全数据风电机组故障诊断方法 |
CN113378908A (zh) * | 2021-06-04 | 2021-09-10 | 浙江大学 | 基于LightGBM算法和网格搜索算法的暖通空调***故障诊断方法 |
CN113505639A (zh) * | 2021-05-28 | 2021-10-15 | 北京化工大学 | 一种基于TPE-XGBoost的旋转机械多参数健康状态评估方法 |
CN114330934A (zh) * | 2022-03-09 | 2022-04-12 | 南方电网数字电网研究院有限公司 | 一种模型参数自适应的gru新能源短期发电功率预测方法 |
CN116861218A (zh) * | 2023-07-25 | 2023-10-10 | 上海华菱电站成套设备股份有限公司 | 一种矿井提升机关键设备状态监测预警*** |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8386401B2 (en) * | 2008-09-10 | 2013-02-26 | Digital Infuzion, Inc. | Machine learning methods and systems for identifying patterns in data using a plurality of learning machines wherein the learning machine that optimizes a performance function is selected |
CN108932580A (zh) * | 2018-06-05 | 2018-12-04 | 浙江运达风电股份有限公司 | 基于数据建模的风电机组变桨轴承磨损监测和预警方法 |
CN109858631A (zh) * | 2019-02-02 | 2019-06-07 | 清华大学 | 用于概念迁移的流式数据分析的自动机器学习***及方法 |
CN110032944A (zh) * | 2019-03-20 | 2019-07-19 | 国网电力科学研究院(武汉)能效测评有限公司 | 一种电力负荷特征提取方法及*** |
CN110135064A (zh) * | 2019-05-15 | 2019-08-16 | 上海交通大学 | 一种发电机后轴承温度故障预测方法、***及控制器 |
-
2019
- 2019-10-25 CN CN201911025957.0A patent/CN110685868A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8386401B2 (en) * | 2008-09-10 | 2013-02-26 | Digital Infuzion, Inc. | Machine learning methods and systems for identifying patterns in data using a plurality of learning machines wherein the learning machine that optimizes a performance function is selected |
CN108932580A (zh) * | 2018-06-05 | 2018-12-04 | 浙江运达风电股份有限公司 | 基于数据建模的风电机组变桨轴承磨损监测和预警方法 |
CN109858631A (zh) * | 2019-02-02 | 2019-06-07 | 清华大学 | 用于概念迁移的流式数据分析的自动机器学习***及方法 |
CN110032944A (zh) * | 2019-03-20 | 2019-07-19 | 国网电力科学研究院(武汉)能效测评有限公司 | 一种电力负荷特征提取方法及*** |
CN110135064A (zh) * | 2019-05-15 | 2019-08-16 | 上海交通大学 | 一种发电机后轴承温度故障预测方法、***及控制器 |
Non-Patent Citations (1)
Title |
---|
FLYINGWARRIOR: "自动机器学习超参数调整(贝叶斯优化)", 《HTTPS://WWW.CNBLOGS.COM/WMX24/P/10025600.HTML》 * |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111488946A (zh) * | 2020-04-28 | 2020-08-04 | 东南大学 | 基于信息融合的雷达伺服***故障诊断方法 |
CN112100575A (zh) * | 2020-09-11 | 2020-12-18 | 石化盈科信息技术有限责任公司 | 设备状态趋势预测方法、装置、计算机设备和存储介质 |
CN112598148A (zh) * | 2020-09-30 | 2021-04-02 | 新天绿色能源股份有限公司 | 基于协同表达和LightGBM算法的风机变桨电机温度故障预警方法 |
CN112990255A (zh) * | 2020-12-23 | 2021-06-18 | 中移(杭州)信息技术有限公司 | 设备故障的预测方法、装置、电子设备、以及存储介质 |
CN112990255B (zh) * | 2020-12-23 | 2024-05-28 | 中移(杭州)信息技术有限公司 | 设备故障的预测方法、装置、电子设备、以及存储介质 |
CN112682273A (zh) * | 2020-12-31 | 2021-04-20 | 长沙理工大学 | 基于代价敏感轻量级梯度提升机的风电机组故障检测方法 |
CN112734130A (zh) * | 2021-01-21 | 2021-04-30 | 河北工业大学 | 一种双馈型风机主轴的故障预警方法 |
CN112734130B (zh) * | 2021-01-21 | 2022-06-10 | 河北工业大学 | 一种双馈型风机主轴的故障预警方法 |
CN113095390A (zh) * | 2021-04-02 | 2021-07-09 | 东北大学 | 基于云数据库和改进集成学习的手杖运动分析***及方法 |
CN113095390B (zh) * | 2021-04-02 | 2024-06-04 | 东北大学 | 基于云数据库和改进集成学习的手杖运动分析方法 |
CN113361186A (zh) * | 2021-04-28 | 2021-09-07 | 山东大学 | 一种基于完全数据风电机组故障诊断方法 |
CN113505639A (zh) * | 2021-05-28 | 2021-10-15 | 北京化工大学 | 一种基于TPE-XGBoost的旋转机械多参数健康状态评估方法 |
CN113505639B (zh) * | 2021-05-28 | 2024-03-22 | 北京化工大学 | 一种基于TPE-XGBoost的旋转机械多参数健康状态评估方法 |
CN113326883A (zh) * | 2021-06-03 | 2021-08-31 | 中创三优(北京)科技有限公司 | 充电站功率利用率预测模型的训练方法、装置及介质 |
CN113326883B (zh) * | 2021-06-03 | 2022-08-30 | 中创三优(北京)科技有限公司 | 充电站功率利用率预测模型的训练方法、装置及介质 |
CN113378908A (zh) * | 2021-06-04 | 2021-09-10 | 浙江大学 | 基于LightGBM算法和网格搜索算法的暖通空调***故障诊断方法 |
CN113339208B (zh) * | 2021-07-21 | 2023-08-22 | 申能新能源(青海)有限公司 | 风电机组振动异常片段的选取方法 |
CN113339208A (zh) * | 2021-07-21 | 2021-09-03 | 申能新能源(青海)有限公司 | 风电机组振动异常片段的选取方法 |
CN114330934A (zh) * | 2022-03-09 | 2022-04-12 | 南方电网数字电网研究院有限公司 | 一种模型参数自适应的gru新能源短期发电功率预测方法 |
CN116861218A (zh) * | 2023-07-25 | 2023-10-10 | 上海华菱电站成套设备股份有限公司 | 一种矿井提升机关键设备状态监测预警*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110685868A (zh) | 一种基于改进梯度提升机的风电机组故障检测方法及装置 | |
CN110594107B (zh) | 一种基于快速梯度提升机的风电机组故障检测方法及装置 | |
CN108022001B (zh) | 基于pca和分位数回归森林的短期负荷概率密度预测方法 | |
CN111275288B (zh) | 基于XGBoost的多维数据异常检测方法与装置 | |
US11840998B2 (en) | Hydraulic turbine cavitation acoustic signal identification method based on big data machine learning | |
CN108073158A (zh) | 基于pca和knn密度算法风电机组轴承故障诊断方法 | |
CN110717610B (zh) | 一种基于数据挖掘的风电功率预测方法 | |
CN111079343B (zh) | 一种基于宽度学习的风电机组有效风速估计方法 | |
CN114363195B (zh) | 面向时间和频谱残差卷积网络的网络流量预测预警方法 | |
CN111340282A (zh) | 基于da-tcn的设备剩余使用寿命的估计方法及*** | |
CN110365053B (zh) | 基于延迟优化策略的短期风电功率预测方法 | |
CN117290800B (zh) | 一种基于超图注意力网络的时序异常检测方法及*** | |
CN114297907A (zh) | 温室环境空间分布预测方法及装置 | |
CN110874665B (zh) | 用于风力发电机组的控制装置和方法 | |
CN114021483A (zh) | 基于时域特征与XGBoost的超短期风电功率预测方法 | |
CN115434875A (zh) | 基于时空神经网络的风电机组故障状态检测方法 | |
CN114429238A (zh) | 一种基于时空特征提取的风电机组故障预警方法 | |
Dong et al. | Real-time detection of wind power abnormal data based on semi-supervised learning Robust Random Cut Forest | |
CN107844872B (zh) | 一种用于风力发电的短期风速预报方法 | |
CN113642238A (zh) | 基于微气象因子的径向基神经网络输电线路覆冰预测方法 | |
CN117458955A (zh) | 电机的运行控制方法及*** | |
CN117096860A (zh) | 基于lssvm模型的架空输电线路载流量区间预测方法及设备 | |
CN117034001A (zh) | 一种风电机组故障预测方法、装置及电子设备 | |
CN114139638A (zh) | 一种考虑多变量相关性的风机叶片覆冰故障诊断方法 | |
CN112183814A (zh) | 一种短期风速预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200114 |
|
RJ01 | Rejection of invention patent application after publication |