CN109039281A - 一种基于改进随机森林算法的光伏阵列故障诊断方法 - Google Patents

一种基于改进随机森林算法的光伏阵列故障诊断方法 Download PDF

Info

Publication number
CN109039281A
CN109039281A CN201810907602.3A CN201810907602A CN109039281A CN 109039281 A CN109039281 A CN 109039281A CN 201810907602 A CN201810907602 A CN 201810907602A CN 109039281 A CN109039281 A CN 109039281A
Authority
CN
China
Prior art keywords
photovoltaic array
array
photovoltaic
branch
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810907602.3A
Other languages
English (en)
Inventor
陶洪峰
周超超
魏强
刘巍
周龙辉
王鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangnan University
Original Assignee
Jiangnan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangnan University filed Critical Jiangnan University
Priority to CN201810907602.3A priority Critical patent/CN109039281A/zh
Priority to RU2019127993A priority patent/RU2734017C1/ru
Priority to PCT/CN2018/101743 priority patent/WO2020029327A1/zh
Publication of CN109039281A publication Critical patent/CN109039281A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02SGENERATION OF ELECTRIC POWER BY CONVERSION OF INFRARED RADIATION, VISIBLE LIGHT OR ULTRAVIOLET LIGHT, e.g. USING PHOTOVOLTAIC [PV] MODULES
    • H02S50/00Monitoring or testing of PV systems, e.g. load balancing or fault identification
    • H02S50/10Testing of PV devices, e.g. of PV modules or single PV cells
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E10/00Energy generation through renewable energy sources
    • Y02E10/50Photovoltaic [PV] energy

Landscapes

  • Photovoltaic Devices (AREA)

Abstract

本发明公开了一种基于改进随机森林算法的光伏阵列故障诊断方法,涉及光伏技术领域,该方法通过光伏阵列总干路和各个支路的参数反映光伏阵列中各条支路的运行状态,通过不同支路之间的阵列间电压差反映支路中各个光伏电池组件的运行状态,从而实现对光伏阵列的故障定位,同时利用包外样本在决策树赋权投票、平局处理和故障特征的重要性度量三个部分进行优化改进,可以使得故障诊断的精度更高、可靠性更强。

Description

一种基于改进随机森林算法的光伏阵列故障诊断方法
技术领域
本发明涉及光伏技术领域,尤其是一种基于改进随机森林算法的光伏阵列故障诊断方法。
背景技术
随着能源需求的增长、化石能源的日益枯竭与成本上涨,以及全球气候变暖等诸多因素的影响,可再生能源技术得到了飞速发展,其中,太阳能具有易获取、无噪声、清洁、无穷无尽等优点,成为了可再生能源的重要部分。目前利用太阳能发电主要有两种形式:光热发电和光伏发电。光热发电与火力发电类似,但热能主要来自大规模的镜面收集,将水加热后,利用蒸汽推动传统发电机工作,从而实现发电,这种发电方式虽然规避了硅晶的光电转换,但对光照强度的要求高且发电成本偏高。而光伏发电基于光生伏特效应,直接将太阳能转化为电能,建设周期短,在运行时不会产生废渣、废水和其他污染物,尤其是对于交通不发达的山区、海岛和偏远地区,光伏发电具有更重要的价值。
一般情况下,光伏发电都是利用光伏电池组件串、并联组成光伏阵列进行运行的,而光伏阵列使用的光伏电池组件较多,光伏电池组件本身发生故障的概率就较高,并且光伏阵列长期运行在户外,运行环境恶劣,易出现老化和损坏等情况,从而造成光伏电池组件发电效率的降低甚至停止工作。当光伏阵列中某个光伏电池组件发生故障后,会导致***效率的下降,并对电力***的运行调度造成不利的影响,严重时,甚至造成财产损失和人员伤亡,因此,对光伏阵列进行故障诊断具有重要意义,目前所采用的故障诊断方法主要包括直接法和间接法两类,间接法比较典型的有红外热量检测法和发电功率对比法,直接法比较典型的有对地电容法、时域反射法、智能诊断算法和电特性检测法,其中,通过将智能诊断算法和电特性检测法进行结合进行故障诊断,是目前非常具有潜力的方法。
但目前的光伏阵列故障诊断方法都较少考虑故障定位的情况,主要原因是:目前的智能诊断算法多采用以BP(Back Propagation)为代表的神经网络,而光伏阵列中的光伏电池组件的数目较多,当某一个或某多个光伏电池组件发生故障时,故障的排列组合形式较多,再加上不同的故障类型,有时甚至会出现上百种故障组合,则会需要较多的训练样本,并且训练时间也会随之增加,诊断精度也不能够得到保证,诊断难度较大。
发明内容
本发明人针对上述问题及技术需求,提出了一种基于改进随机森林算法的光伏阵列故障诊断方法,该方法通过采集阵列间光伏电池组件的电压和电流确定光伏电池组件的运行情况,从而实现故障定位。
本发明的技术方案如下:
一种基于改进随机森林算法的光伏阵列故障诊断方法,该方法包括:
确定光伏阵列在运行过程中的典型运行状态,光伏阵列包括n个支路,每个支路中包括m个光伏电池组件,光伏电池组件的典型运行状态用于指示光伏电池组件中的各个光伏电池组件的运行状态,m和n均为正整数;
在光伏阵列处于每个典型运行状态时,采集光伏阵列的阵列干路参数、各个支路对应的阵列支路参数以及不同支路之间的阵列间电压差;
根据阵列干路参数、阵列支路参数以及阵列间电压差构建故障特征向量,根据故障特征向量构建得到光伏阵列的数据样本集,将数据样本集划分为训练样本集和测试样本集;
基于随机森林算法利用训练样本集训练得到光伏阵列故障诊断模型,并利用测试样本集对光伏阵列故障诊断模型进行测试,光伏阵列故障诊断模型中包括N个决策树,N为正整数且N≥2;
利用测试完成的光伏阵列故障诊断模型对待诊断光伏阵列进行诊断,得到N个决策树对各个典型运行状态的投票结果;
根据各个典型运行状态对应的投票结果得到待诊断光伏阵列的故障诊断结果,故障诊断结果用于指示光伏阵列中的各个光伏电池组件的运行状态。
其进一步的技术方案为,阵列干路参数和每个阵列支路参数分别包括电路的最大功率点电压、最大功率点电流、开路电压和短路电流。
其进一步的技术方案为,光伏阵列故障诊断模型中包括N个决策树及每个决策树对应的权值,则利用测试完成的光伏阵列故障诊断模型对待诊断光伏阵列进行诊断,包括:
N个决策树对各个典型运行状态进行投票,每个决策树将自身对应的权值作为票数投出;
统计得到各个典型运行状态对应的投票结果。
其进一步的技术方案为,基于随机森林算法利用训练样本集训练得到光伏阵列故障诊断模型,包括:
对包含p个样本的训练样本集进行N轮抽样,对于每一轮抽样,采用有放回的抽样方式抽样p次得到该轮抽样对应的子训练样本集和包外样本集,子训练集中包括该轮抽样中抽取到的p个样本,包外样本集中包括训练样本集中在该轮抽样中未被抽取的样本,p为正整数;
根据每一轮抽样对应的子训练样本集训练得到一个决策树,并利用该轮抽样对应的包外样本集对决策树进行测试得到包外准确率,根据包外准确率计算得到决策树对应的权值;
对训练得到的N个决策树和每个决策树对应的权值进行汇总得到光伏阵列故障诊断模型。
其进一步的技术方案为,根据包外准确率计算得到决策树对应的权值,包括计算:
其中,w(i)为第i个决策树对应的权值,Hoob(i)为第i个决策树对应的包外准确率,i和j均为参数,1≤i≤N且i为正整数。
其进一步的技术方案为,该方法还包括:
将N个包外样本集进行汇总得到总包外样本集,对于总包外样本集中的每个样本,利用训练得到的光伏阵列故障诊断模型对样本进行测试得到初始包外准确率;
样本共包括K个故障特征,在其中第k个故障特征中加入噪声,并利用光伏阵列故障诊断模型重新对样本进行测试得到新的包外准确率,计算初始包外准确率和新的包外准确率之间的差值确定第k个特征的重要性度量值,K为正整数,k为参数且k的起始值为1;
在k<K时,令k=k+1,并再次执行在其中第k个故障特征中加入噪声的步骤;直至k=K时得到K个故障特征的重要性度量值;
对于训练样本集中的每个样本,删除样本的K个故障特征中重要性度量值最小的t个故障特征,得到处理后的训练样本集;
基于随机森林算法利用处理后的训练样本集构建得到光伏阵列故障诊断模型。
其进一步的技术方案为,根据各个典型运行状态对应的投票结果得到待诊断光伏阵列的故障诊断结果,包括:
若最高的投票数对应的典型运行状态仅包括一个,则将最高的投票数对应的典型运行状态作为故障诊断结果输出;
若最高的投票数对应的典型运行状态包括至少两个,则选取权值最高的L个决策树对各个典型运行状态重新进行投票,若存在一个典型运行状态获得最多个决策树的选择,则将典型运行状态作为故障诊断结果输出;否则将权值最高的决策树选择的典型运行状态作为故障诊断结果输出,L为正整数且2≤L<N。
本发明的有益技术效果是:
1、本申请公开了一种基于改进随机森林算法的光伏阵列故障诊断方法,采集光伏阵列总干路和各个支路的参数以及不同支路之间的阵列间电压差,光伏阵列总干路和各个支路的参数可以反映光伏阵列中各条支路的运行状态,从而诊断出光伏阵列中哪条支路发生了何种故障,而不同支路之间的阵列间电压差可以反映出支路中各个光伏电池组件的运行状态,从而诊断出具体是哪个光伏电池组件发生了何种故障,两类信息的结合有效地实现了光伏阵列的故障定位;同时利用随机森林算法,该算法适用于实际光伏阵列的特点,克服了传统神经网络算法需要数据量大、训练时间长等问题,能够简单快速地完成诊断任务。
2、本申请公开的方法基于数据驱动的思想,将随机森林算法、决策树赋权、投票平局处理和变量重要性度量结合起来,实现光伏阵列的故障诊断并有效提升诊断精度。
3、本申请公开的方法采用改进随机森林的故障诊断模型结构,通过多个决策树的集成,构建了一个强分类器,在利用决策树赋权、投票平局处理和故障特征重要性度量等一系列步骤进行改进,最后构建改进随机森林算法,诊断结果也表明改进后的算法虽然训练时间稍有延长,但精度更高,诊断可靠性更强。
附图说明
图1是本申请公开的光伏阵列故障诊断方法的流程图。
图2是3*3的光伏阵列的搭建示意图。
图3-a是单个太阳能电池组件在不同光照强度下的U-I输出特性曲线。
图3-b是单个太阳能电池组件在不同光照强度下的U-P输出特性曲线。
图3-c是单个太阳能电池组件在不同温度情况下的U-I输出特性曲线。
图3-d是单个太阳能电池组件在不同温度情况下的U-P输出特性曲线。
图4是单个太阳能电池组件在光照强度600W/m2、800W/m2、1000W/m2情况下的输出特性曲线。
图5-a是光伏阵列在无故障和发生单模式故障时的输出特性曲线比较图。
图5-b是光伏阵列在无故障和发生多模式故障时的输出特性曲线比较图。
图6-a是光伏阵列在一个支路中有一个光伏电池组件短路时的输出特性曲线。
图6-b是光伏阵列在一个支路开路时的输出特性曲线。
图6-c是光伏阵列在一个支路中有两个光伏电池组件存在阴影时的输出特性曲线。
图6-d是光伏阵列在一个支路中有一个光伏电池组件短路,另一个支路中有一个光伏电池组件存在阴影时的输出特性曲线。
具体实施方式
下面结合附图对本发明的具体实施方式做进一步说明。
本申请公开了一种基于改进随机森林算法的光伏阵列故障诊断方法,请参考图1,整个故障诊断流程包括如下步骤:
第一步,搭建m*n形式的光伏阵列,该光伏阵列包括并联的n个支路,每个支路包括串联的m个光伏电池组件,m和n均为正整数。光伏阵列中的光伏电池组件通常是太阳能电池组件,各个光伏电池组件规格均相同,以保证光伏阵列的电位平衡,并且每个光伏电池组件并联旁路二极管、每个支路串联隔离二极管,同时快速熔断器、电压和电流传感器等保护、检测装置均安装正确并正常工作。
本申请以n=3、m=3为例,搭建的3*3的光伏阵列的示意图请参考图2,共包括支路A、支路B和支路C,每个支路中包括3个串联的光伏电池组件,图2未示出旁路二极管、隔离二极管等器件。本申请光伏阵列中的光伏电池组件采用无锡尚德太阳能有限公司的SunTechSTP 270-24/Vd型太阳能电池组件,该型号的太阳能电池组件的参数规格表如下表所示:
参数类型 参数值
开路电压(Voc) 44.5V
最大功率点电压(Vm) 35.0V
短路电流(Isc) 8.20A
最大功率点电流(Im) 7.71A
最大功率(Pmax) 270W
运行温度 -40℃~+85℃
***最大承受电压 1000V DC
串联后保险丝的额定电流 20A
功率误差 ±3%
在保持温度不变的情况下,光照强度从200W/m2上升到1000W/m2(分别为200、400、600、800和1000W/m2)时的U-I(电压-电流)输出特性曲线如图3-a所示、U-P(电压-功率)输出特性曲线如图3-b所示。在保持光照强度不变的情况下,温度从35℃下降到15℃(分别为35℃、30℃、25℃、20℃和15℃)时的U-I输出特性曲线如图3-c所示、U-P(电压-功率)输出特性曲线如图3-d所示。特别的,产品手册中给出了该型号的太阳能电池组件在光照强度为600W/m2、800W/m2和1000W/m2情况下的输出特性曲线如图4所示。
第二步,确定光伏阵列在运行过程中的典型运行状态,本申请中的光伏电池组件的典型运行状态用于指示光伏电池组件中的各个光伏电池组件的运行状态。光伏阵列在实际运行时会出现较多类型的故障,主要有四类故障:短路故障、开路故障、阴影故障以及混合故障。当光伏阵列中的一个支路或多个支路中存在光伏电池组件发生故障时,该发生故障的支路以及整个光伏阵列的输出特性曲线都会发生变化,如图5-a示出了光伏阵列在无故障和发生单模式故障时的故障支路、故障阵列、正常支路和正常阵列的输出特性曲线,图5-b示出了光伏阵列在无故障和发生多模式故障时的故障支路、故障阵列、正常支路和正常阵列的输出特性曲线,其中正常支路是指支路中各个光伏电池组件均正常运行的支路,正常阵列是指各个支路均正常运行的光伏阵列,故障支路是支路中存在光伏电池组件发生故障的支路,故障阵列是指有支路发生故障的光伏阵列。由图中可以看出,正常支路的输出电流大,各个光伏电池组件的输出也相等,而故障支路的输出电流能力较弱,能看到明显的电流较低。输出特性曲线存在两个区域:高电压区域和大电流区域,在高电压区域可以通过检测各个支路的输出电流来判断支路的情况,而在大电流区域,可以检测光伏电池组件的输出电压来实现故障定位。
光伏阵列在运行过程中可能出现上述四类故障,再加上正常运行的情况,光伏阵列的运行状态主要包括五大类:正常运行状态、短路故障状态、开路故障状态、阴影故障状态以及混合故障状态:
(1)、正常运行状态,即所有支路均正常运行。
(2)、短路故障状态,即任意一条支路或多条支路短路。需要说明的是,一条支路中不可能所有光伏电池组件都短路,若全部光伏电池组件都短路,则熔断装置熔断,该支路会开路。
(3)、开路故障状态,即任意一条支路或多条支路开路。
(4)、阴影故障状态,即任意一条支路或多条支路存在阴影,与短路故障状态不同,可以存在一条支路中所有光伏电池组件都存在阴影的情况,因此该状态的数量较多。
(5)、混合故障状态,主要包括光伏阵列中同时发生短路故障和阴影故障的情况。
对于这五大类运行状态,可以采用两级状态分类的方式,首先进行粗略分类从而定位到光伏阵列中的支路,这一步骤不涉及故障定位,可以根据实际情况和经验选择若干最为常见的运行状态。需要说明的是,在光伏***中,***的重度故障都是在轻度故障的基础上演变而来,直接发生重度故障的几率微乎其微,并且重度故障的故障类型排列组合过多,所以本申请主要考虑轻、中度故障,即考虑光伏阵列中至少存在一条支路处于正常运行状态的情况。比如在图2所示的光伏阵列中,假设光伏阵列中的支路C始终处于正常运行状态,则可以选择如下20种运行状态作为第一级状态分类的结果,如下表所示:
以状态标签F2、F7、F10和F18对应的运行状态为例,他们的输出特性曲线依次如图6-a、6-b、6-c和6-d所示。在第一级状态分类的基础上,可以进行第二级状态分类从而定位到支路中的光伏电池组件,从而实现故障定位。以状态标签F2为例,该情况表示一个支路中有一个光伏电池组件短路,在图2所示的3*3的光伏阵列中,假设光伏阵列中的支路C处于正常运行状态,则该情况表示支路A或支路B上存在一个光伏电池组件短路,共包括6种情况,则在此基础上的第二级状态分类的结果如下表所示:
同样的,在状态标签F3对应的第一级状态分类的基础上进行的第二级状态分类的结果可以如下表所示:
其余各种情况都可以以此类推。至此,通过两级状态分类就得到了光伏电池组件的各个典型运行状态。
第三步,光伏阵列的电路参数的采集。在光伏阵列处于每个典型运行状态时,采集光伏阵列的阵列干路参数、各个支路对应的阵列支路参数以及不同支路之间的阵列间电压差。其中,光伏阵列的阵列干路参数是光伏阵列的总干路上的参数,本申请中的阵列干路参数包括总干路的最大功率点电压Vm、最大功率点电流Im、开路电压Voc和短路电流Isc,这是由于这四个参数能够很好的刻画光伏电池组件的U-I输出特性曲线。类似的,对于光伏阵列中的每个支路,采集支路的最大功率点电压Vm、最大功率点电流Im、开路电压Voc和短路电流Isc作为阵列支路参数。如图2所示,在实际操作时,光伏阵列的电路参数可以通过在光伏阵列中配置电压传感器和电流传感器测得,对于m×n规模的光伏阵列,需要配置[n×(m-1)/2]个电压传感器和n+1个电流传感器,其中符号[]表示对n×(m-1)/2进行向上取整。电流传感器设置在各个支路中以及总干路中,用于检测支路的电流和总干路的电流,电压传感器设置在不同支路间,用于检测不同支路间的阵列间电压差,如图2中设置有3个电压传感器Ua、Ub和Uc,电压传感器Ua设置在支路A和支路B之间,电压传感器Ub设置在支路B和支路C之间,电压传感器Uc设置在支路C和支路A之间。支路电流的检测和支路间电压差的检测实质上都是为了检测每个光伏电池组件的电压和电流,通过电压和电流等参数数值的变化反映光伏电池组件的运行情况,从而实现行故障定位,其原理如下:
在光伏阵列中,光伏阵列的电压矩阵Upv array为:
其中,U11表示光伏阵列中第1个支路的第1个光伏电池组件的输出电压,也即图2中的PV1的输出电压,Umn表示光伏阵列中第n个支路的第m个光伏电池组件的输出电压,也即图2中的PV9的输出电压,依次类推。则光伏阵列有等式成立如下:
其中,Uarray是光伏阵列的输出电压,则也即,每个光伏电池组件的输出电压应该是整个光伏阵列的输出电压的1/m。
定义光伏阵列的权值矩阵Apv array,即支路间的电压传感器放置点电位为:
其中,u11=U21-U11,u21=U31-U21,u(m-1)1=Um1-U(m-1)1,依次类推,则当光伏阵列无故障、处于正常运行状态时,权值矩阵Apv array中各列元素的值是等差数列、各行元素的值是相等的。若某个支路中的光伏电池组件发生故障,其他光伏电池组件的电压也会发生变化,利用如下公式计算变化后的光伏电池组件的输出电压为:
U×m=Ubad×(m-x)
其中,U表示正常运行的光伏电池组件的输出电压,m为支路中包含的光伏电池组件的总个数,x为故障支路中发生故障的光伏电池组件的个数,Ubad为故障支路中正常运行的光伏电池组件的输出电压。比如在图2中,光伏电池组件PV1、PV2和PV3的输出电压分别为当光伏电池组件PV1发生故障时,它会被旁路二极管短路,则光伏电池组件PV1输出为0,上式中的x=1,则有则光伏电池组件PV2和PV3两端的输出电压即为也即相应的光伏电池组件PV2和PV3的输出电压将会增加。则当光伏阵列处于故障状态(包括短路、开路、阴影和混合故障)时,权值矩阵Apv array中无故障的支路的各行元素相等、存在故障的支路的各行元素与无故障的支路的各行元素不相等;且存在故障的支路的各列元素不是等差数列。下表示出了部分短路故障情况下,各个电压传感器采集到的阵列间电压差的特征值:
上述状态标签的表示含义可以参考上述第二步中的内容,本领域技术人员理解的是,状态标签F4-14表示的情况是支路A上的PV1和支路B上的PV4短路,以此类推,本申请不一一赘述。
当光伏阵列存在阴影故障时,各个电压传感器采集到的阵列间电压差也会在一个范围内,部分阴影故障情况的特征值如下表所示:
状态标签 Ua Ub Uc
F9-1 Uarray/6<Ua<Uarray/3 Uarray/3 Uarray/3<Uc<2Uarray/3
F9-2 Uarray/6<Ua<Uarray/3 Uarray/3 Uarray/6<Uc<Uarray/3
F9-3 Uarray/3<Ua<2Uarray/3 Uarray/3 Uarray/6<Uc<Uarray/3
F9-4 Uarray/3<Ua<2Uarray/3 Uarray/6<Ub<Uarray/3 Uarray/3
F9-5 Uarray/6<Ua<Uarray/3 Uarray/6<Ub<Uarray/3 Uarray/3
F9-6 Uarray/6<Ua<Uarray/3 Uarray/3<Ub<2Uarray/3 Uarray/3
状态标签F9-1表示的情况是:支路A上的PV1存在阴影,同样的,本领域技术人员可以理解其余各个状态标签表示的含义,本申请不一一赘述。
由上述论述可知,光伏阵列发生故障时会在权值矩阵Apv array中有所体现,进而会导致电压传感器采集到的阵列间电压差发生变化,因此本申请通过对采集阵列间电压差进行分析就能实现光伏阵列的故障定位。
另外,由上可知,电压传感器采集到的阵列间电压差都是与光伏阵列的输出电压Uarray成比例关系的,因此可以进一步简化,不直接利用采集到的阵列间电压差,而是将阵列间电压差除以光伏阵列的输出电压Uarray得到电压系数,以电压系数来表示阵列间电压差。
第四步,故障特征向量和数据样本集的构建。根据采集到的阵列干路参数、阵列支路参数以及阵列间电压差构建故障特征向量,得到故障特征向量后,就能汇总并构建成光伏阵列的数据样本集,由故障特征向量汇总得到数据样本集的方法是本领域技术人员都知道的方法,本申请对此不进行展开叙述。对数据样本集进行划分得到训练样本集和测试样本集,通常可以按照2:1的比例划分成为训练样本集和测试样本集。
第五步,基于改进随机森林算法的光伏阵列故障诊断模型的构建。假设训练样本集为X,故障特征向量的维度为K,也即样本的故障特征的数量为K,K为正整数;故障诊断中需要建立的决策树的数目为N,N≥2且N为正整数,则基于改进随机森林算法利用训练样本集构建得到光伏阵列故障诊断模型的步骤可以简述为:
1、对包含p个样本的训练样本集X进行N轮抽样,对于第i轮抽样,采用有放回的抽样方式抽样p次,由于是进行有放回地抽取,因此会出现部分样本被重复抽取而部分样本没有被抽到的情况,该轮抽样中抽取到的p个样本可以构成该轮抽样对应的子训练样本集Xi,训练样本集中在该轮抽样中未被抽到的样本构成该轮抽样对应的包外样本集oobi(out-of-bag),p为正整数,i为参数,1≤i≤N且i为正整数。
2、利用每一轮抽样对应的子训练样本集训练得到一个决策树,也即利用子训练样本集Xi训练决策树Qi。在决策树的节点***时,从K个故障特征中随机选择q个故障特征,q为正整数且q≤K,计算q个故障特征中的各个故障特征对应的基尼系数,将与最小的基尼系数对应的故障特征作为最佳***特征来进行节点***,基尼系数的计算方法可以采用现有的计算公式,本申请对此不作详细介绍。
3、对于第i轮抽样,其对应的包外样本集oobi中的样本由于没有参与决策树Qi的训练,因此可以将其当做测试集使用,利用包外样本集oobi对决策树Qi进行测试从而得到该决策树Qi的包外准确率Hoob(i)。
在普通的随机森林算法中,决策树的权值默认是相等的,因此部分性能优秀的决策树可能无法表现自身优势,甚至会被淹没在多数投票中,所以本申请对此进行改进,对决策树进行了加权,利用决策树的包外准确率定义评价该决策树的性能优劣,在所有决策树训练完成后,计算得到各个决策树的包外准确率,对于第i轮抽样训练得到决策树Qi,利用其对应的包外准确率Hoob(i)计算该决策树Qi的权值的计算公式如下:
其中,w(i)即第i个决策树对应的权值,j为参数。
4、将所有决策树和每个决策树对应的权值追加到决策树集合中,从而汇总构成光伏阵列故障诊断模型。
第六步,光伏阵列故障诊断模型的进一步优化。随着光伏阵列规模的扩大,其同时运行的支路和电压传感器的数目也会随之增加,故障特征向量的维度K也会增加,这将增加模型训练的难度,而通过包外样本能够对样本的故障特征进行重要性度量从而删减部分故障特征,具体步骤如下:
1、将N个包外样本集oobi进行汇总得到总包外样本集,对于总包外样本集中的每个样本,利用训练得到的光伏阵列故障诊断模型对该样本进行测试得到该样本对应的初始包外准确率e,具体的:光伏阵列故障诊断模型中共包括N个决策树,利用其中未使用该样本进行训练的各个决策树对该样本进行测试,就能确定测试正确和测试错误的决策树的个数,从而得到初始包外准确率e。
2、该样本共包括K个故障特征,在其中第k个故障特征中加入噪声,并利用光伏阵列故障诊断模型重新对该样本进行测试得到新的包外准确率e1,计算初始包外准确率和新的包外准确率之间的差值e-e1,从而确定第k个特征的重要性度量值,K为正整数,k为参数且k的起始值为1。
3、在k<K时,令k=k+1,并再次执行上述步骤2,也即执行在其中第k个故障特征中加入噪声的步骤。直至k=K时,得到该样本的全部K个故障特征的重要性度量值。
4、利用总包外样本集中的各个样本计算得到的K个故障特征的重要性度量值总的来说是趋于一致的,但实际操作时难免有误差,因此在利用总包外样本集中的各个样本分别计算得到K个故障特征的重要性度量值后,对其汇总从而确定K个故障特征中重要性度量值最小的t个故障特征。然后对于训练样本集中的每个样本,删除样本的K个故障特征中重要性度量值最小的t个故障特征,得到处理后的训练样本集,1≤t<K。
5、基于随机森林算法利用处理后的训练样本集构建得到光伏阵列故障诊断模型。
第七步,光伏阵列故障诊断模型的测试。利用测试样本集对光伏阵列故障诊断模型进行测试,可以最终得到诊断精度、平均训练时间和测试时间等指标。按照上述列举的F1-F20,对于光伏阵列的第一级状态类型进行诊断,没有进行故障特征删减,采用改进随机森林算法和普通的随机森林算法进行故障诊断,其中按照2:1的比例划分训练样本集和测试样本集,两种算法使用相同的决策树模型,决策树数目为40,实验结果所得的指标对比如下:
诊断方法 训练时间/s 测试时间/s 诊断精度/%
普通随机森林 0.976120 0.38079 89
改进随机森林 1.472387 0.38711 91
由上表可以看出,本申请提供的基于改进随机森林的算法虽然在训练时间上稍有增加,但诊断精度更高。
二级状态分类可以看成是一级状态分类的一个子类,当光伏阵列规模较大时,其状态的排列组合较多,以短路故障状态为例,统计可得短路故障状态进行二级状态分类后的数目为49,实验结果所得的指标对比如下:同样设置决策树数目为40,决策树的平均诊断精度为64.13%,故障特征向量的维度K=19,在删除重要性度量值最小的4维故障特征后,决策树的平均诊断精度上升至72.95%,整个光伏阵列故障诊断模型的诊断精度也随之提高。
诊断方法 训练时间/s 测试时间/s 诊断精度/%
普通随机森林 2.0646 0.49109 94.49
改进随机森林 2.1171 0.50935 96.12
第八步,利用测试完成的光伏阵列故障诊断模型对待诊断光伏阵列进行诊断,也即利用N个决策树对各个典型运行状态进行投票,投票时采用赋权投票的方式,也即每个决策树将自身对应的权值作为票数投出。
在投票完成后,统计得到各个典型运行状态对应的投票结果,然后根据各个典型运行状态对应的投票结果得到待诊断光伏阵列的故障诊断结果,得到的故障诊断结果用于指示光伏阵列中的各个光伏电池组件的运行状态,具体的:
1)、检测得到最高的投票数的典型运行状态的数量。
2)、若最高的投票数对应的典型运行状态仅包括一个,则直接将最高的投票数对应的典型运行状态作为故障诊断结果输出,否则执行如下步骤3)。
3)、在最高的投票数对应的典型运行状态包括至少两个时,本申请创造性的加入了平局处理策略,也即选取权值最高的L个决策树对各个典型运行状态重新进行投票,L为正整数且2≤L<N,根据实际需要选择。若存在一个典型运行状态获得最多个决策树的选择,则将典型运行状态作为故障诊断结果输出;否则将权值最高的决策树选择的典型运行状态作为故障诊断结果输出。比如,以L=3为例,在重新投票时,若存在两个决策树的投票结果相同,则输出该结果,否则输出权值最高的决策树的投票结果。
以上所述的仅是本申请的优选实施方式,本发明不限于以上实施例。可以理解,本领域技术人员在不脱离本发明的精神和构思的前提下直接导出或联想到的其他改进和变化,均应认为包含在本发明的保护范围之内。

Claims (7)

1.一种基于改进随机森林算法的光伏阵列故障诊断方法,其特征在于,所述方法包括:
确定光伏阵列在运行过程中的典型运行状态,所述光伏阵列包括n个支路,每个支路中包括m个光伏电池组件,所述光伏电池组件的典型运行状态用于指示所述光伏电池组件中的各个光伏电池组件的运行状态,m和n均为正整数;
在所述光伏阵列处于每个所述典型运行状态时,采集所述光伏阵列的阵列干路参数、各个支路对应的阵列支路参数以及不同支路之间的阵列间电压差;
根据所述阵列干路参数、阵列支路参数以及阵列间电压差构建故障特征向量,根据所述故障特征向量构建得到所述光伏阵列的数据样本集,将所述数据样本集划分为训练样本集和测试样本集;
基于随机森林算法利用所述训练样本集训练得到光伏阵列故障诊断模型,并利用所述测试样本集对所述光伏阵列故障诊断模型进行测试,所述光伏阵列故障诊断模型中包括N个决策树,N为正整数且N≥2;
利用测试完成的所述光伏阵列故障诊断模型对待诊断光伏阵列进行诊断,得到所述N个决策树对各个所述典型运行状态的投票结果;
根据各个所述典型运行状态对应的投票结果得到所述待诊断光伏阵列的故障诊断结果,所述故障诊断结果用于指示所述光伏阵列中的各个光伏电池组件的运行状态。
2.根据权利要求1所述的方法,其特征在于,
所述阵列干路参数和每个所述阵列支路参数分别包括电路的最大功率点电压、最大功率点电流、开路电压和短路电流。
3.根据权利要求1或2所述的方法,其特征在于,所述光伏阵列故障诊断模型中包括N个决策树及每个所述决策树对应的权值,则所述利用测试完成的所述光伏阵列故障诊断模型对待诊断光伏阵列进行诊断,包括:
所述N个决策树对各个所述典型运行状态进行投票,每个所述决策树将自身对应的权值作为票数投出;
统计得到各个所述典型运行状态对应的投票结果。
4.根据权利要求3所述的方法,其特征在于,所述基于随机森林算法利用所述训练样本集训练得到光伏阵列故障诊断模型,包括:
对包含p个样本的训练样本集进行N轮抽样,对于每一轮抽样,采用有放回的抽样方式抽样p次得到该轮抽样对应的子训练样本集和包外样本集,所述子训练集中包括该轮抽样中抽取到的p个样本,所述包外样本集中包括所述训练样本集中在该轮抽样中未被抽取的样本,p为正整数;
根据每一轮抽样对应的子训练样本集训练得到一个决策树,并利用该轮抽样对应的包外样本集对所述决策树进行测试得到包外准确率,根据所述包外准确率计算得到所述决策树对应的权值;
对训练得到的N个决策树和每个决策树对应的权值进行汇总得到所述光伏阵列故障诊断模型。
5.根据权利要求4所述的方法,其特征在于,所述根据所述包外准确率计算得到所述决策树对应的权值,包括计算:
其中,w(i)为第i个决策树对应的权值,Hoob(i)为第i个决策树对应的包外准确率,i和j均为参数,1≤i≤N且i为正整数。
6.根据权利要求4所述的方法,其特征在于,所述方法还包括:
将N个所述包外样本集进行汇总得到总包外样本集,对于所述总包外样本集中的每个样本,利用训练得到的所述光伏阵列故障诊断模型对所述样本进行测试得到初始包外准确率;
所述样本共包括K个故障特征,在其中第k个故障特征中加入噪声,并利用所述光伏阵列故障诊断模型重新对所述样本进行测试得到新的包外准确率,计算所述初始包外准确率和新的包外准确率之间的差值确定所述第k个特征的重要性度量值,K为正整数,k为参数且k的起始值为1;
在k<K时,令k=k+1,并再次执行所述在其中第k个故障特征中加入噪声的步骤;直至k=K时得到所述K个故障特征的重要性度量值;
对于所述训练样本集中的每个样本,删除所述样本的K个故障特征中重要性度量值最小的t个故障特征,得到处理后的训练样本集;
基于随机森林算法利用处理后的所述训练样本集构建得到光伏阵列故障诊断模型。
7.根据权利要求3所述的方法,其特征在于,所述根据各个所述典型运行状态对应的投票结果得到所述待诊断光伏阵列的故障诊断结果,包括:
若最高的投票数对应的典型运行状态仅包括一个,则将最高的投票数对应的典型运行状态作为所述故障诊断结果输出;
若最高的投票数对应的典型运行状态包括至少两个,则选取权值最高的L个决策树对各个所述典型运行状态重新进行投票,若存在一个典型运行状态获得最多个决策树的选择,则将所述典型运行状态作为所述故障诊断结果输出;否则将权值最高的决策树选择的典型运行状态作为所述故障诊断结果输出,L为正整数且2≤L<N。
CN201810907602.3A 2018-08-10 2018-08-10 一种基于改进随机森林算法的光伏阵列故障诊断方法 Pending CN109039281A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201810907602.3A CN109039281A (zh) 2018-08-10 2018-08-10 一种基于改进随机森林算法的光伏阵列故障诊断方法
RU2019127993A RU2734017C1 (ru) 2018-08-10 2018-08-22 Способ диагностики неисправностей фотогальванических массивов, основанный на усовершенствованном алгоритме случайного леса
PCT/CN2018/101743 WO2020029327A1 (zh) 2018-08-10 2018-08-22 一种基于改进随机森林算法的光伏阵列故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810907602.3A CN109039281A (zh) 2018-08-10 2018-08-10 一种基于改进随机森林算法的光伏阵列故障诊断方法

Publications (1)

Publication Number Publication Date
CN109039281A true CN109039281A (zh) 2018-12-18

Family

ID=64632631

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810907602.3A Pending CN109039281A (zh) 2018-08-10 2018-08-10 一种基于改进随机森林算法的光伏阵列故障诊断方法

Country Status (3)

Country Link
CN (1) CN109039281A (zh)
RU (1) RU2734017C1 (zh)
WO (1) WO2020029327A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111245365A (zh) * 2020-01-09 2020-06-05 南京工业大学 基于动态加权深度森林的光伏组件故障诊断方法
CN112818587A (zh) * 2021-01-08 2021-05-18 北京理工大学 一种基于分治Q-learning算法的光伏阵列重构方法
CN113159601A (zh) * 2021-04-30 2021-07-23 国网湖北省电力有限公司武汉供电公司 一种基于dbscan聚类算法的光伏电站运行状态分析方法
CN114336742A (zh) * 2021-12-22 2022-04-12 浙江大学 一种基于自适应神经网络的太阳能光伏控制器

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113554177B (zh) * 2020-04-02 2023-10-03 北京航空航天大学 一种基于软决策的卫星电源***自主故障诊断方法
CN111506998B (zh) * 2020-04-15 2022-02-08 哈尔滨工业大学 一种构建机电产品制造过程参数漂移故障特征样本库的方法
CN112578794B (zh) * 2020-12-12 2023-09-01 云南昆船智能装备有限公司 基于机器学习的agv故障检测方法、存储介质及***
CN112949198B (zh) * 2021-03-10 2024-04-12 阳光电源股份有限公司 光伏组串的故障检测方法、装置及计算机存储介质
CN113489457B (zh) * 2021-06-01 2022-08-16 厦门科华数能科技有限公司 光伏组件故障检测方法及装置
CN113552443B (zh) * 2021-06-08 2022-12-02 广西大学 基于交直流脉冲和随机森林的混连高压线路故障识别方法
CN113625108B (zh) * 2021-08-02 2022-11-01 四川轻化工大学 一种柔性直流配电网故障识别方法
CN114022782B (zh) * 2021-11-01 2024-05-10 中国石油大学(华东) 一种基于modis卫星数据的海雾探测方法
CN115940806B (zh) * 2023-01-10 2023-05-23 柏腾数科(杭州)科技有限公司 一种光伏发电***及其故障诊断方法
CN116910668B (zh) * 2023-09-11 2024-04-02 国网浙江省电力有限公司余姚市供电公司 一种避雷器故障预警方法、装置、设备及存储介质
CN117235617A (zh) * 2023-11-10 2023-12-15 兰州理工大学 沙尘天气下基于ml-rfknn的光伏阵列故障诊断方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106997669A (zh) * 2017-05-31 2017-08-01 青岛大学 一种基于特征重要性的判断交通拥堵成因的方法
CN108062571A (zh) * 2017-12-27 2018-05-22 福州大学 基于差分进化随机森林分类器的光伏阵列故障诊断方法
CN108510507A (zh) * 2018-03-27 2018-09-07 哈尔滨理工大学 一种融合加权随机森林的3d椎骨ct图像主动轮廓分割方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5196607B2 (ja) * 2011-06-10 2013-05-15 株式会社システム・ジェイディー 故障診断方法及び被診断体
JP6209412B2 (ja) * 2013-09-27 2017-10-04 株式会社日立製作所 太陽光発電システムの故障診断システム及び故障診断方法
RU2582064C1 (ru) * 2014-12-16 2016-04-20 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и системы эффективного автоматического распознавания символов с использованием леса решений
CN104753461B (zh) * 2015-04-10 2017-04-12 福州大学 基于粒子群优化支持向量机的光伏发电阵列故障诊断与分类方法
US10523010B2 (en) * 2016-11-08 2019-12-31 Sunpower Corporation Energy flow prediction for electric systems including photovoltaic solar systems
CN106961249B (zh) * 2017-03-17 2019-02-19 广西大学 一种光伏阵列故障诊断和预警方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106997669A (zh) * 2017-05-31 2017-08-01 青岛大学 一种基于特征重要性的判断交通拥堵成因的方法
CN108062571A (zh) * 2017-12-27 2018-05-22 福州大学 基于差分进化随机森林分类器的光伏阵列故障诊断方法
CN108510507A (zh) * 2018-03-27 2018-09-07 哈尔滨理工大学 一种融合加权随机森林的3d椎骨ct图像主动轮廓分割方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
贺捷: "随机森林在文本分类中的应用", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111245365A (zh) * 2020-01-09 2020-06-05 南京工业大学 基于动态加权深度森林的光伏组件故障诊断方法
CN111245365B (zh) * 2020-01-09 2020-12-15 南京工业大学 基于动态加权深度森林的光伏组件故障诊断方法
CN112818587A (zh) * 2021-01-08 2021-05-18 北京理工大学 一种基于分治Q-learning算法的光伏阵列重构方法
CN112818587B (zh) * 2021-01-08 2023-03-21 北京理工大学 一种基于分治Q-learning算法的光伏阵列重构方法
CN113159601A (zh) * 2021-04-30 2021-07-23 国网湖北省电力有限公司武汉供电公司 一种基于dbscan聚类算法的光伏电站运行状态分析方法
CN114336742A (zh) * 2021-12-22 2022-04-12 浙江大学 一种基于自适应神经网络的太阳能光伏控制器
CN114336742B (zh) * 2021-12-22 2023-10-27 浙江大学 一种基于自适应神经网络的太阳能光伏控制器

Also Published As

Publication number Publication date
RU2734017C1 (ru) 2020-10-12
WO2020029327A1 (zh) 2020-02-13

Similar Documents

Publication Publication Date Title
CN109039281A (zh) 一种基于改进随机森林算法的光伏阵列故障诊断方法
CN109150104A (zh) 一种基于随机森林算法的光伏阵列故障诊断方法
Spataru et al. Diagnostic method for photovoltaic systems based on light I–V measurements
US8446042B2 (en) Photovoltaic array systems, methods, and devices with improved diagnostics and monitoring
CN107395121B (zh) 基于格拉布斯准则及离群点检测光伏阵列故障检测方法
CN109660206B (zh) 一种基于Wasserstein GAN的光伏阵列故障诊断方法
CN107395119B (zh) 一种光伏阵列的故障定位方法
Chine et al. Fault diagnosis in photovoltaic arrays
Zaki et al. Deep‐learning–based method for faults classification of PV system
CN106021806A (zh) 一种基于核函数极限学习机的光伏组串故障诊断方法
CN108805256A (zh) 基于布谷鸟算法与bp神经网络的光伏组件故障诊断方法
Zaki et al. Fault detection and diagnosis of photovoltaic system using fuzzy logic control
Khelil et al. New Intelligent Fault Diagnosis (IFD) approach for grid-connected photovoltaic systems
Abd el-Ghany et al. A new monitoring technique for fault detection and classification in PV systems based on rate of change of voltage-current trajectory
Kim et al. Fault detection for photovoltaic systems using multivariate analysis with electrical and environmental variables
Chouay et al. An intelligent method for fault diagnosis in photovoltaic systems
CN113037214B (zh) 一种基于s-v曲线的光伏组件阴影遮挡故障诊断方法
Djalab et al. Robust method for diagnosis and detection of faults in photovoltaic systems using artificial neural networks
Xu et al. A fault diagnosis method for PV arrays based on new feature extraction and improved the fuzzy C-mean clustering
Hare et al. A review of faults and fault diagnosis in micro-grids electrical energy infrastructure
Aallouche et al. Online fault detection and identification for an isolated PV system using ANN
Hachana et al. Fault diagnosis of building integrated PV generator: a metaheuristic technique
Wang et al. Fault diagnosis method based on an improved KNN algorithm for PV strings
Hasegawa et al. Iv curve differences image classification by cnn for failure factor determination in pv system
Xie et al. Application of wireless sensor network technology using intelligent algorithm in mismatch detection of photovoltaic power generation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181218

RJ01 Rejection of invention patent application after publication