CN110503153B - 基于差分进化算法和支持向量机的光伏***故障诊断方法 - Google Patents

基于差分进化算法和支持向量机的光伏***故障诊断方法 Download PDF

Info

Publication number
CN110503153B
CN110503153B CN201910792292.XA CN201910792292A CN110503153B CN 110503153 B CN110503153 B CN 110503153B CN 201910792292 A CN201910792292 A CN 201910792292A CN 110503153 B CN110503153 B CN 110503153B
Authority
CN
China
Prior art keywords
parameters
support vector
vector machine
data
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910792292.XA
Other languages
English (en)
Other versions
CN110503153A (zh
Inventor
张文颖
王润琛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN201910792292.XA priority Critical patent/CN110503153B/zh
Publication of CN110503153A publication Critical patent/CN110503153A/zh
Application granted granted Critical
Publication of CN110503153B publication Critical patent/CN110503153B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Photovoltaic Devices (AREA)

Abstract

基于差分进化算法和支持向量机的光伏***故障诊断方法,涉及光伏发电***故障诊断技术领域,为解决现有技术中光伏发电***故障检测时速度慢并且准确率低的问题,本发明将故障诊断转化为一种多分类问题,用MSVM算法实现了对其故障的检测;本发明采用DE算法对MSVM的参数p和C进行参数寻优,找到适应于当前模型的最优参数;本发明建立的MSVM算法基于最优的p和C,在样本较小的情况下也具有良好的泛化能力,可以有效提高光伏发电***故障检测的速度和准确率,准确率提高11%。

Description

基于差分进化算法和支持向量机的光伏***故障诊断方法
技术领域
本发明涉及光伏发电***故障诊断技术领域,具体为一种基于差分进化算法和支持向量机的光伏***故障诊断方法。
背景技术
在21世纪,常规能源是很有限的,特别是在中国,中国的一次能源储量远远低于世界的平均水平,大约只有世界总储量的10%。而且一次次能源危机的到来以及温室效应的加剧,人们越发认识到清洁能源的重要性,因此在中国,作为清洁和可再生能源的光伏发电越来越受到人们的重视,预计到2020年,我国光伏产业的年产量可以达到2.7亿平方米。
相较于传统能源发电,光伏发电具有更多的优点:其成本较低,不需要修建大型工程,也不需要选定特定的地点,只要阳光充足的地方即可建立一个小型发电站。而与传统发电相比,其最大的特点就是清洁与可持续,太阳能取之不尽,用之不竭,故而越发受到人们的认可与关注。
光伏发电站相较于传统发电站的受影响程度很低,其只受到天气状态的影响。晴天、阴天、雨天的时候,发电量都会有较为明显的变化,而四季与昼夜变化对发电量也有很大的影响。为了检测光伏发电***是否正常工作,光伏发电站会安装气象仪等设备来得出当前的相对湿度、露点温度等数据,再结合光伏发电***的电流、功率等数据根据以往的经验判断光伏发电***是否存在故障。这个办法的缺点是过于依靠人工的经验,具有不确定性,准确性没有保障[1]
光伏组件的平均寿命为20~30年,但由于实际应用中的各种问题,组件运行10年以上的时间后,可能出现一系列问题,从而导致***产生故障。常见的故障有:光伏电池板的破裂或被遮挡、光伏***出现零件老化、光伏阵列热斑现象等。在日常维护中,若是能够快速判断是否故障,从而对故障进行进行警报,对节约成本、延长使用寿命是十分有意义的,并能增强光伏发电***的安全性、排除隐患。
我们为了提高光伏发电***的发电效率以及对光伏发电***的保养与维护,同时为了避免人工的不确定性以及降低成本,通过使用机器学习的方法可以利用当前光伏发电***的历史数据来判断当前时刻的天气状态,进而判断出光伏发电***是否有故障。
目前,国内外的厂家都普遍采用安装气象仪的办法来监测光伏发电***是否出现故障,而判断其是否存在故障的算法模型各国学者都有着不同的方法。如红外图像检测法、基于多传感器检测法等等,有的学者还研究出一种利用不同因素所引发的伏安特性变化来分析光伏发电***的故障的方法。不过这些方法都有着不足之处:红外图像检测法无法精确区分温差不明显的区域,而且所需费用较高;基于多传感器检测法需要的传感器过多,难以进行推广;其他的一些方法也有着诸如无法实时监测、精确度不高、依赖于人工的经验等等缺点。
而随着大数据技术的快速发展,我们有了更好的故障诊断的方法,我们可以通过对光伏***的状态进行监测并对其参数进行估计和预测,并建立相关数学模型来判断是否存在故障。有学者就建立了基于RBF神经网络算法的光伏阵列故障诊断模型[1],并利用粒子群算法对其进行优化[2];还有学者利用小波变换相关原理进行故障诊断[3]。文献[4]中有学者建立了支持向量机(Support Vector Machine,SVM)模型来对其进行故障诊断,但是该方法计算速度很慢,不利于实时监测,并且计算准确率也不够高。
支持向量机,简称SVM,在解决小样本和非线性分类问题中表现出许多相较于其他算法特有的优势。SVM方法可以得到全局最优解,在小样本的训练条件下具有较好泛化能力,它是一个凸二次规划问题。光伏发电***各数据的测量需要时间成本,因此为了节约时间成本,采集的数据不会太多,因此这样的算法尤其适合本问题。本发明中采用文献[5]中Crammer-Singer型的多分类支持向量机,简称MSVM,解决多分类的问题。
由于支持向量机中核函数及其参数的选取没有现成的经验公式,因而选择恰当的核函数及其参数是这个算法成败的关键问题。相比文献[4]本文有两点创新:(1)用差分进化算法选取支持向量机的核函数的参数、软间隔系数。计算速度大幅度提升,准确率更高。(2)选取的样本更少,减少数据采集的时间成本,便于实际应用。
差分进化算法简称DE,由于差分进化算法是一种随机并行的搜索算法,它能保留种群的全局搜索机制,采用基于差分的变异和选择机制,降低了计算的复杂程度。从算法原理分析,差分进化算法与文献[4]中所用的粒子群算法相比较,粒子群算法更适合于单目标优化,处理高维多目标优化问题时容易收敛于局部区域,并且计算速度较慢;差分进化算法结构简单、收敛速度快、具有较高的鲁棒性,更适合高维多目标的参数寻优的问题。当迭代到后期时,种群中个体的差异会比较小,也使得该算法拥有较强的局部搜索能力。因此我们运用差分进化算法对支持向量机的核函数参数p和软间隔参数C进行优化。
目前,公开的文献中及专利中,尚未有将差分进化算法优化支持向量机算法的先例,并且也没有将该方法应用于光伏发电***故障诊断中的先例。
发明内容
本发明的目的是:针对现有技术中光伏发电***故障检测时速度慢并且准确率低的问题,提出一种基于差分进化算法和支持向量机的光伏***故障诊断方法。
本发明为了解决上述技术问题采取的技术方案是:基于差分进化算法和支持向量机的光伏***故障诊断方法,包括以下步骤:
步骤一:采集正常工作状态下的光伏发电***的发电数据以及部分天气数据作为输入样本,将同一时间对应的天气状态作为输出样本,所述发电数据包括电压和功率,所述部分天气数据包括采集时间、大气温度、相对湿度、露点温度和太阳辐照度,所述天气状态包括晴天、多云天和下雨天;
步骤二:对步骤一中获取的输入样本数据进行主成分分析;
步骤三:将步骤二中处理后的输入样本数据和输出样本组合得到样本集;
步骤四:将样本集分成训练集和测试集,在训练集中将预测准确率作为适应度函数,采用DE算法寻找到最优的一组MSVM核函数的参数p和软间隔系数C;
步骤五:在测试集中,根据步骤四计算出的最优参数p和C,利用MSVM模型对测试集中的样本进行测试,得到其准确率;
步骤六:利用所述步骤五建立的MSVM模型对光伏发电***工作时采集的数据进行分析,判断出***是否处于正常工作状态。
进一步的,所述步骤二中主成分分析的具体步骤为:
步骤二一:对原始数据进行标准化处理;
步骤二二:搜索出c个规范正交向量,作为标准化原始数据的基;
步骤二三:对主成分按照重要性降序排序,使得第一个主成分的数据方差最大,第二个其次,并以此类推;
步骤二四:去掉这些主成分中重要性较低的成分,即方差最小的成分,重构原始数据。
进一步的,所述标准化处理按下式进行:
Figure GDA0003011708790000031
其中P(i)表示第i时刻(6≤i≤18)的某个输入变量的值,Pmin(i)和Pmax(i)表示该变量在样本集中的最小值和最大值,P*(i)为标准化之后的变量值(0≤P*(i)≤10)。
进一步的,所述步骤四中MSVM核函数的选择为径向基核函数,即RBF核函数:
Figure GDA0003011708790000041
其中p为RBF核函数系数,x与xi为样本集中的两组向量样本。
进一步的,所述步骤四中采用DE算法寻找到最优的RBF核函数参数p和软间隔系数C的具体步骤为:
步骤四一:初始化种群,并初始化MSVM的软间隔参数C和RBF核函数参数p;
步骤四二:取DE的适应度函数为:
Figure GDA0003011708790000042
其中number1、number2和number3分别为晴天、多云天和下雨天的预测准确的天数,mtest指的是训练集中的向量个数,即训练集中数据的总数;
步骤四三:随机生成初始种群,初始种群为2×20的矩阵,对初始种群中的每一列,即每一个目标个体xi'=(pi,Ci)T,(i=1,2,…,20),计算这组参数对应的适应度值,选择适应度最优的一组参数作为初始的最优的一组参数(pbest,Cbest),pi表示第i组中支持向量机的核函数参数,Ci表示第i组中支持向量机的软间隔参数,pbest表示最优的支持向量机的核函数参数,Cbest表示最优的支持向量机的软间隔参数;
步骤四四:对初始种群的每一列,即每个目标个体都进行变异、交叉和选择,并计算经过变异、杂交和选择后所得到的个体的适应度的值,将得到的这个值与(pbest,Cbest)对应的适应度值进行比较,如果这组参数对应的适应度值更优则重新设置其为(pbest,Cbest);
步骤四五:当达到迭代次数或者适应值满足条件时,停止迭代,获得最优的一组的MSVM参数;否则返回步骤四三。
进一步的,所述变异的过程如下:
对于每一个目标个体xi′,首先得到一个变异的个体:
Figure GDA0003011708790000043
r1,r2,r3∈{1,2,…,20},为互不相同的整数,并且r1,r2,r3与当前的目标向量的下标i不同,
Figure GDA0003011708790000044
Figure GDA0003011708790000045
表示种群中两个不同的个体,F∈[0,2],F为缩放因子。
进一步的,所述交叉的过程如下:
首先对于种群中的目标个体xi′,将其与变异向量vi通过交叉方程进行计算,产生新的个体ui,设xi'=(xi1,xi2)T,vi=(vi1,vi2)T,ui=(ui1,ui2)T,交叉方程为:
Figure GDA0003011708790000051
上式中j表示个体中的第j个元素,j=1,2,rand(j)∈[0,1]是均匀分布的一个随机数,CR∈[0,1]为杂交概率,rand(i)为集合{1,2}中随机选择的一个数。
进一步的,所述选择的过程如下:首先将经过变异与交叉产生的个体ui与xi′的适应度的值进行比较,当ui的适应度的值比xi′更优时,用ui替代xi′,否则保留xi′不变。
本发明的有益效果是:
(1)本发明将故障诊断转化为一种多分类问题,用MSVM算法实现了对其故障的检测;
(2)本发明采用DE算法对MSVM的参数p和C进行参数寻优,找到适应于当前模型的最优参数;
(3)本发明建立的MSVM算法基于最优的p和C,在样本较小的情况下也具有良好的泛化能力,可以有效提高光伏发电***故障检测的速度和准确率,准确率提高11%。
附图说明
图1为本发明多分类支持向量机预测天气状态的框图。
图2为本发明输出功率与天气类型的关系图。
具体实施方式
具体实施方式一:参照图1和图2具体说明本实施方式,本实施方式所述的基于差分进化算法和支持向量机的光伏***故障诊断方法,其特征在于包括以下步骤:
步骤S1:采集正常工作状态下的光伏发电***的发电数据(包括电压和功率)以及部分天气数据(包括时间、大气温度、相对湿度、露点温度和太阳辐照度)作为输入样本,将同一时间对应的天气状态(包括晴天、多云天和下雨天)作为输出样本;
步骤S2:对步骤S1中获取的输入样本数据进行主成分分析;
步骤S3:将步骤S2中处理后的输入样本数据和输出样本组合得到样本集;
步骤S4:将样本集分成训练集和测试集,在训练集中将预测准确率作为适应度函数,采用DE算法寻找到最优的一组MSVM核函数的参数p和软间隔系数C;
步骤S5:在测试集中,根据步骤S4计算出的最优参数p和C,利用MSVM模型对测试集中的样本进行测试,得到其准确率;
步骤S6:利用所述步骤S5建立的MSVM模型对光伏发电***工作时采集的数据进行分析,判断出***是否处于正常工作状态。
步骤S5中的准确率相当于将来用此模型进行预测时的准确率。
具体实施方式二:本实施方式是对具体实施方式一所述的作进一步说明,本实施方式与具体实施方式一的区别是所述步骤S2中对样本进行主成分分析(简称PCA)处理的具体方法为:
(1)对原始数据进行标准化处理,使其均值变为零,确保具有大定义域的数据不会主宰定义域小的数据。
(2)搜索出c个规范正交向量,以此作为标准化原始数据的基。这些向量被称为主成分,原始数据可以由主成分的线性组合得来。
(3)对主成分按照重要性降序排序,使得第一个主成分的数据方差最大,第二个其次,并以此类推。
(4)去掉这些主成分中重要性较低的成分,即方差最小的成分,以此来重构原始数据。得到其近似值。因为重构的数据不会和原来的数据完全对等,所以会有误差。但是这个误差不会太大,10%以内。
具体实施方式三:本实施方式是对具体实施方式二所述的作进一步说明,本实施方式与具体实施方式二的区别是对样本数据按照下式进行标准化处理:
Figure GDA0003011708790000061
其中P(i)表示第i时刻(6≤i≤18)的某个输入变量的值,Pmin(i)和Pmax(i)表示该变量在样本集中的最小值和最大值,P*(i)为标准化之后的变量值(0≤P*(i)≤10)。
具体实施方式四:本实施方式是对具体实施方式一所述的作进一步说明,本实施方式与具体实施方式一的区别是所述步骤S4中,MSVM核函数的选择为径向基核函数,即RBF核函数:
Figure GDA0003011708790000062
其中p为RBF核函数系数,x与xi为样本集中的两组向量样本。
具体实施方式五:本实施方式是对具体实施方式一所述的作进一步说明,本实施方式与具体实施方式一的区别是步骤S4中采用DE算法寻找到最优的RBF核函数参数p和软间隔系数C的具体步骤为:
步骤S41:初始化种群,并初始化MSVM的软间隔参数C和RBF核函数参数p;
步骤S42:取DE的适应度函数为:
Figure GDA0003011708790000071
其中number1、number2和number3分别为晴天、多云天和下雨天的预测准确的天数,在这里的“预测准确”指的是:在训练集中的输入数据,根据多分类支持向量机模型预测出的对应天气状态,与训练集对应的实际天气状态进行对比,一致的则称为预测准确。mtest指的是训练集中的向量个数,也就是训练集中数据的总数;
步骤S43:随机生成初始种群,本例中,初始种群是2×20的矩阵。对初始种群中的每一列,即每一个目标个体xi'=(pi,Ci)T,(i=1,2,…,20),计算这组参数对应的适应度值,选择适应度最优的参数作为初始的最优的一组参数(pbest,Cbest),pi表示第i组中支持向量机的核函数参数,Ci表示第i组中支持向量机的软间隔参数,pbest表示最优的支持向量机的核函数参数,Cbest表示最优的支持向量机的软间隔参数;
步骤S44:对初始种群的每一列,即每个个体都进行变异、交叉和选择,并计算经过变异、杂交和选择后得到的个体的适应度的值,将得到的这个值与(pbest,Cbest)对应的适应度值进行比较,如果这组参数对应的适应度值更优则重新设置其为(pbest,Cbest)。
步骤S45:当达到迭代次数或者适应值满足条件时,停止迭代,获得最优的一组的MSVM参数;否则返回步骤S43。
具体实施方式六:本实施方式是对具体实施方式五所述的作进一步说明,本实施方式与具体实施方式五的区别是所述变异的过程如下:
对于每一个目标个体xi′,首先得到一个变异的个体:
Figure GDA0003011708790000072
r1,r2,r3∈{1,2,…,20},为互不相同的整数,并且r1,r2,r3与当前的目标向量的下标i不同,
Figure GDA0003011708790000081
Figure GDA0003011708790000082
表示种群中两个不同的个体。F∈[0,2]为缩放因子,用来控制差分向量缩放程度。
具体实施方式七:本实施方式是对具体实施方式六所述的作进一步说明,本实施方式与具体实施方式六的区别是所述交叉的过程如下:交叉过程就是对于种群中的目标个体xi′,将其与变异向量vi进行通过交叉方程进行计算,产生新的个体ui的过程。
设xi'=(xi1,xi2)T,vi=(vi1,vi2)T,ui=(ui1,ui2)T,交叉方程为:
Figure GDA0003011708790000083
上式中j表示个体中的第j个元素,j=1,2,rand(j)∈[0,1]是均匀分布的一个随机数,CR∈[0,1]为杂交概率,rand(i)为集合{1,2}中随机选择的一个数,其中,(xi1,xi2)T表示xi'的坐标,vi=(vi1,vi2)T和ui=(ui1,ui2)T同理。vij表示vi的分向量,xi'j表示xi'的分向量。
具体实施方式八:本实施方式是对具体实施方式七所述的作进一步说明,本实施方式与具体实施方式七的区别是所述交叉的过程如下:
选择过程就是将经过变异与交叉产生的个体ui与xi′的适应度的值进行比较,当ui的适应度比xi′更优时,用ui替代xi′,否则保留xi′不变。
实施例:
本实施例提供了一种基于差分进化算法优化的多分类支持向量机的光伏***故障诊断方法,流程框图如图1所示,从图2中我们可以看出光伏发电***的输出功率和天气类型的关系,这种关系显然不是线性可分的,而在这里我们利用MSVM正是由于MSVM算法更适合于处理这种线性不可分的问题。
流程具体包括以下步骤:
步骤S1:采集正常工作状态下的光伏发电***的发电数据(包括电压和功率)以及部分天气数据(包括时间、大气温度、相对湿度、露点温度和太阳辐照度)作为输入样本,将同一时间对应的天气状态(包括晴天、多云天和下雨天)作为输出样本;
步骤S2:对步骤S1中获取的输入样本数据进行主成分分析;
步骤S3:将步骤S2中处理后的输入样本数据和输出样本组合得到样本集;
步骤S4:将样本集分成训练集和测试集,在训练集中将预测准确率作为适应度函数,采用DE算法寻找到最优的一组MSVM核函数的参数p和软间隔系数C;
步骤S5:在测试集中,根据步骤S4计算出的最优参数p和C,利用MSVM模型对测试集中的样本进行测试,得到其准确率;
步骤S6:利用所述步骤S5建立的MSVM模型对光伏发电***工作时采集的数据进行分析,判断出***是否处于正常工作状态。
本项目中采集的数据来自于沈阳市的一个小型光伏发电站,数据采集于2015年5月份,每天的早上6点到晚上6点,每间隔一个小时测一次,共测得220个有效样本,这些数据都是在光伏***正常工作的状态下测得的。训练集和测试集的具体比例与个数具体为:
表1训练集与测试集样本数
晴天样本数 多云天样本数 下雨天样本数 总样本数
训练集 89 25 18 132
测试集 64 14 10 88
步骤S4中采用DE算法寻找到最优的RBF核函数系数p和软间隔参数C的具体步骤为:
步骤S41:初始化种群,并初始化MSVM的软间隔系数C和RBF核函数参数p。设定p和C的取值范围在上界100与下界0.01之间;
步骤S42:取DE的适应度函数为:
Figure GDA0003011708790000091
其中number1、number2和number3分别为晴天、多云天和下雨天的预测准确的天数,在这里的“预测准确”指的是:在训练集中的输入数据,根据多分类支持向量机模型预测出的对应天气状态,与训练集对应的实际天气状态进行对比,一致的则称为预测准确。mtest指的是训练集中的向量个数,也就是训练集中数据的总数。由于适应度函数为负数,并且有-1≤f≤0,差分进化算法运算过程中将保留实验个体与目标个体中适应度函数值更小的;
步骤S43:随机生成初始种群,本例中,初始种群是2×20的矩阵。对初始种群中的每一列,即每一个目标个体xi'=(pi,Ci)T,(i=1,2,…,20),计算这组参数对应的适应度值,选择适应度最优的参数作为初始的最优的一组参数(pbest,Cbest),pi表示第i组中支持向量机的核函数参数,Ci表示第i组中支持向量机的软间隔参数,pbest表示最优的支持向量机的核函数参数,Cbest表示最优的支持向量机的软间隔参数;
步骤S44:对初始种群的每一列,即每个个体都进行变异、交叉和选择,并计算经过变异、杂交和选择后得到的个体的适应度的值,将这个值与(pbest,Cbest)对应的适应度值进行比较,如果这组参数对应的适应度值更优则重新设置其为(pbest,Cbest)。其中变异、交叉和选择的过程如下:
对于每一个目标个体xi′,首先得到一个变异的个体:
Figure GDA0003011708790000101
r1,r2,r3∈{1,2,…,20},为互不相同的整数,并且r1,r2,r3与当前的目标向量的下标i不同,
Figure GDA0003011708790000102
Figure GDA0003011708790000103
表示种群中两个不同的个体。F∈[0,2]为缩放因子,用来控制差分向量缩放程度。
交叉过程就是对于种群中的目标个体xi′,将其与变异向量vi进行通过交叉方程进行计算,产生新的个体ui的过程。设xi'=(xi1,xi2)T,vi=(vi1,vi2)T,ui=(ui1,ui2)T,交叉方程为:
Figure GDA0003011708790000104
上式中j表示个体中的第j个元素,j=1,2,rand(j)∈[0,1]是均匀分布的一个随机数,CR∈[0,1]为杂交概率,randn(i)为集合{1,2}中随机选择的一个数。
选择过程就是将经过变异与交叉产生的个体ui与xi′的适应度的值进行比较,当ui的适应度比xi′更优时,用ui替代xi′,否则保留xi′不变。
步骤S45:当达到迭代次数或者适应值满足条件时,停止迭代,获得最优的一组的MSVM参数;否则返回步骤S43。
经过调试,我们找到了较为合适的一组差分进化算法的相关参数:缩放因子F=0.9、杂交概率CR=0.5、迭代次数GEN=100、上界L=0.01、下界H=100,终止条件定为晴天、多云天和下雨天的预测准确率都分别大于70%,经过一段时间的寻优,得到了一组最合适的参数:(p,C)=(7.8693,87.0664),将这组参数代入多分类支持向量机模型得到了一个最优解,解的总预测准确率为80.68%,其中晴天的预测准确率为90.63%、多云天的预测准确率为50%、下雨天的准确率为60%。可以看出最终得到的结果并没有达到终止目标的要求,因此这个解是在参数寻优过程中得到的总预测准确率最大的一个解。下表是MSVM模型与用差分进化算法优化的MSVM模型预测准确率的对比:
表2改进前后的模型准确率对比
Figure GDA0003011708790000111
利用模型对光伏***进行故障诊断的具体方法为:在早6:00至晚18:00的时间内,将此时具体的时间、大气温度、相对湿度、太阳辐照度等前面提到的参数代入模型,得到新模型判断出的此时的天气状态,若与实际天气状态一致,则可以诊断出光伏发电***没有故障;若与实际不符,则可以诊断出光伏发电***出了故障。
通过表2可以看到,当只运用多分类支持向量机模型时,仅能得到一个一般的结果,而将差分进化算法与多分类支持向量机结合后,则能得到一个比较满意的结果。这是因为差分进化算法优化了多分类支持向量机模型的参数,得到了更适合于本发明的MSVM模型,有着非常明显的优化效果。
文献[4]将粒子群算法与支持向量机算法相结合建立了数学模型。经过将相同样本集代入模型进行运算,优化MSVM用粒子群算法与用差分进化算法的对比结果如表3:
表3运用粒子群算法与差分进化算法的模型准确率对比
Figure GDA0003011708790000112
从表3中我们可以看到,在用粒子群算法解决本课题时,在运算时间和运算准确率方面远不如差分进化算法。在相同初始种群的情况下,运用差分进化算法的模型运行用时2187.2435s,而运用粒子群算法的模型运行用时则是5161.8947s,速度提升了2.36倍。并且,差分进化算法的总准确率提高了10.93%。因此,本算法较以往公开发表的文献中的算法有实质性的改进和提升。
我们看到本算法存在一些预测的误差,尤其在多云的天气,误差比较大,分析产生误差的原因如下:
(1)数据量与数据的范围与广度有限,比如:训练集中的阴天的情况大部分都在下午,则难以保证模型可以得到充分的训练,一旦测试集中遇到上午的阴天这样的数据,则难以得到准确的预测。解决方法为多找一些不同类型的数据放入训练集中。
(2)一天当中的天气状态的变化难以确定,测量的数据也难以非常准确,比如:在一个小时之内可能会出现多云天与晴天或者多云天与下雨天交替出现的情况,这也是产生误差的一个原因。
(3)在差分进化算法参数寻优中设定的软间隔参数C的上限为100,这可能导致最大间隔超平面不准确,影响结果的准确性。解决方法为将C的范围调整到更大一些,不过这会导致运算时间有一定程度的增加。
以上实施例是在样本数据比较少的情况下建立的模型,而实际情况中能运用的数据可能多于此实施例,因此准确率也会进一步提升。
综上所述,以上仅为本发明的实施例,凡在本发明的精神和原则之内,所作的均等变化与修饰,均应包含在本发明的保护范围之内。
引用文献:
[1]钱振,蔡世波,顾宇庆,童建军,鲍官军.光伏发电功率预测方法研究综述[J].机电工程,2015,32(05):651-659.
[2]王福忠,裴玉龙.粒子群优化RBF神经网络的光伏阵列故障诊断[J].河南理工大学学报(自然科学版),2018,37(02):93-98.
[3]Il-Song Kim.Fault Detection Algorithm of the Photovoltaic Systemusing Wavelet Transform.Power Electronics(IICPE)[A].2010India IenternationalConference[C].NetajiSubhas,New Delhi,2011:1-6.
[4]Wenying Zhang,Huaguang Zhang,JinhaiLiu,KaiLi,etc.Weatherprediction with multiclass support vector machines in the fault detection ofphotovoltaic system,IEEE/CAA Journal of automatic sinica,2017,4(3):520-525
[5]Koby Crammer;Yoram Singer.On the algorithmic implementation ofmulticlass kernel-based vector machines.Journal of machine learning research,2001,2.
需要注意的是,具体实施方式仅仅是对本发明技术方案的解释和说明,不能以此限定权利保护范围。凡根据本发明权利要求书和说明书所做的仅仅是局部改变的,仍应落入本发明的保护范围内。

Claims (7)

1.基于差分进化算法和支持向量机的光伏***故障诊断方法,包括以下步骤:
步骤一:采集正常工作状态下的光伏发电***的发电数据以及部分天气数据作为输入样本,将同一时间对应的天气状态作为输出样本,所述发电数据包括电压和功率,所述部分天气数据包括采集时间、大气温度、相对湿度、露点温度和太阳辐照度,所述天气状态包括晴天、多云天和下雨天;
步骤二:对步骤一中获取的输入样本数据进行主成分分析;
步骤三:将步骤二中处理后的输入样本数据和输出样本组合得到样本集;
步骤四:将样本集分成训练集和测试集,在训练集中将预测准确率作为适应度函数,采用DE算法寻找到最优的一组MSVM核函数的参数p和软间隔系数C;
步骤五:在测试集中,根据步骤四计算出的最优参数p和C,利用MSVM模型对测试集中的样本进行测试,得到其准确率;
步骤六:利用所述步骤五建立的MSVM模型对光伏发电***工作时采集的数据进行分析,判断出***是否处于正常工作状态;
其特征在于所述步骤四中采用DE算法寻找到最优的RBF核函数参数p和软间隔系数C的具体步骤为:
步骤四一:初始化种群,并初始化MSVM的软间隔参数C和RBF核函数参数p;
步骤四二:取DE的适应度函数为:
Figure FDA0003011708780000011
其中number1、number2和number3分别为晴天、多云天和下雨天的预测准确的天数,mtest指的是训练集中的向量个数,即训练集中数据的总数;
步骤四三:随机生成初始种群,初始种群为2×20的矩阵,对初始种群中的每一列,即每一个目标个体x′i=(pi,Ci)T,i=1,2,…,20,计算这组参数对应的适应度值,选择适应度最优的一组参数作为初始的最优的一组参数(pbest,Cbest),pi表示第i组中支持向量机的核函数参数,Ci表示第i组中支持向量机的软间隔参数,pbest表示最优的支持向量机的核函数参数,Cbest表示最优的支持向量机的软间隔参数;
步骤四四:对初始种群的每一列,即每个目标个体都进行变异、交叉和选择,并计算经过变异、杂交和选择后所得到的个体的适应度的值,将得到的这个值与(pbest,Cbest)对应的适应度值进行比较,如果这组参数对应的适应度值更优则重新设置其为(pbest,Cbest);
步骤四五:当达到迭代次数或者适应值满足条件时,停止迭代,获得最优的一组的MSVM参数;否则返回步骤四三。
2.根据权利要求1所述的基于差分进化算法和支持向量机的光伏***故障诊断方法,其特征在于所述步骤二中主成分分析的具体步骤为:
步骤二一:对原始数据进行标准化处理;
步骤二二:搜索出c个规范正交向量,作为标准化原始数据的基;
步骤二三:对主成分按照重要性降序排序,使得第一个主成分的数据方差最大,第二个其次,并以此类推;
步骤二四:去掉这些主成分中重要性较低的成分,即方差最小的成分,重构原始数据。
3.根据权利要求2所述的基于差分进化算法和支持向量机的光伏***故障诊断方法,其特征在于所述标准化处理按下式进行:
Figure FDA0003011708780000021
其中P(i)表示第i时刻的某个输入变量的值,其中6≤i≤18,Pmin(i)和Pmax(i)表示该变量在样本集中的最小值和最大值,P*(i)为标准化之后的变量值,0≤P*(i)≤10。
4.根据权利要求1所述的基于差分进化算法和支持向量机的光伏***故障诊断方法,其特征在于所述步骤四中MSVM核函数的选择为径向基核函数,即RBF核函数:
Figure FDA0003011708780000022
其中p为RBF核函数系数,x与xi为样本集中的两组向量样本。
5.根据权利要求1所述的基于差分进化算法和支持向量机的光伏***故障诊断方法,其特征在于所述变异的过程如下:
对于每一个目标个体x′i,首先得到一个变异的个体:
Figure FDA0003011708780000023
r1,r2,r3∈{1,2,…,20},为互不相同的整数,并且r1,r2,r3与当前的目标向量的下标i不同,
Figure FDA0003011708780000024
Figure FDA0003011708780000025
表示种群中两个不同的个体,F∈[0,2],F为缩放因子。
6.根据权利要求5所述的基于差分进化算法和支持向量机的光伏***故障诊断方法,其特征在于所述交叉的过程如下:
首先对于种群中的目标个体x′i,将其与变异向量vi通过交叉方程进行计算,产生新的个体ui,设x′i=(xi1,xi2)T,vi=(vi1,vi2)T,ui=(ui1,ui2)T,交叉方程为:
Figure FDA0003011708780000031
上式中j表示个体中的第j个元素,j=1,2,rand(j)∈[0,1]是均匀分布的一个随机数,CR∈[0,1]为杂交概率,rand(i)为集合{1,2}中随机选择的一个数。
7.根据权利要求6所述的基于差分进化算法和支持向量机的光伏***故障诊断方法,其特征在于所述选择的过程如下:首先将经过变异与交叉产生的个体ui与x′i的适应度的值进行比较,当ui的适应度的值比x′i更优时,用ui替代x′i,否则保留x′i不变。
CN201910792292.XA 2019-08-26 2019-08-26 基于差分进化算法和支持向量机的光伏***故障诊断方法 Active CN110503153B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910792292.XA CN110503153B (zh) 2019-08-26 2019-08-26 基于差分进化算法和支持向量机的光伏***故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910792292.XA CN110503153B (zh) 2019-08-26 2019-08-26 基于差分进化算法和支持向量机的光伏***故障诊断方法

Publications (2)

Publication Number Publication Date
CN110503153A CN110503153A (zh) 2019-11-26
CN110503153B true CN110503153B (zh) 2021-06-11

Family

ID=68589730

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910792292.XA Active CN110503153B (zh) 2019-08-26 2019-08-26 基于差分进化算法和支持向量机的光伏***故障诊断方法

Country Status (1)

Country Link
CN (1) CN110503153B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111289937A (zh) * 2020-03-06 2020-06-16 广东电网有限责任公司 一种基于de-svm的光学电流互感器误差补偿方法
CN112036456A (zh) * 2020-08-19 2020-12-04 阳光电源股份有限公司 光伏故障数据生成方法、装置及计算机可读存储介质
CN113095355B (zh) * 2021-03-03 2022-08-23 上海工程技术大学 改进差分进化算法优化随机森林的滚动轴承故障诊断方法
CN114037901B (zh) * 2021-10-25 2023-06-20 河海大学 光伏发电预测导向的实时卫星近红外图像推算方法
TWI797806B (zh) * 2021-11-01 2023-04-01 中原大學 使用3維卷積神經網路進行光伏陣列的故障分類裝置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224738A (zh) * 2015-09-23 2016-01-06 上海大学 Lssvm非高斯脉动风速预测方法
CN107644127A (zh) * 2017-09-08 2018-01-30 西安工程大学 基于imabc优化支持向量机的变压器故障诊断方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224738A (zh) * 2015-09-23 2016-01-06 上海大学 Lssvm非高斯脉动风速预测方法
CN107644127A (zh) * 2017-09-08 2018-01-30 西安工程大学 基于imabc优化支持向量机的变压器故障诊断方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Weather Prediction With Multiclass Support Vector Machines in the Fault Detection of Photovoltaic System;Wenying Zhang等;《IEEE/CAA JOURNAL OF AUTOMATICA SINICA》;20170731;第520-525页 *
基于DGA的差分进化支持向量机电力变压器故障诊断;贾立敬等;《高压电器》;20150416;第51卷(第04期);第13-18页 *

Also Published As

Publication number Publication date
CN110503153A (zh) 2019-11-26

Similar Documents

Publication Publication Date Title
CN110503153B (zh) 基于差分进化算法和支持向量机的光伏***故障诊断方法
CN109873610B (zh) 基于iv特性和深度残差网络的光伏阵列故障诊断方法
CN109842373B (zh) 基于时空分布特性的光伏阵列故障诊断方法及装置
CN112257941B (zh) 基于改进型Bi-LSTM的光伏电站短期功率预测方法
CN106779223B (zh) 一种光伏***发电功率实时预测方法及装置
CN106447098B (zh) 一种光伏超短期功率预测方法及装置
CN109002915B (zh) 基于Kmeans-GRA-Elman模型的光伏电站短期功率预测方法
CN109670553B (zh) 基于自适应神经模糊推理***的光伏阵列故障诊断方法
Munshi et al. Photovoltaic power pattern clustering based on conventional and swarm clustering methods
CN111754026B (zh) 光伏电站群功率预测方法、装置、计算机设备及存储介质
CN104573879A (zh) 基于最优相似日集的光伏电站出力预测方法
CN111444615B (zh) 一种基于k近邻和iv曲线的光伏阵列故障诊断方法
CN109086928A (zh) 基于saga-fcm-lssvm模型的光伏电站实时功率预测方法
CN114004139A (zh) 一种光伏发电功率预测方法
CN115829105A (zh) 基于历史数据特征搜索的光伏功率预测方法
CN115796004A (zh) 一种基于SLSTM和MLSTNet模型的光伏电站超短期功率智能预测方法
CN115115090A (zh) 一种基于改进lstm-cnn的风功率短期预测方法
CN112288157A (zh) 一种基于模糊聚类与深度强化学习的风电场功率预测方法
CN115271253A (zh) 一种水风光发电功率预测模型构建方法、装置及存储介质
CN115204444A (zh) 基于改进聚类分析和融合集成算法的光伏功率预测方法
CN116317937A (zh) 一种分布式光伏电站运行故障诊断方法
CN113361946B (zh) 一种基于分布式光伏并网***的电能质量评估方法及装置
CN110796292A (zh) 计及雾霾影响的光伏功率短期预测方法
CN117540859B (zh) 一种基于神经网络的光伏电站发电量的预估方法及***
CN112508278A (zh) 一种基于证据回归多模型的多联供***负荷预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant