配电网供电可靠性预测方法和***
技术领域
本发明涉及电力技术领域,特别是涉及一种配电网供电可靠性预测方法和***。
背景技术
配电网供电的安全可靠程度与国民生产生活有密切的关联,配电网供电可靠性一定程度上体现了供电企业在电网的建设、改造以及运行维护等方面的综合能力。进一步提升配电网的供电可靠性,不仅可以最大限度满足电力用户的用电需求,同时也有利于促进电网建设的进一步完善和发展。
传统的配电网供电可靠性工作重点在配电网的管理,近年来逐渐由被动管理转化为主动预防。已有相关的技术提出通过人工神经网络、支持向量机(Support VectorMachine,SVM)等方法对影响城市电网可靠性的因素进行分析,进而对配电网供电可靠性做出预测。
这些技术中虽然预测算法逐渐创新优化,但预测结果的精确度较差。
发明内容
基于此,有必要针对预测结果的精确度较差的问题,提供一种配电网供电可靠性预测方法和***。
一种配电网供电可靠性预测方法,包括以下步骤:
根据配电网的网架结构、技术装备参数、设备质量参数、故障因子以及运行维护参数选取多种影响供电可靠性的原始指标因素;
对所述原始指标因素进行标准化处理,得到标准化指标因素,计算各个标准化指标因素与预设的可靠性评价指标之间的相关系数,根据所述相关系数从所述指标因素中筛选出对供电可靠性影响较为明显的核心指标因素;
根据所述核心指标因素构建径向基函数神经网络,获取所述径向基函数神经网络的隐含层的最优中心向量、最优基宽向量和最优输出权重,根据所述最优中心向量、最优基宽向量和最优输出权重获取供电可靠性预测模型,根据所述供电可靠性预测模型对配电网供电可靠性进行预测。
一种配电网供电可靠性预测***,包括:
指标因素选取模块,用于根据配电网的网架结构、技术装备参数、设备质量参数、故障因子以及运行维护参数选取多种影响供电可靠性的原始指标因素;
原始数据筛选模块,用于对所述原始指标因素进行标准化处理,得到标准化指标因素,计算各个标准化指标因素与预设的可靠性评价指标之间的相关系数,根据所述相关系数从所述指标因素中筛选出对供电可靠性影响较为明显的核心指标因素;
预测模型训练模块,用于根据所述核心指标因素构建径向基函数神经网络,获取所述径向基函数神经网络的隐含层的最优中心向量、最优基宽向量和最优输出权重,根据所述最优中心向量、最优基宽向量和最优输出权重获取供电可靠性预测模型,根据所述供电可靠性预测模型对配电网供电可靠性进行预测。
上述配电网供电可靠性预测方法和***,选取多种影响供电可靠性的指标因素;利用相关性分析,对原始数据进行标准化处理,计算多种影响供电可靠性的指标与可靠性评价指标之间的相关系数,定性分析出对供电可靠性影响较为明显的指标;构建径向基函数神经网络并优化隐含层的中心向量、基宽向量和输出权重,完成对供电可靠性预测模型的训练。预测过程中,充分考虑了多方面的供电可靠性影响因素,适用于多输入变量的情况。利用相关性分析理论对特征指标进行预筛选处理,有效提升了径向基函数神经网络训练模型的预测精度、稳定性和泛化性能。此外,优化了径向基函数神经网络,克服了其收敛速度较慢、容易落入局部最优点的弊端,设置参数少,有效减少预测模型的训练时间,提高了预测精度。通过上述预测方法和***,在样本数据准确的情况下,可对供电可靠性进行更加全面的分析和预测,对于引导供电企业制定可靠性提升策略提供了科学有效的参考依据。
附图说明
图1为一实施例中配电网供电可靠性预测方法的流程图;
图2为一实施例中影响供电可靠性指标分类图;
图3为一实施例中影响供电可靠率RS-1主要指标对比图;
图4为一实施例中径向基函数神经网络训练流程图;
图5为一实施例中配电网供电可靠性预测***结构图。
具体实施方式
下面结合附图对本发明的技术方案进行说明。
如图1所示,本发明提供一种配电网供电可靠性预测方法,可包括以下步骤:
步骤S1:根据配电网的网架结构、配电网的技术装备参数、配电网设备质量参数、配电网故障因子以及配电网运行维护参数选取多种影响供电可靠性的原始指标因素。
配电网的供电可靠性与电网自身供应能力、运行维护水平以及外界因素密切相关。为保证对供电可靠性分析的全面性,从配电网的网架结构、配电网的技术装备参数、设备质量参数、故障因子以及运行维护参数等五个方面选取30个影响供电可靠性的指标,作为供电可靠性预测模型输入变量。其中配电网的网架结构关系到供电能力和供电稳定性,即配电网对负荷变化的承受能力和抗毁能力;技术装备参数和设备质量参数、故障因子关系到设备的故障率和故障排除时间,评价的是配网运行的防故障能力和故障发生后的快速甄别、定位、隔离能力;运行维护水平主要涉及带电作业水平以及配电网快速复电能力。
供电可靠性指标分类如图2所示。电网的网架结构的科学性和合理性是影响供电可靠性的重要因素,合理的网架结构可以在任意元件发生故障时实现电力负荷的有效转移,并尽量减少用户的停电时间;配电网技术装备水平主要包括线路的绝缘化及电缆化程度、配电网自动化建设及维护水平;配电网设备包括配电变压器、开关柜线路、杆塔、金具、避雷器等多种设备,设备的使用寿命以及发生故障的次数对于供电可靠性有着较大的影响;配电网故障主要受自然因素、外力因素以及运行维护施工的影响;配电网运行维护水平主要涉及带电作业水平以及配电网快速复电能力等等。五个方面的具体指标如表1所示。
表1影响供电可靠性指标
步骤S2:对所述原始指标因素进行标准化处理,得到标准化指标因素,计算各个标准化指标因素与预设的可靠性评价指标之间的相关系数,根据所述相关系数从所述指标因素中筛选出对供电可靠性影响较为明显的核心指标因素。
由于影响配电网供电可靠性的因素多种多样,因此需要对多种因素进行筛选,挑出核心的因素。可通过相关性分析(Correlation Analysis,CA)筛选核心指标因素。相关性分析是通过计算相关系数来衡量和评价变量之间的强弱关系。供电可靠性评价指标包括供电可靠率、用户平均停电时间等多种评价指标。在一个实施例中,可选取供电可靠率RS-1为评价指标,利用SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案)工具进行相关性分析计算。供电可靠率RS-1为在统计期间内,对用户有效供电时间总小时数与统计期间小时数的比值,其公式为
式中,RS-1为可靠性评价指标,T1为用户平均停电时间,T2为一个统计周期的时间长度。
在一个实施例中,可以对原始数据进行z-score标准化处理。通过对原始数据进行标准化处理,可以消除原始变量量纲不同的影响。基于原始数据的均值和标准差,通过以下公式将原始指标因素使用z-score标准化,得到标准化指标因素。具体可采用以下公式:
式中,D'为标准化指标因素,D为原始指标因素,
为原始指标因素的均值,δ为原始指标因素的标准差。
所述相关系数可以是皮尔逊相关系数或斯皮尔曼秩相关系数。皮尔逊相关系数用于度量两个变量之间线性相关性的强弱,其具有一定的应用条件:1)必须假设数据是成对地从正态分布中取得的;2)数据至少在逻辑范畴内必须是等间距的。其数学定义为:
其中:n为样本数量;x
i和y
i为两变量的变量值;r即为皮尔逊相关系数。皮尔逊相关系数取值范围是[-1,1],r=1表示为完全正相关,r=-1为完全负相关,r=0表示不存在线性相关关系。|r|越接近于1线性相关程度越好,|r|越接近于0线性相关程度越弱。应当说明的是,这里的样本指的是对上述标准化指标因素的取样结果,即,对每项标准化指标因素,分别取若干个样本值,x
i代表当前处理的标准化指标因素对应的第i个样本,
代表前处理的标准化指标因素的样本均值,y
i代表第i个样本的可靠性评价指标,
代表各个可靠性评价指标的均值。
由于相关系数是对总体的部分样本进行计算得到的,因此不能直接断定样本来源的总体满足显著的相关关系,需要通过假设检验的方式进行推断,即利用假设检验的方式从数学上说明结论的正确性。其基本步骤为:
(1)根据各个标准化指标因素构建样本,对所述样本与可靠性评价指标提出原假设H0和备择假设H1;其中,原假设认为所述样本与可靠性评价指标无显著相关关系,备择假设认为所述样本与可靠性评价指标具有显著相关关系;
(2)根据样本容量选择检验统计量,例如t统计量、Z统计量;
(3)计算检验统计量的观测值和对应的概率p;
(4)确定显著性水平决策α并作出决策。如果检验统计量的概率p小于显著性水平α,则拒绝原假设,证实了备择假设,认为两个总体具有显著的相关关系,可计算样本中各个标准化指标因素与预设的可靠性评价指标之间的皮尔逊相关系数;反之,如果检验统计量的概率p大于或等于显著性水平α,则不能拒绝原假设,认为两个总体不存在相关关系,可计算样本中各个标准化指标因素与预设的可靠性评价指标之间的斯皮尔曼秩相关系数。
其中,步骤(2)的统计量视乎样本容量大小而选择。
Z统计量适用于样本容量n大于预设值(例如,n>30)的大样本平均值差异性检验的方法。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。其值的计算公式为:
其中,
是样本的平均数;μ
0是已知总体的平均数;S是样本的标准差;n是样本容量。查Z界值表,确定概率p值,再依据下表2对差异显著性关系表作出判断。其中,样本即对上述标准化指标因素的取样结果,已知总体即对上述标准化指标因素的统计结果,是与“抽样”对应的一个概念,抽样从已知总体中产生。
表2 Z值与差异显著性关系表
t统计量适用于样本容量n小于或等于预设值(例如,n≤30)的小样本,总体标准差σ未知的正态分布。当总体分布是正态分布,如总体标准差未知且样本容量小于30,那么样本平均数与总体平均数的离差统计量呈t分布。t统计量计算公式为:
其中,
是样本的平均数;μ
0是已知总体的平均数;S是样本的标准差;n是样本容量。其中,样本即对上述标准化指标因素的取样结果,已知总体即对上述标准化指标因素的统计结果,是与“抽样”对应的一个概念,抽样从已知总体中产生。
t检验是通过计算得到的t统计量,根据自由度df=n-1,查t界值表,确定概率p值,再依据下表3对差异显著性关系表作出判断。
表3 t值与差异显著性关系表
值得一提的是,表2和表3中的数值可以采用上述值,也根据实际需要自行设定。
在一个实施例中,利用SPSS可计算选用的30个影响供电可靠性的指标与供电可靠率RS-1的皮尔逊相关系数。
在实际操作中,选择双尾显著性检验进行SPSS相关性计算检验。双尾显著性检验是指备择假设没有特定的方向性,并含有符号“≠”的假设检验。原假设和备择假设是一个完备事件组,而且相互对立。例如:原假设为H0:m=m0,备择假设为H1:m≠m0,即为双尾检验。
利用SPSS数据处理和检验后分析,可得出环网率、站间联络率、绝缘化率、架空线绝缘化率、电缆化与供电可靠率RS-1有显著的相关性。
在相关系数满足显著性进行检验的基础之上有以下经验结论:
当相关系数r的绝对值大于或等于第一阈值(例如,|r|≥0.8)时,可视为两个变量之间高度相关;
当相关系数r的绝对值大于或等于第二阈值且小于第一阈值(例如,0.5≤|r|<0.8)时,可视为中度相关;
当相关系数r的绝对值大于或等于第三阈值且小于第二阈值(例如,0.3≤|r|<0.5)时,视为低度相关;
当相关系数r的绝对值小于第三阈值(例如,|r|<0.3)时,说明两个变量之间的相关程度极弱,可视为不相关。
将满足显著性检验的指标提取出来,相应分析结果如表4所示:
表4皮尔逊相关性分析与供电可靠率RS-1显著相关指标
由于皮尔逊相关系数必须假设数据是成对地从正态分布中取得的,并且数据在逻辑范畴内必须是等间距的。如果这两条件不符合,一种可能的解决方法就是采用斯皮尔曼秩相关系数来代替皮尔逊相关系数。斯皮尔曼秩相关系数用来评价当用单调函数表征两个变量之间的关系时的效果如何,不要求变量满足正态分布。斯皮尔曼秩相关系数通常被认为是排列后的变量之间的皮尔逊相关系数,其计算方法如下:假设原始指标因素xi和yi已经按从大到小的顺序排列,记xi′和yi′为原始指标因素xi和yi在排列后数据所在的位置,则xi′和yi′称为变量xi和yi的秩次。
di=x′i-y′i
其中:n为样本数量;xi和yi为两变量的变量值;r即为皮尔逊相关系数;di为xi与yi的秩次之差。斯皮尔曼秩相关系数的符号表示x与y之间的方向。当x随y的增加而增加,则相关系数为正数;当x随y的增加而减小,则相关系数为负数。当x与y相关系数的绝对值为1时表示变量之间满足严格的单调函数关系。
在一个实施例中,利用SPSS可计算选用的30个影响供电可靠性的指标与供电可靠率RS-1的斯皮尔曼秩相关系数。同样选择双尾显著性检验,数据处理分析得到,环网率、站间联络率、线路平均分段数、绝缘化率、架空线绝缘化率、电缆化率、裸导线中压线路故障率、中压故障停电急修到位平均时间、预试定检总次数、减少用户平均停电时间、自然因素引起的故障次数、外力因素引起的故障次数与供电可靠性存在显著相关关系。
将有显著相关关系的指标提取出来,相应分析结果如表5所示:
表5斯皮尔曼相关性分析与供电可靠率RS-1显著相关指标
可对两种相关性方法的分析结果进行对比分析,进行权衡后筛选出影响供电可靠性的主要指标。
由于相关性强弱分析中认为|r|<0.3时两个变量之间的相关程度极弱,可视为不相关,因此将相关性表现为极弱的指标筛除掉。
以供电可靠率RS-1作为供电可靠性评价指标,皮尔逊相关性分析得到的结果与斯皮尔曼相关性分析得到的结果对比如图3所示。对比两种方法得到的结果,筛选出的主要影响供电可靠性的指标为环网率、站间联络率、绝缘化率、架空线绝缘化率、电缆化率、预试定检的次数、自然因素引起的故障次数、外力因素引起的故障次数等8个指标。
步骤S3:根据所述核心指标因素构建径向基函数(Radial Basis Function,RBF)神经网络,获取所述径向基函数神经网络的隐含层的最优中心向量、最优基宽向量和最优输出权重,根据所述最优中心向量、最优基宽向量和最优输出权重获取供电可靠性预测模型,根据所述供电可靠性预测模型对配电网供电可靠性进行预测。
RBF神经网络是一种由输入层、隐含层和输出层构成的三层前馈神经网络,隐含层神经元的运算函数采用具有良好局部特性的径向基函数,使得输入仅在一个局部的区间内通过隐含层产生一定的输出,而区间外输出基本为零,故其具有诸多优点,如非线性逼近能力强、网络结构简单等。RBF神经网络能避开局部最小问题,但对样本数据选取的要求较高。
RBF神经网络隐含层的作用函数常取高斯基函数,该层神经元j的输出为:
X=[x1 x2 L xn]T∈Rn
Cj=[c1j c2j L cij L cnj]T
式中:J为径向基层神经元数,X为神经网络的输入向量,Cj为中心向量,b=(b1,b2,L,bj)为基宽向量。
整个网络的输出为:
Y=WHT
W=[w1 w2 L wj]
H=[h1 h2 L hj]
上述三式中:Y为网络的输出向量,W为径向基层与输出层间的权向量,H为隐含层的输出,即输出层的输入向量,wi为输出权重。
在实际应用中,RBF关键需要确定中心向量Cj、基宽向量bj和输出权重wj。RBF神经网络隐含层中心的数量对计算速度的影响尤为显著,中心数量过多将使网络的计算量明显增加。传统的RBF神经网络一般采用聚类算法和最小二乘法求取以上三个向量参数,网络训练的精度和速度都较差,因此可采用粒子群算法(Particle Swarm Optimization,PSO)对RBF的隐含层参数进行优化,以提高神经网络的训练效率。
PSO算法将问题的搜索空间比作鸟群飞行空间,将每只鸟抽象为一个粒子,用于表示寻优问题的一个待选解,优化得到的最优解等同于鸟群寻找的食物。所有粒子都有自身的位置及速度以决定其飞行的距离和方向,速度根据其自身经验及群体经验进行动态调整。D维空间中第i个粒子的速度和位置分别为Vi=[vi,1,vi,2,L vi,D]和Xi=[xi,1,xi,2,Lxi,D],在每一次迭代中,确定t时间每个粒子所经过的最佳位置pb以及群体所发现的最佳位置gb,通过跟踪更新这两个最佳位置,按照下二式更新粒子的速度和位置。
vi,j(t+1)=vi,j(t)+c1r1[pi,j-xi,j(t)]+c2r2[pg,j-xi,j(t)]
xi,j(t+1)=xi,j(t)+vi,j(t+1),j=1,2,L D
上述两式中,vi,j(t+1)为第j次迭代中第i个粒子在t+1时刻的速度,vi,j(t)为第j次迭代中第i个粒子在t时刻的速度,c1和c2为学习因子,r1和r2为0到1之间的随机数,D为目标函数中需要优化的变量个数,pi,j为第j次迭代中的个体历史最佳位置,pg,j为第j次迭代中的全局最佳位置,xi,j(t)为第j次迭代中第i个粒子在t时刻的位置,xi,j(t+1)为第j次迭代中第i个粒子在t+1时刻的位置。
如图4,PSO-RBF训练预测模型包括以下步骤:
(1)初始化粒子群体,即确定粒子群的大小及搜索维度。并设置PSO相关参数,包括惯性系数ω、学习因子c1和c2、最大迭代次数以及粒子最大速度vmax等。
(2)根据粒子群的大小及搜索维度将每个粒子对应的中心向量、基宽向量和输出权重代入RBF神经网络训练算法中,利用训练样本得到输出的预测值。
(3)根据训练样本计算出初始化种群单个粒子的MSE(Mean Squared Error,均方误差),将其作为粒子适应度fi。
(4)对每个粒子,将其当前适应度fi与一次迭代中每个粒子所经过的个体历史最佳位置pb对比,若fi>pb说明当前的适应度更高,则将用当前位置更新个体历史最佳位置pb,否则保持pb不变。同理比较当前适应值fi与一次迭代中群体所发现的全局最佳位置gb,当fi>gb更新全局最佳位置gb,否则保持gb不变。
(5)根据所述个体历史最佳位置和全局最佳位置,按照公式更新每个粒子的速度与位置。当迭代次数达到最大迭代次数限制或最佳适应度达到设定阈值即停止寻优过程。
(6)通过PSO算法得到的最优中心向量Cj、基宽向量bj和输出权重wj后,利用RBF神经网络训练算法,代入公式Y=WHT,即可计算出模型预测值。
上述配电网供电可靠性预测方法,基于相关性分析及PSO-RBF的配电网供电可靠性预测模型有良好的预测精度、稳定性和泛化性能。具体表现为:
(1)可以充分考虑多方面多角度的供电可靠性影响因素,适用于多输入变量的情况,有利于对供电可靠性更加全面的分析预测。
(2)对输入的原始数据进行相关性分析的处理,筛选出对供电可靠性影响较为明显的指标,有效的实现了输入数据的降维,提升了RBF神经网络训练模型的预测精度和稳定性。
(3)利用粒子群优化算法对神经网络的中心向量、基宽向量和输出权重进行优化,有效减少预测模型的训练时间和预测精度。
(4)根据训练好的模型对影响供电可靠性指标的相关因素进行灵敏度分析可以获得对供电可靠性指标较敏感的相关特征量。
在一个实施例中,本发明还提供一种配电网供电可靠性预测***,如图5所示,可包括:
指标因素选取模块10,用于根据配电网的网架结构、技术装备参数、设备质量参数、故障因子以及运行维护参数选取多种影响供电可靠性的原始指标因素;
配电网的供电可靠性与电网自身供应能力、运行维护水平以及外界因素密切相关。为保证对供电可靠性分析的全面性,从配电网的网架结构、配电网的技术装备参数、设备质量参数、故障因子以及运行维护参数等五个方面选取30个影响供电可靠性指标,作为供电可靠性预测模型输入变量。
原始数据筛选模块20,用于对所述原始指标因素进行标准化处理,得到标准化指标因素,计算各个标准化指标因素与预设的可靠性评价指标之间的相关系数,根据所述相关系数从所述指标因素中筛选出对供电可靠性影响较为明显的核心指标因素;
由于影响配电网供电可靠性的因素多种多样,因此需要对多种因素进行筛选,挑出核心的因素。可通过相关性分析筛选核心指标因素。相关性分析是通过计算相关系数来衡量和评价变量之间的强弱关系。供电可靠性评价指标包括供电可靠率、用户平均停电时间等多种评价指标。在一个实施例中,可选取供电可靠率RS-1为评价指标,利用SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案)工具进行相关性分析计算。供电可靠率RS-1为在统计期间内,对用户有效供电时间总小时数与统计期间小时数的比值,其公式为
式中,RS-1为可靠性评价指标,T1为用户平均停电时间,T2为一个统计周期的时间长度。
在一个实施例中,可以对原始数据进行z-score标准化处理。通过对原始数据进行标准化处理,可以消除原始变量量纲不同的影响。基于原始数据的均值和标准差,通过以下公式将原始指标因素使用z-score标准化,得到标准化指标因素。具体可采用以下公式:
式中,D'为标准化指标因素,D为原始指标因素,
为原始指标因素的均值,δ为原始指标因素的标准差。
所述相关系数可以是皮尔逊相关系数或斯皮尔曼秩相关系数。皮尔逊相关系数用于度量两个变量之间线性相关性的强弱,其具有一定的应用条件:1)必须假设数据是成对地从正态分布中取得的;2)数据至少在逻辑范畴内必须是等间距的。其数学定义为:
其中:n为样本数量;x
i和y
i为两变量的变量值;r即为皮尔逊相关系数。皮尔逊相关系数取值范围是[-1,1],r=1表示为完全正相关,r=-1为完全负相关,r=0表示不存在线性相关关系。|r|越接近于1线性相关程度越好,|r|越接近于0线性相关程度越弱。应当说明的是,这里的样本指的是对上述标准化指标因素的取样结果,即,对每项标准化指标因素,分别取若干个样本值,x
i代表当前处理的标准化指标因素对应的第i个样本,
代表前处理的标准化指标因素的样本均值,y
i代表第i个样本的可靠性评价指标,
代表各个可靠性评价指标的均值。
由于相关系数是对总体的部分样本进行计算得到的,因此不能直接断定样本来源的总体满足显著的相关关系,需要通过假设检验的方式进行推断,即利用假设检验的方式从数学上说明结论的正确性。其基本步骤为:
(1)根据各个标准化指标因素构建样本,对所述样本与可靠性评价指标提出原假设H0和备择假设H1;其中,原假设认为所述样本与可靠性评价指标无显著相关关系,备择假设认为所述样本与可靠性评价指标具有显著相关关系;
(2)根据样本容量选择检验统计量,例如t统计量、Z统计量;
(3)计算检验统计量的观测值和对应的概率p;
(4)确定显著性水平决策α并作出决策。如果检验统计量的概率p小于显著性水平α,则拒绝原假设,证实了备择假设,认为两个总体具有显著的相关关系,可计算样本中各个标准化指标因素与预设的可靠性评价指标之间的皮尔逊相关系数;反之,如果检验统计量的概率p大于或等于显著性水平α,则不能拒绝原假设,认为两个总体不存在相关关系,可计算样本中各个标准化指标因素与预设的可靠性评价指标之间的斯皮尔曼秩相关系数。
其中,步骤(2)的统计量视乎样本容量大小而选择。
Z统计量适用于样本容量n大于预设值(例如,n>30)的大样本平均值差异性检验的方法。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。其值的计算公式为:
其中,
是检验样本的平均数;μ
0是已知总体的平均数;S是样本的标准差;n是样本容量。查Z界值表,确定概率p值,再依据表2对差异显著性关系表作出判断。其中,样本即对上述标准化指标因素的取样结果,已知总体即对上述标准化指标因素的统计结果,是与“抽样”对应的一个概念,抽样从已知总体中产生。
表2 Z值与差异显著性关系表
t统计量适用于样本容量n小于或等于预设值(例如,n≤30)的小样本,总体标准差σ未知的正态分布。当总体分布是正态分布,如总体标准差未知且样本容量小于30,那么样本平均数与总体平均数的离差统计量呈t分布。t统计量计算公式为:
其中,
是检验样本的平均数;μ
0是已知总体的平均数;S是样本的标准差;n是样本容量。
t检验是通过计算得到的t统计量,根据自由度df=n-1,查t界值表,确定概率p值,再依据下表3对差异显著性关系表作出判断。
表3 t值与差异显著性关系表
值得一提的是,表2和表3中的数值可以采用上述值,也根据实际需要自行设定。
在一个实施例中,利用SPSS可计算选用的30个影响供电可靠性的指标与供电可靠率RS-1的皮尔逊相关系数。
在实际操作中,选择双尾显著性检验进行SPSS相关性计算检验。双尾显著性检验是指备择假设没有特定的方向性,并含有符号“≠”的假设检验。原假设和备择假设是一个完备事件组,而且相互对立。例如:原假设为H0:m=m0,备择假设为H1:m≠m0,即为双尾检验。
利用SPSS数据处理和检验后分析,可得出环网率、站间联络率、绝缘化率、架空线绝缘化率、电缆化与供电可靠率RS-1有显著的相关性。
在相关系数满足显著性进行检验的基础之上有以下经验结论:
当相关系数r的绝对值大于或等于第一阈值(例如,|r|≥0.8)时,可视为两个变量之间高度相关;
当相关系数r的绝对值大于或等于第二阈值且小于第一阈值(例如,0.5≤|r|<0.8)时,可视为中度相关;
当相关系数r的绝对值大于或等于第三阈值且小于第二阈值(例如,0.3≤|r|<0.5)时,视为低度相关;
当相关系数r的绝对值小于第三阈值(例如,|r|<0.3)时,说明两个变量之间的相关程度极弱,可视为不相关。
将满足显著性检验的指标提取出来,相应分析结果如表4所示:
表4皮尔逊相关性分析与供电可靠率RS-1显著相关指标
由于皮尔逊相关系数必须假设数据是成对地从正态分布中取得的,并且数据在逻辑范畴内必须是等间距的。如果这两条件不符合,一种可能的解决方法就是采用斯皮尔曼秩相关系数来代替皮尔逊相关系数。斯皮尔曼秩相关系数用来评价当用单调函数表征两个变量之间的关系时的效果如何,不要求变量满足正态分布。斯皮尔曼秩相关系数通常被认为是排列后的变量之间的皮尔逊相关系数,其计算方法如下:假设原始指标因素xi和yi已经按从大到小的顺序排列,记x′i和y′i为原始指标因素xi和yi在排列后数据所在的位置,则x′i和y′i称为变量xi和yi的秩次。
di=x′i-y′i
其中:n为样本数量;xi和yi为两变量的变量值;r即为皮尔逊相关系数;di为xi与yi的秩次之差。斯皮尔曼秩相关系数的符号表示x与y之间的方向。当x随y的增加而增加,则相关系数为正数;当x随y的增加而减小,则相关系数为负数。当x与y相关系数的绝对值为1时表示变量之间满足严格的单调函数关系。
在一个实施例中,利用SPSS可计算选用的30个影响供电可靠性的指标与供电可靠率RS-1的斯皮尔曼秩相关系数。同样选择双尾显著性检验,数据处理分析得到,环网率、站间联络率、线路平均分段数、绝缘化率、架空线绝缘化率、电缆化率、裸导线中压线路故障率、中压故障停电急修到位平均时间、预试定检总次数、减少用户平均停电时间、自然因素引起的故障次数、外力因素引起的故障次数与供电可靠性存在显著相关关系。
将有显著相关关系的指标提取出来,相应分析结果如表5所示:
表5斯皮尔曼相关性分析与供电可靠率RS-1显著相关指标
可对两种相关性方法的分析结果进行对比分析,进行权衡后筛选出影响供电可靠性的主要指标。
由于相关性强弱分析中认为|r|<0.3时两个变量之间的相关程度极弱,可视为不相关,因此将相关性表现为极弱的指标筛除掉。
以供电可靠率RS-1作为供电可靠性评价指标,皮尔逊相关性分析得到的结果与斯皮尔曼相关性分析得到的结果对比如图3所示。对比两种方法得到的结果,筛选出的主要影响供电可靠性的指标为环网率、站间联络率、绝缘化率、架空线绝缘化率、电缆化率、预试定检的次数、自然因素引起的故障次数、外力因素引起的故障次数等8个指标。
预测模型训练模块30,用于根据所述核心指标因素构建径向基函数神经网络,获取所述径向基函数神经网络的隐含层的最优中心向量、最优基宽向量和最优输出权重,根据所述最优中心向量、最优基宽向量和最优输出权重获取供电可靠性预测模型,根据所述供电可靠性预测模型对配电网供电可靠性进行预测。
RBF神经网络是一种由输入层、隐含层和输出层构成的三层前馈神经网络,隐含层神经元的运算函数采用具有良好局部特性的径向基函数,使得输入仅在一个局部的区间内通过隐含层产生一定的输出,而区间外输出基本为零,故其具有诸多优点,如非线性逼近能力强、网络结构简单等。RBF神经网络能避开局部最小问题,但对样本数据选取的要求较高。
RBF神经网络隐含层的作用函数常取高斯基函数,该层神经元j的输出为:
X=[x1 x2 L xn]T∈Rn
Cj=[c1j c2j L cij L cnj]T
式中:J为径向基层神经元数,X为神经网络的输入向量,Cj为中心向量,b=(b1,b2,L,bj)为基宽向量。
整个网络的输出为:
Y=WHT
W=[w1 w2 L wj]
H=[h1 h2 L hj]
上述三式中:Y为网络的输出向量,W为径向基层与输出层间的权向量,H为隐含层的输出,即输出层的输入向量,wi为输出权重。
在实际应用中,RBF关键需要确定中心向量Cj、基宽向量bj和输出权重wj。RBF神经网络隐含层中心的数量对计算速度的影响尤为显著,中心数量过多将使网络的计算量明显增加。传统的RBF神经网络一般采用聚类算法和最小二乘法求取以上三个向量参数,网络训练的精度和速度都较差,因此可采用粒子群算法(Particle Swarm Optimization,PSO)对RBF的隐含层参数进行优化,以提高神经网络的训练效率。
PSO算法将问题的搜索空间比作鸟群飞行空间,将每只鸟抽象为一个粒子,用于表示寻优问题的一个待选解,优化得到的最优解等同于鸟群寻找的食物。所有粒子都有自身的位置及速度以决定其飞行的距离和方向,速度根据其自身经验及群体经验进行动态调整。D维空间中第i个粒子的速度和位置分别为Vi=[vi,1,vi,2,L vi,D]和Xi=[xi,1,xi,2,Lxi,D],在每一次迭代中,确定t时间每个粒子所经过的最佳位置pb以及群体所发现的最佳位置gb,通过跟踪更新这两个最佳位置,按照下二式更新粒子的速度和位置。
vi,j(t+1)=vi,j(t)+c1r1[pi,j-xi,j(t)]+c2r2[pg,j-xi,j(t)]
xi,j(t+1)=xi,j(t)+vi,j(t+1),j=1,2,L D
上述两式中,vi,j(t+1)为第j次迭代中第i个粒子在t+1时刻的速度,vi,j(t)为第j次迭代中第i个粒子在t时刻的速度,c1和c2为学习因子,r1和r2为0到1之间的随机数,D为目标函数中需要优化的变量个数,pi,j为第j次迭代中的个体历史最佳位置,pg,j为第j次迭代中的全局最佳位置,xi,j(t)为第j次迭代中第i个粒子在t时刻的位置,xi,j(t+1)为第j次迭代中第i个粒子在t+1时刻的位置。
如图4,PSO-RBF训练预测模型包括以下步骤:
(1)初始化粒子群体,即确定粒子群的大小及搜索维度。并设置PSO相关参数,包括惯性系数ω、学习因子c1和c2、最大迭代次数以及粒子最大速度vmax等。
(2)根据粒子群的大小及搜索维度将每个粒子对应的中心向量、基宽向量和输出权重代入RBF神经网络训练算法中,利用训练样本得到输出的预测值。
(3)根据训练样本计算出初始化种群单个粒子的MSE(Mean Squared Error,均方误差),将其作为粒子适应度fi。
(4)对每个粒子,将其当前适应度fi与一次迭代中每个粒子所经过的个体历史最佳位置pb对比,若fi>pb说明当前的适应度更高,则将用当前位置更新个体历史最佳位置pb,否则保持pb不变。同理比较当前适应值fi与一次迭代中群体所发现的全局最佳位置gb,当fi>gb更新全局最佳位置gb,否则保持gb不变。
(5)根据所述个体历史最佳位置和全局最佳位置,按照公式更新每个粒子的速度与位置。当迭代次数达到最大迭代次数限制或最佳适应度达到设定阈值即停止寻优过程。
(6)通过PSO算法得到的最优中心向量Cj、基宽向量bj和输出权重wj后,利用RBF神经网络训练算法,代入公式Y=WHT,即可计算出模型预测值。
上述配电网供电可靠性预测方法,基于相关性分析及PSO-RBF的配电网供电可靠性预测模型有良好的预测精度、稳定性和泛化性能。具体表现为:
(1)可以充分考虑多方面多角度的供电可靠性影响因素,适用于多输入变量的情况,有利于对供电可靠性更加全面的分析预测。
(2)对输入的原始数据进行相关性分析的处理,筛选出对供电可靠性影响较为明显的指标,有效的实现了输入数据的降维,提升了RBF神经网络训练模型的预测精度和稳定性。
(3)利用粒子群优化算法对神经网络的中心向量、基宽向量和输出权重进行优化,有效减少预测模型的训练时间和预测精度。
(4)根据训练好的模型对影响供电可靠性指标的相关因素进行灵敏度分析可以获得对供电可靠性指标较敏感的相关特征量。
本发明的配电网供电可靠性预测***与本发明的配电网供电可靠性预测方法一一对应,在上述配电网供电可靠性预测方法的实施例阐述的技术特征及其有益效果均适用于配电网供电可靠性预测***的实施例中,特此声明。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。