CN112633315A - 一种电力***扰动分类方法 - Google Patents

一种电力***扰动分类方法 Download PDF

Info

Publication number
CN112633315A
CN112633315A CN202011132259.3A CN202011132259A CN112633315A CN 112633315 A CN112633315 A CN 112633315A CN 202011132259 A CN202011132259 A CN 202011132259A CN 112633315 A CN112633315 A CN 112633315A
Authority
CN
China
Prior art keywords
disturbance
data
power system
dae
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011132259.3A
Other languages
English (en)
Inventor
刘有志
蒋雨辰
张扬
李子康
刘灏
毕天姝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North China Electric Power University
Guangzhou Power Supply Bureau of Guangdong Power Grid Co Ltd
Original Assignee
North China Electric Power University
Guangzhou Power Supply Bureau of Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North China Electric Power University, Guangzhou Power Supply Bureau of Guangdong Power Grid Co Ltd filed Critical North China Electric Power University
Priority to CN202011132259.3A priority Critical patent/CN112633315A/zh
Publication of CN112633315A publication Critical patent/CN112633315A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明提供了一种电力***扰动分类方法,基于堆叠去噪自编码器的特征提取方法能够捕获扰动数据中对丢失数据鲁棒的特征表达,在此基础上,利用随机森林分类器,实现对电力***扰动的识别。该方法能够快速、准确地对PMU扰动数据进行分类,并且对于包含丢失数据的PMU扰动数据仍然具有很高的识别准确率,抗噪性能好。相较于现有扰动分类方法,能够快速、准确地对包含丢失数据的PMU扰动数据进行分类,实现电力***动态行为的实时监测。

Description

一种电力***扰动分类方法
技术领域
本发明涉及电力***技术领域,具体为一种电力***扰动分类方法,尤其涉及一种考虑PMU丢失数据的电力***扰动分类方法。
背景技术
随着电力***规模的不断扩大以及大量电力电子设备的接入,使电网结构的复杂程度不断增加,电网安全问题也日渐突出。近年来,大停电事故频发,给社会经济发展和人们生活造成了巨大的影响。研究发现,大停电事故通常起始于单一故障,经过一系列连锁反应,最终导致电网崩溃。因此,对电力***扰动的实时监测和分析,对电力***安全稳定运行具有重要作用。同步相量测量单元(Phasor Measurement Units,PMUs)因其同步性、快速性和精确性,可为***保护与闭环控制提供数据基础,使电力***扰动实时监测成为可能。
目前,国内外学者对电力***扰动分类的研究主要分为基于模型和基于数据的方法。基于模型的方法需要通过***拓扑结构和参数来对电网建模,根据扰动触发机理,来实现扰动类型识别。然而对于复杂大***而言,计算量很大,甚至可能无法解析。基于数据的方法通过对历史数据进行分析,得到数据与目标之间的非线性映射关系,来实现扰动类型识别。随着***复杂程度的增加以及海量电力大数据的涌入,基于数据的方法逐渐成为更有效的分析方法。
现有方法大多是在PMU数据正常的假设上研究的,忽略了PMU数据质量的影响。然而,约有10%~17%的PMU数据存在不同程度的数据质量问题,这严重制约了其在电力***扰动分类中的应用。
发明目的
本发明的目的是针对上述现有技术存在的不足,提供一种基于堆叠去噪自编码器和随机森林分类器的电力***扰动分类方法,本方法相较于其他扰动分类方法相比,能够快速、准确地对包含丢失数据的PMU扰动数据进行分类,实现电力***动态行为的实时监测。
发明内容
本发明提供了一种基于堆叠去噪自编码器和随机森林分类器的电力***扰动分类方法,包括以下步骤:
步骤1:利用离线的时域仿真法生成电力***的扰动数据;
步骤2:将步骤1中通过离线仿真法所得到的扰动数据进行标准化处理;
步骤3:构造和训练堆叠去噪自编码器深度神经网络,以扰动发生后0.5s内的频率和电压有效值作为堆叠去噪自编码器的输入,对堆叠去噪自编码器进行训练;
步骤4:利用步骤3中训练后的堆叠去噪自编码器对数据特征提取,得到高层次的特征表达;
步骤5:构造和训练随机森林分类器,并通过训练后的随机森林分类器对步骤4中所提取的高层次的特征进行分类,实现扰动识别。
进一步地,步骤1中利用离线的时域仿真法生成扰动数据的过程具体为:分别选取三相短路3-φFlt、单相接地故障φ-g Flt、发电机出力降低GL、投负荷、切负荷、三相断线LT共6种扰动类型进行仿真,***算例为IEEE 10机39***,仿真软件为PSD-BPA,仿真时间为30s,仿真步长设置为0.02s,5s后触发扰动,输出各母线频率与电压有效值。
再进一步地,步骤2中所述进行标准化处理的过程为:假设PMU上送频率为 50Hz,则0.5s内的频率和电压分别表示为f,
Figure RE-RE-GDA0002960891160000031
对于频率和电压信号分别进行标准化处理:
Figure RE-RE-GDA0002960891160000032
其中,
Figure RE-RE-GDA0002960891160000033
为标准化后的数据,u和σ分别为Z对应变量的均值和标准差。
再进一步地,步骤3中所述堆叠去噪自编码器SDAE是由去噪自编码器DAE 堆叠而成的深层网络模型,所述构造和训练堆叠去噪自编码器深度神经网络的过程包括以下子步骤:
S31:令
Figure RE-RE-GDA0002960891160000034
为DAE的输入数据,首先,以一定概率C对
Figure RE-RE-GDA0002960891160000035
中的数据随机置零,以得到损坏的扰动数据
Figure RE-RE-GDA00029608911600000311
然后,DAE通过编码操作将损坏的数据映射为隐层的特征表达h=[h1,h2,…,ht]T,再通过解码重构完整的样本
Figure RE-RE-GDA0002960891160000036
所述DAE 编码和解码过程如下所示:
Figure RE-RE-GDA0002960891160000037
Figure RE-RE-GDA0002960891160000038
其中,W和W'分别是编码矩阵和解码矩阵;b和b'分别是编码偏置向量和偏置偏差向量;θ和θ'分别是用于编码和解码的参数;fθ和gθ'是激活函数,在此使用Sigmoid函数:
Figure RE-RE-GDA0002960891160000039
S32:对SDEA进行训练,在该过程中,以重建误差最小为目标对参数进行调整:
Figure RE-RE-GDA00029608911600000310
其中
Figure RE-RE-GDA0002960891160000041
是重构误差,
Figure RE-RE-GDA0002960891160000042
是指
Figure RE-RE-GDA0002960891160000043
最小时对应的参数θ和θ';对于预处理过的扰动数据集
Figure RE-RE-GDA0002960891160000044
N为数据个数,其重构误差
Figure RE-RE-GDA0002960891160000045
表示为:
Figure RE-RE-GDA0002960891160000046
其中,
Figure RE-RE-GDA0002960891160000047
为第i个预处理过的扰动数据,
Figure RE-RE-GDA0002960891160000048
的重构数据,MSE为均方差;
通过误差的反向传播和梯度下降算法得到最优的模型参数,参数更新过程如下:
Figure RE-RE-GDA0002960891160000049
其中,η为学习率;
在训练过程中,SDAE通过自监督学习来对模型进行优化,具体为,将SDAE 中的任意两个相邻层视为一个DAE,并以最小化重构误差为目标,逐层对神经网络进行训练。
优选地,步骤4中,SDAE是以上个DAE的编码特征作为下一个DAE的输入数据进行正向传播的。
更进一步地,所述步骤5中进一步包括:
所述随机森林分类器是以多个决策树DT作为弱分类器的一种集成算法分类器,其中,单个DT为分类回归树CART,对于给定的样本集合D,其基尼系数为
Figure RE-RE-GDA00029608911600000410
其中,|Ck|是DF中属于第k类的样本子集的个数,N为样本个数,K为类别个数;Gini(DF)表示中随机选择的样本被错误分类的概率,Gini(DF)越小,则表明 DF中选择的样本被错误分类的概率越低,即DF的纯度越高;
样本特征集DF根据特征F={F1,F2,…Fk}中特征Fj的特定值a分为D1和D2两部分:
D1={(x,y)∈DF|A(x)=a},D2=DF-D1
则在特征A的条件下,集合D的基尼系数为:
Figure RE-RE-GDA0002960891160000051
式中,|D1|和|D2|分别表示集合D1和D2中的样本数;N是样本数;
Gini(DF,Fj=a)表示集合DF以及Fj=a划分后的不确定度;基尼指数的值越大,则样本集的不确定度越大;
使用bootstrap抽样的方法生成n个子数据集,并以基尼指数为分割准则生成n 个子数据集以及对应的n个CART,从而构造随机森林分类器;
通过用SDAE提取的高级特征训练随机森林分类器,实现扰动识别并分类。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为根据本发明实施例的一种基于堆叠去噪自编码器和随机森林分类器的电力***扰动分类方法的流程图;
图2为根据本发明实施例的去噪自编码器的结构图;
图3为根据本发明实施例的堆叠去噪自编码器结构图;
图4为根据本发明实施例的不同堆叠去噪自编码器结构对应重构误差的示意图;
图5为根据本发明实施例的不同决策树深度和个数对应分类准确率的示意图;
图6为根据本发明实施例的在不同去噪自编码器神经网络深度下提取到的特征二维可视化示意图;
图7为根据本发明实施例的扰动分类方法的扰动识别混淆矩阵示意图;
图8为根据本发明实施例的扰动分类方法与其他方法在不同数据丢失水平下识别准确率对比示意图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,本领域技术人员应当理解,所描述的实施例仅用于示例性说明本发明的主旨和思想,不应被视为被本发明范围的限定。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他变体、组合的技术方案,都落入了本发明的保护范围之内。
如图1所示,为本根据本发明实施例的一种基于堆叠去噪自编码器和随机森林分类器的电力***扰动分类方法的流程图,本发明所述扰动分类方法主要包括如下步骤:
步骤1:利用离线的时域仿真法生成扰动数据;
步骤2:利用标准化将离线仿真的数据进行标准化处理;
步骤3:构造和训练堆叠去噪自编码器深度神经网络。将扰动发生后0.5s内的频率和电压有效值作为堆叠去噪自编码器的输入对其进行训练。
步骤4:利用训练的堆叠去噪自编码器对数据特征提取,得到高层次的特征表达。
步骤5:构造和训练随机森林分类器,并通过训练的随机森林分类器对提取的特征进行分类,实现扰动识别。
在步骤1中,利用离线的时域仿真法生成扰动数据的过程具体为:
结合电力***中扰动发生的概率与造成的危害,选取三相短路(3-φFlt),单相接地故障(φ-g Flt),发电机出力降低(GL),负荷投/切(L-on/off),三相断线(LT)6种扰动类型进行仿真。***算例为IEEE 10机39***,仿真软件为PSD-BPA,仿真时间为30s,5s后触发扰动,输出各母线频率与电压有效值。考虑到PMU上送速率为50Hz,仿真步长设置为0.02s。为模拟电力***实际运行状态,在仿真中施加60dB的高斯白噪声。
表1.不同扰动的仿真方法
Figure RE-RE-GDA0002960891160000071
在步骤2中,利用标准化将离线仿真的数据进行标准化处理的过程具体为:假设PMU上送频率为50Hz,则0.5s内的频率和电压可以分别表示为f,
Figure RE-RE-GDA0002960891160000072
对于频率和电压信号,分别对其进行标准化处理:
Figure RE-RE-GDA0002960891160000081
其中,
Figure RE-RE-GDA0002960891160000082
为标准化后的数据,u和σ分别为Z对应变量的均值和标准差。
在对步骤3的具体过程介绍之前,首先针对堆叠去噪自编码器算法做相关介绍。
在步骤3中,构造和训练堆叠去噪自编码器深度神经网络的过程具体为:
去噪自编码器(Denoising autoencoders,DAE)的网络结构如图2所示。令
Figure RE-RE-GDA0002960891160000083
为DAE的输入数据,首先以一定概率C对
Figure RE-RE-GDA0002960891160000084
中的数据随机置零,以得到损坏的扰动数据
Figure RE-RE-GDA0002960891160000085
然后DAE通过编码操作将损坏的数据映射为隐层的特征表达h=[h1,h2,…,ht]T,再通过解码重构完整的样本
Figure RE-RE-GDA0002960891160000086
其编码和解码过程如下所示。
Figure RE-RE-GDA0002960891160000087
Figure RE-RE-GDA0002960891160000088
其中,W和W'分别是编码矩阵和解码矩阵;b和b'分别是编码偏置向量和偏置偏差向量;θ和θ'分别是用于编码和解码的参数。fθ和gθ'是激活函数,这里使用Sigmoid函数:
Figure RE-RE-GDA0002960891160000089
在训练过程中,DAE以重建误差最小为目标对参数进行调整:
Figure RE-RE-GDA00029608911600000810
其中
Figure RE-RE-GDA00029608911600000811
是重构误差。
Figure RE-RE-GDA00029608911600000812
是指
Figure RE-RE-GDA00029608911600000813
最小时对应的参数θ和θ'。如果重构误差足够小,则表明隐藏层中包含能够表征原始数据的显著特征。
对于预处理过的扰动数据集
Figure RE-RE-GDA0002960891160000091
N为数据个数。则该数据集的重构误差
Figure RE-RE-GDA0002960891160000092
表示如下:
Figure RE-RE-GDA0002960891160000093
其中,
Figure RE-RE-GDA0002960891160000094
为第i个预处理过的扰动数据,
Figure RE-RE-GDA0002960891160000095
的重构数据,MSE为均方差。
通过误差的反向传播和梯度下降算法可以得到最优的模型参数。参数更新过程如下:
Figure RE-RE-GDA0002960891160000096
其中,η为学习率。
堆叠去噪自编码器(Stacked denoising autoencoders,SDAE)是由DAE堆叠而成的深层网络模型,如图3所示。SDAE是通过自监督学习来对模型进行优化的。首先,将SDAE中的任意两个相邻层视为一个DAE,并以最小化重构误差为目标,逐层对网络进行训练。基于SDAE的特征提取方法见算法I:
Figure RE-RE-GDA0002960891160000097
Figure RE-RE-GDA0002960891160000101
在步骤4中,利用训练的SDAE对数据特征提取的具体过程为:
SDAE是以上个DAE的编码特征作为下一个DAE的输入数据进行正向传播的。因此,对于隐含层数目为L的SDAE,其特征提取过程如下:
Figure RE-RE-GDA0002960891160000102
Figure RE-RE-GDA0002960891160000111
在步骤5中,构造和训练随机森林分类器的具体过程为:
随机森林(Random Forest,RF)是以多个决策树作为弱分类器的一种集成算法。最终的分类结果是通过多棵决策树(Decision Tree,DT)的多数投票实现的。本研究选取的单个DT为分类回归树(CART),它以基尼指数作为选择分割特征的准则,相关公式如下:
对于给定的样本集合D,其基尼系数为
Figure RE-RE-GDA0002960891160000112
其中,|Ck|是DF中属于第k类的样本子集的个数,N为样本个数,K为类别个数。Gini(DF)表示中随机选择的样本被错误分类的概率,Gini(DF)越小,则表明 DF中选择的样本被错误分类的概率越低,即DF的纯度越高。
样本特征集DF根据特征F={F1,F2,…Fk}中特征Fj的特定值a分为D1和D2两部分:
D1={(x,y)∈DF|A(x)=a},D2=DF-D1
则在特征A的条件下,集合D的基尼系数为:
Figure RE-RE-GDA0002960891160000121
式中,|D1|和|D2|分别表示集合D1和D2中的样本数;N是样本数。
Gini(DF,Fj=a)表示集合DF以及Fj=a划分后的不确定度。基尼指数的值越大,样本集的不确定度越大。因此,选取基尼指数最小的特征及其对应的特征和特征值作为最佳分割特征和分割点。
我们使用bootstrap抽样的方法生成n个子数据集,并以基尼指数为分割准则生成n个子数据集以及对应的n个CART以构造随机森林分类器。
随机森林被用作分类器,以避免单个分类器的泛化性能低的问题。最终,通过用SDAE提取的高级特征训练RF分类器来实现扰动识别。算法III中总结了基于随机森林的事件分类算法,该算法描述了RF的生成和类别分类。
Figure RE-RE-GDA0002960891160000122
Figure RE-RE-GDA0002960891160000131
为了说明本发明实施例上述方案的效果,还通过实验进行了验证。
1、SDAE模型结构及参数设置
将预处理后的数据作为SDAE输入数据,逐层设置隐层神经元的数目。我们先确定第一层的最佳神经元数目,然后固定第一层神经元的数目,以确定第二层的最佳神经元数目。此过程继续进行,直到重构误差MSE不再减小。图4显示了隐藏层数目和隐藏层神经元数目对MSE的影响。对于IEEE-39节点***,当数据丢失水平为50%时,SDAE识别电力***扰动的最佳隐层数目为4层,每层的最佳隐层单元数为50、70、50和30。
采用相同的参数优化方法对不同损失水平的扰动数据进行训练,并计算出测试集的重建误差。不同数据丢失水平下的最优网络结构和测试结果如表2所示,当损失水平大于50%时,重建误差迅速增大,表明该模型可以重建原始数据的最大损失水平为50%。因此,对于IEEE-39节点***,基于SDAE神经网络的扰动识别的最优隐层数目为4层,每层神经元的最佳数目为[50,70,50,30]。最大数据丢失承受度为50%。
表2.不同数据丢失水平下的最佳SDAE结构
Figure RE-RE-GDA0002960891160000141
2、RF参数设置
基于SDAE对扰动数据提取的特征来选择RF的最优参数。首先确定DT的最佳深度d,在最佳深度处,确定了最佳DT的数目n。通过比较验证集上10次交叉验证的平均精度来确定最佳深度d和n。
如图5所示,当d=6且n=40时,分类器具有最佳性能。
3、特征提取测试
为了评估该方法的性能,将原始数据和SDAE提取的特征映射到二维空间,并在数据丢失率为50%的情况下对提取的特征进行可视化。可视化结果如图6所示,其中1、2、3、4、5和6分别对应于三相短路故障、单相接地故障、发动机出力降低、切负荷、投负荷以及三相断线。
如图6(a)所示,原始数据空间中每个类别的样本有太多重叠,无法分离类别。然而,当使用SDAE提取的特征时,类别被很好地分离。图6(b)-(d) 显示了SDAE中不同数量隐藏层的提取特征的特征空间。随着层数的增加,不同类之间的重叠程度降低。
4、在不同数据丢失水平下的测试
我们假设用于扰动识别的PMU数据中存在数据丢失。图7显示了所提方法的混淆矩阵,其中数据丢失水平设置为50%。混淆矩阵是描述分类精度的一种标准格式。它是一个秩为K的方阵,其中K是类的数目。混淆矩阵的行是通过算法得到的扰动类别,列是实际的扰动类别。对角线上的值表示正确识别类别的概率。对角线两边的值表示第j类扰动被错误识别为第i类扰动的概率。
在图7所示的情况下,其中对于发电机出力降低事件的识别精度较低。这是因为投负荷事件和发电机出力降低事件的动态特征相似,导致了它们的错误分类。测试数据的总体准确率为98.73%,表明该方法对有缺失数据的电力***扰动识别具有良好的性能。
此外,我们在不同数据丢失水平下,用不同的特征提取方法和分类器相结合来突出所提方法的优越性。选择的特征提取方法包括时域人工特征(MFT)、频域人工特征(MFF)、堆叠自动编码器(SAE)和SDAE。分类器包括Softmax、极限学习机(ELM)、线性支持向量机(LSVM)、高斯支持向量机(GSVM)、 DT和RF。结果如图8所示。
从图中可以得到以下结果:
1)在所有的数据丢失水平下,四个不同特征空间中所有分类器的精度和 Micro-F1都呈上升趋势,表明基于深度神经网络的特征提取能力优于传统方法 (MFT和MFF)。
2)随着数据丢失程度的增加,SDAE方法与传统方法在精度上的差异也越来越大,说明传统方法对缺失数据非常敏感,但所提方法对缺失数据具有很强的鲁棒性。
3)在相同的数据丢失水平和相同的特征空间下,集成学习的RF分类器的识别率最高可达98.73%。
5、计算时间评估
在CPU为i7-8700k(3.7GHz)、GTX1080ti GPU和16G内存的计算机上进行了仿真实验。计算过程包括特征提取和分类。表2显示了测试集中每个样本的平均计算时间。计算时间为3.507ms,特征提取时间为3.482ms,分类时间为0.025ms,结果表明该方法计算复杂度低,具有较高的实时性。
表2.所提方法的计算时间
Figure RE-RE-GDA0002960891160000161
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (6)

1.一种基于堆叠去噪自编码器和随机森林分类器的电力***扰动分类方法,其特征在于,包括以下步骤:
步骤1:利用离线的时域仿真法生成电力***的扰动数据;
步骤2:将步骤1中通过离线仿真法所得到的扰动数据进行标准化处理;
步骤3:构造和训练堆叠去噪自编码器深度神经网络,以扰动发生后0.5s内的频率和电压有效值作为堆叠去噪自编码器的输入,对堆叠去噪自编码器进行训练;
步骤4:利用步骤3中训练后的堆叠去噪自编码器对数据特征提取,得到高层次的特征表达;
步骤5:构造和训练随机森林分类器,并通过训练后的随机森林分类器对步骤4中所提取的高层次的特征进行分类,实现扰动识别。
2.根据权利要求1所述的电力***扰动分类方法,其特征在于,步骤1中利用离线的时域仿真法生成扰动数据的过程具体为:分别选取三相短路3-φFlt、单相接地故障φ-gFlt、发电机出力降低GL、投负荷、切负荷、三相断线LT共6种扰动类型进行仿真,***算例为IEEE 10机39***,仿真软件为PSD-BPA,仿真时间为30s,仿真步长设置为0.02s,5s后触发扰动,输出各母线频率与电压有效值。
3.根据权利要求1所述的电力***扰动分类方法,其特征在于,步骤2中所述进行标准化处理的过程为:假设PMU上送频率为50Hz,则0.5s内的频率和电压分别表示为f,
Figure RE-FDA0002960891150000011
对于频率和电压信号分别进行标准化处理:
Figure RE-FDA0002960891150000021
其中,
Figure RE-FDA0002960891150000022
为标准化后的数据,u和σ分别为Z对应变量的均值和标准差。
4.根据权利要求1所述的电力***扰动分类方法,其特征在于,步骤3中所述堆叠去噪自编码器SDAE是由去噪自编码器DAE堆叠而成的深层网络模型,所述构造和训练堆叠去噪自编码器深度神经网络的过程包括以下子步骤:
S31:令
Figure RE-FDA0002960891150000023
为DAE的输入数据,首先,以一定概率C对
Figure RE-FDA0002960891150000024
中的数据随机置零,以得到损坏的扰动数据
Figure RE-FDA0002960891150000025
然后,DAE通过编码操作将损坏的数据映射为隐层的特征表达h=[h1,h2,…,ht]T,再通过解码重构完整的样本
Figure RE-FDA0002960891150000026
所述DAE编码和解码过程如下所示:
Figure RE-FDA0002960891150000027
θ={W,b}
Figure RE-FDA0002960891150000028
θ'={W',b'}
其中,W和W'分别是编码矩阵和解码矩阵;b和b'分别是编码偏置向量和偏置偏差向量;θ和θ'分别是用于编码和解码的参数;fθ和gθ'是激活函数,在此使用Sigmoid函数:
Figure RE-FDA0002960891150000029
S32:对SDEA进行训练,在该过程中,以重建误差最小为目标对参数进行调整:
Figure RE-FDA00029608911500000210
其中
Figure RE-FDA0002960891150000031
是重构误差,
Figure RE-FDA0002960891150000032
是指
Figure RE-FDA0002960891150000033
最小时对应的参数θ和θ';对于预处理过的扰动数据集
Figure RE-FDA0002960891150000034
N为数据个数,其重构误差
Figure RE-FDA0002960891150000035
表示为:
Figure RE-FDA0002960891150000036
其中,
Figure RE-FDA0002960891150000037
为第i个预处理过的扰动数据,
Figure RE-FDA0002960891150000038
Figure RE-FDA0002960891150000039
的重构数据,MSE为均方差;
通过误差的反向传播和梯度下降算法得到最优的模型参数,参数更新过程如下:
Figure RE-FDA00029608911500000310
其中,η为学习率;
在训练过程中,SDAE通过自监督学习来对模型进行优化,具体为,将SDAE中的任意两个相邻层视为一个DAE,并以最小化重构误差为目标,逐层对神经网络进行训练。
5.根据权利要求4所述的电力***扰动分类方法,其特征在于,步骤4中,SDAE是以上个DAE的编码特征作为下一个DAE的输入数据进行正向传播的。
6.根据权利要求5所述的电力***扰动分类方法,其特征在于,所述步骤5中进一步包括:
所述随机森林分类器是以多个决策树DT作为弱分类器的一种集成算法分类器,其中,单个DT为分类回归树CART,对于给定的样本集合D,其基尼系数为
Figure RE-FDA0002960891150000041
其中,|Ck|是DF中属于第k类的样本子集的个数,N为样本个数,K为类别个数;Gini(DF)表示中随机选择的样本被错误分类的概率,Gini(DF)越小,则表明DF中选择的样本被错误分类的概率越低,即DF的纯度越高;
样本特征集DF根据特征F={F1,F2,…Fk}中特征Fj的特定值a分为D1和D2两部分:
D1={(x,y)∈DF|A(x)=a},D2=DF-D1
则在特征A的条件下,集合D的基尼系数为:
Figure RE-FDA0002960891150000042
式中,|D1|和|D2|分别表示集合D1和D2中的样本数;N是样本数;
Gini(DF,Fj=a)表示集合DF以及Fj=a划分后的不确定度;基尼指数的值越大,则样本集的不确定度越大;
使用bootstrap抽样的方法生成n个子数据集,并以基尼指数为分割准则生成n个子数据集以及对应的n个CART,从而构造随机森林分类器;
通过用SDAE提取的高级特征训练随机森林分类器,实现扰动识别并分类。
CN202011132259.3A 2020-10-21 2020-10-21 一种电力***扰动分类方法 Pending CN112633315A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011132259.3A CN112633315A (zh) 2020-10-21 2020-10-21 一种电力***扰动分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011132259.3A CN112633315A (zh) 2020-10-21 2020-10-21 一种电力***扰动分类方法

Publications (1)

Publication Number Publication Date
CN112633315A true CN112633315A (zh) 2021-04-09

Family

ID=75302875

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011132259.3A Pending CN112633315A (zh) 2020-10-21 2020-10-21 一种电力***扰动分类方法

Country Status (1)

Country Link
CN (1) CN112633315A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113316185A (zh) * 2021-05-26 2021-08-27 山东建筑大学 基于分类器的lte网络上行干扰类别识别方法及***
CN113364540A (zh) * 2021-06-07 2021-09-07 山东建筑大学 基于堆栈降噪自编码的lte上行干扰分类方法及***
CN116805039A (zh) * 2023-08-21 2023-09-26 腾讯科技(深圳)有限公司 特征筛选方法、装置、计算机设备和数据扰动方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108846410A (zh) * 2018-05-02 2018-11-20 湘潭大学 基于稀疏自动编码深度神经网络的电能质量扰动分类方法
CN110009529A (zh) * 2019-04-15 2019-07-12 湖南大学 一种基于堆栈降噪自动编码器的暂态频率获取方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108846410A (zh) * 2018-05-02 2018-11-20 湘潭大学 基于稀疏自动编码深度神经网络的电能质量扰动分类方法
CN110009529A (zh) * 2019-04-15 2019-07-12 湖南大学 一种基于堆栈降噪自动编码器的暂态频率获取方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PASCAL VINCENT 等: "Stacked Denoising Autoencoders: Learning Useful Representations in a Deep Network with a Local Denoising Criterion", JOURNAL OF MACHINE LEARNING RESEARCH, 12 October 2010 (2010-10-12), pages 3371 - 3408, XP055577183 *
瞿合祚 等: "基于多标签随机森林的电能质量复合扰动分类方法", 电力***保护与控制, vol. 45, no. 11, 1 June 2017 (2017-06-01), pages 1 - 7 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113316185A (zh) * 2021-05-26 2021-08-27 山东建筑大学 基于分类器的lte网络上行干扰类别识别方法及***
CN113316185B (zh) * 2021-05-26 2023-09-12 山东建筑大学 基于分类器的lte网络上行干扰类别识别方法及***
CN113364540A (zh) * 2021-06-07 2021-09-07 山东建筑大学 基于堆栈降噪自编码的lte上行干扰分类方法及***
CN113364540B (zh) * 2021-06-07 2022-05-17 山东建筑大学 基于堆栈降噪自编码的lte上行干扰分类方法及***
CN116805039A (zh) * 2023-08-21 2023-09-26 腾讯科技(深圳)有限公司 特征筛选方法、装置、计算机设备和数据扰动方法
CN116805039B (zh) * 2023-08-21 2023-12-05 腾讯科技(深圳)有限公司 特征筛选方法、装置、计算机设备和数据扰动方法

Similar Documents

Publication Publication Date Title
CN112633315A (zh) 一种电力***扰动分类方法
CN110879917A (zh) 一种基于迁移学习的电力***暂态稳定自适应评估方法
Mao et al. Anomaly detection for power consumption data based on isolated forest
CN110718910A (zh) 贝叶斯优化LightGBM的暂态稳定评估方法
CN112069727B (zh) 具备高可信度的电力***暂态稳定智能化评估***及方法
Liao et al. Electricity theft detection using Euclidean and graph convolutional neural networks
Zhu et al. Networked time series shapelet learning for power system transient stability assessment
CN115563563A (zh) 基于变压器油色谱分析的故障诊断方法及装置
CN112200694A (zh) 基于图神经网络的主导失稳模式识别模型构建及应用方法
CN112485597A (zh) 基于多源数据的电力***输电线路故障诊断方法及***
CN116401532B (zh) 一种电力***受扰后频率失稳识别方法及***
CN111652478B (zh) 基于伞式算法的电力***电压稳定评估误分类约束方法
CN113435492A (zh) 一种基于主动学习的电力***主导失稳模式判别方法
Chen Review on supervised and unsupervised learning techniques for electrical power systems: Algorithms and applications
Zhang et al. Fault diagnosis of oil-immersed power transformer based on difference-mutation brain storm optimized catboost model
Todeschini et al. An image-based deep transfer learning approach to classify power quality disturbances
Zhang et al. Encoding time series as images: A robust and transferable framework for power system DIM identification combining rules and VGGNet
Ghaemi et al. Situational awareness and deficiency warning system in a smart distribution network based on stacking ensemble learning
CN116400168A (zh) 一种基于深度特征聚类的电网故障诊断方法及***
Du et al. Feature Selection-Based Low Voltage AC Arc Fault Diagnosis Method
CN116304918A (zh) 一种基于深度森林算法的变电站设备故障辨识方法及***
CN115684786A (zh) 基于格拉姆角场和并行cnn的逆变器开关管健康诊断方法、装置及***
Chu et al. A relaxed support vector data description algorithm based fault detection in distribution systems
Yang et al. Classification of Voltage Sag Sources Based on PCA-CNN-LVQ Method
Sun et al. Anomaly detection of electricity load data based on MixMatch

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination