CN105427043A - 一种基于改进的最近邻算法的电网告警分析方法 - Google Patents

一种基于改进的最近邻算法的电网告警分析方法 Download PDF

Info

Publication number
CN105427043A
CN105427043A CN201510808826.5A CN201510808826A CN105427043A CN 105427043 A CN105427043 A CN 105427043A CN 201510808826 A CN201510808826 A CN 201510808826A CN 105427043 A CN105427043 A CN 105427043A
Authority
CN
China
Prior art keywords
sample
alarm
classification
tested
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510808826.5A
Other languages
English (en)
Inventor
陈艳
居峻
滕俊
陆圣芝
黄�俊
冯威
徐庆中
范永璞
王阳
林元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Yangzhou Power Supply Co of Jiangsu Electric Power Co
Original Assignee
State Grid Corp of China SGCC
Yangzhou Power Supply Co of Jiangsu Electric Power Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Yangzhou Power Supply Co of Jiangsu Electric Power Co filed Critical State Grid Corp of China SGCC
Priority to CN201510808826.5A priority Critical patent/CN105427043A/zh
Publication of CN105427043A publication Critical patent/CN105427043A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Educational Administration (AREA)
  • Water Supply & Treatment (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Telephonic Communication Services (AREA)

Abstract

一种基于改进的最近邻算法的电网告警分析方法。本发明通过对电网调度自动化***事故跳闸、告警信号以及量测不平衡等数据进行归类和统计,得到***对地区监控的告警主要可以分为事故、异常、越限、变位和告知;然后结合历史告警信息,确定各告警指标的权值,并采用改进的最近邻算法判别当前告警属于的类别,进行相应处理。本发明提高了分析的可靠性,提高了工作效率。

Description

一种基于改进的最近邻算法的电网告警分析方法
技术领域
本发明涉及电网调度自动化安全领域,具体涉及一个基于改进的最近邻算法的电网告警分析方法。
背景技术
随着电网规模的不断扩大,电网结构日趋复杂,***运行方式快速多变,运行管理面临着更大的挑战。而电网监控信息种类繁多、数据量庞大,通过科学的方法监测电网监控信息,归类分析发现电网运行规律以快速做出决策则显得十分必要。
监控业务是在“三集五大”调整之后并入调控中心业务中的,之前各地区关于监控信号数据的处理与分析还处于探索阶段。对监控数据的处理分析也主要基于对收集上来的信息进行汇总统计,缺乏全面、***的分析手段对信息进行归类整理,降低了工作效率。
发明内容
本发明针对以上问题,提供了一种能够将数据信息归类和统计,进而分析,便于判别告警类别,提高判别可靠性,提高工作效率的基于改进的近邻算法的电网告警分析方法。
本发明的技术方案为:包括以下步骤:
S1、通过对电网调度自动化***的数据进行归类和统计,将得到的告警数据进行分类,其类别为事故、异常、越限、变位和告知;
S2、结合历史告警信息,确定各告警指标的权值;采用改进的最近邻算法判别当前告警属于的类别,进行相应的处理。
步骤S2包括以下步骤:
(1)数据结构设计:设每个地区的告警信息集合抽象为一个元组,表示为xi=(xi1,xi2,…,xim),m为样本对象的维数,那么历史告警信息表示为X={x1,x2,…,xn},n为样本对象的个数;xi对应电网调度自动化***收集上来的某一地区已知类别的告警信息;
(2)改进的最近邻算法对告警信息进行分析,步骤如下:
步骤1:构建训练样本集合,将历史告警信息X={x1,x2,…,xn}作为训练样本集;
步骤2:设定K值,K为在训练样本集中选取待测样本“近邻”的个数;
步骤3:在训练样本集中选出与待测样本最近的K个样本,样本之间的“近邻”由欧式距离来度量;假设待测样本为xc=(xc1,xc2,…,xcm),此时待测样本与训练样本xi之间的距离为:
d ′ ( x i , x c ) = w 1 ( x i 1 - x c 1 ) 2 + w 2 ( x i 2 - x c 2 ) 2 + ... + w m ( x i m - x c m ) 2 2 ,
其中w1,w2,…,wm分别为相应属性指标对应的权重,权值集合定义为W={w1,w2,…,wm};其中,权值的确定如下:
步骤3.1:取w1,w2,…,wm的值都为1,对若干个已知分类的样本作为测试集进行测试,统计它与样本的实际分类值之间差异个数p;
步骤3.2:依次去除样本中的第j个属性,然后求出样本的估计分类值,统计它与样本的实际分类值之间差异个数pj(j=1,2,…,m);
步骤3.3:计算gj表示当缺少第j个属性值指标时对分类的影响程度,那么权值集合W各元素的值为j=1,2,…,m,特别地,如果pj=0或p=0,置gj=1;
步骤4:假设根据对历史告警信息不同的处理,分为q类告警,表示为S={s1,s2,…,sq};对于待测样本xc,x1,x2,…,xK表示与xc距离最近的K个样本,设离散的目标函数为f:x→si,其中x表示某个告警样本,si表示第i个类别;表示对f(xc)的估计,计算为该函数表示为使得取值最大时的s,s∈S={s1,s2,…,sq},对于若s=f(xi),否则那么上式就可以输出待测样本的K个近邻中对应最多的告警类别s;
步骤5:即是待测样本xc对应的类别,并根据类别对xc进行相应处理。
步骤S1中的告警数据包括事故跳闸统计、告警信号统计以及量测不平衡统计。
本发明通过对事故、异常、越限、变位和告知五类告警信息的收集,并对各告警类别赋以不同的权值,然后结合历史告警信息,确定各告警指标的权值,并采用改进的最近邻算法判别当前告警属于的类别,进行相应处理。
对电网调度自动化***的事故跳闸、告警信号以及量测不平衡数据进行归类和统计,为改进的最近邻算法提供有效的数据支持。
本发明从繁杂的监控跳闸、告警以及不平衡性等数据中归纳、抽取关键监测指标数据,并进行分析、归类、总结,以帮助监控人员总结发现历史规律,辅助决策,从而减轻其繁重的统计分析工作,有效提高电网监控部门的监测分析能力,进而提高工作效率。
附图说明
图1是本发明的流程图;
具体实施方式
本发明如图1所示,包括以下步骤:
S1、通过对电网调度自动化***的数据进行归类和统计,将得到的告警数据进行分类,其类别为事故、异常、越限、变位和告知;
S2、结合历史告警信息,确定各告警指标的权值;采用改进的最近邻算法判别当前告警属于的类别,进行相应的处理。
步骤S2包括以下步骤:
(1)数据结构设计:设每个地区的告警信息集合抽象为一个元组,表示为xi=(xi1,xi2,…,xim),m为样本对象的维数,那么历史告警信息表示为X={x1,x2,…,xn},n为样本对象的个数。本例中m=5,分别代表告警类别为事故、异常、越限、变位和告知5个属性指标;xi对应电网调度自动化***收集上来的某一地区已知类别的告警信息,xi即对应第i个地区的告警信息;n则为收集告警信息的总数;
(2)改进的最近邻算法对告警信息进行分析,步骤如下:
步骤1:构建训练样本集合,将历史告警信息X={x1,x2,…,xn}作为训练样本集;
步骤2:设定K值,K为在训练样本集中选取待测样本“近邻”的个数。工作中,先确定一个初始值,然后根据分类的准确度不断调整,最终达到最优;当分类结果的准确度低于预先设置的阈值时,就增大K的值,直到使分类结果的准确度达到要求。
步骤3:在训练样本集中选出与待测样本最近的K个样本,样本之间的“近邻”由欧式距离来度量,距离越小则表示与待测样本的距离越近。假设待测样本为xc=(xc1,xc2,…,xcm),此时待测样本与训练样本xi之间的距离为:
d ′ ( x i , x c ) = w 1 ( x i 1 - x c 1 ) 2 + w 2 ( x i 2 - x c 2 ) 2 + ... + w m ( x i m - x c m ) 2 2 ,
其中w1,w2,…,wm分别为相应属性指标对应的权重,权值集合定义为W={w1,w2,…,wm};其中,权值的确定如下:
步骤3.1:取w1,w2,…,wm的值都为1,对若干个已知分类的样本作为测试集进行测试,统计它与样本的实际分类值之间差异个数p;
步骤3.2:依次去除样本中的第j个属性,然后求出样本的估计分类值,统计它与样本的实际分类值之间差异个数pj(j=1,2,…,m);
步骤3.3:计算gj表示当缺少第j个属性值指标时对分类的影响程度,那么权值集合W各元素的值为j=1,2,…,m,特别地,如果pj=0或p=0,置gj=1;
本发明中确定各告警指标的权值,提高分析的可靠性以及确定后续告警类别的可靠性,进而采取相应的处理,节省时间,提高了工作效率。
步骤4:假设根据对历史告警信息不同的处理,分为q类告警,表示为S={s1,s2,…,sq};对于待测样本xc,x1,x2,…,xK表示与xc距离最近的K个样本,设离散的目标函数为f:x→si,其中x表示某个告警样本,si表示第i个类别;表示对f(xc)的估计,计算为该函数表示为使得取值最大时的s,s∈S={s1,s2,…,sq},对于若s=f(xi),否则那么上式就可以输出待测样本的K个近邻中对应最多的告警类别s;
步骤5:即是待测样本xc对应的类别,并根据类别对xc进行相应处理。
步骤S1中的告警数据包括事故跳闸统计、告警信号统计以及量测不平衡统计。其中,事故跳闸统计,例如按地区、电压等级统计线路跳闸次数;告警信号统计,例如按维护责任区统计告警信息情况;量测不平衡性统计,例如按厂站统计,点击可查看某厂站每天的不平衡情况。
具体实施如下:
取K=5,告警的类别为S={s1,s2,s3,s4}四类,即把告警分成四类,进行分类处理。
(1)计算事故、异常、越限、变位和告知5个属性指标所对应的权值:
步骤1:选取12个已知告警类别的测试样本,分别对12个测试样本进行测试。对于一个属于s2类的测试样本为x,当w1,w2,…,w5=1时,利用欧式距离选取训练样本中距离测试样本x最近的5个样本即最“近邻”,然后利用5个最“近邻”得到测试样本x的估计分类。按照同样的方法可以得到12个样本的估计分类。最后统计估计分类与实际分类的差异数,假设差异数为2。
步骤2:分别去除样本中的一个属性指标,然后求出样本的估计分类值,统计它与样本的实际分类值之间差异个数。假设5个属性指标对应的差异数依次为2,2,1,3,4,那么五个属性指标对应的权值为 w 1 = 2 2 2 2 + 2 2 + 1 2 + 3 2 + 4 2 = 1 6 , 依次 w 2 = 1 6 , w 3 = 1 12 , w 4 = 1 4 , w 5 = 1 3 .
(2)利用上述得到的权值,得到待测样本的所属于的类别:
对于一个待测样本xc=(1,3,1,2,1),得到其5个近邻为x1=(2,1,0,2,1),x2=(1,2,1,1,1),x3=(1,3,1,0,1),x4=(0,4,1,2,1),x5=(1,2,0,3,1),其中x1属于s1,x2,x3,x4,x5属于s2,则可以得到xc的5个近邻中属于s2类别的样本最多,则xc属于s2

Claims (3)

1.一种基于改进的最近邻算法的电网告警分析方法,其特征在于,包括以下步骤:
S1、通过对电网调度自动化***的数据进行归类和统计,将得到的告警数据进行分类,其类别为事故、异常、越限、变位和告知;
S2、结合历史告警信息,确定各告警指标的权值;采用改进的最近邻算法判别当前告警属于的类别,进行相应的处理。
2.根据权利要求1所述的一种基于改进的最近邻算法的电网告警分析方法,其特征在于,步骤S2包括以下步骤:
(1)数据结构设计:设每个地区的告警信息集合抽象为一个元组,表示为xi=(xi1,xi2,…,xim),m为样本对象的维数,那么历史告警信息表示为X={x1,x2,…,xn},n为样本对象的个数;xi对应电网调度自动化***收集上来的某一地区已知类别的告警信息;
(2)改进的最近邻算法对告警信息进行分析,步骤如下:
步骤1:构建训练样本集合,将历史告警信息X={x1,x2,…,xn}作为训练样本集;
步骤2:设定K值,K为在训练样本集中选取待测样本“近邻”的个数;
步骤3:在训练样本集中选出与待测样本最近的K个样本,样本之间的“近邻”由欧式距离来度量;假设待测样本为xc=(xc1,xc2,…,xcm),此时待测样本与训练样本xi之间的距离为:
d ′ ( x i , x c ) = w 1 ( x i 1 - x c 1 ) 2 + w 2 ( x i 2 - x c 2 ) 2 + ... + w m ( x i m - x c m ) 2 2 , 其中w1,w2,…,wm分别为相应属性指标对应的权重,权值集合定义为W={w1,w2,…,wm};其中,权值的确定如下:
步骤3.1:取w1,w2,…,wm的值都为1,对若干个已知分类的样本作为测试集进行测试,统计它与样本的实际分类值之间差异个数p;
步骤3.2:依次去除样本中的第j个属性,然后求出样本的估计分类值,统计它与样本的实际分类值之间差异个数pj(j=1,2,…,m);
步骤3.3:计算gj表示当缺少第j个属性值指标时对分类的影响程度,那么权值集合W各元素的值为 特别地,如果pj=0或p=0,置gj=1;
步骤4:假设根据对历史告警信息不同的处理,分为q类告警,表示为S={s1,s2,…,sq};对于待测样本xc,x1,x2,…,xK表示与xc距离最近的K个样本,设离散的目标函数为f:x→si,其中x表示某个告警样本,si表示第i个类别;表示对f(xc)的估计,计算为该函数表示为使得取值最大时的s,s∈S={s1,s2,…,sq},对于若s=f(xi),否则那么上式就可以输出待测样本的K个近邻中对应最多的告警类别s;
步骤5:即是待测样本xc对应的类别,并根据类别对xc进行相应处理。
3.根据权利要求1所述的一种基于改进的最近邻算法的电网告警分析方法,其特征在于,步骤S1中的告警数据包括事故跳闸统计、告警信号统计以及量测不平衡统计。
CN201510808826.5A 2015-11-20 2015-11-20 一种基于改进的最近邻算法的电网告警分析方法 Pending CN105427043A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510808826.5A CN105427043A (zh) 2015-11-20 2015-11-20 一种基于改进的最近邻算法的电网告警分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510808826.5A CN105427043A (zh) 2015-11-20 2015-11-20 一种基于改进的最近邻算法的电网告警分析方法

Publications (1)

Publication Number Publication Date
CN105427043A true CN105427043A (zh) 2016-03-23

Family

ID=55505236

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510808826.5A Pending CN105427043A (zh) 2015-11-20 2015-11-20 一种基于改进的最近邻算法的电网告警分析方法

Country Status (1)

Country Link
CN (1) CN105427043A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106250927A (zh) * 2016-07-29 2016-12-21 国网河南省电力公司电力科学研究院 基于k最近邻分类算法的配电网拓扑结构校验方法
CN109767062A (zh) * 2018-12-07 2019-05-17 国网江苏省电力有限公司南京供电分公司 一种电网任务处置方案的动态生成方法
CN111016720A (zh) * 2019-12-23 2020-04-17 深圳供电局有限公司 基于k最近邻算法攻击识别方法及充电装置
CN112559308A (zh) * 2020-12-11 2021-03-26 广东电力通信科技有限公司 一种基于统计模型的根告警分析方法
CN113159516A (zh) * 2021-03-24 2021-07-23 国网浙江省电力有限公司宁波供电公司 一种基于电网运行数据的三维可视化信息分析***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103455563A (zh) * 2013-08-15 2013-12-18 国家电网公司 一种适用于智能变电站一体化监控***的数据挖掘方法
CN104134006A (zh) * 2014-08-04 2014-11-05 昆明理工大学 一种基于历史数据聚类的电力设备动态阈值整定方法
CN104239437A (zh) * 2014-08-28 2014-12-24 国家电网公司 一种面向电网调度的智能告警分析方法
CN104459378A (zh) * 2014-11-19 2015-03-25 云南电网公司电力科学研究院 一种智能变电站故障诊断方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103455563A (zh) * 2013-08-15 2013-12-18 国家电网公司 一种适用于智能变电站一体化监控***的数据挖掘方法
CN104134006A (zh) * 2014-08-04 2014-11-05 昆明理工大学 一种基于历史数据聚类的电力设备动态阈值整定方法
CN104239437A (zh) * 2014-08-28 2014-12-24 国家电网公司 一种面向电网调度的智能告警分析方法
CN104459378A (zh) * 2014-11-19 2015-03-25 云南电网公司电力科学研究院 一种智能变电站故障诊断方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106250927A (zh) * 2016-07-29 2016-12-21 国网河南省电力公司电力科学研究院 基于k最近邻分类算法的配电网拓扑结构校验方法
CN109767062A (zh) * 2018-12-07 2019-05-17 国网江苏省电力有限公司南京供电分公司 一种电网任务处置方案的动态生成方法
CN111016720A (zh) * 2019-12-23 2020-04-17 深圳供电局有限公司 基于k最近邻算法攻击识别方法及充电装置
CN112559308A (zh) * 2020-12-11 2021-03-26 广东电力通信科技有限公司 一种基于统计模型的根告警分析方法
CN112559308B (zh) * 2020-12-11 2023-02-28 广东电力通信科技有限公司 一种基于统计模型的根告警分析方法
CN113159516A (zh) * 2021-03-24 2021-07-23 国网浙江省电力有限公司宁波供电公司 一种基于电网运行数据的三维可视化信息分析***

Similar Documents

Publication Publication Date Title
CN105427043A (zh) 一种基于改进的最近邻算法的电网告警分析方法
CN109146705B (zh) 一种用电特征指标降维与极限学习机算法进行窃电检测的方法
CN107038167A (zh) 基于模型评估的大数据挖掘分析***及其分析方法
CN104809658B (zh) 一种低压配网台区线损的快速分析方法
CN110634080A (zh) 异常用电检测方法、装置、设备及计算机可读存储介质
CN103103570B (zh) 基于主元相似性测度的铝电解槽况诊断方法
CN106154209A (zh) 基于决策树算法的电能表故障预测方法
CN103033362A (zh) 一种基于改进多变量预测模型的齿轮故障诊断方法
CN105184084A (zh) 一种电力计量自动化终端故障类型预测方法和***
CN107609783A (zh) 一种基于数据挖掘的智能电能表综合性能进行评估的方法及***
CN106330624B (zh) 一种电力信息网络流量异常检测方法
CN103812577A (zh) 非正常无线电信号的自动识别***及其方法
CN107798395A (zh) 一种电网事故信号自动诊断方法及***
CN102789676B (zh) 一种基于报警证据融合的工业报警器设计方法
CN103310388A (zh) 基于信源熵的电网运行综合指数计算方法
CN103886518A (zh) 一种基于监测点电能质量数据挖掘的电压暂降预警方法
CN110705887A (zh) 一种基于神经网络模型的低压台区运行状态综合评价方法
CN108287327A (zh) 基于贝叶斯分类的计量自动化终端故障诊断方法
CN103750552A (zh) 一种智能取样方法及其在香烟质量控制的应用
CN104484678A (zh) 基于故障类型分类能力评价矩阵的多分类器融合故障诊断方法
CN107844067A (zh) 一种水电站闸门在线状态监测控制方法及监测***
CN114201374A (zh) 基于混合机器学习的运维时序数据异常检测方法及***
CN103440410A (zh) 主变个体缺陷概率预测方法
CN114169424A (zh) 基于k近邻回归算法和用电数据的排污量预测方法
CN105184661A (zh) 基于加权马氏距离判别的电网监控信号分析方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160323

RJ01 Rejection of invention patent application after publication