CN105427043A - 一种基于改进的最近邻算法的电网告警分析方法 - Google Patents
一种基于改进的最近邻算法的电网告警分析方法 Download PDFInfo
- Publication number
- CN105427043A CN105427043A CN201510808826.5A CN201510808826A CN105427043A CN 105427043 A CN105427043 A CN 105427043A CN 201510808826 A CN201510808826 A CN 201510808826A CN 105427043 A CN105427043 A CN 105427043A
- Authority
- CN
- China
- Prior art keywords
- sample
- alarm
- classification
- tested
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 14
- 238000000034 method Methods 0.000 claims abstract description 13
- 238000012549 training Methods 0.000 claims description 16
- 238000012360 testing method Methods 0.000 claims description 9
- 230000002159 abnormal effect Effects 0.000 claims description 6
- 239000012141 concentrate Substances 0.000 claims description 6
- 238000013461 design Methods 0.000 claims description 3
- 238000005259 measurement Methods 0.000 abstract description 2
- 238000012544 monitoring process Methods 0.000 description 5
- 238000010224 classification analysis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24147—Distances to closest patterns, e.g. nearest neighbour classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Water Supply & Treatment (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Telephonic Communication Services (AREA)
Abstract
一种基于改进的最近邻算法的电网告警分析方法。本发明通过对电网调度自动化***事故跳闸、告警信号以及量测不平衡等数据进行归类和统计,得到***对地区监控的告警主要可以分为事故、异常、越限、变位和告知;然后结合历史告警信息,确定各告警指标的权值,并采用改进的最近邻算法判别当前告警属于的类别,进行相应处理。本发明提高了分析的可靠性,提高了工作效率。
Description
技术领域
本发明涉及电网调度自动化安全领域,具体涉及一个基于改进的最近邻算法的电网告警分析方法。
背景技术
随着电网规模的不断扩大,电网结构日趋复杂,***运行方式快速多变,运行管理面临着更大的挑战。而电网监控信息种类繁多、数据量庞大,通过科学的方法监测电网监控信息,归类分析发现电网运行规律以快速做出决策则显得十分必要。
监控业务是在“三集五大”调整之后并入调控中心业务中的,之前各地区关于监控信号数据的处理与分析还处于探索阶段。对监控数据的处理分析也主要基于对收集上来的信息进行汇总统计,缺乏全面、***的分析手段对信息进行归类整理,降低了工作效率。
发明内容
本发明针对以上问题,提供了一种能够将数据信息归类和统计,进而分析,便于判别告警类别,提高判别可靠性,提高工作效率的基于改进的近邻算法的电网告警分析方法。
本发明的技术方案为:包括以下步骤:
S1、通过对电网调度自动化***的数据进行归类和统计,将得到的告警数据进行分类,其类别为事故、异常、越限、变位和告知;
S2、结合历史告警信息,确定各告警指标的权值;采用改进的最近邻算法判别当前告警属于的类别,进行相应的处理。
步骤S2包括以下步骤:
(1)数据结构设计:设每个地区的告警信息集合抽象为一个元组,表示为xi=(xi1,xi2,…,xim),m为样本对象的维数,那么历史告警信息表示为X={x1,x2,…,xn},n为样本对象的个数;xi对应电网调度自动化***收集上来的某一地区已知类别的告警信息;
(2)改进的最近邻算法对告警信息进行分析,步骤如下:
步骤1:构建训练样本集合,将历史告警信息X={x1,x2,…,xn}作为训练样本集;
步骤2:设定K值,K为在训练样本集中选取待测样本“近邻”的个数;
步骤3:在训练样本集中选出与待测样本最近的K个样本,样本之间的“近邻”由欧式距离来度量;假设待测样本为xc=(xc1,xc2,…,xcm),此时待测样本与训练样本xi之间的距离为:
其中w1,w2,…,wm分别为相应属性指标对应的权重,权值集合定义为W={w1,w2,…,wm};其中,权值的确定如下:
步骤3.1:取w1,w2,…,wm的值都为1,对若干个已知分类的样本作为测试集进行测试,统计它与样本的实际分类值之间差异个数p;
步骤3.2:依次去除样本中的第j个属性,然后求出样本的估计分类值,统计它与样本的实际分类值之间差异个数pj(j=1,2,…,m);
步骤3.3:计算gj表示当缺少第j个属性值指标时对分类的影响程度,那么权值集合W各元素的值为j=1,2,…,m,特别地,如果pj=0或p=0,置gj=1;
步骤4:假设根据对历史告警信息不同的处理,分为q类告警,表示为S={s1,s2,…,sq};对于待测样本xc,x1,x2,…,xK表示与xc距离最近的K个样本,设离散的目标函数为f:x→si,其中x表示某个告警样本,si表示第i个类别;表示对f(xc)的估计,计算为该函数表示为使得取值最大时的s,s∈S={s1,s2,…,sq},对于若s=f(xi),否则那么上式就可以输出待测样本的K个近邻中对应最多的告警类别s;
步骤5:即是待测样本xc对应的类别,并根据类别对xc进行相应处理。
步骤S1中的告警数据包括事故跳闸统计、告警信号统计以及量测不平衡统计。
本发明通过对事故、异常、越限、变位和告知五类告警信息的收集,并对各告警类别赋以不同的权值,然后结合历史告警信息,确定各告警指标的权值,并采用改进的最近邻算法判别当前告警属于的类别,进行相应处理。
对电网调度自动化***的事故跳闸、告警信号以及量测不平衡数据进行归类和统计,为改进的最近邻算法提供有效的数据支持。
本发明从繁杂的监控跳闸、告警以及不平衡性等数据中归纳、抽取关键监测指标数据,并进行分析、归类、总结,以帮助监控人员总结发现历史规律,辅助决策,从而减轻其繁重的统计分析工作,有效提高电网监控部门的监测分析能力,进而提高工作效率。
附图说明
图1是本发明的流程图;
具体实施方式
本发明如图1所示,包括以下步骤:
S1、通过对电网调度自动化***的数据进行归类和统计,将得到的告警数据进行分类,其类别为事故、异常、越限、变位和告知;
S2、结合历史告警信息,确定各告警指标的权值;采用改进的最近邻算法判别当前告警属于的类别,进行相应的处理。
步骤S2包括以下步骤:
(1)数据结构设计:设每个地区的告警信息集合抽象为一个元组,表示为xi=(xi1,xi2,…,xim),m为样本对象的维数,那么历史告警信息表示为X={x1,x2,…,xn},n为样本对象的个数。本例中m=5,分别代表告警类别为事故、异常、越限、变位和告知5个属性指标;xi对应电网调度自动化***收集上来的某一地区已知类别的告警信息,xi即对应第i个地区的告警信息;n则为收集告警信息的总数;
(2)改进的最近邻算法对告警信息进行分析,步骤如下:
步骤1:构建训练样本集合,将历史告警信息X={x1,x2,…,xn}作为训练样本集;
步骤2:设定K值,K为在训练样本集中选取待测样本“近邻”的个数。工作中,先确定一个初始值,然后根据分类的准确度不断调整,最终达到最优;当分类结果的准确度低于预先设置的阈值时,就增大K的值,直到使分类结果的准确度达到要求。
步骤3:在训练样本集中选出与待测样本最近的K个样本,样本之间的“近邻”由欧式距离来度量,距离越小则表示与待测样本的距离越近。假设待测样本为xc=(xc1,xc2,…,xcm),此时待测样本与训练样本xi之间的距离为:
其中w1,w2,…,wm分别为相应属性指标对应的权重,权值集合定义为W={w1,w2,…,wm};其中,权值的确定如下:
步骤3.1:取w1,w2,…,wm的值都为1,对若干个已知分类的样本作为测试集进行测试,统计它与样本的实际分类值之间差异个数p;
步骤3.2:依次去除样本中的第j个属性,然后求出样本的估计分类值,统计它与样本的实际分类值之间差异个数pj(j=1,2,…,m);
步骤3.3:计算gj表示当缺少第j个属性值指标时对分类的影响程度,那么权值集合W各元素的值为j=1,2,…,m,特别地,如果pj=0或p=0,置gj=1;
本发明中确定各告警指标的权值,提高分析的可靠性以及确定后续告警类别的可靠性,进而采取相应的处理,节省时间,提高了工作效率。
步骤4:假设根据对历史告警信息不同的处理,分为q类告警,表示为S={s1,s2,…,sq};对于待测样本xc,x1,x2,…,xK表示与xc距离最近的K个样本,设离散的目标函数为f:x→si,其中x表示某个告警样本,si表示第i个类别;表示对f(xc)的估计,计算为该函数表示为使得取值最大时的s,s∈S={s1,s2,…,sq},对于若s=f(xi),否则那么上式就可以输出待测样本的K个近邻中对应最多的告警类别s;
步骤5:即是待测样本xc对应的类别,并根据类别对xc进行相应处理。
步骤S1中的告警数据包括事故跳闸统计、告警信号统计以及量测不平衡统计。其中,事故跳闸统计,例如按地区、电压等级统计线路跳闸次数;告警信号统计,例如按维护责任区统计告警信息情况;量测不平衡性统计,例如按厂站统计,点击可查看某厂站每天的不平衡情况。
具体实施如下:
取K=5,告警的类别为S={s1,s2,s3,s4}四类,即把告警分成四类,进行分类处理。
(1)计算事故、异常、越限、变位和告知5个属性指标所对应的权值:
步骤1:选取12个已知告警类别的测试样本,分别对12个测试样本进行测试。对于一个属于s2类的测试样本为x,当w1,w2,…,w5=1时,利用欧式距离选取训练样本中距离测试样本x最近的5个样本即最“近邻”,然后利用5个最“近邻”得到测试样本x的估计分类。按照同样的方法可以得到12个样本的估计分类。最后统计估计分类与实际分类的差异数,假设差异数为2。
步骤2:分别去除样本中的一个属性指标,然后求出样本的估计分类值,统计它与样本的实际分类值之间差异个数。假设5个属性指标对应的差异数依次为2,2,1,3,4,那么五个属性指标对应的权值为 依次
(2)利用上述得到的权值,得到待测样本的所属于的类别:
对于一个待测样本xc=(1,3,1,2,1),得到其5个近邻为x1=(2,1,0,2,1),x2=(1,2,1,1,1),x3=(1,3,1,0,1),x4=(0,4,1,2,1),x5=(1,2,0,3,1),其中x1属于s1,x2,x3,x4,x5属于s2,则可以得到xc的5个近邻中属于s2类别的样本最多,则xc属于s2。
Claims (3)
1.一种基于改进的最近邻算法的电网告警分析方法,其特征在于,包括以下步骤:
S1、通过对电网调度自动化***的数据进行归类和统计,将得到的告警数据进行分类,其类别为事故、异常、越限、变位和告知;
S2、结合历史告警信息,确定各告警指标的权值;采用改进的最近邻算法判别当前告警属于的类别,进行相应的处理。
2.根据权利要求1所述的一种基于改进的最近邻算法的电网告警分析方法,其特征在于,步骤S2包括以下步骤:
(1)数据结构设计:设每个地区的告警信息集合抽象为一个元组,表示为xi=(xi1,xi2,…,xim),m为样本对象的维数,那么历史告警信息表示为X={x1,x2,…,xn},n为样本对象的个数;xi对应电网调度自动化***收集上来的某一地区已知类别的告警信息;
(2)改进的最近邻算法对告警信息进行分析,步骤如下:
步骤1:构建训练样本集合,将历史告警信息X={x1,x2,…,xn}作为训练样本集;
步骤2:设定K值,K为在训练样本集中选取待测样本“近邻”的个数;
步骤3:在训练样本集中选出与待测样本最近的K个样本,样本之间的“近邻”由欧式距离来度量;假设待测样本为xc=(xc1,xc2,…,xcm),此时待测样本与训练样本xi之间的距离为:
步骤3.1:取w1,w2,…,wm的值都为1,对若干个已知分类的样本作为测试集进行测试,统计它与样本的实际分类值之间差异个数p;
步骤3.2:依次去除样本中的第j个属性,然后求出样本的估计分类值,统计它与样本的实际分类值之间差异个数pj(j=1,2,…,m);
步骤3.3:计算gj表示当缺少第j个属性值指标时对分类的影响程度,那么权值集合W各元素的值为 特别地,如果pj=0或p=0,置gj=1;
步骤4:假设根据对历史告警信息不同的处理,分为q类告警,表示为S={s1,s2,…,sq};对于待测样本xc,x1,x2,…,xK表示与xc距离最近的K个样本,设离散的目标函数为f:x→si,其中x表示某个告警样本,si表示第i个类别;表示对f(xc)的估计,计算为该函数表示为使得取值最大时的s,s∈S={s1,s2,…,sq},对于若s=f(xi),否则那么上式就可以输出待测样本的K个近邻中对应最多的告警类别s;
步骤5:即是待测样本xc对应的类别,并根据类别对xc进行相应处理。
3.根据权利要求1所述的一种基于改进的最近邻算法的电网告警分析方法,其特征在于,步骤S1中的告警数据包括事故跳闸统计、告警信号统计以及量测不平衡统计。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510808826.5A CN105427043A (zh) | 2015-11-20 | 2015-11-20 | 一种基于改进的最近邻算法的电网告警分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510808826.5A CN105427043A (zh) | 2015-11-20 | 2015-11-20 | 一种基于改进的最近邻算法的电网告警分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105427043A true CN105427043A (zh) | 2016-03-23 |
Family
ID=55505236
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510808826.5A Pending CN105427043A (zh) | 2015-11-20 | 2015-11-20 | 一种基于改进的最近邻算法的电网告警分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105427043A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106250927A (zh) * | 2016-07-29 | 2016-12-21 | 国网河南省电力公司电力科学研究院 | 基于k最近邻分类算法的配电网拓扑结构校验方法 |
CN109767062A (zh) * | 2018-12-07 | 2019-05-17 | 国网江苏省电力有限公司南京供电分公司 | 一种电网任务处置方案的动态生成方法 |
CN111016720A (zh) * | 2019-12-23 | 2020-04-17 | 深圳供电局有限公司 | 基于k最近邻算法攻击识别方法及充电装置 |
CN112559308A (zh) * | 2020-12-11 | 2021-03-26 | 广东电力通信科技有限公司 | 一种基于统计模型的根告警分析方法 |
CN113159516A (zh) * | 2021-03-24 | 2021-07-23 | 国网浙江省电力有限公司宁波供电公司 | 一种基于电网运行数据的三维可视化信息分析*** |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103455563A (zh) * | 2013-08-15 | 2013-12-18 | 国家电网公司 | 一种适用于智能变电站一体化监控***的数据挖掘方法 |
CN104134006A (zh) * | 2014-08-04 | 2014-11-05 | 昆明理工大学 | 一种基于历史数据聚类的电力设备动态阈值整定方法 |
CN104239437A (zh) * | 2014-08-28 | 2014-12-24 | 国家电网公司 | 一种面向电网调度的智能告警分析方法 |
CN104459378A (zh) * | 2014-11-19 | 2015-03-25 | 云南电网公司电力科学研究院 | 一种智能变电站故障诊断方法 |
-
2015
- 2015-11-20 CN CN201510808826.5A patent/CN105427043A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103455563A (zh) * | 2013-08-15 | 2013-12-18 | 国家电网公司 | 一种适用于智能变电站一体化监控***的数据挖掘方法 |
CN104134006A (zh) * | 2014-08-04 | 2014-11-05 | 昆明理工大学 | 一种基于历史数据聚类的电力设备动态阈值整定方法 |
CN104239437A (zh) * | 2014-08-28 | 2014-12-24 | 国家电网公司 | 一种面向电网调度的智能告警分析方法 |
CN104459378A (zh) * | 2014-11-19 | 2015-03-25 | 云南电网公司电力科学研究院 | 一种智能变电站故障诊断方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106250927A (zh) * | 2016-07-29 | 2016-12-21 | 国网河南省电力公司电力科学研究院 | 基于k最近邻分类算法的配电网拓扑结构校验方法 |
CN109767062A (zh) * | 2018-12-07 | 2019-05-17 | 国网江苏省电力有限公司南京供电分公司 | 一种电网任务处置方案的动态生成方法 |
CN111016720A (zh) * | 2019-12-23 | 2020-04-17 | 深圳供电局有限公司 | 基于k最近邻算法攻击识别方法及充电装置 |
CN112559308A (zh) * | 2020-12-11 | 2021-03-26 | 广东电力通信科技有限公司 | 一种基于统计模型的根告警分析方法 |
CN112559308B (zh) * | 2020-12-11 | 2023-02-28 | 广东电力通信科技有限公司 | 一种基于统计模型的根告警分析方法 |
CN113159516A (zh) * | 2021-03-24 | 2021-07-23 | 国网浙江省电力有限公司宁波供电公司 | 一种基于电网运行数据的三维可视化信息分析*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105427043A (zh) | 一种基于改进的最近邻算法的电网告警分析方法 | |
CN109146705B (zh) | 一种用电特征指标降维与极限学习机算法进行窃电检测的方法 | |
CN107038167A (zh) | 基于模型评估的大数据挖掘分析***及其分析方法 | |
CN104809658B (zh) | 一种低压配网台区线损的快速分析方法 | |
CN110634080A (zh) | 异常用电检测方法、装置、设备及计算机可读存储介质 | |
CN103103570B (zh) | 基于主元相似性测度的铝电解槽况诊断方法 | |
CN106154209A (zh) | 基于决策树算法的电能表故障预测方法 | |
CN103033362A (zh) | 一种基于改进多变量预测模型的齿轮故障诊断方法 | |
CN105184084A (zh) | 一种电力计量自动化终端故障类型预测方法和*** | |
CN107609783A (zh) | 一种基于数据挖掘的智能电能表综合性能进行评估的方法及*** | |
CN106330624B (zh) | 一种电力信息网络流量异常检测方法 | |
CN103812577A (zh) | 非正常无线电信号的自动识别***及其方法 | |
CN107798395A (zh) | 一种电网事故信号自动诊断方法及*** | |
CN102789676B (zh) | 一种基于报警证据融合的工业报警器设计方法 | |
CN103310388A (zh) | 基于信源熵的电网运行综合指数计算方法 | |
CN103886518A (zh) | 一种基于监测点电能质量数据挖掘的电压暂降预警方法 | |
CN110705887A (zh) | 一种基于神经网络模型的低压台区运行状态综合评价方法 | |
CN108287327A (zh) | 基于贝叶斯分类的计量自动化终端故障诊断方法 | |
CN103750552A (zh) | 一种智能取样方法及其在香烟质量控制的应用 | |
CN104484678A (zh) | 基于故障类型分类能力评价矩阵的多分类器融合故障诊断方法 | |
CN107844067A (zh) | 一种水电站闸门在线状态监测控制方法及监测*** | |
CN114201374A (zh) | 基于混合机器学习的运维时序数据异常检测方法及*** | |
CN103440410A (zh) | 主变个体缺陷概率预测方法 | |
CN114169424A (zh) | 基于k近邻回归算法和用电数据的排污量预测方法 | |
CN105184661A (zh) | 基于加权马氏距离判别的电网监控信号分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160323 |
|
RJ01 | Rejection of invention patent application after publication |