CN109639475A - 基于关联图的网络自诊断故障定位方法 - Google Patents

基于关联图的网络自诊断故障定位方法 Download PDF

Info

Publication number
CN109639475A
CN109639475A CN201811486519.XA CN201811486519A CN109639475A CN 109639475 A CN109639475 A CN 109639475A CN 201811486519 A CN201811486519 A CN 201811486519A CN 109639475 A CN109639475 A CN 109639475A
Authority
CN
China
Prior art keywords
node
network
alarming node
alarming
associated diagram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811486519.XA
Other languages
English (en)
Inventor
杨波
党倩
王琼
王刚
尚闻博
杨明杰
郭芳琳
李瑞琪
栗志鹏
闫润珍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Gansu Electric Power Co Ltd
Information and Telecommunication Branch of State Grid Gansu Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
State Grid Gansu Electric Power Co Ltd
Information and Telecommunication Branch of State Grid Gansu Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Gansu Electric Power Co Ltd, Information and Telecommunication Branch of State Grid Gansu Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201811486519.XA priority Critical patent/CN109639475A/zh
Publication of CN109639475A publication Critical patent/CN109639475A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/0213Standardised network management protocols, e.g. simple network management protocol [SNMP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/064Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/065Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种基于关联图的网络自诊断故障定位方法,支持各种类型的关联关系,包括一对一因果关系、多故障间带“并且”、“或者”语义的复杂关系等。根据局部的关联关系自动生成全局关联图,用户只需要提供直接关联的故障事件间的关系,通过这些局部的基本关系,就可以自动生成所有故障事件的全局关联图。通过利用关联图自身的性质进行故障定位结合案例推理定位思想,大大提高了故障定位的效率。本发明给出基于关联图,应用到网络故障诊断***中,将故障定位功能和***的其它模块有机的结合,使得用户能够方便的配置故障关联关系,并能够根据故障报警进行及时的故障源定位,结果表明算法能够进行准确的故障定位。

Description

基于关联图的网络自诊断故障定位方法
技术领域
本发明属于网络故障诊断领域,尤其涉及一种基于关联图的网络自诊断故障定位方法。
背景技术
在过去的几十年间,计算机网络的规模经历了***式的增长,网络的应用已经深入到人们生活工作的每一个角落,成为必不可少的基础设施。随着对网络依赖性的加强,人们对网络的可靠性也提出了更高的要求:(1)稳定、高效、安全的网络环境;(2)当网络发生故障时,能够及时的检测出故障原因并修复。
网络故障诊断对保持网络的健康状态具有重要的意义,然而在当今网络环境下,网络故障诊断遇到了前所未有的困难,主要表现在以下几个方面:
(1)计算机网络无论从规模上,还是从网络复杂性和业务多样性上都有了巨大的发展。大规模网络的故障关系错综复杂,故障原因和故障现象之间的对应关系模糊,大大提高了故障诊断的难度;
(2)网络设备的复杂性也提高了故障诊断的难度。网络设备的复杂性有两个含义第一是新的网络设备不断推出,功能越来越多,越来越复杂;第二是设备提供商数量众多,产品规格和标准不统一;
(3)随着Internet的广泛应用,计算机技术和网络通信技术得到迅速发展,新的数字通信网络不仅拥有多种业务流量,而且采用了多种融合的网络传输技术,不断采用的网络新技术对网络故障诊断提出了越来越高的要求。
正是由于上述困难的存在,传统的依靠网络专家以人工方式进行的故障诊断已经不能满足需要了。当代网络呼唤智能化的故障诊断技术以实现网络故障诊断的自动化,将人从繁重的诊断工作中解放出来。研究智能化网络故障诊断技术,发展与时代相适应的信息化保障体系,确立高效的故障定位理念和推动网络故障诊断精确化,已成为信息化建设的迫切需求。
目前用于故障定位的方法有很多,它们的理论基础来自人工智能、图论、神经网络、信息论等计算机科学领域。基于网络拓扑结构的特点和故障传播等的复杂性,目前的故障定位技术,具有单一性、难以应对复杂语义等缺点,不能完全满足网络故障定位的需求。基于规则推理的网络故障定位方法要求规则必须精确匹配,如果当前的网络状态与规则的条件不匹配,***将退出整个推理过程。但是预先为一个大型网络确定所有的故障规则是非常困难,甚至是不可能的。
发明内容
发明目的:针对以上问题,本发明提出一种基于关联图的网络自诊断故障定位方法。
技术方案:为实现本发明的目的,本发明所采用的技术方案是:一种基于关联图的网络自诊断故障定位方法,包括步骤:
(1)捕捉一定时间内网络发生的告警序列AS,AS={a1,a2,...,an},其中,a1、a2、...、an为告警节点;
(2)对比告警序列AS和已有的告警节点集合ANU,若告警节点不存在于已有的告警节点集合ANU中,则告警节点放入故障源集合S中;若告警节点存在于已有的告警节点集合ANU中,则将告警节点添加到临时故障集合S1中;
(3)检查告警节点关系集合ANRU中的每条关系e:ai→aj,若头节点ai和尾节点aj均存在于临时故障集合S1中,则尾节点aj为非故障源节点;
(4)检查临时故障集合S1中的每一个告警节点,删除非故障源节点;
(5)检查存在于告警节点集合ANU中的组合节点;
(6)检查临时故障集合S1中的每一个告警节点,删除组合节点;
(7)将临时故障集合S1中剩余告警节点添加到故障源集合S中,得到最终的故障源集合。
进一步地,所述步骤1前还包括步骤:根据直接关联的故障事件间的关系,构建所有故障事件的全局关联图,得到告警节点集合ANU和告警节点关系集合ANRU。
进一步地,在告警节点集合中的每个告警节点,找到与其相关联的告警节点,组成组合节点。相关联的条件为告警节点为相连的设备节点。
一种基于关联图的网络自诊断故障定位***,包括一个工作内存、一个推理引擎和一个知识库,工作内存通过分析网络对象的信息识别网络是否发生故障,并将故障信息发送给推理引擎,推理引擎结合知识库推理定位。
进一步地,工作内存、推理引擎和知识库分别描绘***的数据层、控制层和知识层。
进一步地,所述工作内存中包含通过具体的网络管理协议收集到的关于网络对象的各种信息。
进一步地,所述网络管理协议为SNMP或CMIP协议。
有益效果:本专利给出基于关联图和案例库的定位算法,应用到网络故障诊断***中,将故障定位功能和***的其它模块有机的结合,使得用户能够方便的配置故障关联关系,并能够根据故障报警进行及时的故障源定位,结果表明算法能够进行准确的故障定位。
附图说明
图1是本发明的方法流程图;
图2是虚拟网络示意图;
图3是告警列表示意图;
图4是故障关联子图。
具体实施方式
下面结合附图和实施例对本发明的技术方案作进一步的说明。
由于网络的互联性,网络故障之间存在着一定的关联关系,单一的网络故障可能导致大量的故障现象,而每一个故障现象都会作为独立的事件被网络故障诊断***所捕获。网络故障定位就是要根据事件关联关系,从多个故障事件中定位故障源。在现有技术的基础上,本发明给出了一种以依赖于网络空间拓扑结构信息的告警因果图为基础,分析基于因果关联图的故障定位的方法。
基于关联图的推理***由一个工作内存、一个推理引擎和一个知识库组成,这三部分分别描绘了***的数据层、控制层和知识层。工作内存中包含了通过具体的网络管理协议,如SNMP、CMIP收集到的关于网络对象的各种信息。工作内存通过分析这些信息识别网络是否发生故障,并将故障信息发送给推理引擎,推理引擎结合知识库推理定位。
基于关联图的网络自诊断故障定位方法,支持各种类型的关联关系,包括一对一因果关系、多故障间带“并且”、“或者”语义的复杂关系等。这些足够描述网络故障事件间的常见关系。根据局部的关联关系自动生成全局关联图,用户只需要提供直接关联的故障事件间的关系,通过这些局部的基本关系,就可以自动生成所有故障事件的全局关联图。通过利用关联图自身的性质进行故障定位结合案例推理定位思想,在算法中加入案例库的支持,使得***有了自学习能力大大提高了故障定位的效率。
***在某个时间段内捕捉了若干按一定规则组合的告警称为告警序列;输入:T时间内的告警序列AS={a1,a2,...,an},其中,a1、a2、...、an为告警节点;告警节点集合ANU;告警节点关系集合ANRU;输出:故障源集合S。
如图1所示,基于关联图的网络自诊断故障定位方法的具体步骤为:
步骤一:比较告警序列AS和告警节点集合ANU,若AS中的告警节点ai不存在于ANU中,则该告警节点表示的故障是独立的,将其添加到故障源集合S中;若告警节点存在于已有的告警节点集合ANU中,则将告警节点添加到临时故障集合S1中。
对比网络发生的告警序列和已有的告警节点集合,若告警节点不存在于已有的告警节点集合中,那么这个告警节点是独立的故障源或者新的故障。
步骤二:对于告警节点关系集合ANRU中的每条关系e:ai→aj,若头节点ai和尾节点aj均存在于S1中,那么aj就是由ai引起的,则将临时故障集合S1中的aj为非故障源节点;检查临时故障集合S1中的每一个告警节点,删除非故障源节点;
步骤三:检查存在于告警节点集合ANU中的组合节点a;
在告警节点集合中的每个告警节点,找到与其相关联的告警节点,若相关联集合中告警节点个数大于1,则组成组合节点。相关联的条件为告警节点为相连的设备节点。
步骤四:检查临时故障集合S1中的每一个告警节点,删除组合节点;
步骤五:将临时故障集合S1中剩余告警节点添加到故障源集合S中,得到最终的故障源集合。
为了测试基于关联图和案例库的故障定位方法的有效性,建立一个虚拟网络进行实例检验,如图2所示。使用AdventNet Simulation Toolkit网络模拟软件进行设备的模拟,这些模拟设备能够和真实设备一样对诊断***的SNMP请求进行响应,用网络故障诊断原型***对虚拟网络进行监控,并利用其中的故障定位功能进行故障的定位。使得路由器2和3停止工作来模拟故障,一段时间后,告警列表中新增如图3所示的告警。使用本专利的故障定位方法进行定位,生成如图4所示的关联子图,即可得到路由器2和路由器3无响应的故障结论。

Claims (8)

1.一种基于关联图的网络自诊断故障定位方法,其特征在于,包括步骤:
(1)捕捉一定时间内网络发生的告警序列AS,AS={a1,a2,...,an},其中,a1、a2、...、an为告警节点;
(2)对比告警序列AS和已有的告警节点集合ANU,若告警节点不存在于已有的告警节点集合ANU中,则告警节点放入故障源集合S中;若告警节点存在于已有的告警节点集合ANU中,则将告警节点添加到临时故障集合S1中;
(3)检查告警节点关系集合ANRU中的每条关系e:ai→aj,若头节点ai和尾节点aj均存在于临时故障集合S1中,则尾节点aj为非故障源节点;
(4)检查临时故障集合S1中的每一个告警节点,删除非故障源节点;
(5)检查存在于告警节点集合ANU中的组合节点;
(6)检查临时故障集合S1中的每一个告警节点,删除组合节点;
(7)将临时故障集合S1中剩余告警节点添加到故障源集合S中,得到最终的故障源集合。
2.根据权利要求1所述的基于关联图的网络自诊断故障定位方法,其特征在于,所述步骤1前还包括步骤:根据直接关联的故障事件间的关系,构建所有故障事件的全局关联图,得到告警节点集合ANU和告警节点关系集合ANRU。
3.根据权利要求1所述的基于关联图的网络自诊断故障定位方法,其特征在于,在告警节点集合中的每个告警节点,找到与其相关联的告警节点,组成组合节点。
4.根据权利要求3所述的基于关联图的网络自诊断故障定位方法,其特征在于,相关联的条件为告警节点为相连的设备节点。
5.一种基于关联图的网络自诊断故障定位***,其特征在于,包括一个工作内存、一个推理引擎和一个知识库,工作内存通过分析网络对象的信息识别网络是否发生故障,并将故障信息发送给推理引擎,推理引擎结合知识库推理定位。
6.根据权利要求5所述的基于关联图的网络自诊断故障定位***,其特征在于,工作内存、推理引擎和知识库分别描绘***的数据层、控制层和知识层。
7.根据权利要求5所述的基于关联图的网络自诊断故障定位***,其特征在于,所述工作内存中包含通过具体的网络管理协议收集到的关于网络对象的各种信息。
8.根据权利要求7所述的基于关联图的网络自诊断故障定位***,其特征在于,所述网络管理协议为SNMP或CMIP协议。
CN201811486519.XA 2018-12-06 2018-12-06 基于关联图的网络自诊断故障定位方法 Pending CN109639475A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811486519.XA CN109639475A (zh) 2018-12-06 2018-12-06 基于关联图的网络自诊断故障定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811486519.XA CN109639475A (zh) 2018-12-06 2018-12-06 基于关联图的网络自诊断故障定位方法

Publications (1)

Publication Number Publication Date
CN109639475A true CN109639475A (zh) 2019-04-16

Family

ID=66071509

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811486519.XA Pending CN109639475A (zh) 2018-12-06 2018-12-06 基于关联图的网络自诊断故障定位方法

Country Status (1)

Country Link
CN (1) CN109639475A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112632564A (zh) * 2020-12-30 2021-04-09 绿盟科技集团股份有限公司 一种威胁评估方法及装置
CN113112036A (zh) * 2021-04-07 2021-07-13 东软睿驰汽车技术(沈阳)有限公司 车辆的数据处理方法、装置以及计算机设备
CN115243286A (zh) * 2022-06-20 2022-10-25 中国联合网络通信集团有限公司 一种数据处理方法、装置及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102158360A (zh) * 2011-04-01 2011-08-17 华中科技大学 一种基于时间因子因果关系定位的网络故障自诊断方法
CN105391579A (zh) * 2015-11-25 2016-03-09 国家电网公司 基于关键告警集和监督分类的电力通信网故障定位方法
CN106656633A (zh) * 2017-02-10 2017-05-10 国网甘肃省电力公司信息通信公司 一种电力骨干otn传输性能的评估***及方法
CN108632052A (zh) * 2017-03-15 2018-10-09 ***通信集团安徽有限公司 高铁专网信号异常的处理方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102158360A (zh) * 2011-04-01 2011-08-17 华中科技大学 一种基于时间因子因果关系定位的网络故障自诊断方法
CN105391579A (zh) * 2015-11-25 2016-03-09 国家电网公司 基于关键告警集和监督分类的电力通信网故障定位方法
CN106656633A (zh) * 2017-02-10 2017-05-10 国网甘肃省电力公司信息通信公司 一种电力骨干otn传输性能的评估***及方法
CN108632052A (zh) * 2017-03-15 2018-10-09 ***通信集团安徽有限公司 高铁专网信号异常的处理方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
罗玲: "计算机网络自诊断***的研究及实现", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112632564A (zh) * 2020-12-30 2021-04-09 绿盟科技集团股份有限公司 一种威胁评估方法及装置
CN112632564B (zh) * 2020-12-30 2024-04-05 绿盟科技集团股份有限公司 一种威胁评估方法及装置
CN113112036A (zh) * 2021-04-07 2021-07-13 东软睿驰汽车技术(沈阳)有限公司 车辆的数据处理方法、装置以及计算机设备
CN115243286A (zh) * 2022-06-20 2022-10-25 中国联合网络通信集团有限公司 一种数据处理方法、装置及存储介质
CN115243286B (zh) * 2022-06-20 2024-05-03 中国联合网络通信集团有限公司 一种数据处理方法、装置及存储介质

Similar Documents

Publication Publication Date Title
KR102483025B1 (ko) 운영 유지 시스템 및 방법
Myers et al. Anomaly detection for industrial control systems using process mining
CN103001328B (zh) 一种智能变电站的故障诊断与评估方法
Lin et al. Modeling cyber-physical systems with semantic agents
CN102420700B (zh) 网络故障诊断***
CN102752142B (zh) 一种基于多维建模的信息***的监控方法及监控***
KR20180108446A (ko) Ict 인프라 관리 시스템 및 이를 이용한 ict 인프라 관리 방법
CN109639475A (zh) 基于关联图的网络自诊断故障定位方法
Lin et al. A general framework for quantitative modeling of dependability in cyber-physical systems: A proposal for doctoral research
CN112559237B (zh) 运维***排障方法、装置、服务器和存储介质
CN104660463B (zh) 一种基于ns-3的大型综合数据网网络模拟仿真***
JP7442001B1 (ja) 水力発電ユニットの故障総合診断方法
CN103744897A (zh) 故障信息的关联搜索方法、***和网络管理***
CN110460454A (zh) 基于深度学习的网络设备端口故障智能预测方法及原理
CN103997435A (zh) 一种基于故障仿真的交通物联网测试方法
CN111045757B (zh) It资源运行状态的可视化展示***和方法及存储介质
CN110415136B (zh) 一种电力调度自动化***服务能力评估***与方法
Bhattacharyya et al. A discrete event systems approach to network fault management: detection and diagnosis of faults
Kölsch et al. Model-based development of smart home scenarios for IoT simulation
Lu et al. A self-diagnosis algorithm based on causal graphs
CN114417633A (zh) 一种基于平行仿真六元组的网络靶场场景构建方法和***
Saeed et al. ADISTES ontology for active diagnosis of sensors and actuators in distributed embedded systems
Katada et al. Development of practical scenario simulator for dissemination of disaster information
Dali Complexity measurement of large-scale software system based on complex network
CN105184686B (zh) 一种使用动态规则引擎进行信号精益化分析的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190416

RJ01 Rejection of invention patent application after publication