CN109039763A - 一种基于回溯法的网络故障节点检测方法及网络管理*** - Google Patents

一种基于回溯法的网络故障节点检测方法及网络管理*** Download PDF

Info

Publication number
CN109039763A
CN109039763A CN201810984902.1A CN201810984902A CN109039763A CN 109039763 A CN109039763 A CN 109039763A CN 201810984902 A CN201810984902 A CN 201810984902A CN 109039763 A CN109039763 A CN 109039763A
Authority
CN
China
Prior art keywords
node
assets
link
test
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810984902.1A
Other languages
English (en)
Inventor
张仪
张晋锋
张永生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dawning Information Industry Beijing Co Ltd
Original Assignee
Dawning Information Industry Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dawning Information Industry Beijing Co Ltd filed Critical Dawning Information Industry Beijing Co Ltd
Priority to CN201810984902.1A priority Critical patent/CN109039763A/zh
Publication of CN109039763A publication Critical patent/CN109039763A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/0213Standardised network management protocols, e.g. simple network management protocol [SNMP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Small-Scale Networks (AREA)

Abstract

本发明提供一种基于回溯法的网络故障节点检测方法及网络管理***,所述方法包括:扫描局域网中的设备,分析扫描结果并生成局域网中的网络拓扑;根据网络拓扑中的设备类型对设备进行分类、分级,并将经分类、分级后的设备作为资产归入资产池;在资产池中获取资产,根据所述网络拓扑生成资产的测试链路;采用回溯算法对所述资产的测试链路进行通信检测;分析通信检测结果,定位所述测试链路上存在的故障节点。本发明能够按照回溯算法的深度优先搜索的策略,对所述资产的测试链路进行通信检测,精确对所述测试链路上存在的故障节点进行定位。

Description

一种基于回溯法的网络故障节点检测方法及网络管理***
技术领域
本发明涉及局域网技术领域,尤其涉及一种基于回溯法的网络故障节点检测方法及网络管理***。
背景技术
随着现在高性能在各行各业大放异彩,涌现了各种规模的集群。包括超大规模、大规模以及小规模的集群中都相继涌现。有集群就要有网络,现在很多集群通过划分Vlan(虚拟局域网:Virtual Local Area Network)的方式实现不通网段的通信和控制。
但是,随着规模的不断增大,关于网络问题等常见集群管理问题的定位和排查面临严峻的挑战,现有技术中如果集群中一个或多个节点发生故障,很难定位。需要针对网络中的设备逐级逐层进行排查和定位,消耗大量的时间,运维效率低下。
发明内容
本发明提供的基于回溯法的网络故障节点检测方法及网络管理***,能够按照回溯算法的深度优先搜索的策略,对所述资产的测试链路进行通信检测,精确对所述测试链路上存在的故障节点进行定位。
第一方面,本发明提供一种基于回溯法的网络故障节点检测方法,包括:
扫描局域网中的设备,分析扫描结果并生成局域网中的网络拓扑;
根据网络拓扑中的设备类型对设备进行分类、分级,并将经分类、分级后的设备作为资产归入资产池;
在资产池中获取资产,根据所述网络拓扑生成资产的测试链路;
采用回溯算法对所述资产的测试链路进行通信检测;
分析通信检测结果,定位所述测试链路上存在的故障节点。
可选地,所述扫描局域网中的设备,分析扫描结果并生成局域网中的网络拓扑包括:
扫描局域网中的设备获取设备对应参数;
将所扫描的设备作为资产添加,并根据设备对应参数建立所添加资产的通信关联关系;其中,所述通信关联关系包括Vlan、IP地址、MAC地址、资产类型中一种或者任意组合;
根据所述通信关联关系生成局域网中的网络拓扑。
可选地,所述局域网中的网络拓扑设置为四层,依次分别为网络管理***层、汇聚交换机层、交换机层和服务器层。
可选地,所述在资产池中获取资产,根据所述网络拓扑生成资产的测试链路包括:
获取服务器池中的服务器节点,并根据所述拓扑图中资产的通信关联关系将服务器节点与二层交换机池中具有同一Vlan的二层交换机进行匹配,构建所述服务器节点与二层交换机之间的第一链路;
由所述二层交换机与汇聚交换机之间的通信关联关系,构建所述二层交换机与所述汇聚交换机之间的第二链路,并形成服务器节点-二层交换机-汇聚交换机的测试链路;其中,
所述资产池包括服务器节点池、交换机池和汇聚交换机池。
可选地,所述采用回溯算法对所述资产的测试链路进行通信检测包括:
由网络管理***心跳向目标节点发送检测数据,判断***是否检测到正常返回;
当***检测到正常返回时,则记录测试链路上各资产连通正常;
当***检测未检测到正常返回时,则利用回溯算法从所述测试链路的根节点出发对所述测试链路进行通信检测。
可选地,所述利用回溯算法从所述测试链路的根节点出发对所述测试链路进行通信检测包括:
从所述根节点出发利用回溯算法对所述测试链路上的各节点逐一向下进行通信检测;
扫描所述测试链路上的节点并当检测到某一节点时,判断所检测的节点是否包含网络故障;
当所检测的节点包含网络故障,则返回结果并确定所检测的节点为故障节点;
当所检测的节点不包含网络故障,则从所检测的节点出发继续检测,逐层回溯。
可选地,所述分析通信检测结果,定位所述测试链路上存在的故障节点包括:
根据所述回溯法返回测试链路上一层;
通过确定上一层配置以及获取故障节点信息,定位故障节点并分析得出故障解决方案。
可选地,所述分析通信检测结果,定位所述测试链路上存在的故障节点之后,所述方法还包括:
记录故障信息,其中所述故障信息包括资产名、故障类型、时间中一种或者任意组合。
第二方面,本发明提供一种网络管理***,包括:
资产管理模块,用于扫描局域网中的设备,分析扫描结果并生成局域网中的网络拓扑,以及根据网络拓扑中的设备类型对设备进行分类、分级,并将经分类、分级后的设备作为资产归入资产池;
链路生成模块,用于在资产池中获取资产,根据所述网络拓扑生成资产的测试链路;
通信检测模块,用于采用回溯算法对所述资产的测试链路进行通信检测;
结果分析模块,用于分析通信检测结果,定位所述测试链路上存在的故障节点。
可选地,所述链路生成模块包括:
获取单元,用于获取服务器池中的服务器节点;
第一链路生成单元,用于根据所述拓扑图中资产的通信关联关系将服务器节点与二层交换机池中具有同一Vlan的二层交换机进行匹配,构建所述服务器节点与二层交换机之间的第一链路;
第二链路生成单元,用于由所述二层交换机与汇聚交换机之间的通信关联关系,构建所述二层交换机与所述汇聚交换机之间的第二链路,并形成服务器节点-二层交换机-汇聚交换机的测试链路。
可选地,所述通信检测模块包括:
判断单元,用于由网络管理***心跳向目标节点发送检测数据,判断***是否检测到正常返回;
第一记录单元,用于当***检测到正常返回时,则记录测试链路上各资产连通正常;
回溯检测单元,用于当***检测未检测到正常返回时,则利用回溯算法从所述测试链路的根节点出发对所述测试链路进行通信检测;
优选地,所述回溯检测单元包括:
回溯检查子单元,用于从所述根节点出发利用回溯算法对所述测试链路上的各节点逐一向下进行通信检测;
扫描判断子单元,用于扫描所述测试链路上的节点并当检测到某一节点时,判断所检测的节点是否包含网络故障。
可选地,所述结果分析模块包括:
返回单元,用于根据所述回溯法返回测试链路上一层;
定位分析单元,用于通过确定上一层配置以及获取故障节点信息,定位故障节点并分析得出故障解决方案。
可选地,所述***还包括:
记录模块,用于记录故障信息,其中所述故障信息包括资产名、故障类型、时间中一种或者任意组合。
本发明实施例提供的基于回溯法的网络故障节点检测方法及网络管理***,所述方法主要是通过snmp4j和jpcap使用snmp协议(简单网络管理协议:Simple NetworkManagement Protocol)扫描局域网中的设备,并通过分析扫描结果,生成局域网中的网络拓扑;其次根据拓扑中的设备类型,对设备进行分类和分级,并归入资产池,其中,所述资产池包括节点池、交换机池、汇聚交换机池。然后按照回溯算法的深度优先搜索的策略,对所述资产的测试链路的根结点出发进行通信检测,并对所述测试链路上存在的故障节点进行定位。
因此,本实施例所述方法能够实现网络故障节点的自动检测,以自动代替手动,从而实现快速定位故障节点。
其次,本实施例所述方法通过回溯算法对测试链路进行通信检测,定位网络中各个层级对应资产的连通情况,定位通信故障的节点,协助管理员快速定位故障;实现逐层诊断、回溯定位、问题记录与解决方案的目的;快速精准定位问题,定位到设备端口或网卡。
同时还可对测试链路进行数据检查,从而定位故障节点,根据请求和返回确定节点的监控状况。能够查看交换机设备的配置信息,并根据配置监控信息进行诊断,从而精准定位问题。
附图说明
图1为本发明一实施例基于回溯法的网络故障节点检测方法的流程图;
图2为本发明另一实施例所述局域网中的网络拓扑图;
图3为本发明一实施例基于回溯法的网络故障节点检测方法的流程图;
图4为本发明另一实施例网络管理***的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种基于回溯法的网络故障节点检测方法,如图1所示,所述方法包括:
S11、扫描局域网中的设备,分析扫描结果并生成局域网中的网络拓扑;
S12、根据网络拓扑中的设备类型对设备进行分类、分级,并将经分类、分级后的设备作为资产归入资产池;
S13、在资产池中获取资产,根据所述网络拓扑生成资产的测试链路;
S14、采用回溯算法对所述资产的测试链路进行通信检测;
S15、分析通信检测结果,定位所述测试链路上存在的故障节点。
本发明实施例提供的基于回溯法的网络故障节点检测方法主要是通过snmp4j和jpcap使用snmp协议(简单网络管理协议:Simple Network Management Protocol)扫描局域网中的设备,并通过分析扫描结果,生成局域网中的网络拓扑;其次根据拓扑中的设备类型,对设备进行分类和分级,并归入资产池,其中,所述资产池包括节点池、交换机池、汇聚交换机池。然后按照回溯算法的深度优先搜索的策略,对所述资产的测试链路的根结点出发进行通信检测,并对所述测试链路上存在的故障节点进行定位。
因此,本实施例所述方法能够实现网络故障节点的自动检测,以自动代替手动,从而实现快速定位故障节点。
其次,本实施例所述方法通过回溯算法对测试链路进行通信检测,定位网络中各个层级对应资产的连通情况,定位通信故障的节点,协助管理员快速定位故障;实现逐层诊断、回溯定位、问题记录与解决方案的目的;快速精准定位问题,定位到设备端口或网卡。
同时还可对测试链路进行数据检查,从而定位故障节点,根据请求和返回确定节点的监控状况。能够查看交换机设备的配置信息,并根据配置监控信息进行诊断,从而精准定位问题。
可选地,如图2所示,所述扫描局域网中的设备,分析扫描结果并生成局域网中的网络拓扑包括:
扫描局域网中的设备获取设备对应参数;
将所扫描的设备作为资产添加,并根据设备对应参数建立所添加资产的通信关联关系;其中,所述通信关联关系包括Vlan、IP地址、MAC(物理地址:Media Access Control或者Medium Access Control)地址、资产类型中一种或者任意组合;
根据所述通信关联关系生成局域网中的网络拓扑。
具体的,本实施例所述方法通过snmp4j和jpcap使用snmp协议扫描局域网中的设备并获取设备对应的扫描信息,按照获取的扫描信息将所扫描的设备作为资产对应进行添加,根据添加资产的通信关联关系,自动生成通信路径,绘制测试链路,保证各个资产均在测试链路中被监测到,不存在漏测的风险,提高网络故障节点检测的准确性。
可选地,所述局域网中的网络拓扑设置为四层,依次分别为网络管理***层、汇聚交换机层、交换机层和服务器层。
可选地,所述在资产池中获取资产,根据所述网络拓扑生成资产的测试链路包括:
获取服务器池中的服务器节点,并根据所述拓扑图中资产的通信关联关系将服务器节点与二层交换机池中具有同一Vlan的二层交换机进行匹配,构建所述服务器节点与二层交换机之间的第一链路;
由所述二层交换机与汇聚交换机之间的通信关联关系,构建所述二层交换机与所述汇聚交换机之间的第二链路,并形成服务器节点-二层交换机-汇聚交换机的测试链路;其中,
所述资产池包括服务器池、交换机池和汇聚交换机池。
具体的,本实施例所述方法依次构建服务器节点与二层交换机之间的第一链路、二层交换机与所述汇聚交换机之间的第二链路从而形成服务器节点-二层交换机-汇聚交换机对应的完整测试链路,为通信检测提供链路依据。其中,本实施例所述方法能够直接从资产池中获取资产,生成的网络拓扑,自动生成测试链路,然后对检测链路上的设备网络可用性进行通信检测。
另外,本实施例所述方法按照类型划分资产池,便于对同一类资产进行集中维护。监控资产池中设备的配置信息和使用情况,确定通信路径上设备的状况。
可选地,所述采用回溯算法对所述资产的测试链路进行通信检测包括:
由网络管理***心跳向目标节点发送检测数据,判断***是否检测到正常返回;
当***检测到正常返回时,则记录测试链路上各资产连通正常;
当***检测未检测到正常返回时,则利用回溯算法从所述测试链路的根节点出发对所述测试链路进行通信检测。
可选地,所述利用回溯算法从所述测试链路的根节点出发对所述测试链路进行通信检测包括:
从所述根节点出发利用回溯算法对所述测试链路上的各节点逐一向下进行通信检测;
扫描所述测试链路上的节点并当检测到某一节点时,判断所检测的节点是否包含网络故障;
当所检测的节点包含网络故障,则返回结果并确定所检测的节点为故障节点;
当所检测的节点不包含网络故障,则从所检测的节点出发继续检测,逐层回溯。
具体的,本实施例所述方法对所述资产的测试链路进行通信检测,获取对测试链路上的资产通信情况,确定作为资产的各个设备节点的通信是否正常,并定位故障节点。
同时,所述方法还能够再根据请求和返回确定故障节点的监控状况。其次,所述方法还能够进一步通过查看交换机设备的配置信息功能,并根据配置监控信息进行诊断,从而精准定位故障节点。
可选地,所述分析通信检测结果,定位所述测试链路上存在的故障节点包括:
根据所述回溯法返回测试链路上一层;
通过确定上一层配置以及获取故障节点信息,定位故障节点并分析得出故障解决方案。
可选地,所述分析通信检测结果,定位所述测试链路上存在的故障节点之后,所述方法还包括:
记录故障信息,其中所述故障信息包括资产名、故障类型、时间中一种或者任意组合。
具体的,本实施例所述方法能够根据对检测链路进行通信检测所获取的各个资产的链路连通情况,分析检测链路中资产的连通情况,从而定位故障节点。并且每次针对出现问题的故障节点的维护情况做好记录。
同时,所述方法还能够根据记录中关键字(包括资产名、故障类型、时间等)在检测到新问题时,直接根据关键字概率搜索解决记录,提供解决问题的依据和建议,大大提高维护工作的效率。
例如,本实施例所述方法根据网络拓扑,生成完整的测试链路如下:以网络管理***T1到服务器A1的通信路径为例,途径网络管理***服务器T1到汇聚交换机C1,再到交换机S1,最后到测试链路目的终点An:
T1-C1-S1-A1
另外,设置网络管理***T1的网卡eth0和汇聚交换机C1的端口port1相连通;C1的端口port2和交换机S1的端口port1相连通;S1的端口port2和节点An的网卡eth0相连通,则如图3所示完整的测试链路为:
T1(eth0)=>C1(port1)=>C1=>C1(port2)=>S1(port1)
=>S1=>S1(port2)=>An(eth0)=>An
其中,在网络的测试链路中,资产通信故障分为以下几种情况:
故障1:An(eth0)=>An链路故障
当An(eth0)=>An链路存在故障时,故障原因可能为An(eth0)端口故障或者An***服务故障。
网络管理***T1向An发送检测数据,当检测到An(eth0)=>An故障时,则回溯检测设备交换机S1是否正常。通过telnet到交换机S1,查看端口S1(port2)配置信息,获取S1(port2)的配置信息和与端口S1(port2)连接的An(eth0)的MAC和ip信息,若无法获取则An(eth0)故障或An***故障。
如果网络管理***记录An(eth0)=>An在xx时间发生故障一次,现象为An通信断开。
则诊断建议:查看An的网络配置和服务是否正常;查看An(eth0)是否损坏。
故障2:S1(port2)链路故障
当S1(port2)端口存在故障时,S1(port2)=>An(eth0)的通信中断故障。
网络管理***T1向An发送检测数据,当检测到S1(port2)无法与An(eth0)链路通信时,则回溯检测设备交换机S1是否正常。通过telnet到交换机S1,对比端口S1(port2)和其他端口的配置信息,若其他端口与连接的节点正常,则故障定位到S1(port2)端口。
如果网络管理***记录S1(port2)在xx时间发生故障一次,现象S1(port2)=>An(eth0)通信断开。
则诊断建议:查看S1(port2)端口配置是否正常或损坏。
故障3:S1故障
当S1存在故障时,现象为S1下的所有节点通信中断。
网络管理***T1向An发送检测数据,当检测到S1下的所有节点通信中断时,则回溯检测设备交换机S1是否正常。通过telnet到交换机,若连接不上,则S1存在故障;若连接上,查看交换机的配置信息,查看S1运行资源负载情况,判断是否有风暴或回路。
如果网络管理***记录S1在xx时间发生故障一次,现象S1通信断开或负载过高。
则诊断建议:查看S1的配置是否正常;查看S1是否存在风暴或回路。
故障4:S1(port1)端口故障
当S1(port1)存在故障时,现象为C1与S1通信中断。
网络管理***T1向An发送检测数据,当检测到C1与S1通信中断时,则回溯检测设备交换机C1是否正常。通过telnet到汇聚交换机C1,检查C1(port2)端口配置,并获取S1(port1)的配置信息,若C1(port2)配置正常,无法获取S1(port1)的配置信息或信息配置异常,则S1(port1)存在故障。
如果网络管理***记录S1(port1)在xx时间发生故障一次,现象S1(port1)无法获取配置。
则诊断建议:查看S1(port1)的配置是否正常;查看S1(port1)与C1(port2)是否连接正确。
故障5:C1(port2)端口故障
当C1(port2)存在故障时,现象为C1与S1通信中断。
网络管理***T1向An发送检测数据,当检测到C1与S1通信中断时,则回溯检测设备交换机C1是否正常。通过telnet到汇聚交换机C1,检查C1端口配置,并获取C1(port2)的配置信息,若C1配置正常,无法获取C1(port2)的配置信息或信息配置异常,则C1(port2)存在故障。
如果网络管理***记录S1(port1)在xx时间发生故障一次,现象S1(port1)无法获取配置。
则诊断建议:查看C1(port2)的配置是否正常;查看C1是否配置正确。
故障6:C1故障
当C1存在故障时,现象为T1与T1以下各层设备的通信中断。
网络管理***T1向An发送检测数据,当检测到C1通信中断时,则回溯检测网络管理***与汇聚交换机C1是否通信正常。若无法通信,则设备C1异常
如果网络管理***记录S1(port1)在xx时间发生故障一次,现象T1与T1以下各层设备的通信中断。
则诊断建议:查看C1是否正常运行;查看C1是否配置正确。
本发明实施例还提供一种网络管理***,如图4所示,所述***包括:
资产管理模块11,用于扫描局域网中的设备,分析扫描结果并生成局域网中的网络拓扑,以及根据网络拓扑中的设备类型对设备进行分类、分级,并将经分类、分级后的设备作为资产归入资产池;
链路生成模块12,用于在资产池中获取资产,根据所述网络拓扑生成资产的测试链路;
通信检测模块13,用于采用回溯算法对所述资产的测试链路进行通信检测;
结果分析模块14,用于分析通信检测结果,定位所述测试链路上存在的故障节点。
本发明实施例提供的网络管理***主要是由资产管理模块通过snmp4j和jpcap使用snmp协议(简单网络管理协议:Simple Network Management Protocol)扫描局域网中的设备,并通过分析扫描结果,生成局域网中的网络拓扑;其次根据拓扑中的设备类型,对设备进行分类和分级,并归入资产池,其中,所述资产池包括节点池、交换机池、汇聚交换机池。然后由通信检测模块按照回溯算法的深度优先搜索的策略,对所述资产的测试链路的根结点出发进行通信检测,并对所述测试链路上存在的故障节点进行定位。
因此,本实施例所述***能够实现网络故障节点的自动检测,以自动代替手动,从而实现快速定位故障节点。
其次,本实施例所述***通过回溯算法对测试链路进行通信检测,定位网络中各个层级对应资产的连通情况,定位通信故障的节点,协助管理员快速定位故障;实现逐层诊断、回溯定位、问题记录与解决方案的目的;快速精准定位问题,定位到设备端口或网卡。
同时还可对测试链路进行数据检查,从而定位故障节点,根据请求和返回确定节点的监控状况。能够查看交换机设备的配置信息,并根据配置监控信息进行诊断,从而精准定位问题。
可选地,如图4所示,所述链路生成模块包括:
获取单元,用于获取服务器池中的服务器节点;
第一链路生成单元,用于根据所述拓扑图中资产的通信关联关系将服务器节点与二层交换机池中具有同一Vlan的二层交换机进行匹配,构建所述服务器节点与二层交换机之间的第一链路;
第二链路生成单元,用于由所述二层交换机与汇聚交换机之间的通信关联关系,构建所述二层交换机与所述汇聚交换机之间的第二链路,并形成服务器节点-二层交换机-汇聚交换机的测试链路。
可选地,所述通信检测模块包括:
判断单元,用于由网络管理***心跳向目标节点发送检测数据,判断***是否检测到正常返回;
第一记录单元,用于当***检测到正常返回时,则记录测试链路上各资产连通正常;
回溯检测单元,用于当***检测未检测到正常返回时,则利用回溯算法从所述测试链路的根节点出发对所述测试链路进行通信检测;
优选地,所述回溯检测单元包括:
回溯检查子单元,用于从所述根节点出发利用回溯算法对所述测试链路上的各节点逐一向下进行通信检测;
扫描判断子单元,用于扫描所述测试链路上的节点并当检测到某一节点时,判断所检测的节点是否包含网络故障。
可选地,所述结果分析模块包括:
返回单元,用于根据所述回溯法返回测试链路上一层;
定位分析单元,用于通过确定上一层配置以及获取故障节点信息,定位故障节点并分析得出故障解决方案。
可选地,所述***还包括:
记录模块,用于记录故障信息,其中所述故障信息包括资产名、故障类型、时间中一种或者任意组合。
本实施例的***,可以用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (10)

1.一种基于回溯法的网络故障节点检测方法,其特征在于,包括:
扫描局域网中的设备,分析扫描结果并生成局域网中的网络拓扑;
根据网络拓扑中的设备类型对设备进行分类、分级,并将经分类、分级后的设备作为资产归入资产池;
在资产池中获取资产,根据所述网络拓扑生成资产的测试链路;
采用回溯算法对所述资产的测试链路进行通信检测;
分析通信检测结果,定位所述测试链路上存在的故障节点。
2.根据权利要求1所述的方法,其特征在于,所述扫描局域网中的设备,分析扫描结果并生成局域网中的网络拓扑包括:
扫描局域网中的设备获取设备对应参数;
将所扫描的设备作为资产添加,并根据设备对应参数建立所添加资产的通信关联关系;其中,所述通信关联关系包括Vlan、IP地址、MAC地址、资产类型中一种或者任意组合;
根据所述通信关联关系生成局域网中的网络拓扑;
优选地,所述局域网中的网络拓扑设置为四层,依次分别为网络管理***层、汇聚交换机层、交换机层和服务器层。
3.根据权利要求1或2所述的方法,其特征在于,所述在资产池中获取资产,根据所述网络拓扑生成资产的测试链路包括:
获取服务器池中的服务器节点,并根据所述拓扑图中资产的通信关联关系将服务器节点与二层交换机池中具有同一Vlan的二层交换机进行匹配,构建所述服务器节点与二层交换机之间的第一链路;
由所述二层交换机与汇聚交换机之间的通信关联关系,构建所述二层交换机与所述汇聚交换机之间的第二链路,并形成服务器节点-二层交换机-汇聚交换机的测试链路;其中,
所述资产池包括服务器节点池、交换机池和汇聚交换机池。
4.根据权利要求1或3所述的方法,其特征在于,所述采用回溯算法对所述资产的测试链路进行通信检测包括:
由网络管理***心跳向目标节点发送检测数据,判断***是否检测到正常返回;
当***检测到正常返回时,则记录测试链路上各资产连通正常;
当***检测未检测到正常返回时,则利用回溯算法从所述测试链路的根节点出发对所述测试链路进行通信检测;
优选地,述利用回溯算法从所述测试链路的根节点出发对所述测试链路进行通信检测包括:
从所述根节点出发利用回溯算法对所述测试链路上的各节点逐一向下进行通信检测;
扫描所述测试链路上的节点并当检测到某一节点时,判断所检测的节点是否包含网络故障;
当所检测的节点包含网络故障,则返回结果并确定所检测的节点为故障节点;
当所检测的节点不包含网络故障,则从所检测的节点出发继续检测,逐层回溯。
5.根据权利要求1-4任一所述的方法,其特征在于,所述分析通信检测结果,定位所述测试链路上存在的故障节点包括:
根据所述回溯法返回测试链路上一层;
通过确定上一层配置以及获取故障节点信息,定位故障节点并分析得出故障解决方案。
6.根据权利要求1-5任一所述的方法,其特征在于,所述分析通信检测结果,定位所述测试链路上存在的故障节点之后,所述方法还包括:
记录故障信息,其中所述故障信息包括资产名、故障类型、时间中一种或者任意组合。
7.一种网络管理***,其特征在于,包括:
资产管理模块,用于扫描局域网中的设备,分析扫描结果并生成局域网中的网络拓扑,以及根据网络拓扑中的设备类型对设备进行分类、分级,并将经分类、分级后的设备作为资产归入资产池;
链路生成模块,用于在资产池中获取资产,根据所述网络拓扑生成资产的测试链路;
通信检测模块,用于采用回溯算法对所述资产的测试链路进行通信检测;
结果分析模块,用于分析通信检测结果,定位所述测试链路上存在的故障节点。
8.根据权利要求7所述的***,其特征在于,所述链路生成模块包括:
获取单元,用于获取服务器池中的服务器节点;
第一链路生成单元,用于根据所述拓扑图中资产的通信关联关系将服务器节点与二层交换机池中具有同一Vlan的二层交换机进行匹配,构建所述服务器节点与二层交换机之间的第一链路;
第二链路生成单元,用于由所述二层交换机与汇聚交换机之间的通信关联关系,构建所述二层交换机与所述汇聚交换机之间的第二链路,并形成服务器节点-二层交换机-汇聚交换机的测试链路。
9.根据权利要求7或8所述的***,其特征在于,所述通信检测模块包括:
判断单元,用于由网络管理***心跳向目标节点发送检测数据,判断***是否检测到正常返回;
第一记录单元,用于当***检测到正常返回时,则记录测试链路上各资产连通正常;
回溯检测单元,用于当***检测未检测到正常返回时,则利用回溯算法从所述测试链路的根节点出发对所述测试链路进行通信检测;
优选地,所述回溯检测单元包括:
回溯检查子单元,用于从所述根节点出发利用回溯算法对所述测试链路上的各节点逐一向下进行通信检测;
扫描判断子单元,用于扫描所述测试链路上的节点并当检测到某一节点时,判断所检测的节点是否包含网络故障。
10.根据权利要求7-9任一所述的***,其特征在于,所述结果分析模块包括:
返回单元,用于根据所述回溯法返回测试链路上一层;
定位分析单元,用于通过确定上一层配置以及获取故障节点信息,定位故障节点并分析得出故障解决方案。
CN201810984902.1A 2018-08-28 2018-08-28 一种基于回溯法的网络故障节点检测方法及网络管理*** Pending CN109039763A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810984902.1A CN109039763A (zh) 2018-08-28 2018-08-28 一种基于回溯法的网络故障节点检测方法及网络管理***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810984902.1A CN109039763A (zh) 2018-08-28 2018-08-28 一种基于回溯法的网络故障节点检测方法及网络管理***

Publications (1)

Publication Number Publication Date
CN109039763A true CN109039763A (zh) 2018-12-18

Family

ID=64624801

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810984902.1A Pending CN109039763A (zh) 2018-08-28 2018-08-28 一种基于回溯法的网络故障节点检测方法及网络管理***

Country Status (1)

Country Link
CN (1) CN109039763A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110311825A (zh) * 2019-08-08 2019-10-08 河南中烟工业有限责任公司 一种通过预警回溯快速处置通讯网络故障的方法
CN110544018A (zh) * 2019-08-12 2019-12-06 中国南方电网有限责任公司 资产管理方法、装置、***、计算机设备和可读存储介质
CN110943759A (zh) * 2019-11-12 2020-03-31 国家电网有限公司信息通信分公司 一种基于深度优先搜索算法的电力通信链路数据校核方法
CN111510331A (zh) * 2020-04-10 2020-08-07 中国联合网络通信集团有限公司 网络故障分析方法、装置、服务器及存储介质
CN112187565A (zh) * 2020-09-10 2021-01-05 江苏淼安信息科技有限公司 一种网络线路质量智能检测的方法
CN112231523A (zh) * 2020-10-20 2021-01-15 广州知图科技有限公司 一种基于有向无环图的网络故障定位排查方法及***
CN112653587A (zh) * 2019-10-12 2021-04-13 北京奇艺世纪科技有限公司 一种网络连通状态检测方法及装置
CN112910696A (zh) * 2021-01-22 2021-06-04 上海三零卫士信息安全有限公司 一种网络拓扑自动化建模分析方法
CN112995042A (zh) * 2021-05-11 2021-06-18 深圳市科力锐科技有限公司 业务拓扑图的生成方法、装置、设备及存储介质
CN114244692A (zh) * 2021-04-30 2022-03-25 无锡江南计算技术研究所 一种适用于超大规模互连网络的故障快速定位方法
CN114500266A (zh) * 2022-01-06 2022-05-13 云控智行科技有限公司 对于节点的工作状态进行分析的方法、装置及设备
CN115174448A (zh) * 2022-05-20 2022-10-11 复旦大学 一种基于容器的网络探针管控方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101827022A (zh) * 2010-03-19 2010-09-08 重庆大学 一种用于电力抄表***的低压电力线通信组网方法
CN104683168A (zh) * 2013-11-29 2015-06-03 国网浙江省电力公司 一种智能变电站过程层网络通信故障自动定位方法
CN106656588A (zh) * 2016-12-12 2017-05-10 国网北京市电力公司 智能变电站的故障定位方法和装置
CN106789331A (zh) * 2017-01-11 2017-05-31 北京金数信数码科技有限公司 拓扑结构生成方法和***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101827022A (zh) * 2010-03-19 2010-09-08 重庆大学 一种用于电力抄表***的低压电力线通信组网方法
CN104683168A (zh) * 2013-11-29 2015-06-03 国网浙江省电力公司 一种智能变电站过程层网络通信故障自动定位方法
CN106656588A (zh) * 2016-12-12 2017-05-10 国网北京市电力公司 智能变电站的故障定位方法和装置
CN106789331A (zh) * 2017-01-11 2017-05-31 北京金数信数码科技有限公司 拓扑结构生成方法和***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李尧辉 等: ""一种基于子网拓扑的故障分析方法"", 《电信工程技术与标准化》 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110311825A (zh) * 2019-08-08 2019-10-08 河南中烟工业有限责任公司 一种通过预警回溯快速处置通讯网络故障的方法
CN110544018A (zh) * 2019-08-12 2019-12-06 中国南方电网有限责任公司 资产管理方法、装置、***、计算机设备和可读存储介质
CN112653587A (zh) * 2019-10-12 2021-04-13 北京奇艺世纪科技有限公司 一种网络连通状态检测方法及装置
CN110943759A (zh) * 2019-11-12 2020-03-31 国家电网有限公司信息通信分公司 一种基于深度优先搜索算法的电力通信链路数据校核方法
CN111510331A (zh) * 2020-04-10 2020-08-07 中国联合网络通信集团有限公司 网络故障分析方法、装置、服务器及存储介质
CN112187565B (zh) * 2020-09-10 2023-05-30 江苏慧业文人信息科技有限公司 一种网络线路质量智能检测的方法
CN112187565A (zh) * 2020-09-10 2021-01-05 江苏淼安信息科技有限公司 一种网络线路质量智能检测的方法
CN112231523A (zh) * 2020-10-20 2021-01-15 广州知图科技有限公司 一种基于有向无环图的网络故障定位排查方法及***
CN112231523B (zh) * 2020-10-20 2024-01-16 广州知图科技有限公司 一种基于有向无环图的网络故障定位排查方法及***
CN112910696A (zh) * 2021-01-22 2021-06-04 上海三零卫士信息安全有限公司 一种网络拓扑自动化建模分析方法
CN114244692B (zh) * 2021-04-30 2024-02-02 无锡江南计算技术研究所 一种适用于超大规模互连网络的故障快速定位方法
CN114244692A (zh) * 2021-04-30 2022-03-25 无锡江南计算技术研究所 一种适用于超大规模互连网络的故障快速定位方法
CN112995042A (zh) * 2021-05-11 2021-06-18 深圳市科力锐科技有限公司 业务拓扑图的生成方法、装置、设备及存储介质
CN112995042B (zh) * 2021-05-11 2021-08-17 深圳市科力锐科技有限公司 业务拓扑图的生成方法、装置、设备及存储介质
CN114500266A (zh) * 2022-01-06 2022-05-13 云控智行科技有限公司 对于节点的工作状态进行分析的方法、装置及设备
CN115174448A (zh) * 2022-05-20 2022-10-11 复旦大学 一种基于容器的网络探针管控方法
CN115174448B (zh) * 2022-05-20 2023-11-24 复旦大学 一种基于容器的网络探针管控方法

Similar Documents

Publication Publication Date Title
CN109039763A (zh) 一种基于回溯法的网络故障节点检测方法及网络管理***
TWI741505B (zh) 一種拓撲處理方法和裝置以及系統
CN111756582B (zh) 基于nfv日志告警的业务链监控方法
CN106713074B (zh) 基于业务内容的数据网络质量分段探测方法及***
CN112564964B (zh) 一种基于软件定义网络的故障链路检测与恢复方法
US6587440B1 (en) Method for determining computer network topologies
CN106789177A (zh) 一种网络故障处理的***
US20060047809A1 (en) Method and apparatus for assessing performance and health of an information processing network
CN110430224A (zh) 一种基于随机块模型的通信网络异常行为检测方法
CN107147534A (zh) 一种用于电力通信网故障检测的数量优化的探针部署方法
CN102035715B (zh) 一种2m环网络故障诊断方法及***
CN109600276A (zh) 用电采集虚拟专用通道链路的状态监测***
CN112383934A (zh) 一种5g网络切片下多域协作的服务故障诊断方法
CN111988170A (zh) 一种终端故障定位方法及装置
US7719992B1 (en) System for proactive time domain reflectometry
CN105379180B (zh) 一种业务流链路的连通性检测方法、相关装置及***
CN111200544A (zh) 一种网络端口流量测试方法和装置
CN106452880A (zh) 网络接线检测方法及装置
CN102217232A (zh) 确定网元运行状态方法以及相关设备和***
CN108988496A (zh) 一种智能变电站二次***故障的诊断方法、装置及设备
CN105207835A (zh) 一种无线局域网的网元工作状态的判定方法及装置
CN103178997B (zh) 一种基于lldp协议的mac地址相同的检测方法和设备
CN113660560B (zh) 智能变电站过程层交换机拓扑实时校验方法
CN113872827A (zh) 一种交换机蛇形测试失败的分析方法、装置及存储介质
CN117896237B (zh) 一种针对网络组网的多设备互通场景监管***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181218