CN104270268B - 一种分布式***网络性能分析及故障诊断方法 - Google Patents

一种分布式***网络性能分析及故障诊断方法 Download PDF

Info

Publication number
CN104270268B
CN104270268B CN201410508685.0A CN201410508685A CN104270268B CN 104270268 B CN104270268 B CN 104270268B CN 201410508685 A CN201410508685 A CN 201410508685A CN 104270268 B CN104270268 B CN 104270268B
Authority
CN
China
Prior art keywords
network
node
management service
distributed system
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410508685.0A
Other languages
English (en)
Other versions
CN104270268A (zh
Inventor
张攀勇
彭成
季旻
苗艳超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CHINESE CORPORATION DAWNING INFORMATION INDUSTRY CHENGDU CO., LTD.
Dawning Information Industry Co Ltd
Original Assignee
Dawning Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dawning Information Industry Co Ltd filed Critical Dawning Information Industry Co Ltd
Priority to CN201410508685.0A priority Critical patent/CN104270268B/zh
Publication of CN104270268A publication Critical patent/CN104270268A/zh
Application granted granted Critical
Publication of CN104270268B publication Critical patent/CN104270268B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明提供一种分布式***网络性能分析及故障诊断方法,包括以下步骤:在被监控的分布式***上部署监控服务;根据分布式***的特征,运行管理服务;进行网络拓扑发现;确定被监控节点的监控节点集合;管理服务收集节点状态信息并进行分析;网络性能探测;网络状态分析,确定可能存在的故障。本发明考虑到了参与通信路径上的所有网络设备和链路的状态,节点之间的通信性能,根据网络拓扑信息,能够分析并确定故障点的具***置,提高了故障检测的精度,降低了故障检测的开销。同时对于分布式***的性能分析,本方法能够提供分布式***节点间的实际性能,而不是网络***的理论性能,能够提高性能预估的精度。

Description

一种分布式***网络性能分析及故障诊断方法
技术领域
本发明涉及一种诊断方法,具体涉及一种分布式***网络性能分析及故障诊断方法。
背景技术
分布式***指的是建立在网络***之上,将各个不同的节点通过节点之间的消息通信,协作完成一种或多种服务。由于分布式***将服务分布到不同的节点,因此分布式***具有良好的可扩展性,故障隔离,以及应用透明性。在实际的IT***中得到了广泛的应用,典型的服务有分布式文件***,分布式数据库,网站服务等。
由于分布式***依赖网络设备将各个服务节点互联在一起,网络设备的性能和稳定性对分布式***的性能和稳定性起到了决定性的作用。随着分布式***规模的扩大,使得网络的规模,设备类型,设备的连接方式变得极为复杂,如果某些设备出现故障,会直接影响到上层服务的质量。如何通过工具对网络***进行高效的故障诊断和性能分析,具有非常重要的意义。
目前的故障诊断机制来说,分为硬件故障诊断机制和软件测试工具。
硬件故障诊断机制包括网络设备上提供的性能计数器,提供各种性能和故障计数器,包括收发消息,丢弃消息,硬件错误消息等计数,通过这些计数能够检测到硬件设备是否存在异常。
软件测试工具通过主动地进行点到点的消息收发,计算出点到点的网络延迟和带宽,进而判断网络是否存在故障。典型的测试工具有Iperf,netperf等。
现有的分布式***网络性能分析和故障诊断存在如下几个方面的问题:
●故障判断源简单:硬件计数器只能侦测硬件本身的故障源,无法对于网络链路的状态,软件协议层错误等故障进行判断;软件点到点测试工具只能测试两个点之间的网络性能,无法通过数据快速判断网络故障。
●管理员手工参与:需要管理员手工测试各种可能情况,并根据结果分析可能存在何种故障进行处理。随着分布式***规模扩大导致的网络规模庞大,需要故障诊断工具简化并快速的提供整体网络的可能故障点,便于管理员进行故障的判断和排除。
发明内容
为了克服上述现有技术的不足,本发明提供一种分布式***网络性能分析及故障诊断方法,考虑到了参与通信路径上的所有网络设备和链路的状态,节点之间的通信性能,根据网络拓扑信息,能够分析并确定故障点的具***置,提高了故障检测的精度,降低了故障检测的开销。
同时对于分布式***的性能分析,本方法能够提供分布式***节点间的实际性能,而不是网络***的理论性能,能够提高性能预估的精度。
为了实现上述发明目的,本发明采取如下技术方案:
本发明提供一种分布式***网络性能分析及故障诊断方法,所述方法包括以下步骤:
步骤1:在被监控的分布式***上部署监控服务;
步骤2:根据分布式***的特征,运行管理服务;
步骤3:进行网络拓扑发现;
步骤4:确定被监控节点的监控节点集合;
步骤5:管理服务收集节点状态信息并进行分析;
步骤6:网络性能探测;
步骤7:网络状态分析,确定可能存在的故障。
所述步骤1中,根据被监控的分布式***规模,确定被监控节点,并在被监控节点上部署监控服务;所述被监控节点定义为分布式***中需要被监控的服务所在节点,包括服务器和网络设备等。
监控服务负责监控所在节点的网络状态,包括网卡的硬件状态和操作***提供的性能计数信息等;
监控服务接收管理服务的命令并执行,命令包括网络探测命令和网络性能测试命令;
监控服务根据管理服务发出的网络探测命令,进行网络探测;并根据管理服务发出的网络性能测试命令,进行节点之间的网络性能测试。
所述步骤2中,在管理节点上运行管理服务,管理服务根据分布式***特征,选择被监控节点,启动监控服务,并与被监控节点上的监控服务相连接。
管理服务与监控服务的连接方式根据分布式***的规模而定:
对于小规模分布式***,管理服务直接与所有的监控服务连接;
对于大规模分布式***,管理服务采用树形层级方式连接,即上层管理服务管理不同分区的管理服务,单个分区管理服务只管理设定数量的节点和网络。
所述步骤3中,管理服务对分布式***的所有网络设备发起网络拓扑发现,以确定网络拓扑信息,并将网络该拓扑信息存储到管理服务中;如果分布式***所处的网络设备不支持拓扑发现,则根据管理员提供的拓扑配置构建网络拓扑信息。
所述步骤4中,被监控节点支持以下三种监控方式:
(1)全***扫描方式:对分布式***的所有节点和网络设备进行扫描,则监控节点集合为***内部所有节点和网络设备;
(2)管理员指定方式:管理员通过配置指定监控节点集合;
(3)应用程序指定,故障时监控集合扫描方式:应用程序通过API指定监控节点集合,***在发现可疑故障之后针对特定节点扫描;该监控方式的具体过程如下:
3-1):应用程序指定需要监控的节点;
3-2):监控服务定期监控节点的状态,如果发现网络状态异常,则将本节点的异常通信状态主动通知给管理服务;
3-3):管理服务在接收到节点异常通信状态通知后,根据网络拓扑计算出通信路径,将通信路径上的所有网络设备和节点,加入监控节点列表。
所述步骤5包括以下步骤:
步骤5-1:管理服务向监控节点集合中的监控服务发起节点状态信息收集命令;
步骤5-2:监控服务接收到节点状态信息收集命令后,收集本节点网络设备的状态,并将结果返回给管理服务;
步骤5-3:管理服务收集到所有节点的状态信息进行分析,确认存在故障的网络设备,并将存在故障的网络设备在管理服务的网络拓扑信息中标出;
步骤5-4:管理服务将存在故障的网络设备的列表上报给管理员,通知管理员进行维护。
所述步骤6包括以下步骤:
步骤6-1:管理服务向监控节点集合中的监控节点成对发起主动网络性能探测,性能指标包括双向网络延迟、网络带宽和网络性能稳定性,并收集节点路径上的所有网络设备的计数器;
步骤6-2:节点上的监控服务在收到网络性能探测请求后,主动向对应节点发起探测消息操作,并将结果返回给管理服务;
步骤6-3:管理服务选择成对监控节点的算法,包括排列组合算法和贪心算法等。
所述步骤7中,管理服务在接收到步骤5和步骤6的结果之后,根据步骤3获得的网络拓扑信息进行网络状态分析,综合所有网络设备的计数器以及节点之间的通信测试性能,确定存在故障的网络设备或者链路,可能存在的故障包括网卡设备硬件故障、网卡工作模式错误、网卡接口与节点接口不匹配、连接线缆断开、连接线缆不稳定和交换机故障。
与现有技术相比,本发明的有益效果在于:
本发明提供的分布式***网络性能分析及故障诊断方法,由于考虑到了分布式***的所有网络设备的状态,主动进行节点之间的路径探测,并根据探测结论分析出性能问题或故障点,具体到某一个网络设备,链路,或者节点级别,极大的降低了***网络性能分析和故障诊断的开销,减轻了管理员的人工干预;支持全***和应用指定路径的故障探测。
附图说明
图1是本发明实施例中管理服务与监控服务的连接示意图;
图2是本发明实施例中管理服务根据结果判断网络设备故障的示意图。
具体实施方式
下面结合附图对本发明作进一步详细说明。
本发明提供一种分布式***网络性能分析及故障诊断方法,所述方法包括以下步骤:
步骤1:在被监控的分布式***上部署监控服务;
步骤2:根据分布式***的特征,运行管理服务;
步骤3:进行网络拓扑发现;
步骤4:确定被监控节点的监控节点集合;
步骤5:管理服务收集节点状态信息并进行分析;
步骤6:网络性能探测;
步骤7:网络状态分析,确定可能存在的故障。
所述步骤1中,根据被监控的分布式***规模,确定被监控节点,并在被监控节点上部署监控服务;所述被监控节点定义为分布式***中需要被监控的服务所在节点,包括服务器和网络设备等。
监控服务负责监控所在节点的网络状态,包括网卡的硬件状态和操作***提供的性能计数信息等;
监控服务接收管理服务的命令并执行,命令包括网络探测命令和网络性能测试命令;
监控服务根据管理服务发出的网络探测命令,进行网络探测;并根据管理服务发出的网络性能测试命令,进行节点之间的网络性能测试。
所述步骤2中,在管理节点上运行管理服务,管理服务根据分布式***特征,选择被监控节点,启动监控服务,并与被监控节点上的监控服务相连接(如图1)。
管理服务与监控服务的连接方式根据分布式***的规模而定:
对于小规模分布式***,管理服务直接与所有的监控服务连接;
对于大规模分布式***,管理服务采用树形层级方式连接,即上层管理服务管理不同分区的管理服务,单个分区管理服务只管理设定数量的节点和网络。
所述步骤3中,管理服务对分布式***的所有网络设备发起网络拓扑发现,以确定网络拓扑信息,并将网络该拓扑信息存储到管理服务中;如果分布式***所处的网络设备不支持拓扑发现,则根据管理员提供的拓扑配置构建网络拓扑信息。
所述步骤4中,被监控节点支持以下三种监控方式:
(1)全***扫描方式:对分布式***的所有节点和网络设备进行扫描,则监控节点集合为***内部所有节点和网络设备;
(2)管理员指定方式:管理员通过配置指定监控节点集合;
(3)应用程序指定,故障时监控集合扫描方式:应用程序通过API指定监控节点集合,***在发现可疑故障之后针对特定节点扫描;该监控方式的具体过程如下:
3-1):应用程序指定需要监控的节点;
3-2):监控服务定期监控节点的状态,如果发现网络状态异常,则将本节点的异常通信状态主动通知给管理服务;
3-3):管理服务在接收到节点异常通信状态通知后,根据网络拓扑计算出通信路径,将通信路径上的所有网络设备和节点,加入监控节点列表。
所述步骤5包括以下步骤:
步骤5-1:管理服务向监控节点集合中的监控服务发起节点状态信息收集命令;
步骤5-2:监控服务接收到节点状态信息收集命令后,收集本节点网络设备的状态,并将结果返回给管理服务;
步骤5-3:管理服务收集到所有节点的状态信息进行分析,确认存在故障的网络设备,并将存在故障的网络设备在管理服务的网络拓扑信息中标出;
步骤5-4:管理服务将存在故障的网络设备的列表上报给管理员,通知管理员进行维护。
所述步骤6包括以下步骤:
步骤6-1:管理服务向监控节点集合中的监控节点成对发起主动网络性能探测,性能指标包括双向网络延迟、网络带宽和网络性能稳定性,并收集节点路径上的所有网络设备的计数器;
步骤6-2:节点上的监控服务在收到网络性能探测请求后,主动向对应节点发起探测消息操作,并将结果返回给管理服务;
步骤6-3:管理服务选择成对监控节点的算法,包括排列组合算法和贪心算法等。
所述步骤7中,管理服务在接收到步骤5和步骤6的结果之后,根据步骤3获得的网络拓扑信息进行网络状态分析,综合所有网络设备的计数器以及节点之间的通信测试性能,确定存在故障的网络设备或者链路,可能存在的故障包括网卡设备硬件故障、网卡工作模式错误、网卡接口与节点接口不匹配、连接线缆断开、连接线缆不稳定和交换机故障。
判断依据可能有如下几种但不局限于如下方法:
●某一个节点向外的所有链路性能均异常,判断该节点的网卡设备或者节点向外的连接线缆故障;
●经过某一个交换设备的链路上通信性能均异常,判断该交换设备工作异常;
●使用某一个链路的节点到节点的通信性能异常,判断该链路异常。
图2为步骤7管理服务根据结果判断设备故障的一个示例:
■对于节点1,节点2,节点3,交换机1,交换机2根据设备计数器判断均正常工作;
■同时节点1到节点2之间的网络性能正常,但是节点1到节点3,节点2到节点3的状态均异常;
■根据管理服务的网络拓扑信息分析,由于节点1-节点3与节点2-节点3的公共网络路径为交换机1-交换机2,同时根据交换机的设备计数器正常,判断故障可能为交换机1-交换机2之间的链路故障,通知管理员对应的故障点。
如果需要获取分布式***网络性能对应用性能的影响,根据提供的应用个模式,计算出预期的性能值。管理服务将分析结果上报给管理员,由管理员进行判断,并对故障进行相应的处理。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,所属领域的普通技术人员参照上述实施例依然可以对本发明的具体实施方式进行修改或者等同替换,这些未脱离本发明精神和范围的任何修改或者等同替换,均在申请待批的本发明的权利要求保护范围之内。

Claims (1)

1.一种分布式***网络性能分析及故障诊断方法,其特征在于:所述方法包括以下步骤:
步骤1:在被监控的分布式***上部署监控服务;
步骤2:根据分布式***的特征,运行管理服务;
步骤3:进行网络拓扑发现;
步骤4:确定被监控节点的监控节点集合;
步骤5:管理服务收集节点状态信息并进行分析;
步骤6:网络性能探测;
步骤7:网络状态分析,确定可能存在的故障;
所述步骤1中,根据被监控的分布式***规模,确定被监控节点,并在被监控节点上部署监控服务;所述被监控节点定义为分布式***中需要被监控的服务所在节点,包括服务器和网络设备;
监控服务负责监控所在节点的网络状态,包括网卡的硬件状态和操作***提供的性能计数信息;
监控服务接收管理服务的命令并执行,命令包括网络探测命令和网络性能测试命令;
监控服务根据管理服务发出的网络探测命令,进行网络探测;并根据管理服务发出的网络性能测试命令,进行节点之间的网络性能测试;
所述步骤2中,在管理节点上运行管理服务,管理服务根据分布式***特征,选择被监控节点,启动监控服务,并与被监控节点上的监控服务相连接;
管理服务与监控服务的连接方式根据分布式***的规模而定:
对于小规模分布式***,管理服务直接与所有的监控服务连接;
对于大规模分布式***,管理服务采用树形层级方式连接,即上层管理服务管理不同分区的管理服务,单个分区管理服务只管理设定数量的节点和网络;
所述步骤3中,管理服务对分布式***的所有网络设备发起网络拓扑发现,以确定网络拓扑信息,并将网络该拓扑信息存储到管理服务中;如果分布式***所处的网络设备不支持拓扑发现,则根据管理员提供的拓扑配置构建网络拓扑信息;
所述步骤4中,被监控节点支持以下三种监控方式:
(1)全***扫描方式:对分布式***的所有节点和网络设备进行扫描,则监控节点集合为***内部所有节点和网络设备;
(2)管理员指定方式:管理员通过配置指定监控节点集合;
(3)应用程序指定,故障时监控集合扫描方式:应用程序通过API指定监控节点集合,***在发现可疑故障之后针对特定节点扫描;该监控方式的具体过程如下:
3-1):应用程序指定需要监控的节点;
3-2):监控服务定期监控节点的状态,如果发现网络状态异常,则将本节点的异常通信状态主动通知给管理服务;
3-3):管理服务在接收到节点异常通信状态通知后,根据网络拓扑计算出通信路径,将通信路径上的所有网络设备和节点,加入监控节点列表;
所述步骤5包括以下步骤:
步骤5-1:管理服务向监控节点集合中的监控服务发起节点状态信息收集命令;
步骤5-2:监控服务接收到节点状态信息收集命令后,收集本节点网络设备的状态,并将结果返回给管理服务;
步骤5-3:管理服务收集到所有节点的状态信息进行分析,确认存在故障的网络设备,并将存在故障的网络设备在管理服务的网络拓扑信息中标出;
步骤5-4:管理服务将存在故障的网络设备的列表上报给管理员,通知管理员进行维护;
所述步骤6包括以下步骤:
步骤6-1:管理服务向监控节点集合中的监控节点成对发起主动网络性能探测,性能指标包括双向网络延迟、网络带宽和网络性能稳定性,并收集节点路径上的所有网络设备的计数器;
步骤6-2:节点上的监控服务在收到网络性能探测请求后,主动向对应节点发起探测消息操作,并将结果返回给管理服务;
步骤6-3:管理服务选择成对监控节点的算法,包括排列组合算法和贪心算法;
所述步骤7中,管理服务在接收到步骤5和步骤6的结果之后,根据步骤3获得的网络拓扑信息进行网络状态分析,综合所有网络设备的计数器以及节点之间的通信测试性能,确定存在故障的网络设备或者链路,可能存在的故障包括网卡设备硬件故障、网卡工作模式错误、网卡接口与节点接口不匹配、连接线缆断开、连接线缆不稳定和交换机故障。
CN201410508685.0A 2014-09-28 2014-09-28 一种分布式***网络性能分析及故障诊断方法 Active CN104270268B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410508685.0A CN104270268B (zh) 2014-09-28 2014-09-28 一种分布式***网络性能分析及故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410508685.0A CN104270268B (zh) 2014-09-28 2014-09-28 一种分布式***网络性能分析及故障诊断方法

Publications (2)

Publication Number Publication Date
CN104270268A CN104270268A (zh) 2015-01-07
CN104270268B true CN104270268B (zh) 2017-12-05

Family

ID=52161762

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410508685.0A Active CN104270268B (zh) 2014-09-28 2014-09-28 一种分布式***网络性能分析及故障诊断方法

Country Status (1)

Country Link
CN (1) CN104270268B (zh)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104935458B (zh) * 2015-04-29 2018-05-29 中国人民解放军国防科学技术大学 一种基于分布式自动化测量的性能瓶颈分析方法及装置
CN105227395B (zh) * 2015-08-28 2018-09-28 北京奇艺世纪科技有限公司 一种分布式jvm性能分析的方法、装置及***
CN105227354A (zh) * 2015-09-07 2016-01-06 浪潮软件集团有限公司 一种基于日志的对分布式***监控管理的方法
CN106598800A (zh) * 2015-10-14 2017-04-26 中兴通讯股份有限公司 一种硬件故障分析***和方法
CN105812210A (zh) * 2016-05-25 2016-07-27 赵鹏 分布式网络性能测量***
CN106130761B (zh) * 2016-06-22 2019-06-18 北京百度网讯科技有限公司 数据中心的故障网络设备的识别方法和装置
CN107545129B (zh) * 2016-06-27 2021-06-22 西门子(深圳)磁共振有限公司 一种医疗设备的故障检查方法和装置
CN106506196A (zh) * 2016-10-19 2017-03-15 上海携程商务有限公司 企业级上网排障方法及***
CN108664346A (zh) * 2017-03-27 2018-10-16 ***通信集团福建有限公司 分布式存储***的节点异常的定位方法、装置和***
CN108933708B (zh) * 2017-05-27 2021-03-09 中国互联网络信息中心 一种分布式dns服务的多维度校验方法和***
CN109559583B (zh) * 2017-09-27 2022-04-05 华为技术有限公司 故障模拟方法及其装置
CN107634863A (zh) * 2017-10-25 2018-01-26 北京百悟科技有限公司 用于域名解析容灾服务的分布式监控装置及方法
CN108337114A (zh) * 2018-01-16 2018-07-27 中车青岛四方机车车辆股份有限公司 网络状态处理设备、方法及列车
US10795756B2 (en) * 2018-04-24 2020-10-06 EMC IP Holding Company LLC System and method to predictively service and support the solution
CN109088766B (zh) * 2018-08-15 2021-10-29 无锡江南计算技术研究所 一种基于配对测试的互连网络故障检测与定位方法
CN109450729A (zh) * 2018-11-05 2019-03-08 郑州云海信息技术有限公司 一种自动测试整机柜服务器网络稳定性的方法及***
CN109802855B (zh) * 2018-12-28 2020-08-07 华为技术有限公司 一种故障定位方法及装置
CN111092747A (zh) * 2019-10-25 2020-05-01 苏州浪潮智能科技有限公司 一种网络性能诊断的方法、设备及介质
CN112751689B (zh) * 2019-10-30 2023-12-05 北京京东振世信息技术有限公司 一种网络连通性检测方法、监控服务端和监控代理装置
CN110837453B (zh) * 2019-11-01 2023-09-01 山东中创软件商用中间件股份有限公司 一种公文交换平台的监控方法及相关装置
CN111044936A (zh) * 2019-11-28 2020-04-21 中国航空工业集团公司西安航空计算技术研究所 一种机载gjb289a总线线缆故障快速定位方法
CN111682976B (zh) * 2020-04-26 2022-03-01 合肥中科类脑智能技术有限公司 一种保证分布式多机通信监控的方法
CN113839827B (zh) * 2020-06-24 2023-09-12 维谛技术有限公司 数据监控***、设备和方法
CN111817913B (zh) * 2020-06-30 2022-05-17 北京红山信息科技研究院有限公司 分布式网络性能测试方法、***、服务器和存储介质
CN114500244A (zh) * 2020-11-13 2022-05-13 中兴通讯股份有限公司 网络故障诊断方法、装置、计算机设备和可读介质
CN112491464B (zh) * 2020-12-01 2022-08-09 凯睿星通信息科技(南京)股份有限公司 一种卫星通信的分布式故障实时监测与备用设备切换方法
CN113179182B (zh) * 2021-04-27 2022-11-22 中国联合网络通信集团有限公司 网络监管方法、装置、设备及存储介质
CN113708995B (zh) * 2021-08-20 2023-04-07 深圳市风云实业有限公司 一种网络故障诊断方法、***、电子设备及存储介质
WO2023225886A1 (en) * 2022-05-25 2023-11-30 Intel Corporation Low latency and deterministic node failure detection
CN115378830B (zh) * 2022-08-19 2024-03-26 百倍云(浙江)物联科技有限公司 一种生态环境监测***稳定性监控方法
CN115550215A (zh) * 2022-09-19 2022-12-30 中国工商银行股份有限公司 网络检测方法、检测端、埋点服务器和***

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103607297A (zh) * 2013-11-07 2014-02-26 上海爱数软件有限公司 一种计算机集群***的故障处理方法
CN103699111A (zh) * 2013-09-26 2014-04-02 青岛海信网络科技股份有限公司 分布式监控***的故障检测方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8295178B2 (en) * 2008-05-19 2012-10-23 Solarwinds Worldwide Llc Manual configuration for sites that cannot give read/write credentials to a voice over internet protocol (VOIP) monitor

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103699111A (zh) * 2013-09-26 2014-04-02 青岛海信网络科技股份有限公司 分布式监控***的故障检测方法和装置
CN103607297A (zh) * 2013-11-07 2014-02-26 上海爱数软件有限公司 一种计算机集群***的故障处理方法

Also Published As

Publication number Publication date
CN104270268A (zh) 2015-01-07

Similar Documents

Publication Publication Date Title
CN104270268B (zh) 一种分布式***网络性能分析及故障诊断方法
CN106789177B (zh) 一种网络故障处理的***
US8443074B2 (en) Constructing an inference graph for a network
CN102158360B (zh) 一种基于时间因子因果关系定位的网络故障自诊断方法
JP4421645B2 (ja) 通信装置およびネットワーク情報収集プログラム
CN104796298B (zh) 一种sdn网络故障分析的方法及装置
RU2471301C2 (ru) Функционирование сетевых субъектов в системе связи, содержащей сеть управления с уровнями агентов и управления
Ramanathan et al. Towards a debugging system for sensor networks
JP2014534661A (ja) 根本原因分析のための方法、装置、および通信ネットワーク
CN102195857A (zh) 一种网络拓扑结构与节点信息搜集方法
KR20160147957A (ko) 자동-구성 네트워크들에서 검증
CN101667941A (zh) 链路性能的检测方法及装置
CN110224883A (zh) 一种应用于电信承载网的灰色故障诊断方法
CN105812210A (zh) 分布式网络性能测量***
US11012290B2 (en) Systems and methods for node outage determination and reporting
Nie et al. Passive diagnosis for WSNs using data traces
CN108123752B (zh) 一种基于地理信息定位的epon精确环路检测方法
KR100500836B1 (ko) 매트로 이더넷망의 장애처리 장치 및 그 방법
CN116248479A (zh) 网络路径探测方法、装置、设备及存储介质
CN111654413B (zh) 一种网络流量有效测量点的选取方法、设备及存储介质
CN113300914A (zh) 网络质量监测方法、装置、***、电子设备和存储介质
Han et al. Research of network monitoring based on SNMP
Pan et al. Fault diagnosis in network virtualization environment
Ye et al. Providing diagnostic network feedback to end users on smartphones
CN115913903A (zh) 一种录波主站组网设备网络故障自动修复方法及***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190909

Address after: 610000 Sichuan city of Chengdu province Tianfu Tianfu Avenue South Huayang Street No. 846

Co-patentee after: Sugon Information Industry Co., Ltd.

Patentee after: CHINESE CORPORATION DAWNING INFORMATION INDUSTRY CHENGDU CO., LTD.

Address before: 300384 Tianjin city Xiqing District Huayuan Industrial Zone (outer ring) Haitai Huake Street No. 15 1-3

Patentee before: Sugon Information Industry Co., Ltd.