CN109981377A - 一种分布式数据中心链路监控方法及*** - Google Patents

一种分布式数据中心链路监控方法及*** Download PDF

Info

Publication number
CN109981377A
CN109981377A CN201910287217.8A CN201910287217A CN109981377A CN 109981377 A CN109981377 A CN 109981377A CN 201910287217 A CN201910287217 A CN 201910287217A CN 109981377 A CN109981377 A CN 109981377A
Authority
CN
China
Prior art keywords
link
monitoring server
network
computer room
link quality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910287217.8A
Other languages
English (en)
Other versions
CN109981377B (zh
Inventor
田兆楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sohu New Media Information Technology Co Ltd
Original Assignee
Beijing Sohu New Media Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sohu New Media Information Technology Co Ltd filed Critical Beijing Sohu New Media Information Technology Co Ltd
Priority to CN201910287217.8A priority Critical patent/CN109981377B/zh
Publication of CN109981377A publication Critical patent/CN109981377A/zh
Application granted granted Critical
Publication of CN109981377B publication Critical patent/CN109981377B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • H04L41/042Network management architectures or arrangements comprising distributed management centres cooperatively managing the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种分布式数据中心链路监控方法及***,方法包括:在每个互联网数据中心机房部署一台监控服务器,对于监控服务器所在机房的所有子网,从每个子网选取一个IP,将所有子网的IP配置在监控服务器的网卡上;基于监控服务器获取各个互联网数据中心机房不同子网间的链路质量数据,存储链路质量数据,基于链路质量矩阵显示所述链路质量数据。本发明能够实现实时网络链路监控,无需额外开发工具、无需分析网络设备日志,开发简单,几乎不需要维护,能够从网络设备层直接反馈网络链路的质量,不需要从应用侧发现故障,使得定位及时准确。

Description

一种分布式数据中心链路监控方法及***
技术领域
本发明涉及互联网数据中心技术领域,尤其涉及一种分布式数据中心链路监控方法及***。
背景技术
大型数据中心的网络规模庞大,通常有数量庞大的网络设备,且网络设备要进行多层级联,一旦设备出了故障,需要及时定位到故障设备。如果等到应用方发现故障,根据应用方的故障现象被动的定位问题链路,往往不能得到充分的信息进行及时定位。所以网络运营部门需要实时的主动监控数据中心链路质量情况,以及时发现故障,隔离、替换故障设备。
传统的网络中心链路监控方法通常需要收集、分析络设备上的日志或信息,配置、分析复杂,维护成本大。或者通过应用侧反应出网络故障,不能充分、及时定位故障。
因此,如何有效的对分布式数据中心链路进行监控,是一项亟待解决的问题。
发明内容
有鉴于此,本发明提供了一种分布式数据中心链路监控方法,能够实现实时网络链路监控,无需额外开发工具、无需分析网络设备日志,开发简单,几乎不需要维护,能够从网络设备层直接反馈网络链路的质量,不需要从应用侧发现故障,使得定位及时准确。
本发明提供了一种分布式数据中心链路监控方法,包括:
在每个互联网数据中心机房部署一台监控服务器;
对于监控服务器所在机房的所有子网,从每个子网选取一个IP,将所有子网的IP配置在所述监控服务器的网卡上;
基于所述监控服务器获取各个互联网数据中心机房不同子网间的链路质量数据;
存储所述链路质量数据;
基于链路质量矩阵显示所述链路质量数据。
优选地,所述基于所述监控服务器获取各个互联网数据中心机房不同子网间的链路质量数据包括:
读取每台监控服务器上记录的所有互联网数据中心机房的监控服务器IP集合;
在每台监控服务器上运行Ping命令,监控服务器上的所有IP依次Ping所有互联网数据中心机房监控服务器的IP,得到各个互联网数据中心机房不同子网间的链路质量数据。
优选地,所述Ping命令执行时指定参数为:
发送10个包,每个包的大小为500字节,每6秒钟发一个包。
优选地,所述存储所述链路质量数据包括:
实时存储所述链路质量数据;
每小时汇总所述链路质量数据;
每天汇总所述链路质量数据。
优选地,所述方法还包括:
当所述链路质量数据的丢包率或网络延时大于告警阈值时,生成告警信息。
一种分布式数据中心链路监控***,包括:
部署模块,用于在每个互联网数据中心机房部署一台监控服务器;
配置模块,用于对于监控服务器所在机房的所有子网,从每个子网选取一个IP,将所有子网的IP配置在所述监控服务器的网卡上;
处理模块,用于基于所述监控服务器获取各个互联网数据中心机房不同子网间的链路质量数据;
存储模块,用于存储所述链路质量数据;
显示模块,用于基于链路质量矩阵显示所述链路质量数据。
优选地,所述处理模块包括:
读取单元,用于读取每台监控服务器上记录的所有互联网数据中心机房的监控服务器IP集合;
命令运行单元,用于在每台监控服务器上运行Ping命令,监控服务器上的所有IP依次Ping所有互联网数据中心机房监控服务器的IP,得到各个互联网数据中心机房不同子网间的链路质量数据。
优选地,所述Ping命令执行时指定参数为:
发送10个包,每个包的大小为500字节,每6秒钟发一个包。
优选地,所述存储模块在执行存储所述链路质量数据时,具体用于:
实时存储所述链路质量数据;
每小时汇总所述链路质量数据;
每天汇总所述链路质量数据。
优选地,所述***还包括:
生成模块,用于当所述链路质量数据的丢包率或网络延时大于告警阈值时,生成告警信息。
综上所述,本发明公开了一种分布式数据中心链路监控方法,包括:在每个互联网数据中心机房部署一台监控服务器;对于监控服务器所在机房的所有子网,从每个子网选取一个IP,将所有子网的IP配置在监控服务器的网卡上;基于监控服务器获取各个互联网数据中心机房不同子网间的链路质量数据;存储链路质量数据,基于链路质量矩阵显示链路质量数据。本发明不需要收集、分析网络设备的信息,只需要在每个互联网数据中心机房部署一个简单的监控服务,即可监控所有子网的链路质量情况,并且以链路矩阵的形式展示监控数据,能够直观的检测出链路状态。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明公开的一种分布式数据中心链路监控方法实施例1的流程图;
图2为本发明公开的一种分布式数据中心链路监控方法实施例2的流程图;
图3为本发明公开的链路质量矩阵示意图;
图4为本发明公开的显示数值的链路质量矩阵示意图;
图5为本发明公开的一种分布式数据中心链路监控***实施例1的结构示意图;
图6为本发明公开的一种分布式数据中心链路监控***实施例2的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,为本发明公开的一种分布式数据中心链路监控方法实施例1的流程图,所述方法可以包括以下步骤:
S101、在每个互联网数据中心机房部署一台监控服务器;
当需要对分布式数据中心链路的质量进行监控时,首先在每个IDC(InternetDate Center,互联网数据中心)机房部署一台监控服务器。其中,所述的IDC机房,就是电信部门利用已有的互联网通信线路、带宽资源,建立标准化的电信专业级机房环境,为企业、政府提供服务器托管、租用以及相关增值等方面的全方位服务。
S102、对于监控服务器所在机房的所有子网,从每个子网选取一个IP,将所有子网的IP配置在所述监控服务器的网卡上;
IP地址是以网路号和主机号来表示网络上的主机的,只有在一个网络号下的计算机之间才能“直接”互通,不同网络号的计算机要通过网关才能互通。但是这样的划分在某些情况下显得并不十分灵活,为此IP网络还允许划分成更小的网络,称为子网(Subnet)。
对于监控服务器所在机房的所有子网,从每个子网选取一个IP,将这些IP配置在监控服务器的网卡上。因此每台监控服务器都配置了所在IDC机房的所有不同子网的IP。监控服务器上的网卡配置举例如下:
eth10.subnet1:inet IP1netmask mask1broadcast broadcast1
eth10.subnet2:inet IP1netmask mask1broadcast broadcast2
eth10.subnet3:inet IP1netmask mask1broadcast broadcast3
eth10.subnet4:inet IP1netmask mask4broadcast broadcast4
S103、基于监控服务器获取各个互联网数据中心机房不同子网间的链路质量数据;
然后,在每个监控服务器上定时执行监控服务程序,获取各IDC机房不同子网间的链路质量数据。
S104、存储链路质量数据;
当获取到各IDC机房不同子网间的链路质量数据后,进一步对获取到的链路质量数据进行存储,便于前端进行显示。
S105、基于链路质量矩阵显示所述链路质量数据。
最后,如图3所示,通过链路质量矩阵,以矩阵的形式展示不同子网间的链路情况,可以由不同的颜色代表不同的链路质量。
进一步,如图4所示,可以进入链路质量矩阵中的每一个点显示链路情况的具体数值。其中,行和列为不同IDC机房所有子网的一个IP采用延时和丢包率曲线直观显示链路情况。
综上所述,在上述实施例中,一种分布式数据中心链路监控方法,包括:在每个互联网数据中心机房部署一台监控服务器;对于监控服务器所在机房的所有子网,从每个子网选取一个IP,将所有子网的IP配置在监控服务器的网卡上;基于监控服务器获取各个互联网数据中心机房不同子网间的链路质量数据;存储链路质量数据,基于链路质量矩阵显示链路质量数据。本发明不需要收集、分析网络设备的信息,只需要在每个互联网数据中心机房部署一个简单的监控服务,即可监控所有子网的链路质量情况,并且以链路矩阵的形式展示监控数据,能够直观的检测出链路状态。
如图2所示,为本发明公开的一种分布式数据中心链路监控方法实施例2的流程图,所述方法可以包括以下步骤:
S201、在每个互联网数据中心机房部署一台监控服务器;
当需要对分布式数据中心链路的质量进行监控时,首先在每个IDC(InternetDate Center,互联网数据中心)机房部署一台监控服务器。其中,所述的IDC机房,就是电信部门利用已有的互联网通信线路、带宽资源,建立标准化的电信专业级机房环境,为企业、政府提供服务器托管、租用以及相关增值等方面的全方位服务。
S202、对于监控服务器所在机房的所有子网,从每个子网选取一个IP,将所有子网的IP配置在所述监控服务器的网卡上;
IP地址是以网路号和主机号来表示网络上的主机的,只有在一个网络号下的计算机之间才能“直接”互通,不同网络号的计算机要通过网关才能互通。但是这样的划分在某些情况下显得并不十分灵活,为此IP网络还允许划分成更小的网络,称为子网(Subnet)。
对于监控服务器所在机房的所有子网,从每个子网选取一个IP,将这些IP配置在监控服务器的网卡上。因此每台监控服务器都配置了所在IDC机房的所有不同子网的IP。监控服务器上的网卡配置举例如下:
eth10.subnet1:inet IP1netmask mask1broadcast broadcast1
eth10.subnet2:inet IP1netmask mask1broadcast broadcast2
eth10.subnet3:inet IP1netmask mask1broadcast broadcast3
eth10.subnet4:inet IP1netmask mask4broadcast broadcast4
S203、读取每台监控服务器上记录的所有互联网数据中心机房的监控服务器IP集合;
然后,在每个监控服务器上定时执行监控服务程序,获取各IDC机房不同子网间的链路质量数据。具体的,首先读取每台监控服务器上记录的所有IDC机房的监控服务器IP集合。
S204、在每台监控服务器上运行Ping命令,监控服务器上的所有IP依次Ping所有互联网数据中心机房监控服务器的IP,得到各个互联网数据中心机房不同子网间的链路质量数据;
然后读取本监控节点的IP,即读取本监控服务器上的所有IP,在监控服务器上运行Ping命令,依次使用本监控服务器上的所有IP Ping所有IDC机房的监控服务器IP,得到各个互联网数据中心机房不同子网间的链路质量数据。
具体的,为确保链路监控的实时性能,本发明期望将Ping命令的执行限制在一分钟以内,因此经过多次试验设定Ping命令执行时指定参数为:
ping–I source_ip-c 10-i 6-l 500destination_ip
其中-c 10表示发送10个包,-l 500表示每个包的大小为500字节,-i 6表示每6秒钟发一个包。
为实时监控链路情况,监控程序定时为两分钟执行一次,每次程序的执行时间控制在两分钟以内,其中一分钟用于执行Ping命令,一分钟用于数据的处理的存储。
S205、存储链路质量数据;
当获取到各IDC机房不同子网间的链路质量数据后,进一步对获取到的链路质量数据进行存储,便于前端进行显示。
具体的,为显示不同时间粒度的监控数据,数据可以分三个粒度存储,分别为实时数据、每小时汇总数据、每天汇总数据。其中实时数据每两分钟更新一次;每小时汇总数据每两分钟一条数据,保留上个小时的所有数据;每天汇总数据一小时一条数据,保留近两周数据。其中每小时汇总和每天汇总数据是从实时数据中获取保存。
S206、基于链路质量矩阵显示链路质量数据;
最后,如图3所示,通过链路质量矩阵,以矩阵的形式展示不同子网间的链路情况,可以由不同的颜色代表不同的链路质量。
进一步,如图4所示,可以进入链路质量矩阵中的每一个点显示链路情况的具体数值。其中,行和列为不同IDC机房所有子网的一个IP采用延时和丢包率曲线直观显示链路情况。
S207、当链路质量数据的丢包率或网络延时大于告警阈值时,生成告警信息。
根据实际经验,当丢包率>10%或网络延时>5ms时,即可认为网络链路出现故障,本发明以此范围作为告警的阈值。当链路质量数据的丢包率或网络延时大于告警阈值时,生成告警信息,并将告警信息以邮件或短信等形式报警。
综上所述,传统的网络中心链路监控方法通常需要收集、分析网络设备上的日志或信息,配置、分析复杂,维护成本大。或者通过应用侧反应出网络故障,不能充分、及时定位故障。本发明不需要收集、分析网络设备的信息,直接监控链路侧的质量。只需要在每个IDC机房部署一个简单的监控服务,即可监控所有子网的链路质量情况,监控程序可以使用Python或shell脚本开发,开发周期短,基本不需要维护,通过选定合适的Ping命令参数可以在两分钟内完成链路质量数据的获取和处理,实现实时监控的目的,并且以链路矩阵的形式展示监控数据,可以帮助网络工程师直观的检测链路状态。
如图5所示,为本发明公开的一种分布式数据中心链路监控***实施例1的结构示意图,所述***可以包括:
部署模块501,用于在每个互联网数据中心机房部署一台监控服务器;
当需要对分布式数据中心链路的质量进行监控时,首先在每个IDC(InternetDate Center,互联网数据中心)机房部署一台监控服务器。其中,所述的IDC机房,就是电信部门利用已有的互联网通信线路、带宽资源,建立标准化的电信专业级机房环境,为企业、政府提供服务器托管、租用以及相关增值等方面的全方位服务。
配置模块502,用于对于监控服务器所在机房的所有子网,从每个子网选取一个IP,将所有子网的IP配置在所述监控服务器的网卡上;
IP地址是以网路号和主机号来表示网络上的主机的,只有在一个网络号下的计算机之间才能“直接”互通,不同网络号的计算机要通过网关才能互通。但是这样的划分在某些情况下显得并不十分灵活,为此IP网络还允许划分成更小的网络,称为子网(Subnet)。
对于监控服务器所在机房的所有子网,从每个子网选取一个IP,将这些IP配置在监控服务器的网卡上。因此每台监控服务器都配置了所在IDC机房的所有不同子网的IP。监控服务器上的网卡配置举例如下:
eth10.subnet1:inet IP1netmask mask1broadcast broadcast1
eth10.subnet2:inet IP1netmask mask1broadcast broadcast2
eth10.subnet3:inet IP1netmask mask1broadcast broadcast3
eth10.subnet4:inet IP1netmask mask4broadcast broadcast4
处理模块503,用于基于监控服务器获取各个互联网数据中心机房不同子网间的链路质量数据;
然后,在每个监控服务器上定时执行监控服务程序,获取各IDC机房不同子网间的链路质量数据。
存储模块504,用于存储链路质量数据;
当获取到各IDC机房不同子网间的链路质量数据后,进一步对获取到的链路质量数据进行存储,便于前端进行显示。
显示模块505,用于基于链路质量矩阵显示所述链路质量数据。
最后,如图3所示,通过链路质量矩阵,以矩阵的形式展示不同子网间的链路情况,可以由不同的颜色代表不同的链路质量。
进一步,如图4所示,可以进入链路质量矩阵中的每一个点显示链路情况的具体数值。其中,行和列为不同IDC机房所有子网的一个IP采用延时和丢包率曲线直观显示链路情况。
综上所述,在上述实施例中,一种分布式数据中心链路监控方法,包括:在每个互联网数据中心机房部署一台监控服务器;对于监控服务器所在机房的所有子网,从每个子网选取一个IP,将所有子网的IP配置在监控服务器的网卡上;基于监控服务器获取各个互联网数据中心机房不同子网间的链路质量数据;存储链路质量数据,基于链路质量矩阵显示链路质量数据。本发明不需要收集、分析网络设备的信息,只需要在每个互联网数据中心机房部署一个简单的监控服务,即可监控所有子网的链路质量情况,并且以链路矩阵的形式展示监控数据,能够直观的检测出链路状态。
如图6所示,为本发明公开的一种分布式数据中心链路监控***实施例2的结构示意图,所述***可以包括:
部署模块601,用于在每个互联网数据中心机房部署一台监控服务器;
当需要对分布式数据中心链路的质量进行监控时,首先在每个IDC(InternetDate Center,互联网数据中心)机房部署一台监控服务器。其中,所述的IDC机房,就是电信部门利用已有的互联网通信线路、带宽资源,建立标准化的电信专业级机房环境,为企业、政府提供服务器托管、租用以及相关增值等方面的全方位服务。
配置模块602,用于对于监控服务器所在机房的所有子网,从每个子网选取一个IP,将所有子网的IP配置在所述监控服务器的网卡上;
IP地址是以网路号和主机号来表示网络上的主机的,只有在一个网络号下的计算机之间才能“直接”互通,不同网络号的计算机要通过网关才能互通。但是这样的划分在某些情况下显得并不十分灵活,为此IP网络还允许划分成更小的网络,称为子网(Subnet)。
对于监控服务器所在机房的所有子网,从每个子网选取一个IP,将这些IP配置在监控服务器的网卡上。因此每台监控服务器都配置了所在IDC机房的所有不同子网的IP。监控服务器上的网卡配置举例如下:
eth10.subnet1:inet IP1netmask mask1broadcast broadcast1
eth10.subnet2:inet IP1netmask mask1broadcast broadcast2
eth10.subnet3:inet IP1netmask mask1broadcast broadcast3
eth10.subnet4:inet IP1netmask mask4broadcast broadcast4
读取单元603,用于读取每台监控服务器上记录的所有互联网数据中心机房的监控服务器IP集合;
然后,在每个监控服务器上定时执行监控服务程序,获取各IDC机房不同子网间的链路质量数据。具体的,首先读取每台监控服务器上记录的所有IDC机房的监控服务器IP集合。
命令运行单元604,用于在每台监控服务器上运行Ping命令,监控服务器上的所有IP依次Ping所有互联网数据中心机房监控服务器的IP,得到各个互联网数据中心机房不同子网间的链路质量数据;
然后读取本监控节点的IP,即读取本监控服务器上的所有IP,在监控服务器上运行Ping命令,依次使用本监控服务器上的所有IP Ping所有IDC机房的监控服务器IP,得到各个互联网数据中心机房不同子网间的链路质量数据。
具体的,为确保链路监控的实时性能,本发明期望将Ping命令的执行限制在一分钟以内,因此经过多次试验设定Ping命令执行时指定参数为:
ping–I source_ip-c 10-i 6-l 500destination_ip
其中-c 10表示发送10个包,-l 500表示每个包的大小为500字节,-i 6表示每6秒钟发一个包。
为实时监控链路情况,监控程序定时为两分钟执行一次,每次程序的执行时间控制在两分钟以内,其中一分钟用于执行Ping命令,一分钟用于数据的处理的存储。
存储模块605,用于存储链路质量数据;
当获取到各IDC机房不同子网间的链路质量数据后,进一步对获取到的链路质量数据进行存储,便于前端进行显示。
具体的,为显示不同时间粒度的监控数据,数据可以分三个粒度存储,分别为实时数据、每小时汇总数据、每天汇总数据。其中实时数据每两分钟更新一次;每小时汇总数据每两分钟一条数据,保留上个小时的所有数据;每天汇总数据一小时一条数据,保留近两周数据。其中每小时汇总和每天汇总数据是从实时数据中获取保存。
显示模块606,用于基于链路质量矩阵显示链路质量数据;
最后,如图3所示,通过链路质量矩阵,以矩阵的形式展示不同子网间的链路情况,可以由不同的颜色代表不同的链路质量。
进一步,如图4所示,可以进入链路质量矩阵中的每一个点显示链路情况的具体数值。其中,行和列为不同IDC机房所有子网的一个IP采用延时和丢包率曲线直观显示链路情况。
生成模块607,用于当链路质量数据的丢包率或网络延时大于告警阈值时,生成告警信息。
根据实际经验,当丢包率>10%或网络延时>5ms时,即可认为网络链路出现故障,本发明以此范围作为告警的阈值。当链路质量数据的丢包率或网络延时大于告警阈值时,生成告警信息,并将告警信息以邮件或短信等形式报警。
综上所述,传统的网络中心链路监控方法通常需要收集、分析网络设备上的日志或信息,配置、分析复杂,维护成本大。或者通过应用侧反应出网络故障,不能充分、及时定位故障。本发明不需要收集、分析网络设备的信息,直接监控链路侧的质量。只需要在每个IDC机房部署一个简单的监控服务,即可监控所有子网的链路质量情况,监控程序可以使用Python或shell脚本开发,开发周期短,基本不需要维护,通过选定合适的Ping命令参数可以在两分钟内完成链路质量数据的获取和处理,实现实时监控的目的,并且以链路矩阵的形式展示监控数据,可以帮助网络工程师直观的检测链路状态。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种分布式数据中心链路监控方法,其特征在于,包括:
在每个互联网数据中心机房部署一台监控服务器;
对于监控服务器所在机房的所有子网,从每个子网选取一个IP,将所有子网的IP配置在所述监控服务器的网卡上;
基于所述监控服务器获取各个互联网数据中心机房不同子网间的链路质量数据;
存储所述链路质量数据;
基于链路质量矩阵显示所述链路质量数据。
2.根据权利要求1所述的方法,其特征在于,所述基于所述监控服务器获取各个互联网数据中心机房不同子网间的链路质量数据包括:
读取每台监控服务器上记录的所有互联网数据中心机房的监控服务器IP集合;
在每台监控服务器上运行Ping命令,监控服务器上的所有IP依次Ping所有互联网数据中心机房监控服务器的IP,得到各个互联网数据中心机房不同子网间的链路质量数据。
3.根据权利要求2所述的方法,其特征在于,所述Ping命令执行时指定参数为:
发送10个包,每个包的大小为500字节,每6秒钟发一个包。
4.根据权利要求1所述的方法,其特征在于,所述存储所述链路质量数据包括:
实时存储所述链路质量数据;
每小时汇总所述链路质量数据;
每天汇总所述链路质量数据。
5.根据权利要求1所述的方法,其特征在于,还包括:
当所述链路质量数据的丢包率或网络延时大于告警阈值时,生成告警信息。
6.一种分布式数据中心链路监控***,其特征在于,包括:
部署模块,用于在每个互联网数据中心机房部署一台监控服务器;
配置模块,用于对于监控服务器所在机房的所有子网,从每个子网选取一个IP,将所有子网的IP配置在所述监控服务器的网卡上;
处理模块,用于基于所述监控服务器获取各个互联网数据中心机房不同子网间的链路质量数据;
存储模块,用于存储所述链路质量数据;
显示模块,用于基于链路质量矩阵显示所述链路质量数据。
7.根据权利要求6所述的***,其特征在于,所述处理模块包括:
读取单元,用于读取每台监控服务器上记录的所有互联网数据中心机房的监控服务器IP集合;
命令运行单元,用于在每台监控服务器上运行Ping命令,监控服务器上的所有IP依次Ping所有互联网数据中心机房监控服务器的IP,得到各个互联网数据中心机房不同子网间的链路质量数据。
8.根据权利要求7所述的***,其特征在于,所述Ping命令执行时指定参数为:
发送10个包,每个包的大小为500字节,每6秒钟发一个包。
9.根据权利要求1所述的***,其特征在于,所述存储模块在执行存储所述链路质量数据时,具体用于:
实时存储所述链路质量数据;
每小时汇总所述链路质量数据;
每天汇总所述链路质量数据。
10.根据权利要求1所述的***,其特征在于,还包括:
生成模块,用于当所述链路质量数据的丢包率或网络延时大于告警阈值时,生成告警信息。
CN201910287217.8A 2019-04-10 2019-04-10 一种分布式数据中心链路监控方法及*** Active CN109981377B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910287217.8A CN109981377B (zh) 2019-04-10 2019-04-10 一种分布式数据中心链路监控方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910287217.8A CN109981377B (zh) 2019-04-10 2019-04-10 一种分布式数据中心链路监控方法及***

Publications (2)

Publication Number Publication Date
CN109981377A true CN109981377A (zh) 2019-07-05
CN109981377B CN109981377B (zh) 2022-03-01

Family

ID=67084034

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910287217.8A Active CN109981377B (zh) 2019-04-10 2019-04-10 一种分布式数据中心链路监控方法及***

Country Status (1)

Country Link
CN (1) CN109981377B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112367212A (zh) * 2020-08-03 2021-02-12 浪潮云信息技术股份公司 云环境下虚拟机网络质量监控方法及监控***
CN113395356A (zh) * 2021-07-06 2021-09-14 山东电力工程咨询院有限公司 一种数据中心的健康监控方法及***
CN113572644A (zh) * 2021-07-26 2021-10-29 武汉众邦银行股份有限公司 一种互联网云拨测自动化监控方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001035601A1 (en) * 1999-11-10 2001-05-17 Rainfinity, Inc. Distributed traffic controlling system and method for network data
CN101883409A (zh) * 2010-06-18 2010-11-10 西安电子科技大学 无线传感器网络中基于rssi和lqi的快速切换方法
CN102546251A (zh) * 2011-12-31 2012-07-04 清华大学 基于混合探测技术的网络拓扑发现和自动布局方法及***
CN104270291A (zh) * 2014-10-22 2015-01-07 网宿科技股份有限公司 Cdn网络质量监控方法
CN104683182A (zh) * 2015-02-15 2015-06-03 上海帝联信息科技股份有限公司 Idc机房网络服务质量检测方法及装置
CN107070726A (zh) * 2017-05-22 2017-08-18 郑州云海信息技术有限公司 一种基于mdc的综合管理方法
US9992121B1 (en) * 2017-03-20 2018-06-05 Engine Media, Llc Dynamic advertisement routing

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001035601A1 (en) * 1999-11-10 2001-05-17 Rainfinity, Inc. Distributed traffic controlling system and method for network data
CN101883409A (zh) * 2010-06-18 2010-11-10 西安电子科技大学 无线传感器网络中基于rssi和lqi的快速切换方法
CN102546251A (zh) * 2011-12-31 2012-07-04 清华大学 基于混合探测技术的网络拓扑发现和自动布局方法及***
CN104270291A (zh) * 2014-10-22 2015-01-07 网宿科技股份有限公司 Cdn网络质量监控方法
CN104683182A (zh) * 2015-02-15 2015-06-03 上海帝联信息科技股份有限公司 Idc机房网络服务质量检测方法及装置
US9992121B1 (en) * 2017-03-20 2018-06-05 Engine Media, Llc Dynamic advertisement routing
CN107070726A (zh) * 2017-05-22 2017-08-18 郑州云海信息技术有限公司 一种基于mdc的综合管理方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112367212A (zh) * 2020-08-03 2021-02-12 浪潮云信息技术股份公司 云环境下虚拟机网络质量监控方法及监控***
CN112367212B (zh) * 2020-08-03 2022-04-05 浪潮云信息技术股份公司 云环境下虚拟机网络质量监控方法及监控***
CN113395356A (zh) * 2021-07-06 2021-09-14 山东电力工程咨询院有限公司 一种数据中心的健康监控方法及***
CN113395356B (zh) * 2021-07-06 2023-04-28 山东电力工程咨询院有限公司 一种数据中心的健康监控方法及***
CN113572644A (zh) * 2021-07-26 2021-10-29 武汉众邦银行股份有限公司 一种互联网云拨测自动化监控方法及装置
CN113572644B (zh) * 2021-07-26 2024-01-23 武汉众邦银行股份有限公司 一种互联网云拨测自动化监控方法及装置

Also Published As

Publication number Publication date
CN109981377B (zh) 2022-03-01

Similar Documents

Publication Publication Date Title
US20230291674A1 (en) Network health data aggregation service
US9311160B2 (en) Elastic cloud networking
US10862777B2 (en) Visualization of network health information
CN101582807B (zh) 一种基于北向接口实现网络管理的方法及***
US10243820B2 (en) Filtering network health information based on customer impact
Shaikh et al. OSPF Monitoring: Architecture, Design, and Deployment Experience.
US10911263B2 (en) Programmatic interfaces for network health information
US20030225876A1 (en) Method and apparatus for graphically depicting network performance and connectivity
US8533279B2 (en) Method and system for reconstructing transactions in a communication network
CN109981377A (zh) 一种分布式数据中心链路监控方法及***
JP2008519327A (ja) ネットワーク管理アプライアンス
JP2007208633A (ja) ネットワーク設計装置、ネットワーク設計方法およびネットワーク設計プログラム
US11652703B2 (en) Dynamic processing distribution for utility communication networks
CN112333020B (zh) 一种基于五元组的网络安全监测及数据报文解析***
CN114553672B (zh) 一种应用***性能瓶颈确定方法、装置、设备、介质
Rathore et al. Maintaining SmartX multi‐view visibility for OF@ TEIN+ distributed cloud‐native edge boxes
Levin et al. Network Monitoring in Federated Cloud Environment
CN104967539B (zh) 一种无线mesh网络管理信息数据的获取方法
CN107231256A (zh) 一种基于smi‑s协议的多设备管理方法及***
CN109274571B (zh) 一种追溯虚拟局域组网中设备的方法、装置以及设备
CN106254126A (zh) 一种基于daemon模式的管理网络***
EP2033112B1 (en) Improved network management
Phuphong et al. The Design of Voice Over IP Monitoring System
Chothia et al. Grok the data center
CN118075160A (zh) 网络链路质量的确定方法、***及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant