CN115378853A - 一种网络监控方法、装置和设备 - Google Patents

一种网络监控方法、装置和设备 Download PDF

Info

Publication number
CN115378853A
CN115378853A CN202211011028.6A CN202211011028A CN115378853A CN 115378853 A CN115378853 A CN 115378853A CN 202211011028 A CN202211011028 A CN 202211011028A CN 115378853 A CN115378853 A CN 115378853A
Authority
CN
China
Prior art keywords
target
network
vpc
containers
vpcs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211011028.6A
Other languages
English (en)
Other versions
CN115378853B (zh
Inventor
姚劲松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202211011028.6A priority Critical patent/CN115378853B/zh
Publication of CN115378853A publication Critical patent/CN115378853A/zh
Application granted granted Critical
Publication of CN115378853B publication Critical patent/CN115378853B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/12Network monitoring probes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0811Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0852Delays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/02Network architectures or network communication protocols for network security for separating internal from external traffic, e.g. firewalls
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本说明书实施例公开了一种网络监控方法、装置和设备,网络监控方法基于目标网络的网络拓扑结构,从所述目标网络的容器中选取多个目标容器,其中,所述目标网络中包含多个虚拟私有云VPC,一个VPC内包含至少一个容器,所述多个VPC内部署有多个探针机器,一个VPC内至少部署一个探针机器,且一个VPC内至少选取一个目标容器;将所述多个探针机器作为多个探测源分别向所述多个目标容器发送探测信息,以获得所述多个探测源与所述多个目标容器间的预设监控指标数据;基于所述多个探测源与所述多个目标容器间的预设监控指标数据,以及所述多个探测源和所述多个目标容器的网络层级结构描述信息,确定所述目标网络的运行状况。

Description

一种网络监控方法、装置和设备
技术领域
本文件涉及计算机技术领域,尤其涉及一种网络监控方法、装置和设备。
背景技术
为了保证网络的安全,相对于公有云,云服务商还提供虚拟私有云(VirtualPrivate Cloud,VPC)服务。VPC允许客户在虚拟网络环境中逻辑地隔离云资源。VPC基础架构由公共云服务商管理,但是分配给VPC的资源不会与任何其他客户共享。
然而,通过VPC对云资源进行隔离虽然保障了网络的安全,但也为云服务商对云网络的管理带来了挑战,例如,如何监控云网络的运行状况,如VPC间的连通状态,目前缺乏有效的手段。
发明内容
本说明书实施例提供了一种网络监控方法、装置和设备,以对目标网络的运行状况进行有效的监控。
为解决上述技术问题,本说明书实施例是这样实现的:
第一方面,提出了一种网络监控方法,包括:
基于目标网络的网络拓扑结构,从所述目标网络的容器中选取多个目标容器,其中,所述目标网络中包含多个虚拟私有云VPC,一个VPC内包含至少一个容器,所述多个VPC内部署有多个探针机器,一个VPC内至少部署一个探针机器,且一个VPC内至少选取一个目标容器;
将所述多个探针机器作为多个探测源分别向所述多个目标容器发送探测信息,以获得所述多个探测源与所述多个目标容器间的预设监控指标数据,其中,所述预设监控指标包括连通性指标和时延中的至少一种;
基于所述多个探测源与所述多个目标容器间的预设监控指标数据,以及所述多个探测源和所述多个目标容器的网络层级结构描述信息,确定所述目标网络的运行状况,其中,所述运行状况包括VPC间的连通状态。
第二方面,提出了一种网络监控装置,包括:
第一确定模块,基于目标网络的网络拓扑结构,从所述目标网络的容器中选取多个目标容器,其中,所述目标网络中包含多个虚拟私有云VPC,一个VPC内包含至少一个容器,所述多个VPC内部署有多个探针机器,一个VPC内至少部署一个探针机器,且一个VPC内至少选取一个目标容器;
探测模块,将所述多个探针机器作为多个探测源分别向所述多个目标容器发送探测信息,以获得所述多个探测源与所述多个目标容器间的预设监控指标数据,其中,所述预设监控指标包括连通性指标和时延中的至少一种;
第二确定模块,基于所述多个探测源与所述多个目标容器间的预设监控指标数据,以及所述多个探测源和所述多个目标容器的网络层级结构描述信息,确定所述目标网络的运行状况,其中,所述运行状况包括VPC间的连通状态。
第三方面,提出了一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
基于目标网络的网络拓扑结构,从所述目标网络的容器中选取多个目标容器,其中,所述目标网络中包含多个虚拟私有云VPC,一个VPC内包含至少一个容器,所述多个VPC内部署有多个探针机器,一个VPC内至少部署一个探针机器,且一个VPC内至少选取一个目标容器;
将所述多个探针机器作为多个探测源分别向所述多个目标容器发送探测信息,以获得所述多个探测源与所述多个目标容器间的预设监控指标数据,其中,所述预设监控指标包括连通性指标和时延中的至少一种;
基于所述多个探测源与所述多个目标容器间的预设监控指标数据,以及所述多个探测源和所述多个目标容器的网络层级结构描述信息,确定所述目标网络的运行状况,其中,所述运行状况包括VPC间的连通状态。
第四方面,提出了一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
基于目标网络的网络拓扑结构,从所述目标网络的容器中选取多个目标容器,其中,所述目标网络中包含多个虚拟私有云VPC,一个VPC内包含至少一个容器,所述多个VPC内部署有多个探针机器,一个VPC内至少部署一个探针机器,且一个VPC内至少选取一个目标容器;
将所述多个探针机器作为多个探测源分别向所述多个目标容器发送探测信息,以获得所述多个探测源与所述多个目标容器间的预设监控指标数据,其中,所述预设监控指标包括连通性指标和时延中的至少一种;
基于所述多个探测源与所述多个目标容器间的预设监控指标数据,以及所述多个探测源和所述多个目标容器的网络层级结构描述信息,确定所述目标网络的运行状况,其中,所述运行状况包括VPC间的连通状态。
本说明书实施例提供的以上至少一个技术方案,通过将部署在目标网络中各VPC内的多个探针机器作为多个探测源,可以探测得到这多个探测源和所述多个VPC内的多个目标容器之间的包括连通性指标和时延中的至少一种的预设监控指标数据,由于归属于不同维度的探测源和目标容器之间的连通性能够反应不同维度的连通状态,因此,基于探测得到的所述多个探测源与所述多个目标容器间的预设监控指标数据,以及所述多个探测源和所述多个目标容器的网络层级结构描述信息,可以确定出目标网络在不同维度的运行状况,例如可以确定出目标网络中VPC维度(VPC间)的连通状态,从而实现目标云网络的有效监控。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1是本说明书一实施例提供的一种网络监控方法的流程图。
图2是本说明书一实施例提供的一种网络架构示意图。
图3是本说明书一实施例提供的一种网络中的节点层级结构示意图。
图4是本说明书一实施例提供的一种探针机器的配置和数据采集流向示意图。
图5是本说明书一实施例提供的一种探针机器与主站的通信方式示意图。
图6是本说明书一实施例提供的探测源到目标容器的连接示意图。
图7是本说明书一实施例提供的一种监控指标配置页面示意图。
图8是本说明书一实施例提供的一种全局视角配置页面示意图。
图9是本说明书一实施例提供的一种预设全局视角的预设监控指标统计结果展示页面示意图。
图10是本说明书一实施例提供的一种指定维度的源到所述指定维度的目标在预设时长内新增的连接不通的云服务器明细的展示页面示意图。
图11是本说明书一个实施例提供的一种电子设备的结构示意图。
图12是本说明书一实施例提供的一种网络监控装置的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本文件保护的范围。
为了对云网络中VPC间的连通状态进行有效的监控,以及时发现云网络中出现的连通性故障,本说明书实施例提供一种网络监控方法和装置,该方法和装置可以由电子设备执行,或者由安装在电子设备中的软件或硬件设备执行。这里的电子设备包括但不限于终端设备和服务器,所述终端设备包括但不限于:智能手机、个人电脑(personalcomputer,PC)、笔记本电脑、平板电脑、电子阅读器、网络电视、可穿戴设备等智能终端设备中的任一种,所述服务器包括但不限于:单台服务器、多台服务器、服务器集群以及云服务器中的任一种。
作为一个示例,本说明书实施例提供一种网络监控方法中的部分步骤或全部步骤可由目标网络中独立于租户VPC的监控计算平台执行,还有一些附加的步骤可由独立于租户VPC的采集配置平台执行,其中,监控计算平台和采集配置平台可以是同一平台,也可以是不同平台。
下面先对本说明书实施例提供的一种网络监控方法进行说明。
如图1所示,本说明书的一个实施例提供了一种网络监控方法,可以包括:
步骤102、基于目标网络的网络拓扑结构,从所述目标网络的容器中选取多个目标容器,其中,所述目标网络中包含多个虚拟私有云VPC,一个VPC内包含至少一个容器,所述多个VPC内部署有多个探针机器,一个VPC内至少部署一个探针机器,且一个VPC内至少选取一个目标容器。
VPC(Virtual Private Cloud,虚拟私有云)是为特定使用而构建的隔离云网络,它允许租户在虚拟网络环境中逻辑地隔离云资源。所有函数都运行在函数计算拥有的VPC网络环境中。出于不同VPC间相互隔离的性质,函数计算在缺省VPC配置的情况下不能访问该VPC上的私有资源。
目标网络可以是给租户提供云服务的任何云网络。目标网络可以有若干个租户,一个租户在目标网络中可拥有一个或多个VPC。例如,如图2所示,目标网络可以有租户1、租户2和租户3三个租户,其中,租户1在目标网络中拥有VPC1、VPC2和VPC3,租户2在目标网络中拥有VPC4、VPC5和VPC6,租户3在目标网络中拥有VPC7、VPC8和VPC9。
进一步的,如图2所示,可预先分别在各VPC内部署至少一个探针机器,从而至少实现不同租户或同一租户的不同VPC间连通性的探测。
下面对探针机器的部署进行详细说明。
可选的,在步骤102前,本说明书实施例提供的一种网络监控方法,还可以包括:确定所述目标网络的网络拓扑结构;基于所述网络拓扑结构,在所述多个VPC内部署所述多个探针机器。
其中,所述确定所述目标网络的网络拓扑结构,可包括:获取所述目标网络中节点的节点元数据,其中,所述节点为POD,一个POD包含至少一个容器(container),所述节点元数据中包含所述节点的网络层级结构描述信息;基于所述目标网络中节点的网络层级结构描述信息,构建所述目标网络的网络拓扑结构。
其中,获取所述目标网络中节点的节点元数据的方式可以有很多种,下面介绍三种。
第一种,可对所述目标网络中的节点进行监听,以获取所述目标网络中节点的节点元数据。例如,当目标网络为依托于K8S(Kubernetes)集群时,可通过监听K8S节点获取节点元数据。
第二种,可从所述目标网络的预设API接口拉取所述目标网络中节点的节点元数据。
第三种,可从所述目标网络对应的数据库中读取所述目标网络中节点的节点元数据。
其中,基于所述目标网络中节点的网络层级结构描述信息,构建所述目标网络的网络拓扑结构,可包括:基于所述目标网络中节点的网络层级结构描述信息,确定出目标网络中各层级节点的层结构及连接关系,从而依据各层级节点的层结构及连接关系构建所述目标网络的网络拓扑结构。
以目标网络为依托于K8S(Kubernetes)集群为例,目标网络中的节点可以是K8S集群中的工作节点,即POD。K8S也被称为Kube,K8S是谷歌推出的业界最受欢迎的容器编排器。在K8S集群中,POD是所有业务类型的基础,也是K8S管理的最小单位级,是一个或多个容器的组。
一般而言,目标网络中节点的网络层级结构描述信息可以包括但不限于节点内的容器信息、节点本身(POD)的信息、节点所属云服务器和/或物理机信息、节点所属的VPC信息、节点所属的可用区AZ信息、节点所属的租户信息以及节点所属的地区信息等。图3示出了目标网络中节点的层级结构,参考图3可以对这些网络层级结构描述信息有更加直观地了解。
在图3中,目标网络中的节点即POD,其下一层级是容器,其上的层级按递增的顺序依次可以是:云服务器(Elastic Compute Service,ECS)或物理机、ASW、PSW、DSW、MC、XGW/CGW、CSW、CSR、BSR以及地区(region)。
ASW是指接入层(Access Switch),用于直接连接安装了各类应用的服务器(如ECS),把服务器接入到网络里来。
PSW是指汇聚层(POD Switch),用于把一组(偶数个)接入层交换机汇总起来,一组PSW和它下挂的所有ASW组成一个POD。
DSW是指核心层(DCI Switch),其中,DCI是“Data Center Interconnection(数据中心互连)”的缩写,顾名思义,指的是数据中心之间互联的意思,PSW都会接入到DSW上,一组DSW以及它们下挂的所有PSW和ASW一起组成了整个集群。
CSW是指内网接入交换机,用于接入用户内网骨干,实现云网络内外部的路由分发交互,包括VPC专线接入。
MC是指主要核心层(maincore)。
XGW和CWG指网关。
NC是指物理机节点。
CSR是指核心服务路由器(Core Services Router)。
BSR是指远距离专线互联路由器,用于把各个城市的机房通过专线互联起来。
需要说明的是,图3中虽然没有体现出节点所属的VPC信息、节点所属的可用区AZ信息、节点所属的租户信息,但这些信息也是可以包含在节点元数据中的。
可以理解,有了目标网络中节点的网络层级结构描述信息以后,可以这些网络层级结构描述信息确定出目标网络中各层级节点的层结构及连接关系,从而依据各层级节点的层结构及连接关系构建所述目标网络的网络拓扑结构构建所述目标网络的网络拓扑结构。
其中,基于所述网络拓扑结构,在所述多个VPC内部署所述多个探针机器可包括:基于所述网络拓扑结构,确定所述多个VPC下属的云服务器;从所述多个VPC下属的云服务器中选取多个第一服务器,并在所述多个第一服务器中分别部署一个探针机器,其中,一个VPC内对应选取至少一个第一服务器。
可以理解,基于目标网络的网络拓扑结构,可以确定出所述多个VPC下属的(所述多个VPC内的)全部云服务器。之后可采用多种方式从这些云服务器中选取多个第一服务器以部署探针机器,保证一个VPC内对应选取至少一个第一服务器即可,一般是在一个可用区AZ下的一个VPC内部署一批探针机器(如图2所示),下面介绍三种。
在第一种实施方式中,可将所述多个VPC的下属的全部云服务器选为第一服务器。
可以想象,对于租户较多的目标网络来说,其所拥有的云服务器数量是非常庞大的,如果将各VPC下属的全部云服务器选为第一服务器部署探针机器,部署量将非常庞大,探测时采集到的数据量也会非常巨大,该方式虽然可以取得更全面的探测效果,但对计算和存储都会带来不小的压力,且会降低数据计算效率。
鉴于此,在第二种实施方式中,可以分别从所述多个VPC的下属云服务器中针对一个IP段选取一个云服务器作为第一服务器。即对于所述多个VPC中的各VPC,一个IP段对应选取一个云服务器作为第一服务器,如果一个VPC对应多个IP段的话,则分别对应选取多个云服务器作为第一服务器。不难理解,一个VPC内的云服务器对应的IP段数明显少于该VPC内的云服务器数量,因此,当以IP段为粒度选择第一服务器时,相比于以云服务器本身为粒度选择第一服务器,可明显减少所选取的第一服务器的数量,从而降低了探针机器的部署量,最终也会降低所采集的数据量,进而可以避免给计算和存储带来压力,提高数据计算效率。此外,针对VPC内的一个IP段选取一个第一服务器部署探针机器,并不会降低VPC间连通性的探测效果。
在第三种实施方式中,还可以分别从所述多个VPC的下属云服务器中随机选取第一数量个云服务器作为第一服务器,其中,一个VPC对应的第一数量小于该VPC内的云服务器总数量。这同样可以减少所选取的第一服务器的数量,从而降低了探针机器的部署量,最终降低所采集的数据量,进而可以避免给计算和存储带来压力,提高数据计算效率,并且,也不会降低VPC间连通性的探测效果,但是,可能无法保证一些IP段的连通性探测效果,因为不能保证所选取的云服务器涵盖了该VPC下的全部IP段。
下面对探针机器以及探针机器的配置和数据采集流向进行介绍。
由于VPC是私有云网络,不同VPC间是相互隔离的,这种隔离导致的探针机器的部署难度增加,所以在相关技术中,一般不建议采用部署探针机器的方式探测网络质量。但是,本申请实施例通过在VPC内部署一个中心化的采集代理巧妙地化解了这一困难,具体的,通过部署在VPC内的一个相对中心化的采集代理,可实现该VPC内的探针机器的部署以及探针机器探测到的数据的上报。部署在VPC内的第一服务器上的探针机器本身可以是一个容器。
在此基础上,上述在所述多个第一服务器中分别部署一个探针机器,可包括:在所述多个第一服务器所属的VPC中部署采集代理,其中,一个VPC中对应部署一个采集代理;通过所述VPC内的采集代理向该VPC内的所述第一服务器部署探针机器。进一步地,一个探针机器探测得到的预设监控指标数据,也可通过该探针机器所在VPC内的采集代理上报给目标网络的计算监控平台。
如图4所示,一个VPC对应的采集代理41可包括数据网关411、任务调度与执行412、元数据管理413和配置管理414等功能模块,其中,数据网关411用于向监控计算平台44上报探针机器探测到的数据(即下文中提到的预设监控指标数据);任务调度与执行412用于调用日志插件、HTTP插件等实现预设的任务,如调用HTTP插件向探针机器发送配置信息,以实现探针机器的部署;元数据管理模块413用于对探针机器的数据进行管理;配置管理模块414用于对探针机器的配置进行管理。
如图4所示,为了将探测目标网络的全局运行状况的配置下发到对应的采集代理,可以在目标网络的VPC外设置一个采集配置平台43,采集代理41通过注册中心42向采集配置平台43进行注册,采集配置平台43通过注册中心42向采集代理41推送相关配置,采集代理41收到相关配置后在VPC内转发至相应的探针机器。
如图4所示,采集代理41可通过其数据网关411将探针机器探测到的数据上报给监控计算平台44。
进一步的,由于采集代理部署在不同的VPC内,而不同的VPC间是相互隔离的,因此,配置的下发、采集代理的注册以及探针机器探测到的数据的上报都可通过网络专线(vip)来发送。如图5所示,部署在租户51的VPC内的采集代理通过网络专线向主站52中的注册中心(对应图4中的注册中心42)发送注册请求完成注册,主站52中的注册中心通过网络专线向部署在租户51的VPC内的采集代理发送配置信息,以及,部署在租户51的VPC内的采集代理通过网络专线向主站52中监控计算平台(对应图4中的监控计算平台44)上报探测到的数据。在图5中,主站52是相对于目标网络中租户的VPC而言的,它独立于目标网络中租户的VPC,主站52用于对目标网络进行管理。
在部署完探针机器后,可通过执行上述步骤102从所述目标网络的容器中选取多个目标容器。
示例性的,上述步骤102可包括:基于所述目标网络的网络拓扑结构,确定所述多个VPC下属的云服务器;从所述多个VPC下属的云服务器中选取多个第二服务器,其中,一个VPC内对应选取至少一个第二服务器;在所述第二服务器中选取至少一个容器作为目标容器。其中,基于所述目标网络的网络拓扑结构,确定所述多个VPC下属的云服务器的方式,与上文中部署探针机器时的确定方式一致,此处不再赘述。
其中,从所述多个VPC下属的云服务器中选取多个第二服务器方式也有很多种,下面介绍四种。
在第一种实施方式中,将所述多个VPC下属的全部云服务器选为第二服务器。同样可以想象,对于租户较多的目标网络来说,其所拥有的云服务器数量是非常庞大的,如果将各VPC下属的全部云服务器选为第二服务器,以从中选择待探测的目标容器,最终选取的目标容器数量也将非常庞大,探测时采集到的数据量也会非常巨大,该方式虽然可以取得更全面的探测效果,但对计算和存储都会带来不小的压力,且会降低数据计算效率。
在第二种实施方式中,可以将所述多个VPC下属的云服务器中除所述第一服务器外的云服务器选为第二服务器。第二种实施方式相对于第一种实施方式,可减少所选取的第二服务器的数量,从而可以减少最终选取的目标容器数量,最终降低所采集的数据量,进而可以避免给计算和存储带来压力,提高计算效率,并且,也不会降低VPC间连通性的探测效果。此外,将所述多个VPC下属的云服务器中除所述第一服务器外的云服务器选为第二服务器,还可以避免采集冗余数据,例如,当选取第二服务器同时也是部署有探针机器的第一服务器时,会存在探测源与目标容器(探测目标)位于同一云服务器上的情况,这种数据的采集很多时候是不必要的,因为对于容器级别连通性的检测很多时候是不必要的。
在第三种实施方式中,还可以分别从所述多个VPC下属的云服务器中选取第二数量的云服务器作为第二服务器,其中,一个VPC对应的第二数量小于该VPC内的云服务器总数量,所述第二服务器与所述第一服务器为不同的云服务器。这同样可以所选取的第二服务器的数量,从而可以减少最终选取的目标容器数量,最终降低所采集的数据量,进而可以避免给计算和存储带来压力,提高计算效率,并且,也不会降低VPC间连通性的探测效果,但是,可能无法保证一些云服务器间的连通性探测效果,因为一些云服务器上可能既没有探针机器有没有目标容器。
在第四种实施方式中,可以分别从所述多个VPC的下属云服务器中针对一个IP段选取一个云服务器作为第二服务器,其中,所述第二服务器与所述第一服务器为不同的云服务器。这同样可以所选取的第二服务器的数量,从而可以减少最终选取的目标容器数量,最终降低所采集的数据量,进而可以避免给计算和存储带来压力,提高计算效率,并且,也不会降低VPC间连通性的探测效果,但是,可能无法保证一些IP段的连通性探测效果,因为不能保证所选取的第二服务器涵盖了该VPC下的全部IP段。
进一步的,在选好第二服务器以后,可在所述第二服务器中随机选取一个容器作为目标容器。可以理解,一个第二服务器上选取一个容器而不是选多个容器作为目标容器,同样可以减少数据采集量,提升计算效率,最终提升整个网络的监控效率。
步骤104、将所述多个探针机器作为多个探测源分别向所述多个目标容器发送探测信息,以获得所述多个探测源与所述多个目标容器间的预设监控指标数据。
其中,所述预设监控指标可以包括但不限于连通性指标和时延中的至少一种。
在具体实现时,所述多个探针机器可通过Internet控制报文协议(InternetControl Message Protocol,ICMP)向所述多个目标容器发送探测信息,产生探测源到目标容器的预设监控指标数据,之后可以通过对这些数据进行分析,得出目标网络的运行状况,比如得出VPC间的连通状态。其中,连通状态可以包括但不限于连通和未连通(断开)中的一种。
可以理解,假设将n个探针机器作为多个探测源分别向m个目标容器发送探测信息,则可以探测得到n*m条预设监控指标数据。
在具体实现时,可通过一张大宽表描述探测源与目标容器间的预设监控指标数据,以及所述多个探测源和所述多个目标容器的网络层级结构描述信息。例如,该张大宽表中具体可以包括如下几方面的信息:
(1)探测源的网络层级结构描述信息,如:源IP(source_ip)、源VPC(source_vpc)、源租户(source_tenant)、源可用区(source_az)、源地区(soucrce_region)等;
(2)目标容器的网络层级结构描述信息,如:目标IP(target_ip)、目标VPC(target_vpc)、目标租户(target_tenant)、目标机房(target_idc)和目标地区(target_region)等,其中,目标IP可以包括目标云服务器IP(target_ecs_ip)、目标物理机IP(target_nc_ip)和目标IP段(target_nc_ip_段)等。
(3)预设监控指标信息,如:总数(total)、连通失败(fail)、连通成功(success)、平均时延(latency_avg)、成功率(rate)、连通机器数(alive)、无法连通机器数(dead),等等。
其中,预设监控指标是可配置的。图7示出了预设监控指标(监控项)的配置页面示意图。如图7所示,可通过新建指标分组来配置预设监控指标。
步骤106、基于所述多个探测源与所述多个目标容器间的预设监控指标数据,以及所述多个探测源和所述多个目标容器的网络层级结构描述信息,确定所述目标网络的运行状况。
其中,所述运行状况不仅可以包括VPC间的连通状态,还可以包括云服务器、接入层ASW、汇聚层PSW、核心层DSW、IP段、可用区AZ、机房以及地区等维度中至少一个维度的连通状态等指标。
如图6所示,步骤104中的探测源和目标容器可分为下述两种情况:
第一种,探测源和目标容器位于同一VPC内。可以理解,对于该种情况,探测得到的预设监控指标数据可以用来确定同一VPC内的网络连通状态,如不同云服务器间的连通状态,或者不同IP段间的连通状态。
第二种,探测源和目标容器位于不同VPC内,即探测源和目标容器是跨VPC的。可以理解,对于该种情况,探测得到的预设监控指标数据可以用来确定不同VPC间的连通状态。
此外,由于探测源或目标容器还隶属于可用区AZ、机房和地区等维度,所以通过对探测源到目标容器的预设监控指标数据进行分析,得出这些维度的连通状态。
具体的,在上述步骤106中,可先基于所述多个探测源和所述多个目标容器的网络层级结构描述信息,确定预设监控维度;然后从所述预设监控维度对所述多个探测源与所述多个目标容器间的预设监控指标数据进行汇聚,得到所述预设监控维度的预设监控指标汇聚数据;基于所述预设监控维度的预设监控指标汇聚数据,确定所述目标网络在所述预设监控维度的连通状态。
其中,所述预设监控维度可以包括但不限于云服务器、VPC、接入层ASW、汇聚层PSW、核心层DSW、IP段、可用区AZ、机房以及地区中的至少一种。不难看出,除了VPC间,由于本说明书实施例提供的一种网络监控方法,可以确定目标网络在接入层ASW、汇聚层PSW、核心层DSW、IP段、可用区AZ、机房以及地区等维度的连通状态,因此,还可以确定DPA(DSW/PSW/ASW)级、机房级或地区(如城市)级等级别的网络故障。
可以理解,对步骤104中采集得到的所述多个探测源与所述多个目标容器间的预设监控指标数据按预设监控维度进行汇聚,可以满足不同视角的数据需求,以适配目标网络的运维架构体系。并且,对于这样大规模的数据体系,可以通过统一的监控计算平台来分析,也即上述步骤106的执行主体可以是监控计算平台。
在该监控计算平台中,可以使用统一的监控数据标准、插件化的数据采集接入、通用的数据服务API服务来支持不同的监控数据获取方式;可以建立一套健全的数据质量体系、高可用计算集群来保障监控数据质量;还可以通过类似SQL任务定义、自定义计算任务、插件化来提供丰富、开放的数据分析能力,来满足技术风险业务领域下各种复杂数据分析的需求。
可选的,在具体实现时,可通过明细表的形式对步骤104中获得的所述多个探测源与所述多个目标容器间的预设监控指标数据进行汇聚,从而生成不同维度的汇聚数据,最后可通过汇聚后的预设监控指标数据确定目标网络的运行状况,如确定网络的连通状态和时延。
在此基础上,可选的,图1所示的方法还可以包括:展示所述目标网络在所述预设监控维度的预设监控指标汇聚数据。具体的,可以以列表的形式展示所述目标网络在所述预设监控维度的预设监控指标汇聚数据。通过展示,可以使运维人员快速、直观地了解目标网络在各监控维度的运行状况。
图7还示出了上述列表的一种样式。如图7所示,在该列表中,可以从云服务器(sever)、VPC、可用区(AZ)、机房(IDC)以及地区(region)等监控维度展示预设监控指标汇聚数据,且各监控维度下,可以列出列值分组和最终指标。例如,如图7所示,在云服务器(sever)这一监控维度,最终指标(监控指标)可以包括平均耗时、存活和宕机等;在VPC这一监控维度,最终指标可以包括机器数(云服务器数)、连通成功(success)、连通失败(fail)、连通总数(total)和平均时延(latency_avg)等,对于列表中展示不下的部分可以折叠,运维人员可通过点击“展开”选项查看;在可用区(AZ)这一监控维度,最终指标可以包括连通率、平均时延、连通、不连通和机器数;在机房(IDC)这一监控维度,最终指标可以包括连通率、平均时延、连通和不连通;在地区(region)这一监控维度,最终指标可以包括连通率、平均时延、连通和不连通。在图7中,列值分组中包含探测源和目标容器的相关分组信息,分组的目的是为了进行数据汇聚。
可选的,所述列表是可配置和/或可操作的。例如,如图7所示,在该列表的最后一列列出了“编辑”、“预览”和“高级”三个操作选项,这三个操作选项用于对该监控维度下的预设监控指标汇聚数据进行操作。
可选的,如图7所示,所述列表中还可以针对各监控维度设置是否支持告警的选项,供运维人员设置是否支持告警、告警条件以及告警方式等。
可选的,如图7所示,所述列表中还可以针对各监控维度设置监控周期的选项,供运维人员设置监控周期和告警周期中的一种。
在此基础上,可选的,图1所示的方法还可以包括:在基于所述预设监控维度的预设监控指标汇聚数据确定所述目标网络存在所述预设监控维度的连通性故障的情况下,以预设方式对所述预设监控维度的连通性故障进行告警。其中,所述预设方式可包括发送邮件、发送短信等。通过告警,可以使运维人员第一时间了解到目标网络所出现的故障,从而及时对网络故障做出及时修复。
有了上述列表以后,通过查看不同监控维度的源和目标之间的连通性,可以确定云服务器间故障、VPC间故障、DPA级故障、机房级故障和地区级故障中的一种或多种。具体来说,通过查看VPC维度的连通性可确定VPC间故障,通过查看物理机(NC)网段维度的连通性可确定DPA级故障,通过查看AZ维度的连通性可确定机房级故障,通过查看地区维度的连通性可确定城市级故障,等等。
可选的,所述列表是可操作的,且所述列表中包含网络诊断工具(如MTR(mytraceroute))的触发标识(如触发选项),所述网络诊断工具用于检测IP对的连通性,图1所示的方法还包括:响应于针对所述列表中的目标IP对对应的所述触发标识的操作,触发所述网络诊断工具对所述目标IP对的连通性进行检测。如此一来,可以进一步的确定出IP级故障。
此外,对于目标网络,运维人员常常想获得全局视角下的运行状况,以对目标网络的全局稳定性有所掌握。鉴于此,可选的,图1所示的方法还可以包括:从预设全局视角对所述多个探测源与所述多个目标容器间的预设监控指标数据进行统计,得到所述预设全局视角的预设监控指标统计结果,并展示所述预设全局视角的预设监控指标统计结果。
其中,预设全局视角是能够反映所述目标网络全局运行状况的视角。例如,全局视角包可以包括但不限于下述视角中的一种或多种:
(1)指定维度的源到所述指定维度的目标的平均时延;
(2)指定维度的源到所述指定维度的目标在预设时长内新增的连接不通的云服务器数量;
(3)指定维度的源到所述指定维度的目标在预设时长内新增的连接不通的云服务器明细。
其中,所述指定维度是基于所述多个探测源和所述多个目标容器的网络层级结构描述信息确定的,所述指定维度可包括但不限于下述维度中的一种:云服务器、VPC、接入层ASW、汇聚层PSW、核心层DSW、IP段、可用区AZ、机房以及地区中的至少一种;预设时长可以自定义,且针对同一指定维度,可以设置一个或多个预设时长,例如可以设置最后60分钟和最后120分钟两个预设时长。
其中,所述预设全局视角、所述指定维度的源和所述指定维度的目标是可配置的。图8示出了全局视角配置页面示意图。通过图8所示的配置页面可进行预设全局视角的配置。具体如图8所示,可从VPC这一维度配置一全局视角,其数据源可来自上一步的汇聚数据。
图9示出了一种预设全局视角的预设监控指标统计结果展示页面示意图。如图9所示,在该页面中,可以进一步的通过附图标记91所示虚线框中的文本框配置指定维度的源和所述指定维度的目标,以选择不同的源节点和目标节点,进行组合筛选以展示不同维度对应的全局视角下的预设监控指标统计结果。
进一步的,如图9中附图标记92所指,可以在该页面中展示“目标IDC+AZ”这一维度在最近60分钟内(last 60minutes)的平均耗时(平均时延);如图9中附图标记93所指,可以在该页面中展示“目标IDC+AZ”这一维度在最近120分钟内(last 120minutes)的平均耗时(平均时延);如图9中附图标记94所指,可以在该页面中展示“目标IDC+AZ”这一维度在最近5分钟内(last 5minutes)的新增的连不通的机器数(云服务器数);如图9中附图标记95所指,可以在该页面中展示“目标IDC+AZ”这一维度在最近120分钟内(last120minutes)的新增的连不通的机器数(云服务器数);以及,如图9中附图标记96所指,可以在该页面中展示“目标IDC+AZ”这一维度在最近5分钟内(last 5minutes)的新增的连不通的机器(云服务器)明细,等等。
具体的,对于“目标IDC+AZ”这一维度在最近5分钟内(last 5minutes)的新增的连不通的机器(云服务器)明细,可参考10。如图10所示,在该明细表中可以展示下述信息:源AZ、源机房、源IP、源地区、源租户、源VPCID、目标AZ、目标机房、目标IP、目标物理机以及目标地区等明细。并且,还可以对连接不通的IP对,使用MTR进一步检测其连通性。
可选的,对于计算监控平台计算得出的数据(如预设监控维度的预设监控指标汇聚数据、预设全局视角下的预设监控指标统计结果以及预设维度的故障数据等),会被实时存储到指定数据库(如申请人自研的高性能低成本时序数据库)中,该指定数据库的异步写入架构支撑海量数据的写入,且提供实时数据查询和PQL/SQL能力的查询,并对历史数据进行自动降进度永久保存,以及故障数据按需永久保存。此外,该指定数据库还具备如下能力:
(1)提供了更强的查询能力,包括后计算能力,以及prometheus协议支持;
(2)支持业务含义上的压缩,能够提供更高的压缩比;
(3)内置内存时序数据库(MTSDB),对于最近的热数据提供更加高效的查询。
本说明书实施例提供的一种网络监控方法,通过将部署在目标网络中各VPC内的多个探针机器作为多个探测源,可以探测得到这多个探测源和所述多个VPC内的多个目标容器之间的包括连通性指标和时延中的至少一种的预设监控指标数据,由于归属于不同维度的探测源和目标容器之间的连通性能够反应不同维度的连通状态,因此,基于探测得到的所述多个探测源与所述多个目标容器间的预设监控指标数据,以及所述多个探测源和所述多个目标容器的网络层级结构描述信息,可以确定出目标网络在不同维度的运行状况,例如可以确定出目标网络中VPC维度(VPC间)的连通状态,从而实现目标云网络的有效监控。
除VPC维度(VPC间)的连通状态之外,由于本说明书实施例提供的一种网络监控方法,还可以基于多个探测源和所述多个VPC内的多个目标容器之间的预设监控指标数据确定出目标网络在接入层ASW、汇聚层PSW、核心层DSW、IP段、可用区AZ、机房以及地区等维度的连通状态,从而确定出DPA(DSW/PSW/ASW)级、机房级或地区(如城市)级等级别的网络故障。
总之,本本说明书实施例提供的一种网络监控方法,能够对目标网络全局进行有效的监控,能够发现各种级别的连通性故障。
以上对本说明书提供的方法进行了说明,下面对本说明书提供的电子设备进行介绍。
图11是本说明书的一个实施例提供的电子设备的结构示意图。请参考图11,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图11中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成网络监控装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
基于目标网络的网络拓扑结构,从所述目标网络的容器中选取多个目标容器,其中,所述目标网络中包含多个虚拟私有云VPC,一个VPC内包含至少一个容器,所述多个VPC内部署有多个探针机器,一个VPC内至少部署一个探针机器,且一个VPC内至少选取一个目标容器;
将所述多个探针机器作为多个探测源分别向所述多个目标容器发送探测信息,以获得所述多个探测源与所述多个目标容器间的预设监控指标数据,其中,所述预设监控指标包括连通性指标和时延中的至少一种;
基于所述多个探测源与所述多个目标容器间的预设监控指标数据,以及所述多个探测源和所述多个目标容器的网络层级结构描述信息,确定所述目标网络的运行状况,其中,所述运行状况包括VPC间的连通状态,其中,所述运行状况包括VPC间的连通状态。
上述如本说明书图1所示实施例揭示的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书一个或多个实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书一个或多个实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备还可执行图1所示的实施例提供的方法,本说明书在此不再赘述。
当然,除了软件实现方式之外,本说明书的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
本说明书实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图1所示实施例的方法,并具体用于执行以下操作:
基于目标网络的网络拓扑结构,从所述目标网络的容器中选取多个目标容器,其中,所述目标网络中包含多个虚拟私有云VPC,一个VPC内包含至少一个容器,所述多个VPC内部署有多个探针机器,一个VPC内至少部署一个探针机器,且一个VPC内至少选取一个目标容器;
将所述多个探针机器作为多个探测源分别向所述多个目标容器发送探测信息,以获得所述多个探测源与所述多个目标容器间的预设监控指标数据,其中,所述预设监控指标包括连通性指标和时延中的至少一种;
基于所述多个探测源与所述多个目标容器间的预设监控指标数据,以及所述多个探测源和所述多个目标容器的网络层级结构描述信息,确定所述目标网络的运行状况,其中,所述运行状况包括VPC间的连通状态。
如图12所示,本说明书的一个实施例提供了一种网络监控装置1200,在一种软件实施方式中,装置1200可包括:第一确定模块1201、探测模块1202和第二确定模块1203。
第一确定模块1201,基于目标网络的网络拓扑结构,从所述目标网络的容器中选取多个目标容器,其中,所述目标网络中包含多个虚拟私有云VPC,一个VPC内包含至少一个容器,所述多个VPC内部署有多个探针机器,一个VPC内至少部署一个探针机器,且一个VPC内至少选取一个目标容器。
探测模块1202,将所述多个探针机器作为多个探测源分别向所述多个目标容器发送探测信息,以获得所述多个探测源与所述多个目标容器间的预设监控指标数据,其中,所述预设监控指标包括连通性指标和时延中的至少一种。
第二确定模块1203,基于所述多个探测源与所述多个目标容器间的预设监控指标数据,以及所述多个探测源和所述多个目标容器的网络层级结构描述信息,确定所述目标网络的运行状况。
其中,所述运行状况可包括VPC间的连通状态。
可选的,本说明书实施例提供的一种网络监控总之1200,还可以包括:网络结构确定模块和探针机器部署模块。
网络结构确定模块,确定所述目标网络的网络拓扑结构。
探针机器部署模块,基于所述网络拓扑结构,在所述多个VPC内部署所述多个探针机器。
其中,网络结构确定模块,可获取所述目标网络中节点的节点元数据,其中,所述节点为POD,一个POD包含至少一个容器(container),所述节点元数据中包含所述节点的网络层级结构描述信息;基于所述目标网络中节点的网络层级结构描述信息,构建所述目标网络的网络拓扑结构。
其中,获取所述目标网络中节点的节点元数据的方式可以有很多种,下面介绍三种。
第一种,可对所述目标网络中的节点进行监听,以获取所述目标网络中节点的节点元数据。例如,当目标网络为依托于K8S(Kubernetes)集群时,可通过监听K8S节点获取节点元数据。
第二种,可从所述目标网络的预设API接口拉取所述目标网络中节点的节点元数据。
第三种,可从所述目标网络对应的数据库中读取所述目标网络中节点的节点元数据。
网络结构确定模块,可基于所述目标网络中节点的网络层级结构描述信息,确定出目标网络中各层级节点的层结构及连接关系,从而依据各层级节点的层结构及连接关系构建所述目标网络的网络拓扑结构。
其中,探针机器部署模块,可基于所述网络拓扑结构,确定所述多个VPC下属的云服务器;从所述多个VPC下属的云服务器中选取多个第一服务器,并在所述多个第一服务器中分别部署一个探针机器,其中,一个VPC内对应选取至少一个云服务器。
可以理解,基于目标网络的网络拓扑结构,可以确定出所述多个VPC下属的(所述多个VPC内的)全部云服务器。之后可采用多种方式从这些云服务器中选取多个第一服务器以部署探针机器,只要保证一个VPC内对应选取至少一个云服务器即可,一般是在一个可用区AZ下的一个VPC内部署一批探针机器(如图2所示),下面介绍三种。
在第一种实施方式中,可将所述多个VPC的下属的全部云服务器选为第一服务器。
可以想象,对于租户较多的目标网络来说,其所拥有的云服务器数量是非常庞大的,如果将各VPC下属的全部云服务器选为第一服务器部署探针机器,部署量将非常庞大,探测时采集到的数据量也会非常巨大,该方式虽然可以取得更全面的探测效果,但对计算和存储都会带来不小的压力,且会降低数据计算效率。
鉴于此,在第二种实施方式中,可以分别从所述多个VPC的下属云服务器中针对一个IP段选取一个云服务器作为第一服务器。即对于所述多个VPC中的各VPC,一个IP段对应选取一个云服务器作为第一服务器,如果一个VPC对应多个IP段的话,则分别对应选取多个云服务器作为第一服务器。不难理解,一个VPC内的云服务器对应的IP段数明显少于该VPC内的云服务器数量,因此,当以IP段为粒度选择第一服务器时,相比于以云服务器本身为粒度选择第一服务器,可明显减少所选取的第一服务器的数量,从而降低了探针机器的部署量,最终也会降低所采集的数据量,进而可以避免给计算和存储带来压力,提高数据计算效率。此外,针对VPC内的一个IP段选取一个第一服务器部署探针机器,并不会降低VPC间连通性的探测效果。
在第三种实施方式中,还可以分别从所述多个VPC的下属云服务器中随机选取第一数量个云服务器作为第一服务器,其中,一个VPC对应的第一数量小于该VPC内的云服务器总数量。这同样可以减少所选取的第一服务器的数量,从而降低了探针机器的部署量,最终降低所采集的数据量,进而可以避免给计算和存储带来压力,提高数据计算效率,并且,也不会降低VPC间连通性的探测效果,但是,可能无法保证一些IP段的连通性探测效果,因为不能保证所选取的云服务器涵盖了该VPC下的全部IP段。
由于VPC是私有云网络,不同VPC间是相互隔离的,这种隔离导致的探针机器的部署难度增加,所以在相关技术中,一般不建议采用部署探针机器的方式探测网络质量。但是,本申请实施例通过在VPC内部署一个中心化的采集代理巧妙地化解了这一困难,具体的,通过部署在VPC内的一个相对中心化的采集代理,可实现该VPC内的探针机器的部署以及探针机器探测到的数据的上报。部署在VPC内的第一服务器上的探针机器本身可以是一个容器。
在此基础上,上述探针机器部署模块可用于:在所述多个第一服务器所属的VPC中部署采集代理,其中,一个VPC中对应部署一个采集代理;通过所述VPC内的采集代理向该VPC内的所述第一服务器部署探针机器。进一步地,一个探针机器探测得到的预设监控指标数据,也可通过该探针机器所在VPC内的采集代理上报给目标网络的计算监控平台。
其中,从所述多个VPC下属的云服务器中选取多个第二服务器方式也有很多种,下面介绍四种。
在第一种实施方式中,将所述多个VPC下属的全部云服务器选为第二服务器。同样可以想象,对于租户较多的目标网络来说,其所拥有的云服务器数量是非常庞大的,如果将各VPC下属的全部云服务器选为第二服务器,以从中选择待探测的目标容器,最终选取的目标容器数量也将非常庞大,探测时采集到的数据量也会非常巨大,该方式虽然可以取得更全面的探测效果,但对计算和存储都会带来不小的压力,且会降低数据计算效率。
在第二种实施方式中,可以将所述多个VPC下属的云服务器中除所述第一服务器外的云服务器选为第二服务器。第二种实施方式相对于第一种实施方式,可减少所选取的第二服务器的数量,从而可以减少最终选取的目标容器数量,最终降低所采集的数据量,进而可以避免给计算和存储带来压力,提高计算效率,并且,也不会降低VPC间连通性的探测效果。此外,将所述多个VPC下属的云服务器中除所述第一服务器外的云服务器选为第二服务器,还可以避免采集冗余数据,例如,当选取第二服务器同时也是部署有探针机器的第一服务器时,会存在探测源与目标容器(探测目标)位于同一云服务器上的情况,这种数据的采集很多时候是不必要的,因为对于容器级别连通性的检测很多时候是不必要的。
在第三种实施方式中,还可以分别从所述多个VPC下属的云服务器中选取第二数量的云服务器作为第二服务器,其中,一个VPC对应的第二数量小于该VPC内的云服务器总数量,所述第二服务器与所述第一服务器为不同的云服务器。这同样可以所选取的第二服务器的数量,从而可以减少最终选取的目标容器数量,最终降低所采集的数据量,进而可以避免给计算和存储带来压力,提高计算效率,并且,也不会降低VPC间连通性的探测效果,但是,可能无法保证一些云服务器间的连通性探测效果,因为一些云服务器上可能既没有探针机器有没有目标容器。
在第四种实施方式中,可以分别从所述多个VPC的下属云服务器中针对一个IP段选取一个云服务器作为第二服务器,其中,所述第二服务器与所述第一服务器为不同的云服务器。这同样可以所选取的第二服务器的数量,从而可以减少最终选取的目标容器数量,最终降低所采集的数据量,进而可以避免给计算和存储带来压力,提高计算效率,并且,也不会降低VPC间连通性的探测效果,但是,可能无法保证一些IP段的连通性探测效果,因为不能保证所选取的第二服务器涵盖了该VPC下的全部IP段。
进一步的,在选好第二服务器以后,可在所述第二服务器中随机选取一个容器作为目标容器。可以理解,一个第二服务器上选取一个容器而不是选多个容器作为目标容器,同样可以减少数据采集量,提升计算效率,最终提升整个网络的监控效率。
可选的,所述预设监控指标可以包括但不限于连通性指标和时延中的至少一种。
可选的,第二确定模块,具体可先基于所述多个探测源和所述多个目标容器的网络层级结构描述信息,确定预设监控维度;然后从预设监控维度对所述多个探测源与所述多个目标容器间的预设监控指标数据进行汇聚,得到所述预设监控维度的预设监控指标汇聚数据;基于所述预设监控维度的预设监控指标汇聚数据,确定所述目标网络在所述预设监控维度的连通状态。
其中,所述预设监控维度可以包括但不限于云服务器、VPC、接入层ASW、汇聚层PSW、核心层DSW、IP段、可用区AZ、机房以及地区中的至少一种。不难看出,除了VPC间,由于本说明书实施例提供的一种网络监控装置1200,可以确定目标网络在接入层ASW、汇聚层PSW、核心层DSW、IP段、可用区AZ、机房以及地区等维度的连通状态,因此,还可以确定DPA(DSW/PSW/ASW)级、机房级或地区(如城市)级等级别的网络故障。
可选的,图12所示的装置1200还可以包括:第一展示模块,展示所述目标网络在所述预设监控维度的预设监控指标汇聚数据。具体的,第一展示模块可以以列表的形式展示所述目标网络在所述预设监控维度的预设监控指标汇聚数据。通过展示,可以使运维人员快速、直观地了解目标网络在各监控维度的运行状况。
可选的,所述列表是可配置和/或可操作的。
可选的,所述列表中还可以针对各监控维度设置是否支持告警的选项,供运维人员设置是否支持告警、告警条件以及告警方式等。
可选的,所述列表中还可以针对各监控维度设置监控周期的选项,供运维人员设置监控周期和告警周期中的一种。
可选的,图12所示的装置1200还可以包括:告警模块,在基于所述预设监控维度的预设监控指标汇聚数据确定所述目标网络存在所述预设监控维度的连通性故障的情况下,以预设方式对所述预设监控维度的连通性故障进行告警。其中,所述预设方式可包括发送邮件、发送短信等。通过告警,可以使运维人员第一时间了解到目标网络所出现的故障,从而及时对网络故障做出及时修复。
有了上述列表以后,通过查看不同监控维度的源和目标之间的连通性,可以确定云服务器间故障、VPC间故障、DPA级故障、机房级故障和地区级故障中的一种或多种。具体来说,通过查看VPC维度的连通性可确定VPC间故障,通过查看物理机(NC)网段维度的连通性可确定DPA级故障,通过查看AZ维度的连通性可确定机房级故障,通过查看地区维度的连通性可确定城市级故障,等等。
可选的,所述列表是可操作的,且所述列表中包含网络诊断工具(如MTR(mytraceroute))的触发标识(如触发选项),所述网络诊断工具用于检测IP对的连通性,可选的,图12所示的装置1200还可以包括:连通性检测模块,响应于针对所述列表中的目标IP对对应的所述触发标识的操作,触发所述网络诊断工具对所述目标IP对的连通性进行检测。如此一来,可以进一步的确定出IP级故障。
此外,对于目标网络,运维人员常常想获得全局视角下的运行状况,以对目标网络的全局稳定性有所掌握。鉴于此,可选的,图12所示的装置1200还可以包括:统计模块,从预设全局视角对所述多个探测源与所述多个目标容器间的预设监控指标数据进行统计,得到所述预设全局视角的预设监控指标统计结果,并展示所述预设全局视角的预设监控指标统计结果。
其中,预设全局视角是能够反映所述目标网络全局运行状况的视角。例如,全局视角包可以包括但不限于下述视角中的一种或多种:
(1)指定维度的源到所述指定维度的目标的平均时延;
(2)指定维度的源到所述指定维度的目标在预设时长内新增的连接不通的云服务器数量;
(3)指定维度的源到所述指定维度的目标在预设时长内新增的连接不通的云服务器明细。
其中,所述指定维度是基于所述多个探测源和所述多个目标容器的网络层级结构描述信息确定的,所述指定维度包括但不限于下述维度中的一种:云服务器、VPC、接入层ASW、汇聚层PSW、核心层DSW、IP段、可用区AZ、机房以及地区中的至少一种。
其中,所述预设全局视角、所述指定维度的源和所述指定维度的目标是可配置的。
需要说明的是,网络监控装置1000能够实现图5提供的一种网络监控方法,并能取得相同的技术效果,详细内容可参考上文对方法实施例部分的描述,不再赘述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
总之,以上所述仅为本说明书的较佳实施例而已,并非用于限定本说明书的保护范围。凡在本说明书一个或多个实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例的保护范围之内。
上述实施例阐明的***、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制时,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

Claims (23)

1.一种网络监控方法,包括:
基于目标网络的网络拓扑结构,从所述目标网络的容器中选取多个目标容器,其中,所述目标网络中包含多个虚拟私有云VPC,一个VPC内包含至少一个容器,所述多个VPC内部署有多个探针机器,一个VPC内至少部署一个探针机器,且一个VPC内至少选取一个目标容器;
将所述多个探针机器作为多个探测源分别向所述多个目标容器发送探测信息,以获得所述多个探测源与所述多个目标容器间的预设监控指标数据,其中,所述预设监控指标包括连通性指标和时延中的至少一种;
基于所述多个探测源与所述多个目标容器间的预设监控指标数据,以及所述多个探测源和所述多个目标容器的网络层级结构描述信息,确定所述目标网络的运行状况,其中,所述运行状况包括VPC间的连通状态。
2.根据权利要求1所述的方法,在所述基于目标网络的网络拓扑结构,从所述目标网络的容器中选取多个目标容器之前,所述方法还包括:
确定所述目标网络的网络拓扑结构;
基于所述网络拓扑结构,在所述多个VPC内部署所述多个探针机器。
3.根据权利要求2所述的方法,所述确定所述目标网络的网络拓扑结构,包括:
获取所述目标网络中节点的节点元数据,其中,所述节点为POD,一个POD包含至少一个容器,所述节点元数据中包含所述节点的网络层级结构描述信息;
基于所述目标网络中节点的网络层级结构描述信息,构建所述目标网络的网络拓扑结构。
4.根据权利要求3所述的方法,所述获取所述目标网络中节点的节点元数据,包括:
对所述目标网络中的节点进行监听,以获取所述目标网络中节点的节点元数据;
或者,
从所述目标网络的预设API接口拉取所述目标网络中节点的节点元数据;
或者,
从所述目标网络对应的数据库中读取所述目标网络中节点的节点元数据。
5.根据权利要求4所述的方法,
所述目标网络依托于K8S集群,所述节点为K8S集群中的工作节点。
6.根据权利要求2所述的方法,
所述目标网络中节点的网络层级结构描述信息包括节点内的容器信息、节点本身的信息、节点所属的VPC信息、节点所属的可用区AZ信息、节点所属的租户信息以及节点所属的地区信息,其中,所述节点为POD,一个POD包含至少一个容器。
7.根据权利要求2-6任一项所述的方法,其特征在于,所述基于所述网络拓扑结构,在所述多个VPC内部署所述多个探针机器,包括:
基于所述网络拓扑结构,确定所述多个VPC下属的云服务器;
从所述多个VPC下属的云服务器中选取多个第一服务器,并在所述多个第一服务器中分别部署一个探针机器,其中,一个VPC内对应选取至少一个第一服务器。
8.根据权利要求7所述的方法,所述从所述多个VPC下属的云服务器中选取多个第一服务器,包括:
将所述多个VPC的下属的全部云服务器选为第一服务器;
或者,
分别从所述多个VPC的下属云服务器中针对一个IP段选取一个云服务器作为第一服务器。
9.根据权利要求7所述的方法,所述在所述多个第一服务器中分别部署一个探针机器,包括:
在所述多个第一服务器所属的VPC中部署采集代理,其中,一个VPC中对应部署一个采集代理;
通过所述VPC内的采集代理向该VPC内的所述第一服务器部署探针机器。
10.根据权利要求7所述的方法,所述基于目标网络的网络拓扑结构,从所述目标网络的容器中选取多个目标容器,包括:
基于所述目标网络的网络拓扑结构,确定所述多个VPC下属的云服务器;
从所述多个VPC下属的云服务器中选取多个第二服务器,其中,一个VPC内对应选取至少一个第二服务器;
在所述第二服务器中选取至少一个容器作为目标容器。
11.根据权利要求10所述的方法,所述从所述多个VPC下属的云服务器中选取多个第二服务器,包括:
将所述多个VPC下属的全部云服务器选为第二服务器;
或者,
将所述多个VPC下属的云服务器中除所述第一服务器外的云服务器选为第二服务器;
或者,
分别从所述多个VPC下属的云服务器中选取第二数量的云服务器作为第二服务器,其中,一个VPC对应的第二数量小于该VPC内的云服务器总数量,所述第二服务器与所述第一服务器为不同的云服务器。
12.根据权利要求10或11所述的方法,其特征在于,所述在所述第二服务器中选取至少一个容器作为目标容器,包括:
在所述第二服务器中随机选取一个容器作为目标容器。
13.根据权利要求1-6、8-11中任一项所述的方法,所述基于所述多个探测源与所述多个目标容器间的预设监控指标数据,以及所述多个探测源和所述多个目标容器的网络层级结构描述信息,确定所述目标网络的运行状况,包括:
基于所述多个探测源和所述多个目标容器的网络层级结构描述信息,确定预设监控维度,其中,所述预设监控维度包括云服务器、VPC、接入层ASW、汇聚层PSW、核心层DSW、IP段、可用区AZ、机房以及地区中的至少一种;
从所述预设监控维度对所述多个探测源与所述多个目标容器间的预设监控指标数据进行汇聚,得到所述预设监控维度的预设监控指标汇聚数据;
基于所述预设监控维度的预设监控指标汇聚数据,确定所述目标网络在所述预设监控维度的连通状态。
14.根据权利要求13所述的方法,还包括:
展示所述目标网络在所述预设监控维度的预设监控指标汇聚数据。
15.根据权利要求14所述的方法,所述展示所述目标网络在所述预设监控维度的预设监控指标汇聚数据,包括:
以列表的形式展示所述目标网络在所述预设监控维度的预设监控指标汇聚数据,其中,所述列表是可配置和/或可操作的。
16.根据权利要求15所述的方法,所述列表是可操作的,且所述列表中包含网络诊断工具的触发标识,所述网络诊断工具用于检测IP对的连通性,所述方法还包括:
响应于针对所述列表中的目标IP对对应的所述触发标识的操作,触发所述网络诊断工具对所述目标IP对的连通性进行检测。
17.根据权利要求13所述的方法,还包括:
在基于所述预设监控维度的预设监控指标汇聚数据确定所述目标网络存在所述预设监控维度的连通性故障的情况下,以预设方式对所述预设监控维度的连通性故障进行告警。
18.根据权利要求1-6、8-11、14-17中任一项所述的方法,还包括:
从预设全局视角对所述多个探测源与所述多个目标容器间的预设监控指标数据进行统计,得到所述预设全局视角的预设监控指标统计结果,其中,预设全局视角是能够反映所述目标网络全局运行状况的视角;
展示所述预设全局视角的预设监控指标统计结果。
19.根据权利要求18所述的方法,所述全局视角包括下述至少一种:
指定维度的源到所述指定维度的目标的平均时延;
指定维度的源到所述指定维度的目标在预设时长内新增的连接不通的云服务器数量;
指定维度的源到所述指定维度的目标在预设时长内新增的连接不通的云服务器明细;
其中,所述指定维度是基于所述多个探测源和所述多个目标容器的网络层级结构描述信息确定的,所述指定维度包括下述维度中的一种:云服务器、VPC、接入层ASW、汇聚层PSW、核心层DSW、IP段、可用区AZ、机房以及地区中的至少一种。
20.根据权利要求19所述的方法,
所述预设全局视角、所述指定维度的源和所述指定维度的目标是可配置的。
21.一种网络监控装置,包括:
第一确定模块,基于目标网络的网络拓扑结构,从所述目标网络的容器中选取多个目标容器,其中,所述目标网络中包含多个虚拟私有云VPC,一个VPC内包含至少一个容器,所述多个VPC内部署有多个探针机器,一个VPC内至少部署一个探针机器,且一个VPC内至少选取一个目标容器;
探测模块,将所述多个探针机器作为多个探测源分别向所述多个目标容器发送探测信息,以获得所述多个探测源与所述多个目标容器间的预设监控指标数据,其中,所述预设监控指标包括连通性指标和时延中的至少一种;
第二确定模块,基于所述多个探测源与所述多个目标容器间的预设监控指标数据,以及所述多个探测源和所述多个目标容器的网络层级结构描述信息,确定所述目标网络的运行状况,其中,所述运行状况包括VPC间的连通状态。
22.一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
基于目标网络的网络拓扑结构,从所述目标网络的容器中选取多个目标容器,其中,所述目标网络中包含多个虚拟私有云VPC,一个VPC内包含至少一个容器,所述多个VPC内部署有多个探针机器,一个VPC内至少部署一个探针机器,且一个VPC内至少选取一个目标容器;
将所述多个探针机器作为多个探测源分别向所述多个目标容器发送探测信息,以获得所述多个探测源与所述多个目标容器间的预设监控指标数据,其中,所述预设监控指标包括连通性指标和时延中的至少一种;
基于所述多个探测源与所述多个目标容器间的预设监控指标数据,以及所述多个探测源和所述多个目标容器的网络层级结构描述信息,确定所述目标网络的运行状况,其中,所述运行状况包括VPC间的连通状态。
23.一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
基于目标网络的网络拓扑结构,从所述目标网络的容器中选取多个目标容器,其中,所述目标网络中包含多个虚拟私有云VPC,一个VPC内包含至少一个容器,所述多个VPC内部署有多个探针机器,一个VPC内至少部署一个探针机器,且一个VPC内至少选取一个目标容器;
将所述多个探针机器作为多个探测源分别向所述多个目标容器发送探测信息,以获得所述多个探测源与所述多个目标容器间的预设监控指标数据,其中,所述预设监控指标包括连通性指标和时延中的至少一种;
基于所述多个探测源与所述多个目标容器间的预设监控指标数据,以及所述多个探测源和所述多个目标容器的网络层级结构描述信息,确定所述目标网络的运行状况,其中,所述运行状况包括VPC间的连通状态。
CN202211011028.6A 2022-08-23 2022-08-23 一种网络监控方法、装置和设备 Active CN115378853B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211011028.6A CN115378853B (zh) 2022-08-23 2022-08-23 一种网络监控方法、装置和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211011028.6A CN115378853B (zh) 2022-08-23 2022-08-23 一种网络监控方法、装置和设备

Publications (2)

Publication Number Publication Date
CN115378853A true CN115378853A (zh) 2022-11-22
CN115378853B CN115378853B (zh) 2023-06-16

Family

ID=84068344

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211011028.6A Active CN115378853B (zh) 2022-08-23 2022-08-23 一种网络监控方法、装置和设备

Country Status (1)

Country Link
CN (1) CN115378853B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117376194A (zh) * 2023-12-06 2024-01-09 苏州元脑智能科技有限公司 网络检测方法、***、电子设备及计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7680923B1 (en) * 2003-03-11 2010-03-16 Nortel Networks Limited Connectivity assessment for label distribution protocol (LDP) networks
CN108599978A (zh) * 2018-02-24 2018-09-28 国家计算机网络与信息安全管理中心 一种云监控方法和装置
CN108694116A (zh) * 2017-04-10 2018-10-23 北京金山云网络技术有限公司 一种vpc集群的网络稳定性测试方法、装置及***
CN114826969A (zh) * 2022-03-17 2022-07-29 阿里巴巴(中国)有限公司 网络连通性检查方法、装置、设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7680923B1 (en) * 2003-03-11 2010-03-16 Nortel Networks Limited Connectivity assessment for label distribution protocol (LDP) networks
CN108694116A (zh) * 2017-04-10 2018-10-23 北京金山云网络技术有限公司 一种vpc集群的网络稳定性测试方法、装置及***
CN108599978A (zh) * 2018-02-24 2018-09-28 国家计算机网络与信息安全管理中心 一种云监控方法和装置
CN114826969A (zh) * 2022-03-17 2022-07-29 阿里巴巴(中国)有限公司 网络连通性检查方法、装置、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117376194A (zh) * 2023-12-06 2024-01-09 苏州元脑智能科技有限公司 网络检测方法、***、电子设备及计算机可读存储介质
CN117376194B (zh) * 2023-12-06 2024-02-13 苏州元脑智能科技有限公司 网络检测方法、***、电子设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN115378853B (zh) 2023-06-16

Similar Documents

Publication Publication Date Title
CN110855473B (zh) 一种监控方法、装置、服务器及存储介质
CN111181801B (zh) 节点集群测试方法、装置、电子设备及存储介质
US10484265B2 (en) Dynamic update of virtual network topology
CN111131379B (zh) 一种分布式流量采集***和边缘计算方法
US20130179793A1 (en) Enhancing visualization of relationships and temporal proximity between events
CN110659109B (zh) 一种openstack集群虚拟机监控***及方法
CN110838944B (zh) 一种云中心租户维度拓扑图的实现方法
CN109218349A (zh) 一种管理服务器集群的方法及装置
US20230198860A1 (en) Systems and methods for the temporal monitoring and visualization of network health of direct interconnect networks
WO2017080161A1 (zh) 云计算中报警信息的处理方法及装置
Trakadas et al. Scalable monitoring for multiple virtualized infrastructures for 5G services
CN112698915A (zh) 多集群统一监控告警方法、***、设备及存储介质
CN115378853B (zh) 一种网络监控方法、装置和设备
CN110196780B (zh) 确定服务器状态的方法、装置、存储介质和电子装置
CN112162912A (zh) 一种云资源监控方法及***
WO2018045901A1 (zh) 界面生成***、钻取服务层装置、数据发送方法
JP2016533099A (ja) リンク性能テスト方法、装置、論理プロセッサ及びネットワークプロセッサ
WO2019079961A1 (zh) 一种确定共享风险链路组的方法及装置
CN114553747A (zh) redis集群的异常检测方法、装置、终端及存储介质
JP6501924B2 (ja) アラートを解除する方法及びサーバー
CN115150253B (zh) 一种故障根因确定方法、装置及电子设备
CN116820874A (zh) 一种企业级大数据组件及应用监控和告警的方法
CN113766363B (zh) 故障监控方法、装置及计算设备
CN110196721A (zh) 一种互联网数据中心管理方法、***及介质
CN114201314B (zh) 一种基于契约的实现服务依赖发现和服务访问的路由方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant