CN111884869A - 一种监控网络质量的方法、装置和*** - Google Patents

一种监控网络质量的方法、装置和*** Download PDF

Info

Publication number
CN111884869A
CN111884869A CN202010435314.XA CN202010435314A CN111884869A CN 111884869 A CN111884869 A CN 111884869A CN 202010435314 A CN202010435314 A CN 202010435314A CN 111884869 A CN111884869 A CN 111884869A
Authority
CN
China
Prior art keywords
detection
machine
network
edge computing
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010435314.XA
Other languages
English (en)
Inventor
叶雅慧
郑永全
洪少凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wangsu Science and Technology Co Ltd
Original Assignee
Wangsu Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wangsu Science and Technology Co Ltd filed Critical Wangsu Science and Technology Co Ltd
Priority to CN202010435314.XA priority Critical patent/CN111884869A/zh
Publication of CN111884869A publication Critical patent/CN111884869A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • H04L43/103Active monitoring, e.g. heartbeat, ping or trace-route with adaptive polling, i.e. dynamically adapting the polling rate
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0811Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及一种监控网络质量的方法、装置和***。该方法包括:确定监控机的探测目标,探测目标为其他边缘计算节点中的监控机;接收监控机对探测目标进行网络探测发回的探测结果;根据探测结果确定边缘计算网络的网络质量。通过该方法实现了确定每个边缘计算节点的网络质量的目的。

Description

一种监控网络质量的方法、装置和***
技术领域
本发明涉及网络通信领域技术,尤其涉及一种监控网络质量的方法、装置和***。
背景技术
内容分发网络(CDN)是一种新型网络内容服务体系,其基本思路是尽可能避开互联网上有可能影响数据传输速度和稳定性的瓶颈和环节,使内容传输的更快、更稳定。通过在网络各处放置节点服务器,构成在现有的互联网基础之上的一层智能虚拟网络,CDN***能够实时地根据网络流量和各节点的连接、负载状况以及到用户的距离和响应时间等综合信息将用户的请求重新导向离用户最近的服务节点上。其目的是使用户可就近取得所需内容,解决网络拥挤的状况,提高用户访问网站的响应速度。
边缘计算场景下,业务分布在跨运营商、跨区域下的大量节点中,不同节点的网络质量参差不齐,尤其是跨国家,跨运营商的场景下,一旦出现各种网络波动,将对边缘计算业务的稳定性、可靠性造成影响。
内容分发网络可以分为中心网络和边缘网络,边缘网络由多个边缘计算节点组成,边缘计算节点包括多个节点机。
而目前,常见的数据中心、云计算产品的网络质量监控方式更多专注于中心的网络质量监控,而针对边缘计算这种业务下沉型的场景,一般采用如下的方式进行质量监控:一、从中心网络中选取监控机,该监控机模拟客户向边缘计算节点中的节点机发起业务请求;二、部分不同边缘计算节点中的节点机之间互相模拟业务请求。这样的监控方式,缺少与客户业务相近的网络请求监控数据,难以对节点质量进行评估。
发明内容
本发明提供一种监控网络质量的方法、装置和***,实现了综合评价多个边缘计算网络节点之间网络质量的效果。
为实现上述目的,本申请一方面提供一种监控网络质量的方法,调度管理平台关联有多个边缘计算节点,边缘计算节点包括监控机,所述方法运用于所述调度管理平台,所述方法包括:
确定所述监控机的探测目标,所述探测目标为其他所述边缘计算节点中的所述监控机;
接收所述监控机对所述探测目标进行网络探测发回的探测结果;
根据所述探测结果确定所述边缘计算网络的网络质量。
在此基础上,所述监控机关联有区域信息、运营商信息和标签信息,所述标签信息包括第一标签和第二标签;
所述确定所述监控机的探测目标,包括:
选择第一标签的监控机作为探测机,所述第一标签表示所述监控机未被作为探测机;
根据所述区域信息和所述运营商信息确定与所述探测机关联的被探测机,所述被探测机为除探测机之外的其他监控机,所述被探测机为所述探测机的探测目标;
修改所述第一标签为第二标签;
返回执行选择第一标签的监控机作为探测机的操作,直到所有监控机的标签信息为第二标签。
在此基础上,所述根据所述区域信息和所述运营商信息确定与所述探测机关联的被探测机,包括:
从与所述探测机区域信息相同、运营商信息相同的监控机中,选择第一数量的监控机作为被探测机;
从与所述探测机区域信息不同、运营商信息相同的监控机中,选择第二数量的监控机作为被探测机;
从与所述探测机区域信息相同、运营商信息不同的监控机中,选择第三数量的监控机作为被探测机。
在此基础上,还包括:
确定所述探测机的探测频率;
将所述探测频率与所述被探测机的数量的乘积,作为所述探测机的实际监控能力值;
调整所述探测频率或者所述被探测机的数量,以使所述实际监控能力值符合所述探测机的理论监控能力值。
在此基础上,所述探测结果包括自身异常;
所述根据所述探测结果确定所述边缘计算网络的网络质量,包括:
确定所述探测结果为自身异常;
确定上报所述自身异常的监控机所在的边缘计算节点的网络质量低。
在此基础上,所述探测结果包括连接异常;
所述根据所述探测结果确定所述边缘计算网络的网络质量,包括:
确定所述探测结果为连接异;
确定所述连接异常关联的监控机;
当一监控机与超过预设异常数量的连接异常关联,则确定所述监控机所在的边缘计算节点的网络质量低。
为实现上述目的,本申请另一方面提供一种监控网络质量的方法,调度管理平台关联有多个边缘计算节点,边缘计算节点包括监控机,所述方法运用于所述监控机,所述方法包括:
向所述调度管理平台发起目标请求;
接收所述调度管理平台响应所述目标请求发回的探测目标,所述探测目标为其他所述边缘计算节点中的所述监控机;
向所述探测目标发起网络探测,以获得探测信息;
根据所述探测信息确定探测结果;
向调度管理平台发送所述探测结果。
在此基础上,所述向所述探测目标发起网络探测,以获得探测信息,包括:
确定发起网络探测的所述监控机为探测机;
确定所述探测目标为被探测机;
所述探测机依次向所述被探测机发起连接请求;
接收所述被探测机根据所述连接请求发回的回馈信息;
确定响应时间作为探测信息,所述响应时间为所述连接请求与所述回馈信息之间的时间差。
在此基础上,所述网络探测包括如下的至少一种:
基于tcp_ping协议发起网络探测;
基于tcp_connect发起网络探测;
基于udp_ping协议发起网络探测;
基于icmp_ping发起网络探测。
在此基础上,所述根据所述探测信息确定探测结果,包括:
从所述响应时间中筛选超过预设时间的异常时间,所述异常时间表示探测机与被探测机之间的网络连接超时;
当所述异常时间的数量符合第一条件,生成连接异常的探测结果,所述接异常表示被探测机所在的边缘计算节点的网络异常;
当所述异常时间的数量符合第二条件,生成自身异常的探测结果,所自身异常表示探测机所在的边缘计算节点的网络异常。
为实现上述目的,本申请另一方面提供一种监控网络质量的装置,调度管理平台关联有多个边缘计算节点,边缘计算节点包括监控机,所述装置包括:
探测目标确定模块,用于确定所述监控机的探测目标,所述探测目标为其他所述边缘计算节点中的所述监控机;
探测结果接收模块,用于接收所述监控机对所述探测目标进行网络探测发回的探测结果;
网络质量确定模块,用于根据所述探测结果确定所述边缘计算网络的网络质量。
为实现上述目的,本申请另一方面提供一种监控网络质量的装置,调度管理平台关联有多个边缘计算节点,边缘计算节点包括监控机,所述装置包括:
目标请求发起模块,用于向所述调度管理平台发起目标请求;
探测目标接收模块,用于接收所述调度管理平台响应所述目标请求发回的探测目标,所述探测目标为其他所述边缘计算节点中的所述监控机;
网络探测发起模块,用于向所述探测目标发起网络探测,以获得探测信息;
探测结果确定模块,用于根据所述探测信息确定探测结果;
探测结果发送模块,用于向调度管理平台发送所述探测结果。
为实现上述目的,本申请另一方面提供一种监控网络质量的***,包括:两个及其以上的边缘计算节点和调度管理平台;
所述边缘计算节点包括监控机,所述监控机关联有检测目标,所述探测目标为其他所述边缘计算节点中的所述监控机;
每个所述探测目标与所述监控机通信连接,所述探测目标向所述监控机发回探测结果,所述监控机根据所述探测结果确定其所述边缘计算节点的网络质量;
每个所述监控机与所述调度管理平台通信连接,所述监控机向所述调度管理平台上传所述探测结果,所述调度管理平台接收所述探测结果,并根据所述探测结果确定所述边缘计算网络的网络质量。。
在此基础上,
还包括:
所述调度管理平台根据所述监控机的数量,确定理论探测链路数量;
所述调度管理平台接收监控机发回的实际探测链路数量;
确定探测链路差值,所述探测链路差值为所述理论探测链路数量与所述实际探测链路数量的差值;
计算链路探测完整度,所述链路探测完整度为所述链路差值在所述理论探测链路数量的占比;
当所述链路探测完整度低于完整度阈值时,确定所述监控边缘计算节点的网络质量的***异常。
由上可见,本申请提供的技术方案可以将监控机从中心网络下沉到边缘网络,以获得与客户业务相近的网络请求监控数据。监控机既充当探测机,以监控其他边缘计算节点的网络质量,同时监控机(作为被探测机)也能被其他节点的监控机监控,即可以监控自身所在的边缘计算节点的网络质量。
在此基础上,解决了需要通过人工部署监控任务来实现监控调度存在的一些问题,如多人协作不同探测任务导致机器冲突和数据异常,或者监控机异常时无法自动调度切换等。
附图说明
图1是本发明实施方式中监控网络质量的***的结构示意图;
图2是本发明实施例1中监控网络质量的方法的步骤示意图;
图3是本发明实施例1中为监控机确定其他监控机作为探测目标的步骤的示意图;
图4是本发明实施例2中监控网络质量的方法的步骤示意图;
图5是本发明实施例2中向探测目标发起网络探测,以获得探测信息的步骤的示意图;
图6为本发明实施例3提供的一种监控网络质量的装置的结构示意图;
图7为本发明实施例3提供的一种监控网络质量的装置的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
本申请提供一种监控网络质量的方法,该方法可用于如图1所示的监控网络质量的***中,具体用于该***的边缘计算节点中。具体的,请参阅图1,该监控网络质量的***的整体技术架构是以C/S(Client/Server,客户端/服务器)模式来组织实现的。Server即调度管理平台,Client即边缘计算节点中的节点机。其中,调度管理平台关联有多个边缘计算节点(如边缘计算节点1、边缘计算节点2、边缘计算节点n),边缘计算节点包括多个节点机(如边缘计算节点1中包括节点机11、节点机12、节点机13、节点机1n)。调度管理平台从边缘计算节点包括的节点机中确定一监控机:如边缘计算节点1中的节点机12、如边缘计算节点2中的节点机21、如边缘计算节点n中的节点机nn。调度管理平台为监控机确定探测目标,探测目标为其他边缘计算节点中的监控机,如:节点机12的探测目标为节点机21和节点机nn。监控机向调度管理平台发起目标请求,如监控机(节点机12)向调度管理平台发起目标请求,则可以接受调度管理平台发回的探测目标。监控机(节点机12)对探测目标(节点机21和节点机nn)进行网络探测获得探测结果。监控机(节点机12)将该探测结果发送给调度管理平台,调度管理平台根据该探测结果综合评定每个边缘计算节点的网络质量。
实施例1
请参阅图1和图2,本申请一个实施方式中,上述的监控网络质量的方法可以包括以下步骤:
S11、确定所述监控机的探测目标。
调度管理平台针对每个监控机确定探测目标。
调度管理平台存储有每个监控机的区域信息、运营商信息和标签信息。区域信息一般是监控机所在的省份,运营商信息一般是电信、联通和其他(除了电信、联通以外的所有运营商),标签信息包括第一标签和第二标签,第一标签表示监控机未被作为探测机进行匹配,第二标签表示被作为探测机进行匹配。探测机与被探测机是为了后文对监控机的身份进行区分而添加的概念,其本质上也是监控机。当调度管理平台选择一台监控机进行探测目标的确定时,该被选中的监控机被称为探测机,被匹配到的探测目标被称为被探测机。
在一具体的实现方式中,如图3所示,可以通过如下步骤为监控机确定其他监控机作为探测目标:
S111、选择第一标签的监控机作为探测机。
调度管理平台选择标签信息为第一标签的监控机作为探测机。
S112、根据所述区域信息和所述运营商信息确定与所述探测机关联的被探测机。
调度管理平台从与探测机区域信息相同、运营商信息相同的监控机中,选择第一数量(Rule_i)个的监控机作为被探测机。即,在同运营商、同省份的监控机中,挑选Rule_i个作为探测目标,当探测目标个数不足Rule_i个时,则选择所有监控机作为探测目标。
从与探测机区域信息不同、运营商信息相同的监控机中,选择第二数量(Rule_j)个的监控机作为被探测机。即,在同运营商、相邻省的监控机中,挑选Rule_j个作为探测目标,当探测目标个数不足Rule_j时,则选择所有监控机作为探测目标。
从与探测机区域信息相同、运营商信息不同的监控机中,选择第三数量(Rule_k)的监控机作为被探测机。即,如果探测机是小运营商,则挑选同省电信和联通节点的Rule_k个监控机作为探测目标,当探测目标个数不足Rule_k个时,则选择所有监控机作为探测目标。
对于被探测机的数量进行限制,使得第一数量、第二数量和第三数量的总和不超过一特定值。其中,第一数量范围为10-100;第二数量范围为1-5;第三数量范围为1-5;特定值得范围不超过240。当然,本实施例中对第一数量、第二数量、第三数量、和特定值不做限制,只是提供一种可行方案。
应当注意的是,探测机与被探测机之间的探测是双向的,即一台被探测机与一台探测机匹配后,该被探测机作为探测机时,原来匹配的探测机则作为其被探测机。
在上述实施例的基础上,还包括:确定探测机的探测频率;将探测频率与被探测机的数量的乘积,作为探测机的实际监控能力值;调整探测频率或者被探测机的数量,以使实际监控能力值符合探测机的理论监控能力值。
一般的,监控机的实际监控能力值(maxPingLoad),与被探测机的数量(Rule_i+Rule_j+Rule_k)和探测频率(f)相关,可以理解为:maxPingLoad=(Rule_i+Rule_j+Rule_k)*f,如果maxPingLoad过大会导致机器资源消耗过大,探测数据可信度降低。因此,需要调整探测频率或者被探测机的数量,以使实际监控能力值(maxPingLoad)符合探测机的理论监控能力值(一般取值范围为1000-1200)。
探测机可以以一定的周期频率(600次/min),分别对探测目标发起不同协议的不间断探测,不仅可以精确匹配客户反馈的网络问题所对应时段的网络质量监控数据,而且覆盖了客户大部分的网络协议请求。
鉴于探测量较大,可能引起监控机本身CPU、IO(Input/Output,输入/输出)等跑高,所以节点机通过监控本机资源,并上报给调度管理平台,触发调度管理平台执行相关的降量或切换监控机的处理。在监控机发生资源跑高的情况,或者边缘计算节点中没有其他监控机可用,又或者边缘计算节点有更优选择的监控机时,可以自动触发该边缘计算节点进行监控机的切换,为对边缘计算节点进行持续性监控提供可靠保障和最后一道安全防线。
S113、修改所述第一标签为第二标签。
当对监控机进行探测目标的匹配后,将该作为探测机的监控机的标签信息,从第一标签修改为第二标签,表示该监控机已经被进行过探测目标的匹配。
S114、返回执行选择第一标签的监控机作为探测机的操作,直到所有监控机的标签信息为第二标签。
调度管理平台重新选择标签信息为第一标签的监控机作为探测机,进行探测目标的匹配,直到所有监控机的标签信息为第二标签。
S12、接收所述监控机对所述探测目标进行网络探测发回的探测结果。
S13、根据所述探测结果确定所述边缘计算网络的网络质量。
一般的,可以将此步骤理解为调度管理平台将探测目标发送给监控机,监控机对探测目标进行网络探测。调度管理平台接收监控机对探测目标进行网络探测后发回的探测结果,根据该探测结果综合评定每个边缘计算节点的网络质量。调度管理平台接收监控机发起的目标请求,并将该监控机对应的探测目标发送给该监控机,该监控机接收探测目标后对该探测目标进行网络探测。
一般的,当探测机出现网络异常时,可能存在自身无法上报异常的情况。此时则依赖其他监控机对其进行网络探测的探测结果,来间接发现当前探测机的所在节点存在网络质量异常。比如:探测机a,其探测目标有b1,b2,...,bi,即b1,b2,...,bi也在探测探测机a;当b1,b2,...,bi的探测结果中,对探测机a的探测结果中存在j条链路异常,当j/i大于阈值时,则认为探测机a所在的边缘计算节点的下行链路的网络质量低。
由此可见,本申请提供的技术方案通过自动从边缘计算网络中选取一台节点机作为监控机,确定监控机的探测目标,接收监控机对探测目标进行网络探测后发回的探测结果,以综合评定每个所述边缘计算节点的网络质量。从而实现自动监控、自动调度、自动识别、自动告警等功能。
在此基础上,不仅调度管理平台可以综合评定每个所述边缘计算节点的网络质量,每个边缘计算网络的监控机也可以针对每个周期内的所有探测结果进行分析。监控机可以最终计算出发送、接收的真实网络质量,进而生成告警,促使运营人员先于客户感知异常、处理异常,避免对客户业务产生影响。
实施例2
请参阅图1和图4,本申请一个实施方式中,上述的监控网络质量的方法可以包括以下步骤:
S21、向所述调度管理平台发起目标请求。
监控机向调度管理平台发起目标请求,该目标请求中包括了该监控机的标识号,以与其他监控机进行区别。
监控机通过调度管理***从边缘计算节点所包括的节点机中确定。在本实施方式中,边缘计算节点包括多个节点机,调度管理平台采集每个节点机的属性信息后,为该边缘计算节点指定一台节点机作为监控机。
S22、接收所述调度管理平台响应所述目标请求发回的探测目标。
具体的确定探测目标的方式,可以参考实施例1中,步骤S11的描述。
S23、向所述探测目标发起网络探测,以获得探测信息。
监控机接收探测目标后对该探测目标进行网络探测。
网络探测包括如下的至少一种:基于tcp_ping协议发起网络探测、基于tcp_connect发起网络探测、基于udp_ping协议发起网络探测;基于icmp_ping发起网络探测。
通过提高探测协议的覆盖程度,克服了边缘计算网络中监控机的一些资源瓶颈,还对监控网络质量的***本身做了相应的性能保护。
如图5所示,监控机可以通过如下步骤向探测目标发起网络探测,以获得探测信息:
S231、确定发起网络探测的所述监控机为探测机。
S232、确定所述探测目标为被探测机。
S233、所述探测机依次向所述被探测机发起连接请求。
当网络探测基于tcp_ping协议时,探测机发起syn包来探测目标;当网络探测基于tcp_connect时,发起tcp三次握手来探测目标;当网络探测基于udp_ping协议时,发起udp报文来探测目标;当网络探测基于icmp_ping协议时,发起icmp报文来探测目标。
这四种探测协议的覆盖,使得探测执行过程克服了边缘服务器的一些资源瓶颈。
S234、接收所述被探测机根据所述连接请求发回的回馈信息。
S235、确定响应时间作为探测信息,所述响应时间为所述连接请求与所述回馈信息之间的时间差。
探测机确定发送连接请求与接收到回馈信息之间的时间差作为被探测机在某一网络探测情况下的响应时间。
S24、根据所述探测信息确定探测结果。
探测结果包括连接异常与自身异常。连接异常为监控机上报的与其他监控机连接的网络异常,自身异常为监控机根据连接异常推测、上报的自身网络异常。
具体的,探测机确定与被探测机之间的响应时间,从该响应时间中,筛选出探测机与被探测机之间的网络连接超时的响应时间,作为异常时间。
若一探测机与一被探测机之间出现异常时间的次数符合第一条件,说明该探测机与该被探测机之间可能存在延时、丢包的情况。第一条件为出现异常时间的次数不超过响应时间总数量的一半。此时生成连接异常的探测结果。若一探测机与一被探测机之间出现异常时间的次数符合第二条件,说明该探测机本身所在的边缘计算节点的网络异常。
一般的,探测机A有n个被探测机,每个被探测机出现网络异常为等概率事件,将其概率记为p,p在(0,1)之间,一般远小于1。大于一半的被探测机出现网络异常的概率为
Figure BDA0002502015610000131
而探测机出现网络异常的概率为q。因为
Figure BDA0002502015610000132
即超过一半的被探测机出现异常的概率远低于探测机出现网络异常的概率,一旦发生此概率,则由此可以推导出探测机所在的边缘计算节点的上行链路网络异常。此时生成自身异常的探测结果。
调度管理平台接收监控机发回的探测结果,根据探测结果综合评定每个边缘计算节点的网络质量。每个监控机都会发回探测结果,调度管理平台统计每个监控机发回的探测结果。
若监控机发回的探测结果为自身异常,则确定上报自身异常的监控机所在的边缘计算节点的网络质量低。
若控机发回的探测结果为连接异常,则确连接异常关联的监控机;当一监控机与超过预设异常数量的连接异常关联,则确定监控机所在的边缘计算节点的网络质量低。
S25、向调度管理平台发送所述探测结果。
由此可见,本申请提供的技术方案通过自动从边缘计算网络中选取一台节点机作为监控机,确定监控机的探测目标,接收监控机对探测目标进行网络探测后发回的探测结果,以综合评定每个所述边缘计算节点的网络质量。从而实现自动监控、自动调度、自动识别、自动告警等功能。
实施例3
图6为本发明实施例3提供的一种监控网络质量的装置的结构示意图,该装置包括:探测目标确定模块61、探测结果接收模块62和网络质量确定模块63。其中:
探测目标确定模块61,用于确定所述监控机的探测目标,所述探测目标为其他所述边缘计算节点中的所述监控机;
探测结果接收模块62,用于接收所述监控机对所述探测目标进行网络探测发回的探测结果;
网络质量确定模块63,用于根据所述探测结果确定所述边缘计算网络的网络质量。
由此可见,本申请提供的技术方案通过自动从边缘计算网络中选取一台节点机作为监控机,确定监控机的探测目标,接收监控机对探测目标进行网络探测后发回的探测结果,以综合评定每个所述边缘计算节点的网络质量。从而实现自动监控、自动调度、自动识别、自动告警等功能。
在此基础上,探测目标确定模块61包括:
探测机选择子模块,用于选择第一标签的监控机作为探测机,所述第一标签表示所述监控机未被作为探测机;
被探测机选择子模块,用于根据所述区域信息和所述运营商信息确定与所述探测机关联的被探测机,所述被探测机为除探测机之外的其他监控机,所述被探测机为所述探测机的探测目标;
标签修改子模块,用于修改所述第一标签为第二标签;
执行返回子模块,用于返回执行选择第一标签的监控机作为探测机的操作,直到所有监控机的标签信息为第二标签。
在此基础上,被探测机选择子模块包括:
第一确定单元,用于从与所述探测机区域信息相同、运营商信息相同的监控机中,选择第一数量的监控机作为被探测机;
第二确定单元,用于从与所述探测机区域信息不同、运营商信息相同的监控机中,选择第二数量的监控机作为被探测机;
第三确定单元,用于从与所述探测机区域信息相同、运营商信息不同的监控机中,选择第三数量的监控机作为被探测机。
在此基础上,还包括:
频率确定模块,用于确定所述探测机的探测频率;
数值计算模块,用于将所述探测频率与所述被探测机的数量的乘积,作为所述探测机的实际监控能力值;
数值调整模块,用于调整所述探测频率或者所述被探测机的数量,以使所述实际监控能力值符合所述探测机的理论监控能力值。
在此基础上,所述探测结果包括自身异常;网络质量确定模块63包括:
第一异常确定子模块,用于确定所述探测结果为自身异常;
第一质量上报子模块,用于确定上报所述自身异常的监控机所在的边缘计算节点的网络质量低。
在此基础上,所述探测结果包括连接异常;网络质量确定模块63包括:
第二异常确定子模块,用于确定所述探测结果为连接异;
关联信息确子模块,用于确定所述连接异常关联的监控机;
第二质量上报子模块,用于当一监控机与超过预设异常数量的连接异常关联,则确定所述监控机所在的边缘计算节点的网络质量低。
实施例4
图7为本发明实施例3提供的一种监控网络质量的装置的结构示意图,该装置包括:目标请求发起模块71、探测目标接收模块72、网络探测发起模块73、探测结果确定模块74和探测结果发送模块75。其中:
目标请求发起模块71,用于向所述调度管理平台发起目标请求;
探测目标接收模块72,用于接收所述调度管理平台响应所述目标请求发回的探测目标,所述探测目标为其他所述边缘计算节点中的所述监控机;
网络探测发起模块73,用于向所述探测目标发起网络探测,以获得探测信息;
探测结果确定模块74,用于根据所述探测信息确定探测结果;
探测结果发送模块75,用于向调度管理平台发送所述探测结果。
由此可见,本申请提供的技术方案通过自动从边缘计算网络中选取一台节点机作为监控机,确定监控机的探测目标,接收监控机对探测目标进行网络探测后发回的探测结果,以综合评定每个所述边缘计算节点的网络质量。从而实现自动监控、自动调度、自动识别、自动告警等功能。
在此基础上,网络探测发起模块73包括:
探测机确定子模块,用于确定发起网络探测的所述监控机为探测机;
被探测机确定子模块,用于确定所述探测目标为被探测机;
连接请求发起子模块,用于所述探测机依次向所述被探测机发起连接请求;
回馈信息确定子模块,用于接收所述被探测机根据所述连接请求发回的回馈信息;
探测信息确定子模块,用于确定响应时间作为探测信息,所述响应时间为所述连接请求与所述回馈信息之间的时间差。
在此基础上,所述网络探测包括如下的至少一种:
基于tcp_ping协议发起网络探测;
基于tcp_connect发起网络探测;
基于udp_ping协议发起网络探测;
基于icmp_ping发起网络探测。
在此基础上,探测结果确定模块74包括:
异常时间确定子模块,用于从所述响应时间中筛选超过预设时间的异常时间,所述异常时间表示探测机与被探测机之间的网络连接超时;
连接异常生成子模块,用于当所述异常时间的数量符合第一条件,生成连接异常的探测结果,所述接异常表示被探测机所在的边缘计算节点的网络异常;
自身异常生成子模块,用于当所述异常时间的数量符合第二条件,生成自身异常的探测结果,所自身异常表示探测机所在的边缘计算节点的网络异常。
实施例5
请参阅图1,本申请还提供一种监控网络质量的***。调度管理平台关联有多个边缘计算节点,所述边缘计算节点包括一个监控机,该***包括:两个及其以上的边缘计算节点和调度管理平台;
边缘计算节点包括监控机,监控机关联有检测目标,探测目标为其他边缘计算节点中的监控机;
每个探测目标与监控机通信连接,探测目标向监控机发回探测结果,监控机根据探测结果确定其边缘计算节点的网络质量;
每个监控机与调度管理平台通信连接,监控机向调度管理平台上传探测结果,调度管理平台接收探测结果,并根据探测结果确定边缘计算网络的网络质量。
在此基础上,调度管理平台根据监控机的数量,确定理论探测链路数量;调度管理平台接收监控机发回的实际探测链路数量;确定探测链路差值,探测链路差值为理论探测链路数量与实际探测链路数量的差值;计算链路探测完整度,链路探测完整度为链路差值在理论探测链路数量的占比;当链路探测完整度低于完整度阈值时,确定监控边缘计算节点的网络质量的***异常。
一般的,调度管理平台在生成探测任务时,会统计探测机与探测目标的理论数量,也就是理论的探测链路数据。在调度管理平台接收到监控机发回的探测结果时,会从中统计探测机与探测目标的实际数量,也就是实际的探测链路数据。根据理论的探测链路数据与实际的的探测链路数据,完成对探测链路的完整度偏差计算,如下:
完整度偏差=(|理论探测链路数量-实际探测链路数量|/理论探测链路数量)*100%。
通过对探测链路的完整度偏差的计算,可以识别探测链路从生成、下发、生效,到网络质量监控数据最终存储入库,监控网络质量的***本身是否有异常,达到监控闭环的目的。例如:比如:对于A监控机,有m条探测链路,探测机实际上报的链路数为n,当n/m小于阈值时,***判定完整度异常,并触发告警、通知运营人员关注。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是机器人,个人计算机,服务器,或者网络设备等)执行本发明任意实施例所述的监控网络质量的方法。
值得注意的是,上述监控网络质量的装置中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“在一实施例中”、“在又一实施例中”、“示例性的”或“在具体的实施例中”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
虽然,上文中已经用一般性说明、具体实施方式及试验,对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。

Claims (14)

1.一种监控网络质量的方法,其特征在于,调度管理平台关联有多个边缘计算节点,边缘计算节点包括监控机,所述方法运用于所述调度管理平台,所述方法包括:
确定所述监控机的探测目标,所述探测目标为其他所述边缘计算节点中的所述监控机;
接收所述监控机对所述探测目标进行网络探测发回的探测结果;
根据所述探测结果确定所述边缘计算网络的网络质量。
2.根据权利要求1所述的方法,其特征在于,所述监控机关联有区域信息、运营商信息和标签信息,所述标签信息包括第一标签和第二标签;
所述确定所述监控机的探测目标,包括:
选择第一标签的监控机作为探测机,所述第一标签表示所述监控机未被作为探测机;
根据所述区域信息和所述运营商信息确定与所述探测机关联的被探测机,所述被探测机为除探测机之外的其他监控机,所述被探测机为所述探测机的探测目标;
修改所述第一标签为第二标签;
返回执行选择第一标签的监控机作为探测机的操作,直到所有监控机的标签信息为第二标签。
3.根据权利要求2所述的方法,其特征在于,所述根据所述区域信息和所述运营商信息确定与所述探测机关联的被探测机,包括:
从与所述探测机区域信息相同、运营商信息相同的监控机中,选择第一数量的监控机作为被探测机;
从与所述探测机区域信息不同、运营商信息相同的监控机中,选择第二数量的监控机作为被探测机;
从与所述探测机区域信息相同、运营商信息不同的监控机中,选择第三数量的监控机作为被探测机。
4.根据权利要求3所述的方法,其特征在于,还包括:
确定所述探测机的探测频率;
将所述探测频率与所述被探测机的数量的乘积,作为所述探测机的实际监控能力值;
调整所述探测频率或者所述被探测机的数量,以使所述实际监控能力值符合所述探测机的理论监控能力值。
5.根据权利要求1所述的方法,其特征在于,所述探测结果包括自身异常;
所述根据所述探测结果确定所述边缘计算网络的网络质量,包括:
确定所述探测结果为自身异常;
确定上报所述自身异常的监控机所在的边缘计算节点的网络质量低。
6.根据权利要求1所述的方法,其特征在于,所述探测结果包括连接异常;
所述根据所述探测结果确定所述边缘计算网络的网络质量,包括:
确定所述探测结果为连接异;
确定所述连接异常关联的监控机;
当一监控机与超过预设异常数量的连接异常关联,则确定所述监控机所在的边缘计算节点的网络质量低。
7.一种监控网络质量的方法,其特征在于,调度管理平台关联有多个边缘计算节点,边缘计算节点包括监控机,所述方法运用于所述监控机,所述方法包括:
向所述调度管理平台发起目标请求;
接收所述调度管理平台响应所述目标请求发回的探测目标,所述探测目标为其他所述边缘计算节点中的所述监控机;
向所述探测目标发起网络探测,以获得探测信息;
根据所述探测信息确定探测结果;
向调度管理平台发送所述探测结果。
8.根据权利要求7所述的方法,其特征在于,所述向所述探测目标发起网络探测,以获得探测信息,包括:
确定发起网络探测的所述监控机为探测机;
确定所述探测目标为被探测机;
所述探测机依次向所述被探测机发起连接请求;
接收所述被探测机根据所述连接请求发回的回馈信息;
确定响应时间作为探测信息,所述响应时间为所述连接请求与所述回馈信息之间的时间差。
9.根据权利要求7或8所述的方法,其特征在于,所述网络探测包括如下的至少一种:
基于tcp_ping协议发起网络探测;
基于tcp_connect发起网络探测;
基于udp_ping协议发起网络探测;
基于icmp_ping发起网络探测。
10.根据权利要求8所述的方法,其特征在于,所述根据所述探测信息确定探测结果,包括:
从所述响应时间中筛选超过预设时间的异常时间,所述异常时间表示探测机与被探测机之间的网络连接超时;
当所述异常时间的数量符合第一条件,生成连接异常的探测结果,所述接异常表示被探测机所在的边缘计算节点的网络异常;
当所述异常时间的数量符合第二条件,生成自身异常的探测结果,所自身异常表示探测机所在的边缘计算节点的网络异常。
11.一种监控网络质量的装置,其特征在于,调度管理平台关联有多个边缘计算节点,边缘计算节点包括监控机,所述装置包括:
探测目标确定模块,用于确定所述监控机的探测目标,所述探测目标为其他所述边缘计算节点中的所述监控机;
探测结果接收模块,用于接收所述监控机对所述探测目标进行网络探测发回的探测结果;
网络质量确定模块,用于根据所述探测结果确定所述边缘计算网络的网络质量。
12.一种监控网络质量的装置,其特征在于,调度管理平台关联有多个边缘计算节点,边缘计算节点包括监控机,所述装置包括:
目标请求发起模块,用于向所述调度管理平台发起目标请求;
探测目标接收模块,用于接收所述调度管理平台响应所述目标请求发回的探测目标,所述探测目标为其他所述边缘计算节点中的所述监控机;
网络探测发起模块,用于向所述探测目标发起网络探测,以获得探测信息;
探测结果确定模块,用于根据所述探测信息确定探测结果;
探测结果发送模块,用于向调度管理平台发送所述探测结果。
13.一种监控网络质量的***,其特征在于,包括:两个及其以上的边缘计算节点和调度管理平台;
所述边缘计算节点包括监控机,所述监控机关联有检测目标,所述探测目标为其他所述边缘计算节点中的所述监控机;
每个所述探测目标与所述监控机通信连接,所述探测目标向所述监控机发回探测结果,所述监控机根据所述探测结果确定其所述边缘计算节点的网络质量;
每个所述监控机与所述调度管理平台通信连接,所述监控机向所述调度管理平台上传所述探测结果,所述调度管理平台接收所述探测结果,并根据所述探测结果确定所述边缘计算网络的网络质量。
14.根据权利要求13所述的***,其特征在于,还包括:
所述调度管理平台根据所述监控机的数量,确定理论探测链路数量;
所述调度管理平台接收监控机发回的实际探测链路数量;
确定探测链路差值,所述探测链路差值为所述理论探测链路数量与所述实际探测链路数量的差值;
计算链路探测完整度,所述链路探测完整度为所述链路差值在所述理论探测链路数量的占比;
当所述链路探测完整度低于完整度阈值时,确定所述监控边缘计算节点的网络质量的***异常。
CN202010435314.XA 2020-05-21 2020-05-21 一种监控网络质量的方法、装置和*** Pending CN111884869A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010435314.XA CN111884869A (zh) 2020-05-21 2020-05-21 一种监控网络质量的方法、装置和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010435314.XA CN111884869A (zh) 2020-05-21 2020-05-21 一种监控网络质量的方法、装置和***

Publications (1)

Publication Number Publication Date
CN111884869A true CN111884869A (zh) 2020-11-03

Family

ID=73154139

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010435314.XA Pending CN111884869A (zh) 2020-05-21 2020-05-21 一种监控网络质量的方法、装置和***

Country Status (1)

Country Link
CN (1) CN111884869A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114285770A (zh) * 2021-12-25 2022-04-05 即刻雾联科技(北京)有限公司 一种基于全链路探测的pcdn节点评估方法和终端
CN114584485A (zh) * 2022-01-30 2022-06-03 阿里巴巴(中国)有限公司 检测边缘网络质量的方法、装置、设备和计算机可读存储介质
CN114615337A (zh) * 2022-01-27 2022-06-10 网宿科技股份有限公司 设备调度方法、***、服务器及存储介质
CN114679443A (zh) * 2022-03-03 2022-06-28 北京百度网讯科技有限公司 一种下载视频数据的方法、装置、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102136969A (zh) * 2011-02-17 2011-07-27 北京蓝汛通信技术有限责任公司 探测链路质量的方法、装置和***
CN102347864A (zh) * 2011-11-02 2012-02-08 网宿科技股份有限公司 基于内容分发网络的服务质量监控***
CN102624584A (zh) * 2012-03-01 2012-08-01 中兴通讯股份有限公司 链路检测方法及装置
CN108768792A (zh) * 2018-07-06 2018-11-06 网宿科技股份有限公司 网络探测***
CN109787827A (zh) * 2019-01-18 2019-05-21 网宿科技股份有限公司 一种cdn网络监控的方法及装置
CN109889569A (zh) * 2019-01-03 2019-06-14 网宿科技股份有限公司 Cdn服务调度方法及***

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102136969A (zh) * 2011-02-17 2011-07-27 北京蓝汛通信技术有限责任公司 探测链路质量的方法、装置和***
CN102347864A (zh) * 2011-11-02 2012-02-08 网宿科技股份有限公司 基于内容分发网络的服务质量监控***
CN102624584A (zh) * 2012-03-01 2012-08-01 中兴通讯股份有限公司 链路检测方法及装置
CN108768792A (zh) * 2018-07-06 2018-11-06 网宿科技股份有限公司 网络探测***
CN109889569A (zh) * 2019-01-03 2019-06-14 网宿科技股份有限公司 Cdn服务调度方法及***
CN109787827A (zh) * 2019-01-18 2019-05-21 网宿科技股份有限公司 一种cdn网络监控的方法及装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114285770A (zh) * 2021-12-25 2022-04-05 即刻雾联科技(北京)有限公司 一种基于全链路探测的pcdn节点评估方法和终端
CN114615337A (zh) * 2022-01-27 2022-06-10 网宿科技股份有限公司 设备调度方法、***、服务器及存储介质
CN114615337B (zh) * 2022-01-27 2024-04-12 网宿科技股份有限公司 设备调度方法、***、服务器及存储介质
CN114584485A (zh) * 2022-01-30 2022-06-03 阿里巴巴(中国)有限公司 检测边缘网络质量的方法、装置、设备和计算机可读存储介质
CN114584485B (zh) * 2022-01-30 2023-10-31 阿里巴巴(中国)有限公司 检测边缘网络质量的方法、装置、设备和计算机可读存储介质
CN114679443A (zh) * 2022-03-03 2022-06-28 北京百度网讯科技有限公司 一种下载视频数据的方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN111884869A (zh) 一种监控网络质量的方法、装置和***
US7574502B2 (en) Early warning of potential service level agreement violations
US7412448B2 (en) Performance degradation root cause prediction in a distributed computing system
US20130212422A1 (en) Method And Apparatus For Rapid Disaster Recovery Preparation In A Cloud Network
US20130024568A1 (en) Management communication
US20160226714A1 (en) Method and device for monitoring network link and storage medium therefor
US20200327045A1 (en) Test System and Test Method
WO2017000536A1 (zh) 一种bfd检测方法与装置
Xu et al. Lightweight and adaptive service api performance monitoring in highly dynamic cloud environment
Cao et al. {ENVI}: elastic resource flexing for network function virtualization
JP6220625B2 (ja) 遅延監視システムおよび遅延監視方法
CN109617758B (zh) 节点网络质量计算方法及装置、服务器、计算机存储介质
US10225371B2 (en) Method and network components and self-organizing network
CN117242754A (zh) 用于自主网络测试用例生成的方法、***和计算机可读介质
CN113422696A (zh) 监控数据更新方法、***、设备及可读存储介质
CN110266741B (zh) 一种内容分发网络中的客户业务自动调度方法及装置
CN111200520A (zh) 网络监控方法、服务器和计算机可读存储介质
CN111786846B (zh) 一种确定监控机的方法、装置、设备和存储介质
CN113055291B (zh) 一种数据包发送方法、路由器、数据包传输***
EP3252995A1 (en) Method for detecting network failures
US20100153543A1 (en) Method and System for Intelligent Management of Performance Measurements In Communication Networks
KR101490316B1 (ko) 네트워크 장비의 장애 검출 시스템 및 이를 이용한 장애 검출 방법
JP2014137635A (ja) 応答時間監視プログラム、方法および応答時間監視装置
Abderrahim et al. Dependability integration in cloud-hosted telecommunication services
Hossfeld et al. Comparing the scalability of communication networks and systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201103