CN111585833A - 一种探测cdn节点公网质量的方法、装置和计算机设备 - Google Patents

一种探测cdn节点公网质量的方法、装置和计算机设备 Download PDF

Info

Publication number
CN111585833A
CN111585833A CN202010273192.9A CN202010273192A CN111585833A CN 111585833 A CN111585833 A CN 111585833A CN 202010273192 A CN202010273192 A CN 202010273192A CN 111585833 A CN111585833 A CN 111585833A
Authority
CN
China
Prior art keywords
detection
fault event
fault
event
cdn
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010273192.9A
Other languages
English (en)
Other versions
CN111585833B (zh
Inventor
赵东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sina Technology China Co Ltd
Original Assignee
Sina Technology China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sina Technology China Co Ltd filed Critical Sina Technology China Co Ltd
Priority to CN202010273192.9A priority Critical patent/CN111585833B/zh
Publication of CN111585833A publication Critical patent/CN111585833A/zh
Application granted granted Critical
Publication of CN111585833B publication Critical patent/CN111585833B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • H04L43/0829Packet loss
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0852Delays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例提供一种探测CDN节点公网质量的方法、装置和计算机设备,该方法包括:探测是否具有符合故障事件条件的点到点P2P探测对;所述故障事件条件包括:被探测的P2P探测对之间出现丢包率超过第一预设阈值,并且持续第一预设时长;和/或,被探测的P2P探测对之间出现延时值比上一次采集的延时值增加第二预设阈值,并且持续第二预设时长;所述P2P探测对对应于两个CDN网络节点;如果具有符合故障事件条件的P2P探测对,则判定产生P2P类故障事件。本发明的实施例将每个CDN节点抽象为一个逻辑站点,通过CDN节点使用ping/tcping等探针工具实时探测远端目的网络质量,通过丢包率(packet loss)和延时(delay)等指标判断CDN节点之间网络质量好坏,以及是否存在P2P类故障事件。

Description

一种探测CDN节点公网质量的方法、装置和计算机设备
技术领域
本发明涉及网络通信领域,具体涉及一种探测CDN节点公网质量的方法、装置和计算机设备。
背景技术
CDN的全称是Content Delivery Network,即内容分发网络。CDN是构建在现有网络基础之上的智能虚拟网络,依靠部署在各地的边缘服务器,通过中心平台的负载均衡、内容分发、调度等功能模块,使用户就近获取所需内容,降低网络拥塞,提高用户访问响应速度和命中率。CDN的关键技术主要有内容存储和分发技术。CDN网络的诞生大大地改善了互联网的服务质量,因此传统的大型网络运营商纷纷开始建设自己的CDN网络,如 AT&T、德国电信、中国电信等。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:运维人员手工登陆指定CDN节点服务器进行手工探测,实时性差。
发明内容
本发明实施例提供一种探测CDN节点公网质量的方法、装置和计算机设备,以解决手工探测实时性差的问题。
第一方面,本发明实施例提供了一种探测CDN网络节点公网质量的方法,其包括:
探测是否具有符合故障事件条件的点到点P2P探测对;所述故障事件条件包括:被探测的P2P探测对之间出现丢包率超过第一预设阈值,并且持续第一预设时长;和/或,被探测的P2P探测对之间出现延时值比上一次采集的延时值增加第二预设阈值,并且持续第二预设时长;所述P2P探测对对应于两个CDN网络节点;
如果具有符合故障事件条件的P2P探测对,则判定产生P2P类故障事件。
第二方面,本发明实施例提供了一种探测CDN网络节点公网质量的装置,其包括:
探测模块,用于探测是否具有符合故障事件条件的点到点P2P探测对;所述故障事件条件包括:被探测的P2P探测对之间出现丢包率超过第一预设阈值,并且持续第一预设时长;和/或,被探测的P2P探测对之间出现延时值比上一次采集的延时值增加第二预设阈值,并且持续第二预设时长;所述P2P探测对对应于两个CDN网络节点;
判定模块,用于如果具有符合故障事件条件的P2P探测对,则判定产生P2P类故障事件。
第三方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述的探测CDN网络节点公网质量的方法。
第四方面,本发明实施例提供了一种探测CDN网络节点公网质量的计算机设备,其特征在于,其包括:一个或多个处理器;存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述的探测 CDN网络节点公网质量的方法。
上述技术方案具有如下有益效果:本发明的实施例将每个CDN节点抽象为一个逻辑站点,通过CDN节点使用ping/tcping等探针工具实时探测远端目的网络质量,通过丢包率(packet loss)和延时(delay)等指标判断CDN节点之间网络质量好坏,以及是否存在P2P类故障事件。本发明的实施例能够对CDN节点进行自动化探测,实时性好,可以溯源,可以知晓全局网络质量进而帮助决策者做积极的调整。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的一种探测CDN网络节点公网质量的方法的流程图。
图2是本发明实施例的P2P点到点网络模型示意图;
图3是本发明实施例的P2MP点到多点网络模型示意图;
图4是本发明实施例的P2AP点到所有点网络模型示意图;
图5是本发明实施例的探测模型为fullmesh的探测关系示意图;
图6A-图6B是本发明实施例的作为一个举例的判断异常事件产生的详细逻辑流程图;
图7是本发明实施例的数据的收集、处理、上报和展示的示意图;
图8是本发明实施例的通过fullmesh方式呈现的任意节点到其他任意节点的实时探测结果示意图;
图9是本发明实施例的故障历史记录在前端的显示举例图;
图10是本发明的实施例的一种探测CDN网络节点公网质量的功能框图;
图11是本发明实施例的一种探测CDN网络节点公网质量的计算机设备的功能框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例的一种探测CDN网络节点公网质量的方法的流程图。如图1所示,其包括如下步骤:
S110:探测是否具有符合故障事件条件的点到点P2P探测对;该故障事件条件包括:被探测的P2P探测对之间出现丢包率超过第一预设阈值,并且持续第一预设时长;和/或,被探测的P2P探测对之间出现延时值比上一次采集的延时值增加第二预设阈值,并且持续第二预设时长;P2P探测对对应于两个CDN网络节点;
S120:如果具有符合故障事件条件的P2P探测对,则判定产生P2P类故障事件。
进一步地,该方法还可以包括如下步骤:确定P2P类故障事件的事件类型;事件类型包括:存在丢包延时增大;或者,不通。
进一步地,该方法还可以包括如下步骤:当P2P类故障事件的事件类型为存在丢包延时增大时,进一步判断P2P探测对的两端是否具有各自的点到多点P2MP类故障事件;若P2P探测对的两端均不具有各自的P2MP类故障事件,则确定P2P探测对之间出现公网质量变差异常,将P2P探测对加入黑名单,再将P2P类故障事件及其测试数据上报监控***。
进一步地,该方法还可以包括如下步骤:若P2P探测对的两端中的至少一端具有各自的P2MP类故障事件,则将P2MP类故障事件对应的全部P2P探测对(即P2MP探测对, P2MP探测对包括多组P2P探测对)加入黑名单,再判断该至少一端对应的CDN网络节点的出口是否存在流量拥塞;若存在流量拥塞,则确定P2P类故障事件由流量拥塞产生,并且上报监控***;若不存在流量拥塞,则确定P2MP类故障事件对应的全部P2P探测对之间出现公网质量变差异常,将P2MP类故障事件及其测试数据上报监控***。
进一步地,该方法还可以包括如下步骤:当P2P类故障事件的事件类型为不通时,进一步判断P2P探测对的两端是否具有各自的P2MP类故障事件存在;若P2P探测对的两端均不具有P2MP类故障事件,确定P2P探测对之间出现公网不通异常,将P2P探测对加入黑名单,再将P2P类故障事件及其测试数据上报监控***。
进一步地,该方法还可以包括如下步骤:若P2P探测对的两端中至少一端具各自的有 P2MP类故障事件,则将P2MP类故障事件对应的全部P2P探测对全部加入黑名单,再判断该至少一端对应的CDN网络节点的出口是否存在流量拥塞;若存在流量拥塞,确定P2P 类故障事件由流量拥塞产生,将P2P类故障事件由流量拥塞产生上报监控***。
进一步地,该方法还可以包括如下步骤:若不存在流量拥塞,则进一步判断至少一端是否具有点到全部点P2AP类故障事件;若不具有P2AP类故障事件,将P2MP类故障事件及其测试数据上报监控***;若具有P2AP类故障事件,判断至少一端对应的CDN网络节点的其他监控探测器的探测结果是否也具有P2AP类故障事件;若其他监控探测器的探测结果不具有P2AP类故障事件,确定主监控探测器故障,将主监控探测器异常事件上报监控***;若其他监控探测器的探测结果具有P2AP类故障事件,确定该至少一端对应的 CDN网络节点脱网,将该至少一端对应的CDN网络节点脱网事件上报监控***。
进一步地,判断P2P探测对的两端是否具有各自的点到多点P2MP类故障事件,可以包括如下步骤;分别判断其他CDN网络节点到P2P探测对的每一端对应的CDN网络节点之间是否存在异常,存在异常的判定条件包括:当前丢包率超过第一预设阈值;和/或,当前延时值比上一次采集的延时值增加第二预设阈值;当存在异常时,确定P2P探测对的当前端不具有P2MP类故障事件,当不存在异常时,确定P2P探测对的当前端具有P2MP类故障事件。
进一步地,该方法还可以包括如下步骤:预先在所有CDN网络节点均部署监控探测器,其中,任意两个CDN网络节点之间均存在探测关系,所述监控探测器包括ping或者tcping。
本发明的实施例提供了一种实时探测公网CDN节点网络质量的方法和计算机设备。本发明的实施例为了增强公网质量监控的实时性、可溯源、提供故障异常预警能力,提供可视化能力,提供全局网络质量呈现方法,提供实时详尽的监控基础数据,进而帮助网络决策者分析网络运行质量,帮助网络决策者在发生故障时快速做出判断和积极的调整。
本发明的实施例引入P2P(point-to-point)点到点概念,P2MP(point-to-multipoint) 点到多点概念,P2AP(point-to-allpoint)点到全部点概念,将每个CDN节点抽象为一个逻辑站点;通过CDN节点的服务器使用ping/tcping等探针工具实时探测远端目的网络质量,通过丢包率(packet loss)和延时(delay)等指标判断网络质量好坏;通过在所有CDN 节点均部署探针(监控探测器)并且对全网所有其他节点进行实时探测,获取到全网 fullmesh模型的探测结果;将所有CDN节点的探测结果上传到数据接收机,数据接收机做接收和存储处理;展示平台模块调取存储的探测结果进行前端fullmesh展示。其中,数据接收机为专门做数据存储的数据库设备,监控数据会以预先指定的格式存入数据库设备。数据库设备是监控***的一部分,负责数据的存储和调取。监控***包括数据接收机和展示平台模块。
本发明的实施例的技术方案适用于机构或公司存在多个公网CDN网络节点的情况。
以下对本发明的实施例的技术方案进行更加详细的说明:
一、网络模型阐述
1.P2P点到点
将每个公网CDN网络节点抽象成一个点,P2P就是如图2所示,两点形成的探测关系。
2.P2MP点到多点
将每个公网CDN网络节点抽象成一个点,P2MP就是如图3所示,CDN网络节点1 到2、3、4形成的探测关系。
3.P2AP点到其他所有点
将每个公网CDN网络节点抽象成一个点,P2AP就是如图4所示,CDN网络节点1 到2、3、4…N所形成的探测关系。
二、探测工具
探测模型为fullmesh,即任意两点间均存在探测关系,以5个站点举例,如图5。监控探测器使用网络探针工具如ping、tcping等进行探测,每轮探测例如100次,CDN节点部署的监控探测器将每轮返回的丢包率统计结果、延时结果以及时间戳上传至监控***做存储。
三、判断异常事件产生的详细逻辑
如图6A-图6B的流程图所示,包括如下步骤:
步骤S1:监控探测器首先发现符合产生故障事件条件的P2P探测对。
步骤S2:查看该P2P探测对是否在黑名单中,若在,事件结束。
具体地,黑名单指的是一个P2P探测对的列表,在该列表中的P2P探测对如果触发了故障事件条件,则不会进行步骤S3以及后续的故障判断步骤。
步骤S3:若该P2P探测对不在黑名单,则产生P2P类的故障事件。
步骤S4:判断该P2P类故障事件的事件类型,事件类型分两种:存在丢包、延时增大、抖动;不通。
在本步骤中,具体判断方法是,分别判断两端的CDN节点与其他的CDN节点是否有P2P类故障事件。判断规则详见后文的“故障事件生成条件”。
步骤S5:若故障事件类型为丢包延时增大,继续判断该P2P探测对的两端是否有各自的P2MP类故障事件存在。
在本步骤中,判断该P2P探测对以外的其他节点与该P2P探测对中的每个节点之间是否存在P2MP故障。
步骤S6:接步骤S5,若没有,说明只有该P2P探测对之间出现公网质量变差异常,因此先将该P2P探测对加入黑名单以免***做重复判断,再将该P2P故障事件与其mtr等测试数据上报到监控***,事件结束。
在本步骤中,mtr是指Matt’s traceroute,一种开源的网络诊断分析工具。
步骤S7:接步骤S5,若有,将相关的预故障事件,即P2MP类故障事件对应的全部P2P探测对全部放入黑名单,以免***做重复判断。再判断机房,即具有P2MP类故障事件的前述至少一端包含的CDN网络节点的出口是否存在流量拥塞。
步骤S8:接步骤S7,若存在,说明该事件由流量拥塞产生,直接上报监控***,事件结束。
步骤S9:接步骤S7,若不存在,说明该P2MP探测对之间出现公网质量变差异常,将该P2MP故障事件与其mtr等测试数据上报到监控***,事件结束。
步骤S10:接步骤S4,若事件类型为不通,判断两端是否有P2MP故障存在。
步骤S11:接步骤S10,若没有,说明只有该P2P探测对之间出现公网不通异常,因此先将该P2P探测对加入黑名单以免***做重复判断,再将该P2P故障事件与其mtr等测试数据上报到监控***,事件结束。
步骤S12:接步骤S10,若有,将P2MP类故障事件对应的全部P2P探测对全部放入黑名单,以免***做重复判断。再判断是否机房(CDN网络节点)出口存在流量拥塞。
步骤S13:接步骤S12,若存在,说明该事件由流量拥塞产生,直接上报监控***,事件结束。
步骤S14:接步骤S12,若不存在,继续判断是否是P2AP故障。
具体地,判断是否是P2AP故障的步骤包括:判断该CDN节点与其他所有的CDN节点是否都存在P2P故障事件。判断规则参阅下文的“故障事件生成条件”。
步骤S15:接步骤S14,若不是,将该P2MP故障事件与其mtr等测试数据上报到监控***,事件结束。
步骤S16:接步骤S14,若是,判断本机房(CDN网络节点)其他监控探测器的探测结果是否也是P2AP故障。
在可选实施例中,一个CDN网络节点上可以部署多个监控探测器,包括主监控探测器和备用监控探测器。通过分别抓取主备监控探测器的监控数据或结果进行对比,可判断主监控探测器本身是否发生故障。
步骤S17:接步骤S16,若不是,说明是主监控探测器故障,将主监控探测器异常事件上报监控***。
具体地,该监控***用于收集、存储监控数据,按照规则判断故障事件,并且在展示平台将故障实时进行展示。
步骤S18:接步骤S16,若是,说明机房(P2P探测对包含的CDN网络节点)脱网,将CDN网络节点脱网事件上报监控***。在本步骤中,P2AP故障出现,表明一个CDN 网络节点到所有其他CDN网络节点都无法通信,可以判断为该CDN网络节点脱网。在一些可选的实施例中,也可以将P2AP类故障事件上报监控***,或者将CDN网络节点脱网事件上报和P2AP类故障事件一起上报监控***。
一些概念的定义:
(1)故障事件生成条件
被检测或探测的任意两个CDN网络节点之间出现丢包率超过5%,并且持续5分钟。
被检测或探测的任意两个CDN网络节点之间出现延时比上一次采集值增加50%,并且持续5分钟。
上述条件满足其中任意一个即可。
(2)黑名单保留时间
进入黑名单的P2P监控项不再产生故障事件。
(3)P2MP事件成立条件
判断其他节点到该节点是否存在异常,异常条件为:
当前丢包率超过第一预设阈值,例如5%。
当前延时值比上一次采集的延时值增加第二预设阈值,例如50%。
P2AP故障事件成立条件为:判断一个CDN节点与其他所有的CDN节点是否都存在P2P类故障事件。
四、数据的收集与处理
如图7,各个节点的探针,即监控探测器201将探测数据统一发往数据接收端(即监控***)的指定API接口,数据接收端将数据存入相关数据库便于后续调用和平台展示。监控***包括数据接收机202和平台展示模块203。
五、可视化展示部分设计
(1)实时探测结果展示:
展示方法通过fullmesh方式呈现,可以有效显示出任意节点到其他任意节点的实时探测结果,与采集数据模式相匹配,并且可实时刷新最新的P2P探测结果,如图8。fullmesh 方式表示一种关联形式,即所有结点之间都进行关联的形式。
(2)故障历史记录保存:
以节点出口运营商信息、节点名称、探针信息、告警内容、告警时间等内容存储至后台并在前端显示。请参阅图9示出的举例。
本发明实施例还提供了一种探测CDN网络节点公网质量的装置。如图10所示,其包括:
探测模块,用于探测是否具有符合故障事件条件的点到点P2P探测对;故障事件条件包括:被探测的P2P探测对之间出现丢包率超过第一预设阈值,并且持续第一预设时长;和/或,被探测的P2P探测对之间出现延时值比上一次采集的延时值增加第二预设阈值,并且持续第二预设时长;P2P探测对对应于两个CDN网络节点;
P2P类故障事件判定模块,用于如果具有符合故障事件条件的P2P探测对,则判定产生P2P类故障事件。
进一步地,该装置还可以包括:事件类型确定模块,用于确定P2P类故障事件的事件类型;事件类型包括:存在丢包延时增大;或者,不通。
进一步地,该装置还可以包括:
第一P2MP类故障事件判断模块,用于当P2P类故障事件的事件类型为存在丢包延时增大时,进一步判断P2P探测对的两端是否具有各自的点到多点P2MP类故障事件;
第一处理上报模块,用于若P2P探测对的两端均不具有各自的P2MP类故障事件,则确定P2P探测对之间出现公网质量变差异常,将该P2P探测对加入黑名单,再将P2P类故障事件及其测试数据上报监控***。
进一步地,该装置还可以包括:
第二处理上报模块,用于若所述P2P探测对的两端中至少一端具有各自的P2MP类故障事件,则将所述P2MP类故障事件对应的全部P2P探测对加入所述黑名单,再判断所述至少一端对应的CDN网络节点的出口是否存在流量拥塞;若存在流量拥塞,则确定所述 P2P类故障事件由流量拥塞产生,并且上报所述监控***;若不存在流量拥塞,则确定所述P2MP类故障事件对应的全部P2P探测对之间出现公网质量变差异常,将所述P2MP类故障事件及其测试数据上报所述监控***。
进一步地,该装置还可以包括:
第二P2MP类故障事件判断模块,用于当P2P类故障事件的事件类型为不通时,进一步判断P2P探测对的两端是否具有各自的P2MP类故障事件存在;
第三处理上报模块,用于若P2P探测对的两端均不具有P2MP类故障事件,确定该P2P 探测对之间出现公网不通异常,将该P2P探测对加入黑名单,再将P2P类故障事件及其测试数据上报监控***。
进一步地,该装置还可以包括:
第四处理上报模块,被配置为:若所述P2P探测对的两端中至少一端具有各自的P2MP 类故障事件,则将所述P2MP类故障事件对应的全部P2P探测对加入黑名单,再判断所述至少一端对应的CDN网络节点的出口是否存在流量拥塞;若存在流量拥塞,确定所述P2P类故障事件由流量拥塞产生,将所述P2P类故障事件由流量拥塞产生上报所述监控***。
进一步地,该装置还可以包括:第五处理上报模块,被配置为:
若不存在流量拥塞,则进一步判断所述至少一端是否具有点到全部点P2AP类故障事件;若不具有P2AP类故障事件,将所述P2MP类故障事件及其测试数据上报所述监控***;若具有P2AP类故障事件,判断所述至少一端对应的CDN网络节点的其他监控探测器的探测结果是否也具有P2AP类故障事件;若其他监控探测器的探测结果不具有P2AP类故障事件,确定主监控探测器故障,将主监控探测器异常事件上报所述监控***;若其他监控探测器的探测结果具有P2AP类故障事件,确定所述至少一端对应的CDN网络节点脱网,将所述至少一端对应的CDN网络节点脱网事件上报所述监控***。
其中,进一步判断P2P探测对的两端是否具有各自的点到多点P2MP类故障事件,包括;分别判断其他CDN网络节点到所述P2P探测对的每一端对应的CDN网络节点之间是否存在异常,所述存在异常的判定条件包括:当前丢包率超过所述第一预设阈值;和/或,当前延时值比上一次采集的延时值增加所述第二预设阈值;当存在异常时,确定所述P2P 探测对的当前端不具有P2MP类故障事件,当不存在异常时,确定所述P2P探测对的当前端具有P2MP类故障事件。
进一步地,该装置还包括部署模块,用于预先在所有CDN网络节点均部署监控探测器,其中,任意两个CDN网络节点之间均存在探测关系,监控探测器包括ping或者tcping。本发明实施例还提供了一种探测CDN网络节点公网质量的计算机设备,如图10所示,包括一个或多个处理器301、通信接口302、存储器303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信。
存储器303,用于存放计算机程序;
处理器301,用于执行存储器303上所存放的程序时,实现上述探测CDN节点公网质量的方法的各步骤。
在现有技术中,运维人员手工登陆指定CDN节点服务器进行手工探测,实时性差,无法溯源,无法查看历史数据,无预警能力,无可视化,无法知晓全局网络质量进而帮助决策者做积极的调整。本发明的实施例的计算机设备解决了现有技术的上述技术问题。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA) 总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing, DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列 (Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现上述的探测CDN网络节点公网质量的方法的各步骤。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备及可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (12)

1.一种探测CDN网络节点公网质量的方法,其特征在于,包括:
探测是否具有符合故障事件条件的点到点P2P探测对;所述故障事件条件包括:被探测的P2P探测对之间出现丢包率超过第一预设阈值,并且持续第一预设时长;和/或,被探测的P2P探测对之间出现延时值比上一次采集的延时值增加第二预设阈值,并且持续第二预设时长;所述P2P探测对对应于两个CDN网络节点;
如果具有符合故障事件条件的P2P探测对,则判定产生P2P类故障事件。
2.根据权利要求1所述的方法,其特征在于,还包括:
确定所述P2P类故障事件的事件类型;所述事件类型包括:存在丢包延时增大;或者,不通。
3.根据权利要求2所述的方法,其特征在于,还包括:
当所述P2P类故障事件的事件类型为存在丢包延时增大时,进一步判断所述P2P探测对的两端是否具有各自的点到多点P2MP类故障事件;
若所述P2P探测对的两端均不具有各自的P2MP类故障事件,则确定所述P2P探测对之间出现公网质量变差异常,将所述P2P探测对加入黑名单,再将所述P2P类故障事件及其测试数据上报监控***。
4.根据权利要求3所述的方法,其特征在于,还包括:
若所述P2P探测对的两端中至少一端具有各自的P2MP类故障事件,则将所述P2MP类故障事件对应的全部P2P探测对加入所述黑名单,再判断所述至少一端对应的CDN网络节点的出口是否存在流量拥塞;
若存在流量拥塞,则确定所述P2P类故障事件由流量拥塞产生,并且上报所述监控***;
若不存在流量拥塞,则确定所述P2MP类故障事件对应的全部P2P探测对之间出现公网质量变差异常,将所述P2MP类故障事件及其测试数据上报所述监控***。
5.根据权利要求2所述的方法,其特征在于,还包括:
当所述P2P类故障事件的事件类型为不通时,进一步判断所述P2P探测对的两端是否具有各自的P2MP类故障事件存在;
若所述P2P探测对的两端均不具有P2MP类故障事件,确定所述P2P探测对之间出现公网不通异常,将所述P2P探测对加入黑名单,再将所述P2P类故障事件及其测试数据上报监控***。
6.根据权利要求5所述的方法,其特征在于,还包括:
若所述P2P探测对的两端中至少一端具有各自的P2MP类故障事件,则将所述P2MP类故障事件对应的全部P2P探测对加入黑名单,再判断所述至少一端对应的CDN网络节点的出口是否存在流量拥塞;
若存在流量拥塞,确定所述P2P类故障事件由流量拥塞产生,将所述P2P类故障事件由流量拥塞产生上报所述监控***。
7.根据权利要求6所述的方法,其特征在于,还包括:
若不存在流量拥塞,则进一步判断所述至少一端是否具有点到全部点P2AP类故障事件;
若不具有P2AP类故障事件,将所述P2MP类故障事件及其测试数据上报所述监控***;
若具有P2AP类故障事件,判断所述至少一端对应的CDN网络节点的其他监控探测器的探测结果是否也具有P2AP类故障事件;
若其他监控探测器的探测结果不具有P2AP类故障事件,确定主监控探测器故障,将主监控探测器异常事件上报所述监控***;
若其他监控探测器的探测结果具有P2AP类故障事件,确定所述至少一端对应的CDN网络节点脱网,将所述至少一端对应的CDN网络节点脱网事件上报所述监控***。
8.根据权利要求3所述的方法,其特征在于,所述进一步判断所述P2P探测对的两端是否具有各自的点到多点P2MP类故障事件,包括;
分别判断其他CDN网络节点到所述P2P探测对的每一端对应的CDN网络节点之间是否存在异常,所述存在异常的判定条件包括:当前丢包率超过所述第一预设阈值;和/或,当前延时值比上一次采集的延时值增加所述第二预设阈值;
当存在异常时,确定所述P2P探测对的当前端不具有P2MP类故障事件,当不存在异常时,确定所述P2P探测对的当前端具有P2MP类故障事件。
9.根据权利要求1-8中任一所述的方法,其特征在于,还包括:
预先在所有CDN网络节点均部署监控探测器,其中,任意两个CDN网络节点之间均存在探测关系,所述监控探测器包括ping或者tcping。
10.一种探测CDN网络节点公网质量的装置,其特征在于,包括:
探测模块,用于探测是否具有符合故障事件条件的点到点P2P探测对;所述故障事件条件包括:被探测的P2P探测对之间出现丢包率超过第一预设阈值,并且持续第一预设时长;和/或,被探测的P2P探测对之间出现延时值比上一次采集的延时值增加第二预设阈值,并且持续第二预设时长;所述P2P探测对对应于两个CDN网络节点;
判定模块,用于如果具有符合故障事件条件的P2P探测对,则判定产生P2P类故障事件。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-9中任意一项所述的探测CDN网络节点公网质量的方法。
12.一种探测CDN网络节点公网质量的计算机设备,其特征在于,其包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-9中任一所述的探测CDN网络节点公网质量的方法。
CN202010273192.9A 2020-04-09 2020-04-09 一种探测cdn节点公网质量的方法、装置和计算机设备 Active CN111585833B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010273192.9A CN111585833B (zh) 2020-04-09 2020-04-09 一种探测cdn节点公网质量的方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010273192.9A CN111585833B (zh) 2020-04-09 2020-04-09 一种探测cdn节点公网质量的方法、装置和计算机设备

Publications (2)

Publication Number Publication Date
CN111585833A true CN111585833A (zh) 2020-08-25
CN111585833B CN111585833B (zh) 2022-03-11

Family

ID=72116781

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010273192.9A Active CN111585833B (zh) 2020-04-09 2020-04-09 一种探测cdn节点公网质量的方法、装置和计算机设备

Country Status (1)

Country Link
CN (1) CN111585833B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113300901A (zh) * 2020-08-27 2021-08-24 阿里巴巴集团控股有限公司 一种数据流监控方法、装置、电子设备以及存储介质
CN113438106A (zh) * 2021-06-22 2021-09-24 北京百度网讯科技有限公司 内容分发网络处理方法、装置及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104270291A (zh) * 2014-10-22 2015-01-07 网宿科技股份有限公司 Cdn网络质量监控方法
CN106130767A (zh) * 2016-09-23 2016-11-16 深圳灵动智网科技有限公司 一种业务路径故障监控及故障解决的***和方法
CN106130816A (zh) * 2016-06-24 2016-11-16 腾讯科技(深圳)有限公司 一种内容分发网络监控方法、监控服务器及***
US20160359592A1 (en) * 2015-06-05 2016-12-08 Cisco Technology, Inc. Techniques for determining network anomalies in data center networks
CN107493192A (zh) * 2017-08-08 2017-12-19 深圳市网心科技有限公司 用于视频cdn业务传输的基础网络质量评估方法和装置
CN109962790A (zh) * 2017-12-14 2019-07-02 北京金山云网络技术有限公司 一种网络质量监测方法、装置、电子设备及存储介质
US20190372856A1 (en) * 2015-04-06 2019-12-05 Level 3 Communications, Llc Server side content delivery network quality of service

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104270291A (zh) * 2014-10-22 2015-01-07 网宿科技股份有限公司 Cdn网络质量监控方法
US20190372856A1 (en) * 2015-04-06 2019-12-05 Level 3 Communications, Llc Server side content delivery network quality of service
US20160359592A1 (en) * 2015-06-05 2016-12-08 Cisco Technology, Inc. Techniques for determining network anomalies in data center networks
CN106130816A (zh) * 2016-06-24 2016-11-16 腾讯科技(深圳)有限公司 一种内容分发网络监控方法、监控服务器及***
CN106130767A (zh) * 2016-09-23 2016-11-16 深圳灵动智网科技有限公司 一种业务路径故障监控及故障解决的***和方法
CN107493192A (zh) * 2017-08-08 2017-12-19 深圳市网心科技有限公司 用于视频cdn业务传输的基础网络质量评估方法和装置
CN109962790A (zh) * 2017-12-14 2019-07-02 北京金山云网络技术有限公司 一种网络质量监测方法、装置、电子设备及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113300901A (zh) * 2020-08-27 2021-08-24 阿里巴巴集团控股有限公司 一种数据流监控方法、装置、电子设备以及存储介质
CN113300901B (zh) * 2020-08-27 2024-03-12 阿里巴巴集团控股有限公司 一种数据流监控方法、装置、电子设备以及存储介质
CN113438106A (zh) * 2021-06-22 2021-09-24 北京百度网讯科技有限公司 内容分发网络处理方法、装置及电子设备
CN113438106B (zh) * 2021-06-22 2023-02-21 北京百度网讯科技有限公司 内容分发网络处理方法、装置及电子设备
EP4175243A4 (en) * 2021-06-22 2023-08-23 Beijing Baidu Netcom Science Technology Co., Ltd. CONTENT DELIVERY NETWORK PROCESSING METHOD AND APPARATUS

Also Published As

Publication number Publication date
CN111585833B (zh) 2022-03-11

Similar Documents

Publication Publication Date Title
US11442803B2 (en) Detecting and analyzing performance anomalies of client-server based applications
CN105721184B (zh) 一种网络链路质量的监控方法及装置
WO2018126645A1 (zh) 一种通信网络管理方法及其装置
CN109962790B (zh) 一种网络质量监测方法、装置、电子设备及存储介质
US9680693B2 (en) Method and apparatus for network anomaly detection
CN111585833B (zh) 一种探测cdn节点公网质量的方法、装置和计算机设备
CN102740112B (zh) 一种基于视频监控***的设备轮巡的控制方法
JP2013518543A5 (zh)
CN112583642B (zh) 异常检测方法、模型、电子设备及计算机可读存储介质
WO2016033897A1 (zh) 一种网络链路监控方法和设备以及网络***和存储介质
CN110716842A (zh) 集群故障检测方法和装置
CN113542017A (zh) 基于网络拓扑和多指标的一种网络故障定位方法
US20160033583A1 (en) System to identify potential electrical network faults combining vibration and power quality analysis
CN114996090A (zh) 一种服务器异常检测方法、装置、电子设备及存储介质
CN111585819A (zh) 一种配网通信设备故障分析方法和***
CN113708956B (zh) 一种电路质量评测方法
CN110474821A (zh) 节点故障检测方法及装置
CN107154867A (zh) 网络故障检测方法及装置
CN107370618B (zh) 故障排查方法、装置及电子设备
JP2014053658A (ja) 障害部位推定システムおよび障害部位推定プログラム
CN112835780B (zh) 一种业务检测方法及装置
KR100500836B1 (ko) 매트로 이더넷망의 장애처리 장치 및 그 방법
CN114257414A (zh) 一种网络安全智能值班方法及***
CN113630284B (zh) 一种消息中间件的监控方法、装置及设备
WO2021249629A1 (en) Device and method for monitoring communication networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230406

Address after: Room 501-502, 5/F, Sina Headquarters Scientific Research Building, Block N-1 and N-2, Zhongguancun Software Park, Dongbei Wangxi Road, Haidian District, Beijing, 100193

Patentee after: Sina Technology (China) Co.,Ltd.

Address before: 100193 7th floor, scientific research building, Sina headquarters, plot n-1, n-2, Zhongguancun Software Park, Dongbei Wangxi Road, Haidian District, Beijing, 100193

Patentee before: Sina.com Technology (China) Co.,Ltd.