CN114095394A - 网络节点故障检测方法、装置、电子设备及存储介质 - Google Patents
网络节点故障检测方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114095394A CN114095394A CN202111415301.7A CN202111415301A CN114095394A CN 114095394 A CN114095394 A CN 114095394A CN 202111415301 A CN202111415301 A CN 202111415301A CN 114095394 A CN114095394 A CN 114095394A
- Authority
- CN
- China
- Prior art keywords
- network
- dimension
- fault
- data
- fault detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0817—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/10—Active monitoring, e.g. heartbeat, ping or trace-route
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Health & Medical Sciences (AREA)
- Cardiology (AREA)
- General Health & Medical Sciences (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本公开提供了一种网络节点故障检测方法、装置、电子设备及存储介质,涉及数据处理技术领域,尤其涉及网络故障定位技术领域。具体实现方案为:获取探测所述内容分发网络的节点得到的探测数据,并基于所述内容分发网络的多个维度,对所述探测的数据进行分析处理,得到用于当前故障判断的多维度探测数据;分别对每个维度的所述探测数据进行故障判断,得到每个维度下的故障检测结果;结合所述故障检测结果,确定所述内容分发网络的节点发生故障的维度。通过本公开可以更加准确的定位内容分发网络故障的维度。
Description
技术领域
本公开涉及数据处理技术领域,尤其涉及网络故障定位技术领域,具体涉及一种网络节点故障检测方法、装置、电子设备及存储介质。
背景技术
内容分发网络(Content Delivery Network,CDN)技术是构建在现有网络基础之上的智能虚拟网络技术。CDN包括多个CDN节点(node),为保证CDN节点的服务质量,采用探测机实时对CDN节点中的网络IP地址进行探测。通过探测数据确定CDN节点是否故障。
发明内容
本公开提供了一种网络节点故障检测方法、装置、电子设备及存储介质。
根据本公开的第一方面,提供了一种网络节点故障检测方法,应用于内容分发网络,包括:
获取探测所述内容分发网络得到的探测数据,并基于所述内容分发网络的多个维度,对所述探测的数据进行分析处理,得到用于当前故障判断的多维度探测数据;分别对每个维度的所述探测数据进行故障判断,得到每个维度下的故障检测结果;结合所述故障检测结果,确定所述内容分发网络当前发生故障的维度。
根据本公开的第二方面,提供了一种网络节点故障检测装置,应用于内容分发网络,包括:
处理模块,用于获取探测所述内容分发网络得到的探测数据,并基于所述内容分发网络的多个维度,对所述探测的数据进行分析处理,得到用于故障判断的多维度探测数据;还用于分别对每个维度的所述探测数据进行故障判断,得到每个维度下的故障检测结果;确定模块,用于结合所述故障检测结果,确定所述内容分发网络发生故障的维度。
根据本公开的第三方面,提供了一种电子设备,包括:
至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面所述的方法。
根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据第一方面所述的方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是本公开实施例提供的一种网络节点故障检测方法的流程示意图;
图2是本公开实施例提供的一种获取探测数据方法的流程示意图;
图3是本公开实施例提供的一种网络节点故障检测方法中处理探测数据的流程示意图
图4是本公开实施例提供的一种故障判断的流程示意图;
图5是本公开实施例提供的一种用于检测故障的故障检测阈值确定方法的流程示意图;
图6是本公开实施例提供的一种确定故障检测结果的流程示意图;
图7是本公开实施例提供的一种确定故障维度的流程示意图;
图8是本公开实施例提供的一种故障确定方法的流程示意图;
图9是本公开实施例提供的一种网络节点故障检测装置的结构示意图;
图10是用来实现本公开实施例的网络节点故障检测方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
在CDN技术中,CDN节点故障一般包括服务节点机器的物理性故障、服务节点机器的性能故障、网络传输故障和其他故障。其中,服务节点机器的物理性故障可以是机房掉电、磁盘损坏等故障。服务节点机器的性能故障可以是中央处理器(central processingunit,CPU)能力不足、磁盘输入输出能力不足等故障。网络传输故障可以是骨干网故障、网络拥塞等故障。其他故障可以是网络攻击、节点封禁等故障。
因此,为保证CDN节点的服务质量,需要通过有效的技术手段快速精准的识别出每个CDN节点的异常。相关技术中,CDN节点的异常一般包括两种情况,一种情况是CDN节点故障,另一种情况是网络IP链路故障。相关技术中利用探测数据直接筛选故障数据,确定与筛选出来的故障数据对应的CDN节点,将该CDN节点从网络中剔除。
但是相关技术中根据筛选的故障数据,直接将相应的CDN节点从网络中剔除,极易导致原承载在本地的流量,调度至偏远地区,引起过度容灾,进而引起服务质量受损,尤其是本地区服务质量会大幅度降低。
基于此,本公开提供一种网络节点故障检测方法,通过对每个维度的探测数据进行分析,准确的定位到发生故障的CDN故障位置维度,避免过度的故障容灾处理,引起对客户服务的服务器受损。
下面实施例将结合附图对网络节点故障检测方法进行说明。
图1示出了本公开实施例提供的一种网络节点故障检测方法的流程示意图,如图1中所示,该方法可以包括:
步骤S110:获取探测内容分发网络的节点得到的探测数据,并基于内容分发网络的多个维度,对探测的数据进行分析处理,得到用于当前故障判断的多维度探测数据。
在本公开实施例中,内容分发网络的多个维度包括节点维度,网络IP维度和网络链路维度。其中,在本公开中,网络IP维度也可以称为VIP维度。每个节点维度包括多个网络IP,每个网络IP上连接了多个网络链路。网络链路可以是地区的运营商到网络IP的网络链路。需要理解的是,在本公开中,网络链路维度指的是地区运营商到节点的维度。
在本公开中,内容分发网络的节点分布在各个地区,根据各个地区对应网络的要求,在每个地区设置了不同数量的探测机。探测机探测内容分发网络节点的数据包含提供网络的运营商,换言之,探测数据是由地区运营商到网络IP的数据聚合得到的。其中,在本公开中网络IP也可以称为VIP。
示例性的,图2示出了本公开实施例提供的一种获取探测数据方法的流程示意图,如图2中所示,以3个区域的某一运营商为例,3个区域分别表示为区域A、区域B和区域C。区域A包括子区域a,子区域b,子区域c。子区域a包括的探测机,表示为a-运营商-1,子区域b包括的探测机,表示为b-运营商-1,子区域c包括的探测机,表示为c-运营商-1。区域B包括子区域d,子区域e,子区域f。子区域d包括的探测机,表示为d-运营商-1,子区域e包括的探测机,表示为e-运营商-1,子区域f包括的探测机,表示为f-运营商-1。区域C包括子区域g,子区域h,子区域i。子区域g包括的探测机,表示为g-运营商-1,子区域h包括的探测机,表示为h-运营商-1,子区域i包括的探测机,表示为i-运营商-1。基于多个区域中包括的探测机,例如a-运营商-1、b-运营商-1、c-运营商-1、d-运营商-1、e-运营商-1、f-运营商-1、g-运营商-1、h-运营商-1和i-运营商-1,对某一运营商的某一个节点下的VIP(例如某一运营商的节点BJCT下的X.X.X.35或X.X.X.36)进行探测,得到3个区域某一运营商探测某一节点的探测数据。
因此,在本公开中,不同地区运营商可以通过探测机对同一网络IP进行测探,得到某一网络IP的多个地区运营商的探测数据,将该网络IP所有地区运营商的探测数据之和,作为该网络IP维度的探测数据。将某一节点下所有网络IP的探测数据之和,作为该节点维度的探测数据。以上述图2为例,将3个区域某一运营商探测X.X.X.35或X.X.X.36的探测数据之和,确定为X.X.X.35或X.X.X.36的探测数据。换言之,在本公开中,通过聚合网络链路维度的探测数据,可以得到网络IP维度的探测数据。进一步将网络IP维度的探测数据聚合,可以得到节点维度的探测数据。
本公开中,得到多维度探测数据之后,确定每个维度的探测数据的数量。探测数据的数量决定是否可以使用该探测数据进行当前故障检测。若可以用来进行当前故障检测,则进一步确定使用的故障检测的方式。
步骤S120:分别对每个维度的探测数据进行故障判断,得到每个维度下的故障检测结果。
在本公开实施例中,通过对每个维度使用的故障检测方式,分别对网络IP维度的探测数据和网络链路维度的探测数据进行故障判断,从而得到网络IP维度的故障检测结果和网络链路维度的故障检测结果。并通过对每一个节点下所有网络IP维度的故障检测结果进行判断,得到该节点维度的故障检测结果,即,节点故障检测结果依赖于其对应的所有网络IP维度的故障检测结果。
步骤S130:结合故障检测结果,确定内容分发网络的节点当前发生故障的维度。
在本公开实施例中,联动当前判断网络IP维度的故障检测结果和网络链路维度的故障检测结果,对网络IP维度的故障检测结果和网络链路维度的故障检测结果相互参考,确定内容分发网络当前发生故障的维度。
通过本公开实施例提供的网络节点故障检测方法,联动处理多维度的故障检测结果,从而避免影响其他维度的探测成功率,使得故障检测结果更加准确。
图3示出了本公开实施例提供的一种网络节点故障检测方法中处理探测数据的流程示意图,如图3中所示,该方法可以包括:
步骤S210:对探测数据进行分析处理,得到多维度探测数据。
步骤S220:确定已发生故障的内容分发网络维度,并在多维度探测数据中剔除已发生故障的探测数据,得到用于当前故障判断的多维度探测数据。
在本公开实施例中,如上述,通过对探测数据进行分析,得到节点维度的探测数据,网络IP维度的探测数据和网络链路维度的探测数据。
确定节点维度、网络IP维度和网络链路维度中存在的已发生故障维度,并将已发生故障所在维度的探测数据剔除,将剩余的多维度探测数据确定为用于当前故障判断的多维度探测数据。
通过本公开实施例中,将已发生故障维度的探测数据剔除,可以使得剩余的探测数据更能准确的表征当前实际的故障维度,避免已故障探测数据的干扰。
下述实施例将对每个维度的所述探测数据进行故障判断,得到每个维度下的故障检测结果进行说明。
图4示出了本公开实施例提供的一种故障判断的流程示意图,如图4中所示,该方法可以包括:
步骤S310:基于每个维度的探测数据的数量,确定每个维度对应的故障检测阈值。
在本公开实施例中,根据获取的每个维度的探测数据的数量,提供两种用于故障判断的方式,一种方式为,比较探测成功率阈值与探测数据的成功率,确定与该探测数据对应的维度是否存在的故障。另一种方式为,比较探测失败数阈值与探测的失败数,确定与该探测数据对应的维度是否存在的故障。
其中,若探测数据的数量大于或等于分析值,则选择成功率阈值为故障检测阈值;若探测数据的数量小于分析值,则选择失败数为故障检测阈值。
在本公开中,可以根据用于故障判断的探测数据的数量,分别为每个维度的探测数据确定用于检测故障的故障检测阈值。即,分别为网络IP维度探测数据和网络链路维度探测数据,选择采用成功率阈值或失败数阈值判断是否存在的故障。
步骤S320:基于故障检测阈值,对每个维度的探测数据进行检测,得到每个维度的故障检测结果。
在本公开实施例中,基于网络IP维度的探测数据的故障检测阈值,对网络IP维度探测数据进行检测,得到网络IP维度探测数据的故障检测结果。基于网络链路维度的探测数据的故障检测阈值,对网络链路维度探测数据进行检测,得到网络链路维度探测数据的故障检测结果。获取每一节点下所有网络IP维度的故障检测结果,通过判断每一节点下所有网络IP维度的故障检测结果,得到与其对应的节点维度的故障检测结果。
下述实施例将对基于探测数据的数量,为多维度探测数据中每个维度的探测数据确定对应的故障检测阈值进行说明。
图5示出了本公开实施例提供的一种用于检测故障的故障检测阈值确定方法的流程示意图,如图5中所示,探测数据中的关键词包括节点,网络IP,网络链路。通过对探测的数据进行分析,得到多维度探测数据的数量。判断探测数据量是否充足,即确定用于选择故障判断阈值的预设分析值,以及每个维度的探测数据量。
比较网络IP维度的探测数据数量与预设分析值的大小,以及比较网络链路维度的探测数据数量与预设分析值的大小。
若探测数据的数量大于或等于预设分析值,即探测数据量充足,将成功率阈值作为用于检测故障的故障检测阈值。若探测数据小于预设分析值,即探测数据量不充足,将失败数阈值用于检测故障的故障检测阈值。
下述实施例将对基于故障检测阈值,对每个维度的探测数据进行故障检测,得到每个维度的故障检测结果进行说明。
图6示出了本公开实施例提供的一种确定故障检测结果的流程示意图,如图6中所示,该方法可以包括:
步骤S410:计算探测数据中探测成功的数据数量占探测数据的数量的占比率,得到探测数据的成功率;并计算探测数据中探测失败的数据数量,得到探测数据的失败数。
在本公开实施例中,每个维度的探测数据的数量包括探测的成功数和失败数。当探测数据的数量大于或等于分析值时,认为探测数据的数量相对较多,则计算成功数占探测数据的数量的成功率,探测成功的成功率更加准确的体现出内容分发网络是否发生故障,在该情况下,选择将成功率与成功率阈值进行比较,确定是否存在故障。当探测数据的数量小于分析值时,认为探测数据的数量相对较少,则使用得到的失败数与失败数阈值进行比较,确定是否存在故障。例如,若探测机的数量为10个,则认为探测数据的数量相对较少,若存在3个探测失败的探测数据,则认为该探测数据对应的内容分发网络中至少一个维度存在故障。
步骤S420:响应于成功率小于或等于成功率阈值,或,失败数大于失败数阈值,确定该维度的故障检测结果为发生故障。
在本公开实施例中,针对网络IP维度的探测数据,根据与网络IP维度对应的故障检测阈值,确定网络IP维度的探测数据中成功率不大于成功率阈值的探测数据,或,确定网络IP维度的探测数据中失败数不小于失败数阈值的探测数据。
以及,针对网络链路维度的探测数据,根据与网络链路维度对应的故障检测阈值,确定网络链路维度探测数据中成功率不大于成功率阈值的探测数据,或,确定网络链路维度探测数据中失败数不小于失败数阈值的探测数据。
在本公开实施例中,根据每个维度的探测数据与故障检测阈值的比较结果,确定发生故障的网络IP维度和/或网络链路维度,从而确定可能发生故障的内容分发网络维度。
下述实施例将对结合故障检测结果,确定内容分发网络发生故障的维度进行说明。
在本公开中,节点包括一个或多个网络IP。网络链路包括某地区运营商到内容分发网络节点的链路,或某地区运营商到内容分发网络的网络IP的链路。节点维度的探测数据包括节点连接的所有网络链路维度的探测数据。网络IP维度的探测数据包括网络IP连接的所有网络链路维度的探测数据。
图7示出了本公开实施例提供的一种确定故障维度的流程示意图,如图7中所示,该方法可以包括:
步骤S510:基于网络链路维度的故障检测结果,确定网络IP维度的故障检测结果。
步骤S520:基于网络IP维度的故障检测结果,确定节点维度的故障检测结果。
在本公开实施例中,在网络IP维度的故障检测结果和网络链路维度的故障检测结果中,根据节点维度、网络IP维度和网络链路维度之间的关系,逐一确定节点维度、网络IP维度和网络链路维度中发生故障的维度。如上述,网络链路维度的探测数据聚合得到网络IP维度的探测数据,进一步将网络IP维度的探测数据聚合得到节点维度的探测数据,基于节点维度的网络链路维度的故障检测结果,确定发生故障的网络链路;并根据网络IP维度的故障检测结果,以及发生故障的网络链路,确定节点的网络IP的故障结果。和/或基于网络IP维度的故障检测结果和发生故障的网络IP,确定节点维度的故障检测结果。
图8示出了本公开实施例提供的一种故障确定方法的流程示意图,如图8中所示,VIP1、VIP2、VIP3、VIP4表示不同的网络IP,area-isp1、area-isp2、area-isp3、area-isp4表示不同的网络链路,即,表示不同的区域中某一运营商分别到VIP1、VIP2、VIP3、VIP4的链路。
若VIP1和/或VIP4故障,则与VIP1和/或VIP4连接的area-isp1、area-isp2、area-isp3、area-isp4中至少一个故障。若area-isp1和/或area-isp2故障,则会导致与其连接的VIP1、VIP2、VIP3、VIP4的探测数据成功率下降。
从而在本公开中,若故障检测结果中,网络IP维度发生故障且与网络IP连接的所有网络链路中存在无故障的网络链路,确定网络IP维度无故障,或,网络IP维度的故障检测结果满足预设条件,确定与故障检测结果对应的网络IP发生故障。
在本公开实施例中,若网络IP连接的所有网络链路的探测数据的成功率小于或等于成功率阈值;且,网络IP维度的探测数据的成功率小于或等于成功率阈值,或,网络IP维度的探测数据中失败数大于失败数阈值,确定网络IP维度发生故障。
换言之,若确定网络IP维度发生故障需要同时满足以下条件:
条件1网络IP维度探测数据的成功率小于或等于成功率阈值,或,网络IP维度探测数据中失败数大于失败数阈值。
条件2:网络IP维度的探测数据中包括网络IP维度的网络链路维度的探测数据;
条件3:网络链路维度的探测数据成功率小于成功率阈值。
在本公开中,若网络IP维度的故障检测结果中,发生故障的网络IP的个数大于故障个数阈值,则确定该网络IP维度所属节点维度故障。或,若网络IP维度的故障检测结果中,发生故障的网络IP的个数占全部网络IP个数的百分比大于故障百分比阈值,确定网络IP维度所属节点维度故障
通过对不同维度的联动处理,可以避免过度容灾,从而可以避免客户服务器受损。
基于与图1中所示的方法相同的原理,图9示出了本公开实施例提供的一种网络节点故障检测装置的结构示意图,如图9所示,该网络节点故障检测装置100可以包括:
处理模块101,用于获取探测内容分发网络得到的探测数据,并基于内容分发网络的多个维度,对探测数据进行分析处理,得到用于故障判断的多维度探测数据。还用于分别对每个维度的探测数据进行故障判断,得到每个维度下的故障检测结果。确定模块102,用于结合故障检测结果,确定内容分发网络的节点发生故障的维度。
在本公开中,处理模块101,用于对探测数据进行分析处理,得到多维度探测数据;确定已发生故障的内容分发网络维度,并在多维度探测数据中剔除已发生故障的探测数据,得到用于当前故障判断的多维度探测数据。
在本公开中,处理模块101,用于基于每个维度的所述探测数据的数量,确定每个维度对应的故障检测阈值;基于所述故障检测阈值,对每个维度的所述探测数据进行故障检测,得到每个维度的故障检测结果。
在本公开中,确定模块102,用于响应于所述探测数据的数量大于或等于预设分析值,将成功率阈值确定为用于检测故障的故障检测阈值;和/或,响应于所述探测数据小于预设分析值,将失败数阈值确定为用于检测故障的故障检测阈值。
在本公开中,确定模块102,用于计算所述所述探测数据中探测成功的数据数量占所述探测数据的数量的占比率,得到所述所述探测数据的成功率;并计算所述探测数据中探测失败的数据数量,得到所述多维度探测数据的失败数;响应于所述成功率小于或等于所述成功率阈值,或,所述失败数大于所述失败数阈值,确定该维度的故障检测结果为发生故障。
内容分发网络维度包括节点维度、网络IP维度和网络链路维度;所述节点包括一个或多个所述网络IP;所述网络链路包括某地区运营商到所述内容分发网络节点的链路,或某地区运营商到所述内容分发网络系节点的网络IP的链路;所述节点维度的探测数据包括所述节点连接的所有网络链路维度的探测数据;所述网络IP维度的探测数据包括所述网络IP连接的所有网络链路维度的探测数据;
在本公开中,确定模块102,用于基于所述网络链路维度的故障检测结果,确定所述网络IP维度的故障检测结果;基于所述网络IP维度的故障检测结果,确定所述节点维度的故障检测结果。
在本公开中,确定模块102,用于响应于所述网络IP连接的所有网络链路中存在无故障的网络链路,确定所述网络IP维度无故障。。
在本公开中,确定模块102,用于响应于网络IP连接的所有网络链路的探测数据的成功率小于或等于成功率阈值;且,所述网络IP维度的探测数据的成功率小于或等于成功率阈值,或,所述网络IP维度的探测数据中失败数大于失败数阈值;确定所述网络IP维度发生故障。
在本公开中,确定模块102,用于响应于所述网络IP维度的故障检测结果中,所述发生故障的网络IP的个数大于故障阈值,或,所述发生故障的网络IP的个数占全部网络IP个数的百分比大于故障百分比阈值,确定所述节点维度发生故障。
本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图10示出了可以用来实施本公开的实施例的示例电子设备200的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图10所示,设备200包括计算单元201,其可以根据存储在只读存储器(ROM)202中的计算机程序或者从存储单元208加载到随机访问存储器(RAM)203中的计算机程序,来执行各种适当的动作和处理。在RAM 203中,还可存储设备200操作所需的各种程序和数据。计算单元201、ROM 202以及RAM 203通过总线204彼此相连。输入/输出(I/O)接口205也连接至总线204。
设备200中的多个部件连接至I/O接口205,包括:输入单元206,例如键盘、鼠标等;输出单元207,例如各种类型的显示器、扬声器等;存储单元208,例如磁盘、光盘等;以及通信单元209,例如网卡、调制解调器、无线通信收发机等。通信单元209允许设备200通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元201可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元201的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元201执行上文所描述的各个方法和处理,例如方法网络节点故障检测。例如,在一些实施例中,方法网络节点故障检测可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元208。在一些实施例中,计算机程序的部分或者全部可以经由ROM 202和/或通信单元209而被载入和/或安装到设备200上。当计算机程序加载到RAM 203并由计算单元201执行时,可以执行上文描述的方法网络节点故障检测的一个或多个步骤。备选地,在其他实施例中,计算单元201可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行方法网络节点故障检测。
本文中以上描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上***的***(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的***和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的***和技术实施在包括后台部件的计算***(例如,作为数据服务器)、或者包括中间件部件的计算***(例如,应用服务器)、或者包括前端部件的计算***(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将***的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式***的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
Claims (12)
1.一种网络节点故障检测方法,应用于内容分发网络,包括:
获取探测所述内容分发网络的节点得到的探测数据,并基于所述内容分发网络的多个维度,对所述探测数据进行分析处理,得到用于当前故障判断的多维度探测数据;
分别对每个维度的所述探测数据进行故障判断,得到每个维度下的故障检测结果;
结合所述故障检测结果,确定所述内容分发网络的节点当前发生故障的维度。
2.根据权利要求1所述的方法,其中,所述基于所述内容分发网络的多个维度,对所述探测数据进行分析处理,得到用于当前故障判断的多维度探测数据,包括:
对探测数据进行分析处理,得到多维度探测数据;
确定已发生故障的内容分发网络维度,并在多维度探测数据中剔除已发生故障的探测数据,得到用于当前故障判断的多维度探测数据。
3.根据权利要求1所述的方法,其中,所述分别对每个维度的所述探测数据进行故障判断,得到每个维度下的故障检测结果,包括:
基于每个维度的所述探测数据的数量,确定每个维度对应的故障检测阈值;
基于所述故障检测阈值,对每个维度的所述探测数据进行故障检测,得到每个维度的故障检测结果。
4.根据权利要求3所述的方法,其中,所述基于每个维度的所述探测数据的数量,确定每个维度对应的故障检测阈值,包括:
响应于所述探测数据的数量大于或等于预设分析值,将成功率阈值确定为用于检测故障的故障检测阈值;和/或
响应于所述探测数据小于预设分析值,将失败数阈值确定为用于检测故障的故障检测阈值。
5.根据权利要求4所述的方法,其中,所述基于所述故障检测阈值,对每个维度的所述探测数据进行故障检测,得到每个维度的故障检测结果,包括:
计算所述探测数据中探测成功的数据数量占所述探测数据的数量的占比率,得到所述探测数据的成功率;并计算所述探测数据中探测失败的数据数量,得到所述探测数据的失败数;
响应于所述成功率小于或等于所述成功率阈值,或,所述失败数大于所述失败数阈值,确定该维度的故障检测结果为发生故障。
6.根据权利要求1所述的方法,其中,所述内容分发网络维度包括节点维度、网络IP维度和网络链路维度;所述节点包括一个或多个所述网络IP;所述网络链路包括某地区运营商到所述内容分发网络节点的链路,或某地区运营商到所述内容分发网络节点的网络IP的链路;所述节点维度的探测数据包括所述节点连接的所有网络链路维度的探测数据;所述网络IP维度的探测数据包括所述网络IP连接的所有网络链路维度的探测数据;
结合所述故障检测结果,确定所述内容分发网络的节点当前发生故障的维度,包括:
基于所述网络链路维度的故障检测结果,确定所述网络IP维度的故障检测结果;
基于所述网络IP维度的故障检测结果,确定所述节点维度的故障检测结果。
7.根据权利要求6所述的方法,其中,所述基于所述网络链路维度的故障检测结果,确定所述网络IP维度的故障检测结果,包括:
响应于所述网络IP连接的所有网络链路中存在无故障的网络链路,确定所述网络IP维度无故障。
8.根据权利要求6所述的方法,其中,所述基于所述网络链路维度的故障检测结果,确定所述网络IP维度的故障检测结果,包括:
响应于网络IP连接的所有网络链路的探测数据的成功率小于或等于成功率阈值;且,所述网络IP维度的探测数据的成功率小于或等于成功率阈值,或,所述网络IP维度的探测数据中失败数大于失败数阈值;
确定所述网络IP维度发生故障。
9.根据权利要求6所述的方法,所述基于所述网络IP维度的故障检测结果,确定所述节点维度的故障检测结果,包括:
响应于所述网络IP维度的故障检测结果中,所述发生故障的网络IP的个数大于故障阈值,或,所述发生故障的网络IP的个数占全部网络IP个数的百分比大于故障百分比阈值,确定所述节点维度故障。
10.一种网络节点故障检测装置,应用于内容分发网络,包括:
处理模块,用于获取探测所述内容分发网络的节点得到的探测数据,并基于所述内容分发网络的多个维度,对所述探测的数据进行分析处理,得到用于当前故障判断的多维度探测数据;还用于分别对每个维度的所述探测数据进行故障判断,得到每个维度下的故障检测结果;
确定模块,用于结合所述故障检测结果,确定所述内容分发网络的节点当前发生故障的维度。
11.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-9中任一项所述的方法。
12.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-9中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111415301.7A CN114095394B (zh) | 2021-11-25 | 2021-11-25 | 网络节点故障检测方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111415301.7A CN114095394B (zh) | 2021-11-25 | 2021-11-25 | 网络节点故障检测方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114095394A true CN114095394A (zh) | 2022-02-25 |
CN114095394B CN114095394B (zh) | 2023-09-19 |
Family
ID=80304636
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111415301.7A Active CN114095394B (zh) | 2021-11-25 | 2021-11-25 | 网络节点故障检测方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114095394B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114900421A (zh) * | 2022-04-08 | 2022-08-12 | 深圳绿米联创科技有限公司 | 故障检测方法、装置、电子设备及可读存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106130786A (zh) * | 2016-07-26 | 2016-11-16 | 腾讯科技(深圳)有限公司 | 一种网络故障的检测方法及装置 |
US20170293537A1 (en) * | 2014-10-06 | 2017-10-12 | Nec Corporation | Management system for virtual machine failure detection and recovery |
US20170353873A1 (en) * | 2014-12-30 | 2017-12-07 | Comptel Corporation | Enhanced quality of service of a cellular radio access network |
CN107911240A (zh) * | 2017-11-14 | 2018-04-13 | 北京知道创宇信息技术有限公司 | 一种故障检测方法以及装置 |
CN108123824A (zh) * | 2016-11-30 | 2018-06-05 | 华为技术有限公司 | 一种网络故障检测方法及装置 |
CN112532972A (zh) * | 2020-11-26 | 2021-03-19 | 北京百度网讯科技有限公司 | 直播业务的故障检测方法、装置、电子设备及可读存储介质 |
CN113438106A (zh) * | 2021-06-22 | 2021-09-24 | 北京百度网讯科技有限公司 | 内容分发网络处理方法、装置及电子设备 |
-
2021
- 2021-11-25 CN CN202111415301.7A patent/CN114095394B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170293537A1 (en) * | 2014-10-06 | 2017-10-12 | Nec Corporation | Management system for virtual machine failure detection and recovery |
US20170353873A1 (en) * | 2014-12-30 | 2017-12-07 | Comptel Corporation | Enhanced quality of service of a cellular radio access network |
CN106130786A (zh) * | 2016-07-26 | 2016-11-16 | 腾讯科技(深圳)有限公司 | 一种网络故障的检测方法及装置 |
CN108123824A (zh) * | 2016-11-30 | 2018-06-05 | 华为技术有限公司 | 一种网络故障检测方法及装置 |
CN107911240A (zh) * | 2017-11-14 | 2018-04-13 | 北京知道创宇信息技术有限公司 | 一种故障检测方法以及装置 |
CN112532972A (zh) * | 2020-11-26 | 2021-03-19 | 北京百度网讯科技有限公司 | 直播业务的故障检测方法、装置、电子设备及可读存储介质 |
CN113438106A (zh) * | 2021-06-22 | 2021-09-24 | 北京百度网讯科技有限公司 | 内容分发网络处理方法、装置及电子设备 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114900421A (zh) * | 2022-04-08 | 2022-08-12 | 深圳绿米联创科技有限公司 | 故障检测方法、装置、电子设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114095394B (zh) | 2023-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9917744B2 (en) | Method and system for monitoring quality of data transmission in IDC network | |
CN110716842B (zh) | 集群故障检测方法和装置 | |
CN113438106B (zh) | 内容分发网络处理方法、装置及电子设备 | |
CN112380089A (zh) | 一种数据中心监控预警方法及*** | |
CN116049146A (zh) | 一种数据库故障处理方法、装置、设备及存储介质 | |
CN117041029A (zh) | 网络设备故障处理方法、装置、电子设备及存储介质 | |
CN113656252B (zh) | 故障定位方法、装置、电子设备以及存储介质 | |
CN108880838B (zh) | 业务故障的监控方法及装置、计算机设备及可读介质 | |
CN114885014A (zh) | 一种外场设备状态的监测方法、装置、设备及介质 | |
CN111865673A (zh) | 一种自动化故障管理方法、装置及*** | |
CN114095394B (zh) | 网络节点故障检测方法、装置、电子设备及存储介质 | |
CN116645082A (zh) | 一种***巡检方法、装置、设备以及存储介质 | |
CN115687406A (zh) | 一种调用链数据的采样方法、装置、设备及存储介质 | |
CN115437961A (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN114693116A (zh) | 代码评审有效性的检测方法及装置、电子设备 | |
CN114546799A (zh) | 埋点日志校验方法、装置、电子设备、存储介质及产品 | |
CN114881112A (zh) | 一种***异常检测方法、装置、设备及介质 | |
CN114697247A (zh) | 流媒体***的故障检测方法、装置、设备和存储介质 | |
CN114116288A (zh) | 故障处理方法、装置及计算机程序产品 | |
CN113887101A (zh) | 网络模型的可视化方法、装置、电子设备及存储介质 | |
CN111835566A (zh) | 一种***故障管理方法、装置及*** | |
CN114358288B (zh) | 生成知识图谱的方法、信息推荐方法、装置及电子设备 | |
CN115766391A (zh) | 消息跟踪方法、消息生成方法、装置、设备、介质和车辆 | |
CN118170626A (zh) | 一种基于全局拓扑图的应用故障排查方法、装置、设备及存储介质 | |
CN117424818A (zh) | 一种can配置的检测方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |