CN112702198B - 异常根因定位方法、装置、电子设备及存储介质 - Google Patents

异常根因定位方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN112702198B
CN112702198B CN202011511168.0A CN202011511168A CN112702198B CN 112702198 B CN112702198 B CN 112702198B CN 202011511168 A CN202011511168 A CN 202011511168A CN 112702198 B CN112702198 B CN 112702198B
Authority
CN
China
Prior art keywords
attribution
dimension
root cause
anomaly
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011511168.0A
Other languages
English (en)
Other versions
CN112702198A (zh
Inventor
李健
马茗
程媛
郭君健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202011511168.0A priority Critical patent/CN112702198B/zh
Publication of CN112702198A publication Critical patent/CN112702198A/zh
Application granted granted Critical
Publication of CN112702198B publication Critical patent/CN112702198B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/065Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本公开关于一种异常根因定位方法、装置、电子设备及存储介质。所述异常根因定位方法可包括:检测异常;响应于检测到异常,根据归因维度集合执行归因探测操作来确定所述异常的归因路径中的根因节点,其中,归因维度集合包括多个归因维度,每个根因节点对应于一个归因维度的异常归因维度值;根据归因路径中的所有根因节点确定异常根因。

Description

异常根因定位方法、装置、电子设备及存储介质
技术领域
本公开涉及信号处理领域,尤其涉及一种异常根因定位方法、装置、电子设备及存储介质。
背景技术
在各种环境下的运维工作中,每天运维人员会面对大量的异常或故障,运维人员需要及时找出真正引起异常或故障的原因,只有这样,才能够指导运维人员及时采取相应的措施来快速止损或快速恢复业务正常运行,从而最终保证用户的优质体验。另外,在发现异常后常需要在众多的维度空间下找到根因。目前虽然已有一些根因定位方法在生产环境中被使用,例如微软的用于广告***的多维根因算法Adtributor,其可以确定最可能导致广告收入异常的维度。然而,这样的根因定位方法在多维场景下仅能定位到引起异常的某一维度下的集合,而对于引起异常的各维度是交叉的或引起异常的根因往往不是一个维度的场景(例如,涉及内容分发网络(CDN)的场景),这样的根据定位方法无法准确地定位到引起异常的根因。因此,需要通用的能够准确地定位异常根因的技术。
发明内容
本公开提供一种异常根因定位方法、装置、电子设备及存储介质,以至少解决相关技术中的无法准确定位异常根因的问题。
根据本公开实施例的第一方面,提供了一种异常根因定位方法,所述异常根因定位方法包括:检测异常;响应于检测到异常,根据归因维度集合执行归因探测操作来确定所述异常的归因路径中的根因节点,其中,归因维度集合包括多个归因维度,每个根因节点对应于一个归因维度的异常归因维度值;根据归因路径中的所有根因节点确定异常根因。
可选地,所述检测异常,包括:对用户的关注维度或关注维度组合进行异常检测,来确定异常的关注维度值或关注维度组合值,其中,所述根据归因维度集合执行归因探测操作来确定所述异常的归因路径中的根因节点,包括:针对异常的关注维度值或关注维度组合值,根据归因维度集合执行归因探测操作来确定归因路径中的根因节点。
可选地,所述归因探测操作包括:对归因维度集合中的每个归因维度,分别进行所述每个归因维度下的异常检测来确定所述每个归因维度的异常归因维度值;计算所述每个归因维度的异常程度;根据归因维度集合中的所有归因维度的异常程度确定归因路径中的根因节点。
可选地,所述根据归因维度集合中的所有归因维度的异常程度确定归因路径中的根因节点,包括:在归因维度集合中的所有归因维度的异常程度中的最小值满足预定条件的情况下,将异常程度等于该最小值的归因维度的异常归因维度值确定为对应于归因路径中的根因节点,通过从归因维度集合中去除异常程度等于该最小值的归因维度来更新归因维度集合,并且根据更新后的归因维度集合执行所述归因探测操作,直至归因维度集合为空;在归因维度集合中的所有归因维度的异常程度中的最小值不满足预定条件的情况下,将异常程度等于该最小值的归因维度的异常归因维度值确定为对应于归因路径中的根因节点,并且不再执行所述归因探测操作。
可选地,每个归因维度的异常程度等于所述每个归因维度的异常归因维度值的数量与进行所述每个归因维度下的异常检测时所考虑的归因维度值的数量之比。
可选地,所述检测异常,包括:检测内容分发网络中发生的异常,其中,所述归因维度集合中包括影响内容分发网络质量的多个维度。
可选地,所述异常包括与流媒体服务有关的异常。
可选地,所述异常根因定位方法还包括:根据确定的异常根因提供报警信息。
根据本公开实施例的第二方面,提供了一种异常根因定位装置,所述异常根因定位装置包括:异常检测单元,被配置为检测异常;根因节点确定单元,被配置为响应于检测到异常,根据归因维度集合执行归因探测操作来确定所述异常的归因路径中的根因节点,其中,归因维度集合包括多个归因维度,每个根因节点对应于一个归因维度的异常归因维度值;异常根因确定单元,被配置为根据归因路径中的所有根因节点确定异常根因。
可选地,所述检测异常,包括:对用户的关注维度或关注维度组合进行异常检测,来确定异常的关注维度值或关注维度组合值,其中,所述根据归因维度集合执行归因探测操作来确定所述异常的归因路径中的根因节点,包括:针对异常的关注维度值或关注维度组合值,根据归因维度集合执行归因探测操作来确定归因路径中的根因节点。
可选地,所述归因探测操作包括:对归因维度集合中的每个归因维度,分别进行所述每个归因维度下的异常检测来确定所述每个归因维度的异常归因维度值;计算所述每个归因维度的异常程度;根据归因维度集合中的所有归因维度的异常程度确定归因路径中的根因节点。
可选地,所述根据归因维度集合中的所有归因维度的异常程度确定归因路径中的根因节点,包括:在归因维度集合中的所有归因维度的异常程度中的最小值满足预定条件的情况下,将异常程度等于该最小值的归因维度的异常归因维度值确定为对应于归因路径中的根因节点,通过从归因维度集合中去除异常程度等于该最小值的归因维度来更新归因维度集合,并且根据更新后的归因维度集合执行所述归因探测操作,直至归因维度集合为空;在归因维度集合中的所有归因维度的异常程度中的最小值不满足预定条件的情况下,将异常程度等于该最小值的归因维度的异常归因维度值确定为对应于归因路径中的根因节点,并且不再执行所述归因探测操作。
可选地,每个归因维度的异常程度等于所述每个归因维度的异常归因维度值的数量与进行所述每个归因维度下的异常检测时所考虑的归因维度值的数量之比。
可选地,所述检测异常,包括:检测内容分发网络中发生的异常,其中,所述归因维度集合中包括影响内容分发网络质量的多个维度。
可选地,所述异常包括与流媒体服务有关的异常。
可选地,所述异常根因定位装置还包括:报警单元,被配置为根据确定的异常根因提供报警信息。
根据本公开实施例的第三方面,提供了一种电子设备,所述电子设备包括:至少一个处理器;至少一个存储计算机可执行指令的存储器,其中,所述计算机可执行指令在被所述至少一个处理器运行时,促使所述至少一个处理器执行如上所述的异常根因定位方法。
根据本公开实施例的第四方面,提供了一种存储指令的计算机可读存储介质,其特征在于,当所述指令被至少一个处理器运行时,促使所述至少一个处理器执行如上所述的异常根因定位方法。
根据本公开实施例的第五方面,提供了一种计算机程序产品,所述计算机程序产品中的指令被电子设备中的至少一个处理器运行以执行如上所述的异常根因定位方法。
本公开的实施例提供的技术方案至少带来以下有益效果:本公开的实施例通过根据归因维度集合执行归因探测操作来确定所述异常的归因路径中的根因节点,由于归因维度集合包括多个归因维度且每个根因节点对应于一个归因维度的异常归因维度值,因此,可根据归因路径中的所有根因节点准确地定位到多个维度下的异常根因。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的示例实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是本公开的示例性实施例可以应用于其中的示例性***架构;
图2是本公开的示例性实施例的异常根因定位方法的流程图;
图3是示出本公开的示例性实施例的异常根因定位方法的示例的示意图;
图4是本公开的示例性实施例的异常根因定位装置的框图;
图5是根据本公开示例性实施例的电子设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
在此需要说明的是,在本公开中出现的“若干项之中的至少一项”均表示包含“该若干项中的任意一项”、“该若干项中的任意多项的组合”、“该若干项的全体”这三类并列的情况。例如“包括A和B之中的至少一个”即包括如下三种并列的情况:(1)包括A;(2)包括B;(3)包括A和B。又例如“执行步骤一和步骤二之中的至少一个”,即表示如下三种并列的情况:(1)执行步骤一;(2)执行步骤二;(3)执行步骤一和步骤二。
图1示出了本公开的示例性实施例可以应用于其中的示例性***架构100。
如图1所示,***架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息(例如音视频数据上传请求、音视频数据下载请求)等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如音视频录制软件、音视频播放器、即时通信工具、邮箱客户端、社交平台软件等。终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏并且能够进行音视频播放和录制的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中,其可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
终端设备101、102、103可以安装有图像采集装置(例如摄像头),以采集视频数据。实践中,组成视频的最小视觉单位是帧(Frame)。每一帧是一幅静态的图像。将时间上连续的帧序列合成到一起便形成动态视频。此外,终端设备101、102、103也可以安装有用于将电信号转换为声音的组件(例如扬声器)以播放声音,并且还可以安装有用于将模拟音频信号转换为数字音频信号的装置(例如,麦克风)以采集声音。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上所安装的多媒体应用提供支持的后台服务器。后台服务器可以对所接收到的音视频数据上传请求等数据进行解析、存储等处理,并且还可以接收终端设备101、102、103所发送的音视频数据下载请求,并将该音视频数据下载请求所指示的音视频数据反馈至终端设备101、102、103。
作为示例,服务器105可以是流媒体服务器,网络104可以是内容分发网络(CDN)。流媒体服务器可以通过内容分发网络将流媒体传输到各个终端设备。内容分发网络中包括多个提供流媒体内容的节点。当内容分发网络中的节点出现故障时,会导致流媒体服务器向终端设备提供流媒体服务时出现异常。如果能够准确地定位出故障节点,则可快速处理故障并且更好地提供流媒体服务。
需要说明的是,服务器可以是硬件,也可以是软件。当服务器为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
需要说明的是,本公开实施例所提供的异常根因定位方法一般由服务器105执行,相应地,异常根因定位装置一般设置于服务器105中。然而,本公开实施例所提供的异常根因定位方法也可由终端设备和服务器协作执行。相应地,异常根因定位装置也可设置在终端设备和服务器两者中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器,本公开对此并无限制。
图2是本公开的示例性实施例的异常根因定位方法的流程图。
参照图2,在步骤S201,检测异常。这里,可以以任何方式检测异常,本公开对检查异常的方式并入任何限制。作为示例,可以基于对历史业务数据的统计来检测异常,或者可以基于历史业务数据对可能发生的异常进行预测来检测异常。此外,异常可以是任何业务场景中发生的任何异常,本公开对异常的种类、标准等并未任何限制。
例如,在流媒体服务架构中,CDN起着非常关键的作用。将CDN应用在流媒体内容的传输,能有效改善其传输过程中的QoS,并能有效降低骨干网络的带宽消耗,目前已经获得越来越广泛的应用。在对服务的实时质量监测中,需要及时发现服务质量QoS的指标异常,并且能够快速准确地找到真正的故障原因,来指导运维人员进行相应的快速止损,最终保证用户的优质体验。为此,根据示例性实施例,检测异常可以包括检测内容分发网络(CDN)中发生的异常。作为示例,异常包括与流媒体服务有关的异常,例如,数据下载失败率异常,但不限于此。
在步骤S202,响应检测到异常,可根据归因维度集合执行归因探测操作来确定所述异常的归因路径中的根因节点。这里,归因维度集合可包括多个归因维度,并且每个根因节点可对应于一个归因维度的异常归因维度值。在本公开中,归因是可能导致异常的原因,根因是导致异常的根本原因。这里,归因维度可以是导致异常的原因维度,异常归因维度值是归因维度下出现异常的归因维度值。此外,这里,归因路径是寻找异常原因的路径,根因节点是与引起异常的根因对应的节点。
例如,如在本公开背景技术中提及的,在涉及内容分发网络(CDN)的场景中,引起异常的各维度是交叉的或引起异常的根因往往不是一个维度,当发现异常后需要在众多的维度空间下找到根因。因此,可预先设置归因维度集合,以便于在多个维度空间下定位根因。在这种场景中,根据示例性实施例,归因维度集合中可包括影响内容分发网络质量的多个维度。例如,归因维度集合可以是(省份,运营商,域名,网络),但不限于此。用户可根据各种场景需要来定义归因维度集合中的各个维度。
如上所述,引起异常的根因往往不是一个维度,当发现异常后需要在众多的维度空间下找到根因,然而,面对每天各种维度或维度组合下的大量异常,运维人员常常真正需要关注的是引起业务质量变化的维度或维度组合,这样可以方便及时地止损。根据示例性实施例,在步骤S201检测异常时,可以对用户的关注维度或关注维度组合进行异常检测,来确定异常的关注维度值或关注维度组合值。相应地,在步骤S202,可针对异常的关注维度值或关注维度组合值,根据归因维度集合执行归因探测操作来确定归因路径中的根因节点。
例如,在利用CDN提供流媒体服务的质量监测场景中,用户的关注维度可以是CDN厂商、域名、运营商、省份或网络,或者用户的关注维度组合可以是CDN厂商、域名、运营商、省份和网络的任何组合,例如,省份和运营商这个维度组合。在这种情况下,在检测异常时,可仅对用户的关注维度或关注维度组合进行异常检测,来确定异常的关注维度值或关注维度组合值。例如,可仅对(省份,运营商)这个关注维度组合进行异常检测,来确定异常的关注维度组合值。例如,可通过检测各个省份的运营商所服务的客户的下载失败率来进行异常检测,例如,如果河南移动服务的客户的下载失败率高于特定阈值,则将(河南,移动)确定为是一个异常的关注维度组合值。此时,可判断在利用CDN提供流媒体服务的过程中,河南移动发生了异常。在这种情况下,可仅针对这个关注维度组合值(河南,移动),根据归因维度集合执行归因探测操作来确定归因路径中的根因节点,以确定是河南移动的什么原因导致了异常的发生。
根据示例性实施例,在步骤202执行的归因探测操作可包括:对归因维度集合中的每个归因维度,分别进行所述每个归因维度下的异常检测来确定所述每个归因维度的异常归因维度值;计算所述每个归因维度的异常程度;并且根据归因维度集合中的所有归因维度的异常程度确定归因路径中的根因节点。例如,在以上示例中,当确定了异常关于维度组合值(河南,移动)时,可例如根据归因维度集合(网络,域名),分别进行河南省内由移动运营商提供的各个网络和各种域名下的异常检测来确定网络和域名这两个维度下各自的异常维度值。例如,如果检测到WIFI网络异常,则网络这一归因维度的异常归因维度值是WIFI;如果检测到域名alimov2异常,则域名这一归因维度的异常归因维度值是alimov2。在确定了每个归因维度的异常归因维度值之后,可计算每个归因维度的异常程度。根据示例性实施例,每个归因维度的异常程度可以等于每个归因维度的异常归因维度值的数量与进行每个归因维度下的异常检测时所考虑的归因维度值的数量之比。这里,进行每个归因维度下的异常检测时所考虑的归因维度值可预先由用户定义,或者可根据预定条件确定哪些归因维度值需要被考虑。例如,在利用CDN提供流媒体服务的场景中,可根据下载量是否超过阈值来确定哪些归因维度值需要被考虑。
例如,如果归因维度是网络,并且在进行网络这一归因维度下的异常检测时考虑WIFI网络和蜂窝网络这两个网络,则在进行网络这一归因维度下的异常检测时考虑的归因维度值就是WIFI网络和蜂窝网络,其数量为2。如果检测到WIFI网络异常,则网络这一归因维度的异常程度便为1/2。尽管以上给出了每个归因维度的异常程度的计算示例,但是计算异常程度的方式不限于此。
在计算出每个归因维度的异常程度之后,可根据归因维度集合中的所有归因维度的异常程度确定归因路径中的根因节点。具体地,根据示例性实施例,在归因维度集合中的所有归因维度的异常程度中的最小值满足预定条件的情况下,可将异常程度等于该最小值的归因维度的异常归因维度值确定为对应于归因路径中的根因节点,通过从归因维度集合中去除异常程度等于该最小值的归因维度来更新归因维度集合,并且根据更新后的归因维度集合执行所述归因探测操作,直至归因维度集合为空。而在归因维度集合中的所有归因维度的异常程度中的最小值不满足预定条件的情况下,可将异常程度等于该最小值的归因维度的异常归因维度值确定为对应于归因路径中的根因节点,并且不再执行所述归因探测操作。
为描述方便,上述根据归因维度集合执行归因探测操作来确定所述异常的归因路径中的根因节点的过程可被表示如下:
i)对当前归因维度集合中的每个归因维度,分别进行每个归因维度下的异常检测,来确定每个归因维度的异常归因维度值;
ii)计算每个归因维度的异常程度,异常程度的计算方式例如可以如下:每个归因维度的异常归因维度值的数量/进行每个归因维度下的异常检测时所考虑的归因维度值的数量;
iii)若最小的异常程度满足预定条件(例如,大于0且小于1/3,但是预定条件不限于此),则将异常程度等于该最小值的归因维度的异常归因维度值确定为对应于归因路径中的根因节点;否则认为当前节点就是最后一个根因节点,不用进行更细维度的下探,
退出循环。
iv)从当前归因维度集合中去除异常程度等于该最小值的归因维度来更新归因维度集合,并且对i)到iv)进行迭代循环,直到归因维度集合为空。
在步骤S202确定了归因路径中的根因节点之后,在步骤S203,根据归因路径中的所有根因节点确定异常根因。具体地,由于每个根因节点对应于一个归因维度的异常归因维度值,因此,将所有根因节点对应的异常归因维度值组合起来便是异常根因。例如,在以上列举的河南移动的示例中,如果归因路径中存在两个根因节点,一个根因节点对应网络这一归因维度且异常归因维度值是WIFI,一个根因节点对应域名这一归因维度且异常归因维度值是alimov2,则异常根因便是WIFI网络中域名alimov2发生了异常。
可选地,根据本公开示例性实施例,上述异常根因定位方法还可包括根据确定的异常根因提供报警信息。可通过各种方式(例如,声音警报等)向用户提供报警信息。通过提供报警信息,可便于相关运维人员及时根据异常根因采取相应的应对措施。
以上,已经参照图2对本公开示例性实施例的异常根因定位方法进行了描述,根据本公开的异常根因定位方法通过根据归因维度集合执行归因探测操作来确定所述异常的归因路径中的根因节点,由于归因维度集合包括多个归因维度且每个根因节点对应于一个归因维度的异常归因维度值,因此,可根据归因路径中的所有根因节点准确地定位到多个维度下的异常根因。
以下,为便于更清楚地理解本公开,结合本公开示例性实施例可应用于的示例场景对上述异常根因定位方法进行简要描述。
图3是示出本公开的示例性实施例的异常根因定位方法的示例的示意图。图3的示例是利用CDN提供流媒体服务的场景中进行异常根因定位的示例。参照图3,可在流媒体服务质量监测中检测异常,例如,可检测下载失败率异常。假设通过异常检测,发现了资源PREFETCH_VIDEO下载失败率异常。在这种情况下,可根据归因维度集合执行归因探测操作来确定这种异常的归因路径中的根因节点。例如,如图3所示,归因维度集合可以是(省份,运营商,域名,网络),也可被表示为(province,host,isp,network)。可首先对归因维度集合中的每个归因维度分别进行相应归因维度下的异常检测来确定每个归因维度的异常归因维度值。例如,如图3所示,分别在省份、运营商、域名、网络这四个维度下进行异常检测(即,分别在考虑的省份中检测哪些省份发生了下载失败率异常,分别在考虑的运营商中检测哪些运营商发生了下载失败率异常,分别在考虑的域名中检测哪些域名发生了下载失败率异常,分别在考虑的网络中检测哪些网络发生了下载失败率异常),通过每个归因维度下的异常检测可确定每个归因维度的异常归因维度值。例如,如图3所示,省份、运营商、域名、网络这四个维度的异常归因维度值分别是广东、移动、alimov2和WIFI。
接下来,可计算每个归因维度的异常程度。假设进行省份、运营商、域名、网络这四个维度下的异常检测时所考虑的归因维度值的数量分别是13、3、7和2,则可将每个归因维度的异常归因维度值的数量与进行每个归因维度下的异常检测时所考虑的归因维度值的数量之比作为每个归因维度的异常程度。例如,如图3所示,按照这种方式计算出的省份、运营商、域名、网络这四个归因维度的异常程度(也可被称为“显著度”)分别是1/13、1/3、1/7和1/2。随后,可判断所有异常程度中的最小值(即,最小的异常程度)是否满足预定条件。在图3的示例中,将预定条件设置为最小的异常程度是否大于0且小于1/3。由于以上计算出的异常程度1/13、1/3、1/7和1/2中的最小的异常程度是1/13,其满足大于0且小于1/3这一预定条件,因此,将异常程度等于1/13的归因维度的异常归因维度值确定为对应于归因路径中的根因节点,即,将广东确定为对应于一个根因节点。
接下来,从当前归因维度集合(省份,运营商,域名,网络)中去除异常程度最小的归因维度(即,省份这一归因维度),并且继续进行如上所述的对i)到iv)的操作,直到归因维度集合为空。在从归因维度集合中去除省份这一归因维度之后,分别进行当前各个归因维度下的异常检测来确定每个归因维度的异常归因维度值。即,分别检测广东省下所考虑的运营商中哪些运营商存在下载失败率异常,广东省下考虑的域名中哪些域名存在下载失败率异常,以及广东省下考虑的网络中哪些网络存在下载失败率异常。如图3所示,由于未检测到存在下载失败率异常的运营商和域名,因此,运营商和域名这两个归因维度的异常程度均是0。而由于检测到WIFI网络中存在下载失败率异常并且网络这一归因维度中考虑的归因维度值仅有WIFI这一个网络,因此,网络这一归因维度的异常程度为1/1。由于最小的异常程度不满足上述预定条件,因此,当前节点就是最后一个根因节点,不用进行更细维度的下探。此时,便可根据归因路径中的所有根因节点确定异常根因。
具体地,在图3的示例中,可以确定广东-WIFI的异常是导致资源PREFETCH_VIDEO下载失败率异常的根因。此外,可根据异常根因提供报警信息,例如,可输出报警信息:PREFETCH-VIDEO-广东-WIFI。
尽管以上以利用CDN提供流媒体服务的场景为例对根据本公开示例实施例的异常根因定位方法进行了简要描述,但是本公开的异常根因定位方法不限于以上示例场景,而是可根据需要应用于其他需要异常根因定位的场景。
图4是本公开的示例性实施例的异常根因定位装置400的框图。
参照图4,异常根据定位装置400可包括异常检测单元401、根因节点确定单元402和异常根因确定单元403。具体而言,异常检测单元401可被配置为检测异常。根因节点确定单元402可被配置为响应于检测到异常,根据归因维度集合执行归因探测操作来确定所述异常的归因路径中的根因节点。这里,归因维度集合包括多个归因维度,每个根因节点对应于一个归因维度的异常归因维度值。异常根因确定单元403可被配置为根据归因路径中的所有根因节点确定异常根因。可选地,异常根因定位装置400还可包括报警单元(未示出),报警单元可被配置为根据确定的异常根因提供报警信息。
由于图2所示的异常根因定位方法可由图4所示的异常根因定位装置400来执行,并且异常检测单元401、根因节点确定单元402和异常根因确定单元403可分别执行与图2中的步骤201、步骤202和步骤203对应的操作,因此,关于图4中的各单元所执行的操作中涉及的任何相关细节均可参见关于图2的相应描述,这里都不再赘述。
此外,需要说明的是,尽管以上在描述异常根因定位装置400时将其划分为用于分别执行相应处理的单元,然而,本领域技术人员清楚的是,上述各单元执行的处理也可以在异常根因定位装置400不进行任何具体单元划分或者各单元之间并无明确划界的情况下执行。此外,异常根因定位装置400还可包括其他单元,例如,数据处理单元、存储单元等。
图5是根据本公开示例性实施例的电子设备的框图。
参照图5,电子设备500可包括至少一个存储器501和至少一个处理器502,所述至少一个存储器中存储有计算机可执行指令集合,当计算机可执行指令集合被至少一个处理器执行时,执行根据本公开实施例的异常根因定位方法。
作为示例,电子设备可以是PC计算机、平板装置、个人数字助理、智能手机、或其他能够执行上述指令集合的装置。这里,电子设备并非必须是单个的电子设备,还可以是任何能够单独或联合执行上述指令(或指令集)的装置或电路的集合体。电子设备还可以是集成控制***或***管理器的一部分,或者可被配置为与本地或远程(例如,经由无线传输)以接口互联的便携式电子设备。
在电子设备中,处理器可包括中央处理器(CPU)、图形处理器(GPU)、可编程逻辑装置、专用处理器***、微控制器或微处理器。作为示例而非限制,处理器还可包括模拟处理器、数字处理器、微处理器、多核处理器、处理器阵列、网络处理器等。
处理器可运行存储在存储器中的指令或代码,其中,存储器还可以存储数据。指令和数据还可经由网络接口装置而通过网络被发送和接收,其中,网络接口装置可采用任何已知的传输协议。
存储器可与处理器集成为一体,例如,将RAM或闪存布置在集成电路微处理器等之内。此外,存储器可包括独立的装置,诸如,外部盘驱动、存储阵列或任何数据库***可使用的其他存储装置。存储器和处理器可在操作上进行耦合,或者可例如通过I/O端口、网络连接等互相通信,使得处理器能够读取存储在存储器中的文件。
此外,电子设备还可包括视频显示器(诸如,液晶显示器)和用户交互接口(诸如,键盘、鼠标、触摸输入装置等)。电子设备的所有组件可经由总线和/或网络而彼此连接。
根据本公开的实施例,还可提供一种存储指令的计算机可读存储介质,其中,当指令被至少一个处理器运行时,促使至少一个处理器执行根据本公开示例性实施例的异常根因定位方法。这里的计算机可读存储介质的示例包括:只读存储器(ROM)、随机存取可编程只读存储器(PROM)、电可擦除可编程只读存储器(EEPROM)、随机存取存储器(RAM)、动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)、闪存、非易失性存储器、CD-ROM、CD-R、CD+R、CD-RW、CD+RW、DVD-ROM、DVD-R、DVD+R、DVD-RW、DVD+RW、DVD-RAM、BD-ROM、BD-R、BD-RLTH、BD-RE、蓝光或光盘存储器、硬盘驱动器(HDD)、固态硬盘(SSD)、卡式存储器(诸如,多媒体卡、安全数字(SD)卡或极速数字(XD)卡)、磁带、软盘、磁光数据存储装置、光学数据存储装置、硬盘、固态盘以及任何其他装置,所述任何其他装置被配置为以非暂时性方式存储计算机程序以及任何相关联的数据、数据文件和数据结构并将所述计算机程序以及任何相关联的数据、数据文件和数据结构提供给处理器或计算机使得处理器或计算机能执行所述计算机程序。上述计算机可读存储介质中的计算机程序可在诸如客户端、主机、代理装置、服务器等计算机设备中部署的环境中运行,此外,在一个示例中,计算机程序以及任何相关联的数据、数据文件和数据结构分布在联网的计算机***上,使得计算机程序以及任何相关联的数据、数据文件和数据结构通过一个或多个处理器或计算机以分布式方式存储、访问和执行。
根据本公开的实施例中,还可提供一种计算机程序产品,该计算机程序产品中的指令可被电子设备中的至少一个处理器运行以执行根据本公开示例性实施例的异常根因定位方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (14)

1.一种异常根因定位方法,其特征在于,包括:
检测异常;
响应于检测到异常,根据归因维度集合执行归因探测操作来确定所述异常的归因路径中的根因节点,其中,归因维度集合包括多个归因维度,每个根因节点对应于一个归因维度的异常归因维度值;
根据归因路径中的所有根因节点确定异常根因,
其中,所述归因探测操作包括:
对归因维度集合中的每个归因维度,分别进行所述每个归因维度下的异常检测来确定所述每个归因维度的异常归因维度值;
计算所述每个归因维度的异常程度;
在归因维度集合中的所有归因维度的异常程度中的最小值满足预定条件的情况下,将异常程度等于该最小值的归因维度的异常归因维度值确定为对应于归因路径中的根因节点,通过从归因维度集合中去除异常程度等于该最小值的归因维度来更新归因维度集合,并且根据更新后的归因维度集合执行所述归因探测操作,直至归因维度集合为空;
在归因维度集合中的所有归因维度的异常程度中的最小值不满足预定条件的情况下,将异常程度等于该最小值的归因维度的异常归因维度值确定为对应于归因路径中的根因节点,并且不再执行所述归因探测操作。
2.如权利要求1所述的异常根因定位方法,其特征在于,所述检测异常,包括:
对用户的关注维度或关注维度组合进行异常检测,来确定异常的关注维度值或关注维度组合值,
其中,所述根据归因维度集合执行归因探测操作来确定所述异常的归因路径中的根因节点,包括:
针对异常的关注维度值或关注维度组合值,根据归因维度集合执行归因探测操作来确定归因路径中的根因节点。
3.如权利要求1所述的异常根因定位方法,其特征在于,每个归因维度的异常程度等于所述每个归因维度的异常归因维度值的数量与进行所述每个归因维度下的异常检测时所考虑的归因维度值的数量之比。
4.如权利要求1所述的异常根因定位方法,其特征在于,所述检测异常,包括:
检测内容分发网络中发生的异常,
其中,所述归因维度集合中包括影响内容分发网络质量的多个维度。
5.如权利要求4所述的异常根因定位方法,其特征在于,所述异常包括与流媒体服务有关的异常。
6.如权利要求1所述的异常根因定位方法,还包括:根据确定的异常根因提供报警信息。
7.一种异常根因定位装置,其特征在于,包括:
异常检测单元,被配置为检测异常;
根因节点确定单元,被配置为响应于检测到异常,根据归因维度集合执行归因探测操作来确定所述异常的归因路径中的根因节点,其中,归因维度集合包括多个归因维度,每个根因节点对应于一个归因维度的异常归因维度值;
异常根因确定单元,被配置为根据归因路径中的所有根因节点确定异常根因,
其中,所述归因探测操作包括:
对归因维度集合中的每个归因维度,分别进行所述每个归因维度下的异常检测来确定所述每个归因维度的异常归因维度值;
计算所述每个归因维度的异常程度;
在归因维度集合中的所有归因维度的异常程度中的最小值满足预定条件的情况下,将异常程度等于该最小值的归因维度的异常归因维度值确定为对应于归因路径中的根因节点,通过从归因维度集合中去除异常程度等于该最小值的归因维度来更新归因维度集合,并且根据更新后的归因维度集合执行所述归因探测操作,直至归因维度集合为空;
在归因维度集合中的所有归因维度的异常程度中的最小值不满足预定条件的情况下,将异常程度等于该最小值的归因维度的异常归因维度值确定为对应于归因路径中的根因节点,并且不再执行所述归因探测操作。
8.如权利要求7所述的异常根因定位装置,其特征在于,所述检测异常,包括:
对用户的关注维度或关注维度组合进行异常检测,来确定异常的关注维度值或关注维度组合值,
其中,所述根据归因维度集合执行归因探测操作来确定所述异常的归因路径中的根因节点,包括:
针对异常的关注维度值或关注维度组合值,根据归因维度集合执行归因探测操作来确定归因路径中的根因节点。
9.如权利要求7所述的异常根因定位装置,其特征在于,每个归因维度的异常程度等于所述每个归因维度的异常归因维度值的数量与进行所述每个归因维度下的异常检测时所考虑的归因维度值的数量之比。
10.如权利要求7所述的异常根因定位装置,其特征在于,所述检测异常,包括:
检测内容分发网络中发生的异常,
其中,所述归因维度集合中包括影响内容分发网络质量的多个维度。
11.如权利要求10所述的异常根因定位装置,其特征在于,所述异常包括与流媒体服务有关的异常。
12.如权利要求7所述的异常根因定位装置,还包括:报警单元,被配置为根据确定的异常根因提供报警信息。
13.一种电子设备,其特征在于,包括:
至少一个处理器;
至少一个存储计算机可执行指令的存储器,
其中,所述计算机可执行指令在被所述至少一个处理器运行时,促使所述至少一个处理器执行如权利要求1到6中的任一权利要求所述的异常根因定位方法。
14.一种存储指令的计算机可读存储介质,其特征在于,当所述指令被至少一个处理器运行时,促使所述至少一个处理器执行如权利要求1到6中的任一权利要求所述的异常根因定位方法。
CN202011511168.0A 2020-12-18 2020-12-18 异常根因定位方法、装置、电子设备及存储介质 Active CN112702198B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011511168.0A CN112702198B (zh) 2020-12-18 2020-12-18 异常根因定位方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011511168.0A CN112702198B (zh) 2020-12-18 2020-12-18 异常根因定位方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN112702198A CN112702198A (zh) 2021-04-23
CN112702198B true CN112702198B (zh) 2023-03-14

Family

ID=75509093

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011511168.0A Active CN112702198B (zh) 2020-12-18 2020-12-18 异常根因定位方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112702198B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114547133B (zh) * 2022-01-17 2023-03-28 北京元年科技股份有限公司 基于多维数据集的对话式归因分析方法、装置及设备
CN114900421A (zh) * 2022-04-08 2022-08-12 深圳绿米联创科技有限公司 故障检测方法、装置、电子设备及可读存储介质
CN117389230B (zh) * 2023-11-16 2024-06-07 广州中健中医药科技有限公司 抗高血压中药提取液生产控制方法及***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111064614A (zh) * 2019-12-17 2020-04-24 腾讯科技(深圳)有限公司 一种故障根因定位方法、装置、设备及存储介质
CN111078521A (zh) * 2019-12-18 2020-04-28 北京三快在线科技有限公司 异常事件的分析方法、装置、设备、***及存储介质
CN111158977A (zh) * 2019-12-12 2020-05-15 深圳前海微众银行股份有限公司 一种异常事件根因定位方法及装置
CN111444247A (zh) * 2020-06-17 2020-07-24 北京必示科技有限公司 一种基于kpi指标的根因定位方法、装置及存储介质
CN111538951A (zh) * 2020-03-31 2020-08-14 北京华三通信技术有限公司 一种异常定位方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200053108A1 (en) * 2018-08-07 2020-02-13 Apple Inc. Utilizing machine intelligence to identify anomalies

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111158977A (zh) * 2019-12-12 2020-05-15 深圳前海微众银行股份有限公司 一种异常事件根因定位方法及装置
CN111064614A (zh) * 2019-12-17 2020-04-24 腾讯科技(深圳)有限公司 一种故障根因定位方法、装置、设备及存储介质
CN111078521A (zh) * 2019-12-18 2020-04-28 北京三快在线科技有限公司 异常事件的分析方法、装置、设备、***及存储介质
CN111538951A (zh) * 2020-03-31 2020-08-14 北京华三通信技术有限公司 一种异常定位方法及装置
CN111444247A (zh) * 2020-06-17 2020-07-24 北京必示科技有限公司 一种基于kpi指标的根因定位方法、装置及存储介质

Also Published As

Publication number Publication date
CN112702198A (zh) 2021-04-23

Similar Documents

Publication Publication Date Title
CN112702198B (zh) 异常根因定位方法、装置、电子设备及存储介质
US20240195833A1 (en) System for automated capture and analysis of business information for security and client-facing infrastructure reliability
US10048995B1 (en) Methods and apparatus for improved fault analysis
US20190205153A1 (en) System and method of dynamically assigning device tiers based on application
US9158650B2 (en) Mobile application performance management
US9049105B1 (en) Systems and methods for tracking and managing event records associated with network incidents
US10178198B2 (en) System and method for selection and switching of content sources for a streaming content session
US9553909B2 (en) System and method for assignment and switching of content sources for a streaming content session
CN107332765B (zh) 用于维修路由器故障的方法和装置
CN110727560A (zh) 云服务报警方法及装置
WO2014196954A1 (en) Health monitoring using snapshot backups through test vectors
US20200250019A1 (en) Method, device and computer program product for monitoring access request
US20160134508A1 (en) Non-disruptive integrated network infrastructure testing
US10423480B2 (en) Guided troubleshooting with autofilters
CN113473086B (zh) 视频播放的方法、装置、电子设备、智慧高速大屏
US10372524B2 (en) Storage anomaly detection
CN105490835B (zh) 信息监控方法和装置
CN110727563A (zh) 预设客户的云服务报警方法及装置
CN109597724A (zh) 服务稳定性测量方法、装置、计算机设备及存储介质
CN112702229A (zh) 数据传输方法、装置、电子设备以及存储介质
US20200142746A1 (en) Methods and system for throttling analytics processing
CN117061335A (zh) 云平台设备健康管控方法、装置、存储介质和电子设备
CN112769643B (zh) 资源调度方法、装置、电子设备及存储介质
CN113254245A (zh) 一种存储集群的故障检测方法和***
US20160359714A1 (en) Notifying original state listeners of events in a domain model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant