CN114844768A - 信息分析方法、装置及电子设备 - Google Patents

信息分析方法、装置及电子设备 Download PDF

Info

Publication number
CN114844768A
CN114844768A CN202210457613.2A CN202210457613A CN114844768A CN 114844768 A CN114844768 A CN 114844768A CN 202210457613 A CN202210457613 A CN 202210457613A CN 114844768 A CN114844768 A CN 114844768A
Authority
CN
China
Prior art keywords
fault
service
abnormal
determining
service node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210457613.2A
Other languages
English (en)
Inventor
冯鹏
欧阳晔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Yaxin Technology Co ltd
Original Assignee
Guangzhou Yaxin Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Yaxin Technology Co ltd filed Critical Guangzhou Yaxin Technology Co ltd
Priority to CN202210457613.2A priority Critical patent/CN114844768A/zh
Publication of CN114844768A publication Critical patent/CN114844768A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请实施例提供了一种信息分析方法、装置、电子设备及计算机可读存储介质,涉及计算机技术领域。该方法包括:检测到第一业务故障,确定与所述第一业务故障对应的异常服务节点;获取所述异常服务节点的运行信息,确定每个所述异常服务节点对应的故障关联系数;根据所述故障关联系数,确定所述异常服务节点中的根因服务节点;相比于相关技术中由运维人员根据运维经验排查业务日志来判断根因服务节点,本申请实施例根据故障拓扑确定故障关联系数,进而根据故障关联系数确定根因服务节点,实现了提高根因服务节点确定的效率以及准确率,并节省了人力资源。

Description

信息分析方法、装置及电子设备
技术领域
本申请涉及计算机技术领域,具体而言,本申请涉及一种信息分析方法、装置、电子设备及计算机可读存储介质。
背景技术
随着云计算、大数据和微服务等技术的发展,业务***的结构愈加复杂化、技术组件也更加多样化,这样,业务***发生故障也会对业务正常运行造成更大影响。相关技术中,业务***一旦发生故障,通常由运维人员通过多年的运维经验来判断常见故障的可能诱因。然而,通过不同运维人员定位故障的准确性存在一定差异,并且这种方式需要投入较多人力成本,定位故障耗时较长。
发明内容
本申请的目的旨在至少能解决上述的技术缺陷之一,特别是人工定位故障诱因准确性低、耗费人力成本的技术缺陷。
根据本申请的一个方面,提供了一种信息分析方法,该方法包括:
检测到第一业务故障,确定与所述第一业务故障对应的异常服务节点;
获取所述异常服务节点的运行信息,确定每个所述异常服务节点对应的故障关联系数;其中,所述故障关联系数为根据第一业务故障的对应的故障拓扑确定的,所述故障拓扑是根据所述异常服务节点的运行信息确定的;
根据所述故障关联系数,确定所述异常服务节点中的根因服务节点。
可选的,所述方法还包括:
获取所述根因服务节点的告警信息;
在所述告警信息中,确定与所述第一业务故障对应的目标告警信息。
可选的,所述确定每个所述异常服务节点对应的故障关联系数,包括:
根据所述异常服务节点的运行信息,确定所述第一业务故障的对应的故障拓扑;其中,所述故障拓扑中包括所述异常服务节点在所述调用链上的位置信息以及所述异常服务节点执行相互调用时发生异常的次数;
根据所述故障拓扑确定所述故障关联系数。
可选的,所述根据所述故障关联系数,确定所述异常服务节点中的根因服务节点,包括:
对所述故障关联系数进行排序,确定所述故障关联系数最大的异常服务节点为所述根因服务节点。
可选的,所述获取所述异常服务节点的运行信息,包括:
获取所述第一业务的业务日志;
对所述业务日志进行预处理,获取所述异常服务节点的运行信息;
其中,所述预处理包括删除冗余数据、数据合并、增加数据中的至少一项。
可选的,所述运行信息包括以下至少一项:
服务调用时长;服务调用成功率;服务调用次数。
根据本申请的另一个方面,提供了一种信息分析装置,该装置包括:
第一确定模块,用于检测到第一业务故障,确定与所述第一业务故障对应的异常服务节点;
第二确定模块,用于获取所述异常服务节点的运行信息,确定每个所述异常服务节点对应的故障关联系数;其中,所述故障关联系数为根据第一业务故障的对应的故障拓扑确定的,所述故障拓扑是根据所述异常服务节点的运行信息确定的;
第三确定模块,用于根据所述故障关联系数,确定所述异常服务节点中的根因服务节点。
可选的,所述第二确定模块具体用于:
根据所述异常服务节点的运行信息,确定所述第一业务故障的对应的故障拓扑;其中,所述故障拓扑中包括所述异常服务节点在所述调用链上的位置信息以及所述异常服务节点执行相互调用时发生异常的次数;
根据所述故障拓扑确定所述故障关联系数。
根据本申请的另一个方面,提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行根据本申请的第一方面任一项所述的信息分析方法。
例如,本申请的第三方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;
存储器用于存放至少一可执行指令,可执行指令使处理器执行如本申请的第一方面所示的信息分析方法对应的操作。
根据本申请的再一个方面,提供了一种计算机可读存储介质,所述计算机程序被处理器执行时实现本申请的第一方面任一项所述的信息分析方法。
例如,本申请实施例的第四方面,提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现本申请第一方面所示的信息分析方法。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述第一方面的各种可选实现方式中提供的方法。
本申请提供的技术方案带来的有益效果是:
本申请实施例通过检测到第一业务故障,确定与所述第一业务故障对应的异常服务节点;获取所述异常服务节点的运行信息,确定每个所述异常服务节点对应的故障关联系数;根据所述故障关联系数,确定所述异常服务节点中的根因服务节点;相比于相关技术中由运维人员根据运维经验排查业务日志来判断根因服务节点,本申请实施例根据故障拓扑确定故障关联系数,进而根据故障关联系数确定根因服务节点,实现了提高根因服务节点确定的效率以及准确率,并节省了人力资源。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1为本申请实施例提供的一种信息分析方法的流程示意图;
图2为本申请实施例提供的一种信息分析方法的应用场景示意图;
图3为本申请实施例提供的一种信息分析方法的流程示意图;
图4为本申请实施例提供的一种信息分析方法的流程示意图;
图5为本申请实施例提供的一种信息分析方法的流程示意图;
图6为本申请实施例提供的一种信息分析装置的结构示意图;
图7为本申请实施例提供的一种信息分析的电子设备的结构示意图。
具体实施方式
下面结合本申请中的附图描述本申请的实施例。应理解,下面结合附图所阐述的实施方式,是用于解释本申请实施例的技术方案的示例性描述,对本申请实施例的技术方案不构成限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请实施例所使用的术语“包括”以及“包含”是指相应特征可以实现为所呈现的特征、信息、数据、步骤、操作、元件和/或组件,但不排除实现为本技术领域所支持其他特征、信息、数据、步骤、操作、元件、组件和/或它们的组合等。应该理解,当我们称一个元件被“连接”或“耦接”到另一元件时,该一个元件可以直接连接或耦接到另一元件,也可以指该一个元件和另一元件通过中间元件建立连接关系。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的术语“和/或”指示该术语所限定的项目中的至少一个,例如“A和/或B”可以实现为“A”,或者实现为“B”,或者实现为“A和B”。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
本申请提供的信息分析方法、装置、电子设备和计算机可读存储介质,旨在解决现有技术的如上技术问题。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
本申请实施例提供了一种信息分析方法,该方法的执行主体可以为任一电子设备,也可以为集成在这些设备上的装置或芯片,例如可以应用于具有服务信息分析的服务器或者终端设备执行,可选的,该方法可以由服务器执行,例如,服务器可以是各种应用微服务架构***的服务器设备,例如,应用微服务架构***的计算机设备等。
如图1所示,其为本申请实施例提供的一种信息分析方法的流程示意图,该方法可以包括:
步骤S101:检测到第一业务故障,确定与所述第一业务故障对应的异常服务节点。
可选的,本申请实施例可以应用于计算机技术领域;例如,具体可以应用于微服务***中的服务信息分析场景。
具体的,微服务(或微服务架构)是一种云原生架构;微服务架构中,单个应用程序由多个松散耦合且可独立部署的较小组件或服务组成。其中,微服务架构中的服务可以理解为服务节点,即微服务架构中包括多个服务节点。
作为示例,本申请的微服务***可以为业务处理***,其中,业务处理***中可以包括多个服务节点,例如,服务节点可以包括报销处理节点、审核处理节点、请假处理节点等等。可选的,在实际场景中,微服务***中的节点之间存在相互调用;例如,当用户触发报销业务时,根据报销业务处理流程,报销业务处理过程中需要进行报销业务审核;这时,可以通过报销处理节点调用审核处理节点等等。
本申请实施例中,在微服务***中检测到第一业务故障时,可以确定与所述第一业务故障对应的异常服务节点。
具体的,第一业务故障可以包括任一业务故障;例如,在实际场景中第一业务故障可以包括通过触发操作无法启动相应的业务、业务处理结果错误等故障。
本申请实施例中,可以在预设时间点或者预设时间周期,对业务处理***进行检测,确定第一业务故障。此外,还可以在用户或者***自动触发相应业务处理时,由于无法完成相应的业务,启动确定第一业务故障。
异常服务节点为第一业务故障对应的节点,例如,异常服务节点可以为与第一业务故障相关的运行异常的节点。
可选的,可以通过业务处理***的业务日志(业务日志例如Trace日志),获取各服务节点的运行参数,根据运行参数是否满足预设的阈值条件,确定各服务节点中的异常服务节点。其中,相关运行参数可以包括服务节点之间的服务节点调用关系、服务调用时长、服务调用成功率、服务调用次数、以及调用状态等参数。
例如,预设服务调用时长的阈值范围为小于或等于2毫秒;当服务节点的调用时长大于2毫秒时,则可以认为该服务节点为异常服务节点。又如,预设服务调用成功率的阈值范围为大于或等于90%;当服务节点的服务调用成功率为70%时,则可以认为该服务节点为异常服务节点。
步骤S102:获取所述异常服务节点的运行信息,确定每个所述异常服务节点对应的故障关联系数。
其中,所述故障关联系数为根据第一业务故障的对应的故障拓扑确定的,所述故障拓扑是根据所述异常服务节点的运行信息确定的。
具体而言,运行信息可以包括服务节点的运行参数,其中,运行参数可以包括服务节点之间的服务节点调用关系、服务调用时长、服务调用成功率、服务调用次数、以及调用状态等参数。
故障关联系数可以用于表征异常服务节点与第一业务故障的关联程度。可选的,本申请实施例中,可以根据第一业务故障的对应的故障拓扑确定所述故障关联系数。
其中,故障拓扑可以为根据异常服务节点的运行信息所生成的异常服务节点之间的拓扑。可选的,故障拓扑可以为树形结构,即故障拓扑可以为故障树;该故障树可以反映异常服务节点之间的调用关系以及异常服务节点执行相互调用时发生异常的次数。
作为示例,图2所示的故障树中,存在连接关系的异常服务节点之间存在调用关系;例如,头结点与子节点1之间存在调用关系,即头结点调用子节点1,子节点1与子节点r-003之间存在调用关系,即子节点1调用子节点r-003,子节点1与子节点r-004之间存在调用关系,即子节点1调用子节点r-004。可以理解的是,多个存在调用关系的异常服务节点之间形成调用链;例如,头结点、子节点1、子节点r-003、子节点-003、末端节点形成了一条调用链;又如,头结点、子节点1、子节点r-004、子节点003形成了另一条调用链。此外,故障树中的各个异常服务节点上还标识了该节点发生异常的次数;例如,子节点1发生异常的次数为102次;子节点r-003发生异常的次数为33次等等。
可以理解的是,本申请实施例可以根据异常服务节点的运行信息,即服务节点调用关系;服务调用时长;服务调用成功率;服务调用次数等信息,确定所述故障拓扑。然后根据第一业务故障的对应的故障拓扑确定每个所述异常服务节点对应的故障关联系数。
可选的,可以根据异常服务节点在调用链中的位置次序以及异常服务节点执行相互调用时发生异常的次数,确定每个所述异常服务节点对应的故障关联系数。
可选的,可以对异常服务节点在调用链中的位置次序,以及异常服务节点执行相互调用时发生异常的次数进行加权运算,将加权运算的综合权值作为异常服务节点对应的故障关联系数。例如,可以预先确定所述位置次序以及所述发生异常的次数分别对应的权重值,如,所述位置次序对应的权重值为60%;所述发生异常的次数对应的权重值为40%,等等。作为示例,如图2所示,在头结点、子节点1、子节点r-004、子节点003形成的调用链中,头结点的位置次序为1,发生异常次数为20;那么,头结点对应的综合权值为1×60%+20×40%=8.6。又如,子节点1的位置次序为2,发生异常次数为102;那么,子节点1对应的综合权值为2×60%+102×40%=42。
步骤S103:根据所述故障关联系数,确定所述异常服务节点中的根因服务节点。
具体而言,根因服务节点可以理解为导致第一业务故障产生的节点,即由于根因服务节点的异常,导致产生第一业务故障。
可以理解的是,异常服务节点与第一业务故障的关联程度越大,该异常服务节点作为根因服务节点的可能性越大。即所述故障关联系数越大,该异常服务节点作为根因服务节点的可能性越大。
可选的,本申请实施例中,可以对各个异常服务节点对应的故障关联系数进行由大到小排序,确定最大故障关联系数对应的节点为根因服务节点;此外,还可以根据故障关联系数排序,确定预设数量的根因服务节点。例如,可以确定排序前3位的3个异常服务节点为根因服务节点等等。
本申请实施例通过检测到第一业务故障,确定与所述第一业务故障对应的异常服务节点;获取所述异常服务节点的运行信息,确定每个所述异常服务节点对应的故障关联系数;根据所述故障关联系数,确定所述异常服务节点中的根因服务节点;相比于相关技术中由运维人员根据运维经验排查业务日志来判断根因服务节点,本申请实施例根据故障拓扑确定故障关联系数,进而根据故障关联系数确定根因服务节点,实现了提高根因服务节点确定的效率以及准确率,并节省了人力资源。
在本申请的另一个实施例中,所述获取所述异常服务节点的运行信息,包括:
获取所述第一业务的业务日志;
对所述业务日志进行预处理,获取所述异常服务节点的运行信息;
其中,所述预处理包括删除冗余数据、数据合并、增加数据中的至少一项。
本申请实施例中,所述异常服务节点的运行信息可以从业务处理***的业务日志(业务日志例如Trace日志)获取。例如,可以先对所述业务日志进行数据清洗等预处理,进而获取所述异常服务节点的运行信息。其中,所述预处理包括删除冗余数据、数据合并、增加数据中的至少一项。
在本申请的另一个实施例中,所述方法还包括:
获取所述根因服务节点的告警信息;
在所述告警信息中,确定与所述第一业务故障对应的目标告警信息。
可选的,本申请实施例中,在确定根因服务节点之后,可以确定根因服务节点的告警信息中,引发第一业务故障的目标告警信息。
其中,目标告警信息可以包括软件告警信息及硬件告警信息;软件告警信息例如进程中断告警信息、网络中断告警信息等等;硬件告警信息例如硬盘空间不足告警信息、CPU故障告警信息等等。
确定目标告警信息时,可以根据各告警信息产生的时间与第一业务故障发生的时间之间的第一关联关系,以及告警信息的类型与第一业务故障之间的第二关联关系,从所述告警信息中确定目标告警信息。
作为示例,如图3所示,本申请实施例中,可以在获取Trace日志后,对日志数据进行数据清洗;然后根据各个服务节点的运行信息确定异常服务节点,即调用链异常节点聚合;然后根据异常服务节点的运行信息确定故障树,即本申请实施例的故障拓扑;然后根据故障拓扑确定各异常服务节点的故障贡献率,即故障关联系数,并对故障贡献率进行排名;进一步的,还可以结合其他资源拓扑(服务节点之间的关系)确定根因服务节点;最终,在根因服务节点的告警信息中确定目标告警信息,即告警根因。
在本申请的另一个实施例中,所述确定每个所述异常服务节点对应的故障关联系数,包括:
根据所述异常服务节点的运行信息,确定所述第一业务故障的对应的故障拓扑;其中,所述故障拓扑中包括所述异常服务节点在所述调用链上的位置信息以及所述异常服务节点执行相互调用时发生异常的次数;
根据所述故障拓扑确定所述故障关联系数。
可选的,在本申请的一个实施例中,所述运行信息包括以下至少一项:
服务调用时长;服务调用成功率;服务调用次数。
故障拓扑可以为根据异常服务节点的运行信息所生成的异常服务节点之间的拓扑;选的,故障拓扑可以为树形结构,即故障拓扑可以为故障树;该故障树可以反映异常服务节点之间的调用关系以及异常服务节点执行相互调用时发生异常的次数。
作为示例,如图2所示,图中的故障树中,存在连接关系的异常服务节点之间存在调用关系;例如,头结点与子节点1之间存在调用关系,即头结点调用子节点1,子节点1与子节点r-003之间存在调用关系,即子节点1调用子节点r-003,子节点1与子节点r-004之间存在调用关系,即子节点1调用子节点r-004。可以理解的是,多个存在调用关系的异常服务节点之间形成调用链;例如,头结点、子节点1、子节点r-003、子节点-003、末端节点形成了一条调用链;又如,头结点、子节点1、子节点r-004、子节点003形成了另一条调用链。此外,故障树中的各个异常服务节点上还标识了该节点发生异常的次数;例如,子节点1发生异常的次数为102次;子节点r-003发生异常的次数为33次等等。
可以理解的是,本申请实施例可以根据异常服务节点的运行信息,即服务节点调用关系;服务调用时长;服务调用成功率;服务调用次数等信息,确定所述故障拓扑。然后根据第一业务故障的对应的故障拓扑确定每个所述异常服务节点对应的故障关联系数。
可选的,可以对异常服务节点在调用链中的位置次序以及异常服务节点执行相互调用时发生异常的次数进行加权运算,将加权运算的综合权值作为异常服务节点对应的故障关联系数。例如,可以预先确定所述位置次序以及所述发生异常的次数分别对应的权重值,如,所述位置次序对应的权重值为60%;所述发生异常的次数对应的权重值为40%,等等。作为示例,如图2所示,在头结点、子节点1、子节点r-004、子节点003形成的调用链中,头结点的位置次序为1,发生异常次数为20;那么,头结点对应的综合权值为1×60%+20×40%=8.6。又如,子节点1的位置次序为2,发生异常次数为102;那么,子节点1对应的综合权值为2×60%+102×40%=42。
作为示例,如图4所示,本申请实施例中,可以在获取Trace日志后,对日志数据进行数据清洗;然后根据各个服务节点的运行信息(业务黄金指标)对异常服务节点进行标记;此外,本申请实施例中,还可以结合服务节点之间的调用关系(调用服务地图)以及其他资源拓扑(服务节点之间的关系)标记疑似异常服务节点;根据异常服务节点以及疑似异常服务节点确定异常节点集。
此外,如图5所示,本申请的一些实施例中,日志数据还可以包括历史日志数据,即图5中所示的离线数据接入;可以通过历史日志数据对学习模型进行训练,然后通过训练好的学习模型预测得到异常服务节点。
在本申请的另一个实施例中,所述根据所述故障关联系数,确定所述异常服务节点中的根因服务节点,包括:
对所述故障关联系数进行排序,确定所述故障关联系数最大的异常服务节点为所述根因服务节点。
可以理解的是,异常服务节点与第一业务故障的关联程度越大,该异常服务节点作为根因服务节点的可能性越大。即所述故障关联系数越大,该异常服务节点作为根因服务节点的可能性越大。
可选的,本申请实施例中,可以对各个异常服务节点对应的故障关联系数进行由大到小排序,确定最大故障关联系数对应的节点为根因服务节点。
此外,在本申请的另一个实施例中,还可以根据故障关联系数排序,确定预设数量的根因服务节点。例如,可以确定排序前3位的3个异常服务节点为根因服务节点等等。
本申请实施例通过检测到第一业务故障,确定与所述第一业务故障对应的异常服务节点;获取所述异常服务节点的运行信息,确定每个所述异常服务节点对应的故障关联系数;根据所述故障关联系数,确定所述异常服务节点中的根因服务节点;相比于相关技术中由运维人员根据运维经验排查业务日志来判断根因服务节点,本申请实施例根据故障拓扑确定故障关联系数,进而根据故障关联系数确定根因服务节点,实现了提高根因服务节点确定的效率以及准确率,并节省了人力资源。
本申请实施例提供了一种信息分析装置,如图6所示,该信息分析装置60可以包括:第一确定模块601、第二确定模块602以及第三确定模块603,其中,
第一确定模块601,用于检测到第一业务故障,确定与所述第一业务故障对应的异常服务节点;
第二确定模块602,用于获取所述异常服务节点的运行信息,确定每个所述异常服务节点对应的故障关联系数;其中,所述故障关联系数为根据第一业务故障的对应的故障拓扑确定的,所述故障拓扑是根据所述异常服务节点的运行信息确定的;
第三确定模块603,用于根据所述故障关联系数,确定所述异常服务节点中的根因服务节点。
在本申请的另一个实施例中,所述装置还包括:
第四确定模块,用于获取所述根因服务节点的告警信息;
在所述告警信息中,确定与所述第一业务故障对应的目标告警信息。
在本申请的另一个实施例中,所述第二确定模块具体用于:
根据所述异常服务节点的运行信息,确定所述第一业务故障的对应的故障拓扑;其中,所述故障拓扑中包括所述异常服务节点在所述调用链上的位置信息以及所述异常服务节点执行相互调用时发生异常的次数;
根据所述故障拓扑确定所述故障关联系数。
在本申请的另一个实施例中,所述第三确定模块具体用于:
对所述故障关联系数进行排序,确定所述故障关联系数最大的异常服务节点为所述根因服务节点。
在本申请的另一个实施例中,所述第二确定模块具体用于:
获取所述第一业务的业务日志;
对所述业务日志进行预处理,获取所述异常服务节点的运行信息;
其中,所述预处理包括删除冗余数据、数据合并、增加数据中的至少一项。
在本申请的另一个实施例中,所述运行信息包括以下至少一项:
服务调用时长;服务调用成功率;服务调用次数。
本申请实施例的装置可执行本申请实施例所提供的方法,其实现原理相类似,本申请各实施例的装置中的各模块所执行的动作是与本申请各实施例的方法中的步骤相对应的,对于装置的各模块的详细功能描述具体可以参见前文中所示的对应方法中的描述,此处不再赘述。
本申请实施例通过检测到第一业务故障,确定与所述第一业务故障对应的异常服务节点;获取所述异常服务节点的运行信息,确定每个所述异常服务节点对应的故障关联系数;根据所述故障关联系数,确定所述异常服务节点中的根因服务节点;相比于相关技术中由运维人员根据运维经验排查业务日志来判断根因服务节点,本申请实施例根据故障拓扑确定故障关联系数,进而根据故障关联系数确定根因服务节点,实现了提高根因服务节点确定的效率以及准确率,并节省了人力资源。
本申请实施例中提供了一种电子设备,该电子设备包括:存储器和处理器;至少一个程序,存储于存储器中,用于被处理器执行时,与现有技术相比可实现:本申请实施例通过检测到第一业务故障,确定与所述第一业务故障对应的异常服务节点;获取所述异常服务节点的运行信息,确定每个所述异常服务节点对应的故障关联系数;根据所述故障关联系数,确定所述异常服务节点中的根因服务节点;相比于相关技术中由运维人员根据运维经验排查业务日志来判断根因服务节点,本申请实施例根据故障拓扑确定故障关联系数,进而根据故障关联系数确定根因服务节点,实现了提高根因服务节点确定的效率以及准确率,并节省了人力资源。
在一个可选实施例中提供了一种电子设备,如图7所示,图7所示的电子设备4000包括:处理器4001和存储器4003。其中,处理器4001和存储器4003相连,如通过总线4002相连。可选地,电子设备4000还可以包括收发器4004,收发器4004可以用于该电子设备与其他电子设备之间的数据交互,如数据的发送和/或数据的接收等。需要说明的是,实际应用中收发器4004不限于一个,该电子设备4000的结构并不构成对本申请实施例的限定。
处理器4001可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application SpecificIntegrated Circuit,专用集成电路),FPGA(FieldProgrammable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器4001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线4002可包括一通路,在上述组件之间传送信息。总线4002可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。总线4002可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器4003可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact DiscReadOnly Memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器4003用于存储执行本申请方案的应用程序代码(计算机程序),并由处理器4001来控制执行。处理器4001用于执行存储器4003中存储的应用程序代码,以实现前述方法实施例所示的内容。
其中,电子设备包括但不限于:移动电话、笔记本电脑、多媒体播放器、台式计算机等。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,当其在计算机上运行时,使得计算机可以执行前述方法实施例中相应内容。
本申请实施例通过检测到第一业务故障,确定与所述第一业务故障对应的异常服务节点;获取所述异常服务节点的运行信息,确定每个所述异常服务节点对应的故障关联系数;根据所述故障关联系数,确定所述异常服务节点中的根因服务节点;相比于相关技术中由运维人员根据运维经验排查业务日志来判断根因服务节点,本申请实施例根据故障拓扑确定故障关联系数,进而根据故障关联系数确定根因服务节点,实现了提高根因服务节点确定的效率以及准确率,并节省了人力资源。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”、“1”、“2”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除图示或文字描述以外的顺序实施。
应该理解的是,虽然本申请实施例的流程图中通过箭头指示各个操作步骤,但是这些步骤的实施顺序并不受限于箭头所指示的顺序。除非本文中有明确的说明,否则在本申请实施例的一些实施场景中,各流程图中的实施步骤可以按照需求以其他的顺序执行。此外,各流程图中的部分或全部步骤基于实际的实施场景,可以包括多个子步骤或者多个阶段。这些子步骤或者阶段中的部分或全部可以在同一时刻被执行,这些子步骤或者阶段中的每个子步骤或者阶段也可以分别在不同的时刻被执行。在执行时刻不同的场景下,这些子步骤或者阶段的执行顺序可以根据需求灵活配置,本申请实施例对此不限制。
以上所述仅是本申请部分实施场景的可选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请的方案技术构思的前提下,采用基于本申请技术思想的其他类似实施手段,同样属于本申请实施例的保护范畴。

Claims (10)

1.一种信息分析方法,其特征在于,包括:
检测到第一业务故障,确定与所述第一业务故障对应的异常服务节点;
获取所述异常服务节点的运行信息,确定每个所述异常服务节点对应的故障关联系数;其中,所述故障关联系数为根据第一业务故障的对应的故障拓扑确定的,所述故障拓扑是根据所述异常服务节点的运行信息确定的;
根据所述故障关联系数,确定所述异常服务节点中的根因服务节点。
2.根据权利要求1所述的信息分析方法,其特征在于,所述方法还包括:
获取所述根因服务节点的告警信息;
在所述告警信息中,确定与所述第一业务故障对应的目标告警信息。
3.根据权利要求1所述的信息分析方法,其特征在于,所述确定每个所述异常服务节点对应的故障关联系数,包括:
根据所述异常服务节点的运行信息,确定所述第一业务故障的对应的故障拓扑;其中,所述故障拓扑中包括所述异常服务节点在所述调用链上的位置信息以及所述异常服务节点执行相互调用时发生异常的次数;
根据所述故障拓扑确定所述故障关联系数。
4.根据权利要求1所述的信息分析方法,其特征在于,所述根据所述故障关联系数,确定所述异常服务节点中的根因服务节点,包括:
对所述故障关联系数进行排序,确定所述故障关联系数最大的异常服务节点为所述根因服务节点。
5.根据权利要求1所述的信息分析方法,其特征在于,所述获取所述异常服务节点的运行信息,包括:
获取所述第一业务的业务日志;
对所述业务日志进行预处理,获取所述异常服务节点的运行信息;
其中,所述预处理包括删除冗余数据、数据合并、增加数据中的至少一项。
6.根据权利要求1至5任一所述的信息分析方法,其特征在于,所述运行信息包括以下至少一项:
服务节点调用关系;服务调用时长;服务调用成功率;服务调用次数。
7.一种信息分析装置,其特征在于,包括:
第一确定模块,用于检测到第一业务故障,确定与所述第一业务故障对应的异常服务节点;
第二确定模块,用于获取所述异常服务节点的运行信息,确定每个所述异常服务节点对应的故障关联系数;其中,所述故障关联系数为根据第一业务故障的对应的故障拓扑确定的,所述故障拓扑是根据所述异常服务节点的运行信息确定的;
第三确定模块,用于根据所述故障关联系数,确定所述异常服务节点中的根因服务节点。
8.根据权利要求1所述的信息分析装置,其特征在于,所述第二确定模块具体用于:
根据所述异常服务节点的运行信息,确定所述第一业务故障的对应的故障拓扑;其中,所述故障拓扑中包括所述异常服务节点在所述调用链上的位置信息以及所述异常服务节点执行相互调用时发生异常的次数;
根据所述故障拓扑确定所述故障关联系数。
9.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行根据权利要求1至6任一项所述的信息分析方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6任一项所述的信息分析方法。
CN202210457613.2A 2022-04-27 2022-04-27 信息分析方法、装置及电子设备 Pending CN114844768A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210457613.2A CN114844768A (zh) 2022-04-27 2022-04-27 信息分析方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210457613.2A CN114844768A (zh) 2022-04-27 2022-04-27 信息分析方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN114844768A true CN114844768A (zh) 2022-08-02

Family

ID=82567717

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210457613.2A Pending CN114844768A (zh) 2022-04-27 2022-04-27 信息分析方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN114844768A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115016976A (zh) * 2022-08-08 2022-09-06 深圳壹师城科技有限公司 一种根因定位方法、装置、设备及存储介质
CN115396296A (zh) * 2022-08-18 2022-11-25 中电金信软件有限公司 业务处理方法、装置、电子设备及计算机可读存储介质
CN115514617A (zh) * 2022-09-13 2022-12-23 上海驻云信息科技有限公司 一种通用的异常根因定位及分析方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180253350A1 (en) * 2015-11-03 2018-09-06 Alibaba Group Holding Limited Monitoring node usage in a distributed system
CN108833184A (zh) * 2018-06-29 2018-11-16 腾讯科技(深圳)有限公司 服务故障定位方法、装置、计算机设备及存储介质
CN110166264A (zh) * 2018-02-11 2019-08-23 北京三快在线科技有限公司 一种故障定位方法、装置及电子设备
CN110888755A (zh) * 2019-11-15 2020-03-17 亚信科技(中国)有限公司 一种微服务***异常根因节点的查找方法及装置
CN114024837A (zh) * 2022-01-06 2022-02-08 杭州大乘智能科技有限公司 一种微服务***的故障根因定位方法
CN114202206A (zh) * 2021-12-14 2022-03-18 中国工商银行股份有限公司 ***异常根因分析方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180253350A1 (en) * 2015-11-03 2018-09-06 Alibaba Group Holding Limited Monitoring node usage in a distributed system
CN110166264A (zh) * 2018-02-11 2019-08-23 北京三快在线科技有限公司 一种故障定位方法、装置及电子设备
CN108833184A (zh) * 2018-06-29 2018-11-16 腾讯科技(深圳)有限公司 服务故障定位方法、装置、计算机设备及存储介质
CN110888755A (zh) * 2019-11-15 2020-03-17 亚信科技(中国)有限公司 一种微服务***异常根因节点的查找方法及装置
CN114202206A (zh) * 2021-12-14 2022-03-18 中国工商银行股份有限公司 ***异常根因分析方法及装置
CN114024837A (zh) * 2022-01-06 2022-02-08 杭州大乘智能科技有限公司 一种微服务***的故障根因定位方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115016976A (zh) * 2022-08-08 2022-09-06 深圳壹师城科技有限公司 一种根因定位方法、装置、设备及存储介质
CN115016976B (zh) * 2022-08-08 2022-11-25 深圳壹师城科技有限公司 一种根因定位方法、装置、设备及存储介质
CN115396296A (zh) * 2022-08-18 2022-11-25 中电金信软件有限公司 业务处理方法、装置、电子设备及计算机可读存储介质
CN115396296B (zh) * 2022-08-18 2023-06-27 中电金信软件有限公司 业务处理方法、装置、电子设备及计算机可读存储介质
CN115514617A (zh) * 2022-09-13 2022-12-23 上海驻云信息科技有限公司 一种通用的异常根因定位及分析方法及装置
CN115514617B (zh) * 2022-09-13 2024-06-21 上海驻云信息科技有限公司 一种通用的异常根因定位及分析方法及装置

Similar Documents

Publication Publication Date Title
CN112162878B (zh) 数据库故障发现方法、装置、电子设备及存储介质
CN114844768A (zh) 信息分析方法、装置及电子设备
CN114095567B (zh) 数据访问请求的处理方法、装置、计算机设备及介质
US20120174231A1 (en) Assessing System Performance Impact of Security Attacks
CN110543462A (zh) 微服务可靠性预测方法、预测装置、电子设备及存储介质
US9811447B2 (en) Generating a fingerprint representing a response of an application to a simulation of a fault of an external service
CN111913824A (zh) 确定数据链路故障原因的方法及相关设备
CN115113528A (zh) 神经网络模型的运行控制方法、装置、设备及介质
CN113656252B (zh) 故障定位方法、装置、电子设备以及存储介质
CN111159029A (zh) 自动化测试方法、装置、电子设备及计算机可读存储介质
CN116194894A (zh) 原生云应用程序的故障定位
CN112087320A (zh) 一种异常定位方法、装置、电子设备和可读存储介质
CN116738091A (zh) 页面监控方法、装置、电子设备及存储介质
CN115587017A (zh) 数据处理方法、装置、电子设备及存储介质
CN114546799A (zh) 埋点日志校验方法、装置、电子设备、存储介质及产品
CN113934595A (zh) 数据分析方法及***、存储介质及电子终端
CN113360342A (zh) 业务功能运行环境的监控方法及设备
CN112187527A (zh) 微服务的异常定位方法、装置、电子设备及可读存储介质
CN116820826B (zh) 一种基于调用链的根因定位方法、装置、设备及存储介质
CN116915463B (zh) 一种调用链数据安全分析方法、装置、设备及存储介质
CN117950891A (zh) 业务异常的处理方法、装置、电子设备及存储介质
CN117493050A (zh) 一种基于Pinpoint故障定位方法及***
CN116155688A (zh) 链路故障检测方法、装置、设备及介质
CN114253846A (zh) 自动化测试异常定位方法、装置、设备及可读存储介质
CN116882724A (zh) 一种业务流程优化方案的生成方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination