CN111782437B - 故障定位方法、装置、计算设备和介质 - Google Patents

故障定位方法、装置、计算设备和介质 Download PDF

Info

Publication number
CN111782437B
CN111782437B CN202010666253.8A CN202010666253A CN111782437B CN 111782437 B CN111782437 B CN 111782437B CN 202010666253 A CN202010666253 A CN 202010666253A CN 111782437 B CN111782437 B CN 111782437B
Authority
CN
China
Prior art keywords
service
information
change information
change
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010666253.8A
Other languages
English (en)
Other versions
CN111782437A (zh
Inventor
陈庆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202010666253.8A priority Critical patent/CN111782437B/zh
Publication of CN111782437A publication Critical patent/CN111782437A/zh
Application granted granted Critical
Publication of CN111782437B publication Critical patent/CN111782437B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本公开提供了一种故障定位方法,包括:获取监控***中的业务报警信息;基于业务报警信息,确定与业务报警信息相关联的目标业务;基于目标业务,确定与目标业务相关联的至少一个电子设备和至少一个业务变更信息;以及基于至少一个电子设备和至少一个业务变更信息,生成故障提示信息;其中,至少一个电子设备用于处理目标业务的业务数据,至少一个业务变更信息是对目标业务的业务内容进行变更生成的;其中,故障提示信息包括至少部分电子设备的设备标识和至少部分业务变更信息。本公开还提供了一种故障定位装置、一种计算设备以及一种介质。

Description

故障定位方法、装置、计算设备和介质
技术领域
本公开涉及计算机技术领域,特别是涉及一种故障定位方法、一种故障定位装置、一种计算设备以及一种计算机可读存储介质。
背景技术
企业的数据中心需要二十四小时运行以随时提供相关服务,为了保证数据中心的正常运行,通常通过企业的监控***负责数据中心的监控和应急处理。当出现影响业务连续性运行的故障时,需要迅速定位发生故障的原因以采取应急修复措施。
在实现本公开构思的过程中,发明人发现相关技术中至少存在如下问题。
目前,数据中心的监控***一般按照专业分别划分为多个监控子***,例如按专业划分为硬件设备、网络设备、***软件、应用软件等多个监控子***。各个专业各自查看自己的监控子***以确定是否发生与自己专业相关的故障,但各专业的监控子***未进行关联。当出现业务故障时,硬件设备、网络设备、***软件、应用软件等专业分别查看各自的监控子***,各专业的运维人员人工分析判断本次故障是否是与自身的专业相关。可见,相关技术的故障定位方式无法进行信息共享以及有效整合多专业的资源,需要和各专业进行多次沟通,人工查找故障涉及的软件或硬件,主观判断可能的故障原因,不利于故障根源的快速定位,导致故障定位效率较低。
发明内容
有鉴于此,本公开提供了一种优化的故障定位方法、故障定位装置、计算设备和计算机可读存储介质。
本公开的一个方面提供了一种故障定位方法,包括:获取监控***中的业务报警信息,基于所述业务报警信息,确定与所述业务报警信息相关联的目标业务,基于所述目标业务,确定与所述目标业务相关联的至少一个电子设备和至少一个业务变更信息,基于所述至少一个电子设备和所述至少一个业务变更信息,生成故障提示信息,其中,所述至少一个电子设备用于处理所述目标业务的业务数据,所述至少一个业务变更信息是对所述目标业务的业务内容进行变更生成的,其中,所述故障提示信息包括至少部分所述电子设备的设备标识和至少部分所述业务变更信息。
根据本公开实施例,上述基于所述至少一个电子设备和所述至少一个业务变更信息,生成故障提示信息包括:针对所述至少一个电子设备,在确定所述监控***中具有与至少部分所述电子设备相关的设备报警信息时,生成硬件故障提示信息,其中,所述硬件故障提示信息包括至少部分所述电子设备的设备标识,针对所述至少一个业务变更信息,确定所述至少一个业务变更信息中的至少部分所述业务变更信息,并且生成软件故障提示信息,其中,所述软件故障提示信息包括至少部分所述业务变更信息,其中,所述故障提示信息包括所述硬件故障提示信息和所述软件故障提示信息。
根据本公开实施例,在确定所述监控***中具有与至少部分所述电子设备相关的设备报警信息之前,所述方法还包括:确定生成业务报警信息的时刻点,基于所述时刻点,确定包含所述时刻点的时间段,确定所述监控***中是否具有在所述时间段内生成的与至少部分所述电子设备相关的设备报警信息。
根据本公开实施例,上述在确定所述监控***中具有与至少部分所述电子设备相关的设备报警信息时,生成硬件故障提示信息包括:在所述至少部分所述电子设备的设备数量超过预设数量时,确定所述至少部分所述电子设备所处的物理区域,基于所述物理区域,生成硬件故障提示信息,所述硬件故障提示信息包括所述物理区域的位置信息。
根据本公开实施例,上述确定所述至少一个业务变更信息中的至少部分所述业务变更信息包括:确定每个业务变更信息中的变更时间,基于所述变更时间,确定至少部分所述业务变更信息,其中,所述至少部分所述业务变更信息的变更时间晚于其他业务变更信息的变更时间,所述其他业务变更信息为所述至少一个业务变更信息中除所述至少部分所述业务变更信息之外的业务变更信息。
根据本公开实施例,在所述业务报警信息是针对多个目标业务的情况下,与每个所述目标业务相关联的业务变更信息为所述至少一个业务变更信息。其中,所述确定所述至少一个业务变更信息中的至少部分所述业务变更信息,并且生成软件故障提示信息包括:确定所述至少一个业务变更信息中的共同业务变更信息,所述共同业务变更信息与每个所述目标业务均相关联,基于所述共同业务变更信息,生成软件故障提示信息,其中,所述软件故障提示信息包括共同业务变更信息。
根据本公开实施例,上述基于所述共同业务变更信息,生成软件故障提示信息包括:确定所述共同业务变更信息中的共同变更项,所述共同变更项为针对所述每个目标业务的配置参数的变更项,基于所述共同变更项,生成软件故障提示信息,其中,所述软件故障提示信息包括所述共同变更项。
根据本公开实施例,上述软件故障提示信息包括链接信息,所述方法还包括:通过所述链接信息访问至少部分所述业务变更信息,以对至少部分所述业务变更信息进行复核。
根据本公开实施例,上述基于所述业务报警信息,确定与所述业务报警信息相关联的目标业务包括:确定所述业务报警信息中的业务标识,基于所述业务标识,确定与所述业务报警信息相关联的目标业务。
根据本公开实施例,上述基于所述目标业务,确定与所述目标业务相关联的至少一个电子设备和至少一个业务变更信息包括:基于所述目标业务,访问硬件配置管理数据库,以确定所述硬件配置管理数据库中与所述目标业务相关联的至少一个电子设备,基于所述目标业务,访问变更管理数据库,以确定所述变更管理数据库中与所述目标业务相关联的至少一个业务变更信息。
根据本公开实施例,上述获取监控***中的业务报警信息包括:确定所述业务报警信息的报警级别,在所述报警级别满足预设报警级别的情况下,获取监控***中的业务报警信息。
本公开的另一个方面提供了一种故障定位装置,包括:获取模块、第一确定模块、第二确定模块以及生成模块。其中,获取模块,获取监控***中的业务报警信息。第一确定模块,基于所述业务报警信息,确定与所述业务报警信息相关联的目标业务。第二确定模块,基于所述目标业务,确定与所述目标业务相关联的至少一个电子设备和至少一个业务变更信息。生成模块,基于所述至少一个电子设备和所述至少一个业务变更信息,生成故障提示信息。其中,所述至少一个电子设备用于处理所述目标业务的业务数据,所述至少一个业务变更信息是对所述目标业务的业务内容进行变更生成的。其中,所述故障提示信息包括至少部分所述电子设备的设备标识和至少部分所述业务变更信息。
根据本公开实施例,上述基于所述至少一个电子设备和所述至少一个业务变更信息,生成故障提示信息包括:针对所述至少一个电子设备,在确定所述监控***中具有与至少部分所述电子设备相关的设备报警信息时,生成硬件故障提示信息,其中,所述硬件故障提示信息包括至少部分所述电子设备的设备标识,针对所述至少一个业务变更信息,确定所述至少一个业务变更信息中的至少部分所述业务变更信息,并且生成软件故障提示信息,其中,所述软件故障提示信息包括至少部分所述业务变更信息,其中,所述故障提示信息包括所述硬件故障提示信息和所述软件故障提示信息。
根据本公开实施例,在确定所述监控***中具有与至少部分所述电子设备相关的设备报警信息之前,所述装置还包括:第三确定模块、第四确定模块以及第五确定模块。其中,第三确定模块,确定生成业务报警信息的时刻点。第四确定模块,基于所述时刻点,确定包含所述时刻点的时间段。第五确定模块,确定所述监控***中是否具有在所述时间段内生成的与至少部分所述电子设备相关的设备报警信息。
根据本公开实施例,上述在确定所述监控***中具有与至少部分所述电子设备相关的设备报警信息时,生成硬件故障提示信息包括:在所述至少部分所述电子设备的设备数量超过预设数量时,确定所述至少部分所述电子设备所处的物理区域,基于所述物理区域,生成硬件故障提示信息,所述硬件故障提示信息包括所述物理区域的位置信息。
根据本公开实施例,上述确定所述至少一个业务变更信息中的至少部分所述业务变更信息包括:确定每个业务变更信息中的变更时间,基于所述变更时间,确定至少部分所述业务变更信息,其中,所述至少部分所述业务变更信息的变更时间晚于其他业务变更信息的变更时间,所述其他业务变更信息为所述至少一个业务变更信息中除所述至少部分所述业务变更信息之外的业务变更信息。
根据本公开实施例,在所述业务报警信息是针对多个目标业务的情况下,与每个所述目标业务相关联的业务变更信息为所述至少一个业务变更信息。其中,所述确定所述至少一个业务变更信息中的至少部分所述业务变更信息,并且生成软件故障提示信息包括:确定所述至少一个业务变更信息中的共同业务变更信息,所述共同业务变更信息与每个所述目标业务均相关联,基于所述共同业务变更信息,生成软件故障提示信息,其中,所述软件故障提示信息包括共同业务变更信息。
根据本公开实施例,上述基于所述共同业务变更信息,生成软件故障提示信息包括:确定所述共同业务变更信息中的共同变更项,所述共同变更项为针对所述每个目标业务的配置参数的变更项,基于所述共同变更项,生成软件故障提示信息,其中,所述软件故障提示信息包括所述共同变更项。
根据本公开实施例,上述软件故障提示信息包括链接信息,所述装置还包括:访问模块,通过所述链接信息访问至少部分所述业务变更信息,以对至少部分所述业务变更信息进行复核。
根据本公开实施例,上述基于所述业务报警信息,确定与所述业务报警信息相关联的目标业务包括:确定所述业务报警信息中的业务标识,基于所述业务标识,确定与所述业务报警信息相关联的目标业务。
根据本公开实施例,上述基于所述目标业务,确定与所述目标业务相关联的至少一个电子设备和至少一个业务变更信息包括:基于所述目标业务,访问硬件配置管理数据库,以确定所述硬件配置管理数据库中与所述目标业务相关联的至少一个电子设备,基于所述目标业务,访问变更管理数据库,以确定所述变更管理数据库中与所述目标业务相关联的至少一个业务变更信息。
根据本公开实施例,上述获取监控***中的业务报警信息包括:确定所述业务报警信息的报警级别,在所述报警级别满足预设报警级别的情况下,获取监控***中的业务报警信息。
本公开的另一方面提供了一种计算设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上所述的方法。
本公开的另一方面提供了一种非易失性可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
根据本公开的实施例,利用如上所述的故障定位方法,可以至少部分地解决相关技术中故障定位效率较低的技术问题。因此可以实现提高故障定位效率的技术效果。
附图说明
为了更完整地理解本公开及其优势,现在将参考结合附图的以下描述,其中:
图1示意性示出了根据本公开实施例的故障定位方法和故障定位装置的***架构;
图2示意性示出了根据本公开实施例的故障定位方法的流程图;
图3示意性示出了根据本公开另一实施例的故障定位方法的流程图;
图4示意性示出了根据本公开实施例的故障定位装置的框图;以及
图5示意性示出了根据本公开实施例的用于实现故障定位的计算机***的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的***”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的***等)。
附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程控制装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。
因此,本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读存储介质上的计算机程序产品的形式,该计算机程序产品可供指令执行***使用或者结合指令执行***使用。在本公开的上下文中,计算机可读存储介质可以是能够包含、存储、传送、传播或传输指令的任意介质。例如,计算机可读存储介质可以包括但不限于电、磁、光、电磁、红外或半导体***、装置、器件或传播介质。计算机可读存储介质的具体示例包括:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;和/或有线/无线通信链路。
本公开实施例所涉及的业务可以是应用。业务故障可以是应用故障,应用故障例如可以是应用程序故障。
当数据中心出现业务故障时,出现业务故障可以是业务的交易量大幅降低甚至为零,或者该业务的交易响应时间过长,超出时间阈值。故障的根源可能是硬件故障或者软件故障。硬件故障可以包括处理该业务的业务数据的服务器等设备故障或者该业务所涉及到的网络设备故障,或者是大面积的机房环境设备故障。当出现硬件故障时,通常需要通过对硬件设备进行进行维修来解决该故障。
软件故障可以包括***宕机、触发软件漏洞、软件层面的配置错误等。从一方面来看,软件故障可以分为两类,一是软件自身故障,可以通过重启或者重新安装进行修复;另一类是人为参数配置错误引起,这类故障通常是与故障前实施的变更有关,需要进行参数修改或者变更回退。
为了定位数据中心中出现的故障,可将数据中心的监控***与配置管理数据库(Configuration Management Database,CMDB)、变更管理数据库进行关联,以实现将业务故障与硬件故障或者软件故障关联起来,以迅速定位故障根源。
在一方面,数据中心建立了强大的配置管理数据库,使用配置管理数据库对软硬件资产信息、配置信息进行管理。配置管理数据库保存了应用软件信息、***软件信息、硬件设备信息、网络信息等。配置管理数据库将各专业的配置信息都关联在一起。因此,可以利用数据中心的配置管理数据库对业务故障信息进行关联。
另一方面,数据中心基于信息技术基础架构(Information TechnologyInfrastructure Library,ITIL)建立了一套事件管理、问题管理、配置管理、变更管理、发布管理等IT治理***。其中的变更管理数据库记录了每次变更的要素,包含了涉及到的业务***、变更内容、变更范围等。监控***和变更管理数据库可以通过业务标识进行关联。
图1示意性示出了根据本公开实施例的故障定位方法和故障定位装置的***架构。需要注意的是,图1所示仅为可以应用本公开实施例的***架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、***、环境或场景。
如图1所示,本公开实施例的***架构100可以包括监控***110、配置管理数据库120、变更管理数据库130以及计算设备140。
本公开实施例将数据中心的监控***110、配置管理数据库120、变更管理数据库130进行关联以定位业务故障发生的原因。
具体地,本公开实施例的故障定位方法可以由计算设备140执行,或者,本公开实施例的故障定位装置可以设置于计算设备140中。
在一方面,通过将监控***110和配置管理数据库120进行关联。当监控***110中出现业务报警信息时,通过计算设备140访问配置管理数据库120中的网络配置信息、硬件设备配置信息,筛选出涉及到的硬件设备。然后,计算设备140自动搜索监控***110中出现业务报警信息的时间段内是否有这些服务器设备、网络设备的报警信息,从而定位到硬件故障。
由于数据中心大量采用虚拟机、容器等云化部署,当出现服务器硬件故障时,多个业务都将报警,通过本公开实施例的故障定位方法,可以关联至出现故障的硬件,提示硬件运维人员进一步确认硬件是否发生故障。
在另一方面,通过将监控***110和变更管理数据库130进行关联。当监控***110中出现业务报警信息时,通过计算设备140访问变更管理数据库130,将报警涉及到的软件层面的变更列出,定位到最近的一次变更,提示运维人员重新复核该变更内容的正确性。若定位到多个变更,可以进一步检索匹配这些变更的共同点,给出进一步的提示。
可以理解,通过本公开实施例的技术分方案,可有效提升业务故障的根源分析效率。具体地,本公开实施例自动关联监控***、配置管理数据库、变更管理数据库。实现自动进行报警分析,有效减轻运维人员压力,快速定位业务故障的根源,迅速恢复生产,降低生产运维风险。
以下将结合图1的***架构,来描述本公开实施例的故障定位方法。
本公开的实施例提供了一种故障定位方法,包括:获取监控***中的业务报警信息,基于业务报警信息,确定与业务报警信息相关联的目标业务。然后,基于目标业务,确定与目标业务相关联的至少一个电子设备和至少一个业务变更信息。接下来,基于至少一个电子设备和至少一个业务变更信息,生成故障提示信息。其中,至少一个电子设备用于处理目标业务的业务数据,至少一个业务变更信息是对目标业务的业务内容进行变更生成的,故障提示信息包括至少部分电子设备的设备标识和至少部分业务变更信息。
图2示意性示出了根据本公开实施例的故障定位方法的流程图。
如图2所示,本公开实施例的故障定位方法例如可以包括操作S210~操作S240。其中,本公开实施例的故障定位方法可以由图1所示的计算设备140执行。
在操作S210,获取监控***中的业务报警信息。
根据本公开实施例,当监控***监控到数据中心中出现业务报警时,计算设备140可以获取监控***中的业务报警信息。
其中,业务报警信息例如是数据中心中出现业务故障时生成的信息。出现业务故障可以是业务的交易量大幅降低甚至为零,或者该业务的交易响应时间过长导致超出时间阈值。
在操作S220,基于业务报警信息,确定与业务报警信息相关联的目标业务。
根据本公开实施例,业务报警信息中例如包括业务标识。在获取到业务报警信息之后,可以确定业务报警信息中的业务标识,然后基于业务标识,确定与业务报警信息相关联的目标业务。
其中,目标业务可以是银行对外业务、银行对内业务等等。
在操作S230,基于目标业务,确定与目标业务相关联的至少一个电子设备和至少一个业务变更信息。其中,至少一个电子设备用于处理目标业务的业务数据,至少一个业务变更信息是对目标业务的业务内容进行变更生成的。
例如,可以基于目标业务的业务标识,访问配置管理数据库,以确定配置管理数据库中与目标业务相关联的至少一个电子设备。可以基于目标业务的业务标识,访问变更管理数据库,以确定变更管理数据库中与目标业务相关联的至少一个业务变更信息。
在本公开实施例中,至少一个电子设备可以是用于处理目标业务的业务数据的硬件设备。至少一个业务变更信息可以是对目标业务的业务内容进行变更生成的信息,对目标业务的业务内容进行变更例如可以包括修改目标业务的程序代码中的相关配置参数。
接下来,在操作S240,基于至少一个电子设备和至少一个业务变更信息,生成故障提示信息。其中,故障提示信息包括至少部分电子设备的设备标识和至少部分业务变更信息。
根据本公开实施例,在根据业务报警信息搜索到与目标业务相关联的电子设备和业务变更信息之后,可以进一步定位出与本次报警相关的部分电子设备和部分业务变更信息。便于基于定位出的部分电子设备和部分业务变更信息生成故障提示信息,该故障提示信息可以用于提示运维人员对引起本次报警的硬件和软件进行复核。
可以理解,本公开实施例通过自动关联监控***、配置管理数据库、变更管理数据库。实现自动进行报警定位,有效减轻运维人员压力,快速定位业务故障的根源,迅速恢复生产,降低生产运维风险。
根据本公开实施例,上述操作S210中关于获取监控***中的业务报警信息包括:确定业务报警信息的报警级别,在报警级别满足预设报警级别的情况下,获取监控***中的业务报警信息。
在本公开实施例中,可以预先定义数据中心中发生的各类报警的报警级别。并且在每次发生报警时,首先确定本次报警的报警级别是否满足预设报警级别,在满足的情况下由计算设备140获取监控***中的业务报警信息,并将监控***、配置管理数据库、变更管理数据库进行关联。预设报警级别例如可以是预先设置的高级别的报警级别。
图3示意性示出了根据本公开另一实施例的故障定位方法的流程图。
如图3所示,本公开实施例的故障定位方法例如包括操作S210~操作S240以及操作S310~操作S340。其中,操作S210~操作S240与图2中描述的操作相同或类似,在此不再赘述。上述操作S240中关于基于至少一个电子设备和至少一个业务变更信息,生成故障提示信息可以包括操作S241~S242。
在操作S241,针对至少一个电子设备,在确定监控***中具有与至少部分电子设备相关的设备报警信息时,生成硬件故障提示信息,其中,硬件故障提示信息包括至少部分电子设备的设备标识。
根据本公开实施例,当在配置管理数据库中搜索到与目标业务相关联的至少一个电子设备后,继续确定在监控***中是否具有与部分电子设备相关的设备报警信息。如果确定监控***中具有部分电子设备的设备报警信息,则可以生成硬件故障提示信息。
例如,当在配置管理数据库中搜索到与目标业务相关联的电子设备1、电子设备2、电子设备3等等设备后,表明数据中心中由电子设备1、电子设备2、电子设备3来处理目标业务的业务数据。接下来,如果在监控***中确定具有与部分电子设备(例如电子设备1和电子设备2)相关的设备报警信息,则可以表明电子设备1和电子设备2发生故障引起的本次业务故障的概率较大,则可以生成硬件故障提示信息,该硬件故障提示信息中可以包括电子设备1和电子设备2的设备标识,便于运维人员根据设备标识复核电子设备1和电子设备2的故障情况。
在操作S242,针对至少一个业务变更信息,确定至少一个业务变更信息中的至少部分业务变更信息,并且生成软件故障提示信息,其中,软件故障提示信息包括至少部分业务变更信息。
在本公开实施例中,当在变更管理数据库中搜索到与目标业务相关联的至少一个业务变更信息后,可以根据每个业务变更信息的变更情况来确定出部分业务变更信息。业务变更信息可以包括变更单。
当在变更管理数据库中搜索到与目标业务相关联的业务变更信息1、业务变更信息2、业务变更信息3等等变更信息后,可以从业务变更信息1、业务变更信息2、业务变更信息3等等中确定出对本次故障影响概率较大的部分业务变更信息。例如确定出对本次故障影响概率较大的业务变更信息1,并生成软件故障提示信息,该软件故障提示信息中可以包括业务变更信息1,便于运维人员复核业务变更信息1中的变更内容。
根据本公开实施例,硬件故障提示信息和软件故障提示信息例如共同组成本公开实施例的故障提示信息。
以下将描述定位硬件故障的具体实现过程。
如图3所示,在执行操作S241中关于确定监控***中具有与至少部分电子设备相关的设备报警信息之前,本公开实施例的故障定位方法还包括操作S310~操作S330。
在操作S310,确定生成业务报警信息的时刻点。
在操作S320,基于时刻点,确定包含时刻点的时间段。
在操作S330,确定监控***中是否具有在时间段内生成的与至少部分电子设备相关的设备报警信息。
根据本公开实施例,例如将时间段内发生设备报警的电子设备作为部分电子设备。
在另一实施中,在至少部分电子设备的设备数量超过预设数量时,确定至少部分电子设备所处的物理区域。然后,基于物理区域,生成硬件故障提示信息,硬件故障提示信息包括物理区域的位置信息。
例如,物理区域可以是机房。如果部分电子设备的设备数量超过预设数量,可以表明机房发生故障的概率较大。例如机房发生断电等原因导致机房内的大量电子设备发生故障。此时,硬件故障信息中可以包括机房的位置信息,便于运维人员复核机房故障。
以下将描述定位软件故障的具体实现过程。
根据本公开实施例,上述操作S242中关于确定至少一个业务变更信息中的至少部分业务变更信息包括:确定每个业务变更信息中的变更时间,基于变更时间,确定至少部分业务变更信息,至少部分业务变更信息的变更时间晚于其他业务变更信息的变更时间,其他业务变更信息为至少一个业务变更信息中除至少部分业务变更信息之外的业务变更信息。
即,在一实施例中,本公开实施例可以将多个业务变更信息中变更时间最晚的一个业务变更信息作为部分业务变更信息,例如确定出变更时间最晚的一个变更单。然后,基于变更时间最晚的一个变更单生成软件故障提示信息,便于运维人员复核该变更时间最晚的一个变更单的变更内容。
在另一实施例中,在业务报警信息是针对多个目标业务的情况下,与每个目标业务相关联的业务变更信息为至少一个业务变更信息。
其中,上述操作S242中关于确定至少一个业务变更信息中的至少部分业务变更信息,并且生成软件故障提示信息包括:确定至少一个业务变更信息中的共同业务变更信息,共同业务变更信息与每个目标业务均相关联。然后,基于共同业务变更信息,生成软件故障提示信息,其中,软件故障提示信息包括共同业务变更信息。
根据本公开实施例,在多个目标业务均发生报警的情况下,确定出与每个目标业务均相关联的共同业务变更信息。该共同业务变更信息导致多个目标业务发生报警的概率较大,因此可以针对该共同业务变更信息进行复核。具体地,例如确定出与每个目标业务均相关联的共同变更单。然后,基于共同变更单生成软件故障提示信息,便于运维人员复核该共同变更单的变更内容。
在另一实施例中,共同变更单例如包括多个变更项,每个变更项例如可以是针对目标业务的相关参数进行变更。例如多个变更项包括变更项1、变更项2等等。变更项1针对每个目标业务的配置参数1进行变更,变更项2针对每个目标业务的配置参数2进行变更。
在本公开实施例中,可以进一步确定共同业务变更信息中的共同变更项,共同变更项为针对每个目标业务的配置参数的变更项,例如共同变更项为变更项1,该变更项1针对每个目标业务的同一配置参数(参数1)进行变更。然后,基于共同变更项生成软件故障提示信息,其中,软件故障提示信息包括共同变更项。
因此,本公开不仅可以定位到共同业务变更信息,还可以定位到具体的共同变更项,实现了故障的精准定位。
本公开实施例的另一方面,软件故障提示信息包括链接信息。
如图3所示,本公开实施例的故障定位方法还可以包括操作340。
在操作S340,通过链接信息访问至少部分业务变更信息,以对至少部分业务变更信息进行复核。
即,软件故障提示信息中可以包括变更管理数据库的链接,运维人员可以通过点击点击该链接信息访问变更管理数据库,以对变更管理数据库中的业务变更信息进行复核。
本公开实施例通过自动关联监控***、配置管理数据库、变更管理数据库。实现自动进行报警定位,有效减轻运维人员压力,快速定位业务故障的根源,迅速恢复生产,降低生产运维风险。
图4示意性示出了根据本公开实施例的故障定位装置的框图。
如图4所示,故障定位装置400例如可以包括获取模块410、第一确定模块420、第二确定模块430以及生成模块440。
获取模块410可以用于获取监控***中的业务报警信息。根据本公开实施例,获取模块410例如可以执行上文参考图2描述的操作S210,在此不再赘述。
第一确定模块420可以用于基于业务报警信息,确定与业务报警信息相关联的目标业务。根据本公开实施例,第一确定模块420例如可以执行上文参考图2描述的操作S220,在此不再赘述。
第二确定模块430可以用于基于目标业务,确定与目标业务相关联的至少一个电子设备和至少一个业务变更信息,其中,至少一个电子设备用于处理目标业务的业务数据,至少一个业务变更信息是对目标业务的业务内容进行变更生成的。根据本公开实施例,第二确定模块430例如可以执行上文参考图2描述的操作S230,在此不再赘述。
生成模块440可以用于基于至少一个电子设备和至少一个业务变更信息,生成故障提示信息,其中,故障提示信息包括至少部分电子设备的设备标识和至少部分业务变更信息。根据本公开实施例,生成模块440例如可以执行上文参考图2描述的操作S240,在此不再赘述。
根据本公开实施例,基于至少一个电子设备和至少一个业务变更信息,生成故障提示信息包括:针对至少一个电子设备,在确定监控***中具有与至少部分电子设备相关的设备报警信息时,生成硬件故障提示信息,其中,硬件故障提示信息包括至少部分电子设备的设备标识,针对至少一个业务变更信息,确定至少一个业务变更信息中的至少部分业务变更信息,并且生成软件故障提示信息,其中,软件故障提示信息包括至少部分业务变更信息,其中,故障提示信息包括硬件故障提示信息和软件故障提示信息。
根据本公开实施例,在确定监控***中具有与至少部分电子设备相关的设备报警信息之前,装置400还可以包括:第三确定模块、第四确定模块以及第五确定模块。其中,第三确定模块,确定生成业务报警信息的时刻点。第四确定模块,基于时刻点,确定包含时刻点的时间段。第五确定模块,确定监控***中是否具有在时间段内生成的与至少部分电子设备相关的设备报警信息。
根据本公开实施例,在确定监控***中具有与至少部分电子设备相关的设备报警信息时,生成硬件故障提示信息包括:在至少部分电子设备的设备数量超过预设数量时,确定至少部分电子设备所处的物理区域,基于物理区域,生成硬件故障提示信息,硬件故障提示信息包括物理区域的位置信息。
根据本公开实施例,确定至少一个业务变更信息中的至少部分业务变更信息包括:确定每个业务变更信息中的变更时间,基于变更时间,确定至少部分业务变更信息,其中,至少部分业务变更信息的变更时间晚于其他业务变更信息的变更时间,其他业务变更信息为至少一个业务变更信息中除至少部分业务变更信息之外的业务变更信息。
根据本公开实施例,在业务报警信息是针对多个目标业务的情况下,与每个目标业务相关联的业务变更信息为至少一个业务变更信息。其中,确定至少一个业务变更信息中的至少部分业务变更信息,并且生成软件故障提示信息包括:确定至少一个业务变更信息中的共同业务变更信息,共同业务变更信息与每个目标业务均相关联,基于共同业务变更信息,生成软件故障提示信息,其中,软件故障提示信息包括共同业务变更信息。
根据本公开实施例,基于共同业务变更信息,生成软件故障提示信息包括:确定共同业务变更信息中的共同变更项,共同变更项为针对每个目标业务的配置参数的变更项,基于共同变更项,生成软件故障提示信息,其中,软件故障提示信息包括共同变更项。
根据本公开实施例,软件故障提示信息包括链接信息,装置400还可以包括:访问模块,通过链接信息访问至少部分业务变更信息,以对至少部分业务变更信息进行复核。
根据本公开实施例,基于业务报警信息,确定与业务报警信息相关联的目标业务包括:确定业务报警信息中的业务标识,基于业务标识,确定与业务报警信息相关联的目标业务。
根据本公开实施例,基于目标业务,确定与目标业务相关联的至少一个电子设备和至少一个业务变更信息包括:基于目标业务,访问硬件配置管理数据库,以确定硬件配置管理数据库中与目标业务相关联的至少一个电子设备,基于目标业务,访问变更管理数据库,以确定变更管理数据库中与目标业务相关联的至少一个业务变更信息。
根据本公开实施例,获取监控***中的业务报警信息包括:确定业务报警信息的报警级别,在报警级别满足预设报警级别的情况下,获取监控***中的业务报警信息。
本公开还提供了一种计算设备,该计算设备可以包括:一个或多个处理器和存储装置。存储装置可以用于存储一个或多个程序。其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器可以执行图2~图3所示的方法。
本公开的另一方面提供了一种非易失性可读存储介质,存储有计算机可执行指令,该指令在被执行时用于实现图2~图3所示的方法。
本公开的另一方面提供了一种计算机程序,计算机程序包括计算机可执行指令,该指令在被执行时用于实现图2~图3所示的方法。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上***、基板上的***、封装上的***、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,获取模块410、第一确定模块420、第二确定模块430以及生成模块440中的任意多个可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,获取模块410、第一确定模块420、第二确定模块430以及生成模块440中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上***、基板上的***、封装上的***、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,获取模块410、第一确定模块420、第二确定模块430以及生成模块440中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图5示意性示出了根据本公开实施例的用于实现故障定位的计算机***的方框图。图5示出的计算机***仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图5所示,计算机***500包括处理器501、计算机可读存储介质502。该***500可以执行根据本公开实施例的方法。
具体地,处理器501例如可以包括通用微处理器、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器501还可以包括用于缓存用途的板载存储器。处理器501可以是用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
计算机可读存储介质502,例如可以是能够包含、存储、传送、传播或传输指令的任意介质。例如,可读存储介质可以包括但不限于电、磁、光、电磁、红外或半导体***、装置、器件或传播介质。可读存储介质的具体示例包括:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;和/或有线/无线通信链路。
计算机可读存储介质502可以包括计算机程序503,该计算机程序503可以包括代码/计算机可执行指令,其在由处理器501执行时使得处理器501执行根据本公开实施例的方法或其任何变形。
计算机程序503可被配置为具有例如包括计算机程序模块的计算机程序代码。例如,在示例实施例中,计算机程序503中的代码可以包括一个或多个程序模块,例如包括503A、模块503B、……。应当注意,模块的划分方式和个数并不是固定的,本领域技术人员可以根据实际情况使用合适的程序模块或程序模块组合,当这些程序模块组合被处理器501执行时,使得处理器501可以执行根据本公开实施例的方法或其任何变形。
根据本公开的实施例,获取模块410、第一确定模块420、第二确定模块430以及生成模块440中的至少一个可以实现为参考图5描述的计算机程序模块,其在被处理器501执行时,可以实现上面描述的相应操作。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/***中所包含的;也可以是单独存在,而未装配入该设备/装置/***中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现上述方法。
根据本公开的实施例,计算机可读存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读存储介质,该计算机可读存储介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线、光缆、射频信号等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
尽管已经参照本公开的特定示例性实施例示出并描述了本公开,但是本领域技术人员应该理解,在不背离所附权利要求及其等同物限定的本公开的精神和范围的情况下,可以对本公开进行形式和细节上的多种改变。因此,本公开的范围不应该限于上述实施例,而是应该不仅由所附权利要求来进行确定,还由所附权利要求的等同物来进行限定。

Claims (14)

1.一种故障定位方法,包括:
获取监控***中的业务报警信息;
基于所述业务报警信息,确定与所述业务报警信息相关联的目标业务;
基于所述目标业务,确定与所述目标业务相关联的至少一个电子设备和至少一个业务变更信息;以及
基于所述至少一个电子设备和所述至少一个业务变更信息,生成故障提示信息;
其中,所述至少一个电子设备用于处理所述目标业务的业务数据,所述至少一个业务变更信息是对所述目标业务的业务内容进行变更生成的;
其中,所述故障提示信息包括至少部分所述电子设备的设备标识和至少部分所述业务变更信息。
2.根据权利要求1所述的方法,其中,所述基于所述至少一个电子设备和所述至少一个业务变更信息,生成故障提示信息包括:
针对所述至少一个电子设备,在确定所述监控***中具有与至少部分所述电子设备相关的设备报警信息时,生成硬件故障提示信息,其中,所述硬件故障提示信息包括至少部分所述电子设备的设备标识;以及
针对所述至少一个业务变更信息,确定所述至少一个业务变更信息中的至少部分所述业务变更信息,并且生成软件故障提示信息,其中,所述软件故障提示信息包括至少部分所述业务变更信息,
其中,所述故障提示信息包括所述硬件故障提示信息和所述软件故障提示信息。
3.根据权利要求2所述的方法,其中,在确定所述监控***中具有与至少部分所述电子设备相关的设备报警信息之前,所述方法还包括:
确定生成业务报警信息的时刻点;
基于所述时刻点,确定包含所述时刻点的时间段;以及
确定所述监控***中是否具有在所述时间段内生成的与至少部分所述电子设备相关的设备报警信息。
4.根据权利要求2所述的方法,其中,所述在确定所述监控***中具有与至少部分所述电子设备相关的设备报警信息时,生成硬件故障提示信息包括:
在所述至少部分所述电子设备的设备数量超过预设数量时,确定所述至少部分所述电子设备所处的物理区域;以及
基于所述物理区域,生成硬件故障提示信息,所述硬件故障提示信息包括所述物理区域的位置信息。
5.根据权利要求2所述的方法,其中,所述确定所述至少一个业务变更信息中的至少部分所述业务变更信息包括:
确定每个业务变更信息中的变更时间;以及
基于所述变更时间,确定至少部分所述业务变更信息,
其中,所述至少部分所述业务变更信息的变更时间晚于其他业务变更信息的变更时间,所述其他业务变更信息为所述至少一个业务变更信息中除所述至少部分所述业务变更信息之外的业务变更信息。
6.根据权利要求2所述的方法,其中,在所述业务报警信息是针对多个目标业务的情况下,与每个所述目标业务相关联的业务变更信息为所述至少一个业务变更信息;
其中,所述确定所述至少一个业务变更信息中的至少部分所述业务变更信息,并且生成软件故障提示信息包括:
确定所述至少一个业务变更信息中的共同业务变更信息,所述共同业务变更信息与每个所述目标业务均相关联;以及
基于所述共同业务变更信息,生成软件故障提示信息,其中,所述软件故障提示信息包括共同业务变更信息。
7.根据权利要求6所述的方法,其中,所述基于所述共同业务变更信息,生成软件故障提示信息包括:
确定所述共同业务变更信息中的共同变更项,所述共同变更项为针对所述每个目标业务的配置参数的变更项;
基于所述共同变更项,生成软件故障提示信息,其中,所述软件故障提示信息包括所述共同变更项。
8.根据权利要求2所述的方法,其中,所述软件故障提示信息包括链接信息,
所述方法还包括:通过所述链接信息访问至少部分所述业务变更信息,以对至少部分所述业务变更信息进行复核。
9.根据权利要求1所述的方法,其中,所述基于所述业务报警信息,确定与所述业务报警信息相关联的目标业务包括:
确定所述业务报警信息中的业务标识;以及
基于所述业务标识,确定与所述业务报警信息相关联的目标业务。
10.根据权利要求1所述的方法,其中,所述基于所述目标业务,确定与所述目标业务相关联的至少一个电子设备和至少一个业务变更信息包括:
基于所述目标业务,访问硬件配置管理数据库,以确定所述硬件配置管理数据库中与所述目标业务相关联的至少一个电子设备;以及
基于所述目标业务,访问变更管理数据库,以确定所述变更管理数据库中与所述目标业务相关联的至少一个业务变更信息。
11.根据权利要求1至10中任一项所述的方法,其中,所述获取监控***中的业务报警信息包括:
确定所述业务报警信息的报警级别;以及
在所述报警级别满足预设报警级别的情况下,获取监控***中的业务报警信息。
12.一种故障定位装置,包括:
获取模块,获取监控***中的业务报警信息;
第一确定模块,基于所述业务报警信息,确定与所述业务报警信息相关联的目标业务;
第二确定模块,基于所述目标业务,确定与所述目标业务相关联的至少一个电子设备和至少一个业务变更信息;以及
生成模块,基于所述至少一个电子设备和所述至少一个业务变更信息,生成故障提示信息;
其中,所述至少一个电子设备用于处理所述目标业务的业务数据,所述至少一个业务变更信息是对所述目标业务的业务内容进行变更生成的;
其中,所述故障提示信息包括至少部分所述电子设备的设备标识和至少部分所述业务变更信息。
13.一种计算设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1至11中任一项所述的方法。
14.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1至11中任一项所述的方法。
CN202010666253.8A 2020-07-10 2020-07-10 故障定位方法、装置、计算设备和介质 Active CN111782437B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010666253.8A CN111782437B (zh) 2020-07-10 2020-07-10 故障定位方法、装置、计算设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010666253.8A CN111782437B (zh) 2020-07-10 2020-07-10 故障定位方法、装置、计算设备和介质

Publications (2)

Publication Number Publication Date
CN111782437A CN111782437A (zh) 2020-10-16
CN111782437B true CN111782437B (zh) 2023-08-11

Family

ID=72767472

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010666253.8A Active CN111782437B (zh) 2020-07-10 2020-07-10 故障定位方法、装置、计算设备和介质

Country Status (1)

Country Link
CN (1) CN111782437B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101022362A (zh) * 2007-03-27 2007-08-22 华为技术有限公司 定位故障的方法以及业务维护平台
CN105095048A (zh) * 2015-07-23 2015-11-25 上海新炬网络信息技术有限公司 一种基于业务规则的监控***告警关联处理方法
CN109039740A (zh) * 2018-08-01 2018-12-18 平安科技(深圳)有限公司 一种处理运维监控告警的方法及设备
CN109787816A (zh) * 2018-12-28 2019-05-21 北京奇安信科技有限公司 业务故障定位方法、装置、设备及介质
CN109921920A (zh) * 2014-12-16 2019-06-21 华为技术有限公司 一种故障信息处理方法与相关装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101022362A (zh) * 2007-03-27 2007-08-22 华为技术有限公司 定位故障的方法以及业务维护平台
CN109921920A (zh) * 2014-12-16 2019-06-21 华为技术有限公司 一种故障信息处理方法与相关装置
CN105095048A (zh) * 2015-07-23 2015-11-25 上海新炬网络信息技术有限公司 一种基于业务规则的监控***告警关联处理方法
CN109039740A (zh) * 2018-08-01 2018-12-18 平安科技(深圳)有限公司 一种处理运维监控告警的方法及设备
CN109787816A (zh) * 2018-12-28 2019-05-21 北京奇安信科技有限公司 业务故障定位方法、装置、设备及介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于CMDB的银行故障管理优化实现;徐定杰;郑笑天;;黑龙江科技信息(第06期);全文 *

Also Published As

Publication number Publication date
CN111782437A (zh) 2020-10-16

Similar Documents

Publication Publication Date Title
CN109039740B (zh) 一种处理运维监控告警的方法及设备
CN110224858B (zh) 基于日志的告警方法及相关装置
CN110888783A (zh) 微服务***的监测方法、装置以及电子设备
CN111814999B (zh) 一种故障工单生成方法、装置、设备
CN107025224B (zh) 一种监控任务运行的方法和设备
CN110275992B (zh) 应急处理方法、装置、服务器及计算机可读存储介质
CN112764956B (zh) 数据库的异常处理***、数据库的异常处理方法及装置
KR101444250B1 (ko) 개인정보 접근감시 시스템 및 그 방법
CN109800140A (zh) 业务告警事件起因分析的方法、装置、设备及介质
JP2018160186A (ja) 監視プログラム、監視方法および監視装置
CN107885634B (zh) 监控中异常信息的处理方法和装置
CN116016123A (zh) 故障处理方法、装置、设备及介质
CN112769615B (zh) 一种异常分析方法及装置
CN111782437B (zh) 故障定位方法、装置、计算设备和介质
CN112966056A (zh) 一种信息处理方法、装置、设备、***及可读存储介质
CN112817827A (zh) 运维方法、装置、服务器、设备、***及介质
CN115102838B (zh) 服务器宕机风险的应急处理方法和装置、电子设备
CN114500249B (zh) 一种根因定位方法和装置
CN112882892B (zh) 数据处理方法和装置、电子设备及存储介质
CN112445597B (zh) 定时任务调度方法和装置
CN114610560B (zh) ***异常监控方法、装置和存储介质
CN115934453A (zh) 一种故障排查方法、装置及存储介质
WO2016026403A1 (zh) 安全服务的审核处理方法及装置
CN112561385A (zh) 风险监控方法及***
CN112732531A (zh) 一种监控数据的处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant