CN117093455A - 应急数据的复盘方法及其装置、电子设备及存储介质 - Google Patents

应急数据的复盘方法及其装置、电子设备及存储介质 Download PDF

Info

Publication number
CN117093455A
CN117093455A CN202310799196.4A CN202310799196A CN117093455A CN 117093455 A CN117093455 A CN 117093455A CN 202310799196 A CN202310799196 A CN 202310799196A CN 117093455 A CN117093455 A CN 117093455A
Authority
CN
China
Prior art keywords
emergency
data
emergency data
disc
time period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310799196.4A
Other languages
English (en)
Inventor
张莹
王晔
张游琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202310799196.4A priority Critical patent/CN117093455A/zh
Publication of CN117093455A publication Critical patent/CN117093455A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/323Visualisation of programs or trace data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种应急数据的复盘方法及其装置、电子设备及存储介质,涉及金融科技领域,其中,该复盘方法包括:响应应急复盘请求,调用应急数据复盘组件,其中,应急数据复盘组件是基于可视化界面对应急数据进行回放的组件;确定待复盘的目标时间段,并将目标时间段输入到应急数据复盘组件,输出复盘报告,其中,目标时间段是基于应急事件的两个时间戳确定的,复盘报告包含由应急数据复盘组件基于目标时间段对处于目标时间段内的目标应急数据进行回放后得到的报告。本发明解决了相关技术中在进行应急复盘时,调度人员通过文件的形式记录应急过程的关键节点并登陆各***查看应急数据,手动完成应急复盘操作,复盘效率较低的技术问题。

Description

应急数据的复盘方法及其装置、电子设备及存储介质
技术领域
本发明涉及金融科技领域即其他相关技术领域,具体而言,涉及一种应急数据的复盘方法及其装置、电子设备及存储介质。
背景技术
应急处理在生产运维中是很重要的一个环节,是为了应对计算机***、网络或应用程序等突发性问题,而采取的资源调配、故障诊断和修复等紧急处理措施,当计算机***等发生生产故障时需要快速组织、快速决策、快速实施从而快速恢复生产,为了提高应对突发事件的能力,企业或者组织会通过应急演练,来检验应急预案的有效性,提升组织协调能力,然而仅仅进行演练是不够的,更重要的是在应急事件执行后对本次应急事件进行复盘总结。
相关技术中,在进行应急复盘时,调度人员通过文件的形式记录应急过程的关键节点并登陆各***查看应急数据,手动完成应急复盘操作,复盘效率较低,而且会耗费大量的人力资源。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种应急数据的复盘方法及其装置、电子设备及存储介质,以至少解决相关技术中在进行应急复盘时,调度人员通过文件的形式记录应急过程的关键节点并登陆各***查看应急数据,手动完成应急复盘操作,复盘效率较低的技术问题。
根据本发明实施例的一个方面,提供了一种应急数据的复盘方法,包括:响应应急复盘请求,调用应急数据复盘组件,其中,所述应急数据复盘组件是预先构建的基于可视化界面对应急数据进行回放的组件;确定待复盘的目标时间段,并将所述目标时间段输入到所述应急数据复盘组件,输出复盘报告,其中,所述目标时间段是基于应急事件的两个时间戳确定的,所述复盘报告包含由所述应急数据复盘组件基于所述目标时间段对处于所述目标时间段内的目标应急数据进行回放后得到的报告。
可选地,在响应应急复盘请求,调用应急数据复盘组件之前,还包括:在所述应急事件的执行过程中,采集所述应急事件的所有应急数据,其中,所述应急数据包括下述至少之一:应急类型、应急概况数据、关键节点数据、变更操作数据;为所述应急数据配置所述时间戳,并基于所述时间戳存储所述应急数据。
可选地,所述应急概况数据包括下述至少之一:故障发生事件点、应急事件标识、应急事件涉及的应用信息、应急人员、故障影响数据。
可选地,所述关键节点数据至少包括:应急启动节点数据、应急关键操作节点数据、故障恢复节点数据、应急结束节点数据。
可选地,在基于所述时间戳存储所述应急数据之后,还包括:将所述应急数据输入到所述应急数据复盘组件,由所述应急数据复盘组件基于应急类型确定所述应急事件的展示方式。
可选地,所述展示方式包括下述至少之一:趋势图、柱状图、曲线图、轮播列表。
可选地,所述应急数据复盘组件通过所述可视化界面对所述目标应急数据进行展示,所述应急数据复盘组件至少包括以下操作模块:时间设定按钮、回放倍率按钮、导出复盘报告按钮、回放进度条,其中,所述回放进度条上预先标记应急事件的关键节点。
可选地,所述应急数据的复盘方法还包括:创建复盘报告模板,并把所述复盘报告模板存储至所述应急数据复盘组件。
根据本发明实施例的另一方面,还提供了一种应急数据的复盘装置,包括:响应单元,用于响应应急复盘请求,调用应急数据复盘组件,其中,所述应急数据复盘组件是预先构建的基于可视化界面对应急数据进行回放的组件;输出单元,用于确定待复盘的目标时间段,并将所述目标时间段输入到所述应急数据复盘组件,输出复盘报告,其中,所述目标时间段是基于应急事件的两个时间戳确定的,所述复盘报告包含由所述应急数据复盘组件基于所述目标时间段对处于所述目标时间段内的目标应急数据进行回放后得到的报告。
可选地,所述应急数据的复盘装置还包括:第一采集模块,用于在所述应急事件的执行过程中,采集所述应急事件的所有应急数据,其中,所述应急数据包括下述至少之一:应急类型、应急概况数据、关键节点数据、变更操作数据;第一配置模块,用于为所述应急数据配置所述时间戳,并基于所述时间戳存储所述应急数据。
可选地,所述应急概况数据包括下述至少之一:故障发生事件点、应急事件标识、应急事件涉及的应用信息、应急人员、故障影响数据。
可选地,所述关键节点数据至少包括:应急启动节点数据、应急关键操作节点数据、故障恢复节点数据、应急结束节点数据。
可选地,所述应急数据的复盘装置还包括:第一输入模块,用于将所述应急数据输入到所述应急数据复盘组件,由所述应急数据复盘组件基于应急类型确定所述应急事件的展示方式。
可选地,所述展示方式包括下述至少之一:趋势图、柱状图、曲线图、轮播列表。
可选地,所述应急数据复盘组件通过所述可视化界面对所述目标应急数据进行展示,所述应急数据复盘组件至少包括以下操作模块:时间设定按钮、回放倍率按钮、导出复盘报告按钮、回放进度条,其中,所述回放进度条上预先标记应急事件的关键节点。
可选地,所述应急数据的复盘装置还包括:第一创建模块,用于创建复盘报告模板,并把所述复盘报告模板存储至所述应急数据复盘组件。
根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述任意一项应急数据的复盘方法。
根据本发明实施例的另一方面,还提供了一种电子设备,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述任意一项应急数据的复盘方法。
在本公开中,通过以下步骤:先响应应急复盘请求,调用应急数据复盘组件,其中,应急数据复盘组件是预先构建的基于可视化界面对应急数据进行回放的组件;然后确定待复盘的目标时间段,并将目标时间段输入到应急数据复盘组件,输出复盘报告,其中,目标时间段是基于应急事件的两个时间戳确定的,复盘报告包含由应急数据复盘组件基于目标时间段对处于目标时间段内的目标应急数据进行回放后得到的报告。
本公开中,应急数据可以通过应急数据复盘组件进行可视化展示和回放,当需要对应急事件进行复盘时,可以响应应急复盘请求,直接调用应急数据复盘组件,将需要回放的应急数据所处的时间段输入到应急数据复盘组件中,应急数据复盘组件调取相应的应急数据,通过可视化界面进行展示,并自动生成复盘报告。进而解决了相关技术中在进行应急复盘时,调度人员通过文件的形式记录应急过程的关键节点并登陆各***查看应急数据,手动完成应急复盘操作,复盘效率较低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的应急数据的复盘方法的流程图;
图2是根据本发明实施例的一种可选的应急数据复盘组件的可视化界面的示意图;
图3是根据本发明实施例的一种可选的应急数据的复盘装置的示意图;
图4是根据本发明实施例的一种应急数据的复盘方法的电子设备(或移动设备)的硬件结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,本公开中的应急数据的复盘方法及其装置可用于金融科技领域在基于应急数据进行回放和复盘的情况下,也可用于除金融科技领域之外的任意领域在基于应急数据进行回放和复盘的情况下,本公开中对应急数据的复盘方法及其装置的应用领域不做限定。
需要说明的是,本公开所涉及的相关信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。例如,本***和相关用户或机构间设置有接口,在获取相关信息之前,需要通过接口向前述的用户或机构发送获取请求,并在接收到前述的用户或机构反馈的同意信息后,获取相关信息。
本发明下述各实施例可应用于各种对数据进行复盘的***/应用/设备中。本发明自动采集应急过程中的完整数据,为数据回放提供数据基础,有助于更全面的分析和复盘,同时,基于应急数据复盘组件对数据进行回放,用户可以根据需求调整数据回放的播放速度、数据回放范围等基本设置,可以更直观地复盘完整的应急过程,不漏过任何一个细节,操作性强,本发明还可以根据应急数据复盘组件中的回放数据一键导出复盘报告,提升复盘报告的撰写速率,且不会遗漏数据,提升了应急复盘的精确性。
下面结合各个实施例来详细说明本发明。
实施例一
根据本发明实施例,提供了一种应急数据的复盘方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种可选的应急数据的复盘方法的流程图,如图1所示,该复盘方法包括如下步骤:
步骤S101,响应应急复盘请求,调用应急数据复盘组件,其中,应急数据复盘组件是预先构建的基于可视化界面对应急数据进行回放的组件;
步骤S102,确定待复盘的目标时间段,并将目标时间段输入到应急数据复盘组件,输出复盘报告,其中,目标时间段是基于应急事件的两个时间戳确定的,复盘报告包含由应急数据复盘组件基于目标时间段对处于目标时间段内的目标应急数据进行回放后得到的报告。
通过上述步骤,先响应应急复盘请求,调用应急数据复盘组件,其中,应急数据复盘组件是预先构建的基于可视化界面对应急数据进行回放的组件;然后确定待复盘的目标时间段,并将目标时间段输入到应急数据复盘组件,输出复盘报告,其中,目标时间段是基于应急事件的两个时间戳确定的,复盘报告包含由应急数据复盘组件基于目标时间段对处于目标时间段内的目标应急数据进行回放后得到的报告。
本实施例中,应急数据可以通过应急数据复盘组件进行可视化展示和回放,当需要对应急事件进行复盘时,可以响应应急复盘请求,直接调用应急数据复盘组件,将需要回放的应急数据所处的时间段输入到应急数据复盘组件中,应急数据复盘组件调取相应的应急数据,通过可视化界面进行展示,并自动生成复盘报告,提升了复盘效率和准确性。进而解决了相关技术中在进行应急复盘时,调度人员通过文件的形式记录应急过程的关键节点并登陆各***查看应急数据,手动完成应急复盘操作,复盘效率较低的技术问题。
下面结合上述各步骤对本发明实施例进行详细说明。
需要说明的是,应急复盘是指在应急事件结束后,对应急过程进行总结、分析和评估,以便进一步改进和提高应急响应能力,应急处理对***的生产运维至关重要,对应急事件进行复盘生成复盘报告,可以更直观地对应急事件进行分析,具体来说,应急复盘通常包含以下内容:事件描述:对应急事件的发生、进展、应急响应过程等进行全面、详细的描述;问题分析:对应急响应过程中出现的问题进行分析,识别问题的原因、影响范围,并制定相应的解决方案;风险评估:对已经出现或潜在的风险进行评估,制定应对方案并进行风险控制;效果评估:对应急响应的效果进行评估,比较预期目标与实际效果的差异,识别处理不当的原因,寻找改进的空间和方法;总结和改进建议:对应急复盘的过程和结果进行总结,并提出改进建议。
需要说明的是,通过应急复盘的过程,能够清晰、全面地了解应急事件的真实情况和现状,进一步提升应急响应能力,降低应急事件对生产运维的影响,保障***正常运行。
需要说明的是,本发明实施例提出了通过应急数据复盘组件对应急数据进行回放,可以直观地了解到应急事件执行的全过程,同时应急数据复盘组件中包含有一键导出复盘报告的功能按钮,可以基于回放数据直接导出复盘报告,提升复盘报告的生成效率,且相较于人为查询***导出相关数据撰写复盘报告的方式更为全面和准确。
需要说明的是,生产运维中的应急数据可以从以下内容获取:***日志,用于追踪和分析***的运行情况,包括错误信息、警告信息和一些诊断信息;备份数据,备份生产数据可以帮助在发生***问题时恢复数据,避免数据丢失,包括全量备份数据和增量备份数据;***配置信息,包括***硬件配置、软件配置以及***各类服务的配置信息,以保证在发生***问题时能够快速定位问题、故障排除;接口文档,生产环境中常常会依赖各种接口的数据,提前准备好接口文档可以在出现接口问题时快速找到接口问题的所在;安全凭证,包括服务器用户名、密码等重要信息以便在发生安全问题时能够及时控制;以上这些应急数据可以事先准备并妥善保管,当发生突发事件、灾害或紧急情况时能够及时响应,帮助快速恢复***稳定运行,降低生产运维的损失。
可选地,在响应应急复盘请求,调用应急数据复盘组件之前,还包括:在应急事件的执行过程中,采集应急事件的所有应急数据,其中,应急数据包括下述至少之一:应急类型、应急概况数据、关键节点数据、变更操作数据;为应急数据配置时间戳,并基于时间戳存储应急数据。
需要说明的是,本发明实施例在应急事件执行的过程中,会基于设定好的程序实时采集各***的应急数据,并根据应急数据产生的时间戳存储到数据库中,便于后续根据时间信息直接定位并调用对应的应急数据进行回放。
可选地,应急概况数据包括下述至少之一:故障发生事件点、应急事件标识、应急事件涉及的应用信息、应急人员、故障影响数据。
可选地,关键节点数据至少包括:应急启动节点数据、应急关键操作节点数据、故障恢复节点数据、应急结束节点数据。
需要说明的是,本发明实施例在应急过程中的产生的应急数据包括:应急概况、关键节点、应急涉及应用的相关告警操作变更信息等,其中,应急概况包括但不限于:故障发生时间、应急编号、故障涉及的应用、应急人员、故障影响的业务与***;关键节点包括但不限于:应急启动节点、应急关键操作节点、故障恢复时间节点、应急结束时间节点等;应急涉及应用的相关告警操作变更信息至少包括:告警操作信息(例如告警级别、告警通知方式、告警对象等相关变更操作信息,这些变更需要在应急过程中进行)、监控条件变更信息(当应用发生异常现象时,需要及时对监控条件进行调整,以便更好地监控应用运行状况);通过日志采集***采集上述相关数据,并按时间戳存入自身的数据库,可以完整保存应急数据。
可选地,在基于时间戳存储应急数据之后,还包括:将应急数据输入到应急数据复盘组件,由应急数据复盘组件基于应急类型确定应急事件的展示方式。
需要说明的是,对于大量的应急数据,不同级别的应急数据可以通过不同的方式进行展示,例如:通过趋势图来体现***一个时间段内的运行情况,通过轮播列表的形式展示各应用相关的告警操作变更信息等,将不同类型的应急数据输入到应急数据复盘组件中,就可以确定该应急数据的展示方式,并在用户端调用该应急数据时,通过可视化界面以及具体的展示方式进行展示。
可选地,展示方式包括下述至少之一:趋势图、柱状图、曲线图、轮播列表。
需要说明的是,处理通过趋势图和轮播列表对复盘数据进行展示,还可以构建柱状图,曲线图,散点图,饼图等数据图展示方式。
步骤S101,响应应急复盘请求,调用应急数据复盘组件。
需要说明的是,运维终端在每次应急事件执行结束后,都会对该次应急事件进行复盘,通过应急复盘请求可以调用预先构建好的应急数据复盘组件,通过应急数据组件的可视化界面可以对应急数据进行回放。
可选地,应急数据复盘组件通过可视化界面对目标应急数据进行展示,应急数据复盘组件至少包括以下操作模块:时间设定按钮、回放倍率按钮、导出复盘报告按钮、回放进度条,其中,回放进度条上预先标记应急事件的关键节点。
需要说明的是,图2是根据本发明实施例的一种可选的应急数据复盘组件的可视化界面的示意图,如图2所示,应急数据复盘组件的可视化界面配置包括以下多个操作模块:时间设定按钮、回放倍率按钮、导出复盘报告按钮、回放进度条,时间设定按钮可以设定待复盘的目标时间段,包括开始时间戳设定模块和结束时间戳设定模块,根据开始时间戳A和结束时间戳B就可以确定目标时间段,回放倍率按钮可以设定播放速度,例如当倍率为1时,***默认按1秒级回放数据,播放完需要(B-A)秒;当倍率为2时,按每秒回放第2秒、第4秒、第6秒的速度回放,播放完需要(B-A)/2秒,以此类推,导出复盘报告按钮可以根据当前回放的数据一键导出复盘报告,回放进度条拥有显示回放进度,拖动回放进度条可以查看各时间点的具体数据。
需要说明的是,可视化界面还包括开始/暂停按钮,快进按钮和快退按钮,通过快进或者快退按钮可以调整播放进度。
需要说明的是,通过应急数据复盘组件对数据进行回放代替原来复盘采用word或ppt形式回放应急过程,让参与复盘的各方人员能更直观、更全面、身临其境地复盘应急过程,这种形式可以自主切换查看每个时间点的关键数据,操作性更强。
步骤S102,确定待复盘的目标时间段,并将目标时间段输入到应急数据复盘组件,输出复盘报告。
需要说明的是,通过解析运维终端发送的应急复盘请求,确定待复盘的目标时间段,将该目标时间段输入到应急数据复盘组件,由应急数据复盘组件调用目标时间段内的全部应急数据,并根据时间顺序和展示方式在可视化界面中对应急数据进行回放,其中,目标时间段是基于应急事件的两个时间戳确定的。
需要说明的是,应急数据复盘组件根据目标时间段调用存储在数据库中的相关应急数据,即目标应急数据,对目标应急数据进行回放,在可视化界面中根据提前配置好的数据展示方式对数据进行展示,运维终端可以通过数据回放还原应急事件执行过程,清晰直观得了解应急事件的相关信息,并对应急事件进行分析总结。
需要说明的是,本发明实施例不仅可以通过应急数据复盘组件对数据进行回放,还可以一键导出复盘报告,复盘报告是基于预先存储的报告模板生成的,应急数据复盘组件根据当前回放的数据填充报告模板中相应的参数,得到完整的复盘报告。
可选地,应急数据的复盘方法还包括:创建复盘报告模板,并把复盘报告模板存储至应急数据复盘组件。
需要说明的是,应急数据复盘组件中存储一份报告模板,模板里中包含应急名称、故障发生结束时间、影响范围、涉及***与应用、应急预案等应急基本信息,以及应急关键节点、应急人员关键操作、可能影响故障发生的影响因素(主要是告警操作变更信息)等信息,在应急数据复盘组件的可视化页面点击一键导出复盘报告后,后台程序基于数据会自动将关键信息填入模板中,形成一个复盘报告初稿。
需要说明的是,复盘各方人员结合数据回放与复盘报告,进行全面、深入地分析与讨论,之后再向***中导入分析与经验总结,形成优化后的复盘报告。
下面结合另一实施例进行详细说明。
实施例二
本实施例中提供的一种应急数据的复盘装置包含了多个实施单元,每个实施单元对应于上述实施例一中的各个实施步骤。
图3是根据本发明实施例的一种可选的应急数据的复盘装置的示意图,如图3所示,该应急数据的复盘可以包括:响应单元31、输出单元32,其中,
响应单元31,用于响应应急复盘请求,调用应急数据复盘组件,其中,应急数据复盘组件是预先构建的基于可视化界面对应急数据进行回放的组件;
输出单元32,用于确定待复盘的目标时间段,并将目标时间段输入到应急数据复盘组件,输出复盘报告,其中,目标时间段是基于应急事件的两个时间戳确定的,复盘报告包含由应急数据复盘组件基于目标时间段对处于目标时间段内的目标应急数据进行回放后得到的报告。
上述应急数据的复盘装置,通过响应单元31响应应急复盘请求,调用应急数据复盘组件,其中,应急数据复盘组件是预先构建的基于可视化界面对应急数据进行回放的组件;通过输出单元32,确定待复盘的目标时间段,并将目标时间段输入到应急数据复盘组件,输出复盘报告,其中,目标时间段是基于应急事件的两个时间戳确定的,复盘报告包含由应急数据复盘组件基于目标时间段对处于目标时间段内的目标应急数据进行回放后得到的报告。
本实施例中,应急数据可以通过应急数据复盘组件进行可视化展示和回放,当需要对应急事件进行复盘时,可以响应应急复盘请求,直接调用应急数据复盘组件,将需要回放的应急数据所处的时间段输入到应急数据复盘组件中,应急数据复盘组件调取相应的应急数据,通过可视化界面进行展示,并自动生成复盘报告。进而解决了相关技术中在进行应急复盘时,调度人员通过文件的形式记录应急过程的关键节点并登陆各***查看应急数据,手动完成应急复盘操作,复盘效率较低的技术问题。
需要说明的是,应急复盘是指在应急事件结束后,对应急过程进行总结、分析和评估,以便进一步改进和提高应急响应能力,应急处理对***的生产运维至关重要,对应急事件进行复盘生成复盘报告,可以更直观地对应急事件进行分析,具体来说,应急复盘通常包含以下内容:事件描述:对应急事件的发生、进展、应急响应过程等进行全面、详细的描述;问题分析:对应急响应过程中出现的问题进行分析,识别问题的原因、影响范围,并制定相应的解决方案;风险评估:对已经出现或潜在的风险进行评估,制定应对方案并进行风险控制;效果评估:对应急响应的效果进行评估,比较预期目标与实际效果的差异,识别处理不当的原因,寻找改进的空间和方法;总结和改进建议:对应急复盘的过程和结果进行总结,并提出改进建议。
需要说明的是,通过应急复盘的过程,能够清晰、全面地了解应急事件的真实情况和现状,进一步提升应急响应能力,降低应急事件对生产运维的影响,保障***正常运行。
需要说明的是,本发明实施例提出了通过应急数据复盘组件对应急数据进行回放,可以直观地了解到应急事件执行的全过程,同时应急数据复盘组件中包含有一键导出复盘报告的功能按钮,可以基于回放数据直接导出复盘报告,提升复盘报告的生成效率,且相较于人为查询***导出相关数据撰写复盘报告的方式更为全面和准确。
需要说明的是,生产运维中的应急数据可能包括以下内容:***日志,用于追踪和分析***的运行情况,包括错误信息、警告信息和一些诊断信息;备份数据,备份生产数据可以帮助在发生***问题时恢复数据,避免数据丢失,包括全量备份数据和增量备份数据;***配置信息,包括***硬件配置、软件配置以及***各类服务的配置信息,以保证在发生***问题时能够快速定位问题、故障排除;接口文档,生产环境中常常会依赖各种接口的数据,提前准备好接口文档可以在出现接口问题时快速找到接口问题的所在;安全凭证,包括服务器用户名、密码等重要信息以便在发生安全问题时能够及时控制;以上这些应急数据可以事先准备并妥善保管,当发生突发事件、灾害或紧急情况时能够及时响应,帮助快速恢复***稳定运行,降低生产运维的损失。
可选地,应急数据的复盘装置还包括:第一采集模块,用于在应急事件的执行过程中,采集应急事件的所有应急数据,其中,应急数据包括下述至少之一:应急类型、应急概况数据、关键节点数据、变更操作数据;第一配置模块,用于为应急数据配置时间戳,并基于时间戳存储应急数据。
需要说明的是,本发明实施例在应急事件执行的过程中,会基于设定好的程序实时采集各***的应急数据,并根据应急数据产生的时间戳存储到数据库中,便于后续根据时间信息直接定位并调用对应的应急数据进行回放。
可选地,应急概况数据包括下述至少之一:故障发生事件点、应急事件标识、应急事件涉及的应用信息、应急人员、故障影响数据。
可选地,关键节点数据至少包括:应急启动节点数据、应急关键操作节点数据、故障恢复节点数据、应急结束节点数据。
需要说明的是,本发明实施例在应急过程中的产生的应急数据包括:应急概况、关键节点、应急涉及应用的相关告警操作变更信息等,其中,应急概况包括但不限于:故障发生时间、应急编号、故障涉及的应用、应急人员、故障影响的业务与***;关键节点包括但不限于:应急启动节点、应急关键操作节点、故障恢复时间节点、应急结束时间节点等;应急涉及应用的相关告警操作变更信息至少包括:告警操作信息(例如告警级别、告警通知方式、告警对象等相关变更操作信息,这些变更需要在应急过程中进行)、监控条件变更信息(当应用发生异常现象时,需要及时对监控条件进行调整,以便更好地监控应用运行状况);通过日志采集***采集上述相关数据,并按时间戳存入自身的数据库,可以完整保存应急数据。
可选地,应急数据的复盘装置还包括:第一输入模块,用于将应急数据输入到应急数据复盘组件,由应急数据复盘组件基于应急类型确定应急事件的展示方式。
可选地,展示方式包括下述至少之一:趋势图、柱状图、曲线图、轮播列表。
需要说明的是,对于大量的应急数据,不同级别的应急数据可以通过不同的方式进行展示,例如:通过趋势图来体现***一个时间段内***的运行情况,通过轮播列表的形式展示各应用程序相关的告警操作变更信息等,将不同类型的应急数据输入到应急数据复盘组件中,就可以确定该应急数据的展示方式,并在用户端调用该应急数据时,通过可视化界面以及具体的展示方式进行展示。
需要说明的是,处理通过趋势图和轮播列表对复盘数据进行展示,还可以构建柱状图,曲线图,散点图,饼图等数据图展示方式。
可选地,应急数据复盘组件通过可视化界面对目标应急数据进行展示,应急数据复盘组件至少包括以下操作模块:时间设定按钮、回放倍率按钮、导出复盘报告按钮、回放进度条,其中,回放进度条上预先标记应急事件的关键节点。
需要说明的是,应急数据复盘组件的可视化界面配置包括以下多个操作模块:时间设定按钮、回放倍率按钮、导出复盘报告按钮、回放进度条,时间设定按钮可以设定待复盘的目标时间段,包括开始时间戳设定模块和结束时间戳设定模块,根据开始时间戳A和结束时间戳B就可以确定目标时间段,回放倍率按钮可以设定播放速度,例如当倍率为1时,***默认按1秒级回放数据,播放完需要(B-A)秒;当倍率为2时,按每秒回放第2秒、第4秒、第6秒的速度回放,播放完需要(B-A)/2秒,以此类推,导出复盘报告按钮可以根据当前回放的数据一键导出复盘报告,回放进度条拥有显示回放进度,拖动回放进度条可以查看各时间点的具体数据。
需要说明的是,可视化界面还包括开始/暂停按钮,快进按钮和快退按钮,通过快进或者快退按钮可以调整播放进度。
需要说明的是,通过应急数据复盘组件对数据进行回放代替原来复盘采用word或ppt形式回放应急过程,让参与复盘的各方人员能更直观、更全面、身临其境地复盘应急过程,这种形式可以自主切换查看每个点的关键数据,操作性更强。
需要说明的是,本发明实施例中通过解析运维终端发送的应急复盘请求,确定待复盘的目标时间段,将该目标时间段输入到应急数据复盘组件,由应急数据复盘组件调用目标时间段内的全部应急数据,并根据时间顺序和展示方式在可视化界面中对应急数据进行回放,其中,目标时间段是基于应急事件的两个时间戳确定的。
需要说明的是,应急数据复盘组件根据目标时间段调用存储在数据库中的相关应急数据,即目标应急数据,对目标应急数据进行回放,在可视化界面中根据提前配置好的数据展示方式对数据进行展示,运维终端可以通过数据回放还原应急事件执行过程,清晰直观得了解应急事件的相关信息,并对应急事件进行分析总结。
需要说明的是,本发明实施例不仅可以通过应急数据复盘组件对数据进行回放,还可以一键导出复盘报告,复盘报告是基于预先存储的报告模板生成的,应急数据复盘组件根据当前回放的数据填充报告模板中相应的参数,得到完整的复盘报告。
可选地,应急数据的复盘装置还包括:第一创建模块,用于创建复盘报告模板,并把复盘报告模板存储至应急数据复盘组件。
需要说明的是,应急数据复盘组件中存储一份报告模板,模板里中包含应急名称、故障发生结束时间、影响范围、涉及***与应用、应急预案等应急基本信息,以及应急关键节点、应急人员关键操作、可能影响故障发生的影响因素(主要是告警操作变更信息)等信息,在应急数据复盘组件的可视化页面点击一键导出复盘报告后,后台程序基于数据会自动将关键信息填入模板中,形成一个复盘报告初稿。
需要说明的是,复盘各方人员结合数据回放与复盘报告,进行全面、深入地分析与讨论,之后再向***中导入分析与经验总结,形成优化后的复盘报告。
上述的应急数据的复盘装置还可以包括处理器和存储器,上述响应单元31、输出单元32等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
上述处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来对应急数据进行回放,并基于回放的数据输出复盘报告。
上述存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的计算机程序,其中,在计算机程序运行时控制计算机可读存储介质所在设备执行上述任意一项应急数据的复盘方法。
根据本发明实施例的另一方面,还提供了一种电子设备,包括一个或多个处理器和存储器,存储器用于存储一个或多个程序,其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现上述任意一项应急数据的复盘方法。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:响应应急复盘请求,调用应急数据复盘组件,其中,应急数据复盘组件是预先构建的基于可视化界面对应急数据进行回放的组件;确定待复盘的目标时间段,并将目标时间段输入到应急数据复盘组件,输出复盘报告,其中,目标时间段是基于应急事件的两个时间戳确定的,复盘报告包含由应急数据复盘组件基于目标时间段对处于目标时间段内的目标应急数据进行回放后得到的报告。
图4是根据本发明实施例的一种应急数据的复盘方法的电子设备(或移动设备)的硬件结构框图。如图4所示,电子设备可以包括一个或多个(图4中采用402a、402b,……,402n来示出)处理器402(处理器402可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器404。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、键盘、电源和/或相机。本领域普通技术人员可以理解,图4所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,电子设备还可包括比图4中所示更多或者更少的组件,或者具有与图4所示不同的配置。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (11)

1.一种应急数据的复盘方法,其特征在于,包括:
响应应急复盘请求,调用应急数据复盘组件,其中,所述应急数据复盘组件是预先构建的基于可视化界面对应急数据进行回放的组件;
确定待复盘的目标时间段,并将所述目标时间段输入到所述应急数据复盘组件,输出复盘报告,其中,所述目标时间段是基于应急事件的两个时间戳确定的,所述复盘报告包含由所述应急数据复盘组件基于所述目标时间段对处于所述目标时间段内的目标应急数据进行回放后得到的报告。
2.根据权利要求1所述的复盘方法,其特征在于,在响应应急复盘请求,调用应急数据复盘组件之前,还包括:
在所述应急事件的执行过程中,采集所述应急事件的所有应急数据,其中,所述应急数据包括下述至少之一:应急类型、应急概况数据、关键节点数据、变更操作数据;
为所述应急数据配置所述时间戳,并基于所述时间戳存储所述应急数据。
3.根据权利要求2所述的复盘方法,其特征在于,所述应急概况数据包括下述至少之一:故障发生事件点、应急事件标识、应急事件涉及的应用信息、应急人员、故障影响数据。
4.根据权利要求2所述的复盘方法,其特征在于,所述关键节点数据至少包括:应急启动节点数据、应急关键操作节点数据、故障恢复节点数据、应急结束节点数据。
5.根据权利要求2所述的复盘方法,其特征在于,在基于所述时间戳存储所述应急数据之后,还包括:
将所述应急数据输入到所述应急数据复盘组件,由所述应急数据复盘组件基于应急类型确定所述应急事件的展示方式。
6.根据权利要求5所述的复盘方法,其特征在于,所述展示方式包括下述至少之一:趋势图、柱状图、曲线图、轮播列表。
7.根据权利要求1所述的复盘方法,其特征在于,所述应急数据复盘组件通过所述可视化界面对所述目标应急数据进行展示,所述应急数据复盘组件至少包括以下操作模块:时间设定按钮、回放倍率按钮、导出复盘报告按钮、回放进度条,其中,所述回放进度条上预先标记应急事件的关键节点。
8.根据权利要求1所述的复盘方法,其特征在于,还包括:
创建复盘报告模板,并把所述复盘报告模板存储至所述应急数据复盘组件。
9.一种应急数据的复盘装置,其特征在于,包括:
响应单元,用于响应应急复盘请求,调用应急数据复盘组件,其中,所述应急数据复盘组件是预先构建的基于可视化界面对应急数据进行回放的组件;
输出单元,用于确定待复盘的目标时间段,并将所述目标时间段输入到所述应急数据复盘组件,输出复盘报告,其中,所述目标时间段是基于应急事件的两个时间戳确定的,所述复盘报告包含由所述应急数据复盘组件基于所述目标时间段对处于所述目标时间段内的目标应急数据进行回放后得到的报告。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至8中任意一项所述的应急数据的复盘方法。
11.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至8中任意一项所述的应急数据的复盘方法。
CN202310799196.4A 2023-06-30 2023-06-30 应急数据的复盘方法及其装置、电子设备及存储介质 Pending CN117093455A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310799196.4A CN117093455A (zh) 2023-06-30 2023-06-30 应急数据的复盘方法及其装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310799196.4A CN117093455A (zh) 2023-06-30 2023-06-30 应急数据的复盘方法及其装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN117093455A true CN117093455A (zh) 2023-11-21

Family

ID=88776049

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310799196.4A Pending CN117093455A (zh) 2023-06-30 2023-06-30 应急数据的复盘方法及其装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN117093455A (zh)

Similar Documents

Publication Publication Date Title
US7676695B2 (en) Resolution of computer operations problems using fault trend analysis
US8856312B2 (en) Method and system for monitoring transaction based system
CN104424094B (zh) 一种异常信息获取方法、装置及智能终端设备
WO2018161622A1 (zh) 一种获取应用卡顿信息的方法及设备
US7908239B2 (en) System for storing event data using a sum calculator that sums the cubes and squares of events
US20140136896A1 (en) Diagnosing distributed applications using application logs and request processing paths
US20140164840A1 (en) Method and system for monitoring transaction execution on a computer network and computer storage medium
CN105144117B (zh) 对调用堆栈和上下文数据的自动相关分析方法
US20080126003A1 (en) Event-based setting of process tracing scope
CN108073499B (zh) 应用程序的测试方法及装置
US7398511B2 (en) System and method for providing a health model for software
JPWO2007052327A1 (ja) 性能異常分析装置、方法及びプログラム、並びに性能異常分析装置の分析結果表示方法
CN104639352A (zh) 监控装置以及监控方法
CN112219175A (zh) 用于管理技术安装的方法和***
CN109284221B (zh) 一种预警***及方法
CN114553596A (zh) 适用于网络安全的多维度安全情况实时展现方法及***
WO2020202433A1 (ja) 情報処理装置およびapi使用履歴表示プログラム
CN114238020A (zh) 多维度的高精度智能业务监控方法及***
Rebuge et al. A process mining analysis on a virtual electronic patient record system
CN117093455A (zh) 应急数据的复盘方法及其装置、电子设备及存储介质
CN115529219B (zh) 告警分析方法、装置、计算机可读存储介质及电子设备
CN115269415A (zh) 一种基于仿真场景用例的接口测试***和方法
CN110990237B (zh) 一种信息收集***、方法及存储介质
CN114816815A (zh) 故障定位方法、日志格式的配置方法、设备及存储介质
CN113626236A (zh) 一种分布式文件***的故障诊断方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination