WO2022252860A1 - 一种事件处理方法、装置、计算机设备及存储介质 - Google Patents

一种事件处理方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
WO2022252860A1
WO2022252860A1 PCT/CN2022/088134 CN2022088134W WO2022252860A1 WO 2022252860 A1 WO2022252860 A1 WO 2022252860A1 CN 2022088134 W CN2022088134 W CN 2022088134W WO 2022252860 A1 WO2022252860 A1 WO 2022252860A1
Authority
WO
WIPO (PCT)
Prior art keywords
fault
target
alarm
alarms
event
Prior art date
Application number
PCT/CN2022/088134
Other languages
English (en)
French (fr)
Inventor
王旭
张亚男
岳云霞
冉俊秀
于嘉
Original Assignee
中国民航信息网络股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 中国民航信息网络股份有限公司 filed Critical 中国民航信息网络股份有限公司
Publication of WO2022252860A1 publication Critical patent/WO2022252860A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions

Definitions

  • the existing technology usually monitors the civil aviation system by multiple technical platforms, and there are often the same alarm events caused by the same fault cause among multiple technical platforms, which will mislead the operation and maintenance personnel in the event handling process It prolongs the fault handling time of O&M personnel and affects the fault handling efficiency.
  • the present invention provides an event processing method, device, computer equipment and storage media to improve the accuracy and efficiency of fault processing.
  • the technical solution is as follows:
  • An event handling method comprising:
  • it also includes:
  • a failure recovery record of the target failure alarm is generated and stored.
  • An event processing device comprising:
  • the analysis and integration unit is used to analyze and integrate at least one technical platform to monitor and send various fault alarms to the civil aviation system, and determine at least one target fault alarm; one target fault alarm corresponds to one target event;
  • a target fault handling method acquiring unit configured to query the correspondence between preset events and fault handling methods, and obtain target fault handling methods corresponding to each of the target events;
  • the event processing unit is used to trigger the execution of the automatic fault recovery script program indicated by the target fault processing method, and automatically process the fault in the civil aviation system indicated by the target fault alarm corresponding to the target fault processing method.
  • the analysis integration unit includes:
  • the failure alarm receiving unit is used to receive each failure alarm sent by at least one technical platform for monitoring the civil aviation system;
  • a fault alarm determining unit configured to determine at least one fault alarm indicating the same fault among the received fault alarms
  • the analysis and integration subunit is configured to integrate the at least one fault alarm into a target fault alarm if the at least one fault alarm includes fault alarms from different technology platforms.
  • a judging unit is also included, and the judging unit includes:
  • the duration determination unit is used to determine whether the time difference between the alarm occurrence times of two fault alarms does not exceed the preset target duration
  • the judging subunit is used to judge whether the keyword matching degree of the two fault alarms exceeds the preset target keyword matching degree if the time difference does not exceed the target duration;
  • the first determination unit is configured to determine that the two fault alarms indicate the same fault if the keyword matching degree of the two fault alarms exceeds the target keyword matching degree;
  • the second determination unit is used to determine that the two fault alarms are not correct if the time difference between the alarm occurrence times of the two fault alarms exceeds the target duration or the keyword matching degree of the two fault alarms exceeds the target keyword matching degree. Indicates the same fault.
  • An electronic device comprising: a processor and a memory; wherein, the processor is used to call and execute a program stored in the memory; the memory is used to store a program, and the program is used to realize the event Approach.
  • a computer-readable storage medium on which a computer program is stored, and the computer program is loaded and executed by a processor to implement each step of the event processing method.
  • the embodiment of the present application provides an event processing method, device, computer equipment and storage medium, which analyzes and integrates at least one technical platform to monitor and send various fault alarms to the civil aviation system, and determines at least one target fault alarm; one target fault alarm corresponds to one target Events; query the correspondence between pre-set events and fault handling methods, respectively obtain the target fault handling methods corresponding to each target event; trigger the execution of the automatic fault recovery script program indicated by the target fault handling method, and automatically process the corresponding target fault handling methods A malfunction in the civil aviation system indicated by a target malfunction alert.
  • This application is based on the analysis and integration of fault alarms of at least one technical platform and the automatic processing of fault alarms, which effectively improves the accuracy and efficiency of fault handling.
  • FIG. 1 is a schematic structural diagram of an information system event processing device based on the ITIL theory proposed by the present application
  • FIG. 2 is a schematic diagram of an event processing method based on the ITIL scientific theory provided by the embodiment of the present application;
  • Fig. 4 is a flow chart of a method for analyzing and integrating at least one technical platform that monitors and sends various fault alarms sent by the civil aviation system for the embodiment of the present application, and determines at least one target fault alarm;
  • FIG. 6 is a schematic structural diagram of an event processing device provided by an embodiment of the present application.
  • FIG. 7 is a block diagram of a hardware structure of a computer device to which an event processing method provided by an embodiment of the present application is applicable.
  • the existing fault handling mode still stays in that the operation and maintenance personnel receive the fault alarm and then manually log in to the background system to view and analyze the logs.
  • the operation and maintenance personnel judge the cause of the fault and perform recovery operations based on their own experience.
  • the risk of operation and judgment errors In recent years, failures caused by the mistakes of operation and maintenance personnel have occurred frequently.
  • the existing event handling methods can no longer meet the growing needs of civil aviation systems and users.
  • this application unifies the event processing entrance, solves the problem of consuming the energy of operation and maintenance personnel caused by the inconsistency of event processing sources, and improves the efficiency of event processing; secondly, this application realizes the automatic processing of the whole process from event occurrence to processing completion , completely get rid of the experience of the operation and maintenance personnel in the event processing process, which will make the event processing process more secure and timely.
  • the operation and maintenance personnel only check the results of the event processing after the event processing is completed, saving manpower and material resources, and reducing the number of enterprise personnel. cost.
  • this application adopts the scientific guidance theory of ITIL, combines the business development direction and the characteristics of the information system, and builds a set of event processing methods based on the mainstream architecture of information system microservices and Python development language, unifies the entry of event processing and eliminates the common causes of failures. The resulting event alarm, improve work efficiency and production system security.
  • the existing fault handling method is to subjectively judge how to handle the current alarm event based on the work experience of the operation and maintenance personnel.
  • the processing process is completely manual, and the processing method is too backward. great risk.
  • this incident handling method is too dependent on the experience and character of the operation and maintenance personnel, and the risk is extremely high.
  • operational errors will have irreparable and serious consequences for the company's production safety plan. It is more likely to cause customer complaints, which will have an extremely bad impact on the company;
  • the manual processing method can no longer meet the growing needs of the company's business system processing volume, and the manual processing method has a great impact on production safety and timeliness of fault recovery.
  • the present invention constructs a set of automatic processing devices for the whole process from information system fault generation to processing to recovery, which improves the efficiency and accuracy of fault processing, avoids the risk of fault processing, and ensures the safety of the production system .
  • Figure 1 is an information system event processing device based on ITIL theory proposed by this application, which is mainly composed of four modules: fault analysis module, event management module, knowledge base module, and automatic fault repair module.
  • At least one technical platform includes a production command platform and a monitoring system, and the production command platform and the monitoring system are both used to monitor the civil aviation system.
  • Fault analysis module It is the only input port for the production command platform and monitoring system alarm.
  • the fault analysis module analyzes and integrates the same fault alarm after receiving the alarm through kafka, and then outputs accurate fault alarm through kafka (accurate output through kafka Fault alarms can be referred to as target fault alarms) to the event management module.
  • target fault alarms accurate output through kafka Fault alarms
  • a fault analysis module is required to combine the fault alarms of the monitoring system and the fault alarms of the production command platform, which can not only improve the accuracy of fault alarms, but also reduce Operation and maintenance staff workload.
  • Event management module Based on the scientific theory of ITIL, an event management module suitable for the enterprise is designed. This module mainly receives the target fault alarm from the fault analysis module, and automatically converts the target fault alarm into an event (in order to distinguish easily, you can separately The event converted into each target fault alarm is called a target event), and the operation and maintenance personnel can view the event status in this module to track the alarm processing status.
  • Knowledge base module The knowledge base module records the detailed methods of target event processing and automatic fault recovery scripts. When an event occurs, the event management module will accurately match the unique processing method of the fault alarm recorded in the knowledge base according to the fault alarm ID.
  • the processing method includes method description, historical fault recovery record, automation script content, etc.
  • the automatic fault repair module is mainly responsible for script execution and scheduling.
  • the solution ID (the solution ID includes the automatic fault recovery script program ID) is sent to the automatic fault recovery module, and the module schedules the automatic fault recovery script program to realize the repair of the fault. After completion, return to the knowledge base module for recording.
  • the event processing method includes the following steps:
  • Step 1 Receive the fault alarms of the production command platform and the monitoring system through the fault analysis module, analyze and integrate the received fault alarms, and give each output target fault alarm of the fault analysis module an alarm ID and a processing method ID;
  • Step 2 transmit the target failure alarm to the event management module through the kafka message queue.
  • Step 3 The event management module establishes an event record, which will track the whole life cycle of the target fault alarm.
  • Step 4 The event management module obtains the processing method ID in the target fault alarm, and the event management module uses the processing method ID to accurately match the fault processing method in the knowledge base module, making a prerequisite for the next step of accurate fault processing.
  • Step 5 After accurately matching the fault handling method in the knowledge base module, transfer the automatic fault recovery script program information in the fault processing method to the automatic fault repair module.
  • the automated fault recovery script program may also be referred to as an automated processing script program.
  • Step 6 Execute the automatic fault recovery script program sequentially according to the execution order of the scheduler.
  • Step 7 the execution result is returned to the knowledge base module and the event management module.
  • Step 8 the event management module displays the detailed information of the processing result.
  • the failure alarm of the production command platform is as follows:
  • the fault alarm format of the monitoring system is as follows:
  • the fault analysis module includes two functions: First, it receives fault alarms from the production command platform and the monitoring system, and stores the alarms from two different sources into the database separately. Because of the analysis and integration of the alarm information in the later stage, it is necessary to divide each piece of information into keywords when storing the alarm information, so that it can be judged whether they belong to the same alarm information according to the comparison of keywords in the later integration. Fault alarms, and finally the fault alarms can be correctly integrated.
  • the keywords of the alarm information mainly include: departure system, occurrence time, etc.
  • Second the analysis and integration of fault alarms. After storing the production command platform and monitoring alarms in different tables of the database, compare the occurrence time and keywords of the data in the two tables.
  • the integration of alarms has two conditions that must be met at the same time.
  • the two The keywords of the alarm information in the table must be accurately matched.
  • the alarm information contains keywords such as "departure system”;
  • the occurrence time of the production command platform and monitoring alarms must be within 3 minutes, so that this can be guaranteed.
  • the two systems are alarms for the same fault.
  • the fault analysis module can not only filter out invalid alarms from a single source, but also improve the accuracy of integrated and analyzed alarms, laying a good foundation for the correct rate of automatic fault repair.
  • the event management module uses an automatic event creation program to create an event message to track the status and processing details of the event.
  • the event management module is a centralized display platform for the entire automatic fault handling process.
  • the knowledge base module After the event management module transmits the alarm information to the knowledge base module through the kafka interface, the knowledge base module performs accurate matching according to the input fault unique identification code, queries the information of the automated script program that needs to be executed, and transmits the information to the automated fault repair module , when the automatic scheduler in the module receives the information, it will start the repair script, thus completing the automatic fault repair.
  • the repair result information needs to be transmitted to the event management module, so that the operation and maintenance personnel can view the result information of the fault repair at the first time.
  • each embodiment in this specification is described in a progressive manner, and each embodiment focuses on the differences from other embodiments.
  • the description is relatively simple, and for the related information, please refer to the description of the method part.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请提供一种事件处理方法、装置、计算机设备及存储介质,分析整合至少一个技术平台对民航***进行监控发送的各个故障报警,确定至少一个目标故障报警;一个目标故障报警对应一个目标事件;查询预先设置的事件与故障处理方法的对应关系,分别获取每个目标事件对应的目标故障处理方法;触发执行目标故障处理方法指示的自动化故障恢复脚本程序,自动处理目标故障处理方法对应的目标故障报警指示的民航***中的故障。本申请基于对至少一个技术平台的故障报警的分析整合及对故障报警的自动处理,有效提高了故障处理准确性及效率。

Description

一种事件处理方法、装置、计算机设备及存储介质
本申请要求于2021年06月1日提交中国专利局、申请号为202110608613.3、发明名称为“一种事件处理方法、装置、计算机设备及存储介质”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本发明涉及计算机处理技术领域,更具体地说,涉及一种事件处理方法、装置、计算机设备及存储介质。
背景技术
随着用户需求的增多,民航***中业务数量越来越多,业务复杂程度越来越高,为了保证民航***的正常运行,在其发生故障时亟需实现对故障的快速定位和修复。
现有技术通常由多个技术平台对民航***进行监测,多个技术平台之间往往存在着由同一故障原因所导致的相同报警事件,这种情况会对运维人员在事件处理过程中产生误导作用,延长运维人员的故障处理时间,影响故障处理效率。
并且,运维人员在接收到故障报警后需要手动登录后台***查看日志并分析,这种运维人员根据自己的经验来判断故障原因并进行恢复操作的方式,受运维人员主观意识的影响,往往存在着运维人员误操作和判断失误的风向,影响故障处理准确性。
申请内容
有鉴于此,为解决上述问题,本发明提供一种事件处理方法、装置、计算机设备及存储介质,以提高故障处理准确性及效率,技术方案如下:
一种事件处理方法,包括:
分析整合至少一个技术平台对民航***进行监控发送的各个故障报警,确定至少一个目标故障报警;一个目标故障报警对应一个目标事件;
查询预先设置的事件与故障处理方法的对应关系,分别获取每个所述目标事件对应的目标故障处理方法;
触发执行所述目标故障处理方法指示的自动化故障恢复脚本程序,自动处理所述目标故障处理方法对应的目标故障报警指示的所述民航***中 的故障。
优选的,所述分析整合至少一个技术平台对民航***进行监控发送的各个故障报警,确定至少一个目标故障报警,包括:
接收至少一个技术平台对民航***进行监控发送的各个故障报警;
确定所接收到的各个故障报警中指示同一故障的至少一个故障报警;
若所述至少一个故障报警包括来源于不同技术平台的故障报警,将所述至少一个故障报警整合成一个目标故障报警。
优选的,还包括确定两个故障报警是否指示同一故障的过程,该过程包括:
确定两个故障报警的报警发生时间之间的时间差是否未超过预设的目标时长;
若所述时间差未超过所述目标时长,判断两个故障报警的关键字匹配度是否超过预设目标关键字匹配度;
如果两个故障报警的关键字匹配度超过所述目标关键字匹配度,确定两个故障报警指示同一故障;
如果两个故障报警的报警发生时间之间的时间差超过所述目标时长或两个故障报警的关键字匹配度超过所述目标关键字匹配度,确定两个故障报警未指示同一故障。
优选的,所述目标故障处理方法包括自动化故障恢复脚本程序和方法叙述,
所述触发执行所述目标故障处理方法指示的自动化故障恢复脚本程序,自动处理所述目标故障处理方法对应的目标故障报警指示的所述民航***中的故障,包括:
确定所述方法叙述指示的故障恢复步骤序列中最近一个未被确定的故障恢复步骤;
若当前所确定的故障恢复步骤未指示自动化故障恢复脚本程序,展示当前所确定的故障恢复步骤;
响应当前所确定的故障恢复步骤的执行完成操作,返回执行“确定所述方法叙述指示的故障恢复步骤序列中最近一个未被确定的故障恢复步骤” 步骤;
若当前所确定的故障恢复步骤指示自动化故障恢复脚本程序,触发执行所述自动化故障恢复脚本程序。
优选的,还包括:
生成并存储所述目标故障报警的故障恢复记录。
一种事件处理装置,包括:
分析整合单元,用于分析整合至少一个技术平台对民航***进行监控发送的各个故障报警,确定至少一个目标故障报警;一个目标故障报警对应一个目标事件;
目标故障处理方法获取单元,用于查询预先设置的事件与故障处理方法的对应关系,分别获取每个所述目标事件对应的目标故障处理方法;
事件处理单单元,用于触发执行所述目标故障处理方法指示的自动化故障恢复脚本程序,自动处理所述目标故障处理方法对应的目标故障报警指示的所述民航***中的故障。
优选的,所述分析整合单元,包括:
故障报警接收单元,用于接收至少一个技术平台对民航***进行监控发送的各个故障报警;
故障报警确定单元,用于确定所接收到的各个故障报警中指示同一故障的至少一个故障报警;
分析整合子单元,用于若所述至少一个故障报警包括来源于不同技术平台的故障报警,将所述至少一个故障报警整合成一个目标故障报警。
优选的,还包括判断单元,所述判断单元,包括:
时长确定单元,用于确定两个故障报警的报警发生时间之间的时间差是否未超过预设的目标时长;
判断子单元,用于若所述时间差未超过所述目标时长,判断两个故障报警的关键字匹配度是否超过预设目标关键字匹配度;
第一确定单元,用于,用于如果两个故障报警的关键字匹配度超过所述目标关键字匹配度,确定两个故障报警指示同一故障;
第二确定单元,用于如果两个故障报警的报警发生时间之间的时间差 超过所述目标时长或两个故障报警的关键字匹配度超过所述目标关键字匹配度,确定两个故障报警未指示同一故障。
一种电子设备,包括:处理器以及存储器;其中,所述处理器,用于调用并执行所述存储器中存储的程序;所述存储器,用于存储程序,所述程序用于实现所述事件处理方法。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器加载并执行,实现所述事件处理方法的各步骤。
本申请实施例提供一种事件处理方法、装置、计算机设备及存储介质,分析整合至少一个技术平台对民航***进行监控发送的各个故障报警,确定至少一个目标故障报警;一个目标故障报警对应一个目标事件;查询预先设置的事件与故障处理方法的对应关系,分别获取每个目标事件对应的目标故障处理方法;触发执行目标故障处理方法指示的自动化故障恢复脚本程序,自动处理目标故障处理方法对应的目标故障报警指示的民航***中的故障。本申请基于对至少一个技术平台的故障报警的分析整合及对故障报警的自动处理,有效提高了故障处理准确性及效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图,而且还可以根据提供的附图将本申请应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。
图1为本申请提出一种基于ITIL理论构建的信息***事件处理装置的结构示意图;
图2为本申请实施例提供的一种基于ITIL科学理论提供的一种事件处理方法示意图;
图3为本申请实施例提供的一种事件处理方法流程图;
图4为本申请实施例提供的一种分析整合至少一个技术平台对民航***进行监控发送的各个故障报警,确定至少一个目标故障报警的方法流程 图;
图5为本申请实施例提供的一种确定两个故障报警是否指示同一故障的方法流程图;
图6为本申请实施例提供的一种事件处理装置的结构示意图;
图7为本申请实施例提供的一种事件处理方法所适用于的计算机设备的硬件结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
由于现阶段民航***有着数量多、业务复杂等特点,所以当***发生故障时并没有实现对故障进行快速定位和修复的目的。现有的故障处理模式还停留在运维人员接收到故障警报然后再手动登录后台***查看日志并分析,运维人员根据自己的经验来判断故障原因并进行恢复操作,这样存在着运维人员误操作和判断失误的风险,近些年来,因为运维人员的失误而导致的故障频频发生,现有的事件处理方法已经不能满足民航***和用户日益增长的需求。
首先,本申请统一了事件处理入口,解决了事件处理来源不统一所带来的消耗运维人员精力的问题,提高事件处理效率;其次,本申请实现从事件发生到处理完成的全过程自动化处理,事件处理过程中完全摆脱运维人员的经验,这样就会使得处理事件过程更具有安全性与及时性,运维人员只是在事件处理完成后查看事件处理的结果,节省人力物力,降低企业用人成本。
目前在处理事件的方法上没有统一入口,当运维人员在处理事件的时候需要监测多个技术平台,多个技术平台之间还存在着由同一个故障原因所导致的相同报警事件,这样的报警方法会对运维人员在事件处理的过程中产生误导作用,会延长运维人员的故障处理时间,同时运维人员是否能 精准定位到故障发生原因并解决问题也存在疑问。综上,本申请采用ITIL的科学指导理论,结合业务发展方向与信息***特点,基于信息***微服务主流架构,Python开发语言,构建一套事件处理方法,统一事件处理入口并消除相同故障原因所导致的事件报警,提高工作效率与生产***安全。
现有的故障处理方法是仅仅凭借运维人员工作经验来主观判断如何对当前发生的报警事件进行处理,处理过程完全手工化,处理方法过于落后,事件处理结果有很大的不确定性,存在极大的风险。首先,这种事件处理方法过于对运维人员的经验和人品产生依赖,风险性极高,无论运维人员是主观还是非主观的操作错误都会对公司生产安全计划产生不可挽救的严重后果,更有可能还会招致客户投诉,对公司产生极其恶劣的影响;其次,手工化的处理方式已经满足不了公司业务***处理量的日益增长需要,手工化的处理方式在生产安全和故障恢复时效性方面已经跟不上时代发展,完全满足不了公司规定时间内对故障恢复的要求。本发明基于信息***故障事件处理自动化科学理论,构建一套从信息***故障产生到处理直至恢复的全过程自动化处理装置,提高了故障处理效率与精准度,规避了故障处理风险,保障生产***安全。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本申请提出一种基于ITIL理论构建的信息***事件处理装置,主要由故障分析模块、事件管理模块、知识库模块、自动化故障修复模块四大模块组成。
示例性的,至少一个技术平台包括生产指挥平台和监控***等,生产指挥平台和监控***均用于对民航***进行监控。
以上仅仅是本申请实施例提供的技术平台的优选内容,有关技术平台的具体内容,本领域技术人员可根据自己的需求进行设置,在此不做限定。
故障分析模块:是生产指挥平台和监控***报警的唯一输入口,故障分析模块通过kafka接收到报警后对相同故障报警进行分析与整合,再通过kafka输出精准的故障报警(通过kafka输出的精准的故障报警可以称为目标故障报警)到事件管理模块。由于监控***现阶段存在故障报警准确率 不高的问题,所以需要故障分析模块把监控***的故障报警和生产指挥平台的故障报警合二为一,这样既能提高故障报警准确率,又能减少运维人员工作量。
事件管理模块:基于ITIL的科学理论来设计出适合企业自身的事件管理模块,该模块主要接收来自故障分析模块的目标故障报警,把目标故障报警自动转化为一个事件(为了便于区分,可以分别将每个目标故障报警转化成的事件称为目标事件),运维人员可以在此模块中查看事件状态以跟踪报警处理情况。
知识库模块:知识库模块记录着目标事件处理的详细方法和自动化故障恢复脚本程序。当事件产生时,事件管理模块会根据故障报警ID精准匹配出该故障报警在知识库中记录的唯一处理方法,该处理方法包括方法叙述、历史故障恢复记录、自动化脚本内容等等。
自动化故障修复模块:自动化故障修复模块主要负责脚本执行与调度。当知识库模块定位到故障具体解决方案时,把解决方案ID(解决方案ID包括自动化故障恢复脚本程序ID)传送给自动化故障修复模块,该模块调度自动化故障修复脚本程序,实现故障的修复,修复完成后返回给知识库模块进行记录。
图2为本申请实施例中基于ITIL科学理论提供的一种事件处理方法示意图。
如图2所示,事件处理方法包括如下步骤:
步骤1、通过故障分析模块接收生产指挥平台和监控***的故障报警,将接收到的故障报警进行分析与整合,赋予故障分析模块每一个输出的目标故障报警都有一个报警ID和处理方法ID;
步骤2、通过kafka消息队列传输目标故障报警到事件管理模块。
步骤3、事件管理模块建立事件记录,该记录会跟踪目标故障报警全生命周期的情况。
步骤4、事件管理模块获取目标故障报警中的处理方法ID,事件管理模块用处理方法ID精准匹配知识库模块中的故障处理方法,为下一步故障 精准处理做好先行条件。
步骤5、精准匹配到知识库模块内的故障处理方法后,把故障处理方法中的自动化故障恢复脚本程序信息传入到自动化故障修复模块。
示例性的,自动化故障恢复脚本程序也可以称为自动化处理脚本程序。
步骤6、按照调度程序执行顺序,按序执行自动化故障恢复脚本程序。
步骤7、执行结果返回到知识库模块和事件管理模块。
步骤8、事件管理模块展示处理结果详细信息。
下面结合具体实例对本申请实施例提供的一种事件处理方法进行详细说明。
生产指挥平台的故障报警没人如下:
【中国民航信息】公司总值班:21:56陆续接XXXXXXX机场报,离港***中断连接,请相关部门处理。(20200525-22:01)
监控***的故障报警格式如下:
【中国民航信息】监控***报:21:56离港***主机中断连接,IP:192.168.1.1,请相关部门处理。(20200525-21:58),自动化处理识别码:10000001
故障分析模块包含两大功能:首先,接收生产指挥平台和监控***的故障报警,把两种不同来源的报警分开存储到数据库中。因为要进行后期的报警信息分析与整合,所以在存储报警信息的时候需要把每一条信息内容进行关键字分割,这样才会使得后期在整合的时候可以按照关键字比对来判断是否属于同一个故障的报警,最后才能正确的整合故障报警。报警信息关键字主要包括:离港***、发生时间等等。其次,故障报警的分析与整合。把生产指挥平台和监控报警分别存储到数据库不同的表中后,把两个表中的数据进行发生时间和关键字比对,报警的整合有两个条件并且需同时满足,第一,两个表中报警信息的关键字要精准匹配,例如报警信息中都包含“离港***”这样的关键字;第二,生产指挥平台和监控报警的发生时间要在3分钟之内,这样才能保证这两个***是针对同一条故障进行的报警。综上,故障分析模块在双重验证下,既能够把单一来源的无效 报警过滤掉,又能提高整合分析过的报警准确率,为自动化故障修复正确率打下了良好的基础。
在监控***发出故障报警时候,会对每条故障报警赋予一个知识库的对应处理编号,这个编号是自动化故障修复模块的唯一识别码,在故障分析模块整合监控***发出的报警后,编号也会随之存储在整合后的故障报警信息中,跟随故障信息一起传送到kafka队列中,这样事件管理模块就可以继续把识别码传送到知识库模块中。所以,识别码是自动化故障修复的关键。
整合后的报警信息传输到事件管理模块后,事件管理模块用自动事件创建程序创建一条事件信息,对事件的状态和处理详情进行跟踪。事件管理模块是对整个自动化故障处理过程的集中展示平台。
事件管理模块通过kafka接口把报警信息传输到知识库模块后,知识库模块根据输入的故障唯一标识码进行精准匹配,查询到需要执行的自动化脚本程序信息,把该信息传输到自动化故障修复模块中,当模块中的自动化调度程序收到信息后,会启动修复脚本,这样就完成了故障自动化修复。
自动化修复完成后,需要把修复结果信息传输到事件管理模块中,运维人员可以第一时间查看故障修复的结果信息。
下面为了对本申请实施例提供的一种事件处理方法的理解,现结合图3所示的事件处理方法流程图进一步对本申请实施例提供的一种事件处理方法进行详细说明。
如图3所示,该方法包括:
S301、分析整合至少一个技术平台对民航***进行监控发送的各个故障报警,确定至少一个目标故障报警;一个目标故障报警对应一个目标事件;
图4为本申请实施例提供的一种分析整合至少一个技术平台对民航***进行监控发送的各个故障报警,确定至少一个目标故障报警的方法流程图。
如图4所示,该方法包括:
S401、接收至少一个技术平台对民航***进行监控发送的各个故障报警;
示例性的,至少一个技术平台包括至少一个生产指挥平台、至少一个监控***等等。以上仅仅是本申请实施例提供的至少一个技术平台的优选内容,有关至少一个技术平台的具体内容,本领域技术人员可根据自己的需求进行设置,在此不做限定。
本申请实施例,针对至少一个技术平台中的每个技术平台而言,该技术平台对民航***进行监控,在民航***出现故障的情况下,生成相应的故障报警。
S402、确定所接收到的各个故障报警中指示同一故障的至少一个故障报警;
本申请实施例,可以接收至少一个技术平台对民航***进行监控发送的各个故障报警,并将接收到的各个故障报警中指示同一故障的各个故障报警划分成一个故障报警集。针对每个故障报警集而言,该故障报警集中各个故障报警可以认为是指示同一故障的至少一个故障报警。
S403、若至少一个故障报警包括来源于不同技术平台的故障报警,将至少一个故障报警整合成一个目标故障报警。
本申请实施例,针对每个故障报警集而言,判断该故障报警集中各个故障报警是否来自于同一技术平台,如果该故障报警集中各个故障报警并非来自于一个技术平台,则认为针对同一故障至少有两个技术平台都发出了故障报警,这时认为该故障报警集指示的故障的真实性比较大,这时,将该故障报警集中各个故障报警整合成一个目标故障报警。
进一步的,针对一个故障报警集而言,若该故障报警集中各个故障报警来自于同一个技术平台,则认为可能该故障报警集指示的故障的真实性比较低,这种情况下,可以不生成该故障报警集对应的目标报警。
S302、查询预先设置的事件与故障处理方法的对应关系,分别获取每个目标事件对应的目标故障处理方法;
示例性的,预先设置有事件和故障处理方法的对应关系。针对每个目标事件而言,查询预先设置的事件和故障处理方法的对应关系,获取该目 标事件对应的故障处理方法,该目标事件对应的故障处理方法可以称为目标故障处理方法。
S303、触发执行目标故障处理方法指示的自动化故障恢复脚本程序,自动处理目标故障处理方法对应的目标故障报警指示的民航***中的故障。
示例性的,故障处理方法包括方法叙述、历史故障恢复记录、自动化故障恢复脚本程序等等。以上仅仅是本申请实施例提供的故障处理方法的优选内容,有关故障处理方法的具体内容,本领域技术人员可根据自己的需求进行设置,在此不做限定。
本申请实施例,在确定目标事件对应的目标故障处理方法后,可以获取目标故障处理方法中的自动化故障恢复脚本程序的ID,以触发自动化故障修复模块执行自动化故障恢复脚本程序ID对应的自动化故障恢复脚本程序,以实现对民航***中目标事件指示的故障的自动修复。
本申请实施例,触发执行目标故障处理方法指示的自动化故障恢复脚本程序,自动处理目标故障处理方法对应的目标故障报警指示的民航***中的故障,包括:确定方法叙述指示的故障恢复步骤序列中最近一个未被确定的故障恢复步骤;若当前所确定的故障恢复步骤未指示自动化故障恢复脚本程序,展示当前所确定的故障恢复步骤;响应当前所确定的故障恢复步骤的执行完成操作,返回执行“确定方法叙述指示的故障恢复步骤序列中最近一个未被确定的故障恢复步骤”步骤;若当前所确定的故障恢复步骤指示自动化故障恢复脚本程序,触发执行自动化故障恢复脚本程序。
示例性的,方法叙述包括故障恢复步骤序列,故障恢复步骤序列由依次排序的至少一个故障恢复步骤构成。相应的,可以先确定故障恢复步骤序列中第一个故障恢复步骤,如果第一个故障恢复步骤未指示自动化故障恢复脚本程序,则展示第一个故障恢复步骤;响应第一个故障恢复步骤的执行完成操作,从故障恢复步骤序列中确定第二个故障恢复步骤,如果第二个故障恢复步骤指示自动化故障恢复脚本程序,则触发执行第二个故障恢复步骤指示的自动化故障恢复脚本程序;响应第二个故障恢复步骤的执行完成操作,从故障恢复步骤序列中确定第三个故障恢复步骤…以此类推, 在此不做赘述。
示例性的,若故障恢复步骤未指示自动化故障恢复脚本程序,则可能该故障恢复步骤展示完成后认为该故障恢复步骤执行完成;或者,展示该故障恢复步骤,并接收到用户响应该故障恢复步骤执行完成该故障恢复步骤指示的操作后,认为该故障恢复步骤执行完成。
以上仅仅是本申请实施例提供的故障恢复步骤执行完成的几种优选方式,不同故障恢复步骤可能对应的确定执行完成的方式不同,在此不做限定。
进一步的,本申请实施例提供的一种事件处理方法,还可以生成并存储目标故障报警的故障恢复记录。
本申请实施例提供一种事件处理方法,分析整合至少一个技术平台对民航***进行监控发送的各个故障报警,确定至少一个目标故障报警;一个目标故障报警对应一个目标事件;查询预先设置的事件与故障处理方法的对应关系,分别获取每个目标事件对应的目标故障处理方法;触发执行目标故障处理方法指示的自动化故障恢复脚本程序,自动处理目标故障处理方法对应的目标故障报警指示的民航***中的故障。本申请基于对至少一个技术平台的故障报警的分析整合及对故障报警的自动处理,有效提高了故障处理准确性及效率。
下面结合图5对本申请实施例提供的一种确定两个故障报警是否指示同一故障的方法进行详细说明。
如图5所示,该方法包括:
S501、确定两个故障报警的报警发生时间之间的时间差是否未超过预设的目标时长;若时间差未超过目标时长,执行步骤S502;若时间差超过目标时长,执行步骤S504;
示例性的,目标时长可以为1分钟、2分钟、3分钟等等,以上仅仅是本申请实施例提供的目标时长的优选内容,有关目标时长的具体内容,本领域技术人员可根据自己的需求进行设置,在此不做限定。
S502、判断两个故障报警的关键字匹配度是否超过预设目标关键字匹配度;如果两个故障报警的关键字匹配度超过目标关键字匹配度,执行步 骤S503;如果两个故障报警的关键字匹配度未超过目标关键字匹配度,执行步骤S504;
示例性的,以确定关键字匹配度的两个故障报警分别为第一故障报警和第二故障报警为例,对第一故障报警进行关键字分割得到第一故障报警的第一关键字集合,对第二故障报警进行关键字分割得到第二故障报警的第二关键字集合;确定第一关键字集合和第二关键字集合中重复的关键字的数量(为了便于区分,可以将该数量称为第一数量),确定第一关键字集合和第二关键字集合中关键字的总数量(为了便于区分,可以将该数量称为第二数量),利用第一数量除以第二数量得到第一故障报警和第二故障报警的关键字匹配度。
其中,第一关键字集合和第二关键字集合中关键字的总数量的计算方式可以为:确定第一关键字集合和第二关键字集合中重复的关键字,将所确定的关键字从第一关键字集合中删除,确定第一关键字集合中剩余关键字的数量和第二关键字集合中关键字的数量,将第一关键字集合中剩余关键字的数量和第二关键字集合中关键字的数量的和作为第一关键字集合和第二关键字集合中关键字的总数量。
S503、确定两个故障报警指示同一故障;
S504、确定两个故障报警未指示同一故障。
本申请提供的一种事件处理方法,填补了当前民航开放***故障自动化恢复的空白;故障从产生到恢复全流程自动化处理,降低了运维人员手动进行故障恢复所带来的风险;整合分析后的故障报警信息可以反向回馈给监控***,帮助监控***来提升故障报警准确率;减少了运维人员工作量,提高运维人员工作效率。本申请重点强调如何在故障的产生和关闭过程中实现全流程自动化处理,属于在民航开放***自动化运维领域的创新。
图6为本申请实施例提供的一种事件处理装置的结构示意图。
如图6所示,该装置包括:
分析整合单元601,用于分析整合至少一个技术平台对民航***进行监控发送的各个故障报警,确定至少一个目标故障报警;一个目标故障报 警对应一个目标事件;
目标故障处理方法获取单元602,用于查询预先设置的事件与故障处理方法的对应关系,分别获取每个目标事件对应的目标故障处理方法;
事件处理单元603,用于触发执行目标故障处理方法指示的自动化故障恢复脚本程序,自动处理目标故障处理方法对应的目标故障报警指示的民航***中的故障。
示例性的,分析整合单元可以认为是故障分析模块中的单元,目标故障处理方法获取单元可以认为是事件管理模块中的单元,事件处理单元可以认为是事件管理模块中的单元,该事件处理单元用于触发自动化故障修复模块执行目标故障处理方法指示的自动化故障恢复脚本程序,以实现对民航***中故障的自动修复。
本申请实施例中,优选的,分析整合单元,包括:
故障报警接收单元,用于接收至少一个技术平台对民航***进行监控发送的各个故障报警;
故障报警确定单元,用于确定所接收到的各个故障报警中指示同一故障的至少一个故障报警;
分析整合子单元,用于若至少一个故障报警包括来源于不同技术平台的故障报警,将至少一个故障报警整合成一个目标故障报警。
进一步的,本申请实施例提供的一种事件处理装置还包括判断单元,该判断单元包括:
时长确定单元,用于确定两个故障报警的报警发生时间之间的时间差是否未超过预设的目标时长;
判断子单元,用于若时间差未超过目标时长,判断两个故障报警的关键字匹配度是否超过预设目标关键字匹配度;
第一确定单元,用于,用于如果两个故障报警的关键字匹配度超过目标关键字匹配度,确定两个故障报警指示同一故障;
第二确定单元,用于如果两个故障报警的报警发生时间之间的时间差超过目标时长或两个故障报警的关键字匹配度超过目标关键字匹配度,确 定两个故障报警未指示同一故障。
本申请实施例中,优选的,目标故障处理方法包括自动化故障恢复脚本程序和方法叙述,事件处理单元,包括:
故障恢复步骤确定单元,用于确定方法叙述指示的故障恢复步骤序列中最近一个未被确定的故障恢复步骤;
故障恢复步骤展示单元,用于若当前所确定的故障恢复步骤未指示自动化故障恢复脚本程序,展示当前所确定的故障恢复步骤;
返回执行单元,用于响应当前所确定的故障恢复步骤的执行完成操作,返回执行“确定方法叙述指示的故障恢复步骤序列中最近一个未被确定的故障恢复步骤”步骤;
事件处理子单元,用于若当前所确定的故障恢复步骤指示自动化故障恢复脚本程序,触发执行自动化故障恢复脚本程序。
进一步的,本申请实施例提供的一种事件处理装置还包括故障恢复记录生成单元,该故障恢复记录生成单元用于生成并存储目标故障报警的故障恢复记录。
本申请实施例提供的一种车辆功能控制意图确定方法应用于电子设备,如图7所示,为本申请实施例提供的电子设备的一种实现方式的结构图,该计算机设备包括:
存储器701,用于存储程序;
处理器702,用于执行程序,程序具体用于:
分析整合至少一个技术平台对民航***进行监控发送的各个故障报警,确定至少一个目标故障报警;一个目标故障报警对应一个目标事件;
查询预先设置的事件与故障处理方法的对应关系,分别获取每个目标事件对应的目标故障处理方法;
触发执行目标故障处理方法指示的自动化故障恢复脚本程序,自动处理目标故障处理方法对应的目标故障报警指示的民航***中的故障。
处理器702可能是一个中央处理器CPU,或者是特定集成电路ASIC(Application Specific Integrated Circuit)。
控制设备还可以包括通信接口703以及通信总线704,其中,存储器701、处理器702以及通信接口703通过通信总线704完成相互间的通信。
本申请实施例还提供了一种可读存储介质,其上存储有计算机程序,计算机程序被处理器加载并执行,实现上述的事件处理方法的各步骤,具体实现过程可以参照上述实施例相应部分的描述,本实施例不做赘述。
本申请实施例提供一种事件处理方法、装置、计算机设备及存储介质,分析整合至少一个技术平台对民航***进行监控发送的各个故障报警,确定至少一个目标故障报警;一个目标故障报警对应一个目标事件;查询预先设置的事件与故障处理方法的对应关系,分别获取每个目标事件对应的目标故障处理方法;触发执行目标故障处理方法指示的自动化故障恢复脚本程序,自动处理目标故障处理方法对应的目标故障报警指示的民航***中的故障。本申请基于对至少一个技术平台的故障报警的分析整合及对故障报警的自动处理,有效提高了故障处理准确性及效率。
以上对本发明所提供的一种事件处理方法、装置、计算机设备及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅 用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备所固有的要素,或者是还包括为这些过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

  1. 一种事件处理方法,其特征在于,包括:
    分析整合至少一个技术平台对民航***进行监控发送的各个故障报警,确定至少一个目标故障报警;一个目标故障报警对应一个目标事件;
    查询预先设置的事件与故障处理方法的对应关系,分别获取每个所述目标事件对应的目标故障处理方法;
    触发执行所述目标故障处理方法指示的自动化故障恢复脚本程序,自动处理所述目标故障处理方法对应的目标故障报警指示的所述民航***中的故障。
  2. 根据权利要求1所述的方法,其特征在于,所述分析整合至少一个技术平台对民航***进行监控发送的各个故障报警,确定至少一个目标故障报警,包括:
    接收至少一个技术平台对民航***进行监控发送的各个故障报警;
    确定所接收到的各个故障报警中指示同一故障的至少一个故障报警;
    若所述至少一个故障报警包括来源于不同技术平台的故障报警,将所述至少一个故障报警整合成一个目标故障报警。
  3. 根据权利要求1所述的方法,其特征在于,还包括确定两个故障报警是否指示同一故障的过程,该过程包括:
    确定两个故障报警的报警发生时间之间的时间差是否未超过预设的目标时长;
    若所述时间差未超过所述目标时长,判断两个故障报警的关键字匹配度是否超过预设目标关键字匹配度;
    如果两个故障报警的关键字匹配度超过所述目标关键字匹配度,确定两个故障报警指示同一故障;
    如果两个故障报警的报警发生时间之间的时间差超过所述目标时长或两个故障报警的关键字匹配度超过所述目标关键字匹配度,确定两个故障报警未指示同一故障。
  4. 根据权利要求1所述的方法,其特征在于,所述目标故障处理方法包括自动化故障恢复脚本程序和方法叙述,
    所述触发执行所述目标故障处理方法指示的自动化故障恢复脚本程序,自动处理所述目标故障处理方法对应的目标故障报警指示的所述民航***中的故障,包括:
    确定所述方法叙述指示的故障恢复步骤序列中最近一个未被确定的故障恢复步骤;
    若当前所确定的故障恢复步骤未指示自动化故障恢复脚本程序,展示当前所确定的故障恢复步骤;
    响应当前所确定的故障恢复步骤的执行完成操作,返回执行“确定所述方法叙述指示的故障恢复步骤序列中最近一个未被确定的故障恢复步骤”步骤;
    若当前所确定的故障恢复步骤指示自动化故障恢复脚本程序,触发执行所述自动化故障恢复脚本程序。
  5. 根据权利要求1所述的方法,其特征在于,还包括:
    生成并存储所述目标故障报警的故障恢复记录。
  6. 一种事件处理装置,其特征在于,包括:
    分析整合单元,用于分析整合至少一个技术平台对民航***进行监控发送的各个故障报警,确定至少一个目标故障报警;一个目标故障报警对应一个目标事件;
    目标故障处理方法获取单元,用于查询预先设置的事件与故障处理方法的对应关系,分别获取每个所述目标事件对应的目标故障处理方法;
    事件处理单单元,用于触发执行所述目标故障处理方法指示的自动化故障恢复脚本程序,自动处理所述目标故障处理方法对应的目标故障报警指示的所述民航***中的故障。
  7. 根据权利要求6所述的装置,其特征在于,所述分析整合单元,包括:
    故障报警接收单元,用于接收至少一个技术平台对民航***进行监控发送的各个故障报警;
    故障报警确定单元,用于确定所接收到的各个故障报警中指示同一故障的至少一个故障报警;
    分析整合子单元,用于若所述至少一个故障报警包括来源于不同技术平台的故障报警,将所述至少一个故障报警整合成一个目标故障报警。
  8. 根据权利要求6所述的装置,其特征在于,还包括判断单元,所述判断单元,包括:
    时长确定单元,用于确定两个故障报警的报警发生时间之间的时间差是否未超过预设的目标时长;
    判断子单元,用于若所述时间差未超过所述目标时长,判断两个故障报警的关键字匹配度是否超过预设目标关键字匹配度;
    第一确定单元,用于,用于如果两个故障报警的关键字匹配度超过所述目标关键字匹配度,确定两个故障报警指示同一故障;
    第二确定单元,用于如果两个故障报警的报警发生时间之间的时间差超过所述目标时长或两个故障报警的关键字匹配度超过所述目标关键字匹配度,确定两个故障报警未指示同一故障。
  9. 一种电子设备,其特征在于,包括:处理器以及存储器;其中,所述处理器,用于调用并执行所述存储器中存储的程序;所述存储器,用于存储程序,所述程序用于实现如权利要求1-5任意一项所述的事件处理方法。
  10. 一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器加载并执行,实现如权利要求1-5任意一项所述的事件处理方法的各步骤。
PCT/CN2022/088134 2021-06-01 2022-04-21 一种事件处理方法、装置、计算机设备及存储介质 WO2022252860A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202110608613.3 2021-06-01
CN202110608613.3A CN113312200A (zh) 2021-06-01 2021-06-01 一种事件处理方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
WO2022252860A1 true WO2022252860A1 (zh) 2022-12-08

Family

ID=77376794

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2022/088134 WO2022252860A1 (zh) 2021-06-01 2022-04-21 一种事件处理方法、装置、计算机设备及存储介质

Country Status (2)

Country Link
CN (1) CN113312200A (zh)
WO (1) WO2022252860A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113312200A (zh) * 2021-06-01 2021-08-27 中国民航信息网络股份有限公司 一种事件处理方法、装置、计算机设备及存储介质
CN115695142A (zh) * 2022-10-25 2023-02-03 浪潮通信信息***有限公司 一种面向网络运维的事件监控方法及装置
CN117527527B (zh) * 2024-01-08 2024-03-19 天津市天河计算机技术有限公司 多源告警处理方法和***

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7069473B2 (en) * 2001-10-05 2006-06-27 Nec Corporation Computer recovery method and system for recovering automatically from fault, and fault monitoring apparatus and program used in computer system
CN108989132A (zh) * 2018-08-24 2018-12-11 深圳前海微众银行股份有限公司 故障告警处理方法、***及计算机可读存储介质
CN109358602A (zh) * 2018-10-23 2019-02-19 山东中创软件商用中间件股份有限公司 一种故障分析方法、装置及相关设备
CN111181767A (zh) * 2019-12-10 2020-05-19 中国航空工业集团公司成都飞机设计研究所 一种面向复杂***的监控和故障自愈***及其方法
CN110164101B (zh) * 2019-04-09 2021-05-11 烽台科技(北京)有限公司 一种处理报警信息的方法及设备
CN113312200A (zh) * 2021-06-01 2021-08-27 中国民航信息网络股份有限公司 一种事件处理方法、装置、计算机设备及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019009726A (ja) * 2017-06-28 2019-01-17 株式会社日立製作所 障害切り分け方法および管理サーバ
CN109374053B (zh) * 2018-11-13 2021-06-08 深圳市中广控信息科技有限公司 一种基于事件驱动响应的物联网机房管理平台
CN111082966B (zh) * 2019-11-01 2022-08-12 平安科技(深圳)有限公司 基于批量告警事件的定位方法、装置、电子设备及介质
CN111814999B (zh) * 2020-07-08 2024-01-16 上海燕汐软件信息科技有限公司 一种故障工单生成方法、装置、设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7069473B2 (en) * 2001-10-05 2006-06-27 Nec Corporation Computer recovery method and system for recovering automatically from fault, and fault monitoring apparatus and program used in computer system
CN108989132A (zh) * 2018-08-24 2018-12-11 深圳前海微众银行股份有限公司 故障告警处理方法、***及计算机可读存储介质
CN109358602A (zh) * 2018-10-23 2019-02-19 山东中创软件商用中间件股份有限公司 一种故障分析方法、装置及相关设备
CN110164101B (zh) * 2019-04-09 2021-05-11 烽台科技(北京)有限公司 一种处理报警信息的方法及设备
CN111181767A (zh) * 2019-12-10 2020-05-19 中国航空工业集团公司成都飞机设计研究所 一种面向复杂***的监控和故障自愈***及其方法
CN113312200A (zh) * 2021-06-01 2021-08-27 中国民航信息网络股份有限公司 一种事件处理方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN113312200A (zh) 2021-08-27

Similar Documents

Publication Publication Date Title
WO2022252860A1 (zh) 一种事件处理方法、装置、计算机设备及存储介质
CN111209131B (zh) 一种基于机器学习确定异构***的故障的方法和***
US20220321440A1 (en) Interface Service Function Monitoring Method and System Based on Data Acquisition
CN110505102B (zh) 电力信息通信融合监控与服务标准化管理平台***及方法
CN106874159A (zh) 一种集群式自动化测试方法
CN210150534U (zh) 一种具预警功能的电梯维保***
CN100586202C (zh) 故障定位的方法及装置
CN110570097A (zh) 基于大数据的业务人员风险识别方法、装置及存储介质
CN103986607A (zh) 一种智能数据中心语音声光报警监控***
CN117992304A (zh) 一种一体化智能运维平台
Tang et al. MEADEP: A dependability evaluation tool for engineers
CN114500316B (zh) 一种物联网设备巡检方法和***
CN113438248B (zh) 一种便于主站网络ip地址自查管理***
CN115514099A (zh) 电力用电安全检查***及方法
CN115982049A (zh) 性能测试中的异常检测方法、装置和计算机设备
CN114387123B (zh) 数据采集管理方法
WO2020010531A1 (zh) 故障检测方法、设备
CN109345196A (zh) 一种预警平台及预警方法
CN112446619B (zh) 配电网抢修处理方法和装置
CN112305980A (zh) 一种智慧楼宇综合监控用运营管理平台
CN111835566A (zh) 一种***故障管理方法、装置及***
CN110674197A (zh) 一种业务操作的可视化配置与抓取***
TW200840275A (en) Automatic monitor-analysis and problem diagnosis system for mobile network and the method thereof
TWI789576B (zh) 集中式線上監視系統
CN106850305A (zh) 一种it运维管理方法及装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22814907

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 22814907

Country of ref document: EP

Kind code of ref document: A1