CN104243192B - 故障处理方法及*** - Google Patents

故障处理方法及*** Download PDF

Info

Publication number
CN104243192B
CN104243192B CN201310237951.6A CN201310237951A CN104243192B CN 104243192 B CN104243192 B CN 104243192B CN 201310237951 A CN201310237951 A CN 201310237951A CN 104243192 B CN104243192 B CN 104243192B
Authority
CN
China
Prior art keywords
fault
failure
relevant
fisrt
fisrt fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310237951.6A
Other languages
English (en)
Other versions
CN104243192A (zh
Inventor
李宏琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Shenzhou Taiyue Software Co Ltd
Original Assignee
Beijing Shenzhou Taiyue Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Shenzhou Taiyue Software Co Ltd filed Critical Beijing Shenzhou Taiyue Software Co Ltd
Priority to CN201310237951.6A priority Critical patent/CN104243192B/zh
Publication of CN104243192A publication Critical patent/CN104243192A/zh
Application granted granted Critical
Publication of CN104243192B publication Critical patent/CN104243192B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种故障处理方法及***,涉及故障分析技术领域。本发明实施例提供的故障处理方法和***,本故障关联方法中,对设备工作状况进行实时监控,当监控到主故障A发生,则分别以主故障A发生时间点向前和向后查找时间窗T内,是否有故障B发生,如果有,则建立关联关系。故障关联关系的建立,有利于运维人员针对关联故障进行处理,提高故障处理效率。进一步的,本发明实施例还建立有内存缓存队列,通过以队列方式在内存中缓存故障,以便在确定故障关联关系时,仅查询该内存缓存队列便可以快速的找到是否有关联故障发生,避免对大样本进行分析,进一步提高故障处理效率。

Description

故障处理方法及***
技术领域
本发明涉及故障分析技术领域,特别涉及一种故障处理方法及***。
背景技术
在日常设备维护中,通常是通过监控人员监控,如发现故障,便将该故障提交维护人员对其进行排查处理,以及时恢复正常工作状态。
但是,上述处理方法中,对于维护人员而言,由于收到的上报故障杂乱无章,毫无规律而言,因此,在对故障排查和处理时,效率低下。因此,迫切需要一种高效有序的故障处理解决方案,以提高故障处理效率。
发明内容
鉴于上述问题,本发明实施例提供一种故障处理方法及***,使得能够根据有序上报的故障,实现高效快速的故障处理解决方案。
本发明实施例采用了如下技术方案:
本发明一个实施例提供了一种故障处理方法,所述方法包括:
当监控到第一故障发生时,分别向前和向后查找预定时间窗内是否有第二故障发生;
如查找到第二故障发生,则将所述第一故障和第二故障作为关联故障,上报所述关联故障;如未查找到第二故障发生,则将所述第一故障上报;
针对上报的故障,若为关联故障,则对其进行合并处理;若为第一故障,则对其进行处理。
所述方法还包括:
建立关联模板,用于记录故障之间的关联关系;及
建立内存缓存队列,在监控过程中若有故障发生,则以队列的方式在内存中缓存该故障;
则所述当监控到第一故障发生时,分别向前和向后查找预定时间窗内是否有第二故障发生具体包括:
当监控到第一故障发生时,查询所述关联模板,判断所述第一故障是否存在关联故障,若不存在关联故障,则上报所述第一故障;
若存在关联故障,则在所述内存缓存队列中查询所述第一故障发生前预定时间窗内是否有与之关联的第二故障,并且,在所述第一故障发生后的预定时间窗内,继续监控是否有第二故障发生。
所述方法还包括:对所述内存缓存队列进行监控管理,清除当前处理故障发生预定时间窗之前的故障;
则所述当监控到第一故障发生时,分别向前和向后查找预定时间窗内是否有第二故障发生具体包括:
当监控到第一故障发生时,查询所述关联模板,判断所述第一故障是否存在关联故障,若不存在关联故障,则上报所述第一故障;
若存在关联故障,则在所述内存缓存队列中查询是否有与之关联的第二故障,并且,在所述第一故障发生后的预定时间窗内,继续监控所述内存缓存队列中是否有第二故障发生。
若存在关联故障,所述方法还包括:
根据所述关联模板中的故障关联关系,在内存缓存队列中建立以设备网元唯一标识及关联规则ID标识的一个分组,则当监控到故障发生时,将当前监控到的故障缓存在其所对应的设备网元唯一标识及关联规则ID标识的分组中。
所述第二故障为一个或多个。
互为关联故障的第一故障和第二故障的关系如下:
第一故障为主故障,则第二故障为次故障;或
第一故障为次故障,则第二故障为主故障。
本发明实施例还提供一种故障处理***,所述***包括:
关联故障查找模块,用于当监控到第一故障发生时,分别向前和向后查找预定时间窗内是否有第二故障发生;
上报模块,用于若所述关联故障查找模块查找到第二故障发生,则将所述第一故障和第二故障作为关联故障,上报所述关联故障;若所述关联故障查找模块未查找到第二故障发生,则将所述第一故障上报;
处理模块,用于针对上报的故障,若为关联故障,则对其进行合并处理;若为第一故障,则对其进行处理。
所述***还包括:
关联模板模块,用于建立关联模板,记录故障之间的关联关系;
缓存模块,用于建立内存缓存队列,在监控过程中若有故障发生,则以队列的方式在内存中缓存该故障;
则所述关联故障查找模块具体包括:
故障类型判断单元,用于当监控到第一故障发生时,查询所述关联模板,判断所述第一故障是否存在关联故障;
查找单元,用于所述故障类型判断单元的判断结果为存在关联故障,则在所述内存缓存队列中查询所述第一故障发生前预定时间窗内是否有与之关联的第二故障,并且,在所述第一故障发生后的预定时间窗内,继续监控是否有第二故障发生;
上报触发单元,用于当所述故障类型判断单元的判断结果为不存在关联故障,则触发所述上报模块上报所述第一故障;及,根据所述查找单元的查找结果触发所述上报单元上报故障。
所述***还包括:
内存缓存队列管理模块,用于对所述内存缓存队列进行监控管理,清除当前处理故障发生预定时间窗之前的故障;
则所述关联故障查找模块具体包括:
故障类型判断单元,用于当监控到第一故障发生时,查询所述关联模板,判断所述第一故障是否存在关联故障;
查找单元,用于所述故障类型判断单元的判断结果为存在关联故障,则在所述内存缓存队列中查询是否有与之关联的第二故障,并且,在所述第一故障发生后的预定时间窗内,继续监控所述内存缓存队列中是否有第二故障发生;
上报触发单元,用于当所述故障类型判断单元的判断结果为不存在关联故障,则触发所述上报模块上报所述第一故障;及,根据所述查找单元的查找结果触发所述上报单元上报故障。
所述缓存模块还包括:
分组单元,用于存在关联故障时,根据所述关联模板中的故障关联关系,在内存缓存队列中建立以设备网元唯一标识及关联规则ID标识的一个分组,则当监控到故障发生时,将当前监控到的故障缓存在其所对应的设备网元唯一标识及关联规则ID标识的分组中;
所述第二故障为一个或多个;
互为关联故障的第一故障和第二故障的关系如下:
第一故障为主故障,则第二故障为次故障;或
第一故障为次故障,则第二故障为主故障。
本发明实施例提供的故障处理方法和***,本故障关联方法中,对设备工作状况进行实时监控,当监控到主故障A发生,则分别以主故障A发生时间点向前和向后查找时间窗T内,是否有故障B发生,如果有,则建立关联关系。故障关联关系的建立,有利于运维人员针对关联故障进行处理,提高故障处理效率。
进一步的,本发明实施例还建立有内存缓存队列,通过以队列方式在内存中缓存故障,以便在确定故障关联关系时,仅查询该内存缓存队列便可以快速的找到是否有关联故障发生,避免对大样本进行分析,进一步提高故障处理效率。
附图说明
图1为本发明一个实施例提供的一种故障处理方法流程图;
图2为本发明另一实施例提供的一种故障处理方法流程图;
图3为本发明实施例提供的故障处理方法的一种具体实例流程图;
图4为本发明一个实施例提供的一种故障处理***框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
在日常设备维护中,通过监控人员不断观察分析,总结出故障发生规律。通常,若多个故障通常一起发生,则称该多个故障之间具备影响关系,称为关联故障。比如,当A故障发生,通常前后10分钟内B故障也会发生,则认为告警A和告警B为影响关系,根据具体应用场景,关联故障之间存在主次关系,例如在上述关联关系中,A为主故障,B为次故障。
本故障关联方法中,对设备工作状况进行实时监控,当监控到主故障A发生,则分别以主故障A发生时间点向前和向后查找时间窗T内,是否有故障B发生,如果有,则建立关联关系。故障关联关系的建立,有利于维护人员针对关联故障进行处理,提高故障处理效率。
具体的,参见图1,为本发明实施例提供的一种故障处理方法,具体包括如下步骤:
S101:监控故障发生。
S102:当监控到第一故障发生时,分别向前和向后查找预定时间窗内是否有第二故障发生。
根据不同的应用场景,预定时间窗的长度可以设置不同。比如,在通信行业通信设备维护应用场景中,可以设置预定时间窗的长度为10分钟。
S103:如查找到第二故障发生,则将所述第一故障和第二故障作为关联故障,上报所述关联故障;如未查找到第二故障发生,则将所述第一故障上报。
第一故障和第二故障是关联故障,即通常情况下,两者会伴随发生,在实际应用中,如果在故障上报之前,能够对故障进行关联分析处理,并上报,这样,维护人员便可以针对故障进行关联合并处理,能够大大提高故障处理效率。
需要说明的是,上述第二故障可以是一个或多个,也就是说,若第一故障为A故障,第二故障可以为B故障,也可以为B故障、C故障和D故障等等,此处不做限制。
另外需要说明的是,互为关联故障的第一故障和第二故障的关系可以是:
第一故障为主故障,则第二故障为次故障;或,第一故障为次故障,则第二故障为主故障。比如,若某基站故障为主故障,则下行信号发送故障便可以设置为次故障。
S104:针对上报的故障,若为关联故障,则对其进行合并处理;若为第一故障,则对其进行处理。
本发明实施例中,查找主故障A发生前T时间(即时间窗T前)的次故障B。找到的次故障B,建立关联关系。并继续接收次故障B,建立关联关系。当主故障A超过时间窗T,主故障A不在关联次故障B。
可见,本发明实施例提供的故障处理方法和***,本故障关联方法中,对设备工作状况进行实时监控,当监控到主故障A发生,则分别以主故障A发生时间点向前和向后查找时间窗T内,是否有故障B发生,如果有,则建立关联关系。故障关联关系的建立,有利于运维人员针对关联故障进行处理,提高故障处理效率。
优选的,参见图2,本发明另一实施例提供了另一种故障处理方法。本发明实施例进一步的建立有内存缓存队列,通过以队列方式在内存中缓存故障,以便在确定故障关联关系时,仅查询该内存缓存队列便可以快速的找到是否有关联故障发生,从而避免对大样本数据进行分析处理,能够进一步提高故障处理效率。
具体步骤如下:
S201:建立关联模板,用于记录故障之间的关联关系。
S202:建立内存缓存队列,在监控过程中若有故障发生,则以队列的方式在内存中缓存该故障。
具体实践中,当收到故障B时,计算出故障的超时时间窗(即故障发生时间+时间窗T分钟)。将故障以队列的方式存入内存缓存中。若当前处理故障为故障A,则查询内存缓存队列中缓存的故障A之前时间窗T分钟内是否有故障B存在,可见,通过增加内存缓存队列,可以避免对大样本数据进行分析的步骤,仅仅在内存缓存队列中查询即可。
S203:当监控到第一故障发生时,查询上述关联模板,判断第一故障是否存在关联故障,若不存在关联故障,则执行步骤S204,若存在关联故障,则执行步骤S205。
S204:上报第一故障,执行步骤S208。
S205:在内存缓存队列中查询第一故障发生前预定时间窗内是否有与之关联的第二故障,并且,在第一故障发生后的预定时间窗内,继续监控是否有第二故障发生。如查找到第二故障发生,则执行步骤S206,如未查找到第二故障发生,则执行步骤S204。
优选的,本发明实施例还包括如下步骤:对内存缓存队列进行监控管理,清除当前处理故障发生预定时间窗之前的故障。
针对该步骤,当收到故障B时,计算出故障的超时时间窗(即故障发生时间+时间窗T分钟)。将故障以队列的方式存入内存缓存中。若当前处理故障为故障A,则查询内存缓存队列中缓存的故障A之前是否有故障B存在(内存缓存队列中存储的仅仅为当前处理故障即故障A之前时间窗T分钟内的),并且,在第一故障(故障A)发生后的预定时间窗内,继续监控内存缓存队列中是否有第二故障(故障B)发生。可见,通过增加内存缓存队列,可以避免对大样本数据进行分析的步骤,仅仅在内存缓存队列中查询即可。
进一步的,若存在关联故障,本发明实施例所述方法还包括:
根据所述关联模板中的故障关联关系,在内存缓存队列中建立以“设备网元唯一标识+关联规则ID”标识的一个分组,则当监控到故障发生时,将当前监控到的故障缓存在其所对应的设备网元唯一标识及关联规则ID标识的分组中。
其中,设备网元唯一标识,用于唯一标识网络中的某台设备。
关联规则ID,用于标识关联规则,比如A故障为主故障,B故障为次故障。
相应的,在内存缓存队列中查询关联故障的步骤,具体为在内存缓存队列中以“设备网元唯一标识+关联规则ID”标识的分组中查询即可。这样,可以进一步缩小数据处理的样本,进一步提高故障处理的效率。
S206:将第一故障和第二故障作为关联故障,上报该关联故障。
S207:对关联故障进行合并处理,结束。
S208:对第一故障进行处理。
第一故障和第二故障是关联故障,即通常情况下,两者会伴随发生,在实际应用中,如果在故障上报之前,能够对故障进行关联分析处理,并上报,这样,维护人员便可以针对故障进行关联合并处理,能够大大提高故障处理效率。
需要说明的是,上述第二故障可以是一个或多个,也就是说,若第一故障为A故障,第二故障可以为B故障,也可以为B故障、C故障和D故障等等,此处不做限制。
另外需要说明的是,互为关联故障的第一故障和第二故障的关系可以是:
第一故障为主故障,则第二故障为次故障;或,第一故障为次故障,则第二故障为主故障。比如,若某基站故障为主故障,则下行信号发送故障便可以设置为次故障。
本发明实施例中,在内存缓存队列中查找主故障A发生前T时间(即时间窗T前)的次故障B。找到的次故障B,建立关联关系。并继续接收次故障B,建立关联关系。当主故障A超过时间窗T,主故障A不在关联次故障B。
可见,本发明实施例提供的故障处理方法和***,本故障关联方法中,对设备工作状况进行实时监控,当监控到主故障A发生,则分别以主故障A发生时间点向前和向后查找时间窗T内,是否有故障B发生,如果有,则建立关联关系。故障关联关系的建立,有利于运维人员针对关联故障进行处理,提高故障处理效率。
进一步的,本发明实施例还建立有内存缓存队列,通过以队列方式在内存中缓存故障,以便在确定故障关联关系时,仅查询该内存缓存队列便可以快速的找到是否有关联故障发生,避免对大样本进行分析,进一步提高故障处理效率。
参见图3,为本发明实施例提供的一种具体的故障处理方法的实例,整体思路:首先,缓存需要关联的故障。然后,根据故障定位信息,将故障分组。最后,当故障设备的主、次故障均发生故障时,进行故障关联。实现的大体包括以下描述,具体子步骤请参见图3所示,此处不再赘述。
S301:定义关联规则。
同一个设备发生故障A为主告警,发生故障B为子告警。定义时间窗长度为T分钟。
S302:接收活动告警。
i.收到故障A(或者故障B),建立一个以“网元唯一标识+关联规则ID”的一个分组,计算出故障的超时时间窗(即故障发生时间+时间窗T分钟)。将故障以队列的方式存入内存缓存中。
ii.收到故障B(或者故障A)。查找“网元唯一标识+关联规则ID”是否存在未超时数据。如果存在,且互为主次告警,将故障A、故障B关联。
S303:超时丢弃。
检索队列,将超过时间窗T的告警从分组队列中删除。不再用于关联。
可见,本实例的有益效果是:大大减少了大数据样本的复杂查询,加快故障关联速度,从而大大提高了故障处理的效率。
参见图4,本发明实施例提供一种故障处理***,包括:
关联故障查找模块401,用于当监控到第一故障发生时,分别向前和向后查找预定时间窗内是否有第二故障发生。
上报模块402,用于若关联故障查找模块401查找到第二故障发生,则将第一故障和第二故障作为关联故障,上报该关联故障;若关联故障查找模块401未查找到第二故障发生,则将第一故障上报。
处理模块403,用于针对上报的故障,若为关联故障,则对其进行合并处理;若为第一故障,则对其进行处理。
进一步的,本发明实施例提供的故障处理***还包括:
关联模板模块404,用于建立关联模板,记录故障之间的关联关系。
缓存模块405,用于建立内存缓存队列,在监控过程中若有故障发生,则以队列的方式在内存中缓存该故障。
则关联故障查找模块401具体包括:
故障类型判断单元,用于当监控到第一故障发生时,查询所述关联模板,判断所述第一故障是否存在关联故障。
查找单元,用于所述故障类型判断单元的判断结果为存在关联故障,则在所述内存缓存队列中查询所述第一故障发生前预定时间窗内是否有与之关联的第二故障,并且,在所述第一故障发生后的预定时间窗内,继续监控是否有第二故障发生。
以及,上报触发单元,用于当所述故障类型判断单元的判断结果为不存在关联故障,则触发所述上报模块上报所述第一故障;及,根据所述查找单元的查找结果触发所述上报单元上报故障。
再进一步的,本发明实施例提供的故障处理***还包括:
内存缓存队列管理模块406,用于对内存缓存队列进行监控管理,清除当前处理故障发生预定时间窗之前的故障。
则所述关联故障查找模块401具体包括:
故障类型判断单元,用于当监控到第一故障发生时,查询所述关联模板,判断所述第一故障是否存在关联故障。
查找单元,用于所述故障类型判断单元的判断结果为存在关联故障,则在所述内存缓存队列中查询是否有与之关联的第二故障,并且,在所述第一故障发生后的预定时间窗内,继续监控所述内存缓存队列中是否有第二故障发生。
以及,上报触发单元,用于当所述故障类型判断单元的判断结果为不存在关联故障,则触发所述上报模块上报所述第一故障;及,根据所述查找单元的查找结果触发所述上报单元上报故障。
优选的,上述缓存模块还包括:
分组单元,用于存在关联故障时,根据所述关联模板中的故障关联关系,在内存缓存队列中建立以设备网元唯一标识及关联规则ID标识的一个分组,则当监控到故障发生时,将当前监控到的故障缓存在其所对应的设备网元唯一标识及关联规则ID标识的分组中。
需要说明的是,上述第二故障可以是一个或多个,也就是说,若第一故障为A故障,第二故障可以为B故障,也可以为B故障、C故障和D故障等等,此处不做限制。
另外需要说明的是,互为关联故障的第一故障和第二故障的关系可以是:
第一故障为主故障,则第二故障为次故障;或,第一故障为次故障,则第二故障为主故障。比如,若某基站故障为主故障,则下行信号发送故障便可以设置为次故障。
需要说明的是,本发明***实施例中的各个模块或者单元的工作原理和处理过程可以参见上述图1、图2和图3所示方法实施例中的相关描述,此处不再赘述。
可见,本发明实施例提供的故障处理方法和***,本故障关联方法中,对设备工作状况进行实时监控,当监控到主故障A发生,则分别以主故障A发生时间点向前和向后查找时间窗T内,是否有故障B发生,如果有,则建立关联关系。故障关联关系的建立,有利于运维人员针对关联故障进行处理,提高故障处理效率。
进一步的,本发明实施例还建立有内存缓存队列,通过以队列方式在内存中缓存故障,以便在确定故障关联关系时,仅查询该内存缓存队列便可以快速的找到是否有关联故障发生,避免对大样本进行分析,进一步提高故障处理效率。
为了便于清楚描述本发明实施例的技术方案,在发明的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分,本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (9)

1.一种故障处理方法,其特征在于,所述方法包括:
建立关联模板,用于记录故障之间的关联关系;及
建立内存缓存队列,在监控过程中若有故障发生,则以队列的方式在内存中缓存该故障;
当监控到第一故障发生时,分别向前和向后查找预定时间窗内是否有第二故障发生;
如查找到第二故障发生,则将所述第一故障和第二故障作为关联故障,上报所述关联故障;如未查找到第二故障发生,则将所述第一故障上报;
针对上报的故障,若为关联故障,则对其进行合并处理;若为第一故障,则对其进行处理;
所述当监控到第一故障发生时,分别向前和向后查找预定时间窗内是否有第二故障发生具体包括:
当监控到第一故障发生时,查询所述关联模板,判断所述第一故障是否存在关联故障,若不存在关联故障,则上报所述第一故障;
若存在关联故障,则在所述内存缓存队列中查询所述第一故障发生前预定时间窗内是否有与之关联的第二故障,并且,在所述第一故障发生后的预定时间窗内,继续监控是否有第二故障发生。
2.根据权利要求1所述的故障处理方法,其特征在于,所述方法还包括:对所述内存缓存队列进行监控管理,清除当前处理故障发生预定时间窗之前的故障;
则所述当监控到第一故障发生时,分别向前和向后查找预定时间窗内是否有第二故障发生具体包括:
当监控到第一故障发生时,查询所述关联模板,判断所述第一故障是否存在关联故障,若不存在关联故障,则上报所述第一故障;
若存在关联故障,则在所述内存缓存队列中查询是否有与之关联的第二故障,并且,在所述第一故障发生后的预定时间窗内,继续监控所述内存缓存队列中是否有第二故障发生。
3.根据权利要求1或2所述的故障处理方法,其特征在于,若存在关联故障,所述方法还包括:
根据所述关联模板中的故障关联关系,在内存缓存队列中建立以设备网元唯一标识及关联规则ID标识的一个分组,则当监控到故障发生时,将当前监控到的故障缓存在其所对应的设备网元唯一标识及关联规则ID标识的分组中。
4.根据权利要求1-2任一项所述的故障处理方法,其特征在于,所述第二故障为一个或多个。
5.根据权利要求1-2任一项所述的故障处理方法,其特征在于,互为关联故障的第一故障和第二故障的关系如下:
第一故障为主故障,则第二故障为次故障;或
第一故障为次故障,则第二故障为主故障。
6.一种故障处理***,其特征在于,所述***包括:
关联模板模块,用于建立关联模板,记录故障之间的关联关系;
缓存模块,用于建立内存缓存队列,在监控过程中若有故障发生,则以队列的方式在内存中缓存该故障;
关联故障查找模块,用于当监控到第一故障发生时,分别向前和向后查找预定时间窗内是否有第二故障发生;
上报模块,用于若所述关联故障查找模块查找到第二故障发生,则将所述第一故障和第二故障作为关联故障,上报所述关联故障;若所述关联故障查找模块未查找到第二故障发生,则将所述第一故障上报;处理模块,用于针对上报的故障,若为关联故障,则对其进行合并处理;若为第一故障,则对其进行处理;
所述关联故障查找模块具体包括:
故障类型判断单元,用于当监控到第一故障发生时,查询所述关联模板,判断所述第一故障是否存在关联故障;
查找单元,用于所述故障类型判断单元的判断结果为存在关联故障,则在所述内存缓存队列中查询所述第一故障发生前预定时间窗内是否有与之关联的第二故障,并且,在所述第一故障发生后的预定时间窗内,继续监控是否有第二故障发生。
7.根据权利要求6所述的故障处理***,其特征在于,
上报触发单元,用于当所述故障类型判断单元的判断结果为不存在关联故障,则触发所述上报模块上报所述第一故障;及,根据所述查找单元的查找结果触发所述上报模块上报故障。
8.根据权利要求7所述的故障处理***,其特征在于,所述***还包括:
内存缓存队列管理模块,用于对所述内存缓存队列进行监控管理,清除当前处理故障发生预定时间窗之前的故障;
则所述关联故障查找模块具体包括:
故障类型判断单元,用于当监控到第一故障发生时,查询所述关联模板,判断所述第一故障是否存在关联故障;
查找单元,用于所述故障类型判断单元的判断结果为存在关联故障,则在所述内存缓存队列中查询是否有与之关联的第二故障,并且,在所述第一故障发生后的预定时间窗内,继续监控所述内存缓存队列中是否有第二故障发生;
上报触发单元,用于当所述故障类型判断单元的判断结果为不存在关联故障,则触发所述上报模块上报所述第一故障;及,根据所述查找单元的查找结果触发所述上报模块上报故障。
9.根据权利要求7或8所述的故障处理***,其特征在于,所述缓存模块还包括:
分组单元,用于存在关联故障时,根据所述关联模板中的故障关联关系,在内存缓存队列中建立以设备网元唯一标识及关联规则ID标识的一个分组,则当监控到故障发生时,将当前监控到的故障缓存在其所对应的设备网元唯一标识及关联规则ID标识的分组中;
所述第二故障为一个或多个;
互为关联故障的第一故障和第二故障的关系如下:
第一故障为主故障,则第二故障为次故障;或
第一故障为次故障,则第二故障为主故障。
CN201310237951.6A 2013-06-17 2013-06-17 故障处理方法及*** Active CN104243192B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310237951.6A CN104243192B (zh) 2013-06-17 2013-06-17 故障处理方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310237951.6A CN104243192B (zh) 2013-06-17 2013-06-17 故障处理方法及***

Publications (2)

Publication Number Publication Date
CN104243192A CN104243192A (zh) 2014-12-24
CN104243192B true CN104243192B (zh) 2017-11-10

Family

ID=52230593

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310237951.6A Active CN104243192B (zh) 2013-06-17 2013-06-17 故障处理方法及***

Country Status (1)

Country Link
CN (1) CN104243192B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106411615A (zh) * 2016-11-22 2017-02-15 北京奇虎科技有限公司 一种用于对***应用进行云修复的设备和方法
CN108234189B (zh) * 2016-12-22 2021-10-08 北京神州泰岳软件股份有限公司 一种告警数据处理方法和装置
CN109659936A (zh) * 2018-12-29 2019-04-19 国电南瑞科技股份有限公司 一种智能电网调度控制***故障处置方法和***
CN111240871B (zh) * 2019-12-30 2023-07-18 潍柴动力股份有限公司 发动机故障报出方法及装置
CN113515078A (zh) * 2021-05-20 2021-10-19 湖南湘船重工有限公司 一种智能船舶信息监控及告警处理方法及***
CN115056228B (zh) * 2022-07-06 2023-07-04 中迪机器人(盐城)有限公司 一种机器人的异常监控和处理***及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6239699B1 (en) * 1999-03-03 2001-05-29 Lucent Technologies Inc. Intelligent alarm filtering in a telecommunications network
CN1492624A (zh) * 2002-10-22 2004-04-28 华为技术有限公司 通信网络告警的处理方法和相关性分析管理器
CN101360013A (zh) * 2008-09-25 2009-02-04 烽火通信科技股份有限公司 一种基于相关性分析的传输网通用快速故障定位方法
CN102014020A (zh) * 2010-11-12 2011-04-13 百度在线网络技术(北京)有限公司 一种用于对网络设备进行网络监控的设备及其方法
CN102098175A (zh) * 2011-01-26 2011-06-15 浪潮通信信息***有限公司 一种移动互联网告警关联规则获取方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5423427B2 (ja) * 2010-01-26 2014-02-19 富士通株式会社 情報管理プログラム、情報管理装置、および情報管理方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6239699B1 (en) * 1999-03-03 2001-05-29 Lucent Technologies Inc. Intelligent alarm filtering in a telecommunications network
CN1492624A (zh) * 2002-10-22 2004-04-28 华为技术有限公司 通信网络告警的处理方法和相关性分析管理器
CN101360013A (zh) * 2008-09-25 2009-02-04 烽火通信科技股份有限公司 一种基于相关性分析的传输网通用快速故障定位方法
CN102014020A (zh) * 2010-11-12 2011-04-13 百度在线网络技术(北京)有限公司 一种用于对网络设备进行网络监控的设备及其方法
CN102098175A (zh) * 2011-01-26 2011-06-15 浪潮通信信息***有限公司 一种移动互联网告警关联规则获取方法

Also Published As

Publication number Publication date
CN104243192A (zh) 2014-12-24

Similar Documents

Publication Publication Date Title
CN104243192B (zh) 故障处理方法及***
CN103220173B (zh) 一种报警监控方法及监控***
CN101808351B (zh) 业务影响分析方法和***
CN106385334B (zh) 呼叫中心***及其异常检测及自恢复方法
CN112737800B (zh) 服务节点故障定位方法、调用链生成方法及服务器
CN105549508A (zh) 一种基于信息合并的报警方法及装置
CN111786986B (zh) 一种数控***网络入侵防范***及方法
CN103634166B (zh) 一种设备存活检测方法及装置
CN102111788A (zh) 一种告警处理方法及告警管理***
Roblee et al. Implementing large-scale autonomic server monitoring using process query systems
TWI448975B (zh) 應用於影像監控平台的分散式運算系統
CN102195791A (zh) 一种告警的分析方法、装置及***
CN105281824A (zh) 长发光光网络单元的检测方法、装置及网管设备
CN110381082B (zh) 基于Mininet的电力通信网络的攻击检测方法和装置
CN111614630A (zh) 一种网络安全监控方法、装置及云端web应用防火墙
KR101973728B1 (ko) 통합 보안 이상징후 모니터링 시스템
WO2014040470A1 (zh) 告警消息的处理方法及装置
CN115701889A (zh) 基于soar的油田工控***方法
CN114385438A (zh) 业务运营风险预警方法、***及存储介质
CN111274089B (zh) 一种基于旁路技术的服务器异常行为感知***
CN108023741A (zh) 一种监控资源使用方法及服务器
CN114006719A (zh) 基于态势感知的ai验证方法、装置及***
CN113254313A (zh) 一种监控指标异常检测方法、装置、电子设备及存储介质
CN107615708A (zh) 告警信息上报方法及装置
CN111918233A (zh) 一种适用于无线航空网络的异常检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder

Address after: Room 818, 8 / F, 34 Haidian Street, Haidian District, Beijing 100080

Patentee after: BEIJING ULTRAPOWER SOFTWARE Co.,Ltd.

Address before: 100089 Beijing city Haidian District wanquanzhuang Road No. 28 Wanliu new building 6 storey block A Room 601

Patentee before: BEIJING ULTRAPOWER SOFTWARE Co.,Ltd.

CP02 Change in the address of a patent holder