CN102857365A - 网管***中故障预防及智能修复方法和装置 - Google Patents

网管***中故障预防及智能修复方法和装置 Download PDF

Info

Publication number
CN102857365A
CN102857365A CN201210185225XA CN201210185225A CN102857365A CN 102857365 A CN102857365 A CN 102857365A CN 201210185225X A CN201210185225X A CN 201210185225XA CN 201210185225 A CN201210185225 A CN 201210185225A CN 102857365 A CN102857365 A CN 102857365A
Authority
CN
China
Prior art keywords
fault
early warning
strategy
module
message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201210185225XA
Other languages
English (en)
Inventor
冯冲
陈斌
戴娴娴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201210185225XA priority Critical patent/CN102857365A/zh
Publication of CN102857365A publication Critical patent/CN102857365A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及一种网管***中故障预防及智能修复方法和装置,上述装置包括故障检测模块、故障预防模块以及故障修复模块;上述方法预先为网管***中与故障关联的***参数设置相应的预警阈值、故障阈值、预警修复策略及故障修复策略;当监测到与故障关联的***参数大于等于对应的预警阈值而小于对应的故障阈值时,则生成预警消息,并查找对应的预警修复策略,对上述预警进行修复;当监测到与故障关联的***参数大于等于对应的故障阈值时,则生成故障消息并上报故障告警;同时根据上述故障消息,查找对应的故障修复策略,对上述故障进行修复。本发明最大限度地降低了网管***的故障发生概率,提高了故障修复速度。

Description

网管***中故障预防及智能修复方法和装置
技术领域
本发明涉及通信领域,尤其涉及一种网管***中故障预防及智能修复方法和装置。 
背景技术
现有的网管***的故障管理通常是在***发生故障后,通过告警的方式通知维护人员,由维护人员进行人工干预的方式解决故障。 
此种处理方式有以下几大缺点: 
1、总是要等到故障发生时才启动故障修复,给运营商带来运营损失; 
2、故障发生后,通过告警的方式通知网管,等到维护人员排查到故障时,设备的参数可能已经发生了变化,使得维护人员可能无法判断故障时到底发生了什么,因此也可能无法真正找到问题的原因; 
3、虽然发生故障后使用告警的方式通知了维护人员,但有可能维护人员不在办公区域,无法及时知道设备发生了故障,或者该设备未配备网管服务器,只能等到维护人员查询才能知道发生了故障。 
发明内容
本发明的目的是,提供一种网管***中故障预防及智能修复方法和装置,以改善现有网管***不能预防故障,更不能修复故障的缺陷。 
本发明提供了一种网管***中故障预防及智能修复方法,上述方法包括以下步骤: 
预先为网管***中与故障关联的***参数设置相应的预警阈值及故障阈值,同时设置对应的预警修复策略及故障修复策略; 
当监测到与故障关联的***参数大于等于对应的预警阈值而小于对应的故障阈值时,则生成预警消息,并查找对应的预警修复策略,根据上述预警修复策略对上述预警进行修复; 
当监测到与故障关联的***参数大于等于对应的故障阈值时,则生成故障消息并上报故障告警;同时根据上述故障消息,查找对应的故障修复策略,并根据上述故障修复策略对上述故障进行修复。 
优选地,上述方法还预先设置有对应的故障采集策略、预警重检测策略、故障重检测策略以及故障消息发送方式。 
优选地,上述根据所述故障消息,查找对应的故障修复策略,并根据上述故障修复策略对上述故障进行修复具体包括以下步骤: 
根据上述故障消息,查找对应的故障采集策略; 
根据上述故障采集策略,采集与上述故障相关的***参数; 
生成故障修复通知; 
根据上述故障修复通知,查找对应的故障修复策略; 
根据上述故障修复策略,对上述故障进行修复。 
优选地,上述方法还包括以下步骤: 
故障预警修复完成后,查找并执行对应的预警重检测策略,检测预警是否已消除,若是,则生成预警消除消息;否则,生成预警升级消息; 
故障修复完成后,查找并执行对应的故障重检测策略,检测故障是否已消除,若是,则生成故障消除消息并上报故障消除提示;否则,重新生成故障消息。 
优选地,上述方法在重新生成故障消息后,还执行以下步骤: 
根据上述故障消息,查找对应的故障消息发送方式,以上述故障消息发送方式上报上述故障消息。 
优选地,上述预警重检测策略为网管***中相应的健康检测策略。 
优选地,上述预警修复策略、故障修复策略、故障采集策略、预警重检测策略、故障重检测策略以及健康检测策略为上述网管***的内置脚本、用户自定义脚本或者消息事件。 
本发明进一步提供了一种网管***中故障预防及智能修复装置,上述装置包括故障检测模块、故障预防模块以及故障修复模块; 
上述故障监测模块,用于提供设置与故障关联的***参数的预警阈值及故障阈值的接口;以及监测与故障关联的***参数,并判断上述系 统参数与对应的预警阈值及故障阈值的大小;当上述***参数大于等于对应的预警阈值而小于对应的故障阈值时,生成预警消息,发送给上述故障预防模块;当监测到上述***参数大于等于对应的故障阈值时,生成故障消息并上报故障告警,同时将上述故障消息发送给上述故障修复模块; 
上述故障预防模块,用于提供设置预警修复策略的接口;以及根据收到的预警消息,查找对应的预警修复策略,并根据上述预警修复策略对上述预警进行修复; 
上述故障修复模块,用于提供设置故障修复策略的接口;以及根据收到的故障消息,查找对应的故障修复策略,并根据上述故障修复策略对上述故障进行修复。 
优选地,上述装置还包括故障采集模块以及故障消息发送模块, 
上述故障监测模块,用于将生成的故障消息发送给上述故障采集模块; 
上述故障采集模块,用于提供设置故障采集策略的接口;以及根据收到的故障消息,查找对应的故障采集策略,并根据上述故障采集策略,采集与上述故障相关的***参数,生成故障修复通知,发送给上述故障修复模块; 
上述故障修复模块,用于根据收到的故障修复通知,查找对应的故障修复策略,并根据上述故障修复策略对上述故障进行修复; 
上述故障消息发送模块,用于提供设置故障消息发送方式的接口;以及在收到故障消息时,查找对应的故障消息发送方式,并以上述故障消息发送方式上报上述故障消息。 
优选地,上述故障预防模块,用于提供设置预警重检测策略的接口;以及根据预警消息,查找对应的预警重检测策略,并根据上述预警重检测策略,检测预警是否已消除,并在预警消除时,生成预警消除消息,发送给上述故障监测模块;在预警未消除时,生成预警升级消息,发送给上述故障监测模块; 
上述故障修复模块,用于提供设置故障重检测策略的接口;以及故障修复通知,查找对应的故障重检测策略,并根据上述故障重检测策略, 检测故障是否已消除,并在故障消除时,生成故障消除消息,发送给上述故障监测模块;在故障未消除时,生成故障消息并发送给上述故障消息发送模块。 
优选地,上述故障监测模块,用于在生成预警消息的同时,判断是否在预设的第一时间内收到上述故障预防模块返回的预警消除消息;并在上述第一时间内收到上述故障预防模块返回的预警消除消息时,消除上述预警;以及在生成故障消息的同时,判断是否在预设的第二时间内收到上述故障修复模块返回的故障消除消息,并在上述第二时间内收到上述故障修复模块返回的故障消除消息时,上报故障消除提示。 
优选地,上述故障监测模块包括预警监控子模块和故障监控子模块,其中, 
上述预警监控子模块,用于在***参数大于等于对应的预警阈值而小于对应的故障阈值时,生成预警消息,发送给上述故障预防模块;以及判断是否在预设的第一时间内收到上述故障预防模块返回的预警消除消息,并在上述第一时间内收到上述故障预防模块返回的预警消除消息时,清除上述预警; 
上述故障监控子模块,用于在***参数大于等于对应的故障阈值时,生成故障消息并上报故障告警,同时将上述故障消息发送给上述故障采集模块;以及判断是否在预设的第二时间内收到上述故障修复模块返回的故障消除消息,并在上述第二时间内收到上述故障修复模块返回的故障消除消息时,上报故障消除提示。 
优选地,上述故障预防模块包括预警修复子模块及预警检测子模块;其中, 
上述预警修复子模块,用于根据预警消息,查找对应的预警修复策略,并根据上述预警修复策略对上述预警进行修复; 
上述预警检测子模块,用于根据预警消息,查找对应的预警重检测策略,并根据上述预警重检测策略检测预警是否已消除。 
优选地,上述故障修复模块包括智能修复子模块及故障检测子模块;其中, 
上述智能修复子模块,根据故障修复通知,查找对应的故障修复策 略,并根据上述故障修复策略对上述故障进行修复; 
上述故障检测子模块,用于故障修复通知,查找对应的故障重检测策略,并根据上述故障重检测策略检测故障是否已消除。 
本发明使得网管***在预警或者故障发生时,可先自行进行修复,最大限度的降低了网管***的故障发生概率,降低运营商的运营成本;只有在网管***不能够自行修复时,才进行人工干预,显著减少了人工干预的次数,降低了运营风险,提高了故障修复速度。 
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中: 
图1是本发明网管***中故障预防及智能修复装置优选实施例的原理框图; 
图2是本发明网管***中故障预防及智能修复方法的故障监测部分的优选实施例的流程图; 
图3是本发明网管***中故障预防及智能修复方法的预警修复部分的优选实施例的流程图; 
图4是本发明网管***中故障预防及智能修复方法的故障采集部分的优选实施例的流程图。 
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图和实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。 
如图1所示,是本发明网管***中故障预防及智能修复装置优选实施例的原理框图,本实施例包括故障检测模块10、故障预防模块20、故障采集模块30、故障修复模块40以及故障消息发送模块50;其中, 
故障监测模块10,用于提供设置与故障关联的***参数的预警阈值 及故障阈值的接口;以及监测与故障关联的***参数,并判断上述***参数与对应的预警阈值及故障阈值的大小;当上述***参数大于等于对应的预警阈值而小于对应的故障阈值时,生成预警消息,发送给故障预防模块20,并判断故障预防模块20是否在预设的第一时间内返回预警消除消息,在上述第一时间内收到故障预防模块20返回的预警消除消息时,清除预警;当监测到上述***参数大于等于对应的故障阈值时,生成故障消息并上报故障告警,同时将上述故障消息发送给故障采集模块30,并判断故障修复模块40是否在预设的第二时间内返回故障消除消息,在上述第二时间内收到故障预防模块40返回的预警消除消息时,上报故障消除提示;故障监测模块10包括预警监控子模块11和故障监控子模块12; 
预警监控子模块11,用于在***参数大于等于对应的预警阈值而小于对应的故障阈值时,生成预警消息,发送给故障预防模块20,并判断故障预防模块20是否在预设的第一时间内返回预警消除消息,在上述第一时间内收到故障预防模块20返回的预警消除消息时,清除预警; 
故障监控子模块12,用于在***参数大于等于对应的故障阈值时,生成故障消息并上报故障告警,同时将上述故障消息发送给故障采集模块30,并判断故障修复模块40是否在预设的第二时间内返回故障消除消息,在上述第二时间内收到故障预防模块40返回的预警消除消息时,上报故障消除提示; 
故障预防模块20,用于提供设置预警修复策略、预警重检测策略的接口;以及根据收到的预警消息,查找对应的预警修复策略、预警重检测策略,并根据上述预警修复策略对上述预警进行修复;根据上述预警重检测策略,检测预警是否已消除,在预警消除时,生成预警消除消息,发送给故障监测模块10;在预警未消除时,生成预警升级消息,发送给故障监测模块10;故障预防模块20包括预警修复子模块21及预警检测子模块22; 
预警修复子模块21,用于根据预警消息,查找对应的预警修复策略,并根据上述预警修复策略对上述预警进行修复; 
预警检测子模块22,用于根据预警消息,查找对应的预警重检测策 略,并根据上述预警重检测策略检测预警是否已消除; 
故障采集模块30,用于提供设置故障采集策略的接口;以及根据收到的故障消息,查找对应的故障采集策略,并根据上述故障采集策略,采集与上述故障相关的***参数,生成故障修复通知,发送给故障修复模块40; 
故障修复模块40,用于提供设置故障修复策略、故障重检测策略的接口;以及根据收到的故障修复通知,查找对应的故障修复策略、故障重检测策略,并根据上述故障修复策略对上述故障进行修复;根据上述故障重检测策略,检测故障是否已消除,并在故障消除时,生成故障消除消息,发送给故障监测模块10;在故障未消除时,生成故障消息并发送给故障消息发送模块50;故障修复模块40包括智能修复子模块41及故障检测子模块42; 
智能修复子模块41,用于查找对应的故障修复策略,并根据上述故障修复策略对上述故障进行修复; 
故障检测子模块42,用于查找对应的故障重检测策略,并根据上述故障重检测策略检测故障是否已消除; 
故障消息发送模块50,用于提供设置故障消息发送方式的接口;以及在收到故障消息时,查找对应的故障消息发送方式,并以上述故障消息发送方式上报上述故障消息。 
根据本发明网管***中故障预防及智能修复装置的原理框图,可将本发明的网管***中故障预防及智能修复方法分为6个部分,分别为:策略预设部分、故障监测部分、预警修复部分、故障采集部分、故障修复部分以及故障消息上报部分,以下结合具体实施例,对本发明的网管***中故障预防及智能修复方法进行详细说明。 
策略预设部分具体为:预先为网管***中与故障关联的***参数设置相应的预警阈值及故障阈值,同时设置对应的预警修复策略、故障修复策略、故障采集策略、预警重检测策略、故障重检测策略以及故障消息发送方式;结合图1,其中,预警阈值、故障阈值设置在故障监测模块10中,预警修复策略、预警重检测策略设置在故障预防模块20中,故障采集策略设置在故障采集模块30中,故障修复策略、故障重检测策 略设置在故障修复模块40中,故障消息发送方式设置在故障消息发送模块50中。 
本发明中,预警重检测策略可以采用网管***中相应的健康检测策略;且预警修复策略、故障修复策略、故障采集策略、预警重检测策略、故障重检测策略可以以内置脚本、用户自定义脚本或者消息事件的形式设置于网管***中。 
如图2所示,是本发明网管***中故障预防及智能修复方法的故障监测部分的优选实施例的流程图,本部分由故障监测模块10执行,包括以下步骤: 
步骤S001:故障监测模块10监测与故障关联的***参数; 
步骤S002:判断上述***参数与对应的预警阈值的大小,若小于上述预警阈值,则执行步骤S001;否则,执行步骤S003; 
步骤S003:判断上述***参数与对应的故障阈值的大小,若小于上述故障阈值,则执行步骤S004;否则,执行步骤S007; 
步骤S004:生成预警消息,发送给故障预防模块20; 
步骤S005:判断在预设的第一时间T1内是否收到故障预防模块20返回预警消除消息,若是,则执行步骤S006;否则,结束; 
步骤S006:消除预警,转入步骤S001执行; 
步骤S007:生成故障消息,发送给故障采集模块03; 
步骤S008:判断在预设的第二时间T2内是否收到故障修复模块40返回的故障消除消息,若是,则执行步骤S009;否则,结束; 
步骤S009:上报故障消除提示,转入步骤S001执行。 
如图3所示,是本发明网管***中故障预防及智能修复方法的预警修复部分的优选实施例的流程图,本部分由故障预防模块20执行,包括以下步骤: 
步骤S101:故障预防模块20收到预警消息; 
步骤S102:根据预警消息,查找对应的预警修复策略及预警重检测策略; 
本步骤中,预警重检测策略,也可以是***中对应的健康检测策略,若选择用健康检测策略来检测预警是否消除,则当检测到***健康时, 表明预警已修复,当检测到***不健康时,则表明预警并未修复; 
步骤S103:根据上述预警修复策略,对上述预警进行修复; 
步骤S104:根据上述预警重检测策略,检测预警是否消除,若是,则执行步骤S105;否则,执行步骤S106; 
步骤S105:生成预警消除消息,发送给故障监测模块10,结束; 
步骤S106:生成预警升级消息,发送给故障监测模块10,结束。 
以下是本部分的三个实例: 
实例一:配置某接口收包速率的预警阈值为每秒1万个包,预警修复策略为用户自定义脚本,预警重检测策略为***内的接口健康检测策略,该接口健康检测策略为***内置脚本;在***运行中该接口的收包速度若超过该预警阈值,则触发故障预警;根据预警修复策略,对该接口在前一段时间收到的包进行分析,对其中流量最大的包进行限速,限速时间可以自定义,在限速时间过后,再根据健康检测策略对该接口的收包速度进行检测,若在一段时间内收包速率低于预警阈值,则预警消除,否则预警升级。 
实例二:配置***的整体CPU占用率的预警阈值为60%,预警修复策略为***内置脚本,预警重检测策略为***内置脚本形式的CPU健康检测策略;在***运行中整体CPU占用率超过了60%,则触发故障预警;对***中CPU占用最高的几个进程进行调度优先级暂时降低(***至关重要的进程除外),在等待预设时间后,对***的整体CPU占用率进行统计,若低于预警阈值,则取消故障预警,若仍高于预警阈值,则触发预警升级; 
实例三:配置***的整体内存占用率的预警阈值为75%,预警修复策略为***内置程序,预警重检测策略为***内置脚本形式的内存健康检测策略。在***运行中整体的内存占用率超过75%,则触发故障预警;及触发预警修复策略,本例中,预警修复策略为垃圾收集程序,对***中未被引用但未释放的内存进行清理,在垃圾收集程序运行结束后,再对***整体的内存占用率进行检测,若低于预警阈值,则取消故障预警,否则预警升级。 
如图4所示,是本发明网管***中故障预防及智能修复方法的故障 采集部分的优选实施例的流程图,本部分由故障采集模块30执行,包括以下步骤: 
步骤S201:故障采集模块30收到故障消息; 
步骤S202:根据故障消息,查找对应的故障采集策略; 
步骤S203:根据上述故障采集策略,采集与上述故障相关的***参数; 
步骤S204:生成故障修复通知,发送给故障修复模块40,结束。 
以下是本发明网管***中故障预防及智能修复方法的故障修复部分的优选实施例,本部分由故障修复模块40执行,包括以下步骤: 
步骤S301:故障修复模块40收到故障修复通知; 
步骤S302:根据上述故障修复通知,查找对应的故障修复策略及故障重检测策略; 
步骤S303:根据上述故障修复策略,对上述故障进行修复; 
步骤S304:根据上述故障重检测策略,检测故障是否已消除,若是,则执行步骤S305;否则,执行步骤S306; 
步骤S305:生成故障消除消息,发送给故障监测模块10,结束; 
步骤S306:生成故障消息,发送给故障消息发送模块50,结束。 
以下是本发明网管***中故障预防及智能修复方法的故障消息上报部分的优选实施例,本部分由故障消息发送模块50执行,包括以下步骤: 
步骤S401:故障消息发送模块50收到故障消息; 
步骤S402:根据上述故障消息,查找对应的故障消息发送方式; 
步骤S403:以上述故障消息发送方式上报上述故障消息。 
上述说明示出并描述了本发明的优选实施例,但如前所述,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。 

Claims (14)

1.一种网管***中故障预防及智能修复方法,其特征在于,所述方法包括以下步骤:
预先为网管***中与故障关联的***参数设置相应的预警阈值及故障阈值,同时设置对应的预警修复策略及故障修复策略;
当监测到与故障关联的***参数大于等于对应的预警阈值而小于对应的故障阈值时,则生成预警消息,并查找对应的预警修复策略,根据所述预警修复策略对所述预警进行修复;
当监测到与故障关联的***参数大于等于对应的故障阈值时,则生成故障消息并上报故障告警;同时根据所述故障消息,查找对应的故障修复策略,并根据所述故障修复策略对所述故障进行修复。
2.根据权利要求1所述的方法,其特征在于,所述方法还预先设置有对应的故障采集策略、预警重检测策略、故障重检测策略以及故障消息发送方式。
3.根据权利要求2所述的方法,其特征在于,所述根据所述故障消息,查找对应的故障修复策略,并根据所述故障修复策略对所述故障进行修复具体包括以下步骤:
根据所述故障消息,查找对应的故障采集策略;
根据所述故障采集策略,采集与所述故障相关的***参数;
生成故障修复通知;
根据所述故障修复通知,查找对应的故障修复策略;
根据所述故障修复策略,对所述故障进行修复。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括以下步骤:
故障预警修复完成后,查找并执行对应的预警重检测策略,检测预警是否已消除,若是,则生成预警消除消息;否则,生成预警升级消息;
故障修复完成后,查找并执行对应的故障重检测策略,检测故障是否已消除,若是,则生成故障消除消息并上报故障消除提示;否则,重新生成故障消息。
5.根据权利要求4所述的方法,其特征在于,所述方法在重新生成故障消息后,还执行以下步骤:
根据所述故障消息,查找对应的故障消息发送方式,以所述故障消息发送方式上报所述故障消息。
6.根据权利要求2所述的方法,其特征在于,所述预警重检测策略为网管***中相应的健康检测策略。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述预警修复策略、故障修复策略、故障采集策略、预警重检测策略、故障重检测策略以及健康检测策略为所述网管***的内置脚本、用户自定义脚本或者消息事件。
8.一种网管***中故障预防及智能修复装置,其特征在于,所述装置包括故障检测模块、故障预防模块以及故障修复模块;
所述故障监测模块,用于提供设置与故障关联的***参数的预警阈值及故障阈值的接口;以及监测与故障关联的***参数,并判断所述***参数与对应的预警阈值及故障阈值的大小;当所述***参数大于等于对应的预警阈值而小于对应的故障阈值时,生成预警消息,发送给所述故障预防模块;当监测到所述***参数大于等于对应的故障阈值时,生成故障消息并上报故障告警,同时将所述故障消息发送给所述故障修复模块;
所述故障预防模块,用于提供设置预警修复策略的接口;以及根据收到的预警消息,查找对应的预警修复策略,并根据所述预警修复策略对所述预警进行修复;
所述故障修复模块,用于提供设置故障修复策略的接口;以及根据收到的故障消息,查找对应的故障修复策略,并根据所述故障修复策略对所述故障进行修复。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括故障采集模块以及故障消息发送模块,
所述故障监测模块,用于将生成的故障消息发送给所述故障采集模块;
所述故障采集模块,用于提供设置故障采集策略的接口;以及根据收到的故障消息,查找对应的故障采集策略,并根据所述故障采集策略,采集与所述故障相关的***参数,生成故障修复通知,发送给所述故障修复模块;
所述故障修复模块,用于根据收到的故障修复通知,查找对应的故障修复策略,并根据所述故障修复策略对所述故障进行修复;
所述故障消息发送模块,用于提供设置故障消息发送方式的接口;以及在收到故障消息时,查找对应的故障消息发送方式,并以所述故障消息发送方式上报所述故障消息。
10.根据权利要求9所述的装置,其特征在于,
所述故障预防模块,用于提供设置预警重检测策略的接口;以及根据预警消息,查找对应的预警重检测策略,并根据所述预警重检测策略,检测预警是否已消除,并在预警消除时,生成预警消除消息,发送给所述故障监测模块;在预警未消除时,生成预警升级消息,发送给所述故障监测模块;
所述故障修复模块,用于提供设置故障重检测策略的接口;以及故障修复通知,查找对应的故障重检测策略,并根据所述故障重检测策略,检测故障是否已消除,并在故障消除时,生成故障消除消息,发送给所述故障监测模块;在故障未消除时,生成故障消息并发送给所述故障消息发送模块。
11.根据权利要求8所述的装置,其特征在于,所述故障监测模块,用于在生成预警消息的同时,判断是否在预设的第一时间内收到所述故障预防模块返回的预警消除消息;并在所述第一时间内收到所述故障预防模块返回的预警消除消息时,消除所述预警;以及在生成故障消息的同时,判断是否在预设的第二时间内收到所述故障修复模块返回的故障消除消息,并在所述第二时间内收到所述故障修复模块返回的故障消除消息时,上报故障消除提示。
12.根据权利要求8、9或11任一项所述的装置,其特征在于,所述故障监测模块包括预警监控子模块和故障监控子模块,其中,
所述预警监控子模块,用于在***参数大于等于对应的预警阈值而小于对应的故障阈值时,生成预警消息,发送给所述故障预防模块;以及判断是否在预设的第一时间内收到所述故障预防模块返回的预警消除消息,并在所述第一时间内收到所述故障预防模块返回的预警消除消息时,清除所述预警;
所述故障监控子模块,用于在***参数大于等于对应的故障阈值时,生成故障消息并上报故障告警,同时将所述故障消息发送给所述故障采集模块;以及判断是否在预设的第二时间内收到所述故障修复模块返回的故障消除消息,并在所述第二时间内收到所述故障修复模块返回的故障消除消息时,上报故障消除提示。
13.根据权利要求10所述的装置,其特征在于,所述故障预防模块包括预警修复子模块及预警检测子模块;其中,
所述预警修复子模块,用于根据预警消息,查找对应的预警修复策略,并根据所述预警修复策略对所述预警进行修复;
所述预警检测子模块,用于根据预警消息,查找对应的预警重检测策略,并根据所述预警重检测策略检测预警是否已消除。
14.根据权利要求9或10任一项所述的装置,其特征在于,所述故障修复模块包括智能修复子模块及故障检测子模块;其中,
所述智能修复子模块,根据故障修复通知,查找对应的故障修复策略,并根据所述故障修复策略对所述故障进行修复;
所述故障检测子模块,用于故障修复通知,查找对应的故障重检测策略,并根据所述故障重检测策略检测故障是否已消除。
CN201210185225XA 2012-06-07 2012-06-07 网管***中故障预防及智能修复方法和装置 Pending CN102857365A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210185225XA CN102857365A (zh) 2012-06-07 2012-06-07 网管***中故障预防及智能修复方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210185225XA CN102857365A (zh) 2012-06-07 2012-06-07 网管***中故障预防及智能修复方法和装置

Publications (1)

Publication Number Publication Date
CN102857365A true CN102857365A (zh) 2013-01-02

Family

ID=47403574

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210185225XA Pending CN102857365A (zh) 2012-06-07 2012-06-07 网管***中故障预防及智能修复方法和装置

Country Status (1)

Country Link
CN (1) CN102857365A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103227662A (zh) * 2013-04-25 2013-07-31 广东电网公司电力调度控制中心 一种基于状态控制的电力通信设备安全检测方法及***
CN103426062A (zh) * 2013-08-19 2013-12-04 上海欧显信息科技有限公司 一种故障分级及***维护的方法
WO2014129983A1 (en) * 2013-02-21 2014-08-28 Thai Oil Public Company Limited Methods, systems, and devices for managing a plurality of alarms
CN104199755A (zh) * 2014-08-25 2014-12-10 广东欧珀移动通信有限公司 一种基于指示灯诊断硬件模块故障的方法及***
CN104639346A (zh) * 2013-11-06 2015-05-20 中兴通讯股份有限公司 通信运营商网管设备的检测方法及装置
CN107294786A (zh) * 2017-07-13 2017-10-24 郑州云海信息技术有限公司 一种故障信息处理方法及装置
CN108234196A (zh) * 2017-12-12 2018-06-29 北京奇艺世纪科技有限公司 故障检测方法及装置
CN108322345A (zh) * 2018-02-07 2018-07-24 平安科技(深圳)有限公司 一种故障修复数据包的发布方法及服务器
CN108712283A (zh) * 2018-05-10 2018-10-26 国网江西省电力有限公司信息通信分公司 信息***中基于资源关联关系的故障预警方法和装置
WO2019052474A1 (zh) * 2017-09-12 2019-03-21 中兴通讯股份有限公司 音频***管理方法、装置、设备以及存储介质
CN109753893A (zh) * 2018-12-20 2019-05-14 广州航天海特***工程有限公司 轨道沿线视频检测方法、***、计算机设备及存储介质
CN109936477A (zh) * 2019-03-12 2019-06-25 北京百度网讯科技有限公司 用于发送信息的方法和装置
CN111400087A (zh) * 2020-02-26 2020-07-10 深圳震有科技股份有限公司 一种操作***的控制方法、终端以及存储介质
CN112748677A (zh) * 2019-10-29 2021-05-04 深圳市帝迈生物技术有限公司 一种终端设备及其故障处理方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101136799A (zh) * 2007-09-20 2008-03-05 中兴通讯股份有限公司 一种实现通讯设备故障集中告警处理的方法
CN101179440A (zh) * 2007-12-03 2008-05-14 中兴通讯股份有限公司 一种通信***的远程预警实现方法及其***
CN101201786A (zh) * 2006-12-13 2008-06-18 中兴通讯股份有限公司 一种故障日志监控方法及装置
CN101222742A (zh) * 2007-11-22 2008-07-16 ***通信集团山东有限公司 移动通信网管***中告警自定位和自处理的方法及***
CN101409637A (zh) * 2008-11-20 2009-04-15 浪潮通信信息***有限公司 一种通信网管***中的告警交互式自动处理方法
CN101605346A (zh) * 2008-06-10 2009-12-16 中兴通讯股份有限公司 故障修复方法和装置
CN101800675A (zh) * 2010-02-25 2010-08-11 华为技术有限公司 故障监控方法、监控设备及通信***

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101201786A (zh) * 2006-12-13 2008-06-18 中兴通讯股份有限公司 一种故障日志监控方法及装置
CN101136799A (zh) * 2007-09-20 2008-03-05 中兴通讯股份有限公司 一种实现通讯设备故障集中告警处理的方法
CN101222742A (zh) * 2007-11-22 2008-07-16 ***通信集团山东有限公司 移动通信网管***中告警自定位和自处理的方法及***
CN101179440A (zh) * 2007-12-03 2008-05-14 中兴通讯股份有限公司 一种通信***的远程预警实现方法及其***
CN101605346A (zh) * 2008-06-10 2009-12-16 中兴通讯股份有限公司 故障修复方法和装置
CN101409637A (zh) * 2008-11-20 2009-04-15 浪潮通信信息***有限公司 一种通信网管***中的告警交互式自动处理方法
CN101800675A (zh) * 2010-02-25 2010-08-11 华为技术有限公司 故障监控方法、监控设备及通信***

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10127799B2 (en) 2013-02-21 2018-11-13 Thai Oil Public Company Limited Methods, systems, and devices for managing, reprioritizing, and suppressing initiated alarms
WO2014129983A1 (en) * 2013-02-21 2014-08-28 Thai Oil Public Company Limited Methods, systems, and devices for managing a plurality of alarms
US9633552B2 (en) 2013-02-21 2017-04-25 Thai Oil Public Company Limited Methods, systems, and devices for managing, reprioritizing, and suppressing initiated alarms
US9697722B2 (en) 2013-02-21 2017-07-04 Thai Oil Public Company Limited Methods, systems, and devices for managing a plurality of alarms
CN103227662B (zh) * 2013-04-25 2016-06-01 广东电网公司电力调度控制中心 一种基于状态控制的电力通信设备安全检测方法及***
CN103227662A (zh) * 2013-04-25 2013-07-31 广东电网公司电力调度控制中心 一种基于状态控制的电力通信设备安全检测方法及***
CN103426062A (zh) * 2013-08-19 2013-12-04 上海欧显信息科技有限公司 一种故障分级及***维护的方法
CN104639346A (zh) * 2013-11-06 2015-05-20 中兴通讯股份有限公司 通信运营商网管设备的检测方法及装置
CN104199755A (zh) * 2014-08-25 2014-12-10 广东欧珀移动通信有限公司 一种基于指示灯诊断硬件模块故障的方法及***
CN104199755B (zh) * 2014-08-25 2017-08-08 广东欧珀移动通信有限公司 一种基于指示灯诊断硬件模块故障的方法及***
CN107294786A (zh) * 2017-07-13 2017-10-24 郑州云海信息技术有限公司 一种故障信息处理方法及装置
WO2019052474A1 (zh) * 2017-09-12 2019-03-21 中兴通讯股份有限公司 音频***管理方法、装置、设备以及存储介质
CN108234196A (zh) * 2017-12-12 2018-06-29 北京奇艺世纪科技有限公司 故障检测方法及装置
CN108322345A (zh) * 2018-02-07 2018-07-24 平安科技(深圳)有限公司 一种故障修复数据包的发布方法及服务器
CN108322345B (zh) * 2018-02-07 2020-08-21 平安科技(深圳)有限公司 一种故障修复数据包的发布方法及服务器
CN108712283A (zh) * 2018-05-10 2018-10-26 国网江西省电力有限公司信息通信分公司 信息***中基于资源关联关系的故障预警方法和装置
CN109753893A (zh) * 2018-12-20 2019-05-14 广州航天海特***工程有限公司 轨道沿线视频检测方法、***、计算机设备及存储介质
CN109936477A (zh) * 2019-03-12 2019-06-25 北京百度网讯科技有限公司 用于发送信息的方法和装置
CN112748677A (zh) * 2019-10-29 2021-05-04 深圳市帝迈生物技术有限公司 一种终端设备及其故障处理方法
CN112748677B (zh) * 2019-10-29 2022-09-30 深圳市帝迈生物技术有限公司 一种终端设备及其故障处理方法
CN111400087A (zh) * 2020-02-26 2020-07-10 深圳震有科技股份有限公司 一种操作***的控制方法、终端以及存储介质
CN111400087B (zh) * 2020-02-26 2023-08-11 深圳震有科技股份有限公司 一种操作***的控制方法、终端以及存储介质

Similar Documents

Publication Publication Date Title
CN102857365A (zh) 网管***中故障预防及智能修复方法和装置
US8526299B2 (en) Method and device for processing cell out-of-service failures
US9009523B2 (en) Method and apparatus for isolating a fault in a controller area network
CN109698734B (zh) 基于goose双网接收机制的异常判断方法
CN106301544B (zh) 光网络单元onu掉电告警信息的处理方法及装置
US9071513B2 (en) Path switch-back method and apparatus in transport network
EP2622792A1 (en) Method for determining a severity of a network incident
CN103944746A (zh) 一种双机热备的方法及装置
CN104062967A (zh) 启停***的故障诊断方法及装置
CN106789445A (zh) 一种广电网络中网络设备的状态轮询方法和***
CN104104542B (zh) 一种基于rs485的实时智能排障方法
CN102143011B (zh) 一种实现网络保护的装置及方法
US9132550B2 (en) Apparatus and method for managing robot components
CN102281103A (zh) 基于模糊集合解算的光网络多故障恢复方法
CN105743565A (zh) 一种光传送网的保护倒换方法及装置
CN101841838A (zh) 逻辑链路告警的处理方法和装置
CN101924661A (zh) 告警的处理方法及装置
CN103457755B (zh) 一种iec 61850***通信故障检测的方法及***
CN105323104A (zh) 告警管理方法、装置及分组传送设备
CN104754562A (zh) 数据复制异常的修复方法及装置
CN104348676B (zh) 一种基于操作管理维护oam的链路检测方法及设备
CN108259082B (zh) 保护倒换的方法及控制业务板
CN104994528B (zh) 一种回应策略请求的方法及装置
CN103684862A (zh) 告警消息的处理方法、装置、***以及设备
WO2014040470A1 (zh) 告警消息的处理方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20130102