CN102546216B - 网络管理***中的告警消息处理方法及网络管理*** - Google Patents

网络管理***中的告警消息处理方法及网络管理*** Download PDF

Info

Publication number
CN102546216B
CN102546216B CN201010614941.6A CN201010614941A CN102546216B CN 102546216 B CN102546216 B CN 102546216B CN 201010614941 A CN201010614941 A CN 201010614941A CN 102546216 B CN102546216 B CN 102546216B
Authority
CN
China
Prior art keywords
alarm
alarm information
queue
class
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201010614941.6A
Other languages
English (en)
Other versions
CN102546216A (zh
Inventor
宋春咏
李渝燕
陈刚
刘轶苏
王呈雪
林琳
胡立全
马英香
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Group Shandong Co Ltd
Original Assignee
China Mobile Group Shandong Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Group Shandong Co Ltd filed Critical China Mobile Group Shandong Co Ltd
Priority to CN201010614941.6A priority Critical patent/CN102546216B/zh
Publication of CN102546216A publication Critical patent/CN102546216A/zh
Application granted granted Critical
Publication of CN102546216B publication Critical patent/CN102546216B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种网络管理***中的告警消息处理方法及***,涉及通信网络领域中的网络管理技术领域,包括:将采集到的网元设备的告警消息,缓存到与所述告警消息的类型对应的告警队列中;并对各告警队列中分别缓存的不同类型的告警消息进行并行处理。采用本发明实施例提供的方案,实现了对告警消息的分类处理,并避免了因某一类的待处理的告警消息的积压导致其它类的告警消息无法得到及时的处理。

Description

网络管理***中的告警消息处理方法及网络管理***
技术领域
本发明涉及通信网络领域中的网络管理技术领域,尤其涉及一种网络管理***中的告警消息处理方法及网络管理***。
背景技术
通信网络的特点是规模大、结构复杂、异构性、高度分布。在网络管理技术领域,故障被定义为产生功能异常的原因。故障是产生告警的原因,告警消息是特定的事件发生时,被管对象发出的事件通知,用于传递告警信息。
无论是早期的国际电信联盟ITU提出的TMN(Telecom ManagementNetwork,电信管理网)规范,还是后来3GPP(3rd Generation Partnership Project,第三代合作伙伴计划)提出的通信网络管理接口定义,都对网元设备侧和网络管理***侧的告警数据接口进行了规范。通常各通信设备厂家提供的原始告警信息包括:网元名称、告警标题、告警级别、设备厂家、告警正文、发生时间等信息,通信网管***根据需要进行细分、重定义或直接使用。
现有的告警消息的处理流程如图1所示,包括:
步骤S101、告警信息采集步骤:从网元设备上采集原始告警信息,并生成携带告警信息的告警消息。
步骤S102、告警消息过滤步骤:将采集到的各告警消息中的无效或无用告警消息进行简单的过滤,具体的过滤规则一般可以根据业务需要制定。
步骤S103、告警消息处理步骤:将告警消息中的原始告警信息进行翻译、规范,以及告警消息关联定位和告警消息派单等操作。通过对告警消息的处理,例如通过交易中间件或者其他中间件的方式进行处理,可以将各厂家的原始告警信息进行规范和二次处理,从而形成符合日常告警监控人员习惯和需要的告警信息,实现尽量消除厂家差异的集中监控。本步骤是告警消息处理的核心步骤。
步骤S104、告警信息的呈现:将对告警消息处理后得到的处理结果,如规范后的各告警信息,呈现给告警监控人员。具体可以通过处理界面的形式进行呈现,供告警监控人员了解告警信息,以实现进一步针对该告警的后续处理。
由于告警信息是通信网络管理中最基本的也是最重要的信息类型之一,所以告警监控和对告警消息的处理就越发的非常重要。然而,当网络发生大量的设备维护(如网络扩容或者割接)或设备故障中断时,就会在短时间内出现大量的告警,其数量大大超出平时的告警数量。
根据通信网络管理监控的实际情况,业内普遍认可的告警消息处理能力要求为:
告警消息平均处理时延的要求:告警平均处理时延<=20秒;
告警消息平均处理时延=SUM(告警入库时间-告警接收时间)/网管***入库告警消息的数量;
***峰值处理能力的要求:***峰值处理能力>=5条/万TPCC/秒;
峰值处理能力[条数/TPCC/秒]=告警消息总数量/TPCC值/总耗时(秒)。
当短时间内出现大量的告警,使得有大量的告警消息需要处理时,则由于网络管理***处理告警消息的能力的限制,出现无法满足上述处理要求的情况,从而影响到网络管理***正常的告警监控和告警消息处理时,即认定发生“告警风暴”。
一般情况下,对于上述图1所示的告警消息的处理流程,在告警信息采集步骤,可以通过分布式部署、分区域采集的方式来实现负荷分担,并且在该步骤的处理逻辑比较简单,仅进行基本的数据拆分,在实际中极少在这一步骤出现处理任务的积压。
通过简单的告警消息过滤步骤,可以在平时告警消息数量相对正常的情况下满足告警消息处理的及时性和准确性要求,但是一旦出现“告警风暴”,面对短时间内大量告警消息的冲击,将在告警消息处理步骤,出现大量待处理的告警消息的积压,严重降低了告警消息的处理效率和及时性。
目前现有技术中,针对“告警风暴”情况的处理,可以通过丢弃采集到的告警消息,或者通过减少采集告警信息的频次,减少需要处理的告警消息的数量,缓解告警消息处理的压力,但可能导致对突发故障的告警失去监控,降低了对告警监控的完整性,同时会影响监控人员的监控和后续的分析定位;还可以通过增加处理告警消息的处理资源,以提高对告警消息处理的效率,但是在未出现“告警风暴”情况时,大量处理资源的闲置导致处理资源的利用率较低;并且,在“告警风暴”情况发生时,还可以由于待处理的告警消息的积压,导致严重故障引起的告警消息无法得到及时处理,进而使得由于未及时监控到严重故障引起的告警,而未能及时对严重故障进行处理,导致整个通信网络的性能下降。
发明内容
本发明实施例提供一种网络管理***中的告警消息处理方法及网络管理***,用以实现对告警消息的分类处理,以避免因某一类的待处理的告警消息的积压导致其它类的告警消息无法得到及时的处理。
本发明实施例提供一种网络管理***中的告警消息处理方法,包括:
将采集到的网元设备的告警消息,缓存到与所述告警消息的类型对应的告警队列中;
对各告警队列中分别缓存的不同类型的告警消息进行并行处理。
本发明实施例还提供一种处理告警消息的网络管理***,包括:
告警接收缓存装置,用于将采集到的网元设备的告警消息,缓存到与所述告警消息的类型对应的告警队列中;
告警处理装置,应用于对各告警队列中分别缓存的不同类型的告警消息进行并行处理。
本发明实施例提供的方法中,对于采集到的网元设备的告警消息,按照告警消息的类型的不同,分别缓存到与其类型对应的告警队列中,并对各告警队列中分别缓存的不同类型的告警消息进行并行处理。从而实现了对告警消息的分类处理,进而当某一类的待处理的告警消息较多时,并不会影响对其它类的告警消息的及时处理;并且,通过对各告警队列中的告警消息进行并行处理,提高了处理告警消息的效率。
附图说明
图1为现有技术中的告警消息的处理流程图;
图2为本发明实施例中提供的网络管理***中的告警消息处理方法的流程图;
图3为本发明实施例1中提供的告警消息处理方法的流程图;
图4为本发明实施例2中提供的告警消息处理方法的流程图;
图5为本发明实施例3中提供的告警消息处理方法的流程图;
图6为本发明实施例4中提供的告警消息处理方法的流程图;
图7为本发明实施例5中提供的处理告警消息的网络管理***的结构示意图。
具体实施方式
为了给出实现对告警消息的分类处理,以避免因某一类的待处理的告警消息的积压导致其它类的告警消息无法得到及时的处理的方案,本发明实施例提供了一种网络管理***中的告警消息处理方法及网络管理***,以下结合说明书附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
本发明实施例提供一种网络管理***中的告警消息处理方法,如图2所示,包括:
步骤S201、将采集到的网元设备的告警消息,缓存到与所述告警消息的类型对应的告警队列中。
步骤S202、对各告警队列中分别缓存的不同类型的告警消息进行并行处理。
下面结合附图,用具体实施例对本发明提供的方法和相应***进行详细描述。
实施例1:
基于对目前网络管理***中采集到的告警消息的分析发现,在对通信网络中的某一干线进行工程处理时,例如,工程建设和工程调试等,由于涉及到较多网元设备的改动,所以将采集到大量这些网元设备的告警信息,导致出现大量相关的告警消息需要进行处理,可将这些告警消息称作工程类告警消息,工程类告警消息也是目前通信网络中出现“告警风暴”情况的一个重要原因。
工程类告警消息在短时间内的急剧增加,将导致对告警消息处理的整体效率的降低,并且影响了对其它类告警消息的及时处理。
所以,本发明实施例1中提出将工程类告警消息与非工程类告警消息进行分类并行处理的方案,如图3所示,具体包括:
步骤S301、从网元设备上采集原始告警信息,并生成携带告警信息的告警消息。
步骤S302、判断采集到的告警消息是否为工程类告警消息,如果是,进入步骤S303,否则,进入步骤S304。
本实施例1中,考虑到目前通信网络中在进行工程处理时,每个工程所涉及的网元设备是可预知的,并且,在采集的告警消息中均会携带产生告警的网元设备的标识,还可能携带产生告警的网元设备的对端网元设备的标识,所以,本步骤中,可以预先设置该工程处理涉及的各网元设备的标识为指定网元设备标识,并在判断时,根据告警消息中是否携带指定网元设备标识,确定告警消息是否为工程类告警消息。
步骤S303、将工程类告警消息缓存到与工程类对应的告警队列中,具体还可以针对每个工程处理建立告警队列,将与每个工程处理相关的告警消息分别缓存到与该工程处理对应的告警队列中。
步骤S304、将非工程类告警消息缓存到与非工程类对应的告警队列中。
步骤S305、对与工程类对应的告警队列中的工程类告警消息和与非工程类对应的告警队列中的非工程类告警消息,进行并行处理。
具体可以将不同的告警队列部署在同一个处理服务器上,也可以分别部署在不同的告警服务器上。
本实施例1中,考虑到工程类告警消息是产生“报警风暴”的主要告警消息,所以,在对工程类告警消息进行处理时,为了提高处理效率,还可以采用动态负载均衡机制对工程类告警消息进行处理,即当与工程类对应的告警队列中的工程类告警消息的数量超过设定数量阈值时,增加处理工程类告警消息的处理资源,实现处理效率的提高。
步骤S306、将对告警消息的进行处理后得到的处理结果,呈现给告警监控人员。
上述实施例1提供的告警消息处理方法中,基于工程类告警消息是产生“告警风暴”的主要类型的告警消息,提出针对工程类告警消息和非工程类告警消息分类并行处理的方案,避免了因工程类告警消息的急剧增加,导致对非工程类告警消息的处理不够及时,并且,通过动态负载均衡机制,提高对工程类告警消息的处理效率,能够快速消除“告警风暴”。
实施例2:
基于对目前网络管理***中采集到的告警消息的分析发现,当通信网络中的某一网元设备出现重大故障时,则与该网元设备相关的各种业务处理任务由于处理异常,而产生大量的告警消息,例如,通信网络中的某一L局设备发生重大故障,则各地市均将产生大量的与该L局设备相关的告警消息,如目的信令点不可达告警,可将这些由于网元设备出现重大故障而产生的告警消息称作重大故障累告警消息,重大故障类告警消息也是目前通信网络中出现“告警风暴”情况的一个重要原因。
重大故障类告警消息在短时间内的急剧增加,将导致对该重大故障类告警消息处理的效率的降低,并且也影响了对其它类告警消息的及时处理。
所以,本发明实施例2中提出将重大故障类告警消息与非重大故障类告警消息进行分类并行处理的方案,如图4所示,具体包括:
步骤S401、从网元设备上采集原始告警信息,并生成携带告警信息的告警消息。
步骤S402、判断采集到的告警消息是否为重大故障类告警消息,如果是,进入步骤S403,否则,进入步骤S404。
本实施例2中,考虑到目前通信网络中大量的重大故障类告警消息一般都携带有发生故障的网元设备的标识,即均会携带相同网元设备标识,所以,本步骤中,可以通过对当前缓存有告警消息的非重大故障类告警队列中的告警消息中携带的网元设备标识进行分析,当当前缓存有告警消息的非重大故障类告警队列中携带某一相同网元设备标识的告警消息的数量超过第一设定数量阈值时,即可确定出该相同网元设备标识,从而基于该相同网元设备标识,对于后续采集到的告警消息的判断,则将携带该相同网元设备标识的告警消息,确定为重大故障类告警消息,对于未携带该相同网元设备标识的告警消息,确定为非重大故障类告警消息。
即上述判断步骤具体为:
当未确定出用于确定重大故障类告警消息的该相同网元设备标识时,将采集到的告警消息,确定为非重大故障类告警消息,以及当已确定出用于重大故障类告警消息的该相同网元设备标识时,将未携带该相同网元设备标识的告警消息,也确定为非重大故障类告警消息;
当已确定出用于重大故障类告警消息的该相同网元设备标识时,将携带该相同网元设备标识的告警消息,确定为重大故障类告警消息。
实质上,基于上述对工程类告警消息的分析可知,各工程类告警消息同样存在携带有某一相同网元设备标识的特点,所以,基于上述是否携带有确定出的该相同网元设备标识作为判断条件,所确定出的重大故障类告警消息,可能包括工程类告警消息,但本实施例2中将工程类告警消息归属为重大故障类告警消息,并不影响方案的实现和技术效果的获得。
步骤S403、将重大故障类告警消息缓存到与重大故障类对应的告警队列中。
具体还可以针对确定出的各相同网元设备标识分别建立对应的告警队列,将携带每个相同网元设备标识的告警消息,分别缓存到与该相同网元设备标识对应的告警队列中。通过对确定出的不同的该相同网元设备标识建立对应的告警队列,实质上,即实现了对工程类告警消息和重大故障类告警消息的分类并行处理。
较佳的,本步骤还可以包括:当确定出该相同网元设备标识时,即确定出重大故障类告警消息的判定条件时,还可以将当前缓存有告警消息的非重大故障类告警队列中携带该相同网元设备的告警消息,迁移到与重大故障类对应的告警队列中,并且可以将迁移的重大故障类告警消息排列在告警队列的前面,以便尽快得到处理。
步骤S404、将非重大故障类告警消息缓存到与非重大故障类对应的告警队列中。
步骤S405、对与重大故障类对应的告警队列中的重大故障类告警消息和与非重大故障类对应的告警队列中的非重大故障类告警消息,进行并行处理,即对各不同告警队列中的告警消息进行并行处理。
具体可以将不同的告警队列部署在同一个处理服务器上,也可以分别部署在不同的告警服务器上。
本实施例2中,考虑到重大故障类告警消息是产生“报警风暴”的主要告警消息,所以,在对重大故障类告警消息进行处理时,为了提高处理效率,还可以采用动态负载均衡机制对重大故障类告警消息进行处理,即当与重大故障类对应的告警队列中的重大故障类告警消息的数量超过第二设定数量阈值时,增加处理重大告警类告警消息的处理资源,实现处理效率的提高。
在处理重大故障类告警消息的同时,还可以判断当前与重大故障类对应的告警队列中的重大故障类告警消息的数量是否小于第三设定数量阈值,或者判断当前单位时间段内缓存到与重大故障类对应的告警队列中的告警消息的数量是否小于第四设定数量阈值,如果小于,则表示由该重大故障类告警消息引起的“告警风暴”情况已经消除,可以进入正常告警消息的处理环节,即更改上述步骤S402中对重大故障告警消息的判断条件,清除该相同网元设备标识,即对采集到的告警消息均确定为非重大故障类告警消息。
步骤S406、将对告警消息的进行处理后得到的处理结果,呈现给告警监控人员。
上述实施例2提供的告警消息处理方法中,基于重大故障类告警消息是产生“告警风暴”的主要类型的告警消息,提出针对重大故障类告警消息和非重大故障类告警消息分类并行处理的方案,提高了对重大故障类告警消息的处理的及时性,且还可以避免因重大故障类告警消息的急剧增加,导致对非重大故障类告警消息的处理不够及时,并且,通过动态负载均衡机制,可以进一步的提高对重大故障类告警消息的处理效率,快速消除“告警风暴”。
实施例3:
基于上述实施例1和实施例2中分别对工程类告警消息和重大故障类告警消息的分析可知,工程类告警消息和重大故障类告警消息为产生“告警风暴”的主要告警消息,所以,本发明实施例3提出将告警消息划分为重大故障类告警消息、工程类告警消息和其它告警消息(即非重大故障类也非工程类的告警消息),进行分类并行处理的方案,处理流程图为图5,具体包括:
步骤S501、从网元设备上采集原始告警信息,并生成携带告警信息的告警消息。
步骤S502、判断采集到的告警消息是否为重大故障类告警消息,如果是,进入步骤S503,否则,进入步骤S504。
基于上述实施例2中对重大故障类告警消息的分析,且为了区分重大故障类告警消息和工程类告警消息,上述判断步骤具体可以如下:
对于上述实施例2中步骤S402中,通过判断当前缓存有告警消息的非重大故障类告警队列中携带某一相同网元设备标识的告警消息的数量是否超过第一设定数量阈值,确定出的用于确定重大故障类告警消息的相同网元设备标识,还需要满足该相同网元设备标识与指定网元设备标识不同(指定网元设备标识用于确定工程类告警消息);
当未确定出用于确定重大故障类告警消息的该相同网元设备标识时,将采集到的告警消息,确定为非重大故障类告警消息,以及当已确定出用于重大故障类告警消息的该相同网元设备标识时,将未携带该相同网元设备标识的告警消息,也确定为非重大故障类告警消息;
当已确定出用于重大故障类告警消息的该相同网元设备标识时,将携带该相同网元设备标识的告警消息,确定为重大故障类告警消息。
步骤S503、将重大故障类告警消息缓存到与重大故障类对应的告警队列中。
具体还可以针对确定出的各相同网元设备标识分别建立对应的告警队列,将携带每个相同网元设备标识的告警消息,分别缓存到与该相同网元设备标识对应的告警队列中。通过对确定出的不同的该相同网元设备标识建立对应的告警队列,实质上,即实现了对工程类告警消息和重大故障类告警消息的分类并行处理。
较佳的,本步骤还可以包括:当确定出该相同网元设备标识时,即确定出重大故障类告警消息的判定条件时,还可以将当前缓存有告警消息的非重大故障类告警队列中携带该相同网元设备的告警消息,迁移到与重大故障类对应的告警队列中。
步骤S504、判断采集到的非重大故障类告警消息是否为工程类告警消息,如果是,进入步骤S505,否则,进入步骤S506。
具体可以预先设置工程处理涉及的各网元设备的标识为指定网元设备标识,并在判断时,根据告警消息中是否携带指定网元设备标识,确定告警消息是否为工程类告警消息。
步骤S505、将工程类告警消息缓存到与工程类对应的告警队列中,具体还可以针对每个工程处理建立告警队列,将与每个工程处理相关的告警消息分别缓存到与该工程处理对应的告警队列中。
步骤S506、将其它告警消息缓存到与其它类对应的告警队列中。
步骤S507、对与重大故障类对应的告警队列中的重大故障类告警消息,与工程类对应的告警队列中的工程类类告警消息,以及与其它类对应的告警队列中的其它告警消息,进行并行处理,即对各不同告警队列中的告警消息进行并行处理。
具体可以将不同的告警队列部署在同一个处理服务器上,也可以分别部署在不同的告警服务器上。
本实施例3中,考虑到重大故障类告警消息是产生“报警风暴”的主要告警消息,且重大故障类告警消息处理的及时性要求更高,所以,在对重大故障类告警消息进行处理时,为了提高处理效率,还可以采用动态负载均衡机制对重大故障类告警消息进行处理,即当与重大故障类对应的告警队列中的重大故障类告警消息的数量超过第二设定数量阈值时,增加处理重大告警类告警消息的处理资源,实现处理效率的提高。
在处理重大故障类告警消息的同时,还可以判断当前与重大故障类对应的告警队列中的重大故障类告警消息的数量是否小于第三设定数量阈值,或者判断当前单位时间段内缓存到与重大故障类对应的告警队列中的告警消息的数量是否小于第四设定数量阈值,如果小于,则表示由该重大故障类告警消息引起的“告警风暴”情况已经消除,可以进入正常告警消息的处理环节,即更改上述步骤S502中对重大故障告警消息的判断条件,清除该相同网元设备标识,即对采集到的告警消息均确定为非重大故障类告警消息。
步骤S508、将对告警消息的进行处理后得到的处理结果,呈现给告警监控人员。
上述实施例3提供的告警消息处理方法中,基于重大故障类告警消息和工程类告警消息是产生“告警风暴”的主要类型的告警消息,提出针对重大故障类告警消息、工程类告警消息和其它类告警消息分类并行处理的方案,提高了对重大故障类告警消息和工程类告警消息的处理的及时性,快速消除“告警风暴”,并且,通过动态负载均衡机制,可以进一步的提高对重大故障类告警消息的处理效率。
实施例4:
基于对目前网络管理***中采集到的告警消息的分析发现,从告警消息所指示的告警信息的性质,可以划分为两大类,一类是由于网元设备故障或异常产生的告警消息,另一类是当之前的产生的告警已清除后,产生的指示该告警已清除的告警消息,可以将第一类告警消息称为非清除类告警消息,将第二类告警消息称为清除类告警消息。
基于上述分析可知,全部告警消息中将存在近一半的清除类告警消息,而清除类告警消息相对非清除类告警消息而言,其处理的及时性要求相对较低。并且,在由于非清除类告警消息在短时间内急剧增加而产生“告警风暴”,并在故障解除或工程结束后,虽然非清除类告警消息的数量将降低,但与之前产生“告警风暴”的非清除类告警消息相关的清除类告警消息将大量产生,进而使得“告警风暴”状况仍将持续。并且,由于存在大量清除类告警消息需要处理,将导致对后续采集到的非清除类告警消息无法及时处理。
所以,本发明实施例4提出将告警消息划分为清除类告警消息和非清除类告警消息,进行分类并行处理的方案,处理流程图为图6,具体包括:
步骤S601、从网元设备上采集原始告警信息,并生成携带告警信息的告警消息。
步骤S602、判断采集到的告警消息是否为清除类告警消息,如果是,进入步骤S603,否则,进入步骤S604。
具体可以通过告警消息中携带的清除类指示信息进行判断,如果告警消息中携带有清除类指示信息,则确定该告警消息为清除类告警消息,否则,确定为非清除类告警消息。
步骤S603、将清除类告警消息缓存到清除类告警队列中。
步骤S604、本实施例4中,对于非清除类告警消息进一步的进行划分,考虑到对于目前网络管理***中采集到的告警消息已进行了级别划分,从高到低划分为四级,而最低级别类告警消息(即第四级告警消息)一般为指示类和事件通知类的告警消息,例如,指示某一网元设备的某一处理任务的当前处理阶段等,对该最低级别类告警消息的处理及时性一般要求较低,而该最低级别类告警消息在非清除类告警消息中所占的比重又很大,所以,为了提高对非最低级别类告警消息处理的及时性,本步骤中对非清除类告警消息,进一步划分为最低级别类告警消息和非最低级别类告警消息,并进行分类并行处理,具体为:
判断采集到的非清除类告警消息是否为最低级别类告警消息,如果是,进入步骤S605,否则,进入步骤S606。
具体可以基于告警消息中的级别指示信息进行判断,当告警消息中携带的级别指示信息为最低级别指示信息时,则确定该告警消息为最低级别类告警消息,否则,为非最低级别类告警消息。
步骤S605、将最低级别类告警消息缓存到最低级别类告警队列中。
步骤S606、本实施例4中,对于非最低级别类告警消息,还可以进一步将其划分为重大故障类告警消息、工程类告警消息和其它类告警消息。
判断非最低级别类告警消息是否为重大故障类告警消息,如果是,进入步骤S607、否则,进入步骤S608。
具体的判断方式可采用上述实施例3中的相同方式,在此不再进行描述。
步骤S607、将重大故障类告警消息缓存到重大故障类告警队列中。
步骤S608、判断非重大故障类告警消息是否为工程类告警消息,如果是,进入步骤S609、否则,进入步骤S610。
具体的判断方式可采用上述实施例3中的相同方式,在此不再进行描述。
步骤S609、将工程类告警消息缓存到工程类告警队列中。
步骤S610、将其它类告警消息缓存到其它类告警队列中。
步骤S611、对清除类告警队列、最低级别类告警队列、重大故障类告警队列、工程类告警队列和其它类告警队列中的告警消息,进行并行处理,即对各不同告警队列中的告警消息进行并行处理。
具体可以将不同的告警队列部署在同一个处理服务器上,也可以分别部署在不同的告警服务器上。
其中,对于重大故障类告警队列中的重大故障类告警消息的处理,可以采用与上述实施例3中相同的具体方式,以便提高对重大故障类告警消息处理的及时性,快速消除“告警风暴”,在此不再进行详细描述。
步骤S612、将对告警消息的进行处理后得到的处理结果,呈现给告警监控人员。
上述实施例4提供的告警消息处理方法中,首先将告警消息划分为清除类告警消息和非清除类告警消息,并对非清除类告警消息又进一步划分为最低级别类告警消息和非最低级别类告警消息,并对非最低级别类告警消息又进一步划分为重大故障类告警消息和非重大故障类告警消息,并对非重大故障类告警消息又进一步划分为工程类告警消息和其它类告警消息,并基于上述告警消息的类型的划分,实现了对告警消息的分类处理,进而当某一类的待处理的告警消息较多时,并不会影响对其它类别的告警消息的及时处理;并且,通过对告警队列中的告警消息进行并行处理,提高了处理告警消息的效率。
实施例5:
基于同一发明构思,根据本发明上述实施例提供的网络管理***中的告警消息处理方法,相应地,本发明实施例5还提供了一种处理告警消息的网络管理***,其结构示意图如图7所示,具体包括:
告警接收缓存装置701,用于将采集到的网元设备的告警消息,缓存到与该告警消息的类型对应的告警队列中;
告警处理装置702,应用于对各告警队列中分别缓存的不同类型的告警消息进行并行处理。
较佳的,告警接收缓存装置701,具体用于将采集到的未携带指定网元设备标识的告警消息,缓存到第一告警队列中,并将采集到的携带指定网元设备标识的告警消息,缓存到第二告警队列中;和/或
当当前缓存有告警消息的告警队列中携带相同网元设备标识的告警消息的数量超过第一设定数量阈值时,将后续采集到的携带该相同网元设备标识的告警消息,缓存到第三告警队列中;
第一告警队列、第二告警队列和第三告警队列为分别不同的告警队列。
较佳的,告警接收缓存装置701,还用于当当前缓存有告警消息的告警队列中携带相同网元设备标识的告警消息的数量超过第一设定数量阈值时,将当前缓存有告警消息的告警队列中携带该相同网元设备的告警消息,迁移到第三告警队列中。
较佳的,告警处理装置702,具体用于当第三告警队列中的告警消息的数量超过第二设定数量阈值时,增加处理第三告警队列中的告警消息的处理资源,对第三告警队列中的告警消息进行处理。
较佳的,告警接收缓存装置701,具体用于将采集到的清除类告警消息,缓存到清除类告警队列中;并将采集到的非清除类告警消息,缓存到非清除类告警队列中,清除类告警消息为指示告警已清除的告警消息。
较佳的,告警接收缓存装置701,具体用于将采集到的非清除类告警消息中的最低级别类告警消息,缓存到非清除类告警队列中的最低级别类告警队列中;并将采集到的非清除类告警消息中的非最低级别类告警消息,缓存到非清除类告警队列中的非最低级别类告警队列中。
较佳的,告警接收缓存装置701,具体用于将采集到的非清除类告警消息中的非最低级别类告警消息中的未携带指定网元设备设备标识的告警消息,缓存到非清除类告警队列中的非最低级别类告警队列中的第一告警队列中;并将采集到的非清除类告警消息中的非最低级别类告警消息中的携带指定网元设备标识的告警消息,缓存到非清除类告警队列中的非最低级别类告警队列中的第二告警队列中;和/或
当当前缓存有告警消息的非清除类告警队列中的非最低级别类告警队列中,携带相同网元设备标识的告警消息的数量超过第一设定数量阈值时,将后续采集到的非清除类告警消息中的非最低级别类告警消息中的携带该相同网元设备标识的告警消息,缓存到非清除类告警队列中的非最低级别类告警队列中的第三告警队列中。
综上所述,本发明实施例提供的方案,包括:将采集到的网元设备的告警消息,缓存到与所述告警消息的类型对应的告警队列中;并对各告警队列中分别缓存的不同类型的告警消息进行并行处理。采用本发明实施例提供的方案,实现了对告警消息的分类处理,并避免了因某一类的待处理的告警消息的积压导致其它类的告警消息无法得到及时的处理。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (14)

1.一种网络管理***中的告警消息处理方法,其特征在于,包括:
将采集到的网元设备的告警消息,缓存到与所述告警消息的类型对应的告警队列中;
对各告警队列中分别缓存的不同类型的告警消息进行并行处理;
其中,将采集到的网元设备的告警消息,缓存到与所述告警消息的类型对应的告警队列中,具体包括:
当当前缓存有告警消息的告警队列中携带相同网元设备标识的告警消息的数量超过第一设定数量阈值时,将后续采集到的携带该相同网元设备标识的告警消息,缓存到第三告警队列中。
2.如权利要求1所述的方法,其特征在于,将采集到的网元设备的告警消息,缓存到与所述告警消息的类型对应的告警队列中,还具体包括:
将采集到的未携带指定网元设备标识的告警消息,缓存到第一告警队列中;并将采集到的携带指定网元设备标识的告警消息,缓存到第二告警队列中;
所述第一告警队列、所述第二告警队列和所述第三告警队列为分别不同的告警队列。
3.如权利要求1所述的方法,其特征在于,当当前缓存有告警消息的告警队列中携带相同网元设备标识的告警消息的数量超过第一设定数量阈值时,还包括:
将当前缓存有告警消息的告警队列中携带该相同网元设备的告警消息,迁移到所述第三告警队列中。
4.如权利要求1-3任一所述的方法,其特征在于,对所述第三告警队列中缓存的告警消息进行处理,具体包括:
当所述第三告警队列中的告警消息的数量超过第二设定数量阈值时,增加处理所述第三告警队列中的告警消息的处理资源,对所述第三告警队列中的告警消息进行处理。
5.如权利要求1所述的方法,其特征在于,将采集到的网元设备的告警消息,缓存到与所述告警消息的类型对应的告警队列中,具体包括:
将采集到的清除类告警消息,缓存到清除类告警队列中,所述清除类告警消息为指示告警已清除的告警消息;并
将采集到的非清除类告警消息,缓存到非清除类告警队列中。
6.如权利要求5所述的方法,其特征在于,将采集到的非清除类告警消息,缓存到非清除类告警队列中,具体包括:
将采集到的非清除类告警消息中的最低级别类告警消息,缓存到非清除类告警队列中的最低级别类告警队列中;并
将采集到的非清除类告警消息中的非最低级别类告警消息,缓存到非清除类告警队列中的非最低级别类告警队列中。
7.如权利要求6所述的方法,其特征在于,将采集到的非清除类告警消息中的非最低级别类告警消息中,缓存到非清除类告警队列中的非最低级别类告警队列中,具体包括:
将采集到的非清除类告警消息中的非最低级别类告警消息中的未携带指定网元设备标识的告警消息,缓存到非清除类告警队列中的非最低级别类告警队列中的第一告警队列中;并将采集到的非清除类告警消息中的非最低级别类告警消息中的携带指定网元设备标识的告警消息,缓存到非清除类告警队列中的非最低级别类告警队列中的第二告警队列中;和/或
当当前缓存有告警消息的非清除类告警队列中的非最低级别类告警队列中,携带相同网元设备标识的告警消息的数量超过第一设定数量阈值时,将后续采集到的非清除类告警消息中的非最低级别类告警消息中的携带该相同网元设备标识的告警消息,缓存到非清除类告警队列中的非最低级别类告警队列中的第三告警队列中。
8.一种处理告警消息的网络管理***,其特征在于,包括:
告警接收缓存装置,用于将采集到的网元设备的告警消息,缓存到与所述告警消息的类型对应的告警队列中;
告警处理装置,应用于对各告警队列中分别缓存的不同类型的告警消息进行并行处理;
其中,所述告警接收缓存装置,具体用于当当前缓存有告警消息的告警队列中携带相同网元设备标识的告警消息的数量超过第一设定数量阈值时,将后续采集到的携带该相同网元设备标识的告警消息,缓存到第三告警队列中。
9.如权利要求8所述的***,其特征在于,所述告警接收缓存装置,具体还用于将采集到的未携带指定网元设备标识的告警消息,缓存到第一告警队列中,并将采集到的携带指定网元设备标识的告警消息,缓存到第二告警队列中;
所述第一告警队列、所述第二告警队列和所述第三告警队列为分别不同的告警队列。
10.如权利要求8所述的***,其特征在于,所述告警接收缓存装置,还用于当当前缓存有告警消息的告警队列中携带相同网元设备标识的告警消息的数量超过第一设定数量阈值时,将当前缓存有告警消息的告警队列中携带该相同网元设备的告警消息,迁移到所述第三告警队列中。
11.如权利要求8-10任一所述的***,其特征在于,所述告警处理装置,具体用于当所述第三告警队列中的告警消息的数量超过第二设定数量阈值时,增加处理所述第三告警队列中的告警消息的处理资源,对所述第三告警队列中的告警消息进行处理。
12.如权利要求8所述的***,其特征在于,所述告警接收缓存装置,具体用于将采集到的清除类告警消息,缓存到清除类告警队列中;并将采集到的非清除类告警消息,缓存到非清除类告警队列中,所述清除类告警消息为指示告警已清除的告警消息。
13.如权利要求12所述的***,其特征在于,所述告警接收缓存装置,具体用于将采集到的非清除类告警消息中的最低级别类告警消息,缓存到非清除类告警队列中的最低级别类告警队列中;并将采集到的非清除类告警消息中的非最低级别类告警消息,缓存到非清除类告警队列中的非最低级别类告警队列中。
14.如权利要求13所述的***,其特征在于,所述告警接收缓存装置,具体用于将采集到的非清除类告警消息中的非最低级别类告警消息中的未携带指定网元设备标识的告警消息,缓存到非清除类告警队列中的非最低级别类告警队列中的第一告警队列中;并将采集到的非清除类告警消息中的非最低级别类告警消息中的携带指定网元设备标识的告警消息,缓存到非清除类告警队列中的非最低级别类告警队列中的第二告警队列中;和/或
当当前缓存有告警消息的非清除类告警队列中的非最低级别类告警队列中,携带相同网元设备标识的告警消息的数量超过第一设定数量阈值时,将后续采集到的非清除类告警消息中的非最低级别类告警消息中的携带该相同网元设备标识的告警消息,缓存到非清除类告警队列中的非最低级别类告警队列中的第三告警队列中。
CN201010614941.6A 2010-12-30 2010-12-30 网络管理***中的告警消息处理方法及网络管理*** Active CN102546216B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010614941.6A CN102546216B (zh) 2010-12-30 2010-12-30 网络管理***中的告警消息处理方法及网络管理***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010614941.6A CN102546216B (zh) 2010-12-30 2010-12-30 网络管理***中的告警消息处理方法及网络管理***

Publications (2)

Publication Number Publication Date
CN102546216A CN102546216A (zh) 2012-07-04
CN102546216B true CN102546216B (zh) 2015-03-11

Family

ID=46352225

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010614941.6A Active CN102546216B (zh) 2010-12-30 2010-12-30 网络管理***中的告警消息处理方法及网络管理***

Country Status (1)

Country Link
CN (1) CN102546216B (zh)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103684880A (zh) * 2013-12-31 2014-03-26 上海斐讯数据通信技术有限公司 控制告警的方法及告警装置
CN104361713A (zh) * 2014-10-13 2015-02-18 北京国双科技有限公司 一种指标数据的监测方法、装置及服务器
CN104283725B (zh) * 2014-11-10 2018-06-29 武汉众邦领创技术有限公司 网络管理***中告警信息处理方法及***
CN104391930A (zh) * 2014-11-21 2015-03-04 用友软件股份有限公司 分布式文件存储装置和方法
CN104468224B (zh) * 2014-12-18 2018-02-23 浪潮电子信息产业股份有限公司 一种双重过滤的数据中心监控***故障告警方法
CN105827418B (zh) * 2015-01-04 2019-07-05 ***通信集团山东有限公司 一种通信网络告警关联方法及装置
CN105991320B (zh) * 2015-02-05 2020-07-31 深圳市中兴通讯技术服务有限责任公司 无源光网络设备告警信息处理方法及光线路终端
CN104618192B (zh) * 2015-02-12 2020-08-21 网神信息技术(北京)股份有限公司 数据库审计设备的测试方法和装置
CN104980304B (zh) * 2015-06-15 2018-03-27 上海斐讯数据通信技术有限公司 应用于网络***的告警控制方法及***
CN105450445A (zh) * 2015-11-17 2016-03-30 武汉日电光通信工业有限公司 一种大容量分组传送***下的高性能告警处理***及方法
WO2017119246A1 (ja) * 2016-01-08 2017-07-13 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 異常検知方法、異常検知装置及び異常検知システム
CN105791016A (zh) * 2016-03-09 2016-07-20 浪潮通信信息***有限公司 一种基于流式计算的分布式故障管理告警处理***
CN107241210A (zh) * 2016-03-29 2017-10-10 阿里巴巴集团控股有限公司 异常监控报警方法及装置
CN107800553A (zh) * 2016-09-05 2018-03-13 中兴通讯股份有限公司 一种管理设备故障的方法和装置
CN106792856B (zh) * 2016-12-27 2020-04-10 武汉虹信通信技术有限责任公司 一种基于设备级并行度的无线网元管理***告警处理方法
CN106713049B (zh) * 2017-02-04 2020-08-04 杭州迪普科技股份有限公司 一种监控的告警方法及装置
CN106851594B (zh) * 2017-03-10 2019-09-27 Oppo广东移动通信有限公司 一种广播发送方法、装置及终端
CN107426025A (zh) * 2017-07-28 2017-12-01 江西山水光电科技股份有限公司 一种增强网管北向消息响应度的调度方法
CN108259269A (zh) * 2017-12-30 2018-07-06 上海陆家嘴国际金融资产交易市场股份有限公司 网络设备的监控方法和***
CN109889373B (zh) * 2019-01-22 2022-06-21 视联动力信息技术股份有限公司 一种告警信息的传输方法、装置和***
CN109995666A (zh) * 2019-04-12 2019-07-09 深圳市元征科技股份有限公司 一种消息传输方法及相关装置
CN112422304B (zh) * 2019-08-21 2021-11-26 大唐移动通信设备有限公司 一种告警处理方法和装置
CN110764967A (zh) * 2019-10-18 2020-02-07 广东浪潮大数据研究有限公司 高性能监控告警***、方法、装置及计算机可读存储介质
CN113724100B (zh) * 2021-08-27 2024-05-10 广东电网有限责任公司 一种分布式集群的电网监控告警消息处理方法
CN115294736B (zh) * 2022-10-09 2023-02-10 深圳曼顿科技有限公司 报警消息控制方法、装置、终端设备以及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101018157A (zh) * 2007-02-14 2007-08-15 华为技术有限公司 一种告警处理方法及告警***
CN101296115A (zh) * 2007-11-22 2008-10-29 ***通信集团山东有限公司 电信网络多维监控方法
CN101374077A (zh) * 2008-10-20 2009-02-25 中兴通讯股份有限公司 一种网管***中告警前转实现方法及***
CN101877656A (zh) * 2010-06-11 2010-11-03 武汉虹信通信技术有限责任公司 一种网管监控***及其实现并行处理故障告警的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020029266A1 (en) * 2000-09-07 2002-03-07 Edwin Tse Parallel processing architecture for alarm management network entities
US8700761B2 (en) * 2008-09-04 2014-04-15 At&T Intellectual Property I, L.P. Method and system for detecting and managing a fault alarm storm

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101018157A (zh) * 2007-02-14 2007-08-15 华为技术有限公司 一种告警处理方法及告警***
CN101296115A (zh) * 2007-11-22 2008-10-29 ***通信集团山东有限公司 电信网络多维监控方法
CN101374077A (zh) * 2008-10-20 2009-02-25 中兴通讯股份有限公司 一种网管***中告警前转实现方法及***
CN101877656A (zh) * 2010-06-11 2010-11-03 武汉虹信通信技术有限责任公司 一种网管监控***及其实现并行处理故障告警的方法

Also Published As

Publication number Publication date
CN102546216A (zh) 2012-07-04

Similar Documents

Publication Publication Date Title
CN102546216B (zh) 网络管理***中的告警消息处理方法及网络管理***
EP3072260B1 (en) Methods, systems, and computer readable media for a network function virtualization information concentrator
CN101741615B (zh) 基于服务器的告警过滤***及方法
US5488715A (en) Process for integrated traffic data management and network surveillance in communications networks
CN101997709B (zh) 一种根告警数据分析的方法及其***
JPH08307524A (ja) 通信ネットワークの構成要素の異常状態のリスクを識別する方法と装置
CN103370904A (zh) 用于确定网络意外事件的严重性的方法
EP3932025B1 (en) Computing resource scheduling method, scheduler, internet of things system, and computer readable medium
US7933211B2 (en) Method and system for providing prioritized failure announcements
CN110650060A (zh) 流量告警的处理方法、设备及存储介质
US20220239370A1 (en) Proactive isolation of telecommunication faults based on alarm indicators
CN101128001A (zh) 网元管理***对振荡告警的处理方法
CN101640818A (zh) 光网络保护装置和保护方法
CN102082677B (zh) 一种告警信息处理方法和装置及***
US8521869B2 (en) Method and system for reporting defects within a network
CN104639386A (zh) 故障定位***和方法
CN101414933B (zh) 一种告警相关性信息的处理方法及装置
CN111262624B (zh) 光缆故障的监控方法和装置
CN105071970A (zh) 故障分析方法和***以及网管设备
CN101841838B (zh) 逻辑链路告警的处理方法和装置
EP1785866A1 (en) Alarm consolidaton in IT infrastructures
KR100861592B1 (ko) 가입자 망 관리 시스템에서의 고장관리 방법 및 장치
CN101350732B (zh) 传输网网络资源利用状况分析处理、测试方法及装置
CN112751722B (zh) 数据传输质量监控方法和***
CN110609761B (zh) 确定故障源的方法、装置、存储介质和电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant