CN104270277A - 报警信息处理方法和报警信息处理装置 - Google Patents

报警信息处理方法和报警信息处理装置 Download PDF

Info

Publication number
CN104270277A
CN104270277A CN201410579037.4A CN201410579037A CN104270277A CN 104270277 A CN104270277 A CN 104270277A CN 201410579037 A CN201410579037 A CN 201410579037A CN 104270277 A CN104270277 A CN 104270277A
Authority
CN
China
Prior art keywords
equipment
warning message
alert levels
warning
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410579037.4A
Other languages
English (en)
Other versions
CN104270277B (zh
Inventor
崔玉珩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE ICT Technologies Co Ltd
Original Assignee
ZTE ICT Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE ICT Technologies Co Ltd filed Critical ZTE ICT Technologies Co Ltd
Priority to CN201410579037.4A priority Critical patent/CN104270277B/zh
Publication of CN104270277A publication Critical patent/CN104270277A/zh
Application granted granted Critical
Publication of CN104270277B publication Critical patent/CN104270277B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Alarm Systems (AREA)

Abstract

本发明提出了一种报警信息处理方法和一种报警信息处理装置,其中的报警信息处理方法包括:接收来自多个设备的报警信息;根据所述报警信息的属性,调整所述多个设备中的每个设备的报警级别;根据接收到的选择命令,选择调整后的所述报警级别最高的所述设备发出的所述报警信息进行处理。通过本发明的技术方案,可以根据报警信息的属性调整报警设备的报警级别,而调整报警级别的依据可以是报警信息的一种属性,也可以是多种属性的集合,从而可以根据调整后的报警级别优先处理在某一属性或综合属性方面较为重要的设备发出的报警信息,使排查范围以最快的速度进行收敛,从而达到快速、准确地定位故障源的目的,提升了故障排除的效率,降低了故障损失。

Description

报警信息处理方法和报警信息处理装置
技术领域
本发明涉及故障处理技术领域,具体而言,涉及一种报警信息处理方法和一种报警信息处理装置。
背景技术
随着云计算、物联网等技术的发展,联网的***设备、网络设备越来越多,实现的功能也越来越强大。然而,网络组成也变得越来越复杂,一旦某个设备或某个网络节点出现问题,在网络中定位故障源头就变得十分困难。目前,一般都是将所有发出故障信息的点隔离出来,然后逐个故障点进行排查。这一方法对于大型网络***而言并不适用,因为对于大型网络***来说,往往都是因为位于中心节点处的设备出现问题,而导致大面积的网络瘫痪或服务故障,用逐个故障点排查的方法的话,对故障源头的定位十分费时费力,极大地损害了业务的稳定性和客户的满意度。
因此需要一种新的技术方案,可以快速、准确地定位故障源头,以提升故障排查的效率,降低故障损失。
发明内容
本发明正是基于上述问题,提出了一种新的技术方案,可以快速、准确地定位故障源头,以提升故障排查的效率,降低故障损失。
有鉴于此,本发明的第一方面提出了一种报警信息处理方法,包括:接收来自多个设备的报警信息;根据所述报警信息的属性,调整所述多个设备中的每个设备的报警级别;根据接收到的选择命令,选择调整后的所述报警级别最高的所述设备发出的所述报警信息进行处理。
在该技术方案中,可以根据每条报警信息的属性更改发出该报警信息的设备的报警级别,比如,当发出报警信息的设备的类型为网络中的核心设备时,可以为它的报警级别增加一级,如果该设备的报警频率为每分钟一百次,超过了预定频率标准的每分钟十次,则可以为它的报警级别再增加一级。根据这一方法对每个设备的报警级别进行重新调整,再比较调整后的报警级别,可选出报警级别最高的设备,并优先处理这一设备发出的报警信息。再比如,通过报警信息的报警路径可以确定每个设备向哪些设备输出信息,从而可以按输出端从多到少的顺序对设备进行排查,以更加快速地确定故障源,在处理完报警级别最高的设备的报警信息后,如果还不断接收到报警信息,则可以对剩余的设备继续进行报警级别的调整,这样循环往复,直至解决所有故障信息为止。通过该技术方案,可以根据报警信息的属性调整和评估报警设备的报警级别,而评估报警级别的依据可以是报警信息的多个属性中的一个或几个,从而可以优先处理在某一属性或综合属性方面较为重要的设备发出的报警信息,从而达到快速、准确地定位故障源的目的,提升故障排除的效率,降低故障损失。
在上述技术方案中,优选地,所述报警信息的属性包括:发出所述报警信息的所述设备的报警级别;以及以下至少之一或其组合:所述报警信息的报警频度;所述报警信息的类型;发出所述报警信息的所述设备的类型;所述报警信息的报警路径。
在该技术方案中,报警信息中含有设备的初始报警级别和至少一种属性信息,报警信息的属性包括但不限于报警频度、报警信息类型、报警设备类型与报警路径,在进行故障排查时,可以选用其中一种属性作为调整报警级别的指标,也可以选择多种属性作为调整报警级别的综合指标。比如,根据报警频度和报警信息类型来调整设备A和B的报警级别,设备A每小时发出一次CPU报警信息,由于CPU报警被认为是重要告警类型,因此可以将设备A的报警级别调高一级,或者根据用户的需要或其他定义规则调高多级,而设备B每小时发出两次网络报警信息,由于网络报警为普通报警类型,不需要为设备B增加报警级别,但设备B的报警频度是一小时两次,比设备A的报警频度高出一倍,则也可以将设备B的报警级别调高一级,或者根据用户的需要或其他定义规则调高多级。
在上述技术方案中,优选地,所述根据所述报警信息的属性,调整所述多个设备中的每个设备的报警级别,具体包括:根据所述报警信息的属性,确定对每个所述设备的所述报警级别的权重的调整值;将所述调整值与所述权重相加,得到调整后的每个所述设备的所述报警级别的权重。
在该技术方案中,根据各属性确定对报警级别的权重的增加值,并将增加该增加值后的权重设置为设备最终的报警级别。比如,在上述设备A和B的例子中,根据设备A的报警信息的类型和报警频度确定设备A的报警级别权重的增加值为1,同样,根据设备B的报警信息的类型和报警频度确定设备B的报警级别权重的增加值也为1,如果设备A和设备B的初始报警级别分别为2和1,那么调整后的设备A和设备B的报警级别分别为3和2。
在上述技术方案中,优选地,当所述报警信息的属性为所述报警信息的报警路径时,所述确定每个所述设备的所述报警级别的调整值,具体包括:获取每个所述设备在每条所述报警路径中的输出端设备的数量值;将每条所述报警路径中的所述输出端设备的所述数量值相加,得到每个所述设备的所述输出端设备的总数量值;将所述总数量值设置为所述调整值。
在该技术方案中,多个设备构成的网络中总是具有很多条输入输出路径,那么,经过设备的报警路径越多,该设备是故障源的几率越大,以及设备在一条报警路径中下方的输出设备越多,该设备是故障源的几率也越大。因此,通过本技术方案,可以在复杂的网络中选出作为最多个设备的输出源头的源设备,如果源设备确实发生故障,则直接对源设备的报警信息进行处理,如果经排查确定源设备未发生故障,则在网络中删除源设备及源设备的多条输出路径后,可重新估算剩余设备的报警级别,以选出下一个源设备。这样循环往复,直至故障解除为止。每次选出的源设备都是当前输出端最多的设备,即最有可能造成当前网络故障的设备,从而使排查范围以最快的速度进行收敛,提升了排查的效率。
在上述技术方案中,优选地,还包括:根据接收到的更改命令,更改所述设备的所述报警级别。
在该技术方案中,设备的初始报警级别和调整后的报警级别都可以根据实际需要进行更改,比如,一个设备虽然不是网络中的核心设备,其发出的故障信息也不是高级的故障信息,但是该设备是使用年龄超过十年的老设备,其成为故障源的可能性就会很高,再比如,网络中的大部分设备刚刚经过年检,并且年检结果合格,而唯独某个设备还未经过年检,因此,用户在进行故障排查时,可以适当地提升这些设备的报警级别,从而提升故障排查的效率。
本发明的第二方面提出了一种报警信息处理装置,包括:接收单元,接收来自多个设备的报警信息;调整单元,根据所述报警信息的属性,调整所述多个设备中的每个设备的报警级别;处理单元,根据接收到的选择命令,选择调整后的所述报警级别最高的所述设备发出的所述报警信息进行处理。
在该技术方案中,可以根据每条报警信息的属性更改发出该报警信息的设备的报警级别,比如,当发出报警信息的设备的类型为网络中的核心设备时,可以为它的报警级别增加一级,如果该设备的报警频率为每分钟一百次,超过了预定频率标准的每分钟十次,则可以为它的报警级别再增加一级。根据这一方法对每个设备的报警级别进行重新调整,再比较调整后的报警级别,可选出报警级别最高的设备,并优先处理这一设备发出的报警信息。再比如,通过报警信息的报警路径可以确定每个设备向哪些设备输出信息,从而可以按输出端从多到少的顺序对设备进行排查,以更加快速地确定故障源,在处理完报警级别最高的设备的报警信息后,如果还不断接收到报警信息,则可以对剩余的设备继续进行报警级别的调整,这样循环往复,直至解决所有故障信息为止。通过该技术方案,可以根据报警信息的属性调整和评估报警设备的报警级别,而评估报警级别的依据可以是报警信息的多个属性中的一个或几个,从而可以优先处理在某一属性或综合属性方面较为重要的设备发出的报警信息,从而达到快速、准确地定位故障源的目的,提升故障排除的效率,降低故障损失。
在上述技术方案中,优选地,所述报警信息的属性包括:发出所述报警信息的所述设备的报警级别;以及以下至少之一或其组合:所述报警信息的报警频度;所述报警信息的类型;发出所述报警信息的所述设备的类型;所述报警信息的报警路径。
在该技术方案中,报警信息中含有设备的初始报警级别和至少一种属性信息,报警信息的属性包括但不限于报警频度、报警信息类型、报警设备类型与报警路径,在进行故障排查时,可以选用其中一种属性作为调整报警级别的指标,也可以选择多种属性作为调整报警级别的综合指标。比如,根据报警频度和报警信息类型来调整设备A和B的报警级别,设备A每小时发出一次CPU报警信息,由于CPU报警被认为是重要告警类型,因此可以将设备A的报警级别调高一级,或者根据用户的需要或其他定义规则调高多级,而设备B每小时发出两次网络报警信息,由于网络报警为普通报警类型,不需要为设备B增加报警级别,但设备B的报警频度是一小时两次,比设备A的报警频度高出一倍,则也可以将设备B的报警级别调高一级,或者根据用户的需要或其他定义规则调高多级。
在上述技术方案中,优选地,所述调整单元包括:确定单元,根据所述报警信息的属性,确定对每个所述设备的所述报警级别的权重的调整值;以及所述调整单元用于:将所述调整值与所述权重相加,得到调整后的每个所述设备的所述报警级别的权重。
在该技术方案中,根据各属性确定对报警级别的权重的增加值,并将增加该增加值后的权重设置为设备最终的报警级别。比如,在上述设备A和B的例子中,根据设备A的报警信息的类型和报警频度确定设备A的报警级别权重的增加值为1,同样,根据设备B的报警信息的类型和报警频度确定设备B的报警级别权重的增加值也为1,如果设备A和设备B的初始报警级别分别为2和1,那么调整后的设备A和设备B的报警级别分别为3和2。
在上述技术方案中,优选地,当所述报警信息的属性为所述报警信息的报警路径时,所述确定单元用于:获取每个所述设备在每条所述报警路径中的输出端设备的数量值,将每条所述报警路径中的所述输出端设备的所述数量值相加,并将相加得到的每个所述设备的所述输出端设备的总数量值设置为所述调整值。
在该技术方案中,多个设备构成的网络中总是具有很多条输入输出路径,那么,经过设备的报警路径越多,该设备是故障源的几率越大,以及设备在一条报警路径中下方的输出设备越多,该设备是故障源的几率也越大。因此,通过本技术方案,可以在复杂的网络中选出作为最多个设备的输出源头的源设备,如果源设备确实发生故障,则直接对源设备的报警信息进行处理,如果经排查确定源设备未发生故障,则在网络中删除源设备及源设备的多条输出路径后,可重新估算剩余设备的报警级别,以选出下一个源设备。这样循环往复,直至故障解除为止。每次选出的源设备都是当前输出端最多的设备,即最有可能造成当前网络故障的设备,从而使排查范围以最快的速度进行收敛,提升了排查的效率。
在上述技术方案中,优选地,还包括:更改单元,根据接收到的更改命令,更改所述设备的所述报警级别。
在该技术方案中,设备的初始报警级别和调整后的报警级别都可以根据实际需要进行更改,比如,一个设备虽然不是网络中的核心设备,其发出的故障信息也不是高级的故障信息,但是该设备是使用年龄超过十年的老设备,其成为故障源的可能性就会很高,再比如,网络中的大部分设备刚刚经过年检,并且年检结果合格,而唯独某个设备还未经过年检,因此,用户在进行故障排查时,可以适当地提升这些设备的报警级别,从而提升故障排查的效率。
通过以上技术方案,可以根据报警信息的属性调整报警设备的报警级别,而调整报警级别的依据可以是报警信息的一种属性,也可以是多种属性的集合,从而可以根据调整后的报警级别优先处理在某一属性或综合属性方面较为重要的设备发出的报警信息,使排查范围以最快的速度进行收敛,从而达到快速、准确地定位故障源的目的,提升了故障排除的效率,降低了故障损失。
附图说明
图1示出了根据本发明的一个实施例的报警信息处理方法的流程图;
图2示出了根据本发明的另一个实施例的报警信息处理方法的流程图;
图3A和图3B示出了根据本发明的再一个实施例的报警信息处理方法中用于排查故障设备的网络拓扑图;
图4示出了根据本发明的一个实施例的报警信息处理装置的框图;
图5示出了根据本发明的另一个实施例的报警信息处理装置的框图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1示出了根据本发明的一个实施例的报警信息处理方法的流程图。
如图1所示,根据本发明的一个实施例的报警信息处理方法,包括以下步骤:
步骤102,接收来自多个设备的报警信息。
步骤104,根据报警信息的属性,调整多个设备中的每个设备的报警级别。
步骤106,根据接收到的选择命令,选择调整后的报警级别最高的设备发出的报警信息进行处理。
在该技术方案中,可以根据每条报警信息的属性更改发出该报警信息的设备的报警级别,比如,当发出报警信息的设备的类型为网络中的核心设备时,可以为它的报警级别增加一级,如果该设备的报警频率为每分钟一百次,超过了预定频率标准的每分钟十次,则可以为它的报警级别再增加一级。根据这一方法对每个设备的报警级别进行重新调整,再比较调整后的报警级别,可选出报警级别最高的设备,并优先处理这一设备发出的报警信息。再比如,通过报警信息的报警路径可以确定每个设备向哪些设备输出信息,从而可以按输出端从多到少的顺序对设备进行排查,以更加快速地确定故障源,在处理完报警级别最高的设备的报警信息后,如果还不断接收到报警信息,则可以对剩余的设备继续进行报警级别的调整,这样循环往复,直至解决所有故障信息为止。通过该技术方案,可以根据报警信息的属性调整和评估报警设备的报警级别,而评估报警级别的依据可以是报警信息的多个属性中的一个或几个,从而可以优先处理在某一属性或综合属性方面较为重要的设备发出的报警信息,从而达到快速、准确地定位故障源的目的,提升故障排除的效率,降低故障损失。
在上述技术方案中,优选地,报警信息的属性包括:发出报警信息的设备的报警级别;以及以下至少之一或其组合:报警信息的报警频度;报警信息的类型;发出报警信息的设备的类型;报警信息的报警路径。
在该技术方案中,报警信息中含有设备的初始报警级别和至少一种属性信息,报警信息的属性包括但不限于报警频度、报警信息类型、报警设备类型与报警路径,在进行故障排查时,可以选用其中一种属性作为调整报警级别的指标,也可以选择多种属性作为调整报警级别的综合指标。比如,根据报警频度和报警信息类型来调整设备A和B的报警级别,设备A每小时发出一次CPU报警信息,由于CPU报警被认为是重要告警类型,因此可以将设备A的报警级别调高一级,或者根据用户的需要或其他定义规则调高多级,而设备B每小时发出两次网络报警信息,由于网络报警为普通报警类型,不需要为设备B增加报警级别,但设备B的报警频度是一小时两次,比设备A的报警频度高出一倍,则也可以将设备B的报警级别调高一级,或者根据用户的需要或其他定义规则调高多级。
在上述技术方案中,优选地,步骤104具体包括:根据报警信息的属性,确定对每个设备的报警级别的权重的调整值;将调整值与权重相加,得到调整后的每个设备的报警级别的权重。
在该技术方案中,根据各属性确定对报警级别的权重的增加值,并将增加该增加值后的权重设置为设备最终的报警级别。比如,在上述设备A和B的例子中,根据设备A的报警信息的类型和报警频度确定设备A的报警级别权重的增加值为1,同样,根据设备B的报警信息的类型和报警频度确定设备B的报警级别权重的增加值也为1,如果设备A和设备B的初始报警级别分别为2和1,那么调整后的设备A和设备B的报警级别分别为3和2。
在上述技术方案中,优选地,当报警信息的属性为报警信息的报警路径时,步骤104具体包括:获取每个设备在每条报警路径中的输出端设备的数量值;将每条报警路径中的输出端设备的数量值相加,得到每个设备的输出端设备的总数量值;将总数量值设置为调整值。
在该技术方案中,多个设备构成的网络中总是具有很多条输入输出路径,那么,经过设备的报警路径越多,该设备是故障源的几率越大,以及设备在一条报警路径中下方的输出设备越多,该设备是故障源的几率也越大。因此,通过本技术方案,可以在复杂的网络中选出作为最多个设备的输出源头的源设备,如果源设备确实发生故障,则直接对源设备的报警信息进行处理,如果经排查确定源设备未发生故障,则在网络中删除源设备及源设备的多条输出路径后,可重新估算剩余设备的报警级别,以选出下一个源设备。这样循环往复,直至故障解除为止。每次选出的源设备都是当前输出端最多的设备,即最有可能造成当前网络故障的设备,从而使排查范围以最快的速度进行收敛,提升了排查的效率。
在上述技术方案中,优选地,还包括:根据接收到的更改命令,更改设备的报警级别。
在该技术方案中,设备的初始报警级别和调整后的报警级别都可以根据实际需要进行更改,比如,一个设备虽然不是网络中的核心设备,其发出的故障信息也不是高级的故障信息,但是该设备是使用年龄超过十年的老设备,其成为故障源的可能性就会很高,再比如,网络中的大部分设备刚刚经过年检,并且年检结果合格,而唯独某个设备还未经过年检,因此,用户在进行故障排查时,可以适当地提升这些设备的报警级别,从而提升故障排查的效率。
图2示出了根据本发明的另一个实施例的报警信息处理方法的流程图。
如图2所示,根据本发明的另一个实施例的报警信息处理方法,包括以下步骤:
步骤202,接收网络内的设备发出的报警信息。其中,报警信息包括:报警设备的编号、报警频度、报警路径、报警类型、报警级别等。
步骤204,根据设备的报警频度和报警类型来调整设备的报警级别,或根据报警信息的报警路径再次调整设备的报警级别,或先后根据报警频度、报警类型、报警路径调整设备的报警级别。其中,根据报警路径调整设备的报警级别,具体包括:分析每个设备节点之间的输入输出关系或先后关系,在相邻节点中,设置输入节点比输出节点的优先级高一级,根据这一原理逐级确定各设备节点的优先级,从而确定优先级最高的设备节点,比如,设备A的输出连到设备B的输入,所以设备B的报警信息可能是由设备A导致的,所以设备A的报警信息更重要,因此,可以为设备A的报警级别动态加1。
步骤206,处理报警级别最高的设备发出的报警信息,并在处理完成后,返回步骤202。
步骤208,判断是否继续接收到网络内的设备发出的报警信息,当判断结果为是时,返回步骤204,当判断结果为否时,结束进程。
通过该技术方案,可以根据报警信息的属性调整报警设备的报警级别,而调整报警级别的依据可以是报警信息的一种属性,也可以是多种属性的集合,从而可以根据调整后的报警级别优先处理在某一属性或综合属性方面较为重要的设备发出的报警信息,使排查范围以最快的速度进行收敛,从而达到快速、准确地定位故障源的目的,提升了故障排除的效率,降低了故障损失。
图3A和图3B示出了根据本发明的再一个实施例的报警信息处理方法中用于排查故障设备的网络拓扑图。
如图3A所示,当报警管理台接收到了来自设备A至G的每小时一次的报警信息,假设设备A至G中每个设备的初始报警级别都为1,即A=1、B=1、C=1、D=1、E=1、F=1、G=1,可根据报警路径进行分析如下:
B的报警信息来源于A,则为A的报警级别加1,用B→A+1表示,即:B=1,A=2;
E的报警信息来源于C,则C的报警级别加1,用E→C+1表示,即:E=1,C=2;
G的报警信息来源于E,则E的报警级别加1,用G→E+1表示,即:G=1,E=2,C=3;
D的报警信息来源于B,则B的报警级别加1,用D→B+1表示,即:D=1,B=2,A=3;
D的报警信息也来源于E,则E的报警级别加1,用D→E+1表示,即:D=1,E=3,C=4;
F的报警信息来源于D,则D的报警级别加1,用F→D+1表示,即:F=1,D=2,B=3,A=4,E=4,C=5;
因此,调整后的各设备的报警级别分别是:A=4、B=3、C=5、D=2、E=4、F=1、G=1,按照对最高级别设备的报警信息优先处理的原则,优先处理C设备的报警信息,在处理完C设备的报警信息后,根据报警管理台接收到最新报警,重新根据报警路径进行计算,得到如图3B所示的网络拓扑图。
如图3B所示,假设在C的故障消除后,它的下一级节点的报警信息也被消除,那么,发出报警信息的设备就只剩下A、B、D、F,根据报警路径进行分析如下:
B的报警来源于A,则A的报警级别加1,用B→A+1表示,即:B=1,A=2;
D的报警来源于B,则B的报警级别加1,用D→B+1表示,即:D=1,B=2,A=3;
F的报警来源于D,则D的报警级别+1,用F→D加1表示,即:F=1,D=2,B=3,A=4;
因此,调整后的各设备的报警级别分别是:A=4、B=3、D=2、F=1,按照对最高级别设备的报警信息优先处理的原则,优先处理A设备的报警信息,然后再按照上述方法进行递归处理,逐级处理最高报警级别的设备发出的报警信息,这样可以将故障排查的范围最快收敛,从而提升故障排除的效率。
图4示出了根据本发明的一个实施例的报警信息处理装置的框图。
如图4所示,根据本发明的一个实施例的报警信息处理装置400,包括:接收单元402,接收来自多个设备的报警信息;调整单元404,根据报警信息的属性,调整多个设备中的每个设备的报警级别;处理单元406,根据接收到的选择命令,选择调整后的报警级别最高的设备发出的报警信息进行处理。
在该技术方案中,可以根据每条报警信息的属性更改发出该报警信息的设备的报警级别,比如,当发出报警信息的设备的类型为网络中的核心设备时,可以为它的报警级别增加一级,如果该设备的报警频率为每分钟一百次,超过了预定频率标准的每分钟十次,则可以为它的报警级别再增加一级。根据这一方法对每个设备的报警级别进行重新调整,再比较调整后的报警级别,可选出报警级别最高的设备,并优先处理这一设备发出的报警信息。再比如,通过报警信息的报警路径可以确定每个设备向哪些设备输出信息,从而可以按输出端从多到少的顺序对设备进行排查,以更加快速地确定故障源,在处理完报警级别最高的设备的报警信息后,如果还不断接收到报警信息,则可以对剩余的设备继续进行报警级别的调整,这样循环往复,直至解决所有故障信息为止。通过该技术方案,可以根据报警信息的属性调整和评估报警设备的报警级别,而评估报警级别的依据可以是报警信息的多个属性中的一个或几个,从而可以优先处理在某一属性或综合属性方面较为重要的设备发出的报警信息,从而达到快速、准确地定位故障源的目的,提升故障排除的效率,降低故障损失。
在上述技术方案中,优选地,报警信息的属性包括:发出报警信息的设备的报警级别;以及以下至少之一或其组合:报警信息的报警频度;报警信息的类型;发出报警信息的设备的类型;报警信息的报警路径。
在该技术方案中,报警信息中含有设备的初始报警级别和至少一种属性信息,报警信息的属性包括但不限于报警频度、报警信息类型、报警设备类型与报警路径,在进行故障排查时,可以选用其中一种属性作为调整报警级别的指标,也可以选择多种属性作为调整报警级别的综合指标。比如,根据报警频度和报警信息类型来调整设备A和B的报警级别,设备A每小时发出一次CPU报警信息,由于CPU报警被认为是重要告警类型,因此可以将设备A的报警级别调高一级,或者根据用户的需要或其他定义规则调高多级,而设备B每小时发出两次网络报警信息,由于网络报警为普通报警类型,不需要为设备B增加报警级别,但设备B的报警频度是一小时两次,比设备A的报警频度高出一倍,则也可以将设备B的报警级别调高一级,或者根据用户的需要或其他定义规则调高多级。
在上述技术方案中,优选地,调整单元404包括:确定单元4042,根据报警信息的属性,确定对每个设备的报警级别的权重的调整值;以及调整单元404用于:将调整值与权重相加,得到调整后的每个设备的报警级别的权重。
在该技术方案中,根据各属性确定对报警级别的权重的增加值,并将增加该增加值后的权重设置为设备最终的报警级别。比如,在上述设备A和B的例子中,根据设备A的报警信息的类型和报警频度确定设备A的报警级别权重的增加值为1,同样,根据设备B的报警信息的类型和报警频度确定设备B的报警级别权重的增加值也为1,如果设备A和设备B的初始报警级别分别为2和1,那么调整后的设备A和设备B的报警级别分别为3和2。
在上述技术方案中,优选地,当报警信息的属性为报警信息的报警路径时,确定单元4042用于:获取每个设备在每条报警路径中的输出端设备的数量值,将每条报警路径中的输出端设备的数量值相加,并将相加得到的每个设备的输出端设备的总数量值设置为调整值。
在该技术方案中,多个设备构成的网络中总是具有很多条输入输出路径,那么,经过设备的报警路径越多,该设备是故障源的几率越大,以及设备在一条报警路径中下方的输出设备越多,该设备是故障源的几率也越大。因此,通过本技术方案,可以在复杂的网络中选出作为最多个设备的输出源头的源设备,如果源设备确实发生故障,则直接对源设备的报警信息进行处理,如果经排查确定源设备未发生故障,则在网络中删除源设备及源设备的多条输出路径后,可重新估算剩余设备的报警级别,以选出下一个源设备。这样循环往复,直至故障解除为止。每次选出的源设备都是当前输出端最多的设备,即最有可能造成当前网络故障的设备,从而使排查范围以最快的速度进行收敛,提升了排查的效率。
在上述技术方案中,优选地,还包括:更改单元408,根据接收到的更改命令,更改设备的报警级别。
在该技术方案中,设备的初始报警级别和调整后的报警级别都可以根据实际需要进行更改,比如,一个设备虽然不是网络中的核心设备,其发出的故障信息也不是高级的故障信息,但是该设备是使用年龄超过十年的老设备,其成为故障源的可能性就会很高,再比如,网络中的大部分设备刚刚经过年检,并且年检结果合格,而唯独某个设备还未经过年检,因此,用户在进行故障排查时,可以适当地提升这些设备的报警级别,从而提升故障排查的效率。
图5示出了根据本发明的另一个实施例的报警信息处理装置的框图。
如图5所示,根据本发明的另一个实施例的报警信息处理装置500,包括:故障报警模块502,用于向报警管理台上传网络设备的报警信息;报警管理台模块504,用于接收来自故障报警模块502的网络设备的报警信息,并对报警信息进行分析和调整,并将分析和调整的结果发送至故障排除模块506;故障排除模块506,用于接收来自报警管理台模块504的分析和调整结果,以根据该结果处理故障,并在处理完成后将处理结果发送至报警管理台模块504,以供报警管理台模块504重新分析剩余故障节点的情况,从而迅速缩小故障排查范围,快速定位报警源,提升故障排除的效率。
其中,报警管理台接受到报警信息后,可查询报警信息的源头,并将报警设备的报警级别按照报警来源节点逐级跟踪,在相邻节点中,设置输入节点比输出节点的优先级高一级,根据这一原理逐级确定各设备节点的优先级,从而确定优先级最高的设备节点。
在本发明中,术语“多个”表示两个或两个以上。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
以上结合附图详细说明了本发明的技术方案,通过本发明的技术方案,可以根据报警信息的属性调整报警设备的报警级别,而调整报警级别的依据可以是报警信息的一种属性,也可以是多种属性的集合,从而可以根据调整后的报警级别优先处理在某一属性或综合属性方面较为重要的设备发出的报警信息,使排查范围以最快的速度进行收敛,从而达到快速、准确地定位故障源的目的,提升了故障排除的效率,降低了故障损失。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种报警信息处理方法,其特征在于,包括:
接收来自多个设备的报警信息;
根据所述报警信息的属性,调整所述多个设备中的每个设备的报警级别;
根据接收到的选择命令,选择调整后的所述报警级别最高的所述设备发出的所述报警信息进行处理。
2.根据权利要求1所述的报警信息处理方法,其特征在于,所述报警信息的属性包括:
发出所述报警信息的所述设备的报警级别;以及
以下至少之一或其组合:
所述报警信息的报警频度;
所述报警信息的类型;
发出所述报警信息的所述设备的类型;
所述报警信息的报警路径。
3.根据权利要求2所述的报警信息处理方法,其特征在于,所述根据所述报警信息的属性,调整所述多个设备中的每个设备的报警级别,具体包括:
根据所述报警信息的属性,确定对每个所述设备的所述报警级别的权重的调整值;
将所述调整值与所述权重相加,得到调整后的每个所述设备的所述报警级别的权重。
4.根据权利要求3所述的报警信息处理方法,其特征在于,当所述报警信息的属性为所述报警信息的报警路径时,所述确定每个所述设备的所述报警级别的调整值,具体包括:
获取每个所述设备在每条所述报警路径中的输出端设备的数量值;
将每条所述报警路径中的所述输出端设备的所述数量值相加,得到每个所述设备的所述输出端设备的总数量值;
将所述总数量值设置为所述调整值。
5.根据权利要求2至4中任一项所述的报警信息处理方法,其特征在于,还包括:
根据接收到的更改命令,更改所述设备的所述报警级别。
6.一种报警信息处理装置,其特征在于,包括:
接收单元,接收来自多个设备的报警信息;
调整单元,根据所述报警信息的属性,调整所述多个设备中的每个设备的报警级别;
处理单元,根据接收到的选择命令,选择调整后的所述报警级别最高的所述设备发出的所述报警信息进行处理。
7.根据权利要求6所述的报警信息处理装置,其特征在于,所述报警信息的属性包括:
发出所述报警信息的所述设备的报警级别;以及
以下至少之一或其组合:
所述报警信息的报警频度;
所述报警信息的类型;
发出所述报警信息的所述设备的类型;
所述报警信息的报警路径。
8.根据权利要求7所述的报警信息处理装置,其特征在于,所述调整单元包括:
确定单元,根据所述报警信息的属性,确定对每个所述设备的所述报警级别的权重的调整值;以及
所述调整单元用于:
将所述调整值与所述权重相加,得到调整后的每个所述设备的所述报警级别的权重。
9.根据权利要求8所述的报警信息处理装置,其特征在于,当所述报警信息的属性为所述报警信息的报警路径时,所述确定单元用于:
获取每个所述设备在每条所述报警路径中的输出端设备的数量值,将每条所述报警路径中的所述输出端设备的所述数量值相加,并将相加得到的每个所述设备的所述输出端设备的总数量值设置为所述调整值。
10.根据权利要求7至9中任一项所述的报警信息处理装置,其特征在于,还包括:
更改单元,根据接收到的更改命令,更改所述设备的所述报警级别。
CN201410579037.4A 2014-10-24 2014-10-24 报警信息处理方法和报警信息处理装置 Active CN104270277B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410579037.4A CN104270277B (zh) 2014-10-24 2014-10-24 报警信息处理方法和报警信息处理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410579037.4A CN104270277B (zh) 2014-10-24 2014-10-24 报警信息处理方法和报警信息处理装置

Publications (2)

Publication Number Publication Date
CN104270277A true CN104270277A (zh) 2015-01-07
CN104270277B CN104270277B (zh) 2018-07-10

Family

ID=52161771

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410579037.4A Active CN104270277B (zh) 2014-10-24 2014-10-24 报警信息处理方法和报警信息处理装置

Country Status (1)

Country Link
CN (1) CN104270277B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104867292A (zh) * 2015-03-26 2015-08-26 青岛海尔智能家电科技有限公司 一种智能报警方法及装置
CN110362062A (zh) * 2019-07-12 2019-10-22 上海瀚银信息技术有限公司 一种故障自动处理***
CN110447215A (zh) * 2017-11-10 2019-11-12 华为技术有限公司 应用软件恶意行为的动态告警方法和终端
CN111899568A (zh) * 2020-07-17 2020-11-06 广州忘平信息科技有限公司 桥梁防撞预警***、方法、装置和存储介质
CN111915268A (zh) * 2020-07-21 2020-11-10 北京厚德邦安科技有限责任公司 基于化工行业dcs报警变更的标准化管理方法
CN115242611A (zh) * 2022-07-21 2022-10-25 北京天一恩华科技股份有限公司 一种网络故障报警级别管理方法、装置、设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002086750A1 (en) * 2001-03-02 2002-10-31 Computer Associates Think, Inc. System and method for filtering messages based on context
CN1954310A (zh) * 2004-05-12 2007-04-25 思科技术公司 用于网络报警类选的方法和装置
CN102368714A (zh) * 2011-11-09 2012-03-07 华为技术有限公司 一种网络告警的处理方法、装置及其***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002086750A1 (en) * 2001-03-02 2002-10-31 Computer Associates Think, Inc. System and method for filtering messages based on context
CN1954310A (zh) * 2004-05-12 2007-04-25 思科技术公司 用于网络报警类选的方法和装置
CN102368714A (zh) * 2011-11-09 2012-03-07 华为技术有限公司 一种网络告警的处理方法、装置及其***

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104867292A (zh) * 2015-03-26 2015-08-26 青岛海尔智能家电科技有限公司 一种智能报警方法及装置
CN110447215A (zh) * 2017-11-10 2019-11-12 华为技术有限公司 应用软件恶意行为的动态告警方法和终端
CN110447215B (zh) * 2017-11-10 2021-02-12 华为技术有限公司 应用软件恶意行为的动态告警方法和终端
CN110362062A (zh) * 2019-07-12 2019-10-22 上海瀚银信息技术有限公司 一种故障自动处理***
CN111899568A (zh) * 2020-07-17 2020-11-06 广州忘平信息科技有限公司 桥梁防撞预警***、方法、装置和存储介质
CN111899568B (zh) * 2020-07-17 2021-09-07 广州忘平信息科技有限公司 桥梁防撞预警***、方法、装置和存储介质
CN111915268A (zh) * 2020-07-21 2020-11-10 北京厚德邦安科技有限责任公司 基于化工行业dcs报警变更的标准化管理方法
CN115242611A (zh) * 2022-07-21 2022-10-25 北京天一恩华科技股份有限公司 一种网络故障报警级别管理方法、装置、设备和存储介质
CN115242611B (zh) * 2022-07-21 2023-10-03 北京天一恩华科技股份有限公司 一种网络故障报警级别管理方法、装置、设备和存储介质

Also Published As

Publication number Publication date
CN104270277B (zh) 2018-07-10

Similar Documents

Publication Publication Date Title
CN104270277A (zh) 报警信息处理方法和报警信息处理装置
US10805174B2 (en) Using machine learning to monitor link quality and predict link faults
CN113328872B (zh) 故障修复方法、装置和存储介质
Zhao et al. Towards unbiased end-to-end network diagnosis
KR101645598B1 (ko) 네트워크에서의 침입 탐지 방법
US9369364B2 (en) System for analysing network traffic and a method thereof
US20200272923A1 (en) Identifying locations and causes of network faults
CN107735986A (zh) 模拟、可视化和搜索在软件定义网络中的流量
KR20180120558A (ko) 딥러닝 기반 통신망 장비의 장애 예측 시스템 및 방법
CN113938407B (zh) 基于带内网络遥测***的数据中心网络的故障检测方法及装置
JP2014068283A (ja) ネットワーク障害検出システムおよびネットワーク障害検出装置
CN109521327A (zh) 一种配电线路故障原因综合概率分析方法
CN107210927A (zh) 协议处理中的异常检测
US20160226714A1 (en) Method and device for monitoring network link and storage medium therefor
US9935832B2 (en) Automated placement of measurement endpoint nodes in a network
CN105960779A (zh) 具有基于机器学习的路由模型的数据路由
CN111651859B (zh) 一种通信卫星星座***弹性性能的评估方法及装置
CN107124365B (zh) 一种基于机器学习的路由策略的获取***
CN109558727A (zh) 一种路由安全检测方法和***
KR20190001501A (ko) 통신망의 인공지능 운용 시스템 및 이의 동작 방법
Fonseca et al. Bgp dataset generation and feature extraction for anomaly detection
JP7173273B2 (ja) 障害分析装置、障害分析方法および障害分析プログラム
Chilwan et al. On modeling controller-switch interaction in openflow based sdns
JP2016225772A (ja) 異常検出方法、異常検出装置、及びネットワークシステム
Booker et al. Efficient traffic loss evaluation for transport backbone networks

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant