CN107040395A - 一种告警信息的处理方法、装置和*** - Google Patents

一种告警信息的处理方法、装置和*** Download PDF

Info

Publication number
CN107040395A
CN107040395A CN201610075817.4A CN201610075817A CN107040395A CN 107040395 A CN107040395 A CN 107040395A CN 201610075817 A CN201610075817 A CN 201610075817A CN 107040395 A CN107040395 A CN 107040395A
Authority
CN
China
Prior art keywords
node
link
alarm
warning information
root
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610075817.4A
Other languages
English (en)
Other versions
CN107040395B (zh
Inventor
赵子青
聂鑫
梁定安
杨波
黄浩宇
张兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Tencent Cloud Computing Beijing Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201610075817.4A priority Critical patent/CN107040395B/zh
Priority to KR1020187015309A priority patent/KR102131160B1/ko
Priority to PCT/CN2017/072112 priority patent/WO2017133522A1/zh
Priority to EP17746842.8A priority patent/EP3413512B1/en
Priority to US15/774,032 priority patent/US11190390B2/en
Publication of CN107040395A publication Critical patent/CN107040395A/zh
Application granted granted Critical
Publication of CN107040395B publication Critical patent/CN107040395B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/064Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • H04L41/0622Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time based on time
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • H04L41/0627Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time by acting on the notification or alarm source
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/065Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/02Capturing of monitoring data
    • H04L43/028Capturing of monitoring data by filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1061Peer-to-peer [P2P] networks using node-based peer discovery mechanisms

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例公开了一种告警信息的处理方法、装置和***;本发明实施例采用接收第一节点在第一时刻产生的告警信息后,若确定该告警信息为根源告警,则获取包含第一节点的链路,得到第一链路集,在该第一链路集的链路中查找位置位于第一节点前,并在第一时刻的前后预设时间范围内产生过告警信息的节点,得到第二节点,然后,对第二节点重新进行告警根源分析,并将分析结果通知给用户;该方案可以提高告警分析的完整性和准确性,从而使得可以及时发现故障或异常,有利于提高***的稳定性和安全性。

Description

一种告警信息的处理方法、装置和***
技术领域
本发明涉及通信技术领域,具体涉及一种告警信息的处理方法、装置和***。
背景技术
集群,指的是将多个***连接到一起,使多台服务器能够像一台机器那样工作或者看起来好像一台机器的相关技术。通过集群技术,可以提高***的稳定性和网络中心的数据处理能力及服务能力。
集群中的应用只在一台服务器上运行,如果这个应用出现故障,其它的某台服务器会重新启动这个应用,接管位于共享磁盘柜上的数据区,进而使应用重新正常运转。但是,由于整个应用的切换过程中需要花费一定的时间,因此,会导致一定的延迟,影响整个集群***的性能,所以,提前获知设备故障或***异常显得极为重要。为此,现有技术提出了告警技术,即当设备发生故障或某些原因导致集群***发生不正常的工作状态时,集群***能够根据不同类型的故障及不同模块出现的故障产生告警信息,然后,基于这些告警信息进行告警分析,并将分析结果通知给用户,以便用户可以及时对故障或异常进行处理。
在对现有技术的研究和实践过程中,本发明的发明人发现,现有的很多告警,常常会因各种原因而产生延时,使得后续在告警分析时,无法及时获取到完整的告警信息,最终导致分析不准确,从而无法及时发现故障或异常,影响***的稳定性和安全性。
发明内容
本发明实施例提供一种告警信息的处理方法、装置和***,可以提高告警分析的完整性和准确性,从而使得可以及时发现故障或异常,有利于提高***的稳定性和安全性。
本发明实施例提供一种告警信息的处理方法,包括:
接收第一节点在第一时刻产生的告警信息;
确定所述告警信息为根源告警时,获取包含第一节点的链路,得到第一链路集;
在所述第一链路集的链路中查找位置位于第一节点前,并在第一时刻的前后预设时间范围内产生过告警信息的节点,得到第二节点;
对所述第二节点进行告警根源分析,并将分析结果通知给用户。
相应的,本发明实施例还提供一种告警信息的处理装置,包括:
接收单元,用于接收第一节点在第一时刻产生的告警信息,得到第一链路集;
获取单元,用于确定所述告警信息为根源告警时,获取包含第一节点的链路;
查找单元,用于在所述第一链路集的链路中查找位置位于第一节点前,并在第一时刻的前后预设时间范围内产生过告警信息的节点,得到第二节点;
处理单元,用于对所述第二节点进行告警根源分析,并将分析结果通知给用户。
此外,本发明实施例还提供一种集群***,包括本发明实施例所提供的任一种告警信息的处理装置。
本发明实施例采用接收第一节点在第一时刻产生的告警信息后,若确定该告警信息为根源告警,则获取包含第一节点的链路,得到第一链路集,在该第一链路集的链路中查找位置位于第一节点前,并在第一时刻的前后预设时间范围内产生过告警信息的节点,得到第二节点,然后,对第二节点重新进行告警根源分析,并将分析结果通知给用户,从而达到动态分析告警的根源的目的,弥补了因某些告警信息延时发出而导致的分析不准的问题,大大提高了告警分析的完整性和准确性,从而便于用户可以及时发现故障或异常,有利于提高***的稳定性和安全性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a是本发明实施例提供的集群***的场景示意图;
图1b是本发明实施例提供的告警信息的处理方法的流程图;
图2a是本发明实施例提供的告警信息的处理方法的另一流程图;
图2b是本发明实施例提供的告警信息的处理方法中的链路示意图;
图2c是本发明实施例提供的告警信息的处理方法中的过滤后的链路示意图;
图2d是本发明实施例提供的告警信息的处理方法中告警模块和链路叠加后的链路示意图;
图2e是本发明实施例提供的告警信息的处理方法中进行告警根源分析的链路示意图;
图2f是本发明实施例提供的告警信息的处理方法中的一链路示意图;
图3是本发明实施例提供的告警信息的处理装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种告警信息的处理方法、装置和***。
参见图1a,集群***可以包括控制设备,该控制设备可以包括本发明实施例所提供的任一种告警信息的处理装置,此外,该集群***还可以包括多个节点,比如,节点A、节点B、节点C,……节点N,等等,这些节点用于对该集群***中的数据进行处理,以提供相应的服务,并且,可以在确定发生故障或异常时产生告警信息,并向控制设备发送该告警信息。而控制设备在接收到该告警信息后,可以对该告警信息进行判断,若确定为根源告警,则获取包含该告警节点(比如,如果节点A发送告警信息,则节点A为告警节点)的链路,在该链路中查找位置位于该告警节点前,并在该告警时间的前后预设时间范围内,比如以该告警时间为基准,前8个时间窗口以及后4个时间窗口内,产生过告警信息的节点,然后,对这些节点重新进行告警根源分析,并将分析结果通知给用户;否则,若确定该告警信息不是根源告警,则可以直接忽略。
以下将分别进行详细说明。
实施例一、
本实施例将从告警信息的处理装置的角度进行描述,该告警信息的处理装置具体可以集成在集群***的控制设备中,该控制设备具体可以为控制服务器或调控服务器等设备。
一种告警信息的处理方法,包括:接收第一节点在第一时刻产生的告警信息;确定该告警信息为根源告警时,获取包含第一节点的链路,得到第一链路集;在该第一链路集的链路中查找位置位于第一节点前,并在第一时刻的前后预设时间范围内产生过告警信息的节点,得到第二节点;对该第二节点进行告警根源分析,并将分析结果通知给用户。
如图1b所示,该告警信息的处理方法的具体流程可以如下:
101、接收第一节点在第一时刻产生的告警信息。
需说明的是,由于可能会产生延迟,所以,第一节点产生告警信息的时间(即第一时刻)与发送该告警信息的时间有可能不同,比如,节点C0在12:00点产生的告警信息,可能在12:30点才发出。
102、确定该告警信息为根源告警时,获取包含第一节点的链路(业务链路),得到第一链路集。
其中,根源告警的内容具体可以根据实际应用的需求进行设置,比如,该根源告警可以包括节点发布变更、节点机器丢包、节点下程序崩溃、节点下机器死机和/或节点下专线拥塞等告警,即步骤“确定该告警信息为根源告警时,获取包含第一节点的链路”具体可以为:
确定该告警信息指示节点发布变更、节点机器丢包、节点下程序崩溃、节点下机器死机和/或节点下专线拥塞时,获取包含第一节点的链路,得到第一链路集。
例如,如果该告警信息是由节点C0发出的,则此时可以获取包含节点C0的链路,然后,将这些包含节点C0的链路添加到第一链路集中,等等。
103、在该第一链路集的链路中查找位置位于第一节点前,并在第一时刻的前后预设时间范围内产生过告警信息的节点,得到第二节点。
其中,该时间范围可以根据实际应用的需求进行设置,比如,可以设置为在以第一时刻的时间窗为基准,在该基准的前八个时间窗内,以及后四个时间窗内,即步骤“在该链路中查找位置位于第一节点前,并在第一时刻的前后预设时间范围内产生过告警信息的节点,得到第二节点”具体可以如下:
在该第一链路集的链路中查找位置位于第一节点前的节点,得到候选节点,在该候选节点中查找在第一时刻的前八个时间窗内,以及后四个时间窗内产生过告警信息的节点,得到第二节点。
其中,该时间窗口的大小可以根据实际应用的需求进行设置。
例如,以第一节点为节点C0,且一个时间窗为5分钟为例进行说明,如果节点C0产生告警信息的时间为12:00点,则此时,可以查找在这些链路(即第一链路集的链路)中,位置位于C0前的节点,得到候选节点,然后,在这些候选节点中查找11:20~12:20之间产生过告警信息的节点(即告警节点),比如,节点A、节点B和节点D,则此时,便可以确定第二节点为:节点A、节点B和节点D。
104、对该第二节点进行告警根源分析,并将分析结果通知给用户,例如,可以如下:
(1)提取包含第二节点的链路,得到第二链路集。
比如,以第二节点为节点A为例,则此时,可以获取包括节点A的链路,得到第二链路集。
(2)根据第二节点的调用关系对该第二链路集中的链路进行过滤,得到有效链路。
例如,还是以第二节点为节点A为例,则此时,可以根据节点A的主调关系、以及被调关系来进行过滤,比如节点A的下一跳被调有节点B0、节点B2和节点B4三个节点,那么,便可以从该第二链路集中提取出包括有“A—>B0”、“A—>B2”和“A—>B4”的链路,得到有效链路,而过滤掉其他不包括“A—>B0”、“A—>B2”和“A—>B4”的无效链路。
其中,主调指的是主动调用,比如主动调用别的节点;被调指的是被动调用,比如被别的节点调用。例如,如果A节点调用B节点,则A节点相对于B节点而言,则为主调,B节点为被调。
(3)根据该有效链路对该第二节点进行告警根源分析,比如可以如下:
A、确定第二节点的告警时间,得到第二时刻;
B、从该有效链路中获取在第二时刻的前后预设时间范围内产生过告警信息的节点,得到第三节点。
其中,该时间范围可以根据实际应用的需求进行设置,比如,可以以该第二时刻的时间窗口为基准,从该有效链路中确定该基准前八个时间窗内,以及后四个时间窗内产生过告警信息的节点,得到第三节点。
其中,该时间窗口的大小可以根据实际应用的需求进行设置。
可选的,为了便于对告警节点进行管理,可以设置一告警模块接收池,用于对各个告警节点,以及各个告警节点所产生的告警信息进行管理,其中,该告警模块接收池中可以包括多个告警模块,每一告警模块对应一个告警节点。
例如,以该告警信息的处理装置中设置有告警模块接收池为例,则此时,步骤“从所述有效链路中获取在第二时刻的前后预设时间范围内产生过告警信息的节点,得到第三节点”具体可以如下:
(a)从告警模块接收池中获取在第二时刻的前后预设时间范围内产生过告警信息的模块,得到目标告警模块;
其中,该时间范围可以根据实际应用的需求进行设置,比如,可以设置为在以第二时刻的时间窗为基准,在该基准的前八个时间窗内,以及后四个时间窗内,即步骤“从告警模块接收池中获取在第二时刻的前后预设时间范围内产生过告警信息的模块,得到目标告警模块”具体可以如下:
以该第二时刻的时间窗口为基准,从告警模块接收池中获取该基准前八个时间窗内,以及后四个时间窗内产生过告警信息的模块,得到目标告警模块。
其中,该时间窗口的大小可以根据实际应用的需求进行设置。
例如,以第二时刻为12:00点,且一个时间窗为5分钟为例进行说明,则此时,可以从告警模块接收池中获取11:20~12:20之间产生过告警信息的模块,得到目标告警模块,比如,该目标告警模块的模块标识分别为:A和D2
(b)将目标告警模块与该有效链路进行叠加,以确定在第二时刻的前后预设时间范围内产生过告警信息的节点,得到第三节点。
比如,叠加后,目标告警模块A所对应的节点为节点A,目标告警模块D2所对应的节点为节点D2,则此时,可以确定第三节点为:节点A和节点D2
C、分析第三节点的告警内容,以确定该告警内容是否为根源告警,若为根源告警,则执行步骤D,若不是根源告警,则执行步骤E。
比如,可以分析第三节点的告警内容,以确定该告警内容是否包括节点发布变更、节点机器丢包、节点下程序崩溃、节点下机器死机和节点下专线拥塞中任意一种,若是,则确定该告警内容为根源告警,若否,则确定该告警内容不是根源告警。
D、确定为根源告警时,将该第三节点作为第一节点,并返回执行获取包含第一节点的链路的步骤,即返回执行步骤102,采用上述方式(即步骤102~104的方法)进行分析。
E、确定不是根源告警时,执行将分析结果写入库表,并将分析结果通知给用户的步骤,即执行步骤104中的步骤(4),如下:
(4)将分析结果写入库表,并将分析结果通知给用户。
由上可知,本实施例采用接收第一节点在第一时刻产生的告警信息后,若确定该告警信息为根源告警,则获取包含第一节点的链路,得到第一链路集,在该第一链路集的链路中查找位置位于第一节点前,并在第一时刻的前后预设时间范围内产生过告警信息的节点,得到第二节点,然后,对第二节点重新进行告警根源分析,并将分析结果通知给用户,从而达到动态分析告警的根源的目的,弥补了因某些告警信息延时发出而导致的分析不准的问题,大大提高了告警分析的完整性和准确性,从而便于用户可以及时发现故障或异常,有利于提高***的稳定性和安全性。
实施例二、
根据实施例一所描述的方法,以下将举例作进一步详细说明。
在本实施例中,将以该告警信息的处理装置具体集成在集群***的控制设备中为例进行说明。
如图2a所示,一种告警信息的处理方法,具体流程可以如下:
201、在第一时刻,控制设备接收节点A在第一时刻产生的告警信息。
比如,在12:00点时,控制设备接收节点A在12:00产生的告警信息。
202、控制设备根据该告警信息提取包含节点A的链路,得到第二链路集。
例如,参见图2b,该第二链路集可以包括6条链路,如下:
链路1(Link1):节点A->节点B0->节点C0->节点D0->节点E;
链路2(Link2):节点A->节点B1->节点C1->节点D1->节点E1
链路3(Link3):节点A->节点B2->节点C2->节点D2->节点E2
链路4(Link4):节点A->节点B3->节点C3->节点D3->节点E3
链路5(Link5):节点A->节点B4->节点C4->节点D4->节点E4
链路6(Link6):节点A->节点B5->节点C5->节点D5->节点E5
203、控制设备根据节点A的调用关系对该第二链路集中链路进行过滤,得到有效链路。
例如,可以根据节点A的主调关系、以及被调关系来进行过滤,比如节点A的下一跳被调有节点B0、节点B2和节点B4三个节点,那么,参见图2c,便可以从该第二链路集中提取出相应的链路,如下:
链路1(Link1):节点A->节点B0->节点C0->节点D0->节点E;
链路3(Link3):节点A->节点B2->节点C2->节点D2->节点E2
链路5(Link5):节点A->节点B4->节点C4->节点D4->节点E4
204、控制设备以第一时刻,比如12:00点告警的时间窗口为基准,从有效链路中获取该基准前八个时间窗内,以及后四个时间窗内产生过告警信息的节点,得到相应的告警节点,即第三节点。例如,可以如下:
(1)控制设备以第一时刻,比如12:00点告警的时间窗口为基准,从告警模块接收池中获取该基准前八个时间窗内,以及后四个时间窗内产生过告警信息的模块,得到目标告警模块。
其中,该时间窗口的大小可以根据实际应用的需求进行设置,比如,以一个时间窗为5分钟为例,则此时,可以从告警模块接收池中获取11:20~12:20点之间产生过告警信息的模块,得到目标告警模块。
例如,其中,11:20~12:20点之间告警模块接收池具体可以如表一所示:
表一:
比如,在这12个时间窗口内,告警模块接收池中有A、B2、D2、B4和C4这5个模块有告警,因此,可以得到目标告警模块:模块A、模块B2、模块D2、模块B4和模块C4
(2)控制设备将目标告警模块与该有效链路进行叠加,以确定相应的告警节点(即第三节点)。
例如,以目标告警模块包括模块A、模块B2、模块D2、模块B4和模块C4为例,则将目标告警模块与该有效链路进行叠加后,可以得到相应的告警节点(即第三节点),具体为:节点A、节点B2、节点D2、节点B4和节点C4,可参见图2d,其中,实线部分的节点即为告警节点,由于节点B2位于节点D2之前,节点B4位于节点C4之前,因此,除了可以对节点A、节点B2、节点D2、节点B4和节点C4均进行分析之外,也可以只对节点D2和节点C4进行分析(即执行步骤205)。
205、控制设备分析这些告警节点(即第三节点)的告警内容,以确定该告警内容是否为根源告警,若为根源告警,则执行步骤202,若不是根源告警,则执行步骤206。
例如,可以分析这些告警节点(即第三节点)的告警内容,以确定该告警内容是否包括节点发布变更、节点机器丢包、节点下程序崩溃、节点下机器死机和节点下专线拥塞等告警中的任意一种,若是,则确定该告警内容为根源告警,若否,则确定该告警内容不是根源告警。
比如,参见图2e,以告警节点C4和D2为例,由于告警节点C4为进程告警,而告警节点D2为自动化测试告警,都不属于根源告警,所以,可以执行步骤206。
206、由于不是根源告警,因此,控制设备将分析结果写入库表,并将分析结果通知给用户。
207、在第一时刻之后,比如在12:30分,控制设备接收到节点C0(即第一节点)发出的在第一时刻,即12:00产生的告警信息,确定该告警信息不是根源告警时,忽略该告警信息,确定该告警信息为根源告警时,获取包含节点C0的链路,得到包含节点C0的链路,得到第一链路集,然后执行步骤208。
例如,参见图2f,该第一链路集可以包括6条链路,如下:
链路1(Link1):节点A->节点B0->节点C0->节点D0->节点E;
链路2(Link2):节点A1->节点B1->节点C0->节点D1->节点E1
链路3(Link3):节点A2->节点B8->节点C0->节点D2->节点E2
链路4(Link4):节点A3->节点B3->节点C0->节点D3->节点E3
链路5(Link5):节点A4->节点B4->节点C0->节点D4->节点E4
链路6(Link6):节点A5->节点B5->节点C0->节点D5->节点E5
208、控制设备在步骤207所得到的第一链路集中的各条链路中进行查找,以确定位置位于节点C0之前的节点,得到候选节点,然后执行步骤209。
209、控制设备从这些候选节点中,以12:00点(即节点C0产生告警的时间,即第一时刻)告警的时间窗口为基准,获取该基准前八个时间窗内,以及后四个时间窗内产生过告警信息的节点,得到相应的告警节点(即第二节点),然后执行步骤210。
其中,该时间窗口的大小可以根据实际应用的需求进行设置,比如,以一个时间窗为5分钟为例,则此时,可以获取11:20~12:20点之间产生过告警信息的节点,比如可以包括:节点A、节点B8、节点A3、节点A4和节点A5,参见图2f。
210、控制设备对这些告警节点,比如节点A、节点B8、节点A3、节点A4和节点A5重新进行告警根源分析,并将分析结果通知给用户。
即对这些告警节点,比如节点A、节点B8、节点A3、节点A4和节点A5采用步骤202至206的方式,重新进行告警根源分析,将新的分析结果写入库表,并将新的分析结果通知给用户。
由上可知,本实施例采用接收告警节点产生的告警信息后,对该告警信息是否为根据告警进行判断,若确定为根源告警,则获取包含该告警节点的链路,得到第一链路集,在该第一链路集的链路中查找位置位于该告警节点前,并在该告警节点产生告警的时间的前后预设时间范围内产生过告警信息的节点,得到相应的其他告警节点,然后,对这些其他告警节点重新进行告警根源分析,并将分析结果通知给用户,从而达到动态分析告警的根源的目的,弥补了因某些告警信息延时发出而导致的分析不准的问题,大大提高了告警分析的完整性和准确性,从而便于用户可以及时发现故障或异常,有利于提高***的稳定性和安全性。
实施例三、
为了更好地实施以上方法,本发明实施例还提供一种告警信息的处理装置,如图3所示,该告警信息的处理装置包括接收单元301、获取单元302、查找单元303和处理单元304,如下:
(1)接收单元301;
接收单元301,用于接收第一节点在第一时刻产生的告警信息。
需说明的是,由于可能会产生延迟,所以,第一节点产生告警信息的时间(即第一时刻)与发送该告警信息的时间有可能不同,比如,节点C0在12:00点产生的告警信息,可能在12:30点才发出。
(2)获取单元302;
获取单元302,用于确定该告警信息为根源告警时,获取包含第一节点的链路,得到第一链路集。
其中,根源告警的内容具体可以根据实际应用的需求进行设置,比如,该根源告警可以包括节点发布变更、节点机器丢包、节点下程序崩溃、节点下机器死机和/或节点下专线拥塞等告警,即:
获取单元302,具体可以用于确定该告警信息指示节点发布变更、节点机器丢包、节点下程序崩溃、节点下机器死机和/或节点下专线拥塞等时,获取包含第一节点的链路,得到第一链路集。
(3)查找单元303;
查找单元303,用于在该第一链路集的链路中查找位置位于第一节点前,并在第一时刻的前后预设时间范围内产生过告警信息的节点,得到第二节点。
其中,该时间范围可以根据实际应用的需求进行设置,比如,可以设置为在以第一时刻的时间窗为基准,在该基准的前八个时间窗内,以及后四个时间窗内,即:
查找单元303,具体可以用于在该链路中查找位置位于第一节点前的节点,得到候选节点;在该候选节点中查找在第一时刻的前八个时间窗内,以及后四个时间窗内产生过告警信息的节点,得到第二节点。
其中,该时间窗口的大小可以根据实际应用的需求进行设置。
例如,以第一节点为节点C0,且一个时间窗为5分钟为例进行说明,如果节点C0产生告警信息的时间为12:00点,则此时,可以查找在这些链路中,位置位于C0前的节点,得到候选节点,然后,在这些候选节点中查找11:20~12:20之间产生过告警信息的节点(即告警节点),比如,节点A、节点B和节点D,则此时,便可以确定第二节点为:节点A、节点B和节点D。
(4)处理单元304;
处理单元304,该第二节点进行告警根源分析,并将分析结果通知给用户。
例如,处理单元304可以包括提取子单元、过滤子单元、分析子单元和通知子单元,如下:
提取子单元,用于提取包含第二节点的链路,得到第二链路集;
过滤子单元,用于根据第二节点的调用关系对该第二链路集中的链路进行过滤,得到有效链路;
分析子单元,用于根据该有效链路对该第二节点进行告警根源分析;
通知子单元,用于将分析结果写入库表,并将分析结果通知给用户。
比如,其中,分析子单元,具体可以用于确定第二节点的告警时间,得到第二时刻;从该有效链路中获取在第二时刻的前后预设时间范围内产生过告警信息的节点,得到第三节点,分析第三节点的告警内容,以确定该告警内容是否为根源告警;若为根源告警,则将该第三节点作为第一节点,并触发获取单元执行获取包含第一节点的链路的操作;若不是根源告警,则触发通知子单元执行将分析结果写入库表,并将分析结果通知给用户的操作。
其中,该预设时间范围可以根据实际应用的需求进行设置,比如,可以设置为在以第二时刻的时间窗为基准,在该基准的前八个时间窗内,以及后四个时间窗内,等等,即:
分析子单元,具体可以用于以该第二时刻的时间窗口为基准,从该有效链路中获取该基准前八个时间窗内,以及后四个时间窗内产生过告警信息的节点,得到第三节点。
可选的,为了便于对告警节点进行管理,可以设置一告警模块接收池,用于对各个告警节点,以及各个告警节点所产生的告警信息进行管理,其中,该告警模块接收池中可以包括多个告警模块,每一告警模块对应一个告警节点。
例如,以该告警信息的处理装置中设置有告警模块接收池为例,则此时:
分析子单元,具体可以用于从告警模块接收池中获取在第二时刻的前后预设时间范围内产生过告警信息的模块,得到目标告警模块;将目标告警模块与该有效链路进行叠加,以确定在第二时刻的前后预设时间范围内产生过告警信息的节点,得到第三节点。
此外,需说明的是,根源告警也可以根据实际应用的需求进行设置,比如,根源告警可以包括节点发布变更、节点机器丢包、节点下程序崩溃、节点下机器死机和节点下专线拥塞等,即:
分析子单元,具体可以用于分析第三节点的告警内容,以确定该告警内容是否包括节点发布变更、节点机器丢包、节点下程序崩溃、节点下机器死机和节点下专线拥塞中任意一种;若是,则确定该告警内容为根源告警;若否,则确定该告警内容不是根源告警。
具体实施时,以上各个单元可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的方法实施例,在此不再赘述。
该告警信息的处理装置具体可以集成在集群***的控制设备中,该控制设备具体可以为控制服务器或调控服务器等设备。
由上可知,本实施例的告警信息的处理装置在接收第一节点在第一时刻产生的告警信息后,若确定该告警信息为根源告警,则由获取单元302获取包含第一节点的链路,得到第一链路集,并由查找单元303在该第一链路集的链路中查找位置位于第一节点前,并在第一时刻的前后预设时间范围内产生过告警信息的节点,得到第二节点,然后,由处理单元304对第二节点重新进行告警根源分析,并将分析结果通知给用户,从而达到动态分析告警的根源的目的,弥补了因某些告警信息延时发出而导致的分析不准的问题,大大提高了告警分析的完整性和准确性,从而便于用户可以及时发现故障或异常,有利于提高***的稳定性和安全性。
实施例四、
相应的,本发明实施例还提供一种集群***,可以包括本发明实施例所提供的任一种告警信息的处理装置,具体可参见实施例三,例如,可以如下:
告警信息的处理装置,用于接收第一节点在第一时刻产生的告警信息;确定该告警信息为根源告警时,获取包含第一节点的链路,得到第一链路集;在该第一链路集的链路中查找位置位于第一节点前,并在第一时刻的前后预设时间范围内产生过告警信息的节点,得到第二节点;对该第二节点进行告警根源分析,并将分析结果通知给用户。
其中,根源告警的内容具体可以根据实际应用的需求进行设置,比如,该根源告警可以包括节点发布变更、节点机器丢包、节点下程序崩溃、节点下机器死机和/或节点下专线拥塞等告警。
而预设时间范围也可以根据实际应用的需求进行设置,比如,可以设置为在以第一时刻的时间窗为基准,在该基准的前八个时间窗内,以及后四个时间窗内,其中,时间窗内的大小可以进行灵活设置,在此不再赘述。
该告警信息的处理装置具体可以集成在集群***的控制设备中,该控制设备具体可以为控制服务器或调控服务器等设备。
此外,该集群***还可以包括其他的设备,比如可以包括多个服务器,这些服务器可以作为该集群***的节点,其中,每一个服务器均可以执行如下操作:
对该集群***中的数据进行处理,以提供相应的服务,并且,可以在确定发生故障或异常时产生告警信息,并向告警信息的处理装置(比如控制设备)发送该告警信息。
以上各个设备的具体实施可参见前面的方法实施例,在此不再赘述。
由于该集群***可以包括本发明实施例所提供的任一种告警信息的处理装置,因此,可以实现本发明实施例所提供的任一种告警信息的处理装置所能实现的有益效果,详见前面的实施例,在此不再赘述。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
以上对本发明实施例所提供的一种告警信息的处理方法、装置和***进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (15)

1.一种告警信息的处理方法,其特征在于,包括:
接收第一节点在第一时刻产生的告警信息;
确定所述告警信息为根源告警时,获取包含第一节点的链路,得到第一链路集;
在所述第一链路集的链路中查找位置位于第一节点前,并在第一时刻的前后预设时间范围内产生过告警信息的节点,得到第二节点;
对所述第二节点进行告警根源分析,并将分析结果通知给用户。
2.根据权利要求1所述的方法,其特征在于,所述确定所述告警信息为根源告警时,获取包含第一节点的链路,得到第一链路集,包括:
确定所述告警信息指示节点发布变更、节点机器丢包、节点下程序崩溃、节点下机器死机和/或节点下专线拥塞时,获取包含第一节点的链路,得到第一链路集。
3.根据权利要求1所述的方法,其特征在于,所述在所述第一链路集的链路中查找位置位于第一节点前,并在第一时刻的前后预设时间范围内产生过告警信息的节点,得到第二节点,包括:
在所述第一链路集的链路中查找位置位于第一节点前的节点,得到候选节点;
在所述候选节点中查找在第一时刻的前八个时间窗内,以及后四个时间窗内产生过告警信息的节点,得到第二节点。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述对所述第二节点进行告警根源分析,并将分析结果通知给用户,包括:
提取包含第二节点的链路,得到第二链路集;
根据第二节点的调用关系对所述第二链路集中的链路进行过滤,得到有效链路;
根据所述有效链路对所述第二节点进行告警根源分析;
将分析结果写入库表,并将分析结果通知给用户。
5.根据权利要求4所述的方法,其特征在于,所述根据所述有效链路对所述第二节点进行告警根源分析,包括:
确定第二节点的告警时间,得到第二时刻;
从所述有效链路中获取在第二时刻的前后预设时间范围内产生过告警信息的节点,得到第三节点;
分析第三节点的告警内容,以确定所述告警内容是否为根源告警;
若为根源告警,则将所述第三节点作为第一节点,并返回执行获取包含第一节点的链路的步骤;
若不是根源告警,则执行将分析结果写入库表,并将分析结果通知给用户的步骤。
6.根据权利要求5所述的方法,其特征在于,所述分析第三节点的告警内容,以确定所述告警内容是否为根源告警,包括:
分析第三节点的告警内容,以确定所述告警内容是否包括节点发布变更、节点机器丢包、节点下程序崩溃、节点下机器死机和节点下专线拥塞中任意一种;
若是,则确定所述告警内容为根源告警;
若否,则确定所述告警内容不是根源告警。
7.根据权利要求5所述的方法,其特征在于,所述从所述有效链路中确定在第二时刻的前后预设时间范围内产生过告警信息的节点,得到第三节点,包括:
以所述第二时刻的时间窗口为基准;
从所述有效链路中确定该基准前八个时间窗内,以及后四个时间窗内产生过告警信息的节点,得到第三节点。
8.一种告警信息的处理装置,其特征在于,包括:
接收单元,用于接收第一节点在第一时刻产生的告警信息;
获取单元,用于确定所述告警信息为根源告警时,获取包含第一节点的链路,得到第一链路集;
查找单元,用于在所述第一链路集的链路中查找位置位于第一节点前,并在第一时刻的前后预设时间范围内产生过告警信息的节点,得到第二节点;
处理单元,用于对所述第二节点进行告警根源分析,并将分析结果通知给用户。
9.根据权利要求8所述的装置,其特征在于,
所述获取单元,具体用于确定所述告警信息指示节点发布变更、节点机器丢包、节点下程序崩溃、节点下机器死机和/或节点下专线拥塞时,获取包含第一节点的链路,得到第一链路集。
10.根据权利要求8所述的装置,其特征在于,
所述查找单元,具体用于在所述第一链路集的链路中查找位置位于第一节点前的节点,得到候选节点;在所述候选节点中查找在第一时刻的前八个时间窗内,以及后四个时间窗内产生过告警信息的节点,得到第二节点。
11.根据权利要求8至10任一项所述的装置,其特征在于,所述处理单元包括提取子单元、过滤子单元、分析子单元和通知子单元;
所述提取子单元,用于提取包含第二节点的链路,得到第二链路集;
所述过滤子单元,用于根据第二节点的调用关系对所述第二链路集中的链路进行过滤,得到有效链路;
所述分析子单元,用于根据所述有效链路对所述第二节点进行告警根源分析;
所述通知子单元,用于将分析结果写入库表,并将分析结果通知给用户。
12.根据权利要求11所述的装置,其特征在于,所述分析子单元,具体用于:
确定第二节点的告警时间,得到第二时刻;
从所述有效链路中获取在第二时刻的前后预设时间范围内产生过告警信息的节点,得到第三节点;
分析第三节点的告警内容,以确定所述告警内容是否为根源告警;
若为根源告警,则将所述第三节点作为第一节点,并触发获取单元执行获取包含第一节点的链路的操作;
若不是根源告警,则触发通知子单元执行将分析结果写入库表,并将分析结果通知给用户的操作。
13.根据权利要求12所述的装置,其特征在于,
所述分析子单元,具体用于分析第三节点的告警内容,以确定所述告警内容是否包括节点发布变更、节点机器丢包、节点下程序崩溃、节点下机器死机和节点下专线拥塞中任意一种;若是,则确定所述告警内容为根源告警;若否,则确定所述告警内容不是根源告警。
14.根据权利要求12所述的装置,其特征在于,
所述分析子单元,具体用于以所述第二时刻的时间窗口为基准,从所述有效链路中确定该基准前八个时间窗内,以及后四个时间窗内产生过告警信息的节点,得到第三节点。
15.一种集群***,其特征在于,包括权利要求8至14任一项所述的告警信息的处理装置。
CN201610075817.4A 2016-02-03 2016-02-03 一种告警信息的处理方法、装置和*** Active CN107040395B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201610075817.4A CN107040395B (zh) 2016-02-03 2016-02-03 一种告警信息的处理方法、装置和***
KR1020187015309A KR102131160B1 (ko) 2016-02-03 2017-01-22 알람 정보 처리 방법 및 장치, 시스템, 및 컴퓨터 저장 매체
PCT/CN2017/072112 WO2017133522A1 (zh) 2016-02-03 2017-01-22 告警信息的处理方法、装置和***、计算机存储介质
EP17746842.8A EP3413512B1 (en) 2016-02-03 2017-01-22 Alarm information processing method, apparatus and system
US15/774,032 US11190390B2 (en) 2016-02-03 2017-01-22 Alarm information processing method and apparatus, system, and computer storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610075817.4A CN107040395B (zh) 2016-02-03 2016-02-03 一种告警信息的处理方法、装置和***

Publications (2)

Publication Number Publication Date
CN107040395A true CN107040395A (zh) 2017-08-11
CN107040395B CN107040395B (zh) 2019-11-15

Family

ID=59499331

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610075817.4A Active CN107040395B (zh) 2016-02-03 2016-02-03 一种告警信息的处理方法、装置和***

Country Status (5)

Country Link
US (1) US11190390B2 (zh)
EP (1) EP3413512B1 (zh)
KR (1) KR102131160B1 (zh)
CN (1) CN107040395B (zh)
WO (1) WO2017133522A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108494591A (zh) * 2018-03-16 2018-09-04 北京京东金融科技控股有限公司 ***告警处理方法与装置
CN110166264A (zh) * 2018-02-11 2019-08-23 北京三快在线科技有限公司 一种故障定位方法、装置及电子设备
CN110659807A (zh) * 2019-08-29 2020-01-07 苏宁云计算有限公司 一种基于链路的风险用户识别方法及装置
CN110888754A (zh) * 2019-11-14 2020-03-17 北京金山云网络技术有限公司 一种消息获得方法及装置
CN114706737A (zh) * 2022-05-25 2022-07-05 深圳依时货拉拉科技有限公司 崩溃告警方法、装置、***、设备及可读存储介质

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111786806B (zh) * 2019-04-04 2022-03-01 大唐移动通信设备有限公司 一种网元异常处理方法及网管***
CN110460460B (zh) * 2019-07-08 2022-06-03 创新先进技术有限公司 业务链路故障定位方法、装置及设备
CN111404740A (zh) * 2020-03-12 2020-07-10 中国铁塔股份有限公司 故障分析方法、装置、电子设备及计算机可读存储介质
CN111917594B (zh) * 2020-08-14 2021-04-06 广州锦行网络科技有限公司 一种基于蜜场架构的诱捕节点故障实时检测方法
CN112596887B (zh) * 2020-12-29 2024-06-25 中国建设银行股份有限公司 一种针对批量延迟的分析方法及相关装置
CN113542039A (zh) * 2021-09-16 2021-10-22 浩鲸云计算科技股份有限公司 一种通过ai算法定位5g网络虚拟化跨层问题的方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040119590A1 (en) * 2002-12-20 2004-06-24 Randall Wang Wireless alarm system for contributing security network
CN101707537A (zh) * 2009-11-18 2010-05-12 华为技术有限公司 故障链路定位方法、告警根因分析方法及设备、***
CN102136949A (zh) * 2011-03-24 2011-07-27 国网电力科学研究院 一种基于网络和时间的告警相关性分析方法及***
CN102195826A (zh) * 2010-03-10 2011-09-21 杭州华三通信技术有限公司 一种检测根源告警的方法及设备
CN102201927A (zh) * 2010-03-26 2011-09-28 北京市电力公司 处理告警信息的方法与装置
CN102611564A (zh) * 2011-01-25 2012-07-25 中兴通讯股份有限公司 一种实现性能告警的方法、***及网元
CN105095048A (zh) * 2015-07-23 2015-11-25 上海新炬网络信息技术有限公司 一种基于业务规则的监控***告警关联处理方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6707795B1 (en) * 1999-04-26 2004-03-16 Nortel Networks Limited Alarm correlation method and system
US7120102B2 (en) * 2002-10-24 2006-10-10 Matsushita Electric Industrial Co., Ltd. Jitter detection apparatus and jitter detection method
US8484336B2 (en) * 2006-11-15 2013-07-09 Cisco Technology, Inc. Root cause analysis in a communication network
US8112378B2 (en) * 2008-06-17 2012-02-07 Hitachi, Ltd. Methods and systems for performing root cause analysis
US20110141914A1 (en) 2009-12-15 2011-06-16 Chen-Yui Yang Systems and Methods for Providing Ethernet Service Circuit Management
US8411577B2 (en) * 2010-03-19 2013-04-02 At&T Intellectual Property I, L.P. Methods, apparatus and articles of manufacture to perform root cause analysis for network events
US8245079B2 (en) * 2010-09-21 2012-08-14 Verizon Patent And Licensing, Inc. Correlation of network alarm messages based on alarm time
US8682836B2 (en) * 2011-03-30 2014-03-25 Southwest Research Institute Detection of network links in a communications network
US8661295B1 (en) * 2011-03-31 2014-02-25 Amazon Technologies, Inc. Monitoring and detecting causes of failures of network paths
CN102833109B (zh) 2012-08-30 2015-01-07 华为技术有限公司 故障点位置信息处理方法及设备
CN103713976B (zh) 2013-12-30 2016-12-07 卡斯柯信号有限公司 用于信号集中监测***的信号设备故障根源搜索方法
US10263836B2 (en) * 2014-03-24 2019-04-16 Microsoft Technology Licensing, Llc Identifying troubleshooting options for resolving network failures
US9276803B2 (en) * 2014-04-02 2016-03-01 Ca, Inc. Role based translation of data
JP6320200B2 (ja) * 2014-07-01 2018-05-09 アズビル株式会社 Pidコントローラおよびデータ収集方法
CN104767648B (zh) 2015-04-24 2018-02-13 烽火通信科技股份有限公司 一种基于告警回溯的根源告警定位功能实现方法及***
CN105071970B (zh) 2015-08-27 2018-09-11 中国电信股份有限公司 故障分析方法和***以及网管设备
US10171335B2 (en) * 2015-12-01 2019-01-01 Microsoft Technology Licensing, Llc Analysis of site speed performance anomalies caused by server-side issues

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040119590A1 (en) * 2002-12-20 2004-06-24 Randall Wang Wireless alarm system for contributing security network
CN101707537A (zh) * 2009-11-18 2010-05-12 华为技术有限公司 故障链路定位方法、告警根因分析方法及设备、***
CN102195826A (zh) * 2010-03-10 2011-09-21 杭州华三通信技术有限公司 一种检测根源告警的方法及设备
CN102201927A (zh) * 2010-03-26 2011-09-28 北京市电力公司 处理告警信息的方法与装置
CN102611564A (zh) * 2011-01-25 2012-07-25 中兴通讯股份有限公司 一种实现性能告警的方法、***及网元
CN102136949A (zh) * 2011-03-24 2011-07-27 国网电力科学研究院 一种基于网络和时间的告警相关性分析方法及***
CN105095048A (zh) * 2015-07-23 2015-11-25 上海新炬网络信息技术有限公司 一种基于业务规则的监控***告警关联处理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
徐前方: "基于数据挖掘的网络故障告警相关性研究", 《中国优秀博士学位论文全文数据库信息科技辑I136-13》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110166264A (zh) * 2018-02-11 2019-08-23 北京三快在线科技有限公司 一种故障定位方法、装置及电子设备
CN110166264B (zh) * 2018-02-11 2022-03-08 北京三快在线科技有限公司 一种故障定位方法、装置及电子设备
CN108494591A (zh) * 2018-03-16 2018-09-04 北京京东金融科技控股有限公司 ***告警处理方法与装置
CN110659807A (zh) * 2019-08-29 2020-01-07 苏宁云计算有限公司 一种基于链路的风险用户识别方法及装置
CN110659807B (zh) * 2019-08-29 2022-08-26 苏宁云计算有限公司 一种基于链路的风险用户识别方法及装置
CN110888754A (zh) * 2019-11-14 2020-03-17 北京金山云网络技术有限公司 一种消息获得方法及装置
CN114706737A (zh) * 2022-05-25 2022-07-05 深圳依时货拉拉科技有限公司 崩溃告警方法、装置、***、设备及可读存储介质
CN114706737B (zh) * 2022-05-25 2022-09-02 深圳依时货拉拉科技有限公司 崩溃告警方法、装置、***、设备及可读存储介质

Also Published As

Publication number Publication date
WO2017133522A1 (zh) 2017-08-10
KR20180079395A (ko) 2018-07-10
US20180324029A1 (en) 2018-11-08
KR102131160B1 (ko) 2020-07-07
EP3413512B1 (en) 2020-10-28
US11190390B2 (en) 2021-11-30
EP3413512A4 (en) 2019-07-24
CN107040395B (zh) 2019-11-15
EP3413512A1 (en) 2018-12-12

Similar Documents

Publication Publication Date Title
CN107040395A (zh) 一种告警信息的处理方法、装置和***
CN106209405B (zh) 故障诊断方法及装置
CN103442008B (zh) 一种路由安全检测***及检测方法
EP1718014A1 (en) A route switching method and a network node device
CN112118174B (zh) 软件定义数据网关
CN105868075A (zh) 一种实时监控分析大量日志的***及方法
FI990826A0 (fi) Toipuminen matkaviestinjärjestelmissä
CN106933693A (zh) 一种数据库集群节点故障自动修复方法及***
CN108271195A (zh) 基于软硬采的信令关联分析方法和设备
CN104283802A (zh) 邻居发现方法和设备
CN106452941A (zh) 网络异常的检测方法及装置
CN107026790A (zh) 一种转发控制方法及设备
CN102136965A (zh) 一种隧道故障检测方法和流量工程节点
CN107888424A (zh) 告警信息识别方法及装置、网络管理***
CN101252477B (zh) 一种网络故障根源的确定方法及分析装置
CN110266603B (zh) 基于http协议的身份认证业务网络流量分析***及方法
CN107733716A (zh) 分布式文件***日志分析方法、***、设备及存储介质
CN110856188A (zh) 通信方法、装置、***和计算机可读存储介质
CN103152263B (zh) 链路状态协议数据单元分片更新方法及路由器
CN107947974B (zh) 一种云平台业务的网络关键链路检测方法
CN103297298A (zh) 用于智能变电站的网络风暴实时快速检测方法
CN109450703A (zh) 故障的处理方法及装置、存储介质
CN106998563A (zh) 一种基于网络性能的室分***预警方法及装置
CN106059850A (zh) 一种is‑is网络中的链路异常检测方法、***、装置、芯片
CN103178997B (zh) 一种基于lldp协议的mac地址相同的检测方法和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240104

Address after: 518057 Tencent Building, No. 1 High-tech Zone, Nanshan District, Shenzhen City, Guangdong Province, 35 floors

Patentee after: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.

Patentee after: TENCENT CLOUD COMPUTING (BEIJING) Co.,Ltd.

Address before: 2, 518000, East 403 room, SEG science and Technology Park, Zhenxing Road, Shenzhen, Guangdong, Futian District

Patentee before: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.