CN107832200A - 告警处理方法、装置、计算机设备及存储介质 - Google Patents

告警处理方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN107832200A
CN107832200A CN201711001755.3A CN201711001755A CN107832200A CN 107832200 A CN107832200 A CN 107832200A CN 201711001755 A CN201711001755 A CN 201711001755A CN 107832200 A CN107832200 A CN 107832200A
Authority
CN
China
Prior art keywords
alarm
default
event
alarm event
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711001755.3A
Other languages
English (en)
Inventor
高泗俊
李渊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201711001755.3A priority Critical patent/CN107832200A/zh
Priority to PCT/CN2017/113234 priority patent/WO2019080249A1/zh
Publication of CN107832200A publication Critical patent/CN107832200A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Computing Systems (AREA)
  • Economics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Alarm Systems (AREA)

Abstract

本申请实施例公开了一种告警处理方法、装置、计算机设备及存储介质。其中该方法包括:获取监控对象的监控数据;根据预设告警规则确定所述监控数据中的告警数据,其中所述告警数据为触发所述预设告警规则的监控数据;根据所述告警数据生成告警事件,并将所述告警事件记录在预设消息队列;按照预设获取规则获取所述预设消息队列中的告警事件;基于机器学习规则和预设知识库对所述告警事件进行预设处理;以及将经过所述预设处理过的告警事件发送至用户终端。该告警处理方法不仅可以消除报警风暴,同时还可以提高报警准确率,进而减少无效报警。

Description

告警处理方法、装置、计算机设备及存储介质
技术领域
本申请涉及通信技术领域,尤其涉及一种告警处理方法、装置、计算机设备及存储介质。
背景技术
目前,市场上存在很多开源的监控***,比如Zabbix监控***和Open-falcon监控***。这些监控***均包括“告警中心”,该告警中心用于将告警事件展示给运维人员以提示运维人员进行相应地处理。但是,现有的告警中心大多只是简单地实现告警事件的展示,这种处理方式会导致产生大量的无效告警,从而延长了故障恢复时间,不利于运维人员的及时处理,造成了更多的损失。
发明内容
本申请提供了一种告警处理方法、装置、计算机设备及存储介质,可以减少无效报警以及降低误报率。
第一方面,本申请提供了一种告警处理方法,应用于监控***,其包括:
获取监控对象的监控数据;
根据预设告警规则确定所述监控数据中的告警数据,其中所述告警数据为触发所述预设告警规则的监控数据;
根据所述告警数据生成告警事件,并将所述告警事件记录在预设消息队列;
按照预设获取规则获取所述预设消息队列中的告警事件;
基于机器学习规则和预设知识库对从所述预设消息队列中获取的告警事件进行预设处理;以及
将经过所述预设处理过的告警事件发送至用户终端。
第二方面,本申请提供了一种告警处理装置,其包括:
数据获取单元,用于获取监控对象的监控数据;
数据确定单元,用于根据预设告警规则确定所述监控数据中的告警数据,其中所述告警数据为触发所述预设告警规则的监控数据;
事件生成记录单元,用于根据所述告警数据生成告警事件,并将所述告警事件记录在预设消息队列;
事件获取单元,用于按照预设获取规则获取所述预设消息队列中的告警事件;
预设处理单元,用于基于机器学习规则和预设知识库对所述告警事件进行预设处理;以及
事件发送单元,用于将经过所述预设处理过的告警事件发送至用户终端。
第三方面,本申请又提供了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现本申请提供的任一项所述的告警处理方法。
第四方面,本申请还提供了一种存储介质,其中所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行本申请提供的任一项所述的告警处理方法。
本申请提供一种告警处理方法、装置、计算机设备及存储介质。其中该方法通过根据预设告警规则确定监控对象的监控数据中的告警数据;在将告警数据生成告警事件并保存在预设消息队列后,按照预设获取规则获取所述预设消息队列中的告警事件,并将获取到的告警事件基于机器学习规则和预设知识库进行预设处理,以及将处理过的告警事件发送至用户终端以展示给运维管理人员。该告警处理方法不仅可以消除报警风暴,同时还可以提高报警准确率,进而减少无效报警。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的一种告警处理方法的示意流程图;
图2是本申请另一实施例提供的一种告警处理方法的示意流程图;
图3是图2中步骤S205的子步骤示意流程图;
图4是本申请一实施例提供的一种告警处理装置的示意性框图;
图5是本申请另一实施例提供的一种告警处理装置的示意性框图;
图6是本申请一实施例提供的一种计算机设备的一示意性框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1,图1是本申请一实施例提供的一种告警处理方法的示意流程图。该告警处理方法应用于监控***中,监控***可运行在服务器中,其中该服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。如图1所示,该告警处理方法包括步骤S101~S106。
S101、获取监控对象的监控数据。
在本实施例中,监控对象包括主机、容器、网络设备以及中间件等,该中间件比如为weblogic,tomcat,kafka或zookeeper组件等。监控对象的监控数据包括监控对象的使用状态等信息,比如监控对象为主机,相对应地监控数据包括主机的CPU使用率、内存使用率,磁盘使用率和网络流量等信息。
S102、根据预设告警规则确定所述监控数据中的告警数据,其中所述告警数据为触发所述预设告警规则的监控数据。
在本实施例中,预设告警规则为预先设置的告警规则,在监控***的告警中心初始化时自动配置一套通用的告警规则作为预设告警规则,如果用户有个性化的需求,可以自定义或修改该预设告警规则。
具体地,该预设告警规则采用预设阈值范围判定方法,通过判断所述监控数据中的数值是否在预设阈值范围内;如果所述监控数据中的数值在所述预设阈值范围内,则判定为未触发所述预设告警规则;如果所述监控数据中的数值未在所述预设阈值范围内,则判定为触发所述预设告警规则。其中触发所述预设告警规则对应的监控数据即为告警数据。
比如,监控数据中的CPU使用率,如果该使用率对应的数值超过了所述预设告警规则对应的CPU使用率的预设阈值范围,则判定该CPU使用率即为告警数据。
S103、根据所述告警数据生成告警事件,并将所述告警事件记录在预设消息队列。
在本实施例中,根据所述告警数据生成告警事件,包括:按照预设事件格式将所述告警数据生成告警事件。该预设事件格式可以对告警事件进行规范,方便后续解析处理。
具体地,可以事先定义该预设事件格式,以便后续解析告警事件中相应的字段的值,从中获取想要的信息,按照预设事件格式生成的告警事件在被推送至每个订阅了告警事件的用户***后,用户***需要针对告警中心定义的告警事件格式进行解析,以获取告警事件中的相关信息。这样设计可以减少告警中心接口设计的复杂度。
在一实施例中,该预设事件格式,比如采用预设JSON格式,具体如下:
{Detail:[P3#1/1]net_monitor_1cpu.used.percentall(#3)100>=30,Entity:net_monitor_1,Status:1,Url:abc.com,Group:app_type=APP,app_name=NET-MONITOR>}。
在上述JSON式中,[P3#1/1]中P3表示告警优先级,#1/1表示当前告警次数/最大告警次数;net_monitor_1cpu.used.percentall(#3)100>=30中net_monitor_1表示监控对象对应的***名称,具体为CPU的使用率;Entity:net_monitor_1表示是实体网络;Status:1表示告警事件的状态;Url:abc.com表示监控对象的URL地址;Group:app_type=APP表示监控对象类别;app_name=NET-MONITOR表示监控对象的小类别。
其中,在按照预设事件格式将所述告警数据生成告警事件后,还需将该告警事件发送并保存至预设消息队列中,该预设消息队列保存在预设数据库中,该预设消息队列的使用可以消除告警风暴。
S104、按照预设获取规则获取所述预设消息队列中的告警事件。
在本实施例中,由于预设消息队列中包括多个告警事件,因此按照预设获取规则获取所述预设消息队列中的告警事件,比如告警事件还可包括优先等级信息或告警严重程度信息等,相对应地,该预设获取规则可以为按照优先等级或告警严重程度的顺序获取所述预设消息队列中的告警事件,因此可以合理有序地对预设消息队列中的告警事件进行处理,先解决重要的告警问题,由此间接地提高告警处理效率。
在一实施例中,所述按照预设获取规则获取所述预设消息队列中的告警事件,包括:按照预设顺序获取所述预设消息队列中预设数量的告警事件。具体地,该预设顺序可以为告警事件的优先等级顺序,也可以为告警事件的生成时间对应时间顺序,按照该预设顺序每次获取一定数量的告警事件。因此,该预设数量可以保证按批次地对预设消息队列中的告警事件进行处理,进而避免报警风暴的产生。
S105、基于机器学习规则和预设知识库对从所述预设消息队列中获取的告警事件进行预设处理。
在本实施例中,所述基于机器学习规则和预设知识库对从所述预设消息队列中获取的告警事件进行预设处理,具体包括:基于机器学习规则和预设知识库对从所述预设消息队列中获取的告警事件进行预设告警分析处理、预设告警收敛处理或预设告警聚合处理。
其中,机器学***滑的二次平滑算法、三次平滑算法,基于分解的傅里叶分解算法、小波分解算法等,或者基于深度学习的前馈神经网络、循环神经网络RNN算法等,这些机器学习算法就需要通过大量的线上历史数据(历史告警事件)进行训练,以便得出相对准确的告警策略,该告警策略即是规则模型用于分析处理当前的告警事件。此外,还可以多个算法同时进行训练,针对不同的场景,每一种算法的效果会不同,这时根据与历史结果进行对比,调整每个算法的权重,最终得出一个共同告警策略。
预设知识库用于储存告警事件、告警事件处理结果信息及分析结果信息等,以帮助分析处理所述告警事件。
具体地,预设告警分析处理对应的分析方法包括:基于历史数据统计的方法,假设正态分布的方法,3-sigma策略等,通过这些标准的统计学方法可以自动计算出一个合理的告警阀值,当性能指标超过或者低于这个告警阀值时,就会触发告警。同时将这些合理的告警阀值设置为所述预设告警规则中的预设阈值范围,以此形成一个闭环控制,从而提高告警的准确率。
具体地,预设告警收敛处理,具体包括:根据预设时间窗口合并告警事件,比如,将在某段时间内产生的告警事件合并成一条发出;或者根据相同的监控策略合并相应的告警事件,比如,有多条cpu使用率超过90%的告警事件合并成一条告警事件;或者根据相同的告警对象进行合并相应的告警事件,比如主机A在某个时间窗口发出的告警,cpu,内存或者磁盘等告警,可以合并成一条主机A对应的告警事件发出。
具体地,预设告警聚合处理包括:关联挖掘处理和异常依赖处理。关联挖掘处理的合并策略指的是通过挖掘告警事件与告警事件之间的关联,多时序间的关联,将多个告警事件合并成一个告警事件发出。异常依赖处理指的是某个异常的产生和另外一个异常有依赖关系,比如磁盘故障可能会导致主机宕机,如果同时收到磁盘故障和主机失联的告警事件,那么可以通过该异常依赖关系,将这两条告警事件收敛为一条告警事件。
需要说明的是,预设知识库和预设消息队列均保存在相同的数据库中,方便告警事件加载数据库中以备对这些告警事件进行预设处理;其中该预设知识库里保存有历史告警事件及其相关信息。
S106、将经过所述预设处理过的告警事件发送至用户终端。
在本实施例中,用户终端包括***管理员对应的终端或用户***对应的终端等,该***管理员为负责监控***的管理人员。其中对于不同的用户终端也可以采用不同发送方式。具体地,针对***管理员可以以邮件,短信,电话等方式通知***的管理员;而针对用户***,可以将告警事件推送给用户自己的***进行下一步的处理,比如有的用户会开发自己的工具平台,对告警事件做进一步的处理,结合业务逻辑做判断,为满足这样的用户需求,用户***可以订阅监控***的告警。当监控***的告警中心有新的告警产生时,会根据用户***订阅的对应的主题,实现定向推送,因此提高了用户的体验。
上述实施例告警处理方法通过根据预设告警规则确定监控对象的监控数据中的告警数据;在将告警数据生成告警事件并保存在预设消息队列后,按照预设获取规则获取所述预设消息队列中的告警事件,并将获取到的告警事件基于机器学习规则和预设知识库进行预设处理,以及将处理过的告警事件发送至用户终端以展示给运维管理人员。该告警处理方法不仅可以消除报警风暴,同时还可提高报警准确率,进而减少无效报警。
请参阅图2,图2是本申请另一实施例提供的一种告警处理方法的示意流程图。该告警处理方法应用于监控***中,监控***可运行在服务器中,其中该服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。如图2所示,该告警处理方法包括步骤S201~S208。
S201、获取监控对象的监控数据。
其中,监控对象除了包括主机、容器、网络设备以及中间件等,还包括监控对象本身。
在本实施例中,获取监控对象的监控数据,还包括:获取监控***的监控数据。
S202、根据预设告警规则确定所述监控数据中的告警数据,其中所述告警数据为触发所述预设告警规则的监控数据。
其中,预设告警规则为预先设置的告警规则,具体采用预设阈值范围判定方法,也可以采用其他类似的判定方法,在此不做限定。
S203、根据所述告警数据生成告警事件,并将所述告警事件记录在预设消息队列。
在本实施例中,也采用按照预设事件格式的方式将所述告警数据生成告警事件,以及将生成告警事件保存在预设消息队列。
其中,该预设消息队列用于存储多个告警事件,可有效地防止服务器需要同时产生多个告警事件,进而产生告警风暴。
S204、按照预设获取规则获取所述预设消息队列中的告警事件。
具体地,按照预设顺序获取所述预设消息队列中预设数量的告警事件。具体地,该预设顺序可以为告警事件的优先等级顺序,也可以为告警事件的生成时间对应时间顺序,按照该预设顺序每次获取一定数量的告警事件。因此,该预设数量可以保证按批次地对预设消息队列中的告警事件进行处理,进而避免报警风暴的产生。
S205、基于机器学习规则和预设知识库对从所述预设消息队列中获取的告警事件进行预设处理。
其中,对于监控对象不是监控***所对应的告警事件还是采用上述实施例的预设处理方法,在此不做详细介绍。
在本实施例中,对于监控对象是监控***本身所对应的告警事件,将采用如图3中的方法步骤,具体如步骤S205a和S205b。
S205a、从所述告警事件中筛选出监控告警事件,其中所述监控告警事件为所述监控***的告警事件。
因为所述告警事件不仅包括监控***的告警事件,还包括主机、容器或中间件的告警事件,因此需要从所述告警事件中筛选出监控告警事件,该监控告警事件为所述监控***的告警事件。
具体地,可通过获取监控对象的标识信息;将所述监控对象的监控数据和所述标识信息相关联。因此告警数据也对应有标识信息,由该标识信息可以从所述告警事件中筛选出监控告警事件。
S205b、将所述监控告警事件发送至自愈***以使得所述自愈***处理所述监控告警事件对应的故障。
其中,该自愈***和监控***可以安装在不同的服务器中,服务器之间建立通信连接以完成数据的交互。该自愈***用于自动化处理所述监控告警事件对应的故障,比如扩展容量、重启服务或限制流量等。
S206、将经过所述预设处理过的告警事件发送至用户终端。
其中,将经过所述预设处理过的告警事件发送至用户终端,以便用户对该告警事件做相应的处理,及时消除该告警事件。
S207、接收所述用户终端发送的反馈信息,其中所述反馈信息为所述用户终端对所述经过所述预设处理过的告警事件做预设标记处理生成的处理结果信息。
在本实施例中,该预设标记处理包括:标记无效告警事件,不做处理,并反馈给服务器的告警中心;或者标记有效告事件警,进行事件处理。用户终端可能有自动化事件处理***。用户终端接收到事件后开始处理,并将最后的处理结果好通知服务器的告警中心,具体可以通过API回调的方式发送。
S208、将所述处理结果信息保存至所述预设知识库。
在本实施例中,服务器将将所述处理结果信息保存至所述预设知识库,将告警事件及对应的处理结果信息作为历史告警事件,对当前的告警事件进行分析处理,由此形成一个闭环机制,可以让整个处理过程不断完善,由此提高了告警的准确率。
上述实施例提供的告警处理方法不仅可以消除报警风暴,同时还可以对监控***自身的告警对应故障进行自愈处理,保证监控***的正常运行,还可接收用户终端发送的反馈信息,并将该反馈信息中的关于告警事件的处理结果信息保存在所述预设数据库,以便对下次的告警事件做分析处理,由此形成了一个分析闭环控制机制,通过该闭环控制机制不断完善该监控***的告警分析处理能力,进而提高了告警准确率。
本申请实施例还提供一种告警处理装置,该装置用于执行前述的告警处理方法。具体地,请参阅图4,图4是本申请实施例提供的一种告警处理装置的示意性框图。该告警处理装置300可以安装于服务器中。
如图4所示,该告警处理装置300包括数据获取单元301、数据确定单元302、生成记录单元303、事件获取单元304、预设处理单元305和事件发送单元306。
数据获取单元301,用于获取监控对象的监控数据。
其中,监控对象包括主机、容器、网络设备以及中间件等,该中间件比如为weblogic,tomcat,kafka或zookeeper组件等。监控对象的监控数据包括监控对象的使用状态等信息,比如监控对象为主机,相对应地监控数据包括主机的CPU使用率、内存使用率,磁盘使用率和网络流量等信息。
数据确定单元302,用于根据预设告警规则确定所述监控数据中的告警数据,其中所述告警数据为触发所述预设告警规则的监控数据。
其中,预设告警规则为预先设置的告警规则,在监控***的告警中心初始化时自动配置一套通用的告警规则作为预设告警规则,如果用户有个性化的需求,可以自定义或修改该预设告警规则。
具体地,该预设告警规则采用预设阈值范围判定方法,通过判断所述监控数据中的数值是否在预设阈值范围内;如果所述监控数据中的数值在所述预设阈值范围内,则判定为未触发所述预设告警规则;如果所述监控数据中的数值未在所述预设阈值范围内,则判定为触发所述预设告警规则。其中触发所述预设告警规则对应的监控数据即为告警数据。
生成记录单元303,用于根据所述告警数据生成告警事件,并将所述告警事件记录在预设消息队列。
其中,根据所述告警数据生成告警事件,包括:按照预设事件格式将所述告警数据生成告警事件。该预设事件格式可以对告警事件进行规范,方便后续解析处理。
其中,在按照预设事件格式将所述告警数据生成告警事件后,还需将该告警事件发送并保存至预设消息队列中,该预设消息队列保存在预设数据库中,该预设消息队列的使用可以消除告警风暴。
事件获取单元304,用于按照预设获取规则获取所述预设消息队列中的告警事件。
其中,由于预设消息队列中包括多个告警事件,因此按照预设获取规则获取所述预设消息队列中的告警事件,比如告警事件还可包括优先等级信息或告警严重程度信息等,相对应地,该预设获取规则可以为按照优先等级或告警严重程度的顺序获取所述预设消息队列中的告警事件,因此可以合理有序地对预设消息队列中的告警事件进行处理,先解决重要的告警问题,由此间接地提高告警处理效率。
在一实施例中,事件获取单元304,具体用于:按照预设顺序获取所述预设消息队列中预设数量的告警事件。具体地,即每次获取一定数量的告警事件。因此,该预设数量可以保证按批次地对预设消息队列中的告警事件进行处理,进而避免报警风暴的产生。
预设处理单元305,用于基于机器学习规则和预设知识库对从所述预设消息队列中获取的告警事件进行预设处理。
其中,具体用于:基于机器学习规则和预设知识库对从所述预设消息队列中获取的告警事件进行预设告警分析处理、预设告警收敛处理或预设告警聚合处理。基于此,该预设处理单元305可包括告警分析子单元3051、告警收敛子单元3052和告警聚合子单元3053。
具体地,告警分析子单元3051,用于:基于历史数据统计的方法,假设正态分布的方法,3-sigma策略等,通过这些标准的统计学方法可以自动计算出一个合理的告警阀值,当性能指标超过或者低于这个告警阀值时,触发告警。同时将这些合理的告警阀值设置为所述预设告警规则中的预设阈值范围,以此形成一个闭环控制,从而提高告警的准确率。
具体地,告警收敛子单元3052,具体用于:根据预设时间窗口合并告警事件;或者根据相同的监控策略合并相应的告警事件;或者根据相同的告警对象进行合并相应的告警事件。比如,将在某段时间内产生的告警事件合并成一条发出;比如,有多条cpu使用率超过90%的告警事件合并成一条告警事件;再比如主机A在某个时间窗口发出的告警,cpu,内存或者磁盘等告警,可以合并成一条主机A对应的告警事件发出。
具体地,告警聚合子单元3053,具体用于:关联挖掘处理和异常依赖处理。关联挖掘处理的合并策略指的是通过挖掘告警事件与告警事件之间的关联,多时序间的关联,将多个告警事件合并成一个告警事件发出。异常依赖处理指的是某个异常的产生和另外一个异常有依赖关系,比如磁盘故障可能会导致主机宕机,如果同时收到磁盘故障和主机失联的告警事件,那么可以通过该异常依赖关系,将这两条告警事件收敛为一条告警事件。
事件发送单元306,用于将经过所述预设处理过的告警事件发送至用户终端。
其中,用户终端包括***管理员或用户***对应的终端等,对于不同的用户终端也可以采用不同发送方式。具体地,针对***管理员可以以邮件,短信,电话等方式通知***的管理员;而针对用户***,可以将告警事件推送给用户***进行下一步的处理,比如有的用户会开发自己的工具平台,对告警事件做进一步的处理,结合业务逻辑做判断,为满足这样的用户需求,用户***可以订阅监控***的告警。当监控***的告警中心有新的告警产生时,会根据用户***订阅的对应的主题,实现定向推送,因此还提高了用户的体验。
本申请实施例还提供另一种告警处理装置,该装置用于执行前述的告警处理方法。具体地,请参阅图5,图5是本申请实施例提供的一种告警处理装置的示意性框图。该告警处理装置400可以安装于服务器中。
如图5所示,该告警处理装置400包括数据获取单元401、数据确定单元402、生成记录单元403、事件获取单元404、预设处理单元405、事件发送单元406、信息接收单元407和信息保存单元408。
数据获取单元401,用于获取监控对象的监控数据。
其中,监控对象除了包括主机、容器、网络设备以及中间件等,还包括监控对象本身。在本实施例中,获取监控对象的监控数据,还包括:获取监控***的监控数据。
数据确定单元402,用于根据预设告警规则确定所述监控数据中的告警数据,其中所述告警数据为触发所述预设告警规则的监控数据。
其中,预设告警规则为预先设置的告警规则,具体采用预设阈值范围判定方法,也可以采用其他类似的判定方法,在此不做限定。
生成记录单元403,用于根据所述告警数据生成告警事件,并将所述告警事件记录在预设消息队列。
其中,也采用按照预设事件格式的方式将所述告警数据生成告警事件,以及将生成告警事件保存在预设消息队列。该预设消息队列用于存储多个告警事件,可有效地防止服务器需要同时产生多个告警事件,进而产生告警风暴。
事件获取单元404,用于按照预设获取规则获取所述预设消息队列中的告警事件。
具体用于:按照预设顺序获取所述预设消息队列中预设数量的告警事件。具体地,每次按照预设顺序获取一定数量的告警事件。因此,该预设数量可以保证按批次地对预设消息队列中的告警事件进行处理,进而避免报警风暴的产生。
预设处理单元405,用于基于机器学习规则和预设知识库对所述告警事件进行预设处理。
其中,对于监控对象不是监控***所对应的告警事件和监控对象是监控***本身所对应的告警事件,因此需要不同的预设处理方式,基于此,预设处理单元405包括事件筛选子单元4051和发送自愈子单元4052。
事件筛选子单元4051,用于从所述告警事件中筛选出监控告警事件,其中所述监控告警事件为所述监控***的告警事件。
因为所述告警事件不仅包括监控***的告警事件,还包括主机、容器或中间件的告警事件,因此需要从所述告警事件中筛选出监控告警事件,该监控告警事件为所述监控***的告警事件。
具体地,可通过获取监控对象的标识信息;将所述监控对象的监控数据和所述标识信息相关联。因此告警数据也对应有标识信息,由该标识信息可以从所述告警事件中筛选出监控告警事件。
发送自愈子单元4052,用于将所述监控告警事件发送至自愈***以使得所述自愈***处理所述监控告警事件对应的故障。
其中,该自愈***和监控***可以安装在不同的服务器中,服务器之间建立通信连接以完成数据的交互。该自愈***用于自动化处理所述监控告警事件对应的故障,比如扩展容量、重启服务或限制流量等。
事件发送单元406,用于将经过所述预设处理过的告警事件发送至用户终端。
其中,将经过所述预设处理过的告警事件发送至用户终端,以便用户对该告警事件做相应的处理,及时消除该告警事件。
信息接收单元407,用于接收所述用户终端发送的反馈信息,其中所述反馈信息为所述用户终端对所述经过所述预设处理过的告警事件做预设标记处理生成的处理结果信息。
其中,该预设标记处理包括:标记无效告警事件,不做处理,并反馈给服务器的告警中心;或者标记有效告事件警,进行事件处理。用户终端可能有自动化事件处理***。用户终端接收到事件后开始处理,并将最后的处理结果好通知服务器的告警中心,具体可以通过API回调的方式发送。
信息保存单元408、将所述处理结果信息保存至所述预设知识库。
其中,服务器将将所述处理结果信息保存至所述预设知识库,将告警事件及对应的处理结果信息作为历史告警事件,对当前的告警事件进行分析处理,由此形成一个闭环机制,可以让整个处理过程不断完善,由此提高了告警的准确率。
上述装置可以实现为一种计算机程序的形式,该计算机程序可以在如图6所示的计算机设备上运行。
请参阅图6,图6是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备700设备可以是终端。该终端可以是智能手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等具有通信功能的电子设备。
参照图6,该计算机设备700包括通过***总线710连接的处理器720、网络接口750和存储器,其中,存储器可以包括非易失性存储介质730和内存储器740。
该非易失性存储介质730可存储操作***731和计算机程序732。该计算机程序732被执行时,可使得处理器720执行一种告警处理方法。
该处理器720用于提供计算和控制能力,支撑整个计算机设备700的运行。
该内存储器740中可储存有计算机程序,该计算机程序被处理器720执行时,可使得处理器720执行一种告警处理方法。
该网络接口750用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备700的限定,具体的计算机设备700可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器720用于运行存储在存储器中的程序代码,以实现如下功能:
获取监控对象的监控数据;根据预设告警规则确定所述监控数据中的告警数据,其中所述告警数据为触发所述预设告警规则的监控数据;根据所述告警数据生成告警事件,并将所述告警事件记录在预设消息队列;按照预设获取规则获取所述预设消息队列中的告警事件;基于机器学习规则和预设知识库对从所述预设消息队列中获取的告警事件进行预设处理;以及将经过所述预设处理过的告警事件发送至用户终端。
在一实施例中,处理器720在执行所述将经过所述预设处理过的告警事件发送至用户终端之后,还执行如下程序:接收所述用户终端发送的反馈信息,其中所述反馈信息为所述用户终端对所述经过所述预设处理过的告警事件做预设标记处理生成的处理结果信息;以及将所述处理结果信息保存至所述预设知识库。
在一实施例中,处理器720在执行时,具体执行如下程序:从所述告警事件中筛选出监控告警事件,其中所述监控告警事件为所述监控***的告警事件;将所述监控告警事件发送至自愈***以使得所述自愈***处理所述监控告警事件对应的故障。
在一实施例中,处理器720在执行时,具体执行如下程序:按照预设事件格式将所述告警数据生成告警事件。
在一实施例中,处理器720在执行时,具体执行如下程序:基于机器学习规则和预设知识库对从所述预设消息队列中获取的告警事件进行预设告警分析处理、预设告警收敛处理或预设告警聚合处理。
在一实施例中,处理器720在执行时,具体执行如下程序:按照预设顺序获取所述预设消息队列中预设数量的告警事件。
应当理解,在本申请实施例中,处理器720可以是中央处理单元(CentralProcessing Unit,CPU),该处理器720还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域技术人员可以理解,图6中示出的计算机设备700结构并不构成对计算机设备700的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
在本申请的另一实施例中提供一种存储介质,该存储介质包括计算机可读存储介质,该计算机可读存储介质存储有计算机程序,其中计算机程序包括程序指令。该程序指令被处理器执行时实现:
获取监控对象的监控数据;根据预设告警规则确定所述监控数据中的告警数据,其中所述告警数据为触发所述预设告警规则的监控数据;根据所述告警数据生成告警事件,并将所述告警事件记录在预设消息队列;按照预设获取规则获取所述预设消息队列中的告警事件;基于机器学习规则和预设知识库对从所述预设消息队列中获取的告警事件进行预设处理;以及将经过所述预设处理过的告警事件发送至用户终端。
在一实施例中,该程序指令被处理器执行所述将经过所述预设处理过的告警事件发送至用户终端之后,还实现:接收所述用户终端发送的反馈信息,其中所述反馈信息为所述用户终端对所述经过所述预设处理过的告警事件做预设标记处理生成的处理结果信息;以及将所述处理结果信息保存至所述预设知识库。
在一实施例中,该程序指令被处理器执行所述基于机器学习规则和预设知识库对从所述预设消息队列中获取的告警事件进行预设处理时,具体实现:从所述告警事件中筛选出监控告警事件,其中所述监控告警事件为所述监控***的告警事件;将所述监控告警事件发送至自愈***以使得所述自愈***处理所述监控告警事件对应的故障。
在一实施例中,该程序指令被处理器执行所述根据所述告警数据生成告警事件时,具体实现:按照预设事件格式将所述告警数据生成告警事件。
在一实施例中,该程序指令被处理器执行所述基于机器学习规则和预设知识库对从所述预设消息队列中获取的告警事件进行预设处理时,具体实现:基于机器学习规则和预设知识库对从所述预设消息队列中获取的告警事件进行预设告警分析处理、预设告警收敛处理或预设告警聚合处理。
在一实施例中,该程序指令被处理器执行所述按照预设获取规则获取所述预设消息队列中的告警事件时,具体实现:按照预设顺序获取所述预设消息队列中预设数量的告警事件。
该计算机可读存储介质可以是U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的告警处理装置和方法,可以通过其它的方式实现。例如,以上所描述的告警处理装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。
本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本申请实施例装置中的单元可以根据实际需要进行合并、划分和删减。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种告警处理方法,应用于监控***,其特征在于,包括:
获取监控对象的监控数据;
根据预设告警规则确定所述监控数据中的告警数据,其中所述告警数据为触发所述预设告警规则的监控数据;
根据所述告警数据生成告警事件,并将所述告警事件记录在预设消息队列;
按照预设获取规则获取所述预设消息队列中的告警事件;
基于机器学习规则和预设知识库对从所述预设消息队列中获取的告警事件进行预设处理;以及
将经过所述预设处理过的告警事件发送至用户终端。
2.根据权利要求1所述的告警处理方法,其特征在于,所述将经过所述预设处理过的告警事件发送至用户终端之后,还包括:
接收所述用户终端发送的反馈信息,其中所述反馈信息为所述用户终端对所述经过所述预设处理过的告警事件做预设标记处理生成的处理结果信息;以及
将所述处理结果信息保存至所述预设知识库。
3.根据权利要求1所述的告警处理方法,其特征在于,所述基于机器学习规则和预设知识库对从所述预设消息队列中获取的告警事件进行预设处理,包括:
从所述告警事件中筛选出监控告警事件,其中所述监控告警事件为所述监控***的告警事件;
将所述监控告警事件发送至自愈***以使得所述自愈***处理所述监控告警事件对应的故障。
4.根据权利要求1所述的告警处理方法,其特征在于,所述根据所述告警数据生成告警事件,包括:按照预设事件格式将所述告警数据生成告警事件。
5.根据权利要求1所述的告警处理方法,其特征在于,所述基于机器学习规则和预设知识库对从所述预设消息队列中获取的告警事件进行预设处理,包括:
基于机器学习规则和预设知识库对从所述预设消息队列中获取的告警事件进行预设告警分析处理、预设告警收敛处理或预设告警聚合处理。
6.根据权利要求1所述的告警处理方法,其特征在于,所述按照预设获取规则获取所述预设消息队列中的告警事件,包括:
按照预设顺序获取所述预设消息队列中预设数量的告警事件。
7.一种告警处理装置,其特征在于,包括:
数据获取单元,用于获取监控对象的监控数据;
数据确定单元,用于根据预设告警规则确定所述监控数据中的告警数据,其中所述告警数据为触发所述预设告警规则的监控数据;
生成记录单元,用于根据所述告警数据生成告警事件,并将所述告警事件记录在预设消息队列;
事件获取单元,用于按照预设获取规则获取所述预设消息队列中的告警事件;
预设处理单元,用于基于机器学习规则和预设知识库对从所述预设消息队列中获取的告警事件进行预设处理;以及
事件发送单元,用于将经过所述预设处理过的告警事件发送至用户终端。
8.根据权利要求7所述的告警处理装置,其特征在于,
信息接收单元,用于接收所述用户终端发送的反馈信息,其中所述反馈信息为所述用户终端对所述经过所述预设处理过的告警事件做预设标记处理生成的处理结果信息;以及
信息保存单元,用于将所述处理结果信息保存至所述预设知识库。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6中任一项的方法。
10.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1至6任一项所述的方法。
CN201711001755.3A 2017-10-24 2017-10-24 告警处理方法、装置、计算机设备及存储介质 Pending CN107832200A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201711001755.3A CN107832200A (zh) 2017-10-24 2017-10-24 告警处理方法、装置、计算机设备及存储介质
PCT/CN2017/113234 WO2019080249A1 (zh) 2017-10-24 2017-11-28 告警处理方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711001755.3A CN107832200A (zh) 2017-10-24 2017-10-24 告警处理方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN107832200A true CN107832200A (zh) 2018-03-23

Family

ID=61649105

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711001755.3A Pending CN107832200A (zh) 2017-10-24 2017-10-24 告警处理方法、装置、计算机设备及存储介质

Country Status (2)

Country Link
CN (1) CN107832200A (zh)
WO (1) WO2019080249A1 (zh)

Cited By (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108763038A (zh) * 2018-08-08 2018-11-06 平安科技(深圳)有限公司 告警数据的管理方法、装置、计算机设备及存储介质
CN108846484A (zh) * 2018-04-11 2018-11-20 北京百度网讯科技有限公司 故障自愈***、方法、计算机设备及存储介质
CN108964987A (zh) * 2018-06-15 2018-12-07 平安科技(深圳)有限公司 数据监控方法、装置、计算机设备及存储介质
CN108959034A (zh) * 2018-07-05 2018-12-07 北京木瓜移动科技股份有限公司 一种监控报警方法、装置、电子设备及存储介质
CN109039727A (zh) * 2018-07-24 2018-12-18 中国银行股份有限公司 基于深度学习的消息队列监控方法及装置
CN109086189A (zh) * 2018-07-23 2018-12-25 郑州云海信息技术有限公司 一种物理基础设施管理器pim告警处理方法及设备
CN109144825A (zh) * 2018-07-27 2019-01-04 阿里巴巴集团控股有限公司 一种报警数据监控方法、装置及设备
CN109558298A (zh) * 2018-10-12 2019-04-02 平安科技(深圳)有限公司 基于深度学习模型的告警执行频率优化方法及相关设备
CN109636364A (zh) * 2018-12-29 2019-04-16 江苏满运软件科技有限公司 用于电子红包分组派发的方法、***、设备以及介质
CN109639456A (zh) * 2018-11-09 2019-04-16 网宿科技股份有限公司 一种自动化告警的改进方法及告警数据的自动化处理平台
CN109669836A (zh) * 2018-09-25 2019-04-23 平安普惠企业管理有限公司 智能it运维分析方法、装置、设备及可读存储介质
CN109672556A (zh) * 2018-11-20 2019-04-23 珠海许继芝电网自动化有限公司 一种事件告警***
CN109992483A (zh) * 2019-04-11 2019-07-09 苏州浪潮智能科技有限公司 一种温度监控方法、装置、设备及可读存储介质
CN110362455A (zh) * 2019-07-15 2019-10-22 北京奇艺世纪科技有限公司 一种数据处理方法和数据处理装置
CN110363381A (zh) * 2019-05-31 2019-10-22 阿里巴巴集团控股有限公司 一种信息处理方法和装置
CN110532152A (zh) * 2019-08-05 2019-12-03 北明云智(武汉)网软有限公司 一种基于Kapacitor计算引擎的监控告警处理方法及***
WO2019237585A1 (zh) * 2018-06-13 2019-12-19 平安科技(深圳)有限公司 Zookeeper的监控方法、装置、计算机设备及存储介质
CN110661659A (zh) * 2019-09-23 2020-01-07 上海艾融软件股份有限公司 一种告警方法、装置、***及电子设备
CN110708204A (zh) * 2019-11-18 2020-01-17 上海维谛信息科技有限公司 一种基于运维知识库的异常处理方法、***、终端及介质
CN110719207A (zh) * 2019-10-23 2020-01-21 北京数制科技有限公司 告警消息传输方法、装置、工业数据采集平台和存储介质
CN110865921A (zh) * 2019-11-08 2020-03-06 拉扎斯网络科技(上海)有限公司 数据监控方法、装置、可读存储介质和电子设备
WO2020073994A1 (zh) * 2018-10-11 2020-04-16 中兴通讯股份有限公司 一种网络告警处理方法、装置及存储介质
CN111061616A (zh) * 2019-11-25 2020-04-24 京信通信***(中国)有限公司 告警管理方法、装置、通信设备和存储介质
CN111259629A (zh) * 2020-01-10 2020-06-09 深圳前海环融联易信息科技服务有限公司 任务调度***的告警方法、装置、设备以及存储介质
CN111294218A (zh) * 2018-12-06 2020-06-16 云智慧(北京)科技有限公司 信息处理方法、装置、***及存储介质
CN111352808A (zh) * 2020-03-03 2020-06-30 腾讯云计算(北京)有限责任公司 告警数据处理方法、装置、设备及存储介质
CN111538643A (zh) * 2020-07-07 2020-08-14 宝信软件(成都)有限公司 一种监控***报警信息过滤方法和***
CN111756778A (zh) * 2019-03-26 2020-10-09 京东数字科技控股有限公司 一种服务器磁盘清理脚本推送的方法、装置和存储介质
CN111769977A (zh) * 2020-06-17 2020-10-13 广州嘉为科技有限公司 一种基于企业监控告警事件的处理方法
CN111865691A (zh) * 2020-07-22 2020-10-30 平安证券股份有限公司 基于人工智能的报警文件分发方法、装置、设备和介质
CN112182367A (zh) * 2020-09-18 2021-01-05 佳都新太科技股份有限公司 一种管控告警方法及装置
CN112650642A (zh) * 2020-12-07 2021-04-13 深圳前海微众银行股份有限公司 一种告警处理方法及装置、设备、存储介质
CN112685247A (zh) * 2020-12-24 2021-04-20 京东方科技集团股份有限公司 基于Zabbix监控***的告警抑制方法及监控***
CN113065884A (zh) * 2020-03-31 2021-07-02 ***通信集团贵州有限公司 一种话单文件的处理方法、装置及电子设备
CN113282420A (zh) * 2021-06-07 2021-08-20 新奥数能科技有限公司 一种边缘端服务告警的方法及装置
CN113360292A (zh) * 2021-06-01 2021-09-07 北京百度网讯科技有限公司 消息处理方法、装置、电子设备、存储介质和程序产品
WO2021174835A1 (zh) * 2020-03-04 2021-09-10 平安科技(深圳)有限公司 告警信息处理方法、装置、计算机装置及存储介质
CN113434366A (zh) * 2021-06-28 2021-09-24 中国建设银行股份有限公司 一种事件处理方法和***
CN113608839A (zh) * 2021-08-10 2021-11-05 曙光信息产业(北京)有限公司 集群告警方法、装置、计算机设备及存储介质
CN113704065A (zh) * 2021-08-31 2021-11-26 平安普惠企业管理有限公司 监控方法、装置、设备及计算机存储介质
CN113724100A (zh) * 2021-08-27 2021-11-30 广东电网有限责任公司 一种分布式集群的电网监控告警消息处理方法
CN113794597A (zh) * 2021-09-15 2021-12-14 中国联合网络通信集团有限公司 告警信息处理方法、***、电子设备及存储介质
CN113849383A (zh) * 2021-09-27 2021-12-28 广州华多网络科技有限公司 告警通知控制方法及其装置、设备、介质、产品
CN113886182A (zh) * 2021-09-29 2022-01-04 深圳市金蝶天燕云计算股份有限公司 一种告警收敛方法、装置及电子设备和存储介质
CN113923327A (zh) * 2021-09-08 2022-01-11 深圳市安软慧视科技有限公司 三维地图中摄像头告警的展示方法、***和相关设备
WO2022029599A1 (en) * 2020-08-06 2022-02-10 International Business Machines Corporation Alert management in data processing systems
CN114090412A (zh) * 2022-01-20 2022-02-25 北京安帝科技有限公司 一种分布式告警处理方法及***
CN114172785A (zh) * 2021-10-21 2022-03-11 广州市百果园信息技术有限公司 告警信息处理方法、装置、设备和存储介质
CN114697318A (zh) * 2022-06-01 2022-07-01 深圳市华曦达科技股份有限公司 一种终端设备告警抓拍图片的推送方法及装置
CN114710390A (zh) * 2022-02-18 2022-07-05 联通沃悦读科技文化有限公司 针对互联网***的监控告警方法及***、设备及介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113504969A (zh) * 2021-07-07 2021-10-15 北京汇钧科技有限公司 容器事件告警的方法、装置及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103905533A (zh) * 2014-03-13 2014-07-02 广州杰赛科技股份有限公司 基于云存储的分布式告警监控方法和***
CN105743220A (zh) * 2016-03-21 2016-07-06 国网天津静海供电有限公司 一种调度自动化监控信息分析处理***及方法
CN106649055A (zh) * 2017-01-10 2017-05-10 山东浪潮云服务信息科技有限公司 一种基于国产cpu和操作***的软硬件故障告警***及方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8112378B2 (en) * 2008-06-17 2012-02-07 Hitachi, Ltd. Methods and systems for performing root cause analysis
CN103414581A (zh) * 2013-07-24 2013-11-27 佳都新太科技股份有限公司 一种基于数据挖掘的设备故障报警预测处理机制
CN106940677A (zh) * 2017-02-13 2017-07-11 咪咕音乐有限公司 一种应用日志数据告警方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103905533A (zh) * 2014-03-13 2014-07-02 广州杰赛科技股份有限公司 基于云存储的分布式告警监控方法和***
CN105743220A (zh) * 2016-03-21 2016-07-06 国网天津静海供电有限公司 一种调度自动化监控信息分析处理***及方法
CN106649055A (zh) * 2017-01-10 2017-05-10 山东浪潮云服务信息科技有限公司 一种基于国产cpu和操作***的软硬件故障告警***及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
姚淑萍: "《网络安全预警防御技术》", 30 November 2015, 《国防工业出版社》 *

Cited By (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108846484A (zh) * 2018-04-11 2018-11-20 北京百度网讯科技有限公司 故障自愈***、方法、计算机设备及存储介质
WO2019237585A1 (zh) * 2018-06-13 2019-12-19 平安科技(深圳)有限公司 Zookeeper的监控方法、装置、计算机设备及存储介质
CN108964987A (zh) * 2018-06-15 2018-12-07 平安科技(深圳)有限公司 数据监控方法、装置、计算机设备及存储介质
CN108959034A (zh) * 2018-07-05 2018-12-07 北京木瓜移动科技股份有限公司 一种监控报警方法、装置、电子设备及存储介质
CN109086189A (zh) * 2018-07-23 2018-12-25 郑州云海信息技术有限公司 一种物理基础设施管理器pim告警处理方法及设备
CN109039727B (zh) * 2018-07-24 2021-08-06 中国银行股份有限公司 基于深度学习的消息队列监控方法及装置
CN109039727A (zh) * 2018-07-24 2018-12-18 中国银行股份有限公司 基于深度学习的消息队列监控方法及装置
CN109144825A (zh) * 2018-07-27 2019-01-04 阿里巴巴集团控股有限公司 一种报警数据监控方法、装置及设备
CN108763038B (zh) * 2018-08-08 2022-04-12 平安科技(深圳)有限公司 告警数据的管理方法、装置、计算机设备及存储介质
CN108763038A (zh) * 2018-08-08 2018-11-06 平安科技(深圳)有限公司 告警数据的管理方法、装置、计算机设备及存储介质
CN109669836A (zh) * 2018-09-25 2019-04-23 平安普惠企业管理有限公司 智能it运维分析方法、装置、设备及可读存储介质
CN111049664A (zh) * 2018-10-11 2020-04-21 中兴通讯股份有限公司 一种网络告警处理方法、装置及存储介质
WO2020073994A1 (zh) * 2018-10-11 2020-04-16 中兴通讯股份有限公司 一种网络告警处理方法、装置及存储介质
CN109558298A (zh) * 2018-10-12 2019-04-02 平安科技(深圳)有限公司 基于深度学习模型的告警执行频率优化方法及相关设备
CN109558298B (zh) * 2018-10-12 2022-07-19 平安科技(深圳)有限公司 基于深度学习模型的告警执行频率优化方法及相关设备
CN109639456B (zh) * 2018-11-09 2022-08-16 网宿科技股份有限公司 一种自动化告警的改进方法及告警数据的自动化处理平台
CN109639456A (zh) * 2018-11-09 2019-04-16 网宿科技股份有限公司 一种自动化告警的改进方法及告警数据的自动化处理平台
CN109672556A (zh) * 2018-11-20 2019-04-23 珠海许继芝电网自动化有限公司 一种事件告警***
CN111294218B (zh) * 2018-12-06 2022-07-26 云智慧(北京)科技有限公司 信息处理方法、装置、***及存储介质
CN111294218A (zh) * 2018-12-06 2020-06-16 云智慧(北京)科技有限公司 信息处理方法、装置、***及存储介质
CN109636364A (zh) * 2018-12-29 2019-04-16 江苏满运软件科技有限公司 用于电子红包分组派发的方法、***、设备以及介质
CN111756778B (zh) * 2019-03-26 2024-06-18 京东科技控股股份有限公司 一种服务器磁盘清理脚本推送的方法、装置和存储介质
CN111756778A (zh) * 2019-03-26 2020-10-09 京东数字科技控股有限公司 一种服务器磁盘清理脚本推送的方法、装置和存储介质
CN109992483A (zh) * 2019-04-11 2019-07-09 苏州浪潮智能科技有限公司 一种温度监控方法、装置、设备及可读存储介质
CN110363381B (zh) * 2019-05-31 2023-12-22 创新先进技术有限公司 一种信息处理方法和装置
CN110363381A (zh) * 2019-05-31 2019-10-22 阿里巴巴集团控股有限公司 一种信息处理方法和装置
CN110362455A (zh) * 2019-07-15 2019-10-22 北京奇艺世纪科技有限公司 一种数据处理方法和数据处理装置
CN110532152A (zh) * 2019-08-05 2019-12-03 北明云智(武汉)网软有限公司 一种基于Kapacitor计算引擎的监控告警处理方法及***
CN110661659B (zh) * 2019-09-23 2022-06-21 上海艾融软件股份有限公司 一种告警方法、装置、***及电子设备
CN110661659A (zh) * 2019-09-23 2020-01-07 上海艾融软件股份有限公司 一种告警方法、装置、***及电子设备
CN110719207A (zh) * 2019-10-23 2020-01-21 北京数制科技有限公司 告警消息传输方法、装置、工业数据采集平台和存储介质
CN110865921A (zh) * 2019-11-08 2020-03-06 拉扎斯网络科技(上海)有限公司 数据监控方法、装置、可读存储介质和电子设备
CN110708204A (zh) * 2019-11-18 2020-01-17 上海维谛信息科技有限公司 一种基于运维知识库的异常处理方法、***、终端及介质
CN111061616B (zh) * 2019-11-25 2024-03-29 京信网络***股份有限公司 告警管理方法、装置、通信设备和存储介质
CN111061616A (zh) * 2019-11-25 2020-04-24 京信通信***(中国)有限公司 告警管理方法、装置、通信设备和存储介质
CN111259629A (zh) * 2020-01-10 2020-06-09 深圳前海环融联易信息科技服务有限公司 任务调度***的告警方法、装置、设备以及存储介质
CN111352808A (zh) * 2020-03-03 2020-06-30 腾讯云计算(北京)有限责任公司 告警数据处理方法、装置、设备及存储介质
WO2021174835A1 (zh) * 2020-03-04 2021-09-10 平安科技(深圳)有限公司 告警信息处理方法、装置、计算机装置及存储介质
CN113065884A (zh) * 2020-03-31 2021-07-02 ***通信集团贵州有限公司 一种话单文件的处理方法、装置及电子设备
CN111769977A (zh) * 2020-06-17 2020-10-13 广州嘉为科技有限公司 一种基于企业监控告警事件的处理方法
CN111538643A (zh) * 2020-07-07 2020-08-14 宝信软件(成都)有限公司 一种监控***报警信息过滤方法和***
CN111538643B (zh) * 2020-07-07 2020-10-16 宝信软件(成都)有限公司 一种监控***报警信息过滤方法和***
CN111865691B (zh) * 2020-07-22 2022-11-04 平安证券股份有限公司 基于人工智能的报警文件分发方法、装置、设备和介质
CN111865691A (zh) * 2020-07-22 2020-10-30 平安证券股份有限公司 基于人工智能的报警文件分发方法、装置、设备和介质
WO2022029599A1 (en) * 2020-08-06 2022-02-10 International Business Machines Corporation Alert management in data processing systems
GB2612755A (en) * 2020-08-06 2023-05-10 Ibm Alert management in data processing systems
CN112182367A (zh) * 2020-09-18 2021-01-05 佳都新太科技股份有限公司 一种管控告警方法及装置
CN112650642A (zh) * 2020-12-07 2021-04-13 深圳前海微众银行股份有限公司 一种告警处理方法及装置、设备、存储介质
CN112685247A (zh) * 2020-12-24 2021-04-20 京东方科技集团股份有限公司 基于Zabbix监控***的告警抑制方法及监控***
CN112685247B (zh) * 2020-12-24 2024-01-12 京东方科技集团股份有限公司 基于Zabbix监控***的告警抑制方法及监控***
CN113360292B (zh) * 2021-06-01 2024-03-15 北京百度网讯科技有限公司 消息处理方法、装置、电子设备、存储介质和程序产品
CN113360292A (zh) * 2021-06-01 2021-09-07 北京百度网讯科技有限公司 消息处理方法、装置、电子设备、存储介质和程序产品
CN113282420A (zh) * 2021-06-07 2021-08-20 新奥数能科技有限公司 一种边缘端服务告警的方法及装置
CN113434366A (zh) * 2021-06-28 2021-09-24 中国建设银行股份有限公司 一种事件处理方法和***
CN113608839A (zh) * 2021-08-10 2021-11-05 曙光信息产业(北京)有限公司 集群告警方法、装置、计算机设备及存储介质
CN113724100A (zh) * 2021-08-27 2021-11-30 广东电网有限责任公司 一种分布式集群的电网监控告警消息处理方法
CN113724100B (zh) * 2021-08-27 2024-05-10 广东电网有限责任公司 一种分布式集群的电网监控告警消息处理方法
CN113704065A (zh) * 2021-08-31 2021-11-26 平安普惠企业管理有限公司 监控方法、装置、设备及计算机存储介质
CN113923327A (zh) * 2021-09-08 2022-01-11 深圳市安软慧视科技有限公司 三维地图中摄像头告警的展示方法、***和相关设备
CN113794597B (zh) * 2021-09-15 2023-05-30 中国联合网络通信集团有限公司 告警信息处理方法、***、电子设备及存储介质
CN113794597A (zh) * 2021-09-15 2021-12-14 中国联合网络通信集团有限公司 告警信息处理方法、***、电子设备及存储介质
CN113849383A (zh) * 2021-09-27 2021-12-28 广州华多网络科技有限公司 告警通知控制方法及其装置、设备、介质、产品
CN113886182A (zh) * 2021-09-29 2022-01-04 深圳市金蝶天燕云计算股份有限公司 一种告警收敛方法、装置及电子设备和存储介质
CN114172785A (zh) * 2021-10-21 2022-03-11 广州市百果园信息技术有限公司 告警信息处理方法、装置、设备和存储介质
CN114172785B (zh) * 2021-10-21 2023-10-03 广州市百果园信息技术有限公司 告警信息处理方法、装置、设备和存储介质
CN114090412A (zh) * 2022-01-20 2022-02-25 北京安帝科技有限公司 一种分布式告警处理方法及***
CN114090412B (zh) * 2022-01-20 2022-06-28 北京安帝科技有限公司 一种分布式告警处理方法及***
CN114710390A (zh) * 2022-02-18 2022-07-05 联通沃悦读科技文化有限公司 针对互联网***的监控告警方法及***、设备及介质
CN114697318A (zh) * 2022-06-01 2022-07-01 深圳市华曦达科技股份有限公司 一种终端设备告警抓拍图片的推送方法及装置

Also Published As

Publication number Publication date
WO2019080249A1 (zh) 2019-05-02

Similar Documents

Publication Publication Date Title
CN107832200A (zh) 告警处理方法、装置、计算机设备及存储介质
CN106878064A (zh) 数据监控方法和装置
CA2673135C (en) Determining usage predictions and detecting anomalous user activity through traffic patterns
CN110048888A (zh) 一种基于zabbix监控告警的方法、服务器、设备及存储介质
CN105610648B (zh) 一种运维监控数据的采集方法及服务器
CN106961352A (zh) 监控***及监控方法
CN109669835B (zh) MySQL数据库监控方法、装置、设备及可读存储介质
WO2019223062A1 (zh) ***异常的处理方法和***
CN108880845B (zh) 一种信息提示的方法以及相关装置
CN109861856B (zh) ***故障信息的通知方法、装置、存储介质及计算机设备
CN114595126A (zh) 一种基于规则引擎的告警方法、***、存储设备及终端
CN110198305A (zh) 坐席ip的异常检测方法、***、计算机设备及存储介质
CN109639504A (zh) 一种基于云平台的告警信息处理方法和装置
EP2454848A1 (en) Method and apparatus for telecommunications network performance anomaly events detection and notification
CN114443429B (zh) 一种告警事件的处理方法、装置及计算机可读存储介质
CN107453906A (zh) 一种存储管理***监控告警的设置方法及装置
CN112532435B (zh) 一种运维方法、运维管理平台、设备及介质
CN107689956A (zh) 一种异常事件的威胁评估方法及装置
CN111478815B (zh) 网络性能监控方法及装置
CN109166025A (zh) 一种审核方法和相关装置
CN101766847B (zh) 医疗设备无线监测***
CN110674149B (zh) 业务数据处理方法、装置、计算机设备和存储介质
CN110113201B (zh) 监控数据处理方法、装置及监控***
US11146447B2 (en) Method and apparatus of establishing computer network monitoring criteria
CN112948223A (zh) 一种监测运行情况的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180323

RJ01 Rejection of invention patent application after publication