CN109254897A - 一种告警方法和装置 - Google Patents

一种告警方法和装置 Download PDF

Info

Publication number
CN109254897A
CN109254897A CN201811054939.0A CN201811054939A CN109254897A CN 109254897 A CN109254897 A CN 109254897A CN 201811054939 A CN201811054939 A CN 201811054939A CN 109254897 A CN109254897 A CN 109254897A
Authority
CN
China
Prior art keywords
monitored item
alarm
performance data
item
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811054939.0A
Other languages
English (en)
Inventor
于文杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201811054939.0A priority Critical patent/CN109254897A/zh
Publication of CN109254897A publication Critical patent/CN109254897A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/321Display for diagnostics, e.g. diagnostic result display, self-test user interface

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Human Computer Interaction (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种告警方法,该方法包括:定期接收各资源的各监控项的性能数据;对于不产生预定告警的任一监控项,统计所述监控项连续满足预设条件的次数,当所述次数超过预设的重复次数时,发出告警。本发明还公开告警的装置。本发明提供的方法和装置能够提高告警的准确性,减少告警误报。

Description

一种告警方法和装置
技术领域
本发明涉及监控领域,尤其涉及监控领域中的一种告警方法。
背景技术
在云计算时代,随着业务逻辑复杂,数据增多,相关设备也逐步增加,如何及时产生告警并处理非常重要。因此在监控***运行时,如何产生告警并处理告警信息,达到准确及时告警,并且减少重复告警,是每一个监控***都要考虑的功能。
发明内容
本发明要解决的技术问题是提供一种告警方法,提高了告警的准确性,减少了告警误报。
为了解决上述技术问题,本发明实施例提供了一种告警方法,包括:
定期接收各资源的各监控项的性能数据;
对于不产生预定告警的任一监控项,统计所述监控项连续满足预设条件的次数,当所述次数超过预设的重复次数时,发出告警;
其中,所述不产生预定告警的监控项包括以下一种或多种:预设资源的预设监控项、所有资源的预设类型的监控项或指定设备的所有资源的监控项。
进一步地,上述方法还具有下面特点:
所述监控项包括连续型监控项和离散型监控项;
其中,所述连续型监控项是指性能数据为连续数值的监控项;所述离散型监控项是指性能数据为离散数值的监控项。
进一步地,上述方法还具有下面特点:
按照告警产生的时间分类存储所述告警,并定期自动删除超过预设存储期限的告警。
进一步地,上述方法还具有下面特点:
在发出告警之前,包括:
核查告警是否已经发出,若未发出所述告警,则发出告警。
进一步地,上述方法还具有下面特点:
所述预设条件包括以下一种或多种:无法获取监控项的性能数据、连续型监控项的性能数据高于或低于阈值、离散型监控项的性能数据为预设值。
为了解决上述问题,本发明还提供了一种告警装置,包括:存储器和处理器;其特征在于:
所述存储器,用于保存用于告警的程序;
所述处理器,用于读取执行所述用于告警的程序,执行如下操作:
定期接收各资源的各监控项的性能数据;
对于不产生预定告警的任一监控项,统计所述监控项连续满足预设条件的次数,当所述次数超过预设的重复次数时,发出告警;
其中,所述不产生预定告警的监控项包括以下一种或多种:预设资源的预设监控项、所有资源的预设类型的监控项或指定设备的所有资源的监控项。
进一步地,上述装置还具有下面特点:
所述监控项包括连续型监控项和离散型监控项;
其中,所述连续型监控项是指性能数据为连续数值的监控项;所述离散型监控项是指性能数据为离散数值的监控项。
进一步地,上述装置还具有下面特点:
所述处理器,用于读取执行所述用于告警的程序,还执行如下操作:
按照告警产生的时间分类存储所述告警,并定期自动删除超过预设存储期限的告警。
进一步地,上述装置还具有下面特点:
所述处理器,用于读取执行所述用于告警的程序,还执行如下操作:
在发出告警之前,核查告警是否已经发出,若未发出所述告警,则发出告警。
进一步地,上述装置还具有下面特点:
所述预设条件包括以下一种或多种:无法获取监控项的性能数据、连续型监控项的性能数据高于或低于阈值、离散型监控项的性能数据为预设值。
综上,本发明实施例提供一种告警方法和装置,提高了告警的准确性,减少了告警误报。
附图说明
图1为根据本发明实施例的告警方法的示意图。
图2为根据本发明实施例的告警方法的流程图。
图3为根据本发明实施例的告警装置的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
图1为本发明实施例的告警方法的示意图,如图1所示,本实施例的告警方法包括:
S11、定期接收各资源的各监控项的性能数据。
其中,所述资源是被监控的实体,所述资源的类型包括以下任一种或多种:操作***、数据库、网络设备、主机、虚拟机、服务器。
其中,对于每一个被监控的实体,都有一系列的项目,这些项目就是监控项,代表了实体不同的性能信息。比如交换机的CPU使用率、内存使用率、各个端口流出流量、各个端口流入流量等。监控项的性能数据就是监控项的监控数据。比如,交换机的CPU使用率为60%。
一种可选实施方式中,可以根据用户需要设置每隔10秒钟获取一次各资源的各监控项的性能数据,也可以使用***默认值。
S12、对于不产生预定告警的任一监控项,统计所述监控项连续满足预设条件的次数,当所述次数超过预设的重复次数时,发出告警。
其中,所述不产生预定告警的监控项可以包括以下一种或多种:预设资源的预设监控项、所有资源的预设类型的监控项或指定设备的所有资源的监控项。比如,预设交换机的CPU使用率大于80%不产生告警。想让某设备不告警时,预设该设备的所有资源的监控项不产生预定告警。
预设条件可以是无法获取监控项的性能数据、连续型监控项的性能数据高于或低于阈值、离散型监控项的性能数据为预设值。其中,连续型监控项是指性能数据为连续数值的监控项;比如,CPU使用率和内存使用率都属于连续型监控项。连续型监控项的性能数据为某范围内的连续数值,告警一般包括无法获取数据,以及高于(或低于)阈值。该阈值可根据经验值或实验值自行设置。离散型监控项是指性能数据为离散数值的监控项。其性能数据为某几个离散的数值,一般为状态,告警一般包括无法获取数据,以及状态为某些特定状态。比如进程数就是离散型监控项。
对于第N次接收的某一监控项的性能数据,其不为预定告警的监控项,且满足预设条件,此时连续满足预设条件的次数为1;第N+1接收的该监控项的性能数据,其不是预定告警的监控项,且满足预设条件,此时连续满足预设条件的次数为2。如果该监控项不满足预设条件,则连续满足预设条件的次数恢复成0。
其中,预设的重复次数可根据经验值或实验值自行设置。
一种可选实施方式中,在发出告警之前,还核查告警是否已经发出,若未发出所述告警,则发出告警。从而规避冗余告警,连续的相同的告警只向管理员发送一次。
一种可选实施方式中,可以按照告警产生的时间分类存储所述告警,并定期自动删除超过预设存储期限的告警。比如,将告警按月份进行分离存储,一方面减少数据库大小,使查询方便快捷,另一方面也方便清理历史数据。
图2为本发明实施例的告警方法的流程图。如图2所示,包括步骤如下:
步骤201:定期接收各资源的各监控项的性能数据。
步骤202:对于任一监控项,当判断该监控项不是公认的告警(即上述的预设告警)时,判断该监控项的性能数据是不是满足预设条件。
其中,预设条件可以包括以下一种或多种:无法获取监控项的性能数据、连续型监控项的性能数据高于或低于阈值、离散型监控项的性能数据为预设值。通过公认一个告警,可以使该资源的此监控项或所有资源的此类监控项或者某设备的所有监控项不产生该告警。
步骤203:若满足预设条件,则统计连续满足预设条件的次数。
步骤204:若统计的次数超过预设的重复次数时,检查告警是否已经产生。
步骤205:若统计的次数低过预设的重复次数时,则等待下一次的该监控项的性能数据。
步骤206:若该告警未产生,则产生告警并发出告警,同时按照产生的时间进行分类存储该告警。
可以通过短信或邮件等方式推送该告警。
本实施例的告警方法,通过增加重复次数防抖动机制,监控免告警机制,冗余告警规避,提高了告警准确性,减少了告警误报,增加了告警灵活性。通过按时间分类存储告警,增加了告警可维护性,使查询方便快捷,另一方面也方便清理历史数据。
图3为本发明实施例的告警装置的示意图,如图3所示,本实施例的告警装置,包括:存储器和处理器;其特征在于:
所述存储器,用于保存用于告警的程序;
所述处理器,用于读取执行所述用于告警的程序,执行如下操作:
定期接收各资源的各监控项的性能数据;
对于不产生预定告警的任一监控项,统计所述监控项连续满足预设条件的次数,当所述次数超过预设的重复次数时,发出告警;
其中,所述不产生预定告警的监控项包括以下一种或多种:预设资源的预设监控项、所有资源的预设类型的监控项或指定设备的所有资源的监控项。
可选地,所述监控项包括连续型监控项和离散型监控项;
其中,所述连续型监控项是指性能数据为连续数值的监控项;所述离散型监控项是指性能数据为离散数值的监控项。
可选地,所述处理器,用于读取执行所述用于告警的程序,还执行如下操作:
按照告警产生的时间分类存储所述告警,并定期自动删除超过预设存储期限的告警。
可选地,所述处理器,用于读取执行所述用于告警的程序,还执行如下操作:
在发出告警之前,核查告警是否已经发出,若未发出所述告警,则发出告警。
可选地,所述预设条件包括以下一种或多种:无法获取监控项的性能数据、连续型监控项的性能数据高于或低于阈值、离散型监控项的性能数据为预设值。
本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。本发明不限制于任何特定形式的硬件和软件的结合。
以上仅为本发明的优选实施例,当然,本发明还可有其他多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims (10)

1.一种告警方法,包括:
定期接收各资源的各监控项的性能数据;
对于不产生预定告警的任一监控项,统计所述监控项连续满足预设条件的次数,当所述次数超过预设的重复次数时,发出告警;
其中,所述不产生预定告警的监控项包括以下一种或多种:预设资源的预设监控项、所有资源的预设类型的监控项或指定设备的所有资源的监控项。
2.如权利要求1所述的方法,其特征在于,
所述监控项包括连续型监控项和离散型监控项;
其中,所述连续型监控项是指性能数据为连续数值的监控项;所述离散型监控项是指性能数据为离散数值的监控项。
3.如权利要求1所述的方法,其特征在于,还包括:
按照告警产生的时间分类存储所述告警,并定期自动删除超过预设存储期限的告警。
4.如权利要求1所述的方法,其特征在于,
在发出告警之前,包括:
核查告警是否已经发出,若未发出所述告警,则发出告警。
5.如权利要求2所述的方法,其特征在于,
所述预设条件包括以下一种或多种:无法获取监控项的性能数据、连续型监控项的性能数据高于或低于阈值、离散型监控项的性能数据为预设值。
6.一种告警装置,包括:存储器和处理器;其特征在于:
所述存储器,用于保存用于告警的程序;
所述处理器,用于读取执行所述用于告警的程序,执行如下操作:
定期接收各资源的各监控项的性能数据;
对于不产生预定告警的任一监控项,统计所述监控项连续满足预设条件的次数,当所述次数超过预设的重复次数时,发出告警;
其中,所述不产生预定告警的监控项包括以下一种或多种:预设资源的预设监控项、所有资源的预设类型的监控项或指定设备的所有资源的监控项。
7.如权利要求6所述的装置,其特征在于,
所述监控项包括连续型监控项和离散型监控项;
其中,所述连续型监控项是指性能数据为连续数值的监控项;所述离散型监控项是指性能数据为离散数值的监控项。
8.如权利要求6所述的装置,其特征在于,
所述处理器,用于读取执行所述用于告警的程序,还执行如下操作:
按照告警产生的时间分类存储所述告警,并定期自动删除超过预设存储期限的告警。
9.如权利要求6所述的方法,其特征在于,
所述处理器,用于读取执行所述用于告警的程序,还执行如下操作:
在发出告警之前,核查告警是否已经发出,若未发出所述告警,则发出告警。
10.如权利要求7所述的方法,其特征在于,
所述预设条件包括以下一种或多种:无法获取监控项的性能数据、连续型监控项的性能数据高于或低于阈值、离散型监控项的性能数据为预设值。
CN201811054939.0A 2018-09-11 2018-09-11 一种告警方法和装置 Pending CN109254897A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811054939.0A CN109254897A (zh) 2018-09-11 2018-09-11 一种告警方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811054939.0A CN109254897A (zh) 2018-09-11 2018-09-11 一种告警方法和装置

Publications (1)

Publication Number Publication Date
CN109254897A true CN109254897A (zh) 2019-01-22

Family

ID=65047888

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811054939.0A Pending CN109254897A (zh) 2018-09-11 2018-09-11 一种告警方法和装置

Country Status (1)

Country Link
CN (1) CN109254897A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115225544A (zh) * 2022-07-19 2022-10-21 武汉思普崚技术有限公司 一种网络流量统计和监测方法、装置、电子设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101408889A (zh) * 2008-11-12 2009-04-15 阿里巴巴集团控股有限公司 一种性能监控的方法、装置及***
CN101917296A (zh) * 2006-01-27 2010-12-15 华为技术有限公司 告警***和网络管理器
CN103106763A (zh) * 2011-11-09 2013-05-15 上海移远通信技术有限公司 报警***及方法
CN103544093A (zh) * 2012-07-13 2014-01-29 深圳市快播科技有限公司 监控报警控制方法及其***
CN104657250A (zh) * 2014-12-16 2015-05-27 无锡华云数据技术服务有限公司 一种对云主机进行性能监控的监控方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101917296A (zh) * 2006-01-27 2010-12-15 华为技术有限公司 告警***和网络管理器
CN101408889A (zh) * 2008-11-12 2009-04-15 阿里巴巴集团控股有限公司 一种性能监控的方法、装置及***
CN103106763A (zh) * 2011-11-09 2013-05-15 上海移远通信技术有限公司 报警***及方法
CN103544093A (zh) * 2012-07-13 2014-01-29 深圳市快播科技有限公司 监控报警控制方法及其***
CN104657250A (zh) * 2014-12-16 2015-05-27 无锡华云数据技术服务有限公司 一种对云主机进行性能监控的监控方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115225544A (zh) * 2022-07-19 2022-10-21 武汉思普崚技术有限公司 一种网络流量统计和监测方法、装置、电子设备及介质

Similar Documents

Publication Publication Date Title
WO2020259421A1 (zh) 一种业务***的监控方法及装置
US9070121B2 (en) Approach for prioritizing network alerts
CN106656590B (zh) 一种网络设备告警消息风暴的处理方法和装置
US10687306B2 (en) Intelligent throttling and notifications management for monitoring and incident management systems
US10606851B1 (en) Intelligent compute request scoring and routing
CN107832200A (zh) 告警处理方法、装置、计算机设备及存储介质
CN101727356B (zh) 用于在计算中心中实施资源使用策略的方法和装置
US10896073B1 (en) Actionability metric generation for events
CN109669835A (zh) MySQL数据库监控方法、装置、设备及可读存储介质
CN108400928A (zh) 一种即时通讯异常用户处理方法及装置
CN114661450B (zh) 基于时间序列学习和预测的备份***任务调度方法及***
CN111339466A (zh) 接口管理方法、装置、电子设备及可读存储介质
CN113472582B (zh) 用于信息技术监控中的警报关联和警报聚合的***和方法
CN109254897A (zh) 一种告警方法和装置
CN110677271B (zh) 基于elk的大数据告警方法、装置、设备及存储介质
CN110389876A (zh) 基础资源容量监管方法、装置、设备及存储介质
KR102464688B1 (ko) 모니터링 결과의 이벤트 등급 결정 방법 및 장치
CN115426287A (zh) 一种***监控和优化方法、装置、电子设备及介质
CN111090563B (zh) 数据池监视***
CN111211938B (zh) 生物信息软件监控***及方法
CN108809735B (zh) 事件上报管理方法及装置
CN115914064A (zh) 网络***服务性能评估方法、装置、计算设备和存储介质
JP2021018630A (ja) 警報集約選別装置及び警報集約選別方法
US20240012795A1 (en) Database usage footprint monitoring platform
CN117557071B (zh) 稀疏时间序列的预测方法、设备、存储介质及应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190122

RJ01 Rejection of invention patent application after publication