CN115080366A - 告警方法、装置、计算机设备和存储介质 - Google Patents

告警方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN115080366A
CN115080366A CN202211002521.1A CN202211002521A CN115080366A CN 115080366 A CN115080366 A CN 115080366A CN 202211002521 A CN202211002521 A CN 202211002521A CN 115080366 A CN115080366 A CN 115080366A
Authority
CN
China
Prior art keywords
alarm
data
data source
index
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211002521.1A
Other languages
English (en)
Other versions
CN115080366B (zh
Inventor
熊勇
刘东宝
于桂东
邹建斌
黄狄杰
陈晓钿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yishi Huolala Technology Co Ltd
Original Assignee
Shenzhen Yishi Huolala Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Yishi Huolala Technology Co Ltd filed Critical Shenzhen Yishi Huolala Technology Co Ltd
Priority to CN202211002521.1A priority Critical patent/CN115080366B/zh
Publication of CN115080366A publication Critical patent/CN115080366A/zh
Application granted granted Critical
Publication of CN115080366B publication Critical patent/CN115080366B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3093Configuration details thereof, e.g. installation, enabling, spatial arrangement of the probes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3495Performance evaluation by tracing or monitoring for systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/865Monitoring of software

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Alarm Systems (AREA)

Abstract

本申请涉及一种告警方法、装置、计算机设备和存储介质。方法包括:当监听到实例数据源的数据源变更消息时,根据数据源变更消息生成目标业务的告警规则实例数据,根据检查时间配置数据确定告警规则实例数据对应的检查时间;当监听到目标指标数据源的数据源变更消息时,确定与目标指标数据源对应的目标告警指标,根据目标指标数据源的数据源变更消息和目标告警指标对应的统计类型更新目标告警指标的指标数据;在当前时间到达检查时间时,根据告警规则实例数据获取各告警指标的指标数据,根据获得的指标数据检验告警规则是否成立,以及响应于告警规则成立,进行告警。本申请可使各三方业务***无需专门开发告警能力,能降低重复开发和维护的成本。

Description

告警方法、装置、计算机设备和存储介质
技术领域
本申请涉及数据分析领域,特别是涉及一种告警方法、装置、计算机设备和存储介质。
背景技术
目前,为了分析三方业务***的业务的转化漏斗是否存在转化异常,多数业务告警***会通过在三方业务***内部嵌入埋点上报代码的方式来收集转化漏斗的相关指标的指标数据,并在确认存在转化异常时进行告警。
然而,上述收集指标数据的方式需要占用开发资源,并且需要提前将相关埋点上报代码嵌入到对应业务***中,再通过发版验证上线,因而使用起来不够灵活,并且时间周期也会比较长。
再者,对于从三方业务***中的业务数据的角度出发,去观察是否存在转化漏斗转化异常的场景,三方业务***往往需要专门去开发和维护用于扫描业务数据的定时任务,需要专门去开发用于对指标数据进行分组、计数、累计等操作的功能,这种工作会极大浪费开发和测试资源,并且是重复性的工作。
发明内容
本申请针对上述不足或缺点,提供了一种告警方法、装置、计算机设备和存储介质,本申请实施例通过告警平台来为各三方业务***提供转化漏斗转化异常的告警能力,使得各三方业务***无需专门开发相应的告警能力,能够降低重复开发和维护的成本。
本申请根据第一方面提供了一种告警方法,在一个实施例中,该方法包括:
接收用户为目标业务配置的告警配置数据;其中,告警配置数据包括含有一个或多个告警指标的告警规则、各告警指标对应的统计类型、检查时间配置数据和数据源配置数据;
根据数据源配置数据监听目标业务对应的实例数据源以及各告警指标对应的指标数据源的数据源变更消息;
当监听到实例数据源的数据源变更消息时,根据实例数据源的数据源变更消息生成目标业务的告警规则实例数据,根据检查时间配置数据确定告警规则实例数据对应的检查时间;
当监听到目标指标数据源的数据源变更消息时,确定与目标指标数据源对应的目标告警指标,根据目标指标数据源的数据源变更消息和目标告警指标对应的统计类型更新目标告警指标的指标数据;
在当前时间到达检查时间时,根据告警规则实例数据获取各告警指标的指标数据,根据获得的指标数据检验告警规则是否成立,以及响应于告警规则成立,进行告警。
在一个实施例中,目标业务是任一个三方业务***的任一个业务;数据源变更消息是binlog消息;目标告警指标是告警规则包含的任一个告警指标。
在一个实施例中,数据源配置数据包括目标业务对应的实例数据源的配置数据以及各告警指标对应的指标数据源的配置数据;根据数据源配置数据监听目标业务对应的实例数据源以及各告警指标对应的指标数据源的数据源变更消息之前还包括:
根据目标业务对应的实例数据源的配置数据,向目标业务对应的实例数据源注册数据源消息变更监听;
根据各告警指标对应的指标数据源的配置数据,向各告警指标对应的指标数据源注册数据源消息变更监听。
在一个实施例中,根据检查时间配置数据确定告警规则实例数据对应的检查时间之后还包括:
将告警规则实例数据作为延迟消息发送至延迟队列,并将上述延迟消息的延迟消费时间设置为检查时间;
监听延迟队列;
在当前时间到达检查时间时,根据告警规则实例数据获取各告警指标的指标数据,包括:
当监听到上述延迟消息对应的延迟消费时间到达时,表明当前时间到达检查时间,从延迟队列中拉取上述延迟消息;
根据上述延迟消息获取各告警指标的指标数据。
在一个实施例中,根据获得的指标数据检验告警规则是否成立,包括:
将获得的各指标数据填充至告警规则中进行计算;
将计算得到的结果与告警规则中的比较阈值进行比较;
根据比较结果检验告警规则是否成立。
在一个实施例中,检查时间配置数据包括起始时间配置和预设时长;
根据检查时间配置数据确定告警规则实例数据对应的检查时间,包括:
根据起始时间配置从实例数据源的数据源变更消息中获取起始时间;
根据起始时间和预设时长确定告警规则实例数据对应的检查时间。
在一个实施例中,进行告警,包括:
获取预设的告警模板;
根据告警模板生成告警内容;
以预设触达方式将告警内容发送至预设接收告警人。
本申请根据第二方面提供了一种告警装置,在一个实施例中,该装置包括:
告警配置接收模块,用于接收用户为目标业务配置的告警配置数据;其中,告警配置数据包括含有一个或多个告警指标的告警规则、各告警指标对应的统计类型、检查时间配置数据和数据源配置数据;
监听模块,用于根据数据源配置数据监听目标业务对应的实例数据源以及各告警指标对应的指标数据源的数据源变更消息;
第一处理模块,用于当监听到实例数据源的数据源变更消息时,根据实例数据源的数据源变更消息生成目标业务的告警规则实例数据,根据检查时间配置数据确定告警规则实例数据对应的检查时间;
第二处理模块,用于当监听到目标指标数据源的数据源变更消息时,确定与目标指标数据源对应的目标告警指标,根据目标指标数据源的数据源变更消息和目标告警指标对应的统计类型更新目标告警指标的指标数据;
第三处理模块,用于在当前时间到达检查时间时,根据告警规则实例数据获取各告警指标的指标数据,根据获得的指标数据检验告警规则是否成立,以及响应于告警规则成立,进行告警。
本申请根据第三方面提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述任一方法的实施例的步骤。
本申请根据第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一方法的实施例的步骤。
本申请上述实施例通过告警平台来为各三方业务***提供转化漏斗转化异常的告警能力,可以使得各三方业务***无需专门开发相应的告警能力,能够降低重复开发和维护的成本。
附图说明
图1为一个实施例中一种告警方法的应用环境图;
图2为一个实施例中一种告警方法的流程示意图;
图3为一个实施例中一种告警装置的结构框图;
图4为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅用以解释本申请,并不用于限定本申请。
本申请提供了一种告警方法。在一个实施例中,该告警方法可以应用于如图1所示的应用环境中。其中,告警平台(如图1中所示的20)可以为多个三方业务***(示例性地,可以如图1中所示的11、12、1N)提供转化漏斗转化异常的告警能力。其中,告警平台和三方业务***可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
本实施例提供的一种告警方法包括如图2所示的步骤S110-S150,下面以该方法应用于图1中的告警平台为例进行说明。
步骤S110:接收用户为目标业务配置的告警配置数据;其中,告警配置数据包括含有一个或多个告警指标的告警规则、各告警指标对应的统计类型、检查时间配置数据和数据源配置数据。目标业务是任一个三方业务***的任一个业务。三方业务***是告警平台之外的业务***。
针对三方业务***中存在的转化漏斗可能转化异常的场景,告警平台通过将三方业务***的转化漏斗转换成对应的告警规则,提供了通用的配置化接入方式,供各三方业务***接入。对于目标三方业务***(可以是任一个三方业务***)的目标转化漏斗(可以是任一个转化漏斗),中台人员可以在告警平台的管理端为其配置相应的告警配置数据,告警平台即可基于配置好的告警配置数据监控相关业务在该目标转化漏斗上是否出现转化异常,并在监控到出现转化异常时进行告警。
以下通过一个示例来对转化漏斗进行介绍。
以目标三方业务***是司机任务***为例,司机任务***的功能是:圈选一批司机,给各个司机派发任务,如果司机按照任务的要求完成任务,就可以获得任务对应的奖励。
假设运营人员在司机任务***创建了一个任务A,任务A需要派发给100万个司机,任务的派发时间为“2022-07-25 10:00:00”,任务的有效期为“2022-07-25 10:00:00到2022-07-25 23:59:59”,任务完成条件为“完成1单”,任务奖励为“现金5元”
任务A包含的完整漏斗可以为:预期派发任务数(100万)->实际派发任务数(95万)->司机领取任务数(80万)->司机完成任务数(20万)->领取任务奖励数(18万);
基于上述完整漏斗,至少可以定义出以下两个转化漏斗:
转化漏斗1:派发成功率 = 实际派发任务数/预期派发任务数;
转化漏斗2:派发完成率 = 完成任务数/实际派发任务数;
使用司机任务***的运营人员或是开发人员可以根据经验和/或查看到的历史数据情况,基于上述一个或两个转化漏斗为相关业务配置业务告警规则,例如:
业务告警规则1:在任务派发1个小时后(即派发时间 + 1小时),如果派发成功率< 90%,就进行告警;
业务告警规则2:在任务结束3个小时后(即任务的有期结束时间 + 3小时),如果派发完成率 < 5%,就进行告警。
其中,用户为目标业务配置的告警配置数据包括含有一个或多个告警指标(如上述的“任务派发1个小时后”“任务结束3个小时后”、“派发完成率”)的告警规则、各告警指标对应的统计类型、检查时间配置数据和数据源配置数据。可以理解地,用户可以根据需要调整告警配置数据的具体内容。
在一个具体的示例中,告警配置数据包括的数据可以如下所示:
1.数据源数据(包括数据库信息+表信息+列信息)
a.告警规则实例数据源、数据源记录的过滤规则(用于排除掉无用的表记录,如要过滤掉其中已经被软删的记录);
b.告警规则中指标的数据源、指标的统计类型(可以是常量、计数,累加)、对应告警规则关联的ID、数据源记录的过滤规则;
c.其他依赖的数据源(如:告警内容中需要填充的内容)数据源记录的过滤规则。
2.告警规则配置
告警规则配置用于配置业务告警规则,其中,业务告警规则可以由告警规则检查时间表达式和告警规则表达式两部分组成。
例如:
a.告警规则检查时间表达式:
b.告警规则表达式:如:完成任务数/实际派发任务数 < 5% ;
进一步地,告警规则配置还可以包括:
c.告警触达方式:如:飞书、飞书群,邮件,短信等;
d.告警内容模板。
上述的告警内容模板可以是:
“【司机任务】派发完成率告警
任务结束3小时后,派发完成率小于5%,触发告警,请注意!
任务ID : #{taskId}
任务名称:#{taskName}
@张三, @李四 ”
3. 告警规则数据与数据源数据的关联(或称为映射关系)
步骤S120:根据数据源配置数据监听目标业务对应的实例数据源以及各告警指标对应的指标数据源的数据源变更消息。
本实施例中,数据源变更消息是指数据库的binlog消息(指二进制日志)。
数据源配置数据可以包括目标业务对应的实例数据源的配置数据以及各告警指标对应的指标数据源的配置数据。
相应地,根据数据源配置数据监听目标业务对应的实例数据源以及各告警指标对应的指标数据源的数据源变更消息之前还包括:根据目标业务对应的实例数据源的配置数据,向目标业务对应的实例数据源注册数据源消息变更监听;以及,根据各告警指标对应的指标数据源的配置数据,向各告警指标对应的指标数据源注册数据源消息变更监听。
本实施例通过动态地向相关数据源注册数据源消息变更监听,可以以订阅的方式获取到相关数据源中的业务数据,无需预先埋点,因而不用占用开发资源。此外,以订阅的方式来获取业务数据,使用起来更快更灵活。
步骤S130:当监听到实例数据源的数据源变更消息时,根据实例数据源的数据源变更消息生成目标业务的告警规则实例数据,根据检查时间配置数据确定告警规则实例数据对应的检查时间。
其中,上述的检查时间配置数据包括起始时间配置和预设时长。相应地,根据检查时间配置数据确定告警规则实例数据对应的检查时间的步骤,包括:根据起始时间配置从实例数据源的数据源变更消息中获取起始时间;根据起始时间和预设时长确定告警规则实例数据对应的检查时间。
检查时间配置数据即前文示例中的告警规则检查时间表达式,如:“任务结束时间+ 3小时”,在此示例中,起始时间配置是“任务结束时间”,预设时长是“3小时”。如果获取到的起始时间是13:00,那么可以确定检查时间是16:00。
步骤S140:当监听到目标指标数据源的数据源变更消息时,确定与目标指标数据源对应的目标告警指标,根据目标指标数据源的数据源变更消息和目标告警指标对应的统计类型更新目标告警指标的指标数据。
目标告警指标可以是用户为目标业务配置的告警规则中所包含的任一个告警指标。在监听到目标指标数据源的数据源变更消息时,可以根据告警规则数据与数据源数据的关联来确定出与目标指标数据源对应的目标告警指标。
以下通过一个示例来对监听到实例数据源的数据源变更消息以及目标指标数据源的数据源变更消息时,会采取的相关处理。
本示例以用户为目标业务配置的告警规则是“在任务结束3个小时后,派发完成率<5%就告警”,以及目标业务是上文所提及的司机任务***中的任务为例。
在监听到binlog消息时,只关注binlog消息中的如下两部分内容。
1. 告警规则实例数据
告警平台需要监听目标业务对应的实例数据源的***语句的binlog消息,当监听到该实例数据源的***语句的binlog消息时,告警平台会获取目标业务的业务内容,根据业务内容生成告警规则实例,并落库(这其中还会保存依赖的字段,如告警内容模板中需要填充的字段),并获取任务的结束时间,结合告警规则检查时间配置,计算出检查时间。
2. 指标数据
对于本示例中的告警规则,其可以拆出如下信息:
告警规则的公式为:派发完成率=完成任务数/实际派发任务数;
告警规则涉及的指标为:司机完成任务数、实际派发任务数;
实际派发任务数:这个指标是要通过监听目标业务与司机建立关联时的***语句的binlog消息,并基于监听到的binlog消息对实际派发任务数这个指标做累加计算,得到最新的指标数据。
司机完成任务数:这个指标是要通过监听目标业务与司机关联表所记录的更新语句的binlog消息,当更新内容中包含了表示将目标业务的任务状态字段的字段值更新为“已完成”的内容时,对司机完成任务数这个指标做累加计算,得到最新的指标数据。
步骤S150:在当前时间到达检查时间时,根据告警规则实例数据获取各告警指标的指标数据,根据获得的指标数据检验告警规则是否成立,以及响应于告警规则成立,进行告警。
其中,告警规则实例数据包括实例标识(或称为目标业务的业务标识)、 告警规则配置所关联的唯一ID以及数据源配置数据所关联的唯一ID。
上述根据获得的指标数据检验告警规则是否成立的步骤,可以包括:将获得的各指标数据填充至告警规则中进行计算;将计算得到的结果与告警规则中的比较阈值进行比较;根据比较结果检验告警规则是否成立。其中,假设业务规则是“在任务结束3个小时后,派发完成率<5%就告警”,则比较阈值是指“5%(派发完成率=司机完成任务数/实际派发任务数)”,告警平台会先获取司机完成任务数和实际派发任务数这两个指标的指标数据,然后填充至“派发完成率=司机完成任务数/实际派发任务数”这一公式中进行计算以得到的计算结果,即派发完成率这一指标的指标数据。计算结果如果小于5%,那么就确定告警规则成立,反之,则确定告警规则不成立。
进一步地,上述进行告警的步骤,可以包括:获取预设的告警模板;根据告警模板生成告警内容;以预设触达方式将告警内容发送至预设接收告警人。
在上述实施例中,告警平台为各三方业务***提供了通用配置化接入,基于用户为目标业务配置好的告警配置数据,对相关数据源的数据源变更消息进行实时监听,能够为各三方业务***提供快速告警能力,保障三方业务***的稳定性。
在一个实施例中,在根据检查时间配置数据确定告警规则实例数据对应的检查时间的步骤之后还包括:将告警规则实例数据作为延迟消息发送至延迟队列,并将上述延迟消息的延迟消费时间设置为检查时间;监听延迟队列。相应地,在当前时间到达检查时间时,根据告警规则实例数据获取各告警指标的指标数据,包括:当监听到上述延迟消息对应的延迟消费时间到达时,表明当前时间到达检查时间,从延迟队列中拉取上述延迟消息;根据上述延迟消息获取各告警指标的指标数据。
在本实施例中,告警平台会将生成的告警规则实例数据直接作为延迟消息发送至延迟队列,并将检查时间设为该延迟消息的消费时间(即上述的延迟消费时间),当监听到该延迟消息到达延迟消费时间时,即从延迟队列中拉取该延迟消息,然后根据该延迟消息来执行相关计算,以判断告警规则是否成立。
由于监控目标业务的转化漏斗是否出现异常的流程很长,以同步形式一直将整个流程走完会存在很多问题(比如不稳定,效率低等)因此,本实施例采用了延迟队列,有利于提高告警平台的响应速度, 告警平台只要将告警规则实例数据作为延迟消息发送至延迟队列,就可以立马返回,可以执行其他事情。还需要说明的是,上述的检查时间是一个未来的时间。因此,需要用延迟队列而不能用普通的消息队列来实现。其中,延迟队列可以用RabbitMQ来实现。
图2为一个实施例中告警方法的流程示意图。应该理解的是,虽然图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
基于相同的发明构思,本申请还提供了一种告警装置。在本实施例中,如图3所示,该告警装置应用于告警平台,可以包括以下模块:
告警配置接收模块110,用于接收用户为目标业务配置的告警配置数据;其中,告警配置数据包括含有一个或多个告警指标的告警规则、各告警指标对应的统计类型、检查时间配置数据和数据源配置数据;
监听模块120,用于根据数据源配置数据监听目标业务对应的实例数据源以及各告警指标对应的指标数据源的数据源变更消息;
第一处理模块130,用于当监听到实例数据源的数据源变更消息时,根据实例数据源的数据源变更消息生成目标业务的告警规则实例数据,根据检查时间配置数据确定告警规则实例数据对应的检查时间;
第二处理模块140,用于当监听到目标指标数据源的数据源变更消息时,确定与目标指标数据源对应的目标告警指标,根据目标指标数据源的数据源变更消息和目标告警指标对应的统计类型更新目标告警指标的指标数据;
第三处理模块150,用于在当前时间到达检查时间时,根据告警规则实例数据获取各告警指标的指标数据,根据获得的指标数据检验告警规则是否成立,以及响应于告警规则成立,进行告警。
在一个实施例中,目标业务是任一个三方业务***的任一个业务;数据源变更消息是binlog消息;目标告警指标是告警规则包含的任一个告警指标。
在一个实施例中,数据源配置数据包括目标业务对应的实例数据源的配置数据以及各告警指标对应的指标数据源的配置数据。监听模块120在根据数据源配置数据监听目标业务对应的实例数据源以及各告警指标对应的指标数据源的数据源变更消息之前,还用于根据目标业务对应的实例数据源的配置数据,向目标业务对应的实例数据源注册数据源消息变更监听;根据各告警指标对应的指标数据源的配置数据,向各告警指标对应的指标数据源注册数据源消息变更监听。
在一个实施例中,第一处理模块130在根据检查时间配置数据确定告警规则实例数据对应的检查时间之后,还用于:将告警规则实例数据作为延迟消息发送至延迟队列,并将上述延迟消息的延迟消费时间设置为检查时间以及监听延迟队列。相应地,第三处理模块150在当前时间到达检查时间时,根据告警规则实例数据获取各告警指标的指标数据时,具体用于:当监听到上述延迟消息对应的延迟消费时间到达时,表明当前时间到达检查时间,从延迟队列中拉取上述延迟消息;根据上述延迟消息获取各告警指标的指标数据。
在一个实施例中,第三处理模块150根据获得的指标数据检验告警规则是否成立时,具体用于:将获得的各指标数据填充至告警规则中进行计算;将计算得到的结果与告警规则中的比较阈值进行比较;根据比较结果检验告警规则是否成立。
在一个实施例中,检查时间配置数据包括起始时间配置和预设时长;相应地,第一处理模块130根据检查时间配置数据确定告警规则实例数据对应的检查时间时,具体用于:根据起始时间配置从实例数据源的数据源变更消息中获取起始时间;根据起始时间和预设时长确定告警规则实例数据对应的检查时间。
在一个实施例中,第三处理模块150进行告警时,具体用于:获取预设的告警模板;根据告警模板生成告警内容;以预设触达方式将告警内容发送至预设接收告警人。
关于告警装置的具体限定可以参见上文中对于告警方法的限定,在此不再赘述。上述告警装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,其内部结构图可以如图4所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储目标业务的告警配置数据等数据,具体存储的数据还可以参见上述方法实施例中的限定。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种告警方法。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上述任一实施例中提供的告警方法中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述任一实施例中提供的告警方法中的步骤。
本领域普通技术人员可以理解实现上述方法实施例中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于非易失性计算机可读存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种告警方法,其特征在于,应用于告警平台,所述方法包括:
接收用户为目标业务配置的告警配置数据;其中,所述告警配置数据包括含有一个或多个告警指标的告警规则、各所述告警指标对应的统计类型、检查时间配置数据和数据源配置数据;
根据所述数据源配置数据监听所述目标业务对应的实例数据源以及各所述告警指标对应的指标数据源的数据源变更消息;
当监听到所述实例数据源的数据源变更消息时,根据所述实例数据源的数据源变更消息生成所述目标业务的告警规则实例数据,根据所述检查时间配置数据确定所述告警规则实例数据对应的检查时间;
当监听到目标指标数据源的数据源变更消息时,确定与所述目标指标数据源对应的目标告警指标,根据所述目标指标数据源的数据源变更消息和所述目标告警指标对应的统计类型更新所述目标告警指标的指标数据;
在当前时间到达所述检查时间时,根据所述告警规则实例数据获取各所述告警指标的指标数据,根据获得的指标数据检验所述告警规则是否成立,以及响应于所述告警规则成立,进行告警。
2.如权利要求1所述的方法,其特征在于,所述目标业务是任一个三方业务***的任一个业务;所述数据源变更消息是binlog消息;所述目标告警指标是所述告警规则包含的任一个告警指标。
3.如权利要求1所述的方法,其特征在于,所述数据源配置数据包括所述目标业务对应的实例数据源的配置数据以及各所述告警指标对应的指标数据源的配置数据;根据所述数据源配置数据监听所述目标业务对应的实例数据源以及各所述告警指标对应的指标数据源的数据源变更消息之前还包括:
根据所述目标业务对应的实例数据源的配置数据,向所述目标业务对应的实例数据源注册数据源消息变更监听;
根据各所述告警指标对应的指标数据源的配置数据,向各所述告警指标对应的指标数据源注册数据源消息变更监听。
4.如权利要求1或3所述的方法,其特征在于,根据所述检查时间配置数据确定所述告警规则实例数据对应的检查时间之后还包括:
将所述告警规则实例数据作为延迟消息发送至延迟队列,并将所述延迟消息的延迟消费时间设置为所述检查时间;
监听所述延迟队列;
所述在当前时间到达所述检查时间时,根据所述告警规则实例数据获取各所述告警指标的指标数据,包括:
当监听到所述延迟消息对应的延迟消费时间到达时,表明当前时间到达所述检查时间,从所述延迟队列中拉取所述延迟消息;
根据所述延迟消息获取各所述告警指标的指标数据。
5.如权利要求1所述的方法,其特征在于,所述根据获得的指标数据检验所述告警规则是否成立,包括:
将获得的各指标数据填充至所述告警规则中进行计算;
将计算得到的结果与所述告警规则中的比较阈值进行比较;
根据比较结果检验所述告警规则是否成立。
6.如权利要求1所述的方法,其特征在于,所述检查时间配置数据包括起始时间配置和预设时长;根据所述检查时间配置数据确定所述告警规则实例数据对应的检查时间,包括:
根据所述起始时间配置从所述实例数据源的数据源变更消息中获取起始时间;
根据所述起始时间和所述预设时长确定所述告警规则实例数据对应的检查时间。
7.如权利要求1或6所述的方法,其特征在于,所述进行告警,包括:
获取预设的告警模板;
根据所述告警模板生成告警内容;
以预设触达方式将所述告警内容发送至预设接收告警人。
8.一种告警装置,其特征在于,应用于告警平台,所述装置包括:
告警配置接收模块,用于接收用户为目标业务配置的告警配置数据;其中,所述告警配置数据包括含有一个或多个告警指标的告警规则、各所述告警指标对应的统计类型、检查时间配置数据和数据源配置数据;
监听模块,用于根据所述数据源配置数据监听所述目标业务对应的实例数据源以及各所述告警指标对应的指标数据源的数据源变更消息;
第一处理模块,用于当监听到所述实例数据源的数据源变更消息时,根据所述实例数据源的数据源变更消息生成所述目标业务的告警规则实例数据,根据所述检查时间配置数据确定所述告警规则实例数据对应的检查时间;
第二处理模块,用于当监听到目标指标数据源的数据源变更消息时,确定与所述目标指标数据源对应的目标告警指标,根据所述目标指标数据源的数据源变更消息和所述目标告警指标对应的统计类型更新所述目标告警指标的指标数据;
第三处理模块,用于在当前时间到达所述检查时间时,根据所述告警规则实例数据获取各所述告警指标的指标数据,根据获得的指标数据检验所述告警规则是否成立,以及响应于所述告警规则成立,进行告警。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202211002521.1A 2022-08-22 2022-08-22 告警方法、装置、计算机设备和存储介质 Active CN115080366B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211002521.1A CN115080366B (zh) 2022-08-22 2022-08-22 告警方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211002521.1A CN115080366B (zh) 2022-08-22 2022-08-22 告警方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN115080366A true CN115080366A (zh) 2022-09-20
CN115080366B CN115080366B (zh) 2022-11-15

Family

ID=83245096

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211002521.1A Active CN115080366B (zh) 2022-08-22 2022-08-22 告警方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN115080366B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170329808A1 (en) * 2016-05-12 2017-11-16 NeoTek Energy, Inc. System and method for a multi-sensor network interface for real-time data historian
CN108270618A (zh) * 2017-12-30 2018-07-10 杭州华为数字技术有限公司 告警判定的方法、装置及告警***
US20180239809A1 (en) * 2017-02-17 2018-08-23 International Business Machines Corporation Managing content creation of data sources
CN109815028A (zh) * 2018-12-27 2019-05-28 北京摩拜科技有限公司 数据同步的***、方法、装置和计算机存储介质
CN112416724A (zh) * 2020-12-04 2021-02-26 中国建设银行股份有限公司 告警处理方法、***、计算机设备和存储介质
CN112511339A (zh) * 2020-11-09 2021-03-16 宝付网络科技(上海)有限公司 基于多集群的容器监控告警方法、***、设备及存储介质
CN113377624A (zh) * 2021-07-02 2021-09-10 华青融天(北京)软件股份有限公司 信息安全告警方法、装置和电子设备
WO2021247194A1 (en) * 2020-06-04 2021-12-09 Frito-Lay North America, Inc. Frontline void planogram alerting service tool
CN113961431A (zh) * 2021-10-27 2022-01-21 维沃移动通信有限公司 业务监控方法及其装置
CN114661562A (zh) * 2022-04-22 2022-06-24 北京博睿宏远数据科技股份有限公司 一种数据告警方法、装置、设备及介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170329808A1 (en) * 2016-05-12 2017-11-16 NeoTek Energy, Inc. System and method for a multi-sensor network interface for real-time data historian
US20180239809A1 (en) * 2017-02-17 2018-08-23 International Business Machines Corporation Managing content creation of data sources
CN108270618A (zh) * 2017-12-30 2018-07-10 杭州华为数字技术有限公司 告警判定的方法、装置及告警***
CN109815028A (zh) * 2018-12-27 2019-05-28 北京摩拜科技有限公司 数据同步的***、方法、装置和计算机存储介质
WO2021247194A1 (en) * 2020-06-04 2021-12-09 Frito-Lay North America, Inc. Frontline void planogram alerting service tool
CN112511339A (zh) * 2020-11-09 2021-03-16 宝付网络科技(上海)有限公司 基于多集群的容器监控告警方法、***、设备及存储介质
CN112416724A (zh) * 2020-12-04 2021-02-26 中国建设银行股份有限公司 告警处理方法、***、计算机设备和存储介质
CN113377624A (zh) * 2021-07-02 2021-09-10 华青融天(北京)软件股份有限公司 信息安全告警方法、装置和电子设备
CN113961431A (zh) * 2021-10-27 2022-01-21 维沃移动通信有限公司 业务监控方法及其装置
CN114661562A (zh) * 2022-04-22 2022-06-24 北京博睿宏远数据科技股份有限公司 一种数据告警方法、装置、设备及介质

Also Published As

Publication number Publication date
CN115080366B (zh) 2022-11-15

Similar Documents

Publication Publication Date Title
CN110995482B (zh) 告警分析方法、装置、计算机设备及计算机可读存储介质
CN110659123B (zh) 一种基于消息的分布式任务分发调度方法及装置
CN111585837B (zh) 物联网数据链路监控方法、装置、计算机设备和存储介质
CN111582771A (zh) 风险评估方法、装置、设备及计算机可读存储介质
CN110737655B (zh) 用于上报数据的方法和装置
CN111416857A (zh) 客户端崩溃处理方法、装置、***、设备和存储介质
CN113342608B (zh) 流式计算引擎任务的监控方法及装置
CN115080366B (zh) 告警方法、装置、计算机设备和存储介质
CN117762652A (zh) 基于消息中间件的分布式事务的处理方法及装置
CN110011845B (zh) 日志采集方法及***
CN117170894A (zh) 基于实时计算的事件中心管理方法和装置
CN112860763B (zh) 实时流数据处理方法、装置、计算机设备和存储介质
CN115442225A (zh) 埋点日志上报方法和装置以及埋点质量监控方法和装置
CN113901153A (zh) 数据处理方法及相关设备
CN114816915A (zh) 链路追踪方法以及设备
CN113079063A (zh) 充电设备的离线判断方法、***、设备及计算机存储介质
CN108805778B (zh) 电子装置、采集征信数据的方法及存储介质
CN114143822A (zh) 流量管理方法、运营管理平台、充电桩及存储介质
CN101894119B (zh) 用于监控的海量数据的储存
CN113094241A (zh) 一种实时程序准确性的确定方法、装置、设备及存储介质
CN112632121A (zh) 区块链数据获取方法和装置
CN111711537B (zh) 备用主节点列表更新方法、装置及设备
CN109753420B (zh) 监控数据的采集方法及装置
CN112506735B (zh) 服务质量监控方法、***、服务器和存储介质
CN117041356B (zh) 指标分发方法、指标计算方法、装置、电子设备及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant