CN111431733A - 服务告警覆盖信息的评估方法及装置 - Google Patents

服务告警覆盖信息的评估方法及装置 Download PDF

Info

Publication number
CN111431733A
CN111431733A CN202010105352.9A CN202010105352A CN111431733A CN 111431733 A CN111431733 A CN 111431733A CN 202010105352 A CN202010105352 A CN 202010105352A CN 111431733 A CN111431733 A CN 111431733A
Authority
CN
China
Prior art keywords
alarm
service
evaluated
information
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010105352.9A
Other languages
English (en)
Other versions
CN111431733B (zh
Inventor
周泽强
徐俊劲
刘述超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lazas Network Technology Shanghai Co Ltd
Original Assignee
Lazas Network Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lazas Network Technology Shanghai Co Ltd filed Critical Lazas Network Technology Shanghai Co Ltd
Priority to CN202010105352.9A priority Critical patent/CN111431733B/zh
Publication of CN111431733A publication Critical patent/CN111431733A/zh
Application granted granted Critical
Publication of CN111431733B publication Critical patent/CN111431733B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5003Managing SLA; Interaction between SLA and QoS
    • H04L41/5009Determining service level performance parameters or violations of service level contracts, e.g. violations of agreed response time or mean time between failures [MTBF]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种服务告警覆盖信息的评估方法及装置,涉及一种通信技术领域,主要在于能够及时了解当前服务的告警覆盖情况和告警缺失情况,全面地进行告警补全,提升服务的告警覆盖率,及时发现服务问题,提升问题的处理效率。其中方法包括:获取待评估服务对应的基础数据和已有告警规则;根据所述待评估服务的业务类型,确定所述待评估服务对应的预设告警模板;根据所述基础数据和所述预设告警模板,生成所述待评估服务对应的应有告警信息;将所述已有告警规则和所述应有告警信息进行对比,根据对比结果确定所述待评估服务对应的告警覆盖信息。本发明适用于服务告警覆盖信息的评估。

Description

服务告警覆盖信息的评估方法及装置
技术领域
本发明涉及一种通信技术领域,特别是涉及一种服务告警覆盖信息的评估方法及装置。
背景技术
随着互联网服务业务逻辑与场景的丰富化和日常化,对服务的可用性要求日益增高,这些场景需要用到监控***,通过监控***及时的发现问题并对问题进行修复,能极大的提升问题处理效率。
目前,通常在服务出现问题后,若确定监控***中无相应告警,则针对该问题进行告警补全。然而该方式只能在问题出现后针对单个问题进行告警补全,无法及时了解当前服务的告警配置状态和告警覆盖情况,由此无法全面对监控***进行告警补全,从而导致服务的整体告警覆盖率低下,无法及时发现服务问题和知晓问题点,造成问题处理效率低下。
发明内容
有鉴于此,本发明提供一种服务告警覆盖信息的评估方法及装置,主要目的在于能够及时了解当前服务的告警覆盖情况和告警缺失情况,全面地进行告警补全,提升服务的告警覆盖率,及时发现服务问题,提升问题的处理效率。
依据本发明一个方面,提供了一种服务告警覆盖信息的评估方法,包括:
获取待评估服务对应的基础数据和已有告警规则;
根据所述待评估服务的业务类型,确定所述待评估服务对应的预设告警模板,所述预设告警模板是由与所述待评估服务的业务类型相同和/或相似服务的历史告警缺失信息汇总的;
根据所述基础数据和所述预设告警模板,生成所述待评估服务对应的应有告警信息;
将所述已有告警规则和所述应有告警信息进行对比,根据对比结果确定所述待评估服务对应的告警覆盖信息。
可选地,所述根据所述基础数据和所述预设告警模板,生成所述待评估服务对应的应有告警信息,包括:
将所述基础数据对应添加到所述预设告警模板中,生成所述待评估服务对应的应有监控项数据;
对所述应有监控项数据进行对比格式处理,得到所述待评估服务对应的应有告警信息。
可选地,所述对所述应有监控项数据进行对比格式处理,得到所述待评估服务对应的应有告警信息,包括:
根据所述预设告警模板,确定所述应有监控项数据对应的各个对比字段;
根据所述各个对比字段对所述应有监控项数据进行对比格式处理,得到所述待评估服务对应的应有告警信息。
可选地,所述将所述已有告警规则和所述应有告警信息进行对比,根据对比结果确定所述待评估服务对应的告警覆盖信息,包括:
对所述已有告警规则进行解析和对比格式处理,得到所述待评估服务对应的已有告警信息;
将所述已有告警信息和所述应有告警信息进行对比,根据对比结果确定所述待评估服务对应的告警覆盖信息。
可选地,所述将所述已有告警信息和所述应有告警信息进行对比,根据对比结果确定所述待评估服务对应的告警覆盖信息,包括:
将所述应有告警信息中的各组告警数据分别与所述已有告警信息中的各组告警数据进行匹配;
若所述应有告警信息中的各组告警数据与所述已有告警信息中对应组别的告警数据一致,则确定所述对应组别的告警数据不存在告警缺失;
若所述应有告警信息中的各组告警数据与所述已有告警信息中对应组别的告警数据不一致,则确定所述对应组别的告警数据存在告警缺失;
根据所述应有告警信息中的各组告警数据的匹配结果,确定所述待评估服务对应的告警覆盖信息。
可选地,每隔预设时间间隔获取实时启动的服务,作为所述待评估服务进行服务告警覆盖信息的评估。
可选地,在所述将所述已有告警规则和所述应有告警信息进行对比,根据对比结果确定所述待评估服务对应的告警覆盖信息之后,所述方法还包括:
根据所述告警覆盖信息分别统计不同维度下的告警覆盖率;
将所述告警覆盖率和所述告警覆盖信息中的告警缺失信息发送至待评估服务对应的负责人终端。
依据本发明另一个方面,提供了一种服务告警覆盖信息的评估装置,包括:
获取单元,用于获取待评估服务对应的基础数据和已有告警规则;
确定单元,用于根据所述待评估服务的业务类型,确定所述待评估服务对应的预设告警模板,所述预设告警模板是由与所述待评估服务的业务类型相同和/或相似服务的历史告警缺失信息汇总的;
生成单元,用于根据所述基础数据和所述预设告警模板,生成所述待评估服务对应的应有告警信息;
对比单元,用于将所述已有告警规则和所述应有告警信息进行对比,根据对比结果确定所述待评估服务对应的告警覆盖信息。
可选地,所述生成单元包括:生成模板和处理模块,
所述生成模块,用于将所述基础数据对应添加到所述预设告警模板中,生成所述待评估服务对应的应有监控项数据;
所述处理模块,用于对所述应有监控项数据进行对比格式处理,得到所述待评估服务对应的应有告警信息。
可选地,所述处理模块包括:确定子模块和处理子模块,
所述确定子模块,用于根据所述预设告警模板,确定所述应有监控项数据对应的各个对比字段;
所述处理子模块,用于根据所述各个对比字段对所述应有监控项数据进行对比格式处理,得到所述待评估服务对应的应有告警信息。
可选地,所述对比单元包括:处理模块和对比模块,
所述处理模块,用于对所述已有告警规则进行解析和对比格式处理,得到所述待评估服务对应的已有告警信息;
所述对比模块,用于将所述已有告警信息和所述应有告警信息进行对比,根据对比结果确定所述待评估服务对应的告警覆盖信息。
可选地,所述对比模块包括:匹配子模块和确定子模块,
所述匹配子模块,用于将所述应有告警信息中的各组告警数据分别与所述已有告警信息中的各组告警数据进行匹配;
所述确定子模块,用于若所述应有告警信息中的各组告警数据与所述已有告警信息中对应组别的告警数据一致,则确定所述对应组别的告警数据不存在告警缺失;
所述确定子模块,还用于若所述应有告警信息中的各组告警数据与所述已有告警信息中对应组别的告警数据不一致,则确定所述对应组别的告警数据存在告警缺失;
所述确定子模块,还用于根据所述应有告警信息中的各组告警数据的匹配结果,确定所述待评估服务对应的告警覆盖信息。
可选地,所述获取单元,还用于每隔预设时间间隔获取实时启动的服务,作为所述待评估服务进行服务告警覆盖信息的评估。
可选地,所述装置还包括:统计单元和发送单元,
所述统计单元,用于根据所述告警覆盖信息分别统计不同维度下的告警覆盖率;
所述发送单元,用于将所述告警覆盖率和所述告警覆盖信息中的告警缺失信息发送至待评估服务对应的负责人终端。
根据本发明的又一方面,提供了一种存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述服务告警覆盖信息的评估方法对应的操作。
根据本发明的再一方面,提供了一种终端,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述服务告警覆盖信息的评估方法对应的操作。
借由上述技术方案,本发明提供的技术方案至少具有下列优点:
本发明提供了一种服务告警覆盖信息的评估方法及装置,与目前只有在服务出现问题后,针对该问题进行告警补全的方式相比,本发明通过获取待评估服务对应的基础数据和已有告警规则;并根据所述待评估服务的业务类型,确定所述待评估服务对应的预设告警模板,所述预设告警模板是由与所述待评估服务的业务类型相同和/或相似服务的历史告警缺失信息汇总的;与此同时,根据所述基础数据和所述预设告警模板,生成所述待评估服务对应的应有告警信息;并将所述已有告警规则和所述应有告警信息进行对比,根据对比结果确定所述待评估服务对应的告警覆盖信息,由此能够及时了解当前服务的告警配置状态和告警覆盖情况,从而可以更加全面地对该服务进行告警补全,整体提升服务的告警覆盖率,以便于及时发现服务问题并知晓问题点,提升问题的处理效率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种服务告警覆盖信息的评估方法流程图;
图2示出了本发明实施例提供的另一种服务告警覆盖信息的评估方法流程图;
图3示出了本发明实施例提供的一种服务告警覆盖信息的评估装置组成框图;
图4示出了本发明实施例提供的另一种服务告警覆盖信息的评估装置组成框图;
图5示出了本发明实施例提供的一种终端的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明实施例提供了一种服务告警覆盖信息的评估方法,如图1所示,该方法包括:
101、获取待评估服务对应的基础数据和已有告警规则。
其中,基础数据包括待评估服务在配置管理数据库中的基础数据和监控***中的基础数据,对于本发明实施例,为了对待评估服务的告警覆盖信息进行评估,需要预先获取待评估服务的基础数据,以便根据该基础数据对待评估服务进行告警覆盖信息的评估,具体地,采集待评估服务在配置管理数据库中的基础数据和监控***中的基础数据,其中,配置管理数据库中的基础信息具体包括:待评估服务对应的部门信息,部门下待评估服务的ID信息,待评估服务的负责人信息,以及待评估服务对应的机器,此外,监控***中的基础信息具体包括:待评估服务的监控项信息和已有告警规则,其中,待评估服务的监控项信息具体又包括:***监控项、业务监控项和中间件监控项,由此能够根据上述获取的基础数据和已有告警规则对待评估服务进行告警覆盖信息的评估。
102、根据所述待评估服务的业务类型,确定所述待评估服务对应的预设告警模板。
其中,所述预设告警模板是由与所述待评估服务的业务类型相同和/或相似服务的历史告警缺失信息汇总的,预设告警模板中包括待评估服务的全部监控应有项,对于本发明实施例,为了判断待评估服务的已有告警规则中是否存在告警缺失,需要预先设定告警模板,并将获取的基础信息添加至预设告警模板中,生成应有告警信息,由此通过对比已有告警规则和应有告警信息,能够判定待评估服务是否存在告警缺失,并确定待评估服务的告警覆盖情况,具体地,根据当前常用监控***和各个服务常见监控项,设定通用告警模板,同时根据不同服务的业务类型或者业务场景对通用告警模板进行调整,得到不同业务类型服务的告警模板,进一步地,针对不同业务类型的服务,汇总与其业务类型相同和/或相似服务的历史告警缺失信息,并根据汇总的告警缺失信息对不同业务类型服务的告警模板进行补全,确定不同业务类型服务对应的预设告警模板,由此能够根据待评估服务的业务类型,确定其对应的预设告警模板。
103、根据所述基础数据和所述预设告警模板,生成所述待评估服务对应的应有告警信息。
对于本发明实施例,由于预设告警模板中包括待评估服务的全部监控应有项,将获取的配置管理数据库中的基础数据和监控***中的基础数据对应添加到预设告警模板中应有监控项,得到待评估服务的应有监控项数据,进一步地,根据待评估服务对应的预设告警模板中的应有监控项,确定应有监控项数据对应的对比字段,并根据该对比字段应有监控项数据进行对比格式处理,生成待评估服务对应的应有告警信息,以便将待评估服务的应有告警信息与已有告警规则进行对比,确定待评估服务的告警覆盖信息。
104、将所述已有告警规则和所述应有告警信息进行对比,根据对比结果确定所述待评估服务对应的告警覆盖信息。
其中,告警覆盖信息包括待评估服务的告警覆盖率和告警缺失信息等,对于本发明实施例,将待评估服务的已有告警规则进行解析,得到待评估服务对应的已有监控项数据,并对该已有监控项数据进行对比格式处理,得到待评估服务对应的已有告警信息,其中,已有监控项数据进行对比格式处理的对比字段与应有监控项数据的对比字段相对应,进一步地,将应有告警信息中的各组告警数据与已有告警信息中的各组告警数据进行对比,判断已有告警信息中的各组告警数据是否存在告警缺失,若应有告警信息中的某组告警数据与已有告警信息中对应组别的告警数据完全一致,则确定已有告警信息中对应组别的告警数据不存在告警缺失;若应有告警信息中的某组告警数据与已有告警信息中对应组别的告警数据不一致,则确定已有告警信息中对应组别的告警数据存在告警缺失,由此统计已有告警信息中各组告警数据对应的告警缺失信息,确定待评估服务的整体告警覆盖率,并将该告警缺失信息发送至对应的负责人终端,针对该告警缺失信息进行告警补全,由此能够提升待评估服务的整体告警覆盖率,能够及时发现问题并进行处理。
本发明实施例提供的一种服务告警覆盖信息的评估方法,与目前只有在服务出现问题后,针对该问题进行告警补全的方式相比,本发明实施例通过获取待评估服务对应的基础数据和已有告警规则;并根据所述待评估服务的业务类型,确定所述待评估服务对应的预设告警模板,所述预设告警模板是由与所述待评估服务的业务类型相同和/或相似服务的历史告警缺失信息汇总的;与此同时,根据所述基础数据和所述预设告警模板,生成所述待评估服务对应的应有告警信息;并将所述已有告警规则和所述应有告警信息进行对比,根据对比结果确定所述待评估服务对应的告警覆盖信息,由此能够及时了解当前服务的告警配置状态和告警覆盖情况,从而可以更加全面地对该服务进行告警补全,整体提升服务的告警覆盖率,以便于及时发现服务问题并知晓问题点,提升问题的处理效率。
进一步的,作为上述实施内容的扩展和细化,本发明实施例还提供了另一种服务告警覆盖信息的评估方法,如图2所示,该方法包括:
201、获取待评估服务对应的基础数据和已有告警规则。
对于本发明实施例,获取待评估服务对应的基础数据和已有告警规则的方式与步骤101完全一致,在此不再赘述。
202、根据所述待评估服务的业务类型,确定所述待评估服务对应的预设告警模板。
其中,所述预设告警模板是由与所述待评估服务的业务类型相同和/或相似服务的历史告警缺失信息汇总的,对于本发明实施例,通过当前常用监控项和各个服务常见监控项,设定服务的通用告警模板,同时通过不同服务的业务类型和业务场景对该通用告警模板进行调整,得到不同业务类型服务的告警模板,进一步地,针对不同业务类型的服务,汇总与其业务类型相同和/或相似服务的历史告警缺失信息,并根据汇总的告警缺失信息对不同业务类型服务的告警模板进行补全,得到不同业务类型服务对应的预设告警模板,进一步地,根据待评估服务的业务类型,调取与其对应的预设告警模板,其中,该通用告警模板中包括***监控项、中间件监控项和服务监控项,***监控项具体包括容器和虚拟机,可以通过CPU使用率和内存使用率对容器进行监控,通过CPU使用率、内存使用率、磁盘使用率、网络带宽使用率、网卡丢包率和数据包重传率等对虚拟机进行监控;服务监控项具体包括事件、异常和接口等,可以通过耗时和每秒的事务数对事件进行监控,通过每秒的事务数和自定义项对异常进行监控,通过耗时、每秒的事务数、成功率和自定义项等对接口进行监控;中间件监控项具体包括MySQL数据库、缓存、消息队列和搜索引擎等,可以通过服务状态、每秒的操作次数和/或每秒的事务数、慢日志数量、当前连接数、主从状态、主从延迟和自定义项等对MySQL数据库进行监控,通过服务状态、每秒的操作次数和/或每秒的事务数、连接数、内存使用率、进出总流量和自定义项等对缓存进行监控,通过服务状态、列队数、消费延迟和自定义项对消息队列进行监控,通过服务状态、每秒的操作次数和自定义项等对搜索引擎进行监控。
203、将所述基础数据对应添加到所述预设告警模板中,生成所述待评估服务对应的应有监控项数据。
对于本发明实施例,将获取的配置管理数据库中的基础数据和监控***中的基础数据对应添加到预设告警模板中的应有监控项,得到待评估服务的应有监控项数据,例如,将采集的待评估服务的CPU使用率和内存使用率对应添加到预设告警模板中的容器监控项,需要说明的是,监控***中的基础数据必须包括待评估服务的***监控项数据,待评估服务的业务监控项数据和中间件监控项数据任选其一。
204、对所述应有监控项数据进行对比格式处理,得到所述待评估服务对应的应有告警信息。
对于本发明实施例,为了能够获取待评估服务对应的应有告警信息,以便将已有告警规则和应有告警信息进行对比,步骤204具体包括:根据所述预设告警模板,确定所述应有监控项数据对应的各个对比字段;根据所述各个对比字段对所述应有监控项数据进行对比格式处理,得到所述待评估服务对应的应有告警信息。具体地,根据待评估服务对应的预设告警模板,确定进行对比格式处理的对比字段,该对比字段具体可以包括:部门信息、服务名称、服务负责人、服务的资源信息、监控项大类、监控项子类、监控项详情信息和数据统计类型,其中,部门信息具体为服务所属的部门信息,一个部门可对应多个服务,服务名称在配置管理数据库中保持全局唯一,服务负责人用于接收比对结果的通知,服务的资源信息具体为服务所属的主机信息,用于做底层监控,监控项大类具体包括***监控项、业务监控项和中间件监控项,监控项子类具体包括容器、虚拟机、异常、事件、MySQL数据库和消息队列等,监控项详情信息具体可以为CPU使用率和数据库的连接数等,监控项的数据统计类型具体包括频率、耗时、数量和比例等,进一步地,根据确定的对比字段将应有监控项数据拆分成多组告警数据,即待评估服务对应的应有告警信息,由此能够实现将应有告警信息中的各组告警数据与已有告警规则进行一对一对比,提高对比精度,例如,待评估服务对应的应有告警信息中的某组告警数据,如表1所示:
表1
部门信息 服务名称 负责人 资源信息 监控大类 监控子类 监控详情 数据统计
部门1 服务1 负责人1 IP *** 虚拟机 磁盘使用率 比例
205、对所述已有告警规则进行解析和对比格式处理,得到所述待评估服务对应的已有告警信息。
对于本发明实施例,采集监控***的基础数据中包括待评估服务对应的已有告警规则,为了将待评估服务的已有告警规则与应有告警信息进行对比,需要对已有告警规则进行解析,并对解析之后的已有告警规则进行对比格式处理,具体进行对比格式处理时,根据待评估服务的应有监控项数据对应的各个对比字段,确定已有告警规则对应的各个对比字段,包括:告警规则ID、告警名称、告警大类、告警子类、告警所属服务名称、告警过滤规则、告警触发添加和告警通知人等,其中,告警大类包括***监控项、业务监控项和中间件监控项,告警子类包括容器、虚拟机、异常、事件、MySQL数据库、消息队列等,告警过滤规则制定告警所适用的监控项详情,比如监控项名为cpu使用率、数据库连接数、某个/某些异常,告警触发条件制定规则中的监控项数据的执行条件,由此根据上述各个对比字段,将解析之后的已有告警规则进行对比格式处理,得到待评估服务对应的已有告警信息,该已有告警信息中包括多组告警数据,以便将已有告警信息中的各组告警数据与应有告警信息中的各组告警数据进行对比,其中,待评估服务对应的已有告警信息中的某组告警数据,如表2所示:
表2
Figure BDA0002388355550000111
206、将所述已有告警信息和所述应有告警信息进行对比,根据对比结果确定所述待评估服务对应的告警覆盖信息。
对于本发明实施例,为了判断待评估服务对应的已有告警信息中是否存在告警缺失,将待评估服务对应的已有告警信息与应有告警信息进行对比,步骤206具体包括:将所述应有告警信息中的各组告警数据分别与所述已有告警信息中的各组告警数据进行匹配;若所述应有告警信息中的各组告警数据与所述已有告警信息中对应组别的告警数据一致,则确定所述对应组别的告警数据不存在告警缺失;若所述应有告警信息中的各组告警数据与所述已有告警信息中对应组别的告警数据不一致,则确定所述对应组别的告警数据存在告警缺失;根据所述应有告警信息中的各组告警数据的匹配结果,确定所述待评估服务对应的告警覆盖信息。具体地,将应有告警信息中的各组告警数据与已有告警信息中的各组告警数据进行一一对比,例如,将应有告警信息中的某组告警数据与已有告警信息中对应组别的告警数据进行对比,具体可在表1中增加对比结果字段和告警规则ID字段,以便记录各组告警数据的对比结果,如果两者完全一致,则确定已有告警信息中该组别的告警数据不存在缺失,并记录下该组别告警数据对应的告警规则ID;如果两者不一致,则确定已有告警信息中该组别的告警数据存在缺失,该组别告警数据对应的告警规则ID为空,具体对比结果如表3所示:
表3
Figure BDA0002388355550000121
由此能够确定已有告警信息中各组告警数据的对比结果,为了根据该对比结果,统计不同部门、服务维度下的告警覆盖率,在所述将所述已有告警规则和所述应有告警信息进行对比,根据对比结果确定所述待评估服务对应的告警覆盖信息之后,所述方法还包括:根据所述告警覆盖信息分别统计不同维度下的告警覆盖率;将所述告警覆盖率和所述告警覆盖信息中的告警缺失信息发送至待评估服务对应的负责人终端。具体推送时可采用邮件或者短信的方式将对比结果推送至相关负责人终端,同时将明细数据使用平台进行展示,以便于负责人及时查看告警缺失信息,进行告警补全。进一步地,每隔预设时间间隔获取实时启动的服务,作为所述待评估服务进行服务告警覆盖信息的评估,由此通过定时任务或者其他方式以固定频率执行服务告警覆盖信息的评估脚本并输出结果,可及时了解相应服务和部门的告警覆盖率和告警缺失信息,以便及时对服务的告警缺失项进行补全,同时还可以通过服务名称查询该服务的历史告警覆盖率,可了解该服务的告警缺失情况和补全情况。
本发明实施例提供的另一种服务告警覆盖信息的评估方法,与目前只有在服务出现问题后,针对该问题进行告警补全的方式相比,本发明实施例通过获取待评估服务对应的基础数据和已有告警规则;并根据所述待评估服务的业务类型,确定所述待评估服务对应的预设告警模板,所述预设告警模板是由与所述待评估服务的业务类型相同和/或相似服务的历史告警缺失信息汇总的;与此同时,根据所述基础数据和所述预设告警模板,生成所述待评估服务对应的应有告警信息;并将所述已有告警规则和所述应有告警信息进行对比,根据对比结果确定所述待评估服务对应的告警覆盖信息,由此能够及时了解当前服务的告警配置状态和告警覆盖情况,从而可以更加全面地对该服务进行告警补全,整体提升服务的告警覆盖率,以便于及时发现服务问题并知晓问题点,提升问题的处理效率。
进一步的,作为对上述图1所示方法的实现,本发明实施例提供了一种服务告警覆盖信息的评估装置,如图3所示,该装置包括:获取单元31、确定单元32、生成单元33和对比单元34。
获取单元31,可以用于获取待评估服务对应的基础数据和已有告警规则。所述获取单元31是本装置中获取待评估服务对应的基础数据和已有告警规则的主要功能模块。
确定单元32,可以用于根据所述待评估服务的业务类型,确定所述待评估服务对应的预设告警模板,所述预设告警模板是由与所述待评估服务的业务类型相同和/或相似服务的历史告警缺失信息汇总的。所述确定单元32是本装置中根据所述待评估服务的业务类型,确定所述待评估服务对应的预设告警模板的主要功能模块。
生成单元33,可以用于根据所述基础数据和所述预设告警模板,生成所述待评估服务对应的应有告警信息。所述生成单元33是本装置中根据所述基础数据和所述预设告警模板,生成所述待评估服务对应的应有告警信息的主要功能模块,也是核心模块。
对比单元34,可以用于将所述已有告警规则和所述应有告警信息进行对比,根据对比结果确定所述待评估服务对应的告警覆盖信息。所述对比单元34是本装置中将所述已有告警规则和所述应有告警信息进行对比,根据对比结果确定所述待评估服务对应的告警覆盖信息的主要功能模块,也是核心模块。
进一步的,作为对上述图2所示方法的实现,本发明实施例提供了另一种服务告警覆盖信息的评估装置,如图4所示,所述生成单元33包括:生成模板331和处理模块332。
所述生成模块331,可以用于将所述基础数据对应添加到所述预设告警模板中,生成所述待评估服务对应的应有监控项数据。
所述处理模块332,可以用于对所述应有监控项数据进行对比格式处理,得到所述待评估服务对应的应有告警信息。
对于本发明实施例,为了确定待评估服务对应的应有告警信息,所述处理模块332包括:确定子模块和处理子模块。
所述确定子模块,可以用于根据所述预设告警模板,确定所述应有监控项数据对应的各个对比字段。
所述处理子模块,可以用于根据所述各个对比字段对所述应有监控项数据进行对比格式处理,得到所述待评估服务对应的应有告警信息。
进一步地,为了对待评估服务的告警覆盖信息进行评估,所述对比单元34包括:处理模块341和对比模块342。
所述处理模块341,可以用于对所述已有告警规则进行解析和对比格式处理,得到所述待评估服务对应的已有告警信息。
所述对比模块342,可以用于将所述已有告警信息和所述应有告警信息进行对比,根据对比结果确定所述待评估服务对应的告警覆盖信息。
进一步地,为了将应有告警信息和已有告警信息进行对比,所述对比模块342包括:匹配子模块和确定子模块。
所述匹配子模块,可以用于将所述应有告警信息中的各组告警数据分别与所述已有告警信息中的各组告警数据进行匹配。
所述确定子模块,可以用于若所述应有告警信息中的各组告警数据与所述已有告警信息中对应组别的告警数据一致,则确定所述对应组别的告警数据不存在告警缺失。
所述确定子模块,还可以用于若所述应有告警信息中的各组告警数据与所述已有告警信息中对应组别的告警数据不一致,则确定所述对应组别的告警数据存在告警缺失;
所述确定子模块,还可以用于根据所述应有告警信息中的各组告警数据的匹配结果,确定所述待评估服务对应的告警覆盖信息。
与此同时,为了每隔预设时间对待评估服务的告警覆盖信息进行评估,所述获取单元31,还可以用于每隔预设时间间隔获取实时启动的服务,作为所述待评估服务进行服务告警覆盖信息的评估。
进一步地,为了对待评估服务的告警缺失信息进行统计,并将统计结果发送至对应的负责人,所述装置还包括:统计单元35和发送单元36。
所述统计单元35,可以用于根据所述告警覆盖信息分别统计不同维度下的告警覆盖率。
所述发送单元36,可以用于将所述告警覆盖率和所述告警覆盖信息中的告警缺失信息发送至待评估服务对应的负责人终端。
根据本发明一个实施例提供了一种存储介质,所述存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的数据查询方法。
图5示出了根据本发明一个实施例提供的一种终端的结构示意图,本发明具体实施例并不对终端的具体实现做限定。
如图5所示,该终端可以包括:处理器(processor)502、通信接口(CommunicationsInterface)504、存储器(memory)506、以及通信总线508。
其中:处理器502、通信接口504、以及存储器506通过通信总线508完成相互间的通信。
通信接口504,用于与其它设备比如客户端或其它服务器等的网元通信。
处理器502,用于执行程序510,具体可以执行上述服务告警覆盖信息的评估方法实施例中的相关步骤。
具体地,程序510可以包括程序代码,该程序代码包括计算机操作指令。
处理器502可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。终端包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器506,用于存放程序510。存储器506可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序510具体可以用于使得处理器502执行以下操作:获取待评估服务对应的基础数据和已有告警规则;根据所述待评估服务的业务类型,确定所述待评估服务对应的预设告警模板,所述预设告警模板是由与所述待评估服务的业务类型相同和/或相似服务的历史告警缺失信息汇总的;根据所述基础数据和所述预设告警模板,生成所述待评估服务对应的应有告警信息;将所述已有告警规则和所述应有告警信息进行对比,根据对比结果确定所述待评估服务对应的告警覆盖信息。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

Claims (10)

1.一种服务告警覆盖信息的评估方法,其特征在于,包括:
获取待评估服务对应的基础数据和已有告警规则;
根据所述待评估服务的业务类型,确定所述待评估服务对应的预设告警模板,所述预设告警模板是由与所述待评估服务的业务类型相同和/或相似服务的历史告警缺失信息汇总的;
根据所述基础数据和所述预设告警模板,生成所述待评估服务对应的应有告警信息;
将所述已有告警规则和所述应有告警信息进行对比,根据对比结果确定所述待评估服务对应的告警覆盖信息。
2.根据权利要求1所述的方法,其特征在于,所述根据所述基础数据和所述预设告警模板,生成所述待评估服务对应的应有告警信息,包括:
将所述基础数据对应添加到所述预设告警模板中,生成所述待评估服务对应的应有监控项数据;
对所述应有监控项数据进行对比格式处理,得到所述待评估服务对应的应有告警信息。
3.根据权利要求2所述的方法,其特征在于,所述对所述应有监控项数据进行对比格式处理,得到所述待评估服务对应的应有告警信息,包括:
根据所述预设告警模板,确定所述应有监控项数据对应的各个对比字段;
根据所述各个对比字段对所述应有监控项数据进行对比格式处理,得到所述待评估服务对应的应有告警信息。
4.根据权利要求1所述的方法,其特征在于,所述将所述已有告警规则和所述应有告警信息进行对比,根据对比结果确定所述待评估服务对应的告警覆盖信息,包括:
对所述已有告警规则进行解析和对比格式处理,得到所述待评估服务对应的已有告警信息;
将所述已有告警信息和所述应有告警信息进行对比,根据对比结果确定所述待评估服务对应的告警覆盖信息。
5.根据权利要求4所述的方法,其特征在于,所述将所述已有告警信息和所述应有告警信息进行对比,根据对比结果确定所述待评估服务对应的告警覆盖信息,包括:
将所述应有告警信息中的各组告警数据分别与所述已有告警信息中的各组告警数据进行匹配;
若所述应有告警信息中的各组告警数据与所述已有告警信息中对应组别的告警数据一致,则确定所述对应组别的告警数据不存在告警缺失;
若所述应有告警信息中的各组告警数据与所述已有告警信息中对应组别的告警数据不一致,则确定所述对应组别的告警数据存在告警缺失;
根据所述应有告警信息中的各组告警数据的匹配结果,确定所述待评估服务对应的告警覆盖信息。
6.根据权利要求1-5任一项所述的方法,其特征在于,每隔预设时间间隔获取实时启动的服务,作为所述待评估服务进行服务告警覆盖信息的评估。
7.根据权利要求1-5任一项所述的方法,其特征在于,在所述将所述已有告警规则和所述应有告警信息进行对比,根据对比结果确定所述待评估服务对应的告警覆盖信息之后,所述方法还包括:
根据所述告警覆盖信息分别统计不同维度下的告警覆盖率;
将所述告警覆盖率和所述告警覆盖信息中的告警缺失信息发送至待评估服务对应的负责人终端。
8.一种服务告警覆盖信息的评估装置,其特征在于,包括:
获取单元,用于获取待评估服务对应的基础数据和已有告警规则;
确定单元,用于根据所述待评估服务的业务类型,确定所述待评估服务对应的预设告警模板,所述预设告警模板是由与所述待评估服务的业务类型相同和/或相似服务的历史告警缺失信息汇总的;
生成单元,用于根据所述基础数据和所述预设告警模板,生成所述待评估服务对应的应有告警信息;
对比单元,用于将所述已有告警规则和所述应有告警信息进行对比,根据对比结果确定所述待评估服务对应的告警覆盖信息。
9.根据权利要求8所述的装置,其特征在于,所述生成单元包括:生成模板和处理模块,
所述生成模块,用于将所述基础数据对应添加到所述预设告警模板中,生成所述待评估服务对应的应有监控项数据;
所述处理模块,用于对所述应有监控项数据进行对比格式处理,得到所述待评估服务对应的应有告警信息。
10.根据权利要求9所述的装置,其特征在于,所述处理模块包括:确定子模块和处理子模块,
所述确定子模块,用于根据所述预设告警模板,确定所述应有监控项数据对应的各个对比字段;
所述处理子模块,用于根据所述各个对比字段对所述应有监控项数据进行对比格式处理,得到所述待评估服务对应的应有告警信息。
CN202010105352.9A 2020-02-20 2020-02-20 服务告警覆盖信息的评估方法及装置 Active CN111431733B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010105352.9A CN111431733B (zh) 2020-02-20 2020-02-20 服务告警覆盖信息的评估方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010105352.9A CN111431733B (zh) 2020-02-20 2020-02-20 服务告警覆盖信息的评估方法及装置

Publications (2)

Publication Number Publication Date
CN111431733A true CN111431733A (zh) 2020-07-17
CN111431733B CN111431733B (zh) 2021-06-22

Family

ID=71547055

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010105352.9A Active CN111431733B (zh) 2020-02-20 2020-02-20 服务告警覆盖信息的评估方法及装置

Country Status (1)

Country Link
CN (1) CN111431733B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112312209A (zh) * 2020-10-30 2021-02-02 中移(杭州)信息技术有限公司 综合告警生成方法、装置、服务器、存储介质
CN113065139A (zh) * 2021-05-06 2021-07-02 携程旅游网络技术(上海)有限公司 告警接入方法及***、电子设备及介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105376100A (zh) * 2015-12-09 2016-03-02 国云科技股份有限公司 一种适用于云平台资源监控的分布式告警规则评估方法
WO2017005117A1 (zh) * 2015-07-09 2017-01-12 阿里巴巴集团控股有限公司 一种基于云平台的故障处理方法和装置
CN106817233A (zh) * 2015-11-30 2017-06-09 中兴通讯股份有限公司 一种云计算管理平台告警方法及计量监控平台
CN108769179A (zh) * 2018-05-23 2018-11-06 北京顺丰同城科技有限公司 一种服务健康状态评估方法及装置
CN109218102A (zh) * 2018-09-26 2019-01-15 江苏满运软件科技有限公司 一种告警监控方法及***
CN110191094A (zh) * 2019-04-26 2019-08-30 北京奇安信科技有限公司 异常数据的监控方法及装置、存储介质、终端
CN110310009A (zh) * 2019-05-29 2019-10-08 国网安徽省电力有限公司合肥供电公司 一种电网调度运行风险告警与全景评估方法
CN110659174A (zh) * 2018-06-28 2020-01-07 阿里巴巴集团控股有限公司 监控告警方法、装置和***

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017005117A1 (zh) * 2015-07-09 2017-01-12 阿里巴巴集团控股有限公司 一种基于云平台的故障处理方法和装置
CN106817233A (zh) * 2015-11-30 2017-06-09 中兴通讯股份有限公司 一种云计算管理平台告警方法及计量监控平台
CN105376100A (zh) * 2015-12-09 2016-03-02 国云科技股份有限公司 一种适用于云平台资源监控的分布式告警规则评估方法
CN108769179A (zh) * 2018-05-23 2018-11-06 北京顺丰同城科技有限公司 一种服务健康状态评估方法及装置
CN110659174A (zh) * 2018-06-28 2020-01-07 阿里巴巴集团控股有限公司 监控告警方法、装置和***
CN109218102A (zh) * 2018-09-26 2019-01-15 江苏满运软件科技有限公司 一种告警监控方法及***
CN110191094A (zh) * 2019-04-26 2019-08-30 北京奇安信科技有限公司 异常数据的监控方法及装置、存储介质、终端
CN110310009A (zh) * 2019-05-29 2019-10-08 国网安徽省电力有限公司合肥供电公司 一种电网调度运行风险告警与全景评估方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112312209A (zh) * 2020-10-30 2021-02-02 中移(杭州)信息技术有限公司 综合告警生成方法、装置、服务器、存储介质
CN112312209B (zh) * 2020-10-30 2023-07-21 中移(杭州)信息技术有限公司 综合告警生成方法、装置、服务器、存储介质
CN113065139A (zh) * 2021-05-06 2021-07-02 携程旅游网络技术(上海)有限公司 告警接入方法及***、电子设备及介质

Also Published As

Publication number Publication date
CN111431733B (zh) 2021-06-22

Similar Documents

Publication Publication Date Title
CN107992398B (zh) 一种业务***的监控方法和监控***
CN110086666B (zh) 一种告警方法、装置及***
CN107688496B (zh) 任务分布式处理方法、装置、存储介质和服务器
CN110362473B (zh) 测试环境的优化方法及装置、存储介质、终端
CN112311617A (zh) 一种配置化数据监控告警方法及***
CN110362455B (zh) 一种数据处理方法和数据处理装置
CN114185708A (zh) 基于分布式链路追踪的数据分析方法、装置和电子设备
CN111274052A (zh) 数据分发方法、服务器及计算机可读存储介质
WO2019223062A1 (zh) ***异常的处理方法和***
CN108280022A (zh) 性能监测方法及装置
CN109740129B (zh) 基于区块链的报表生成方法、装置、设备及可读存储介质
CN112286806A (zh) 自动化测试方法、装置、存储介质及电子设备
CN111431733B (zh) 服务告警覆盖信息的评估方法及装置
CN112232881A (zh) 一种数据检测方法、装置、电子设备及存储介质
CN111651595A (zh) 一种异常日志处理方法及装置
CN111240876A (zh) 微服务的故障定位方法、装置、存储介质及终端
CN110888985A (zh) 一种报警信息处理方法、装置、电子设备及存储介质
CN113434396A (zh) 接口测试方法、装置、设备、存储介质及程序产品
CN111338888B (zh) 一种数据统计方法、装置、电子设备及存储介质
US8073938B2 (en) Information processing apparatus and method of operating the same
CN107885634B (zh) 监控中异常信息的处理方法和装置
WO2021056739A1 (zh) 性能分析方法、装置、计算机设备及存储介质
CN112948224A (zh) 一种数据处理方法、装置、终端及存储介质
CN109409948B (zh) 交易异常检测方法、装置、设备及计算机可读存储介质
CN113076112A (zh) 数据库部署的方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant