CN112751711A - 告警信息处理方法和装置、存储介质和电子设备 - Google Patents

告警信息处理方法和装置、存储介质和电子设备 Download PDF

Info

Publication number
CN112751711A
CN112751711A CN202011612444.2A CN202011612444A CN112751711A CN 112751711 A CN112751711 A CN 112751711A CN 202011612444 A CN202011612444 A CN 202011612444A CN 112751711 A CN112751711 A CN 112751711A
Authority
CN
China
Prior art keywords
information
alarm
dimension
correlation
dimension information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011612444.2A
Other languages
English (en)
Other versions
CN112751711B (zh
Inventor
潘陈益
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN202011612444.2A priority Critical patent/CN112751711B/zh
Publication of CN112751711A publication Critical patent/CN112751711A/zh
Application granted granted Critical
Publication of CN112751711B publication Critical patent/CN112751711B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Alarm Systems (AREA)

Abstract

本申请提供了一种告警信息处理方法和装置、存储介质和电子设备,其中,该方法包括:获取告警信息中的告警维度信息,告警信息基于监控指标异常产生;根据预设关联关系确定与告警信息关联的关联指标,关联指标包括至少一个关联维度信息;将关联维度信息依次与告警维度信息进行相关性分析,得到相关维度信息;整合告警信息和相关维度信息得到告警投递信息。在当前告警信息的基础上,将与告警信息关联的其他关联指标与当前告警信息进行多指标多维度相关性分析,可以挖掘到告警风暴中更多潜在的更为全面的异常信息以及故障可能的根本问题,最大可能让用户直观地获知播放***告警风暴中包含的更多播放链路上深层次信息,在一定程度提高了告警的价值。

Description

告警信息处理方法和装置、存储介质和电子设备
技术领域
本申请涉及多媒体技术领域,尤其涉及一种告警信息处理方法和装置、存储介质和电子设备。
背景技术
现有监控***下,各告警投递间往往互相独立,即不管是同一监控指标还是不同监控指标在发生异常时都独立投递告警。例如,在播放链路中,一个故障的发生,往往会有多个监控指标同时受影响,如一个视频出现播放问题时,可能会影响到故障指标,影响起播用户数,影响在线用户数等等。因此,在播放***中,一个真实故障会伴随大批量监控指标的异常,并针对单个异常指标分别同时投递告警信息,从用户角度感知,会同一时间收到大量针对单个异常指标的告警信息,形成告警风暴。告警量的快速积压,以及告警风暴的各个告警只针对单个异常指标,会导致用户收到的告警信息多且杂乱。现有的告警的汇聚策略又大多只针对时间维度,将告警做简单的拼接,虽然可以减少用户接收到的告警信息量,但是告警信息依然杂乱,使用户无法及时快速获知故障根本原因,进而导致告警的有效性差。
因此,相关技术中存在导致告警的有效性差的问题。
发明内容
本申请提供了一种告警信息处理方法和装置、存储介质和电子设备,以至少解决相关技术中存在告警的有效性差的问题。
根据本申请实施例的一个方面,提供了一种告警信息处理方法,包括:获取告警信息中的告警维度信息,告警信息基于监控指标异常产生;根据预设关联关系确定与告警信息关联的关联指标,关联指标包括至少一个关联维度信息,所述预设关联关系至少包括功能相关联的指标之间的关系;将关联维度信息依次与告警维度信息进行相关性分析,得到告警信息的相关维度信息;整合告警信息和相关维度信息得到告警投递信息。
可选地,将关联维度信息依次与告警维度信息进行相关性分析,得到告警维度信息的相关维度信息包括:
利用相关性算法依次将至少一个所述关联维度信息与所述告警维度信息进行相关性分析,得到每一相关维度信息对应的分析结果,其中,每一关联维度信息包括至少一个关联维度特征,所述告警维度信息包括至少一个告警维度特征,所述分析结果包括当前关联维度信息中关联维度特征与所述告警维度信息中的告警维度特征的相关度;保留每一关联维度信息对应的分析结果中的所述关联维度特征与告警维度特征的相关度大于预设相关度的关联维度特征作为所述相关维度信息。
可选地,利用相关性算法依次将至少一个所述关联维度信息与所述告警维度信息进行相关性分析,得到每一相关维度信息对应的分析结果包括:获取每一关联维度信息的维度粒度值,其中,维度粒度值与关联维度特征的特征数量呈正相关;按照维度粒度值递增的顺序依次将关联维度信息与告警维度信息的维度特征进行相关性分析。
可选地,按照维度粒度值递增的顺序依次将关联维度信息与告警维度信息的维度特征进行相关性分析包括:分别汇总告警维度信息中的告警维度特征随时间变化的状态信息得到告警时间序列,告警时间序列与告警维度特征一一对应;分别汇总每一关联维度信息中的关联维度特征随时间变化的状态信息得到待分析时间序列,待分析时间序列与关联维度特征一一对应;按照维度值递增的顺序依次将每一关联维度信息对应的待分析时间序列与告警时间序列进行相关性分析,直至遍历所有的关联维度信息。
可选地,获取告警信息中的告警维度信息包括:获取告警信息,告警信息基于检测到播放链路中的监控指标发生异常时产生;基于预设规则对告警信息进行汇聚,得到告警信息集;基于所述监控指标的被监控维度查找所述告警信息集中的告警信息产生异常的维度信息,得到告警维度信息。
可选地,基于预设规则对告警信息进行汇聚,得到告警信息集包括:根据发生异常的监控指标对告警信息进行分类;按照时序分别对不同类的告警信息进行汇聚得到告警信息集。
可选地,整合告警信息和相关维度信息得到告警投递信息包括:基于相关维度信息和告警维度信息确定待投递监控指标信息,待投递监控指标信息包括相关维度信息对应的监控指标信息和告警维度信息对应的监控指标信息;将待投递监控指标信息、告警信息、相关维度信息和告警维度信息进行整合得到告警投递信息。
根据本申请实施例的另一个方面,还提供了一种告警信息处理装置,包括:获取模块,用于告警信息中的告警维度信息,告警信息基于监控指标异常产生;确定模块,用于根据预设关联关系确定与告警信息关联的关联指标,关联指标包括至少一个关联维度信息;分析模块,用于将关联维度信息依次与告警维度信息进行相关性分析,得到告警信息的相关维度信息;整合模块,用于整合告警信息和相关维度信息得到投递告警信息。
根据本申请实施例的又一个方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器、通信接口和存储器通过通信总线完成相互间的通信;其中,存储器,用于存储计算机程序;处理器,用于通过运行存储器上所存储的计算机程序来执行上述任一实施例中的方法步骤。
根据本申请实施例的又一个方面,还提供了一种计算机可读的存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一实施例中的方法步骤。
在本申请实施例中,在检测到监控指标异常时,得到异常监控指标的告警信息,根据预先配置的预设关联关系,得到与当前告警信息关联的关联指标以及关联指标中的关联维度信息,将当前告警信息中的告警维度信息与关联指标中的关联维度信息进行相关性分析,确定与当前告警信息相关的维度信息,挖掘与当前告警信息相关的更多潜在信息,最终将当前告警信息与相关维度信息进行整合,得到最终需要投递的告警投递信息,解决了相关技术中存在告警的汇聚策略又大多只针对时间维度,将告警做简单的拼接,难以快速获知故障根本原因和影响范围,进而导致告警的有效性差的问题,在得到告警信息之后,在当前告警信息的基础上,将与告警信息关联的其他关联指标与当前告警信息进行多指标多维度相关性分析,可以挖掘到告警风暴中更多潜在的更为全面的异常信息,挖掘故障可能的根本问题,最大可能让用户直观地获知播放***告警风暴中包含的更多播放链路上深层次信息以及故障的根本原因,在一定程度提高了告警的价值。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的一种可选的告警信息处理方法的硬件环境的示意图;
图2是根据本申请实施例的一种可选的告警信息处理方法的流程示意图;
图3是根据本申请实施例的另一种可选的告警信息处理方法的示意图;
图4是根据本申请实施例的另一种可选的告警信息处理框架示意图;
图5是根据本申请实施例的一种可选的告警信息处理装置的结构框图;
图6是根据本申请实施例的一种可选的电子设备的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请实施例的一个方面,提供了一种告警信息处理方法。可选地,在本实施例中,上述告警信息处理方法可以应用于如图1所示的硬件环境中。如图1所示,
根据本申请实施例的一个方面,提供了一种告警信息处理方法。可选地,在本实施例中,上述告警信息处理方法可以应用于如图1所示的由终端102和服务器104所构成的硬件环境中。如图1所示,服务器104通过网络与终端102进行连接,可用于为终端或终端上安装的客户端提供服务,可在服务器上或独立于服务器设置数据库,用于为服务器104提供数据存储服务,还可以用于处理云服务,上述网络包括但不限于:广域网、城域网或局域网,终端102并不限定于PC、手机、平板电脑等。本申请实施例的告警信息处理方法可以由服务器104来执行,也可以由终端102来执行,还可以是由服务器104和终端102共同执行。其中,终端102执行本申请实施例的告警信息处理方法也可以是由安装在其上的客户端来执行。
以由终端102或服务器104来执行本实施例中的告警信息处理方法为例,图2是根据本申请实施例的一种可选的告警信息处理方法的流程示意图,如图2所示,该方法的流程可以包括以下步骤:
步骤S202,获取告警信息中的告警维度信息,告警信息基于监控指标异常产生。
步骤S204,根据预设关联关系确定与告警信息相关的关联指标,关联指标包括至少一个关联维度信息。
步骤S206,将关联维度信息依次与告警维度信息进行相关性分析,得到告警信息的相关维度信息。
步骤S208,整合告警信息和相关维度信息得到告警投递信息。
通过上述步骤S202至步骤S208,在检测到监控指标异常时,得到异常监控指标的告警信息,根据预先配置的预设关联关系,得到与当前告警信息关联的关联指标以及关联指标中的关联维度信息,将当前告警信息中的告警维度信息与关联指标中的关联维度信息进行相关性分析,确定与当前告警信息相关的维度信息,挖掘与当前告警信息相关的更多潜在信息,最终将当前告警信息与相关维度信息进行整合,得到最终需要投递的告警投递信息,解决了相关技术中存在告警的汇聚策略又大多只针对时间维度,将告警做简单的拼接,难以快速获知故障根本原因和影响范围,进而导致告警的有效性差的问题,在得到告警信息之后,在当前告警信息的基础上,将与告警信息关联的其他关联指标与当前告警信息进行多指标多维度相关性分析,可以挖掘到告警风暴中更多潜在的更为全面的异常信息,挖掘故障可能的根本问题,最大可能让用户直观地获知播放***告警风暴中包含的更多播放链路上深层次信息以及故障的根本原因,在一定程度提高了告警的价值。
在步骤S202的技术方案中,所称的告警信息可以为对播放***进行监控的监控指标异常时产生的告警信息,其中,播放***可以为视频播放链路、音频播放链路等,监控指标可以为卡顿指标,播放错误等。其中,告警信息中可以从至少一个维度进行告警,例如,在发生卡顿时,告警信息中可以从是否在线,视频类型,播放平台类型等这些维度进行记录,其中,每一告警维度信息中包括至少一个告警维度特征,例如,告警维度信息为“是否在线”,其告警维度特征可以为“在线”和“离线”;告警维度信息为“视频类型”,其告警维度特征可以为“VIP视频”和“非VIP视频”,告警维度信息为“播放平台类型”,其告警维度特征可以为“iPhone移动终端”、“android移动终端”、“WindowsPC端”以及“mac端”。其中,告警维度信息还可以包括每个告警维度的粒度值,其中,该告警维度粒度值与该维度中的告警维度特征数量成正比或相同,例如,告警维度信息为“播放平台类型”,其告警维度特征为“iPhone移动终端”、“android移动终端”、“WindowsPC端”以及“mac端”,其维度粒度值可以为4。
在步骤S204的技术方案中,根据预设关联关系确定告警信息的关联维度信息,作为示例性的实施例,预设关联关系可以为预先配置具有功能相关联的指标之间的关系,,例如,出现卡顿之后,可以基于预先配置预设关联关系,可能需要查看卡顿比,查看卡顿次数、卡顿时长等功能相关的关联指标中维度的异常。在播放错误可能需要查看终端、终端***、服务器、数据库等关联指标中各维度的异常。在本实施例中,当获取到告警信息之后,可以基于告警信息和预设关联关系,确定与当前告警信息具有预设关联关系的关联指标和/或关联维度信息。
在步骤S206的技术方案中,将关联维度信息依次与告警维度信息进行相关性分析,得到告警信息的相关维度信息。示例性的,在基于预设关联关系得到与当前告警信息相关联的其他的关联维度信息之后,将关联维度信息与当前告警维度信息进行相关性分析,示例性的,相关性分析可以采用相关系数算法,例如,余弦相关性算法,皮尔森相关系数,还可以采用其他常见距离相关性分析方法,例如,欧几里得距离,马哈拉诺比斯距离,曼哈顿距离等相关性分析方法,将进行相关性分析的结果,相关性分析结果可以包括相关性值或相关性系数,量化评估关联维度信息与告警信息关联紧密程度,以使用户更为直接明确当前告警的故障的影响的范围以及更深层次信息和故障的根本原因。作为可选的实施例,在进行相关性分析之后,还可以保留相关性分析结果中相关度较高的关联维度信息作为告警信息的相关维度信息。示例性的,与卡顿指标的告警信息关联的指标例如卡顿比指标中的播放平台类型,包括平台***,平台配置;视频类型,包括离线视频、在线视频;视频质量,包括高清视频、蓝光视频等维度。可以将关联维度信息与当前告警信息中的告警维度信息进行相关性分析,例如,可以将卡顿比中的平台类型与当前告警信息(卡顿)中告警维度信息中的平台类型,进行相关性分析,将卡顿比中的视频类型和/或视频质量与当前告警信息(卡顿)中告警维度信息中的视频类型进行相关性分析。具体的,可以将所有相关维度信息依次与告警维度进行相关性分析,得到每一维度的相关度,可以保留关联维度信息中相关度大于预设相关度的关联维度信息作为与告警信息相关的相关维度信息。作为可选地实施例,以皮尔森相关系数为例计算告警维度信息与关联维度信息的相关度进行说明,具体的可以采用如下公式进行计算:
Figure BDA0002873269160000091
其中,X为告警维度信息,Y为关联维度信息,ρX,Y为相关度,其中,ρX,Y的取值范围(-1,1),取值为0为不相关,取值越接近1正相关度越大,取值越接近-1负相关度越大。
作为另一种可选地实施方式,还可以采用距离相关性分析方法得到告警维度信息和关联维度信息的相关度,具体的可以采用如下公式进行计算:
Figure BDA0002873269160000092
其中,ρX,Y为相关度,Xi为告警维度信息,Yi为关联维度信息。
关于步骤S208,整合告警信息和相关维度信息进行投递,示例性的,当前收到的告警信息可以为一条也可以为多条,其中对每一条告警信息的关联维度信息与当前告警信息中的告警维度信息进行相关性分析得到与告警信息相关的相关维度信息之后,在进行投递时,可以投递一条告警投递信息,该告警投递信息可以包括一共有几条告警,分别涉及哪些告警维度,同时,与前述几条告警信息相关的其他维度也存在异常,其他相关维度所属的指标也存在异常等等。这样检测到告警信息的基础上,可以针对多个关联指标的多维度进行相关性分析,不仅可以提高关联分析效率,也可以挖掘到告警风暴中更多潜在信息,提高告警有效性,深度挖掘了告警信息之间可能存在的关联,在一定程度提高了告警的价值。
作为示例性的实施例,在对关联维度信息依次与告警维度信息进行相关性分析时,可以利用相关性算法依次将至少一个所述关联维度信息与所述告警维度信息进行相关性分析,得到每一相关维度信息对应的分析结果,示例性的,可以采用下钻分析的方式进行,具体的,可以将关联维度信息基于维度属性进行层次排布,沿层次排布分别利用相关性算法依次分析每个层次中的关联维度信息与告警维度信息相关度,最终得到每个关联维度信息与告警维度信息均的相关度。具体的,每一关联维度信息包括至少一个关联维度特征,所述告警维度信息包括至少一个告警维度特征,所述分析结果包括当前关联维度信息中关联维度特征与所述告警维度信息中的告警维度特征的相关度;保留每一关联维度信息对应的分析结果中的所述关联维度特征与告警维度特征的相关度大于预设相关度的关联维度特征作为所述相关维度信息。
其中,维度属性可以包括关联维度信息的粒度值,即关联维度信息中关联维度特征的数量,还可以包括关联维度信息之间的关系,例如,父子关系、优先级关系等。
作为可选地实施例,每一关联维度信息均包括维度特征以及维度粒度值,其中维度特征为各个维度的特征,维度粒度值可以为某一相关维度中的维度特征的数量,例如,关联维度为平台类型,其维度特征可以为“iPhone移动终端”、“android移动终端”、“WindowsPC端”以及“mac端”,由于维度特征为4个,其维度粒度值为4。在本实施例中,对于关联指标中的关联维度的下钻分析可以按照维度粒度值递增的顺序进行相关性分析,即按照维度粒度由粗到细进行相关性分析。具体的,获取每一关联维度信息中的关联维度特征的维度粒度值,其中,维度粒度值与关联维度特征的特征数量呈正相关;按照维度粒度值递增的顺序依次将关联维度信息与告警维度信息进行相关性分析。具体的,可以选取特征粒度值最小的关联维度信息,在进行下钻分析时先选取特征粒度最粗的维度进行分析,在对最粗的维度进行分析完成之后,保留相关度大于预设相关度的关联维度特征通过合并等方式作为相关维度信息,之后,再选取特征粒度次一级的维度进行分析,直至完成所有维度的分析,得到多个相关维度信息。
通常播放***中的监控指标是随时间变化的,在进行多指标相关性分析时,可以利用时间序列描述监控指标,具体的,监控指标存在多个维度,每一维度下具有至少一个维度特征,其中维度特征随时间变化,因此,可以将维度特征随时间变化的状态信息描述为时间序列,基于相关性算法分析时间序列之间的相关性,进而可以量化维度特征之间、各个维度之间以及各个指标之间的相关性。具体的,如图3所示,基于时间序列的进行下钻分析可以包括如下步骤:
S302,分别汇总告警维度信息中的告警维度特征随时间变化的状态信息得到告警时间序列,告警时间序列与告警维度特征一一对应。
S304,分别汇总每一关联维度信息中的关联维度特征随时间变化的状态信息得到待分析时间序列,待分析时间序列与关联维度特征一一对应。
S306,按照维度值递增的顺序依次将每一关联维度信息对应的待分析时间序列与告警时间序列进行相关性分析,直至遍历所有的关联维度信息。
在得到待分析时间序列和告警时间序列之后,可以采用如下步骤进行下钻相关性分析:A.选取特征粒度值最小的关联维度信息对应的待分析时间序列;B.基于相关性算法对待分析时间序列和告警时间序列进行相关性分析,保留相关度大于预设相关度的相关时间序列;C.更新待分析时间序列,将分析完成的关联维度特征信息及其对应的时间序列删除,保留未进行分析的关联维度信息及其对应的待分析时间序列。重复步骤A-C,直至完成所有关联维度信息中的待分析时间序列的相关性分析。示例性的,告警时间序列可以为从告警前三小时至当前的服务器或数据库随时间变化的序列状态信息,下钻分析时,如果是查看省份维度是否有问题,则会以省份为分组信息进行关联维度信息的获取,如果一共有10个省份,则会获取到10条从告警前三小时至今的时序序列(长度与告警时间序列一致),然后对这10条序列和前述的告警时间序列进行相关性分析。
作为示例性的实施例,待分析时间序列与告警时间序列之间的相关性可以采用相关系数算法,例如,余弦相关性算法,皮尔森相关系数,还可以采用其他常见距离相关性分析方法,例如,欧几里得距离,马哈拉诺比斯距离,曼哈顿距离等相关性分析方法。示例性的,可以采用上述实施例中描述的皮尔森相关系数或欧几里得距离算法计算待分析时间序列与告警时间序列的相关度。
在播放***中,一个真实故障会伴随大批量监控指标的异常,并针对单个异常指标分别同时投递告警信息,从用户角度感知,会同一时间收到大量针对单个异常指标的告警信息,形成告警风暴,告警量的快速积压,以及告警风暴的各个告警只针对单个异常指标,会导致用户收到的告警信息多且杂乱。因此,为了整合多个异常指标的多个报警信息,作为示例性的实施例,获取警告信息,警告信息基于监控指标的异常产生;基于预设规则对告警信息进行汇聚,得到告警信息集;基于所述监控指标的被监控维度查找所述告警信息集中的告警信息产生异常的维度信息,得到告警维度信息。具体的,图4示出了对于告警信息处理的一个示例性的处理框架示意图,具体的,如图4所示,该处理框架可以包括告警汇聚模块10,用于对告警信息进行汇聚;下钻分析模块20,用于对告警信息进行相关性分析;扫描模块30,可以在告警汇聚模块10中扫描告警信息集,投递模块40,用于进行告警投递。
作为示例性的实施例,监控***对播放***中各个指标进行实时监控,当检测到播放链路上某一指标发生异常时,并不直接投递告警,而是先将告警按照一定规则存储到数据库的告警汇聚模块10中,可以存储在Redis数据库中,根据发生异常的监控指标对告警信息进行分类;按照时序分别对不同类的告警信息进行汇聚得到与异常监控指标对应的告警信息集。如播放中的卡顿相关指标存储到一个告警汇聚模块中,播放开始前的故障率相关指标存储到一个告警汇聚模块中等。
作为示例性的实施例,如图4所示,在汇聚完成后,利用下钻分析模块20可以对告警信息进行相关性分析,具体的,采用扫描模块30对告警汇聚模块进行扫描,可以按照一定时间间隔,如10秒、20秒、一分钟,对Redis数据库进行扫描,检测是否有汇聚告警,在扫描得到警信息集之后,下钻分析模块对警信息集中的每个告警信息进行维度特征挖掘,得到告警维度信息。基于告警维度信息和告警信息集的关联维度信息进行相关性分析,得到与当前告警信息集相关的相关维度信息。
作为示例性的实施例,如图4所示,告警投递模块40在进行告警投递时,可以基于相关维度信息和告警维度信息确定待投递监控指标;将待投递监控指标、告警信息、相关维度信息和告警维度信息和待投递监控指标进行整合得到告警投递信息。具体的,将相关维度信息所属的监控指标以及告警维度信息的监控指标作为待投递监控指标,在投递时,可以集合待投递监控指标,投递告警信息、告警信息所属指标以及告警维度,和,与之相关的指标和相关维度等作为告警投递信息进行投递。基于在整合多条告警的基础上,可以针对多个关联指标的多维度进行相关性分析,不仅可以提高关联分析效率,也可以挖掘到告警风暴中更多潜在信息,提高告警有效性;利用对告警间关联性,深度挖掘了告警间可能存在的关联,在一定程度提高了告警的价值。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM(Read-Only Memory,只读存储器)/RAM(Random Access Memory,随机存取存储器)、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例的方法。
根据本申请实施例的另一个方面,还提供了一种用于实施上述告警信息处理方法的告警信息处理装置。图3是根据本申请实施例的一种可选的告警信息处理装置的示意图,如图3所示,该装置可以包括:
(1)获取单元502,用于告警信息中的告警维度信息,告警信息基于监控指标异常产生;
(2)确定单元504,用于根据预设关联关系确定与告警信息关联的关联指标,关联指标包括至少一个关联维度信息;
(3)分析单元506,用于将关联维度信息依次与告警维度信息进行相关性分析,得到告警信息的相关维度信息;
(4)整合单元508,用于整合告警信息和相关维度信息得到投递告警信息。
需要说明的是,该实施例中的获取单元502可以用于执行上述步骤S202,该实施例中的确定单元504可以用于执行上述步骤S204,该实施例中的分析单元506可以用于执行上述步骤S206,该实施例中的整合单元508可以用于执行上述步骤S208。
作为一种可选的实施例,分析单元506包括:
下钻分析子单元,用于基于相关性算法对关联维度信息和告警维度信息进行下钻分析;
选择子单元,用于保留每次下钻分析结果中相关度大于预设相关度的关联维度信息作为相关维度信息。
作为可选的实施例,下钻分析子单元还用于获取每一关联维度信息的维度粒度值,其中,维度粒度值与关联维度特征的特征数量呈正相关;按照维度粒度值递增的顺序依次将关联维度信息与告警维度信息的维度特征进行相关性分析。
作为可选的实施例,下钻分析子单元还用于分别汇总告警维度信息中的告警维度特征随时间变化的状态信息得到告警时间序列,告警时间序列与告警维度特征一一对应;分别汇总每一关联维度信息中的关联维度特征随时间变化的状态信息得到待分析时间序列,待分析时间序列与关联维度特征一一对应;按照维度值递增的顺序依次将每一关联维度信息对应的待分析时间序列与告警时间序列进行相关性分析,直至遍历所有的关联维度信息。
作为可选的实施例,获取单元502包括:
获取子单元,用于获取告警信息,告警信息基于检测到播放链路中的监控指标发生异常时产生;
汇聚单元,用于基于预设规则对告警信息进行汇聚,得到告警信息集;
挖掘单元,用于对告警信息集中的告警信息的告警维度进行挖掘,得到告警维度信息。
作为可选的实施例,汇聚子单元还用于根据发生异常的监控指标对告警信息进行分类;按照时序分别对不同类的告警信息进行汇聚,得到告警信息集。
作为可选的实施例,整合单元508还用于基于相关维度信息和告警维度信息确定待投递监控指标信息,待投递监控指标信息包括相关维度信息对应的监控指标信息和告警维度信息对应的监控指标信息;将待投递监控指标信息、告警信息、相关维度信息和告警维度信息进行整合得到告警投递信息。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现,其中,硬件环境包括网络环境。
根据本申请实施例的又一个方面,还提供了一种用于实施上述告警信息处理方法的电子设备,该电子设备可以是服务器、终端、或者其组合。
图6是根据本申请实施例的一种可选的电子设备的结构框图,如图6所示,包括处理器602、通信接口604、存储器606和通信总线608,其中,处理器602、通信接口604和存储器606通过通信总线608完成相互间的通信,其中,
存储器606,用于存储计算机程序;
处理器602,用于执行存储器606上所存放的计算机程序时,实现如下步骤:
S1,获取告警信息中的告警维度信息,告警信息基于监控指标异常产生;
S2,根据预设关联关系确定与告警信息关联的关联指标,关联指标包括至少一个关联维度信息;
S3,将关联维度信息依次与告警维度信息进行相关性分析,得到告警信息的相关维度信息;
S4,整合告警信息和相关维度信息得到告警投递信息。
可选地,在本实施例中,上述的通信总线可以是PCI(Peripheral ComponentInterconnect,外设部件互连标准)总线、或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括RAM,也可以包括非易失性存储器(non-volatile memory),例如,至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
作为一种示例,如图6所示,上述存储器602中可以但不限于包括上述告警信息处理装置中的获取单元502、确定单元504、分析单元506以及整合单元508。此外,还可以包括但不限于上述告警信息处理装置中的其他模块单元,本示例中不再赘述。
上述处理器可以是通用处理器,可以包含但不限于:CPU(Central ProcessingUnit,中央处理器)、NP(Network Processor,网络处理器)等;还可以是DSP(DigitalSignal Processing,数字信号处理器)、ASIC(Application Specific IntegratedCircuit,专用集成电路)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
此外,上述电子装置还包括:显示器,用于显示告警投递信息。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
本领域普通技术人员可以理解,图6所示的结构仅为示意,实施上述告警信息处理方法的设备可以是终端设备,该终端设备可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图6其并不对上述电子装置的结构造成限定。例如,终端设备还可包括比图6中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图6所示的不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、ROM、RAM、磁盘或光盘等。
根据本申请实施例的又一个方面,还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于执行告警信息处理方法的程序代码。可选地,在本实施例中,上述存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:
S1,获取告警信息中的告警维度信息,告警信息基于监控指标异常产生;
S2,根据预设关联关系确定与告警信息关联的关联指标,关联指标包括至少一个关联维度信息;
S3,将关联维度信息依次与告警维度信息进行相关性分析,得到告警信息的相关维度信息;
S4,整合告警信息和相关维度信息得到告警投递信息。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例中对此不再赘述。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、ROM、RAM、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例中所提供的方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (10)

1.一种告警信息处理方法,其特征在于,包括:
获取告警信息中的告警维度信息,所述告警信息基于监控指标异常产生;
根据预设关联关系确定与所述告警信息关联的关联指标,所述关联指标包括至少一个关联维度信息,所述预设关联关系至少包括功能相关联的指标之间的关系;
将所述关联维度信息依次与所述告警维度信息进行相关性分析,得到所述告警信息的相关维度信息;
整合所述告警信息和所述相关维度信息得到告警投递信息。
2.如权利要求1所述的告警信息处理方法,其特征在于,将所述关联维度信息依次与所述告警维度信息进行相关性分析,得到所述告警维度信息的相关维度信息包括:
利用相关性算法依次将至少一个所述关联维度信息与所述告警维度信息进行相关性分析,得到每一相关维度信息对应的分析结果,其中,每一关联维度信息包括至少一个关联维度特征,所述告警维度信息包括至少一个告警维度特征,所述分析结果包括当前关联维度信息中关联维度特征与所述告警维度信息中的告警维度特征的相关度;
保留每一关联维度信息对应的分析结果中的所述关联维度特征与告警维度特征的相关度大于预设相关度的关联维度特征作为所述相关维度信息。
3.如权利要求2所述的告警信息处理方法,其特征在于,利用相关性算法依次将至少一个所述关联维度信息与所述告警维度信息进行相关性分析,得到每一相关维度信息对应的分析结果包括:
获取每一所述关联维度信息的维度粒度值,其中,所述维度粒度值与所述关联维度特征的特征数量呈正相关;
按照所述维度粒度值递增的顺序依次将所述关联维度信息与所述告警维度信息的维度特征进行相关性分析。
4.如权利要求3所述的告警信息处理方法,其特征在于,按照所述维度粒度值递增的顺序依次将所述关联维度信息与所述告警维度信息的维度特征进行相关性分析包括:
分别汇总所述告警维度信息中的告警维度特征随时间变化的状态信息得到告警时间序列,所述告警时间序列与所述告警维度特征一一对应;
分别汇总每一所述关联维度信息中的关联维度特征随时间变化的状态信息得到待分析时间序列,所述待分析时间序列与所述关联维度特征一一对应;
按照所述维度值递增的顺序依次将每一所述关联维度信息对应的所述待分析时间序列与所述告警时间序列进行相关性分析,直至遍历所有的所述关联维度信息。
5.如权利要求1所述的告警信息处理方法,其特征在于,获取告警信息中的告警维度信息包括:
获取所述告警信息,所述告警信息基于检测到播放链路中的监控指标发生异常时产生;
基于预设规则对所述告警信息进行汇聚,得到告警信息集;
基于所述监控指标的被监控维度查找所述告警信息集中的告警信息产生异常的维度信息,得到所述告警维度信息。
6.如权利要求5所述的告警信息处理方法,其特征在于,基于预设规则对所述告警信息进行汇聚,得到告警信息集包括:
根据发生异常的所述监控指标对所述告警信息进行分类;
按照时序分别对不同类的告警信息进行汇聚,得到所述告警信息集。
7.如权利要求1所述的告警信息处理方法,其特征在于,整合所述告警信息和所述相关维度信息得到告警投递信息包括:
基于所述相关维度信息和告警维度信息确定待投递监控指标信息,所述待投递监控指标信息包括相关维度信息对应的监控指标信息和告警维度信息对应的监控指标信息;
将所述待投递监控指标信息、所述告警信息、所述相关维度信息和所述告警维度信息进行整合得到所述告警投递信息。
8.一种告警信息处理装置,其特征在于,包括:
获取模块,用于告警信息中的告警维度信息,所述告警信息基于监控指标异常产生;
确定模块,用于根据预设关联关系确定与所述告警信息关联的关联指标,所述关联指标包括至少一个关联维度信息,所述预设关联关系至少包括功能相关联的指标之间的关系;
分析模块,用于将所述关联维度信息依次与所述告警维度信息进行相关性分析,得到所述告警信息的相关维度信息;
整合模块,用于整合所述告警信息和所述相关维度信息得到投递告警信息。
9.一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口和所述存储器通过所述通信总线完成相互间的通信,其特征在于,
所述存储器,用于存储计算机程序;
所述处理器,用于通过运行所述存储器上所存储的所述计算机程序来执行权利要求1至7中任一项所述的告警信息处理方法步骤。
10.一种计算机可读的存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行权利要求1至7中任一项中所述的告警信息处理方法步骤。
CN202011612444.2A 2020-12-30 2020-12-30 告警信息处理方法和装置、存储介质和电子设备 Active CN112751711B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011612444.2A CN112751711B (zh) 2020-12-30 2020-12-30 告警信息处理方法和装置、存储介质和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011612444.2A CN112751711B (zh) 2020-12-30 2020-12-30 告警信息处理方法和装置、存储介质和电子设备

Publications (2)

Publication Number Publication Date
CN112751711A true CN112751711A (zh) 2021-05-04
CN112751711B CN112751711B (zh) 2023-04-07

Family

ID=75649794

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011612444.2A Active CN112751711B (zh) 2020-12-30 2020-12-30 告警信息处理方法和装置、存储介质和电子设备

Country Status (1)

Country Link
CN (1) CN112751711B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113807697A (zh) * 2021-09-17 2021-12-17 中国联合网络通信集团有限公司 基于告警关联的派单方法及装置
CN114024828A (zh) * 2021-10-15 2022-02-08 烽火通信科技股份有限公司 一种平台侧告警抑制方法、装置及存储介质
CN114257489A (zh) * 2021-12-23 2022-03-29 中国工商银行股份有限公司 实现监控告警内容丰富的方法、装置和计算机设备
CN115967827A (zh) * 2022-12-06 2023-04-14 北京奇艺世纪科技有限公司 一种数据指标监测告警方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110493065A (zh) * 2019-09-03 2019-11-22 浪潮云信息技术有限公司 一种云中心运维的告警关联度分析方法及***
WO2019233047A1 (zh) * 2018-06-07 2019-12-12 国电南瑞科技股份有限公司 基于电网调度的运维方法
CN110661659A (zh) * 2019-09-23 2020-01-07 上海艾融软件股份有限公司 一种告警方法、装置、***及电子设备
CN111522859A (zh) * 2020-03-23 2020-08-11 深圳奇迹智慧网络有限公司 告警分析方法、装置、计算机设备和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019233047A1 (zh) * 2018-06-07 2019-12-12 国电南瑞科技股份有限公司 基于电网调度的运维方法
CN110493065A (zh) * 2019-09-03 2019-11-22 浪潮云信息技术有限公司 一种云中心运维的告警关联度分析方法及***
CN110661659A (zh) * 2019-09-23 2020-01-07 上海艾融软件股份有限公司 一种告警方法、装置、***及电子设备
CN111522859A (zh) * 2020-03-23 2020-08-11 深圳奇迹智慧网络有限公司 告警分析方法、装置、计算机设备和存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113807697A (zh) * 2021-09-17 2021-12-17 中国联合网络通信集团有限公司 基于告警关联的派单方法及装置
CN113807697B (zh) * 2021-09-17 2023-10-31 中国联合网络通信集团有限公司 基于告警关联的派单方法及装置
CN114024828A (zh) * 2021-10-15 2022-02-08 烽火通信科技股份有限公司 一种平台侧告警抑制方法、装置及存储介质
CN114024828B (zh) * 2021-10-15 2023-05-23 烽火通信科技股份有限公司 一种平台侧告警抑制方法、装置及存储介质
CN114257489A (zh) * 2021-12-23 2022-03-29 中国工商银行股份有限公司 实现监控告警内容丰富的方法、装置和计算机设备
CN115967827A (zh) * 2022-12-06 2023-04-14 北京奇艺世纪科技有限公司 一种数据指标监测告警方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN112751711B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN112751711B (zh) 告警信息处理方法和装置、存储介质和电子设备
CN110321371B (zh) 日志数据异常检测方法、装置、终端及介质
CN110839016B (zh) 异常流量监测方法、装置、设备及存储介质
CN106951925B (zh) 数据处理方法、装置、服务器及***
CN107302547B (zh) 一种web业务异常检测方法及装置
CN111178760B (zh) 风险监测方法、装置、终端设备及计算机可读存储介质
CN105868256A (zh) 处理用户行为数据的方法和***
CN111722952A (zh) 业务***的故障分析方法、***、设备和存储介质
CN105471932B (zh) 一种前端应用的监控方法、设备和***
CN111240876B (zh) 微服务的故障定位方法、装置、存储介质及终端
CN113271322B (zh) 异常流量的检测方法和装置、电子设备和存储介质
CN112395156A (zh) 故障的告警方法和装置、存储介质和电子设备
CN109495291B (zh) 调用异常的定位方法、装置和服务器
CN112671767B (zh) 一种基于告警数据分析的安全事件预警方法及装置
CN104298586A (zh) 一种基于***日志的Web***异常分析方法和装置
CN111984442A (zh) 计算机集群***的异常检测方法及装置、存储介质
CN112839014A (zh) 建立识别异常访问者模型的方法、***、设备及介质
CN107341095B (zh) 一种智能分析日志数据的方法及装置
CN112437034B (zh) 虚假终端检测方法和装置、存储介质及电子装置
CN110598959A (zh) 一种资产风险评估方法、装置、电子设备及存储介质
CN115576834A (zh) 支撑故障还原的软件测试复用方法、***、终端及介质
CN113391867B (zh) 基于数字化和可视化的大数据业务处理方法及业务服务器
CN105825641A (zh) 一种业务报警方法和装置
CN112416896A (zh) 数据异常的报警方法和装置、存储介质、电子装置
CN114827951B (zh) 一种基于车辆终端的车辆网络质量分析方法、***及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant