CN113742169B - 一种业务监控告警方法、装置、设备以及存储介质 - Google Patents

一种业务监控告警方法、装置、设备以及存储介质 Download PDF

Info

Publication number
CN113742169B
CN113742169B CN202110931862.6A CN202110931862A CN113742169B CN 113742169 B CN113742169 B CN 113742169B CN 202110931862 A CN202110931862 A CN 202110931862A CN 113742169 B CN113742169 B CN 113742169B
Authority
CN
China
Prior art keywords
target
monitoring
relation
weight coefficient
variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110931862.6A
Other languages
English (en)
Other versions
CN113742169A (zh
Inventor
张广意
刘超
冯经宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN202110931862.6A priority Critical patent/CN113742169B/zh
Publication of CN113742169A publication Critical patent/CN113742169A/zh
Application granted granted Critical
Publication of CN113742169B publication Critical patent/CN113742169B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Alarm Systems (AREA)

Abstract

本申请实施例公开了一种业务监控告警方法,该方法包括:确定待监控对象对应的参考关系;按照预设时间间隔采集待分析时间段内至少一个参考监控变量的第一数值集合和监控参数的第二数值集合;基于第一数值集合、第二数值集合和参考关系,确定得到第一目标关系;确定历史分析时间段内对应的第二目标关系;从第一目标关系中,获取目标监控变量对应的第一权重系数;其中,目标监控变量是每一参考监控变量;从第二目标关系中,获取目标监控变量对应的第二权重系数;基于第一权重系数和第二权重系数,生成用于提示目标人员需对目标监控变量对应的业务进行分析的提示信息,并显示提示信息。本申请实施例还公开了一种业务监控告警装置、设备和存储介质。

Description

一种业务监控告警方法、装置、设备以及存储介质
技术领域
本申请涉及信息技术领域,尤其涉及一种业务监控告警方法、装置、设备以及存储介质。
背景技术
随着计算机技术的飞速发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,但由于金融行业的安全性和实时性要求,也对技术提出了更高的要求。在信息技术***的运维管理中,对异常事件的监控管理尤为重要。目前,常用的两种异常事件的监控告警方式主要有两种:一种是当采集到监控对象的数据满足对应的数值阈值条件时,触发告警事件,以通知相关人员对监控对象的异常进行处理;另一种是采用斜率计算的方式来对监控对象进行监控告警,即计算一段时间内监控对象的变化率来对监控对象进行监控告警。例如当一个应用***新版本上线之后,假设应用***旧版本的业务量与***资源的使用关系检测为执行一笔交易时的中央处理器(Central ProcessingUnit,CPU)占用率为0.01%和的内存占用量为2兆比特(MB),而应用***新版本的业务量与***资源的使用关系经检测为执行一笔交易时的CPU占用率为0.05%和内存占用量为5MB,只能分别对应用***新旧版本的CPU占用率或内存占用量采用前述两种监控告警方式进行比较分析,以针对应用***新版本是否需要进行告警。
目前,进行监控时只根据监控对象造成的单一***层的资源使用情况来实现,并没有对监控对象的输入变量进行考虑,导致监控告警的准确率较低。
申请内容
为解决上述技术问题,本申请实施例期望提供一种业务监控告警方法、装置、设备以及存储介质,解决了目前监控告警准确率较低的问题,实现了一种充分考虑输入变量对象对***资源消耗的影响的业务监控告警方法,提高了监控告警的准确率。
本申请的技术方案是这样实现的:
第一方面,一种业务监控告警方法,所述方法包括:
确定待监控对象对应的参考关系;其中,所述参考关系用于表示所述待监控对象的至少一个参考监控变量与所述待监控对象的监控参数之间的关系,所述至少一个参考监控变量的变动会导致所述监控参数的变动;
按照预设时间间隔采集待分析时间段内所述至少一个参考监控变量的第一数值集合和所述监控参数的第二数值集合;
基于所述第一数值集合、第二数值集合和所述参考关系,确定得到第一目标关系;
确定历史分析时间段内对应的第二目标关系;其中,所述第二目标关系是基于所述历史分析时间段内所述至少一个参考监控变量的第三数值集合、所述监控参数的第四数值集合和所述参考关系确定得到的,所述历史分析时间段是与所述待分析时间段相邻、且时长相同的前一时间段;
从所述第一目标关系中,获取目标监控变量对应的第一权重系数;其中,所述目标监控变量是每一所述参考监控变量;
从所述第二目标关系中,获取所述目标监控变量对应的第二权重系数;
基于所述第一权重系数和所述第二权重系数,生成用于提示目标人员需对所述目标监控变量对应的业务进行分析的提示信息,并显示所述提示信息。
第二方面,一种业务监控告警装置,所述装置包括:确定单元、采集单元、获取单元和生成单元;其中:
所述确定单元,用于确定待监控对象对应的参考关系;其中,所述目标关系用于表示所述待监控对象的至少一个参考监控变量与所述待监控对象的监控参数之间的关系;
所述采集单元,用于按照预设时间间隔采集待分析时间段内所述至少一个参考监控变量的第一数值集合和所述监控参数的第二数值集合;
所述确定单元,还用于基于所述第一数值集合、第二数值集合和所述参考关系,确定得到第一目标关系;
所述确定单元,还用于确定历史分析时间段内对应的第二目标关系;其中,所述第二目标关系是基于所述历史分析时间段内所述至少一个参考监控变量的第三数值集合、所述监控参数的第四数值集合和所述参考关系确定得到的,所述历史分析时间段是与所述待分析时间段相邻、且时长相同的前一时间段;
所述获取单元,用于从所述第一目标关系中,获取目标监控变量对应的第一权重系数;其中,所述目标监控变量是每一所述参考监控变量;
所述获取单元,还用于从所述第二目标关系中,获取所述目标监控变量对应的第二权重系数;
所述生成单元,用于基于所述第一权重系数和所述第二权重系数,生成用于提示目标人员需对所述目标监控变量对应的业务进行分析的提示信息,并显示所述提示信息。
第三方面,一种业务监控告警设备,所述设备包括:存储器、处理器和通信总线;其中:
所述存储器,用于存储可执行指令;
所述通信总线,用于实现所述处理器和所述存储器之间的通信连接;
所述处理器,用于执行所述存储器中存储的业务监控告警程序,实现如上述任一项所述的业务监控告警方法的步骤。
第四方面,一种存储介质,所述存储介质上存储有业务监控告警程序,所述业务监控告警程序被处理器执行时实现如上述任一项所述的业务监控告警方法的步骤。
本申请实施例中,通过确定待监控对象对应的参考关系,按照预设时间间隔采集待分析时间内至少一个参考监控变量的第一数值集合和监控参数的第二数值集合,并基于第一数值集合、第二数值集合和参考关系,确定得到第一目标关系,以及确定历史分析时间段内对应的第二目标关系,然后从第一目标关系中,获取目标监控变量对应的第一权重系数,从第二目标关系中,获取目标监控变量对应的第二权重系数,最后基于第一权重系数和第二权重系数,生成用于提示目标人员需对目标监控变量对应的业务进行分析的提示信息,并显示提示信息。这样,通过确定得到两个不同分析时间段内针对待监控对象的至少一个参考监控变量和监控参数对应的第一目标关系和第二目标关系后,对第一目标关系和第二目标关系中目标监控变量对应的权重系数进行分析,来确定目标监控变量是否出现异常,解决了目前监控告警准确率较低的问题,实现了一种充分考虑输入变量对象对***资源消耗的影响的业务监控告警方法,提高了监控告警的准确率。
附图说明
图1为本申请实施例提供的一种业务监控告警方法的流程示意图;
图2为本申请实施例提供的另一种业务监控告警方法的流程示意图;
图3为本申请实施例提供的又一种业务监控告警方法的流程示意图;
图4为本申请实施例提供的一种业务监控告警装置的结构示意图;
图5为本申请实施例提供的一种业务监控告警设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
本申请的实施例提供一种业务监控告警方法,参照图1所示,方法应用于业务监控告警设备,该方法包括以下步骤:
步骤101、确定待监控对象对应的参考关系。
其中,参考关系用于表示待监控对象的至少一个参考监控变量与待监控对象的监控参数之间的关系,至少一个参考监控变量的变动会导致监控参数的变动。
在本申请实施例中,待监控对象可以是任何需要进行监控告警的对象,例如可以是业务监控告警设备中运行的应用***。待监控对象对应的参考关系可以采用计算公式、图表等形式表示至少一个参考监控变量与待监控对象的监控参数之间的关系。业务监控告警设备可以是具有计算运行能力的设备,例如可以是各种类型的计算机设备、服务器等设备。
步骤102、按照预设时间间隔采集待分析时间段内至少一个参考监控变量的第一数值集合和监控参数的第二数值集合。
在本申请实施例中,预设时间间隔为根据大量实验或根据实际需求设置的数据采集间隔经验值。待分析时间段也可以是根据大量实验或根据实际需求设置的经验值。在待分析时间段内,按照预设时间间隔采集至少一个参考监控变量和监控参数对应的实际运行值,得到包括待分析时间段内,不同采集时刻对应的至少一个参考监控变量的实际运行值的第一数值集合,以及不同采集时刻对应的监控参数的第二数值集合。其中,假设在待分析时间段内按照预设时间间隔进行采集时,共采集了预设数量次,对应的,第一数值集合中,包括预设数量个包括至少一个参考监控的实际运行值的子集合,第二数值集合中包括预设数量个监控参数的实际运行值。
步骤103、基于第一数值集合、第二数值集合和参考关系,确定得到第一目标关系。
在本申请实施例中,将第一数值集合和第二数值集合中,同一时刻的实际运行值代入到参考关系中,这样可以得到预设数量个不同时刻对应的方程组,对预设数量个不同时刻对应的方程组进行计算分析,即可得到第一目标关系,其中,通过对预设数量个不同时刻对应的方程组进行计算分析,可以得到每一参考监控变量对应的权重系数。
步骤104、确定历史分析时间段内对应的第二目标关系。
其中,第二目标关系是基于历史分析时间段内至少一个参考监控变量的第三数值集合、监控参数的第四数值集合和参考关系确定得到的,历史分析时间段是与待分析时间段相邻、且时长相同的前一时间段。
在本申请实施例中,历史分析时间段内对应的第二目标关系可以是针对历史分析时间进行分析时,已经确定好的第二目标关系,在分析待分析时间段内的待监控对象时,可以直接获取针对待监控对象的历史分析时间段内的第二目标关系,有效降低了业务监控告警设备的运算工作量,提高了业务监控告警设备的工作效率。但在一些应用场景中,第二目标关系也可以是将历史分析时间段内采集到的第三数据集合和第四数据集合中的值代入至参考关系中后,进行分析得到的。
步骤105、从第一目标关系中,获取目标监控变量对应的第一权重系数。
其中,目标监控变量是每一参考监控变量。
在本申请实施例中,由于第一目标关系中每一参考监控变量对应的权重系数均已计算得到,因此,可以确定每一参考监控变量为目标监控变量,这样,从第一目标关系中获取目标监控变量对应的第一权重系数。
步骤106、从第二目标关系中,获取目标监控变量对应的第二权重系数。
在本申请实施例中,第二目标关系中每一参考监控变量对应的权重系数也是已知的,因此,也可以从第二目标关系中,获取到目标监控变量对应的第二权重系数。
步骤107、基于第一权重系数和第二权重系数,生成用于提示目标人员需对目标监控变量对应的业务进行分析的提示信息,并显示提示信息。
在本申请实施例中,对目标监控变量为某一参考监控变量,即同一参考监控变量的第一权重系数和第二权重系数进行分析,得到分析结果,并根据分析结果生成对应的提示信息。
显示提示信息时,业务监控告警设备可以将提示信息显示于业务监控告警设备对应的特定显示区域内,也可以将提示信息显示于与业务监控告警设备具有通信连接的显示设备中,显示设备例如可以与业务监控告警设备具有通信连接的具有显示屏幕的计算机设备,或者可以是对业务监控告警设备进行维护管理的运维人员的智能终端设备。提示信息的形式可以是文字、语音、灯光等的至少一种结合。
本申请实施例中,通过确定待监控对象对应的参考关系,按照预设时间间隔采集待分析时间内至少一个参考监控变量的第一数值集合和监控参数的第二数值集合,并基于第一数值集合、第二数值集合和参考关系,确定得到第一目标关系,以及确定历史分析时间段内对应的第二目标关系,然后从第一目标关系中,获取目标监控变量对应的第一权重系数,从第二目标关系中,获取目标监控变量对应的第二权重系数,最后基于第一权重系数和第二权重系数,生成用于提示目标人员需对目标监控变量对应的业务进行分析的提示信息,并显示提示信息。这样,通过确定得到两个不同分析时间段内针对待监控对象的至少一个参考监控变量和监控参数对应的第一目标关系和第二目标关系后,对第一目标关系和第二目标关系中目标监控变量对应的权重系数进行分析,来确定目标监控变量是否出现异常,解决了目前监控告警准确率较低的问题,实现了一种充分考虑输入变量对象对***资源消耗的影响的业务监控告警方法,提高了监控告警的准确率。
基于前述实施例,本申请的实施例提供一种业务监控告警方法,参照图2所示,该方法应用于业务监控告警设备,该方法包括以下步骤:
步骤201、确定待监控对象对应的至少一个参考监控变量和监控参数。
在本申请实施例中,待监控对象对应的至少一个参考监控变量的变动,会影响监控参数。示例性的,以待监控对象为计算机设备为例进行说明,在监控参数为计算机CPU的占用率时,至少一个参考监控变量可以是计算机设备中同时运行的指示一个应用程序。
步骤202、基于至少一个参考监控变量和监控参数,采用多元一次线性回归分析,构建得到参考关系。
其中,参考关系用于表示待监控对象的至少一个参考监控变量与待监控对象的监控参数之间的关系,至少一个参考监控变量的变动会导致监控参数的变动。
在本申请实施例中,参考关系采用公式进行表示时,参考关系可以表示为y=a1*x1+a2*x2+……+an*xn+c,其中,y为监控参数,x1、x2、……xn为至少一个参考变量,c为常数。
步骤203、按照预设时间间隔采集待分析时间段内至少一个参考监控变量的第一数值集合和监控参数的第二数值集合。
在本申请实施例中,以预设时间间隔为1秒(s)为例,待分析时间段为1~3s时间段为例进行说明,对应的得到的第一数值集合可以记为((x11,x21,……,xn1),(x12,x22,……,xn2),(x13,x23,……,xn3)),第二数值集合可以记为(y1,y2,y3),其中,(x11,x21,……,xn1)为1s时刻采集到的至少一个参考监控变量,对应的y1位1s时刻采集到的监控参数,(x12,x22,……,xn2)为2s时刻采集到的至少一个参考监控变量,对应的y2位2s时刻采集到的监控参数,(x13,x23,……,xn3))为3s时刻采集到的至少一个参考监控变量,对应的y3位3s时刻采集到的监控参数。
步骤204、基于第一数值集合、第二数值集合和参考关系,确定得到第一目标关系。
在本申请实施例中,对第一数值集合((x11,x21,……,xn1),(x12,x22,……,xn2),(x13,x23,……,xn3))、第二数值集合(y1,y2,y3)和参考关系y=a1*x1+a2*x2+……+an*xn+c进行分析,确定得到第一目标关系,其中,第一目标关系中a1、a2、……、an对应的权重系数的确定的。这样,由于参考关系中充分考虑了多个参考监控变量对监控参数的同时影响,实现全方面变量因素对因变量的影响的考虑。
步骤205、确定历史分析时间段内对应的第二目标关系。
其中,第二目标关系是基于历史分析时间段内至少一个参考监控变量的第三数值集合、监控参数的第四数值集合和参考关系确定得到的,历史分析时间段是与待分析时间段相邻、且时长相同的前一时间段。
在本申请实施例中,获取与待分析时间段相邻的,且时长相同的前一时间段即历史分析时间段对应的第二目标关系式。在一些应用场景中,历史分析时间段与待分析时间段的关系除了可以是相邻的两个时间周期外,也还可以是有部分采集时间重叠的相同时长的时间段,示例性的,假设采集时间为t1、t2、t3、t4、t5、t6、t7时,待分析时间段为t2、t3、t4、t5、t6、t7,对应的历史分析时间段为t1、t2、t3、t4、t5、t6,这样,由于历史分析时间段和待分析时间段内采集到的数据大部分是相同的,因此,可以明确确定参考监控变量是否出现异常。
步骤206、从第一目标关系中,获取目标监控变量对应的第一权重系数。
其中,目标监控变量是每一参考监控变量。
在本申请实施例中,目标监控变量可以依次是a1、a2、……、an。即从第一目标关系中,获取每一参考监控变量对应的第一权重系数。
步骤207、从第二目标关系中,获取目标监控变量对应的第二权重系数。
在本申请实施例中,从第二目标关系中,获取每一参考监控变量对应的第二权重系数。
步骤208、基于第一权重系数和第二权重系数,生成用于提示目标人员需对目标监控变量对应的业务进行分析的提示信息,并显示提示信息。
在本申请实施例中,对同一参考监控变量的第一权重系数和第二权重系数进行分析,生成针对同一参考监控变量的提示信息。并显示提示信息,以便运维人员快速发现异常情况,降低不必要的损失,包括业务监控告警设备的资源消耗损失和业务异常导致的经济损失。这样,由于第一目标关系式和第二目标关系式中均考虑了多个自变量参数对因变量参数的影响,且为两段相邻时间段内的样本数据进行分析得到的,能够有效比对出异常情况,提高了告警的准确率。
基于前述实施例,在本申请其他实施例中,步骤204可以由步骤204a~204b来实现:
步骤204a、将第一数值集合和第二数值集合中同一采集时刻的元素代入参考关系中,得到与参考关系相关的目标关系集合。
在本申请实施例中,将第一数值集合中1s时刻的(x11,x21,……,xn1)和第二数值集合中1s时刻的y1代入参考关系y=a1*x1+a2*x2+……+an*xn+c中,得到y1=a1*x11+a2*x21+……+an*xn1+c,同理可得2s时刻的y2=a1*x12+a2*x22+……+an*xn2+c,3s时刻的y3=a1*x13+a2*x23+……+an*xn3+c,即目标关系结合为(y1=a1*x11+a2*x21+……+an*xn1+c,y2=a1*x12+a2*x22+……+an*xn2+c,y3=a1*x13+a2*x23+……+an*xn3+c)。
步骤204b、对目标关系集合进行回归分析,得到第一目标关系。
在本申请实施例中,由于第一数值集合和第二数值结合中的元素均未确定的数值,因此,采用各种回归分析方法对目标关系集合进行回归分析,即可确定得到a1=a11、a2=a21、……、an=an1以及c=c1,从而可以得到a1、a2、……、an以及c为确定数值的第一目标关系y=a11*x1+a21*x2+……+an1*xn+c1。
基于前述实施例,在本申请其他实施例中,步骤205可以由步骤205a~205b来实现:
步骤205a、获取历史分析时间段内按照预设时间间隔采集到的至少一个参考监控变量的第三数值集合和监控对象的第四数值集合。
步骤205b、基于第二数值集合、第二数值集合和参考关系,确定得到第二目标关系。
在本申请实施例中,为确定第二目标关系的实现过程,其中,步骤205b的具体实现过程可以参照步骤204a~204b的实现过程,此处不再详细赘述。对应的,假设得到的第二目标关系为y=a12*x1+a22*x2+……+an2*xn+c1。
基于前述实施例,在本申请其他实施例中,步骤208可以由步骤208a~208c来实现:
步骤208a、确定第一权重系数与第二权重系数之间的变换系数值。
在本申请实施例中,从第一目标关系y=a11*x1+a21*x2+……+an1*xn+c1和第二目标关系y=a12*x1+a22*x2+……+an2*xn+c1中,依次获取参考监控变量x1对应的第一权重系数a11和第二权重系数a12,并对a11和a12进行比较分析,确定得到参考监控变量x1对应的变换系数值,同理,对参考监控变量x2对应的第一权重系数a21和第二权重系数a22进行比较分析,确定得到参考监控变量x2对应的变换系数值,……,对参考监控变量xn对应的第一权重系数an1和第二权重系数an2进行比较分析,确定得到参考监控变量xn对应的变换系数值。
步骤208b、若变换系数值大于或等于预设参数,生成提示信息。
在本申请实施例中,预设参数为根据大量实验得到的异常经验值。若变换系数值小于预设参数,表明参考监控变量正常,因此,无需生成提示信息。若变换系数值大于或等于预设参数,表明参考监控变量对监控参数的影响较大,可能存在异常,因此,需要生成提示信息,以提示运维人员对变换系数值大于或等于预设参数的参考变量进行分析。需说明的是,不同参考监控变量对应的预设参数可以相同,也可以不同。
步骤208c、显示提示信息。
基于前述实施例,在本申请其他实施例中,步骤208a可以由以下步骤来实现:确定第一权重系数与第二权重系数之间的变化百分比。
其中,变换系数值包括变化百分比。
在本申请实施例中,第一权重系数与第二权重系数之间的变换百分比=|第一权重系数-第二权重系数|/第二权重系数*100%,其中||为取绝对值符号。但在一些应用场景中,第一权重系数与第二权重系数之间的变换百分比=|第一权重系数-第二权重系数|/权重系数平均值*100%,其中,权重系数平均值可以是对第一权重系数和第二权重系数进行平均值计算得到的,还可以是采用加权平均算法计算得到的。
基于前述实施例,在本申请其他实施例中,待分析时间段为当前采样周期,对应的,历史分析时间段为与当前采样周期相邻的前一采样周期。
基于前述实施例,本申请实施例提供一种业务监控告警方法,参照图3所示,包括以下实现过程:
步骤a11、通过预先设置的规则配置,确定待监控对象的自变量参数与因变量参数。
其中,待监控对象的自变量为前述至少一个参考监控变量,待监控对象的因变量为前述的待监控对象的监控参数。即开发人员将不同监控对象对应的需要分析的自变量与因变量进行预先设置,因此,在需要对待监控对象进行监控分析时,可以根据预先设置的规则配置来确定得到待监控对象对应的自变量和因变量。但在一些应用场景下,预先设置的规则配置也可以是用户或运维人员根据实际需求对待监控对象的自变量与因变量进行配置的。
示例性的,以待监控对象为用户认证***软件的运行消耗主机的CPU资源为例进行说明,用户认证***软件的运行时,主机的CPU需要对的用户认证***软件进行程序调度与软件计算,因此,可以确定用户认证***软件中用户的登入数和登出数与主机CPU的使用率之间存在依赖关系,用户的登入数与用户的登出数的最大并发数取决于该台主机的CPU的最大计算能力,因此将用户的登入数与用户的登出作为自变量数,主机的CPU使用率作为因变量。
步骤a12、对待监控对象的自变量参数和因变量参数进行持续性采集,得到样本区间数据。
其中,示例性的,需要持续性地采集用户的登入数、登出数和主机CPU资源使用率的数值,具体的方式可以是通过用户认证***软件上报当前时间段用户的登入数和登出数给采集程序,采集程序把相应时刻的数据存储起来,主机的CPU使用率可以通过采集程序按照采集用户的登入数和登出数相同的周期去读取主机操作***资源使用情况,并且也把相应时刻的数据存储起来。
其中,采集用户的登入数和登出数时,可以按照采样间隔为10秒采集一次样本数据,采样区间为1分钟,则得到的每一样本的样本数量为6个数据点。这样,限定线性回归分析的采样区间,即确定进行数据分析时的样本数量,以及线性回归分析完后系数的变化区间,是为了保证确定得到的系数变化幅度是位于自变量的变化的合理预期内。采样间隔和采样区域可以是设置在规则配置中的。
步骤a13、对采集得到的样本区间数据进行线性回归分析,得到目标系数。
其中,目标系数为每一自变量参数对应的权重系数。每次采集的数据都是当前时刻10秒内的用户登入数总和X1、用户登出数总和X2、CPU使用率Y,其中,CPU使用率可以是通过下述方式统计得到的:CPU使用率=(1-(一定时间内的空闲CPU时间总和)/(该时间内的总CPU时间))*100%。
假设采样区间1分钟内采集到的样本数据为:登入数:[3,8,1,5,13,7];登出数:[1,10,4,2,6,3];CPU使用率:[2,51,17,12,46,20]。将采集到的样本数据代入自变量与因变量间的关系即前述参考关系为Y=a*X1+b*X2+C中,可以得到方程组:2=a*3+b*1+C,51=a*8+b*10+C,17=a*1+b*4+C,12=a*5+b*2+C,46=a*13+b*6+C,20=a*7+b*3+C,采用线性回归分析,可以计算得到a=3.419,b=0.059,C=2.939,即回归分析最后生成的最优公式即前述第一目标关系为Y=3.419*X1+0.059*X2+2.939。其中,a=3.419,b=0.059,C=2.939为目标系数,并存储目标系数。
步骤a14、获取待监控对象的历史系数,并对目标系数与历史系数进行分析,得到变化百分比。
其中,假设确定得到的与步骤a13采样区间相邻的下一采样周期内,用户认证***软件对应的回归分析的系数计算结果为a=4、b=0.2、C=3,则登入数对应的第一权重系数为4,登入数的第二权重系数为3.419,登出数对应的第一权重系数为0.2,登出数对应的第二权重系数为0.059,对应的变换百分比的计算公式可以记为变化百分比B=|d1-d2|/d2*100%,其中,d1为第一权重系数,d2为第二权重系数,这样通过公式可以计算得到B(a)=|4-3.419|/3.419*100%=17%,B(b)=|0.2-0.059|/0.059*100%=238%,B(C)=|3-2.939|/2.939*100%=2%。
步骤a15、将变化百分比与变化阈值进行比较,若变化百分比大于或等于变化阈值,执行步骤a16,否则执行步骤a12。
其中,假设变化阈值为100%,则登出数对应的B(b)已超出变化阈值。变化阈值也可以在规则配置中进行设置得到。
步骤a16、发出警告。
其中,发出针对登出数的业务进行分析的警告,而登入数的业务正常,不用发出警告。
需要说明的是,本实施例中与其它实施例中相同步骤和相同内容的说明,可以参照其它实施例中的描述,此处不再赘述。
本申请实施例中,通过确定待监控对象对应的参考关系,按照预设时间间隔采集待分析时间内至少一个参考监控变量的第一数值集合和监控参数的第二数值集合,并基于第一数值集合、第二数值集合和参考关系,确定得到第一目标关系,以及确定历史分析时间段内对应的第二目标关系,然后从第一目标关系中,获取目标监控变量对应的第一权重系数,从第二目标关系中,获取目标监控变量对应的第二权重系数,最后基于第一权重系数和第二权重系数,生成用于提示目标人员需对目标监控变量对应的业务进行分析的提示信息,并显示提示信息。这样,通过确定得到两个不同分析时间段内针对待监控对象的至少一个参考监控变量和监控参数对应的第一目标关系和第二目标关系后,对第一目标关系和第二目标关系中目标监控变量对应的权重系数进行分析,来确定目标监控变量是否出现异常,解决了目前监控告警准确率较低的问题,实现了一种充分考虑输入变量对象对***资源消耗的影响的业务监控告警方法,提高了监控告警的准确率。
基于前述实施例,本申请的实施例提供一种业务监控告警装置,该业务监控告警装置可以应用于图1~2对应的实施例提供的业务监控告警方法中,参照图4所示,该业务监控告警装置3可以包括:确定单元31、采集单元32、获取单元33和生成单元34;其中:
确定单元31,用于确定待监控对象对应的参考关系;其中,目标关系用于表示待监控对象的至少一个参考监控变量与待监控对象的监控参数之间的关系;
采集单元32,用于按照预设时间间隔采集待分析时间段内至少一个参考监控变量的第一数值集合和监控参数的第二数值集合;
确定单元31,还用于基于第一数值集合、第二数值集合和参考关系,确定得到第一目标关系;
确定单元31,还用于确定历史分析时间段内对应的第二目标关系;其中,第二目标关系是基于历史分析时间段内至少一个参考监控变量的第三数值集合、监控参数的第四数值集合和参考关系确定得到的,历史分析时间段是与待分析时间段相邻、且时长相同的前一时间段;
获取单元33,用于从第一目标关系中,获取目标监控变量对应的第一权重系数;其中,目标监控变量是每一参考监控变量;
获取单元33,还用于从第二目标关系中,获取目标监控变量对应的第二权重系数;
生成单元34,用于基于第一权重系数和第二权重系数,生成用于提示目标人员需对目标监控变量对应的业务进行分析的提示信息,并显示提示信息。
在本申请其他实施例中,确定单元31用于执行步骤确定待监控对象对应的参考关系时,具体可以通过以下步骤来实现:
确定待监控对象对应的至少一个参考监控变量和监控参数;
基于至少一个参考监控变量和监控参数,采用多元一次线性回归分析,构建得到参考关系。
在本申请其他实施例中,确定单元31用于执行步骤基于第一数值集合、第二数值集合和参考关系,确定得到第一目标关系时,具体可以通过以下步骤来实现:
将第一数值集合和第二数值集合中同一采集时刻的元素代入参考关系中,得到与参考关系相关的目标关系集合;
对目标关系集合进行回归分析,得到第一目标关系。
在本申请其他实施例中,确定单元31用于执行步骤确定历史分析时间段内对应的第二目标关系时,具体可以通过以下步骤来实现:
获取历史分析时间段内按照预设时间间隔采集到的至少一个参考监控变量的第三数值集合和监控对象的第四数值集合;
基于第二数值集合、第二数值集合和参考关系,确定得到第二目标关系。
在本申请其他实施例中,生成单元34用于执行步骤基于第一权重系数和第二权重系数,生成用于提示目标人员需对目标监控变量对应的业务进行分析的提示信息,并显示提示信息时,可以通过以下步骤来实现:
确定第一权重系数与第二权重系数之间的变换系数值;
若变换系数值大于或等于预设参数,生成提示信息;
显示提示信息。
在本申请其他实施例中,生成单元34用于执行步骤确定第一权重系数与第二权重系数之间的变换系数值时,可以通过以下步骤来实现:
确定第一权重系数与第二权重系数之间的变化百分比;其中,变换系数值包括变化百分比。
在本申请其他实施例中,待分析时间段为当前采样周期,对应的,历史分析时间段为与当前采样周期相邻的前一采样周期。
需要说明的是,本申请实施例中单元或模块之间的信息传递过程,可以参照图1~2对应的实施例提供的方法实现过程,此处不再赘述。
本申请实施例中,通过确定待监控对象对应的参考关系,按照预设时间间隔采集待分析时间内至少一个参考监控变量的第一数值集合和监控参数的第二数值集合,并基于第一数值集合、第二数值集合和参考关系,确定得到第一目标关系,以及确定历史分析时间段内对应的第二目标关系,然后从第一目标关系中,获取目标监控变量对应的第一权重系数,从第二目标关系中,获取目标监控变量对应的第二权重系数,最后基于第一权重系数和第二权重系数,生成用于提示目标人员需对目标监控变量对应的业务进行分析的提示信息,并显示提示信息。这样,通过确定得到两个不同分析时间段内针对待监控对象的至少一个参考监控变量和监控参数对应的第一目标关系和第二目标关系后,对第一目标关系和第二目标关系中目标监控变量对应的权重系数进行分析,来确定目标监控变量是否出现异常,解决了目前监控告警准确率较低的问题,实现了一种充分考虑输入变量对象对***资源消耗的影响的业务监控告警方法,提高了监控告警的准确率。
基于前述实施例,本申请的实施例提供一种业务监控告警设备,该业务监控告警设备可以应用于图1~2对应的实施例提供的业务监控告警方法中,参照图5所示,该业务监控告警设备4可以包括:处理器41、存储器42和通信总线43,其中:
存储器42,用于存储可执行指令;
通信总线43,用于实现处理器41和存储器42之间的通信连接;
处理器41,用于执行存储器42中存储的业务监控告警程序,以实现参照图1~2对应的实施例提供的方法实现过程,此处不再赘述。
基于前述实施例,本申请的实施例提供一种计算机可读存储介质,简称为存储介质,该计算机可读存储介质存储有一个或者多个程序,该一个或者多个程序可被一个或者多个处理器执行,以实现如图1~2对应的实施例提供的业务监控告警方法实现过程,此处不再赘述。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。

Claims (8)

1.一种业务监控告警方法,其特征在于,所述方法包括:
确定待监控对象对应的参考关系;其中,所述参考关系用于表示所述待监控对象的至少一个参考监控变量与所述待监控对象的监控参数之间的关系,所述至少一个参考监控变量的变动会导致所述监控参数的变动;
按照预设时间间隔采集待分析时间段内所述至少一个参考监控变量的第一数值集合和所述监控参数的第二数值集合;
将所述第一数值集合和所述第二数值集合中同一采集时刻的元素代入所述参考关系中,得到与所述参考关系相关的目标关系集合;对所述目标关系集合进行回归分析,得到第一目标关系;
确定历史分析时间段内对应的第二目标关系;其中,所述第二目标关系是基于所述历史分析时间段内按照预设时间间隔采集到的所述至少一个参考监控变量的第三数值集合、所述监控参数的第四数值集合和所述参考关系确定得到的,所述历史分析时间段是与所述待分析时间段相邻、且时长相同的前一时间段;
从所述第一目标关系中,获取目标监控变量对应的第一权重系数;其中,所述目标监控变量是每一所述参考监控变量;
从所述第二目标关系中,获取所述目标监控变量对应的第二权重系数;
基于所述第一权重系数和所述第二权重系数,生成用于提示目标人员需对所述目标监控变量对应的业务进行分析的提示信息,并显示所述提示信息。
2.根据权利要求1所述的方法,其特征在于,所述确定待监控对象对应的参考关系,包括:
确定所述待监控对象对应的所述至少一个参考监控变量和所述监控参数;
基于所述至少一个参考监控变量和所述监控参数,采用多元一次线性回归分析,构建得到所述参考关系。
3.根据权利要求1或2所述的方法,其特征在于,所述基于所述第一权重系数和所述第二权重系数,生成用于提示目标人员需对所述目标监控变量对应的业务进行分析的提示信息,并显示所述提示信息,包括:
确定所述第一权重系数与所述第二权重系数之间的变换系数值;
若所述变换系数值大于或等于预设参数,生成所述提示信息;
显示所述提示信息。
4.根据权利要求3所述的方法,其特征在于,所述确定所述第一权重系数与所述第二权重系数之间的变换系数值,包括:
确定所述第一权重系数与所述第二权重系数之间的变化百分比;其中,所述变换系数值包括所述变化百分比。
5.根据权利要求1或2所述的方法,其特征在于,所述待分析时间段为当前采样周期,对应的,所述历史分析时间段为与所述当前采样周期相邻的前一采样周期。
6.一种业务监控告警装置,其特征在于,所述装置包括:确定单元、采集单元、获取单元和生成单元;其中:
所述确定单元,用于确定待监控对象对应的参考关系;其中,目标关系用于表示所述待监控对象的至少一个参考监控变量与所述待监控对象的监控参数之间的关系;
所述采集单元,用于按照预设时间间隔采集待分析时间段内所述至少一个参考监控变量的第一数值集合和所述监控参数的第二数值集合;
所述确定单元,还用于将所述第一数值集合和所述第二数值集合中同一采集时刻的元素代入所述参考关系中,得到与所述参考关系相关的目标关系集合;对所述目标关系集合进行回归分析,得到第一目标关系;
所述确定单元,还用于确定历史分析时间段内对应的第二目标关系;其中,所述第二目标关系是基于所述历史分析时间段内按照预设时间间隔采集到的所述至少一个参考监控变量的第三数值集合、所述监控参数的第四数值集合和所述参考关系确定得到的,所述历史分析时间段是与所述待分析时间段相邻、且时长相同的前一时间段;
所述获取单元,用于从所述第一目标关系中,获取目标监控变量对应的第一权重系数;其中,所述目标监控变量是每一所述参考监控变量;
所述获取单元,还用于从所述第二目标关系中,获取所述目标监控变量对应的第二权重系数;
所述生成单元,用于基于所述第一权重系数和所述第二权重系数,生成用于提示目标人员需对所述目标监控变量对应的业务进行分析的提示信息,并显示所述提示信息。
7.一种业务监控告警设备,其特征在于,所述设备包括:存储器、处理器和通信总线;其中:
所述存储器,用于存储可执行指令;
所述通信总线,用于实现所述处理器和所述存储器之间的通信连接;
所述处理器,用于执行所述存储器中存储的业务监控告警程序,实现如权利要求1至5中任一项所述的业务监控告警方法的步骤。
8.一种存储介质,其特征在于,所述存储介质上存储有业务监控告警程序,所述业务监控告警程序被处理器执行时实现如权利要求1至5中任一项所述的业务监控告警方法的步骤。
CN202110931862.6A 2021-08-13 2021-08-13 一种业务监控告警方法、装置、设备以及存储介质 Active CN113742169B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110931862.6A CN113742169B (zh) 2021-08-13 2021-08-13 一种业务监控告警方法、装置、设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110931862.6A CN113742169B (zh) 2021-08-13 2021-08-13 一种业务监控告警方法、装置、设备以及存储介质

Publications (2)

Publication Number Publication Date
CN113742169A CN113742169A (zh) 2021-12-03
CN113742169B true CN113742169B (zh) 2024-06-21

Family

ID=78731054

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110931862.6A Active CN113742169B (zh) 2021-08-13 2021-08-13 一种业务监控告警方法、装置、设备以及存储介质

Country Status (1)

Country Link
CN (1) CN113742169B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116095305B (zh) * 2023-04-12 2023-08-25 长鑫存储技术有限公司 用于对图像采集***进行监测的方法、设备及介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5942639B2 (ja) * 2012-06-29 2016-06-29 富士通株式会社 監視装置,監視プログラム,監視方法
CN110247796B (zh) * 2019-05-30 2022-09-20 平安科技(深圳)有限公司 监控告警方法、装置及相关设备
CN111679952B (zh) * 2020-06-08 2023-09-19 中国银行股份有限公司 告警阈值生成方法及装置
CN112433919B (zh) * 2020-11-25 2023-01-24 深圳前海微众银行股份有限公司 一种信息告警方法、设备及存储介质
CN112987675B (zh) * 2021-05-06 2021-07-23 北京瑞莱智慧科技有限公司 一种异常检测的方法、装置、计算机设备和介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于大数据分析技术的智能运维体系探索;张会根;张博;赵焕芳;;金融电子化;20141215(第12期);全文 *
监控阈值模型及报警事件关联规则研究;张小翠;;中国金融电脑;20160507(第05期);全文 *

Also Published As

Publication number Publication date
CN113742169A (zh) 2021-12-03

Similar Documents

Publication Publication Date Title
US20190228296A1 (en) Significant events identifier for outlier root cause investigation
US9058259B2 (en) System and method for dynamic problem determination using aggregate anomaly analysis
CN112712113B (zh) 一种基于指标的告警方法、装置及计算机***
US20080077358A1 (en) Self-Learning Integrity Management System and Related Methods
KR20180108446A (ko) Ict 인프라 관리 시스템 및 이를 이용한 ict 인프라 관리 방법
CN110581773A (zh) 一种自动化服务监控与报警管理***
US20080168044A1 (en) System and method for providing performance statistics for application components
CN107566172B (zh) 一种基于存储***的主动式管理方法及***
CN114358106A (zh) ***异常检测方法、装置、计算机程序产品及电子设备
CN111400189A (zh) 代码覆盖率监测方法、装置、电子设备及存储介质
CN113742169B (zh) 一种业务监控告警方法、装置、设备以及存储介质
CN111753875A (zh) 一种电力信息***运行趋势分析方法、装置及存储介质
CN113377559A (zh) 基于大数据的异常处理方法、装置、设备及存储介质
CN111625418A (zh) 一种进程监控方法及装置
CN114138601A (zh) 一种业务告警方法、装置、设备及存储介质
CN110262955A (zh) 基于pinpoint的应用性能监控工具
CN110677271B (zh) 基于elk的大数据告警方法、装置、设备及存储介质
CN110413482B (zh) 检测方法和装置
CN112764985A (zh) 一种数据中心***智能监控方法
CN113285978B (zh) 基于区块链和大数据的故障识别方法及通用计算节点
CN113986704A (zh) 基于TS-Decomposition的数据中心高频故障时域预警方法及***
CN115525392A (zh) 容器监控方法、装置、电子设备及存储介质
CN115080363A (zh) 一种基于业务日志的***容量评估方法及装置
CN109766238B (zh) 基于session数的运维平台性能监控方法、装置及相关设备
CN112711508A (zh) 面向大规模客户端***的智能运维服务***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant