CN110535864B - 服务异常检测方法、装置、设备及存储介质 - Google Patents

服务异常检测方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN110535864B
CN110535864B CN201910817527.6A CN201910817527A CN110535864B CN 110535864 B CN110535864 B CN 110535864B CN 201910817527 A CN201910817527 A CN 201910817527A CN 110535864 B CN110535864 B CN 110535864B
Authority
CN
China
Prior art keywords
index
influence degree
target service
index value
reference index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910817527.6A
Other languages
English (en)
Other versions
CN110535864A (zh
Inventor
张旭华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN201910817527.6A priority Critical patent/CN110535864B/zh
Publication of CN110535864A publication Critical patent/CN110535864A/zh
Application granted granted Critical
Publication of CN110535864B publication Critical patent/CN110535864B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1425Traffic logging, e.g. anomaly detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • General Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Hardware Design (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Medical Informatics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Debugging And Monitoring (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本公开关于一种服务异常检测方法、装置、设备及存储介质,包括:获取目标历史时间段中多个时长间隔内目标服务的各个参考指标的指标值;根据指标值以及对应时长间隔内各个参考指标的预设告警阈值,确定各个参考指标的影响度;基于指标值以及参考指标的影响度,对机器学习模型进行训练,得到影响度预测模型;根据影响度预测模型,得到当前时刻参考指标对应的指标值区间;若当前时刻参考指标的指标值不属于指标值区间,对目标服务进行异常检测。通过影响度预测模型,来动态确定当前时刻的指标值对应的指标值区间,从而基于所处区间来确定是否发生异常,可以及时检测到目标服务的异常情况,提高了目标服务运行的稳定性。

Description

服务异常检测方法、装置、设备及存储介质
技术领域
本公开涉及网络安全技术领域,尤其涉及一种服务异常检测方法、装置、设备及存储介质。
背景技术
随着互联网技术的不断发展,基于互联网技术的相关服务已经被作为一种全新的模式深入到各个领域,例如利用程度较广泛的云服务。为了保证云服务运行稳定,需及时发现云服务的异常情况并予以处理。有的异常情况比较容易发现,比如云服务的运行程序出现空指针异常等显示报错,可以及时上报给管理员进行处理。但有的异常情况却很难被发现,比如云服务在某一时间段相比于历史上这一时间段来说,出现访问量异常,若不能及时发现,将会对云服务业务造成影响。
为了解决上述问题,相关技术中,通过设置固定的访问量告警区间来触发异常告警,当云服务访问量超过固定的访问量告警区间时,触发告警以发现访问量异常情况。但上述方法,由于云服务运行情况复杂,设置固定的访问量告警区间,可能触发云服务误告警,增加对告警情况的处理成本;或者造成云服务异常的漏告警,影响云服务业务运行稳定性。
发明内容
本公开提供一种服务异常检测方法、装置、设备及存储介质,以至少解决相关技术中通过设置固定的指标值告警区间以发现服务运行异常情况,易导致服务异常误告警或漏报警的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种服务异常检测方法,所述方法包括:获取目标历史时间段中多个时长间隔内目标服务的各个参考指标的指标值;根据所述指标值以及对应时长间隔内各个所述参考指标的预设告警阈值,确定各个所述参考指标的影响度;基于所述指标值以及所述参考指标的影响度,对机器学习模型进行训练,得到影响度预测模型;根据所述影响度预测模型,得到当前时刻所述参考指标对应的指标值区间;若所述当前时刻所述参考指标的指标值不属于所述指标值区间,对所述目标服务进行异常检测。
可选地,所述获取目标历史时间段中多个时长间隔内目标服务的各个参考指标的指标值之前,所述方法还包括:获取触发对所述目标服务进行异常检测的所有指标;基于所述目标服务的类型,确定每一个所述指标的权重;将权重大于目标值的所述指标作为所述参考指标。
可选地,所述根据所述影响度预测模型,得到当前时刻所述参考指标对应的指标值区间,包括:将当前时刻所述参考指标的指标值输入所述影响度预测模型,得到所述参考指标的影响度;根据所述参考指标的影响度,确定当前时刻所述参考指标对应的指标值区间,所述影响度预先与所述指标值区间相关联。
可选地,所述参考指标包括:所述目标服务的访问量、相关联服务的访问量、所述目标服务对应的服务器内存、所述目标服务对应的服务器处理速率、所述目标服务的峰值访问量、所述目标服务的峰值访问量持续时间组成的群组中的至少一个。
可选地,所述根据所述影响度预测模型,得到当前时刻所述参考指标对应的指标值区间之前,所述方法还包括:获取测试数据,对所述影响度预测模型的预测准确率进行校验;根据校验结果,对所述影响度预测模型的模型参数进行调整,得到满足预测准确率要求的所述影响度预测模型。
根据本公开实施例的第二方面,提供一种服务异常检测装置,所述装置包括:第一获取单元,被配置为执行获取目标历史时间段中多个时长间隔内目标服务的各个参考指标的指标值;确定单元,被配置为执行根据所述指标值以及对应时长间隔内各个所述参考指标的预设告警阈值,确定各个所述参考指标的影响度;第二获取单元,被配置为执行基于所述指标值以及所述参考指标的影响度,对机器学习模型进行训练,得到影响度预测模型;第三获取单元,被配置为执行根据所述影响度预测模型,得到当前时刻所述参考指标对应的指标值区间;检测单元,被配置为执行若所述当前时刻所述参考指标的指标值不属于所述指标值区间,对所述目标服务进行异常检测。
可选地,所述第一获取单元,还被配置为执行获取触发对所述目标服务进行异常检测的所有指标;基于所述目标服务的类型,确定每一个所述指标的权重;将权重大于目标值的所述指标作为所述参考指标。
可选地,所述第三获取单元,被配置为执行将当前时刻所述参考指标的指标值输入所述影响度预测模型,得到所述参考指标的影响度;根据所述参考指标的影响度,确定当前时刻所述参考指标对应的指标值区间,所述影响度预先与所述指标值区间相关联。
可选地,所述参考指标包括:所述目标服务的访问量、相关联服务的访问量、所述目标服务对应的服务器内存、所述目标服务对应的服务器处理速率、所述目标服务的峰值访问量、所述目标服务的峰值访问量持续时间组成的群组中的至少一个。
可选地,所述第三获取单元,还被配置为执行获取测试数据,对所述影响度预测模型的预测准确率进行校验;根据校验结果,对所述影响度预测模型的模型参数进行调整,得到满足预测准确率要求的所述影响度预测模型。
根据本公开实施例的第三方面,提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如第一方面或第一方面的任一种可能的实施方式中的方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,包括:当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如第一方面或第一方面的任一种可能的实施方式中的方法。
根据本公开实施例的第五方面,提供了一种计算机程序(产品),所述计算机程序(产品)包括:计算机程序代码,当所述计算机程序代码被计算机运行时,使得所述计算机执行上述各方面中的方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
通过获取目标历史时间段中多个时长间隔内目标服务的各个参考指标的指标值以及各个参考指标的影响度得到影响度预测模型,通过影响度预测模型得到当前时刻的指标值对应的指标值区间,在当前时刻的指标值不满足指标值区间的情况下,对目标服务进行异常检测。通过影响度预测模型,来动态确定当前时刻的指标值对应的指标值区间,从而基于所处区间来确定是否发生异常,可以及时检测到目标服务的异常情况,提高了目标服务运行的稳定性;同时也避免了目标服务异常情况的误报和漏报,节省了人工处理成本。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种服务异常检测方法的流程图;
图2是根据一示例性实施例示出的一种服务异常检测方法的示意图;
图3是根据一示例性实施例示出的一种服务异常检测方法的示意图;
图4是根据一示例性实施例示出的一种服务异常检测装置的框图;
图5是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
随着互联网技术的不断发展,基于互联网技术的相关服务已经被作为一种全新的模式深入到各个领域,例如利用程度较广泛的云服务。为了保证云服务运行稳定,需及时发现云服务的异常情况并予以处理。有的异常情况比较容易发现,比如云服务的运行程序出现空指针异常等显示报错,可以及时上报给管理员进行处理。但有的异常情况却很难被发现,比如云服务在某一时间段相比于历史上这一时间段来说,出现访问量异常,若不能及时发现,将会对云服务业务造成影响。
为了解决上述问题,相关技术中,通过设置固定的访问量告警区间来触发异常告警,当云服务访问量超过固定的访问量告警区间时,触发告警以发现访问量异常情况。但上述方法,由于云服务运行情况复杂,设置固定的访问量告警区间,可能触发云服务误告警,增加对告警情况的处理成本;或者造成云服务异常的漏告警,影响云服务业务运行稳定性。为了解决上述技术问题,本申请实施例提供了一种服务异常检测方法。
图1是根据一示例性实施例示出的一种服务异常检测方法的流程图,如图1所示,该方法可用于电子设备中,该电子设备可以是终端或者是服务器,本申请实施例以终端为例,该方法包括以下步骤。
在步骤101中,获取目标历史时间段中多个时长间隔内目标服务的各个参考指标的指标值。
示例性地,该历史时间段可以是包含历史数据的任意时间段,比如一小时、一天、一个月等。对目标历史时间段的选择可以根据目标服务的参考指标的变化周期确定,可以将一个变化周期作为目标历史时间段。当目标服务的参考指标的变化周期为一天时,多个时间间隔可以是一天中的每一秒、每一分钟、每一个小时。本申请实施例对时长间隔不作限定,本领域技术人员可以根据实际需要确定。目标服务的各个参考指标可以根据目标服务的类型确定,将可以影响目标服务的业务运行稳定性的所有参数均作为参考指标。
比如若以目标服务为网上购物为例,对于网上购物服务来说,其对应的参考指标可以包括访问量。对于网上购物来说,访问量可能在一天中不同时间、一周的不同天数均有不同,例如工作日午休时间段以及工作日晚上八点以后,网上购物的访问量较工作日其他时间会增加;而一个星期内,网上购物的访问量在休息日一般会比工作日对应的时间要多。所以对于目标服务为网上购物来说,访问量的变化周期为一个星期,故目标历史时间段可以以周为单位,获取一周内或者多周内的每一天中不同小时的访问量。比如若以目标服务为节假日网上抢红包活动,由于一年内有不同的节日,故此时目标历史时间段可以以年为单位,获取一年内或多年内各个节假日对应的抢红包服务相关参考指标的指标值。
在步骤102中,根据指标值以及对应时长间隔内各个参考指标的预设告警阈值,确定各个参考指标的影响度。
示例性地,由于参考指标的指标值会随着时间变化而发生改变,可以对每一个时长间隔获取到的指标值设置预设告警阈值。该预设告多个不同的间隔时长对应的预设告警阈值可以相同,也可以不同。比如以一周内每一天网上购物服务的访问量为例,工作日21点访问量的预设告警阈值可以为100,休息日21点访问量的预设告警阈值可以设置为120,其他时间可以设置访问量阈值为10000。本申请实施例对对应时长间隔的参考指标的预设告警阈值不作限定,本领域技术人员可以根据实际使用需要确定。
对参考指标的影响度的确定方式可以根据不同时长间隔内参考指标的指标值与对应时长间隔内参考指标的预设告警阈值的比值来确定对应的影响度。例如以一个星期内、五个工作日20点的网上购物服务的访问量、对应的访问量预设告警阈值为10000为例进行说明.比如从周一到周五,每一天20点的访问量分别为1000、1000、5000、5000、8000。则对应的访问量与访问量预设告警阈值的比值为0.1、0.1、0.5、0.5、0.8。则可以将比值小于0.3时,对应的影响度设置为1;将比值大于0.3而小于0.7的影响度设置为2,比值大于0.7而小于1的影响度设置为3。本申请实施例对参考指标的影响度的确定方式与表征方式不作限定,比如还可以根据实际访问量与预设告警阈值的差值大小确定,本领域技术人员可以根据实际需要确定。
在步骤103中,基于指标值以及参考指标的影响度,对机器学习模型进行训练,得到影响度预测模型。
示例性地,将得到的不同间隔时长的参考指标的指标值以及对应参考指标的影响度作为机器学习模型的输入参数,对机器学习模型进行训练,得到的影响度预测模型。该影响度预测模型可以根据不同间隔时长的指标值,确定对应的参考指标的影响度。该机器学习模型可以采用逻辑回归模型训练得到。本申请实施例对机器学习模型不作限定,本领域技术人员可以根据实际训练使用需要确定。
在步骤104中,根据影响度预测模型,得到当前时刻参考指标对应的指标值区间。
示例性地,该影响度预测模型根据参考指标的指标值以及对应参考指标的影响度训练得到,故在将获取到的当前时刻的参考指标的指标值输入到影响度预测模型后,影响度预测模型可以根据输出当前时刻参考指标的影响度,根据该影响度匹配出对应的指标值区间。匹配的方式可以是预先设定并存储多个指标值区间,按照输出的影响度的大小,按照从大到小的顺序依次匹配对应的指标值区间。
在步骤105中,若当前时刻参考指标的指标值不属于指标值区间,对目标服务进行异常检测。
示例性地,获取当前时刻参考指标的指标值,将当前时刻参考指标的指标值与根据影响度预设模型得到的当前时刻对应的指标值区间进行比对。若当前时刻参考指标的指标值不属于对应的指标区间,表征当前时刻的目标服务出现运行异常。当前时刻参考指标的指标值可以按照对应时长间隔向终端发送;或者是终端按照对应时长间隔向目标服务发送数据请求,目标服务在接收到数据请求时,向终端发送参考指标的指标值。本申请实施例对当前时刻参考指标的获取方式不作限定,本领域技术人员可以根据实际需要确定。
若当前时刻参考指标的指标值不属于指标值区间时,可以触发目标服务的异常告警状态参数发生改变。当终端检测到目标服务的异常告警状态参数发生改变时,终端可以自行对目标服务进行自检;或者终端可以向相关负责人发送目标服务异常信息,以供相关负责人根据目标服务异常信息对目标服务进行异常检测。例如,若当前时刻参考指标的指标值属于指标值区间时,异常告警状态参数为“0”;当终端检测到目标服务的异常告警状态参数变为“1”时,对目标服务进行异常检测。本申请实施例对异常告警状态参数的设置方式不作限定,本领域技术人员可以根据实际需要确定。
为了便于对目标服务进行检测,该目标服务异常信息可以包括发生异常的参考指标的名称、发生异常的时间、发生异常的持续时间等。本申请实施例对目标服务异常信息不作限定,本领域技术人员可以根据实际使用需要确定目标服务异常信息中包含的内容。
本申请实施例提供的服务异常检测方法,通过获取目标历史时间段中多个时长间隔内目标服务的各个参考指标的指标值以及各个参考指标的影响度得到影响度预测模型,通过影响度预测模型得到当前时刻的指标值对应的指标值区间,在当前时刻的指标值不满足指标值区间的情况下,对目标服务进行异常检测。通过影响度预测模型,来动态确定当前时刻的指标值对应的指标值区间,从而基于所处区间来确定是否发生异常,可以及时检测到目标服务的异常情况,提高了目标服务运行的稳定性;同时也避免了目标服务异常情况的误报和漏报,节省了人工处理成本。
在本申请一个可选实施方式,在步骤101之前,如图2所示,该方法还包括:
1011,获取触发对目标服务进行异常检测的所有指标。
示例性地,触发对目标服务进行异常检测的所有指标可以是影响目标服务的业务运行状态的所有指标。例如目标服务的访问量、相关联服务的访问量、目标服务对应的服务器内存、目标服务对应的服务器处理速率、目标服务的峰值访问量、目标服务的峰值访问量持续时间。本申请实施例触发对目标服务进行异常检测的指标不作限定,本领域技术人员可以根据目标服务的类别确定。
1012,基于目标服务的类型,确定每一个指标的权重。
示例性地,由于目标服务提供的业务类型不同,使得不同的指标对不同类型的目标服务的重要程度存在差异。为了提高影响度预测模型的训练效率,可以选择对目标服务的业务运行稳定性影响较大的指标作为参考指标。每一个指标对目标服务的权重可以根据对应的指标在目标历史时间段内对目标服务的业务稳定性影响程度确定。本申请实施例对每一个指标的权重的确定方式不作限定,本领域技术人员可以根据实际需要确定。例如对于主播直播服务,相较于其他指标来说,用户的访问量最为重要,则设置的用户访问量的权重高于其他指标的权重。
1013,将权重大于目标值的指标作为参考指标。
示例性地,本申请实施例对该目标值不作限定,本领域技术人员可以根据需要选择不同的目标值来确定对应的参考指标。例如,将权重大于第一预设数值的指标作为参考指标,该第一预设数值可以是0.5。为了提高影响度预测模型的训练效率,当权重大于第一预设数值的指标较多时,可以适应性提高第一预设数值,将权重大于第二预设数值的指标作为参考指标,该第二预设数值可以是0.9。本申请实施例对第一预设数值和第二预设数值的大小不作限定,本领域技术人员可以根据实际使用需要确定。
在本申请一个可选实施方式,在步骤104中,如图3所示,包括:
1041,将当前时刻参考指标的指标值输入影响度预测模型,得到参考指标的影响度。
1042,根据参考指标的影响度,确定当前时刻参考指标对应的指标值区间,影响度预先与指标值区间相关联。
示例性地,当前时刻的参考指标在不同影响度下对应的指标值区间可以根据当前时刻的参考指标对应的预设告警阈值确定。根据影响度的不同,可以在小于参考指标的预设告警阈值的范围内,将参考指标的指标值分为多个不同的指标值区间。不同影响度对应不同的指标值区间,将不同参考指标的影响度与对应的指标值区间预先进行关联。例如,以网上购物服务的两个工作日中每天20点的访问量为例,若根据影响度预测模型得到第一个工作日的访问量对应的影响度为1,则关联的指标值区间可以设置为[4000,5000],不属于该指标值区间进行告警;第二个工作日的访问量对应的影响度为2,关联的指标值区间可以设置为[7000,8000],不属于该指标值区间进行告警。
相比于上述描述中工作日20点的访问量预设告警阈值固定为10000,根据每天同一时刻访问量的不同,动态设置不同的指标值区间,便于及时发现目标服务的运行异常情况。
作为本申请一个可选实施方式,该参考指标可以包括:目标服务的访问量、相关联服务的访问量、目标服务对应的服务器内存、目标服务对应的服务器处理速率、目标服务的峰值访问量、目标服务的峰值访问量持续时间组成的群组中的至少一个。
示例性地,目标服务对应的参考指标可以根据目标服务的运行关系确定。比如对于运行关系独立、没有其他相关联服务的目标服务,例如单一为用户提供数据查询的服务。该目标服务对应的参考指标可以包括不同时长间隔的用户对目标服务的访问量、目标服务对应的服务器内存、目标服务对应的服务器处理速率、目标服务的峰值访问量、目标服务的峰值访问量持续时间等。
对于运行关系相对复杂、需要与其它服务相关联完成提供的服务业务的目标服务,例如对于目标服务A,当用户对目标服务A发起服务请求时,目标服务A需要向相关联服务B发送数据请求,使得目标服务A对相关联服务B提供的数据进行分析处理后,向用户提供服务。则对于目标服务A来说,参考指标除了上述指标外,还可以包括相关联服务的访问量等指标作为目标服务A的参考指标。为了便于进行方案描述,本申请实施例以目标服务的访问量为例进行说明。
在本申请一个可选实施方式,在步骤104之前,该方法还包括:获取测试数据,对影响度预测模型的预测准确率进行校验;根据校验结果,对影响度预测模型的模型参数进行调整,得到满足预测准确率要求的影响度预测模型。
示例性地,该测试数据可以是与目标历史时间段处于同一时间段的其他历史指标值。比如当目标历史时间段为2017年全年的网上购物服务的访问量,则对应的测试数据可以是2018年全年的访问量。将测试数据输入到影响度预测模型,根据得到的影响度以及对应的指标值区间,确定根据影响度预测模型得到的异常检测结果与根据测试数据得到的异常检测结果是否一致。当根据影响度预测模型得到的异常检测结果的准确性不满足预测准确性要求时,对影响度预测模型的参考指标的权重等模型参数进行调整,直至达到预测准确率。
图4是根据一示例性实施例示出的一种服务异常检测装置框图。参照图4,该装置包括第一获取单元401,确定单元402、第二获取单元403、第三获取单元404以及检测单元405。
第一获取单元401,被配置为执行获取目标历史时间段中多个时长间隔内目标服务的各个参考指标的指标值;
确定单元402,被配置为执行根据指标值以及对应时长间隔内各个参考指标的预设告警阈值,确定各个参考指标的影响度;
第二获取单元403,被配置为执行基于指标值以及参考指标的影响度,对机器学习模型进行训练,得到影响度预测模型。
第三获取单元404,被配置为执行根据影响度预测模型,得到当前时刻参考指标对应的指标值区间;
检测单元405,被配置为执行若当前时刻参考指标的指标值不属于指标值区间,对目标服务进行异常检测。
本申请实施例提供的服务异常检测装置,通过获取目标历史时间段中多个时长间隔内目标服务的各个参考指标的指标值以及各个参考指标的影响度得到影响度预测模型,通过影响度预测模型得到当前时刻的指标值对应的指标值区间,在当前时刻的指标值不满足指标值区间的情况下,对目标服务进行异常检测。通过影响度预测模型,来动态确定当前时刻的指标值对应的指标值区间,从而基于所处区间来确定是否发生异常,可以及时检测到目标服务的异常情况,提高了目标服务运行的稳定性;同时也避免了目标服务异常情况的误报和漏报,节省了人工处理成本。
作为本申请一个可选实施方式,第一获取单元401,还被配置为执行获取触发对目标服务进行异常检测的所有指标;基于目标服务的类型,确定每一个指标的权重;将权重大于目标值的指标作为参考指标。
作为本申请一个可选实施方式,第三获取单元404,被配置为执行将当前时刻参考指标的指标值输入影响度预测模型,得到参考指标的影响度;根据参考指标的影响度,确定当前时刻参考指标对应的指标值区间,影响度预先与指标值区间相关联。
作为本申请一个可选实施方式,参考指标包括:目标服务的访问量、相关联服务的访问量、目标服务对应的服务器内存、目标服务对应的服务器处理速率、目标服务的峰值访问量、目标服务的峰值访问量持续时间组成的群组中的至少一个。
作为本申请一个可选实施方式,第三获取单元404,还被配置为执行获取测试数据,对影响度预测模型的预测准确率进行校验;根据校验结果,对影响度预测模型的模型参数进行调整,得到满足预测准确率要求的影响度预测模型。
关于上述实施例中的装置,其中各个单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
基于相同构思,本申请实施例还提供一种电子设备,如图5所示,所述设备包括:
处理器501;
用于存储所述处理器501可执行指令的存储器502;
其中,所述处理器被配置为执行所述命令,以实现如上述实施例所述的服务异常检测方法。处理器501和存储器502通过通信总线503连接。
应理解的是,上述处理器可以是中央处理器(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(digital signal processing,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现场可编程门阵列(field-programmable gate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者是任何常规的处理器等。值得说明的是,处理器可以是支持进阶精简指令集机器(advanced RISC machines,ARM)架构的处理器。
进一步地,在一种可选的实施例中,上述存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据。存储器还可以包括非易失性随机存取存储器。例如,存储器还可以存储设备类型的信息。
该存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用。例如,静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(dynamic random access memory,DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data dateSDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(directrambus RAM,DR RAM)。
本申请提供了一种计算机程序,当计算机程序被计算机执行时,可以使得处理器或计算机执行上述方法实施例中对应的各个步骤和/或流程。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid StateDisk)等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (12)

1.一种服务异常检测方法,其特征在于,所述方法包括:
获取目标历史时间段中多个时长间隔内目标服务的各个参考指标的指标值;
根据所述指标值以及对应时长间隔内各个所述参考指标的预设告警阈值,确定各个所述参考指标的影响度,所述影响度是由所述指标值与所述预设告警阈值之间的比值或者差值确定的;
基于所述指标值以及所述参考指标的影响度,对机器学习模型进行训练,得到影响度预测模型;
根据所述影响度预测模型,得到当前时刻所述参考指标对应的指标值区间;
若所述当前时刻所述参考指标的指标值不属于所述指标值区间,对所述目标服务进行异常检测。
2.根据权利要求1所述的方法,其特征在于,所述获取目标历史时间段中多个时长间隔内目标服务的各个参考指标的指标值之前,所述方法还包括:
获取触发对所述目标服务进行异常检测的所有指标;
基于所述目标服务的类型,确定每一个所述指标的权重;
将权重大于目标值的所述指标作为所述参考指标。
3.根据权利要求1所述的方法,其特征在于,所述根据所述影响度预测模型,得到当前时刻所述参考指标对应的指标值区间,包括:
将当前时刻所述参考指标的指标值输入所述影响度预测模型,得到所述参考指标的影响度;
根据所述参考指标的影响度,确定当前时刻所述参考指标对应的指标值区间,所述影响度预先与所述指标值区间相关联。
4.根据权利要求1所述的方法,其特征在于,所述参考指标包括:所述目标服务的访问量、相关联服务的访问量、所述目标服务对应的服务器内存、所述目标服务对应的服务器处理速率、所述目标服务的峰值访问量、所述目标服务的峰值访问量持续时间组成的群组中的至少一个。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述根据所述影响度预测模型,得到当前时刻所述参考指标对应的指标值区间之前,所述方法还包括:
获取测试数据,对所述影响度预测模型的预测准确率进行校验;
根据校验结果,对所述影响度预测模型的模型参数进行调整,得到满足预测准确率要求的所述影响度预测模型。
6.一种服务异常检测装置,其特征在于,所述装置包括:
第一获取单元,被配置为执行获取目标历史时间段中多个时长间隔内目标服务的各个参考指标的指标值;
确定单元,被配置为执行根据所述指标值以及对应时长间隔内各个所述参考指标的预设告警阈值,确定各个所述参考指标的影响度,所述影响度是由所述指标值与所述预设告警阈值之间的比值或者差值确定的;
第二获取单元,被配置为执行基于所述指标值以及所述参考指标的影响度,对机器学习模型进行训练,得到影响度预测模型;
第三获取单元,被配置为执行根据所述影响度预测模型,得到当前时刻所述参考指标对应的指标值区间;
检测单元,被配置为执行若所述当前时刻所述参考指标的指标值不属于所述指标值区间,对所述目标服务进行异常检测。
7.根据权利要求6所述的装置,其特征在于,所述第一获取单元,还被配置为执行获取触发对所述目标服务进行异常检测的所有指标;基于所述目标服务的类型,确定每一个所述指标的权重;将权重大于目标值的所述指标作为所述参考指标。
8.根据权利要求6所述的装置,其特征在于,所述第三获取单元,被配置为执行将当前时刻所述参考指标的指标值输入所述影响度预测模型,得到所述参考指标的影响度;根据所述参考指标的影响度,确定当前时刻所述参考指标对应的指标值区间,所述影响度预先与所述指标值区间相关联。
9.根据权利要求6所述的装置,其特征在于,所述参考指标包括:所述目标服务的访问量、相关联服务的访问量、所述目标服务对应的服务器内存、所述目标服务对应的服务器处理速率、所述目标服务的峰值访问量、所述目标服务的峰值访问量持续时间组成的群组中的至少一个。
10.根据权利要求6-9中任一项所述的装置,其特征在于,所述第三获取单元,还被配置为执行获取测试数据,对所述影响度预测模型的预测准确率进行校验;根据校验结果,对所述影响度预测模型的模型参数进行调整,得到满足预测准确率要求的所述影响度预测模型。
11.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至5中任一项所述的服务异常检测方法。
12.一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1至5中任一项所述的服务异常检测方法。
CN201910817527.6A 2019-08-30 2019-08-30 服务异常检测方法、装置、设备及存储介质 Active CN110535864B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910817527.6A CN110535864B (zh) 2019-08-30 2019-08-30 服务异常检测方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910817527.6A CN110535864B (zh) 2019-08-30 2019-08-30 服务异常检测方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN110535864A CN110535864A (zh) 2019-12-03
CN110535864B true CN110535864B (zh) 2022-02-25

Family

ID=68665991

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910817527.6A Active CN110535864B (zh) 2019-08-30 2019-08-30 服务异常检测方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN110535864B (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111130940A (zh) * 2019-12-26 2020-05-08 众安信息技术服务有限公司 异常数据检测方法、装置及服务器
CN111241159B (zh) * 2020-01-08 2023-07-07 山东汇贸电子口岸有限公司 确定任务执行时间的方法及装置
CN113280265B (zh) * 2020-02-20 2022-08-05 中国石油天然气股份有限公司 工况识别方法、装置、计算机设备以及存储介质
CN113535444B (zh) * 2020-04-14 2023-11-03 ***通信集团浙江有限公司 异动检测方法、装置、计算设备及计算机存储介质
CN111815129A (zh) * 2020-06-22 2020-10-23 上海申铁信息工程有限公司 一种铁路车站设备运维任务触发信息处理方法和装置
CN111880986A (zh) * 2020-07-03 2020-11-03 亚信科技(成都)有限公司 一种数据检测方法及装置
CN113780703B (zh) * 2020-09-27 2024-05-24 北京京东振世信息技术有限公司 一种指标调整方法和装置
CN112699534A (zh) * 2020-12-11 2021-04-23 北京首钢股份有限公司 一种用于生产冷轧产品的方法及装置
CN112612844B (zh) * 2020-12-18 2024-02-09 深圳前海微众银行股份有限公司 数据处理方法、装置、设备和存储介质
CN112835769A (zh) * 2021-02-24 2021-05-25 北京顶象技术有限公司 一种业务数据异常诊断方法、装置、设备及存储介质
CN113361891B (zh) * 2021-05-31 2022-07-01 北京达佳互联信息技术有限公司 数据获取方法及装置
CN113342939B (zh) * 2021-06-24 2023-02-07 中国平安人寿保险股份有限公司 数据质量监控方法、装置及相关设备
CN113590442B (zh) * 2021-06-30 2023-10-03 中国农业银行股份有限公司 一种主机性能检测方法、装置、电子设备及存储介质
CN113569970B (zh) * 2021-07-27 2024-05-03 中冶赛迪信息技术(重庆)有限公司 量化特征指标对标签影响的分析方法、***、介质和终端
CN113722177B (zh) * 2021-08-03 2024-03-29 北京达佳互联信息技术有限公司 时序指标异常检测方法、装置、***、设备及存储介质
CN113836204A (zh) * 2021-09-28 2021-12-24 安徽听见科技有限公司 接口异常检测方法、装置、电子设备和存储介质
CN113891386B (zh) * 2021-11-02 2023-06-20 中国联合网络通信集团有限公司 基站的隐性故障确定方法、装置、设备和可读存储介质
CN114301803B (zh) * 2021-12-24 2024-03-08 北京百度网讯科技有限公司 网络质量检测方法、装置、电子设备及存储介质
CN114520773B (zh) * 2022-02-16 2023-09-29 平安科技(深圳)有限公司 一种服务请求的响应方法、装置、服务器及存储介质
CN114971164B (zh) * 2022-04-13 2023-09-22 江苏禹润水务研究院有限公司 一种基于人工智能的污泥处理设备异常检测方法及***
CN116502166B (zh) * 2023-04-28 2024-02-02 天宇正清科技有限公司 一种对目标设备故障预测的方法、装置、设备和介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105610647A (zh) * 2015-12-30 2016-05-25 华为技术有限公司 一种探测业务异常的方法和服务器
CN106611023A (zh) * 2015-10-27 2017-05-03 北京国双科技有限公司 网站访问异常的检测方法及装置
CN108038040A (zh) * 2017-12-08 2018-05-15 上海市信息网络有限公司 计算机集群性能指标检测方法、电子设备及存储介质
CN108089962A (zh) * 2017-11-13 2018-05-29 北京奇艺世纪科技有限公司 一种异常检测方法、装置及电子设备
CN108920336A (zh) * 2018-05-25 2018-11-30 麒麟合盛网络技术股份有限公司 一种基于时间序列的服务异常提醒方法及装置
CN109658124A (zh) * 2018-10-24 2019-04-19 中国平安人寿保险股份有限公司 基于大数据的效果预测方法、装置、介质及电子设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106611023A (zh) * 2015-10-27 2017-05-03 北京国双科技有限公司 网站访问异常的检测方法及装置
CN105610647A (zh) * 2015-12-30 2016-05-25 华为技术有限公司 一种探测业务异常的方法和服务器
CN108089962A (zh) * 2017-11-13 2018-05-29 北京奇艺世纪科技有限公司 一种异常检测方法、装置及电子设备
CN108038040A (zh) * 2017-12-08 2018-05-15 上海市信息网络有限公司 计算机集群性能指标检测方法、电子设备及存储介质
CN108920336A (zh) * 2018-05-25 2018-11-30 麒麟合盛网络技术股份有限公司 一种基于时间序列的服务异常提醒方法及装置
CN109658124A (zh) * 2018-10-24 2019-04-19 中国平安人寿保险股份有限公司 基于大数据的效果预测方法、装置、介质及电子设备

Also Published As

Publication number Publication date
CN110535864A (zh) 2019-12-03

Similar Documents

Publication Publication Date Title
CN110535864B (zh) 服务异常检测方法、装置、设备及存储介质
US11645293B2 (en) Anomaly detection in big data time series analysis
CN107871190B (zh) 一种业务指标监控方法及装置
CN107888397B (zh) 确定故障类型的方法和装置
CN108989150B (zh) 一种登录异常检测方法及装置
CN105721187B (zh) 一种业务故障诊断方法及装置
US20170371757A1 (en) System monitoring method and apparatus
US20150371163A1 (en) Churn prediction in a broadband network
RU2017118317A (ru) Система и способ автоматического расчета кибер-риска в бизнес-критических приложениях
US20130231894A1 (en) Method and apparatus for providing battery information
CN109635564A (zh) 一种检测暴力破解行为的方法、装置、介质及设备
CN106598822B (zh) 一种用于容量评估的异常数据检测方法及装置
CN107070940B (zh) 一种从流式登录日志中判断恶意登录ip地址的方法及装置
CN111131290B (zh) 流量数据处理方法和装置
CN109859002B (zh) 产品推送方法、装置、计算机设备及存储介质
CN106603733B (zh) 路由器地址类型的识别方法及装置
EP3961404A1 (en) Method, system, and apparatus for monitoring blockchain smart contract
CN108366012B (zh) 一种社交关系建立方法、装置及电子设备
CN111539563A (zh) 一种用能安全状态预测方法、装置、服务器及存储介质
KR101953558B1 (ko) 스마트 기기 결함 관리 장치 및 방법
CN117151726A (zh) 故障的修复方法、修复装置、电子设备以及存储介质
CN112507041B (zh) 设备机型识别方法及装置、电子设备、存储介质
CN105491172B (zh) 一种用于确定网络地址的归属地信息的方法与设备
CN110138892B (zh) 确定设备地域信息的方法及装置
CN111563111A (zh) 告警方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant