CN114844798B - 云应用服务异常检测方法与装置 - Google Patents

云应用服务异常检测方法与装置 Download PDF

Info

Publication number
CN114844798B
CN114844798B CN202210776468.4A CN202210776468A CN114844798B CN 114844798 B CN114844798 B CN 114844798B CN 202210776468 A CN202210776468 A CN 202210776468A CN 114844798 B CN114844798 B CN 114844798B
Authority
CN
China
Prior art keywords
pcu
value
sequence
cloud application
normal distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210776468.4A
Other languages
English (en)
Other versions
CN114844798A (zh
Inventor
李学辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Haima Cloud Technology Co ltd
Original Assignee
Haima Cloud Tianjin Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Haima Cloud Tianjin Information Technology Co Ltd filed Critical Haima Cloud Tianjin Information Technology Co Ltd
Priority to CN202210776468.4A priority Critical patent/CN114844798B/zh
Publication of CN114844798A publication Critical patent/CN114844798A/zh
Application granted granted Critical
Publication of CN114844798B publication Critical patent/CN114844798B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Environmental & Geological Engineering (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请提供了一种云应用服务异常检测方法与装置、电子设备及存储介质,方法包括:获取云应用预设历史时间段内至少一个维度的多个峰值并发用户数PCU组成PCU数值序列,将所述PCU数值序列转换成符合标准正态分布的序列;对于所述PCU数值序列中的每一个PCU数值,若判断获知该PCU数值位于所述符合标准正态分布的序列对应的正常PCU数值区间之外,则确定该PCU数值为疑似异常值,并基于该疑似异常值确定云应用服务是否异常,能够检测云应用服务的异常。

Description

云应用服务异常检测方法与装置
技术领域
本发明涉及云应用领域,特别涉及一种云应用服务异常检测方法与装置、电子设备及存储介质。
背景技术
云应用以其不弱于本地应用的体验、简便易用、成本低廉等特性业已被广大用户所接受,作为云应用服务供应商,给每位接入的用户提供稳定、可靠的服务,保证用户整个使用过程的体验,是其立身之本,这就对复杂的云应用基础服务架构提出了巨大的挑战。但实际上云服务架构在地域分布、运营商线路、承载的应用、接入的终端等各不相同,如何服务好众多形色各异的用户,及时预测、发现并处理可能的异常,这对给用户承诺的服务质量至关重要。而当前普遍存在的问题是用户侧先于服务供应商发现并反馈了问题,特别是大批量用户被同一个问题造成的影响,严重影响服务质量;相较而言,服务供应商却有些后知后觉。这就有可能造成潜在的用户流失,并且也会使现有客户对云应用服务供应商的信任程度有所降低。
因此,如何提供一种方案,来检测云应用服务的异常,成为亟待解决的技术问题。
发明内容
针对现有技术存在的技术问题,本申请实施例提供一种云应用服务异常检测方法与装置、电子设备及存储介质。
第一方面,本申请实施例提供了一种云应用服务异常检测方法,包括:
获取云应用预设历史时间段内至少一个维度的多个峰值并发用户数PCU组成PCU数值序列,将所述PCU数值序列转换成符合标准正态分布的序列;
对于所述PCU数值序列中的每一个PCU数值,若判断获知该PCU数值位于所述符合标准正态分布的序列对应的正常PCU数值区间之外,则确定该PCU数值为疑似异常值,并基于该疑似异常值确定云应用服务是否异常。
第二方面,本申请实施例还提供了一种云应用服务异常检测装置,包括:
转换单元,用于获取云应用预设历史时间段内至少一个维度的多个峰值并发用户数PCU组成PCU数值序列,将所述PCU数值序列转换成符合标准正态分布的序列;
确定单元,用于对于所述PCU数值序列中的每一个PCU数值,若判断获知该PCU数值位于所述符合标准正态分布的序列对应的正常PCU数值区间之外,则确定该PCU数值为疑似异常值,并基于该疑似异常值确定云应用服务是否异常。
第三方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如第一方面至第二方面所述的云应用服务异常检测方法的步骤。
第四方面,本申请实施例还提供了一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如第一方面至第二方面所述的云应用服务异常检测方法的步骤。
综上,本申请实施例提供的云应用服务异常检测方法与装置、电子设备及存储介质,获取云应用预设历史时间段内至少一个维度的多个峰值并发用户数PCU组成PCU数值序列,将所述PCU数值序列转换成符合标准正态分布的序列;对于所述PCU数值序列中的每一个PCU数值,若判断获知该PCU数值位于所述符合标准正态分布的序列对应的正常PCU数值区间之外,则确定该PCU数值为疑似异常值,并基于该疑似异常值确定云应用服务是否异常,能够检测云应用服务的异常。
附图说明
图1为本申请实施例提供的一种云应用服务异常检测方法一实施例的流程示意图;
图2为本申请实施例提供的一种云应用服务异常检测装置一实施例的结构示意图;
图3为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。
在云应用中,有一项指标:PCU(Peak Concurrent Users,也即峰值并发用户数)非常关键,它是用来表明同时服务给用户的实例数量。由于云应用服务供应商全国各地数据中心广泛的实例分布、用户对不同应用的关注度差异、用户手持设备的能力以及用户所属的运营商线路等等各有不同,这导致实例的使用和分布都会有较大差异,这些最终会体现在PCU数值及分布的不同。这里的分布,指其它需要与PCU一并考虑的维度诸如接入商、应用、终端、机房、运营商线路等。
作为云应用服务供应商,通过定时获取当前一段时间的总的PCU及相关维度聚合的PCU数值,可以很方便的获知当前云应用服务情况,而通过对一段时间的PCU数值序列的分析,可进一步获知当前总体或各维度下基础设施的情况,从而实时监控各服务模块的运行质量,最终保证云应用服务的整体稳定。
本发明通过对核心指标项PCU的有效分析,发现由于云服务问题导致的PCU数值抖升或抖降,从而便于给出实时告警以便运维人员及时查找并修正问题,缩短服务不可用时间,最终确保服务整体稳定。
具体地,参照图1所示,为本申请实施例提供的一种云应用服务异常检测方法的流程示意图,可以包括:
S10、获取云应用预设历史时间段内至少一个维度的多个峰值并发用户数PCU组成PCU数值序列,将所述PCU数值序列转换成符合标准正态分布的序列;
本实施例中,需要说明的是,至少一个维度可以包括接入商、应用、终端、机房、运营商线路等。比如,可以按照某个采集时间周期(比如30秒)采集过去一段时间(比如5分钟)内某个接入商下的某款云游戏的PCU数值组成PCU数值序列,则过去5分钟内可以采集到10个PCU数值。需要说明的是,PCU数值的获取可以采用滑动窗口的方式,具体可以将采集时间周期作为滑动窗口的大小,按照时间先后顺序,每次向后滑动一个采集时间周期采集到一个新的PCU数值,将前一个PCU数值序列中去掉第一个PCU数值,并加上新采集到的PCU数值组成新的PCU数值序列。比如,以30秒作为采集周期采集过去5分钟内某个接入商下的某款云游戏的PCU数值组成PCU数值序列(记为PCU数值序列1),那么对PCU数值序列1对应的时间段向后滑动30秒即可采集到一个新的PCU数值,将PCU数值序列1中后9个PCU数值和新采集到的PCU数值组成PCU数值序列即为新的PCU数值序列(可以记为PCU数值序列2)。按照此种方法,通过依次对前一个PCU数值序列对应的时间段进行窗口滑动,并采集PCU数值可以得到PCU数值序列3、...、PCU数值序列N(其中,N为正整数)。PCU数值为云应用用户在一个给定时刻的在线人数,申请人在实施本发明的过程中发现,云应用从申请开始到云应用结束,PCU数值在统计上符合自然的正态分布,即定时获取的PCU数值是一个连续随机变量,其数值序列符合概率密度为正态分布的特征。在获取到PCU数值序列之后,可以通过预设的归一化规则将其转换成符合标准正态分布的概率密度分布,具体地,转换公式可以为转换后的PCU数值=(PCU数值-AVG)/STDEV,其中,AVG为PCU数值序列的均值,STDEV为PCU数值序列的标准差。如果PCU数值在序列中发生抖动(包括抖升或抖降),则该抖动会偏离概率密度分布规律,从而定性成异常值。因此在给定一个PCU数值序列以及合理区间的情况下,可以判定出某个PCU数值是异常值的概率,之后通过进一步研判可最终确定是否异常并反馈给告警平台以进入下一步处理。
S11、对于所述PCU数值序列中的每一个PCU数值,若判断获知该PCU数值位于所述符合标准正态分布的序列对应的正常PCU数值区间之外,则确定该PCU数值为疑似异常值,并基于该疑似异常值确定云应用服务是否异常。
本实施例中,对于所述PCU数值序列中的每一个PCU数值,需要判断该PCU数值是否位于所述符合标准正态分布的序列对应的正常PCU数值区间之外,若该PCU数值位于所述正常PCU数值区间之外,则确定该PCU数值为疑似异常值。在确定出疑似异常值后,可以通过进一步加工(包括阈值处理、多个维度对标过滤等)确定该PCU数值是否为真正异常,并在确定为真正异常时做告警处理。
本申请实施例提供的云应用服务异常检测方法,获取云应用预设历史时间段内至少一个维度的多个峰值并发用户数PCU组成PCU数值序列,将所述PCU数值序列转换成符合标准正态分布的序列;对于所述PCU数值序列中的每一个PCU数值,若判断获知该PCU数值位于所述符合标准正态分布的序列对应的正常PCU数值区间之外,则确定该PCU数值为疑似异常值,并基于该疑似异常值确定云应用服务是否异常,能够检测云应用服务的异常。
在前述方法实施例的基础上,记所述PCU数值序列为第一PCU数值序列,所述符合标准正态分布的序列的半区间为第二PCU数值序列,
其中,所述若判断获知该PCU数值位于所述符合标准正态分布的序列对应的正常PCU数值区间之外,可以包括:
计算该PCU数值的正态分布偏移量y,计算公式为y=R×σ2-abs(Abs-Std-Norm-ABS-AVG),其中,R为调参系数,σ2为所述第二PCU数值序列的方差,abs(t)表示对t取绝对值,Abs-Std-Norm=abs(该PCU数值-AVG)/STDEV,AVG为所述第一PCU数值序列的均值,STDEV为所述第一PCU数值序列的标准差,ABS-AVG为所述第二PCU数值序列的均值;
判断所述正态分布偏移量y是否为负数,若所述正态分布偏移量y为负数,则确定该PCU数值位于所述符合标准正态分布的序列对应的正常PCU数值区间之外。
本实施例中,需要说明的是,发现第一PCU数值序列中异常值的关键在于确定一个合理的区间,此区间只包含正常PCU数值,但不包含异常PCU数值,不在此区间的PCU数值即为疑似异常值。由于线上的服务质量导致的PCU数值抖变是小概率事件,通过对PCU样本数据序列的假设检验,在一个PCU数值序列里,基于PCU数值偏离正常值的概率可以确定PCU正常值概率为某一数值所对应的横轴区间约为(μ-R×σ,μ+R×σ),其中,μ为第一PCU数值序列的中值(或均值),σ为第一PCU数值序列的标准差,R即为实际工作中要调整的参数,通过调整R,以尽可能的保证找到的异常PCU值精确,减少误报同时也减少漏报。具体地,在确定出R后,对于第一PCU数值序列中的每一个PCU数值,可以通过计算该PCU数值的正态分布偏移量y,并判断y是否是负数,来确定该PCU数值是否位于正常PCU数值区间之外:若y是负数,则确定该PCU数值位于正常PCU数值区间之外,否则,则确定该PCU数值不位于正常PCU数值区间之外。比如在一个序列里,若PCU数值偏离正常值的概率为0.3%,则PCU正常值概率为99.7%所对应的横轴区间为(μ-2.75σ,μ+2.75σ),此时R约为2.75,为了避免误报综合分析后,可以设置R取值为2.8,这表明PCU数值序列99.74%的概率为正常值,则可以基于R计算第一PCU数值序列中的各个PCU数值的正态分布偏移量y,通过判断正态分布偏移量y是否为负数来确定相应的PCU数值是否位于正常PCU数值区间之外。
有时对于重点客户或重点应用要优先保障,则可以按照接入商、应用来采集PCU数值,得到一个或几个分组的PCU数值序列后,进行相应的假设检验以获得调参系数R,之后应用上述算法,最终触发的异常在精确性上已经能满足业务所需。
本实施例中,通过计算PCU数值的正态分布偏移量y,并判断正态分布偏移量y是否为负数能够准确确定该PCU数值是否位于正常PCU数值区间之外。
在前述方法实施例的基础上,R的取值范围可以为[2.6,2.9]。
在前述方法实施例的基础上,所述基于该疑似异常值确定云应用服务是否异常,可以包括:
对该疑似异常值进行过滤,并基于过滤的结果确定云应用服务是否异常,其中,过滤的维度包括PCU数值本身、接入商、应用、定购实例数量、云服务时段、机房、运营商线路、前端接入每秒请求数QPS中的至少一个。
本实施例中,需要说明的是,通过确定疑似异常值已经能在相当大的概率上捕获异常并告警,但是单纯靠算法是无法完全避免误报的,为了在告警前做精细化处理以在一定程度上避免误报,需要借助于PCU关联的重要维度对疑似异常值进行过滤,其中,PCU关联的重要维度有PCU数值本身、接入商、应用、定购实例数量、云服务时段、机房、运营商线路、前端接入每秒请求数QPS等。
对于PCU数值本身来说,当PCU数值较小时,一般来说处于业务低谷期,此时PCU小范围的抖动,被误认为异常的概率会有所增加,可以考虑对于PCU数值小于一定阈值(比如整体PCU数值序列的最大值小于100)的情况下,忽略此异常,而在其它情况时确定云应用服务异常。
对于接入商来说,可以根据接入商服务等级协议SLA及重要等级选取若干接入商进行监控告警,当PCU数值对应的接入商为选取的接入商时确定云应用服务异常。
对于云应用来说,实际上在线的实例服务的应用有上千款,但通常只会对重点客户的爆款应用进行监控,在保证绝大多数用户的云服务正常的情况下可以只针对重点应用进行监控:当PCU数值对应的应用为监控的应用时确定云应用服务异常。
对于定购实例数量来说,如果客户总的PCU数值大于其定购的实例数量,则确定云应用服务异常。
对于云服务时段来说,此维度与PCU数值正相关,通常云应用的高峰期在一天中集中在11:00-14:00以及18:00-22:00时间段,因此可以将其作为辅助维度来过滤异常PCU数值:当PCU数值对应的时间属于云应用服务的高峰时段时确定云应用服务异常。
对于机房及运营商线路来说,云应用服务的实例本身分布在全国的多个机房内,并且每个机房都有移动、联通、电信的线路,通常机房内不同线路的稳定性会有些差异,每个机房定时会有不同区域测试用户的拨测来确保连通性,同时也会上报延时情况,这一项也可作为最终异常认定前的过滤规则:可以设置机房及运营商线路黑名单,当PCU数值对应的机房、运营商线路属于黑名单时确定云应用服务异常。
对于前端接入QPS来说,为了避免在业务高峰期,并发请求对后台服务的压力,对于每个重点大客户,会进行一定的访问QPS限制,以使用户有序的、逐步的进入到云玩中,根据此QPS可以换算出单位时间进入云应用的PCU增量(比如限定100QPS,考虑从请求云服务到分配实例整个过程要5秒,每30秒PCU的增量应低于600),这样对于PCU数值序列就可以使用增量阈值进行异常的判定:当PCU数值序列中PCU数值的增量不小于增量阈值时确定云应用服务异常。
需要说明的是,以上PCU关联的重要维度可以根据实际情况调整或者选择。
参照图2所示,为本申请实施例提供的一种云应用服务异常检测装置的结构示意图,包括:
转换单元20,用于获取云应用预设历史时间段内至少一个维度的多个峰值并发用户数PCU组成PCU数值序列,将所述PCU数值序列转换成符合标准正态分布的序列;
确定单元21,用于对于所述PCU数值序列中的每一个PCU数值,若判断获知该PCU数值位于所述符合标准正态分布的序列对应的正常PCU数值区间之外,则确定该PCU数值为疑似异常值,并基于该疑似异常值确定云应用服务是否异常。
本申请实施例提供的云应用服务异常检测装置,借助于转换单元20获取云应用预设历史时间段内至少一个维度的多个峰值并发用户数PCU组成PCU数值序列,将所述PCU数值序列转换成符合标准正态分布的序列;对于所述PCU数值序列中的每一个PCU数值,若借助于确定单元21判断获知该PCU数值位于所述符合标准正态分布的序列对应的正常PCU数值区间之外,则确定该PCU数值为疑似异常值,并基于该疑似异常值确定云应用服务是否异常,能够检测云应用服务的异常。
在前述装置实施例的基础上,记所述PCU数值序列为第一PCU数值序列,所述符合标准正态分布的序列的半区间为第二PCU数值序列,
其中,所述确定单元,可以用于:
计算该PCU数值的正态分布偏移量y,计算公式为y=R×σ2-abs(Abs-Std-Norm-ABS-AVG),其中,R为调参系数,σ2为所述第二PCU数值序列的方差,abs(t)表示对t取绝对值,Abs-Std-Norm=abs(该PCU数值-AVG)/STDEV,AVG为所述第一PCU数值序列的均值,STDEV为所述第一PCU数值序列的标准差,ABS-AVG为所述第二PCU数值序列的均值;
判断所述正态分布偏移量y是否为负数,若所述正态分布偏移量y为负数,则确定该PCU数值位于所述符合标准正态分布的序列对应的正常PCU数值区间之外。
在前述装置实施例的基础上,R的取值范围可以为[2.6,2.9]。
在前述装置实施例的基础上,所述确定单元,可以用于:
对该疑似异常值进行过滤,并基于过滤的结果确定云应用服务是否异常,其中,过滤的维度包括PCU数值本身、接入商、应用、定购实例数量、云服务时段、机房、运营商线路、前端接入每秒请求数QPS中的至少一个。
如图3所示,本申请实施例提供的一种电子设备,包括:处理器30、存储器31和总线32,所述存储器31存储有所述处理器30可执行的机器可读指令,当电子设备运行时,所述处理器30与所述存储器31之间通过总线32通信,所述处理器30执行所述机器可读指令,以执行如上述云应用服务异常检测方法的步骤。
具体地,上述存储器31和处理器30能够为通用的存储器和处理器,这里不做具体限定,当处理器30运行存储器31存储的计算机程序时,能够执行上述云应用服务异常检测方法。
对应于上述云应用服务异常检测方法,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述云应用服务异常检测方法的步骤。
通过上述云应用服务异常检测方案,可以在每次事故后快速发现问题,确保作为云应用服务厂商,拥有先于客户发现问题的能力,便于迅速恢复云服务,保证云应用整体服务的稳定性,确保给客户承诺的SLA,从而得到客户的广泛信任并可吸引更多潜在的客户。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***和装置的具体工作过程,可以参考方法实施例中的对应过程,本申请中不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的***、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种云应用服务异常检测方法,其特征在于,包括:
获取云应用预设历史时间段内至少一个维度的多个峰值并发用户数PCU组成PCU数值序列,将所述PCU数值序列转换成符合标准正态分布的序列,转换公式为转换后的PCU数值=(PCU数值-AVG)/STDEV,其中,AVG为PCU数值序列的均值,STDEV为PCU数值序列的标准差;
对于所述PCU数值序列中的每一个PCU数值,若判断获知该PCU数值位于所述符合标准正态分布的序列对应的正常PCU数值区间之外,则确定该PCU数值为疑似异常值,并基于该疑似异常值确定云应用服务是否异常。
2.如权利要求1所述的方法,其特征在于,记所述PCU数值序列为第一PCU数值序列,所述符合标准正态分布的序列的半区间为第二PCU数值序列,
其中,所述若判断获知该PCU数值位于所述符合标准正态分布的序列对应的正常PCU数值区间之外,包括:
计算该PCU数值的正态分布偏移量y,计算公式为y=R×σ2-abs(Abs-Std-Norm-ABS-AVG),其中,R为调参系数,σ2为所述第二PCU数值序列的方差,abs(t)表示对t取绝对值,Abs-Std-Norm=abs(该PCU数值-AVG)/STDEV,AVG为所述第一PCU数值序列的均值,STDEV为所述第一PCU数值序列的标准差,ABS-AVG为所述第二PCU数值序列的均值;
判断所述正态分布偏移量y是否为负数,若所述正态分布偏移量y为负数,则确定该PCU数值位于所述符合标准正态分布的序列对应的正常PCU数值区间之外。
3.如权利要求2所述的方法,其特征在于,R的取值范围为[2.6,2.9]。
4.如权利要求1至3任一项所述的方法,其特征在于,所述基于该疑似异常值确定云应用服务是否异常,包括:
对该疑似异常值进行过滤,并基于过滤的结果确定云应用服务是否异常,其中,过滤的维度包括PCU数值本身、接入商、应用、定购实例数量、云服务时段、机房、运营商线路、前端接入每秒请求数QPS中的至少一个。
5.一种云应用服务异常检测装置,其特征在于,包括:
转换单元,用于获取云应用预设历史时间段内至少一个维度的多个峰值并发用户数PCU组成PCU数值序列,将所述PCU数值序列转换成符合标准正态分布的序列,转换公式为转换后的PCU数值=(PCU数值-AVG)/STDEV,其中,AVG为PCU数值序列的均值,STDEV为PCU数值序列的标准差;
确定单元,用于对于所述PCU数值序列中的每一个PCU数值,若判断获知该PCU数值位于所述符合标准正态分布的序列对应的正常PCU数值区间之外,则确定该PCU数值为疑似异常值,并基于该疑似异常值确定云应用服务是否异常。
6.如权利要求5所述的装置,其特征在于,记所述PCU数值序列为第一PCU数值序列,所述符合标准正态分布的序列的半区间为第二PCU数值序列,
其中,所述确定单元,用于:
计算该PCU数值的正态分布偏移量y,计算公式为y=R×σ2-abs(Abs-Std-Norm-ABS-AVG),其中,R为调参系数,σ2为所述第二PCU数值序列的方差,abs(t)表示对t取绝对值,Abs-Std-Norm=abs(该PCU数值-AVG)/STDEV,AVG为所述第一PCU数值序列的均值,STDEV为所述第一PCU数值序列的标准差,ABS-AVG为所述第二PCU数值序列的均值;
判断所述正态分布偏移量y是否为负数,若所述正态分布偏移量y为负数,则确定该PCU数值位于所述符合标准正态分布的序列对应的正常PCU数值区间之外。
7.如权利要求6所述的装置,其特征在于,R的取值范围为[2.6,2.9]。
8.如权利要求5至7任一项所述的装置,其特征在于,所述确定单元,用于:
对该疑似异常值进行过滤,并基于过滤的结果确定云应用服务是否异常,其中,过滤的维度包括PCU数值本身、接入商、应用、定购实例数量、云服务时段、机房、运营商线路、前端接入每秒请求数QPS中的至少一个。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至4任一项所述的云应用服务异常检测方法的步骤。
10.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至4任一项所述的云应用服务异常检测方法的步骤。
CN202210776468.4A 2022-07-04 2022-07-04 云应用服务异常检测方法与装置 Active CN114844798B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210776468.4A CN114844798B (zh) 2022-07-04 2022-07-04 云应用服务异常检测方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210776468.4A CN114844798B (zh) 2022-07-04 2022-07-04 云应用服务异常检测方法与装置

Publications (2)

Publication Number Publication Date
CN114844798A CN114844798A (zh) 2022-08-02
CN114844798B true CN114844798B (zh) 2022-10-14

Family

ID=82574547

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210776468.4A Active CN114844798B (zh) 2022-07-04 2022-07-04 云应用服务异常检测方法与装置

Country Status (1)

Country Link
CN (1) CN114844798B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103684910A (zh) * 2013-12-02 2014-03-26 北京工业大学 一种基于工业控制***网络流量的异常检测方法
CN112015971A (zh) * 2019-05-30 2020-12-01 阿里巴巴集团控股有限公司 云产品的推荐方法、装置、电子设备及计算机可读介质
CN113079143A (zh) * 2021-03-24 2021-07-06 北京锐驰信安技术有限公司 一种基于流数据的异常检测方法及***

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106909793A (zh) * 2017-03-03 2017-06-30 北京北青厚泽数据科技有限公司 检验服从近似正态分布的时间序列的异常的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103684910A (zh) * 2013-12-02 2014-03-26 北京工业大学 一种基于工业控制***网络流量的异常检测方法
CN112015971A (zh) * 2019-05-30 2020-12-01 阿里巴巴集团控股有限公司 云产品的推荐方法、装置、电子设备及计算机可读介质
CN113079143A (zh) * 2021-03-24 2021-07-06 北京锐驰信安技术有限公司 一种基于流数据的异常检测方法及***

Also Published As

Publication number Publication date
CN114844798A (zh) 2022-08-02

Similar Documents

Publication Publication Date Title
WO2021072890A1 (zh) 基于模型的流量异常监测方法、装置、设备及存储介质
CN113176978B (zh) 基于日志文件的监控方法、***、设备及可读存储介质
CN108076019B (zh) 基于流量镜像的异常流量检测方法及装置
CN109034400B (zh) 一种变电站异常量测数据预测平台***
CN106645934B (zh) 基于动态网格离群点的用电行为反窃电诊断方法和装置
CN113190423B (zh) 业务数据的监控方法、装置及***
CN108599977B (zh) 基于统计方法监控***可用性的***及方法
CN108696368B (zh) 一种网元健康状态的检测方法及设备
CN111144435A (zh) 基于lof和验证过滤框架的电能量异常数据监测方法
CN115396289B (zh) 一种故障告警确定方法、装置、电子设备及存储介质
CN111585819A (zh) 一种配网通信设备故障分析方法和***
CN114844798B (zh) 云应用服务异常检测方法与装置
CN109963292B (zh) 投诉预测的方法、装置、电子设备和存储介质
CN117194171A (zh) 一种异构云资源全景式异常检测***
CN111831515A (zh) 一种应用***运行状态监控***及其监控方法
CN111371570B (zh) 一种nfv网络的故障检测方法及装置
CN114244732A (zh) 一种NetFlow端口流量准确率核查方法及装置
CN111510443B (zh) 基于设备画像的终端监测方法和终端监测装置
CN114244685A (zh) 一种云服务中心访问异常处置***
CN113746862A (zh) 一种基于机器学习的异常流量检测方法、装置和设备
CN112256543A (zh) 一种基于流量数据感知的服务器异常行为分析与告警方法
CN102567470A (zh) ***级性能数据的处理方法及设备
CN111817923B (zh) 交换机端口流量突变的预警分析方法和装置
CN113032227B (zh) 一种异常网元检测方法、装置、电子设备及存储介质
CN110290545A (zh) 一种无线通信设备的在线保活方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20231206

Address after: Room 672, 6th Floor, Building A3A4, Zhong'an Chuanggu Science and Technology Park, No. 900 Wangjiang West Road, High tech Zone, China (Anhui) Pilot Free Trade Zone, Hefei City, Anhui Province, 230031

Patentee after: Anhui Haima Cloud Technology Co.,Ltd.

Address before: 301700 room 2d25, Building 29, No.89 Heyuan Road, Jingjin science and Technology Valley Industrial Park, Wuqing District, Tianjin

Patentee before: HAIMAYUN (TIANJIN) INFORMATION TECHNOLOGY CO.,LTD.