CN116304936A - 基于分数阶差分时序数据单点异常检测方法、装置及设备 - Google Patents

基于分数阶差分时序数据单点异常检测方法、装置及设备 Download PDF

Info

Publication number
CN116304936A
CN116304936A CN202310042992.3A CN202310042992A CN116304936A CN 116304936 A CN116304936 A CN 116304936A CN 202310042992 A CN202310042992 A CN 202310042992A CN 116304936 A CN116304936 A CN 116304936A
Authority
CN
China
Prior art keywords
regression
data
point
time
time series
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310042992.3A
Other languages
English (en)
Inventor
朱洪利
严川
张博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cloudwise Beijing Technology Co Ltd
Original Assignee
Cloudwise Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cloudwise Beijing Technology Co Ltd filed Critical Cloudwise Beijing Technology Co Ltd
Publication of CN116304936A publication Critical patent/CN116304936A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明的实施例提供一种基于分数阶差分时序数据单点异常检测方法、装置及设备,所述方法包括:获取时间序列数据;根据基于分数阶差分算子得到的回归系数,计算所述时间序列数据中目标点的均值回归;根据所述时间序列数据的均值回归和基于分数阶差分算子得到的回归系数,计算所述时间序列数据中目标点的偏差回归;根据所述均值回归和偏差回归,对所述时间序列数据进行异常检测。本发明提供的技术方案通过在异常检测中引入分数阶差分算子,处理过程中可调参数少,提高检测效率,降低处理人员工作量。

Description

基于分数阶差分时序数据单点异常检测方法、装置及设备
技术领域
本发明涉及智能运维技术领域,特别是指一种基于分数阶差分时序数据单点异常检测方法、装置及设备。
背景技术
随着信息技术的进一步发展,企业级服务器的数目越来越多,规模越来越大,若其运行出现问题可能会导致巨大的经济损失。所以对这些设备进行监控及时检测出异常是有十分必要的。服务器在运行过程中会产生大量的指标数据,例如硬盘使用率、CPU使用率、内存使用率等。数据格式为时间序列。服务的异常可以通过采集到的指标数据反映出来。根据数据异常的形态特点,异常可分为三类,分别是单点异常、上下文异常和连续性异常。其中单点异常检测的方法一般可分为三类,机器学习类算法,统计类算法,时序分解类算法。这些算法普遍具有可调参数太多导致的调参难度高的问题,影响工作效率。
发明内容
本发明提供了一种基于分数阶差分时序数据单点异常检测方法、装置及设备,可大大减少可调参数的个数,以提高时间序列数据的异常数据点的检测效率,降低工作量。
为解决上述技术问题,本发明的实施例提供一种基于分数阶差分时序数据单点异常检测方法,包括:
获取时间序列数据;
根据基于分数阶差分算子得到的回归系数,计算所述时间序列数据中目标点的均值回归;
根据所述时间序列数据的均值回归和基于分数阶差分算子得到的回归系数,计算所述时间序列数据中目标点的偏差回归;
根据所述均值回归和偏差回归,对所述时间序列数据进行异常检测。
可选的,所述时间序列数据为:Xt={x1,x2,…xt…,xn},xt为t时间点的数据,n为正整数;
分数阶差分算子为:
Figure SMS_1
其中,L表示延迟算子,
Figure SMS_2
Figure SMS_3
表示伽马函数,/>
Figure SMS_4
j=0,1,2,3…,r为分数阶差分阶数。
可选的,根据基于分数阶差分算子得到的回归系数,计算所述时间序列数据中目标点的均值回归,包括:
根据分数阶差分算子和设定的回归阶数,计算回归系数;
根据所述回归系数,计算所述时间序列数据中目标点的均值回归。
可选的,根据分数阶差分算子和设定的回归阶数,计算回归系数,包括:
通过
Figure SMS_5
,/>
Figure SMS_6
计算回归系数,所述回归系数为:/>
Figure SMS_7
,j=1,2,…,i,s为归一系数;
其中,r为分数阶差分阶数,i为回归阶数,
Figure SMS_8
表示伽马函数。
可选的,根据所述回归系数,计算所述时间序列数据中目标点的均值回归,包括:
通过
Figure SMS_9
对t时刻均值进行回归,得到所述时间序列数据的均值回归mt
可选的,根据所述时间序列数据的均值回归和基于分数阶差分算子得到的回归系数,计算所述时间序列数据中目标点的偏差回归,包括:
通过
Figure SMS_10
计算所述时间序列数据的偏差回归/>
Figure SMS_11
其中,dt为t时间点的数据的偏差回归,
Figure SMS_12
,j=1,…,i;
Figure SMS_13
为t-j时间点的数据,/>
Figure SMS_14
表示t-j时间点的数据的均值回归;/>
Figure SMS_15
Figure SMS_16
表示伽马函数,r表示分数阶差分阶数。
可选的,根据所述均值回归和偏差回归,对所述时间序列数据进行异常检测,包括:
如果
Figure SMS_17
,则所述时间序列数据中的t时间点对应的数据点为正常数据点,否则,识别所述时间序列数据中的t时间点对应的数据点为异常数据点;其中,k为敏感度参数,/>
Figure SMS_18
为t时间点的数据的均值回归,dt为t时间点的数据的偏差回归。
本发明的实施例还提供一种基于分数阶差分时序数据单点异常检测装置,所述装置包括:
获取模块,用于获取时间序列数据;
处理模块,用于根据基于分数阶差分算子得到的回归系数,计算所述时间序列数据中目标点的均值回归;根据所述时间序列数据的均值回归和基于分数阶差分算子得到的回归系数,计算所述时间序列数据中目标点的偏差回归;根据所述均值回归和偏差回归,对所述时间序列数据进行异常检测。
本发明的实施例还提供一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述所述的方法对应的操作。
本发明的实施例还提供一种计算机可读存储介质,存储有指令,所述指令在计算机上运行时,使得计算机执行上述所述的方法。
本发明的上述方案至少包括以下有益效果:
本发明的上述方案,在时间序列数据检测中,利用基于分数阶差分算子得到的回归系数,计算时间序列数据中目标点的均值回归,并根据时间序列数据的均值回归和基于分数阶差分算子得到的回归系数,计算时间序列数据中目标点的偏差回归;依据据所述均值回归和偏差回归,判断时间序列数据中数据点的异常或正常状态,通过引入分数阶差分算子,减少计算过程中可调参数的设置,同时设置的可调参数也便于计算,进一步提高计算效率,降低检测的工作量。
附图说明
图1为本发明实施例提供的时序数据的异常检测方法的流程示意图;
图2为本发明实施例提供的一具体异常检测结果图;
图3为本发明实施例提供的另一具体异常检测结果图;
图4为本发明实施例提供的时序数据的异常检测装置的模块示意图。
实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
如图1所示,本发明的实施例提供一种时序数据的异常检测方法,所述方法包括:
步骤11,获取单指标时间序列数据,数据为从服务器采集到的单指标数据(例如硬盘使用率,CPU使用率,内存使用率等),格式为时间序列,即数据中数据点按时间顺序等间隔排列;
步骤12,根据基于分数阶差分算子得到的回归系数,计算所述时间序列数据中目标点的均值回归;
步骤13,根据所述时间序列数据的均值回归和基于分数阶差分算子得到的回归系数,计算所述时间序列数据中目标点的偏差回归;
步骤14,根据所述均值回归和偏差回归,对所述时间序列数据进行异常检测。
该实施例中,所述时间序列数据中每个数据均为单一指标数据,所述均值回归是当前待检测数据点之前时刻的所有数据点的均值回归,所述偏差回归是当前待检测数据点之前时刻的所有数据点的偏差回归;在计算所述时间序列数据的均值回归之前,可以根据分数阶差分算子,构造一预设单点时间序列数据的回归模型,基于所述回归模型,并根据所述分数阶差分算子,计算获取的所述时间序列数据的均值回归,保证计算均值回归的准确性及有效性,同时基于分数阶差分算子,在建立回归模型以及后续计算时,只需设定分数阶差分的阶数这一个参数,与现有方案相比参数设定少;
根据所述均值回归,计算所述时间序列数据的偏差回归,所述偏差回归是对当前待检测数据点之前时刻的所有数据点的真实回归偏差进行回归后得到的,所述真实回归偏差是当前待检测数据点之前时刻的数据点的真实指标数据值与所述均值回归的差值的绝对值;根据所述真实回归偏差获取当前待检测数据点的偏差回归;
根据预设的参数、所述均值回归以及所述偏差回归,判断所述时间序列数据中当前时刻数据点的状态,该方案的整个处理过程中,设定参数的个数少且简便易行,降低数据处理的工作量,提高检测效率;优选的,重复执行步骤12、步骤13以及步骤14即可完成对整个时间序列数据的异常检测。
本发明的一可选实施例中,所述时间序列数据为:Xt={x1,x2,…xt…,xn},xt为t时间点的硬盘使用率数据,n为正整数;下表1示出Xt中的6个数据作为示例对本实施例进行示例性描述。
表1
序号 时间点t 硬盘使用率X
1 16:00 60%
2 16:01 60%
3 16:02 62%
4 16:03 61%
5 16:04 60%
6 16:05 90%
…… …… ……
后面基于示出的该些具体数据进行处理,每一个处理步骤得到具体的处理结果,例如取r=0.5,k=3时,根据分数阶差分可得到未归一化的回归系数为(0.5, 0.125, 0.063,0.039, 0.027),根据以上回归系数计算得到的均值回归mt为{0.60, 0.60, 0.60, 0.61,0.61,0.60},而后计算得到的偏差序列为{0.00, 0.02, 0.00, 0.01,0.30}:偏差回归dt为{0.00, 0.00,0.00,0.01, 0.01, 0.01},根据异常判别方法,可以判定6号数据点出现了异常,因为6号数据点取值为0.9,均值回归为0.6,偏差回归为0.01,取值不再区间(0.6-3*0.01, 0.6+3*0.01)之内;从而可以检测出服务器的硬盘使用率在这一时刻发生异常。
由上述实施例可知,本发明的方法只需设定分数阶差分的阶数和敏感参数k这两个参数,即可得到异常数据点。如果采取不用分数阶差分的回归方法而采用普通回归方法,本例中则需要回归系数(a1, a2, a3, a4, a5)以及敏感参数k共6个参数。如果数据更长,所需参数更多。
分数阶差分算子为:
Figure SMS_19
其中,L表示延迟算子,
Figure SMS_20
Figure SMS_21
表示伽马函数,/>
Figure SMS_22
j=0,1,2,3…=,r为分数阶差分算子,该实施例中,所述分数阶差分阶数r参数的取值一般为0到1之间,优选的,根据分数阶差分算子可以构造时间序列数据的分数阶回归模型:
Figure SMS_23
其中
Figure SMS_24
是均值为0,方差为σ2的随机变量,一般假设其为正态分布即:
Figure SMS_25
进一步得到:
Figure SMS_26
Figure SMS_27
,则上式可简化地写为:/>
Figure SMS_28
利用上式可实现对X t 的一个回归,在给定分数阶0.5时,可以得到一套回归系数,将回归系数截断到有限长度并用于时间序列数据的异常检测,检测得到序号6为异常,耗时0.01毫秒,而如果采用普通的回归检测方法,同样检测到序号3为异常,耗时0.04毫秒,对比可知,本发明的方法耗时更短,提高了检测效率。
本发明的一可选实施例中,所述步骤12,可以包括:
步骤121,根据分数阶差分算子和设定的回归阶数,计算回归系数;
步骤122,根据所述回归系数,计算所述时间序列数据中目标点的均值回归。
该实施例中,所述回归阶数可以根据实际需要进行设置,根据分数阶差分算子构造的时间序列数据的分数阶回归模型,以及设定的回归阶数,获得回归系数,进一步根据所述回归系数,计算所述时间序列数据的均值回归,在此计算过程中,无需再设定其他参数,计算简便。
本发明的一可选实施例中,所述步骤121,根据分数阶差分算子和设定的回归阶数,计算回归系数,包括:
通过公式
Figure SMS_29
,/>
Figure SMS_30
计算得到回归系数,所述回归系数为:/>
Figure SMS_31
,j=1,2,…,i,s为归一系数;
其中,r为分数阶差分阶数,n为回归阶数,
Figure SMS_32
表示伽马函数。该实施例中,分数阶差分阶数r为设定参数,回归阶数in是根据实际时间序列数据的情况进行截取的,一般为定值,s为归一系数。
本发明的一可选实施例中,所述步骤本122,根据所述回归系数,计算所述时间序列数据的均值回归,包括:
通过公式
Figure SMS_33
对t时刻均值进行回归,得到所述时间序列数据的均值回归mt
该实施例中,在计算公式中引入归一系数,保证回归均值的无偏差型;所述均值回归mt为当前待检测的t时间点对应的数据点之前时刻的所有数据点的均值的回归,其中,j表示延迟j个时间点。
本发明的一可选实施例中,所述步骤13,可以包括:
步骤131,通过
Figure SMS_34
计算所述时间序列数据的偏差回归/>
Figure SMS_35
其中,dt为t时间点的数据的偏差回归,
Figure SMS_36
,j=1,…,i,
Figure SMS_37
为t-j时间点的数据,/>
Figure SMS_38
表示t-j时间点的数据的均值回归;
Figure SMS_39
;/>
Figure SMS_40
表示伽马函数,r表示分数阶差分阶数。
该实施例中,
Figure SMS_41
为时间序列数据中t-j时间点对应的已知实际数据,/>
Figure SMS_42
表示t-j时间点的数据的均值回归;dt为当前待检测t时间点对应的数据的偏差回归,S为归一系数,在实际检测数据状态的过程中,当前待检测数据的偏差值是未知的,依据当前待检测数据之前时刻的数据的均值回归,与当前待检测数据之前时刻的数据的实际数据值的差值,并对所述差值取绝对值即得到当前待检测数据之前时刻的数据的偏差绝对值,也即是
Figure SMS_43
,对所述偏差绝对值进行回归处理,获得当前待检测数据的偏差回归。
本发明的一可选实施例中,所述步骤14,可以包括:
步骤141,如果
Figure SMS_44
,则所述时间序列数据中的t时间点数据为正常,否则,识别所述时间序列数据中的t时间点数据为异常;其中,k为敏感度参数。
该实施例中,
Figure SMS_45
为当前待检测t时间点对应的数据;dt为当前待检测t时间点对应的数据的偏差回归;/>
Figure SMS_46
为当前待检测t时间点对应的数据的均值回归,根据设定的敏感度参数,若当前待检测t时间点对应的数据/>
Figure SMS_47
,满足/>
Figure SMS_48
该关系,则检测当前数据为正常点,否则为异常点;该实施例中k为根据时间序列数据的回归模型的实际需求设定的敏感度参数,其中k值越大模型对异常数据点就越敏感,k值越小模型对异常数据点就越不敏感。本申请的方案中,应用分数阶差分算子进行异常检测,可以在保证模型有效的情况下大大减少模型的参数,使得调参变得更加简便易行。只需调节分数阶差分阶数r,回归阶数i,以及敏感度k,其中回归阶数i的值一般是固定的,所以在实际操作中只需调整分数阶差分阶数r值和敏感度k值即可。
如图2至图3所示,以分数阶r=0.5,敏感度参数k=10,回归阶数i按实际需求取值为100,对实际运维数据进行异常检测,得出的实验结果,如图中箭头标示所示,即为检测到的异常点;可见,基于分数阶差分的异常检测算法在各类运维时序数据上均有很好的结果,同时可以有效地捕捉数据中的异常点。
如图4所示,本发明的实施例还提供一种基于分数阶差分时序数据单点异常检测装置,所述装置40包括:
获取模块41,用于获取时间序列数据;
处理模块42,用于根据基于分数阶差分算子得到的回归系数,计算所述时间序列数据中目标点的均值回归;根据所述时间序列数据的均值回归和基于分数阶差分算子得到的回归系数,计算所述时间序列数据中目标点的偏差回归;根据所述均值回归和偏差回归,对所述时间序列数据进行异常检测。
可选的,所述时间序列数据为:Xt={x1,x2,…xt…,xn},xt为t时间点的数据,n为正整数;
分数阶差分算子为:
Figure SMS_49
其中,L表示延迟算子,
Figure SMS_50
Figure SMS_51
表示伽马函数,/>
Figure SMS_52
j=0,1,2,3…,r为分数阶差分阶数。
可选的,所述处理模块42,根据基于分数阶差分算子得到的回归系数,计算所述时间序列数据中目标点的均值回归,包括:
根据分数阶差分算子和设定的回归阶数,计算回归系数;
根据所述回归系数,计算所述时间序列数据中目标点的均值回归。
可选的,所述处理模块42,根据分数阶差分算子和设定的回归阶数,计算回归系数,包括:
通过
Figure SMS_53
,/>
Figure SMS_54
计算回归系数,所述回归系数为:/>
Figure SMS_55
,j=1,2,…,i,s为归一系数;
其中,r为分数阶差分阶数,i为回归阶数,
Figure SMS_56
表示伽马函数。
可选的,所述处理模块42,根据所述回归系数,计算所述时间序列数据中目标点的均值回归,包括:
通过
Figure SMS_57
对t时刻均值进行回归,得到所述时间序列数据的均值回归mt
可选的,所述处理模块42,根据所述时间序列数据的均值回归和基于分数阶差分算子得到的回归系数,计算所述时间序列数据中目标点的偏差回归,包括:
通过
Figure SMS_58
计算所述时间序列数据的偏差回归/>
Figure SMS_59
其中,dt为t时间点的数据的偏差回归,
Figure SMS_60
,j=1,…,i;
Figure SMS_61
为t-j时间点的数据,/>
Figure SMS_62
表示t-j时间点的数据的均值回归;
Figure SMS_63
;/>
Figure SMS_64
表示伽马函数,r表示分数阶差分阶数。
可选的,所述处理模块42,根据所述均值回归和偏差回归,对所述时间序列数据进行异常检测,包括:
如果
Figure SMS_65
,则所述时间序列数据中的t时间点对应的数据点为正常数据点,否则,识别所述时间序列数据中的t时间点对应的数据点为异常数据点;其中,k为敏感度参数,/>
Figure SMS_66
为t时间点的数据的均值回归,dt为t时间点的数据的偏差回归。
需要说明的是,该装置是与上述方法对应的装置,上述方法实施例中的所有实现方式均适用于该装置的实施例中,也能达到相同的技术效果。
本发明的实施例还提供一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如上所述的方法对应的操作。
本发明的实施例还提供一种计算机可读存储介质,存储有指令,所述指令在计算机上运行时,使得计算机执行如上所述的方法。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
此外,需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行,某些步骤可以并行或彼此独立地执行。对本领域的普通技术人员而言,能够理解本发明的方法和装置的全部或者任何步骤或者部件,可以在任何计算装置(包括处理器、存储介质等)或者计算装置的网络中,以硬件、固件、软件或者它们的组合加以实现,这是本领域普通技术人员在阅读了本发明的说明的情况下运用他们的基本编程技能就能实现的。
因此,本发明的目的还可以通过在任何计算装置上运行一个程序或者一组程序来实现。所述计算装置可以是公知的通用装置。因此,本发明的目的也可以仅仅通过提供包含实现所述方法或者装置的程序代码的程序产品来实现。也就是说,这样的程序产品也构成本发明,并且存储有这样的程序产品的存储介质也构成本发明。显然,所述存储介质可以是任何公知的存储介质或者将来所开发出来的任何存储介质。还需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行。某些步骤可以并行或彼此独立地执行。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种基于分数阶差分时序数据单点异常检测方法,其特征在于,包括:
获取时间序列数据;
根据基于分数阶差分算子得到的回归系数,计算所述时间序列数据中目标点的均值回归;
根据所述时间序列数据的均值回归和基于分数阶差分算子得到的回归系数,计算所述时间序列数据中目标点的偏差回归;
根据所述均值回归和偏差回归,对所述时间序列数据进行异常检测。
2.根据权利要求1所述的基于分数阶差分时序数据单点异常检测方法,其特征在于,所述时间序列数据为:Xt={x1,x2,…xt…,xn},xt为t时间点的数据,n为正整数;
分数阶差分算子为:
Figure QLYQS_1
其中,L表示延迟算子,
Figure QLYQS_2
Figure QLYQS_3
表示伽马函数,/>
Figure QLYQS_4
j=0,1,2,3…,r为分数阶差分阶数。
3.根据权利要求1所述的基于分数阶差分时序数据单点异常检测方法,其特征在于,根据基于分数阶差分算子得到的回归系数,计算所述时间序列数据中目标点的均值回归,包括:
根据分数阶差分算子和设定的回归阶数,计算回归系数;
根据所述回归系数,计算所述时间序列数据中目标点的均值回归。
4.根据权利要求3所述的基于分数阶差分时序数据单点异常检测方法,其特征在于,根据分数阶差分算子和设定的回归阶数,计算回归系数,包括:
通过
Figure QLYQS_5
,/>
Figure QLYQS_6
计算回归系数,所述回归系数为:/>
Figure QLYQS_7
,j=1,2,…,i,s为归一系数;
其中,r为分数阶差分阶数,i为回归阶数,
Figure QLYQS_8
表示伽马函数。
5.根据权利要求4所述的基于分数阶差分时序数据单点异常检测方法,其特征在于,根据所述回归系数,计算所述时间序列数据中目标点的均值回归,包括:
通过
Figure QLYQS_9
对t时刻均值进行回归,得到所述时间序列数据的均值回归mt
6.根据权利要求5所述的基于分数阶差分时序数据单点异常检测方法,其特征在于,根据所述时间序列数据的均值回归和基于分数阶差分算子得到的回归系数,计算所述时间序列数据中目标点的偏差回归,包括:
通过
Figure QLYQS_10
计算所述时间序列数据的偏差回归/>
Figure QLYQS_11
其中,dt为t时间点的数据的偏差回归,
Figure QLYQS_12
,j=1,…,i;/>
Figure QLYQS_13
为t-j时间点的数据,/>
Figure QLYQS_14
表示t-j时间点的数据的均值回归;/>
Figure QLYQS_15
;/>
Figure QLYQS_16
表示伽马函数,r表示分数阶差分阶数。
7.根据权利要求1所述的基于分数阶差分时序数据单点异常检测方法,其特征在于,根据所述均值回归和偏差回归,对所述时间序列数据进行异常检测,包括:
如果
Figure QLYQS_17
,则所述时间序列数据中的t时间点对应的数据点为正常数据点,否则,识别所述时间序列数据中的t时间点对应的数据点为异常数据点;其中,k为敏感度参数,/>
Figure QLYQS_18
为t时间点的数据的均值回归,dt为t时间点的数据的偏差回归。
8.一种基于分数阶差分时序数据单点异常检测装置,其特征在于,所述装置包括:
获取模块,用于获取时间序列数据;
处理模块,用于根据基于分数阶差分算子得到的回归系数,计算所述时间序列数据中目标点的均值回归;根据所述时间序列数据的均值回归和基于分数阶差分算子得到的回归系数,计算所述时间序列数据中目标点的偏差回归;根据所述均值回归和偏差回归,对所述时间序列数据进行异常检测。
9.一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的方法对应的操作。
10.一种计算机可读存储介质,其特征在于,存储有指令,所述指令在计算机上运行时,使得计算机执行如权利要求1至7任一项所述的方法。
CN202310042992.3A 2022-01-26 2023-01-28 基于分数阶差分时序数据单点异常检测方法、装置及设备 Pending CN116304936A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2022100884011 2022-01-26
CN202210088401.1A CN114117354A (zh) 2022-01-26 2022-01-26 一种时序数据的异常检测方法、装置及设备

Publications (1)

Publication Number Publication Date
CN116304936A true CN116304936A (zh) 2023-06-23

Family

ID=80361085

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202210088401.1A Pending CN114117354A (zh) 2022-01-26 2022-01-26 一种时序数据的异常检测方法、装置及设备
CN202310042992.3A Pending CN116304936A (zh) 2022-01-26 2023-01-28 基于分数阶差分时序数据单点异常检测方法、装置及设备

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202210088401.1A Pending CN114117354A (zh) 2022-01-26 2022-01-26 一种时序数据的异常检测方法、装置及设备

Country Status (1)

Country Link
CN (2) CN114117354A (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117313957B (zh) * 2023-11-28 2024-02-27 威海华创软件有限公司 基于大数据分析的生产流水任务量智能预测方法

Also Published As

Publication number Publication date
CN114117354A (zh) 2022-03-01

Similar Documents

Publication Publication Date Title
WO2021179572A1 (zh) 运维***异常指标检测模型优化方法、装置及存储介质
US20160369777A1 (en) System and method for detecting anomaly conditions of sensor attached devices
CN111459700A (zh) 设备故障的诊断方法、诊断装置、诊断设备及存储介质
EP4160342A1 (en) Abnormal modulation cause identification device, abnormal modulation cause identification method, and abnormal modulation cause identification program
JP6777142B2 (ja) システム分析装置、システム分析方法、及び、プログラム
EP3761133A1 (en) Diagnosis device and diagnosis method
CN109308225B (zh) 一种虚拟机异常检测方法、装置、设备及存储介质
CN116304936A (zh) 基于分数阶差分时序数据单点异常检测方法、装置及设备
CN113657454A (zh) 基于自回归BiGRU的核电旋转机械状态监测方法
EP4160339A1 (en) Abnormality/irregularity cause identifying apparatus, abnormality/irregularity cause identifying method, and abnormality/irregularity cause identifying program
CN113988325A (zh) 一种电力***故障预警方法、装置、终端设备及存储介质
CN111796233A (zh) 双母线接线形式下多台电压互感器继发性误差的评估方法
CN112202630A (zh) 一种基于无监督模型的网路质量异常检测方法及装置
CN114020598B (zh) 一种时间序列数据的异常检测方法、装置及设备
CN111488947A (zh) 电力***设备的故障检测方法与装置
EP4160341A1 (en) Abnormal modulation cause identifying device, abnormal modulation cause identifying method, and abnormal modulation cause identifying program
KR101960755B1 (ko) 미취득 전력 데이터 생성 방법 및 장치
CN111623905B (zh) 风电机组轴承温度预警方法及装置
CN111581044A (zh) 集群优化方法、装置、服务器及介质
CN113052272A (zh) 一种异常检测方法、装置、电子设备及存储介质
CN116448062B (zh) 一种桥梁沉降变形检测方法、装置、计算机及存储介质
EP4160340A1 (en) Abnormal modulation cause identifying device, abnormal modulation cause identifying method, and abnormal modulation cause identifying program
WO2019060314A1 (en) APPARATUS AND METHOD FOR INTRODUCING PROBABILITY AND UNCERTAINTY IN CLASSIFICATION OF DATA NOT SUPERVISED BY GROUPING, THROUGH CLASSIFICATION STATISTICS
CN113761034B (zh) 一种数据处理方法及其装置
CN116150666B (zh) 储能***故障检测方法、装置及智能终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination