CN109871401A - 一种时间序列异常检测方法及装置 - Google Patents

一种时间序列异常检测方法及装置 Download PDF

Info

Publication number
CN109871401A
CN109871401A CN201811603934.9A CN201811603934A CN109871401A CN 109871401 A CN109871401 A CN 109871401A CN 201811603934 A CN201811603934 A CN 201811603934A CN 109871401 A CN109871401 A CN 109871401A
Authority
CN
China
Prior art keywords
data
feature
labeled data
preset
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811603934.9A
Other languages
English (en)
Other versions
CN109871401B (zh
Inventor
张顺龙
王占一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qax Technology Group Inc
Original Assignee
Beijing Qianxin Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qianxin Technology Co Ltd filed Critical Beijing Qianxin Technology Co Ltd
Priority to CN201811603934.9A priority Critical patent/CN109871401B/zh
Publication of CN109871401A publication Critical patent/CN109871401A/zh
Application granted granted Critical
Publication of CN109871401B publication Critical patent/CN109871401B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明实施例提供一种时间序列异常检测方法及装置,所述方法包括:获取包含有标注数据的标注数据集合;获取所述标注数据集合中的各标注数据分别对应的特征组合集合;并根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据;在所有候选数据中提取可用于优化预设模型的目标数据;根据所有目标数据,确定对所述预设模型的优化处理策略;以通过优化处理过的预设模型对待检测时间序列进行异常检测。所述装置执行上述方法。本发明实施例提供的方法及装置,能够提高时间序列异常检测的适用性。

Description

一种时间序列异常检测方法及装置
技术领域
本发明实施例涉及时间序列技术领域,具体涉及一种时间序列异常检测方法及装置。
背景技术
时间序列,是指将同一统计指标的数值按时间先后顺序排列得到的数值序列(例如:某服务器每小时的网络吞吐量、某网站每分钟的访问次数等)。时间序列异常检测,是指检测时间序列中某个数值或者某个数值子序列是否偏离了正常模式。
现有检测时间序列是否异常的方法,主要是利用统计或者机器学习算法进行异常检测,普遍存在如下缺陷:(1)针对特定场景或者具有相似异常模式的某一类检测对象分别建立模型,通用性不强;(2)误报率和漏报率都较高;(3)需要人工对较多的待检测时间序列进行标注,效率低下。
因此,如何避免上述缺陷,能够提高时间序列异常检测的适用性,成为亟须解决的问题。
发明内容
针对现有技术存在的问题,本发明实施例提供一种时间序列异常检测方法及装置。
第一方面,本发明实施例提供一种时间序列异常检测方法,所述方法包括:
获取包含有标注数据的标注数据集合;所述标注数据是经过确认的、在时间序列检测结果中存在错误的对应数据;
获取所述标注数据集合中的各标注数据分别对应的特征组合集合;并根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据;
在所有候选数据中提取可用于优化预设模型的目标数据;其中,所述预设模型包括用于生成误判规则的第一预设模型和用于检测时间序列是否异常的第二预设模型;
根据所有目标数据,确定对所述预设模型的优化处理策略;以通过优化处理过的预设模型对待检测时间序列进行异常检测。
第二方面,本发明实施例提供一种时间序列异常检测装置,所述装置包括:
第一获取单元,用于获取包含有标注数据的标注数据集合;所述标注数据是经过确认的、在时间序列检测结果中存在错误的对应数据;
第二获取单元,用于获取所述标注数据集合中的各标注数据分别对应的特征组合集合;并根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据;
提取单元,用于在所有候选数据中提取可用于优化预设模型的目标数据;其中,所述预设模型包括用于生成误判规则的第一预设模型和用于检测时间序列是否异常的第二预设模型;
检测单元,用于根据所有目标数据,确定对所述预设模型的优化处理策略;以通过优化处理过的预设模型对待检测时间序列进行异常检测。
第三方面,本发明实施例提供一种电子设备,包括:处理器、存储器和总线,其中,
所述处理器和所述存储器通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如下方法:
获取包含有标注数据的标注数据集合;所述标注数据是经过确认的、在时间序列检测结果中存在错误的对应数据;
获取所述标注数据集合中的各标注数据分别对应的特征组合集合;并根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据;
在所有候选数据中提取可用于优化预设模型的目标数据;其中,所述预设模型包括用于生成误判规则的第一预设模型和用于检测时间序列是否异常的第二预设模型;
根据所有目标数据,确定对所述预设模型的优化处理策略;以通过优化处理过的预设模型对待检测时间序列进行异常检测。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,包括:
所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如下方法:
获取包含有标注数据的标注数据集合;所述标注数据是经过确认的、在时间序列检测结果中存在错误的对应数据;
获取所述标注数据集合中的各标注数据分别对应的特征组合集合;并根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据;
在所有候选数据中提取可用于优化预设模型的目标数据;其中,所述预设模型包括用于生成误判规则的第一预设模型和用于检测时间序列是否异常的第二预设模型;
根据所有目标数据,确定对所述预设模型的优化处理策略;以通过优化处理过的预设模型对待检测时间序列进行异常检测。
本发明实施例提供的时间序列异常检测方法及装置,通过获取与更新标注对应的各标注数据相似的候选数据、并基于候选数据提取目标数据,再根据目标数据确定对预设模型的优化处理策略,通过优化过的预设模型检测时间序列,能够提高时间序列异常检测的适用性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例时间序列异常检测方法流程示意图;
图2为基于模块化设计的实现本发明实施例的方法的示意图;
图3为本发明实施例对预设模型的优化处理流程图;
图4为本发明另一实施例时间序列异常检测方法流程示意图;
图5为本发明实施例时间序列异常检测装置结构示意图;
图6为本发明实施例提供的电子设备实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了便于理解,先对本发明实施例涉及的部分名词作简要说明,如表1所示:
表1
图1为本发明实施例时间序列异常检测方法流程示意图,如图1所示,本发明实施例提供的一种时间序列异常检测方法,包括以下步骤:
S101:获取包含有标注数据的标注数据集合;所述标注数据是经过确认的、在时间序列检测结果中存在错误的对应数据。
具体的,装置获取包含有标注数据的标注数据集合;所述标注数据是经过确认的、在时间序列检测结果中存在错误的对应数据。装置可以理解为执行该方法的设备等。标注数据可以是经过业务人员确认的、每次确认的批量标注数据组成标注数据集合。对时间序列说明如下:对某网页以10分钟为窗口的访客量进行计数统计,考虑时间因素可以得到序列[(2018-08-07 09:10:00,34),(2018-08-0709:20:00,12),(2018-08-07 09:30:00,67),(2018-08-07 09:40:00,34),……,(2018-08-07 10:10:00,2)],如果不考虑时间因素可以得到序列:[34,12,67,34,.....,2]、以时间序列[34,12,67,34,.....,2]为例,检测结果为[0,0,0,1,.....,0],业务人员确认时间序列中“2”对应的检测结果“0”存在错误,则将2018-08-07 10:10:00的该网页的访客量作为标注数据。然后,该方法自动识别该标注数据的标注类型。标注类型可以包括漏报点、误报点等。
S102:获取所述标注数据集合中的各标注数据分别对应的特征组合集合;并根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据。
具体的,装置获取所述标注数据集合中的各标注数据分别对应的特征组合集合;并根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据。获取候选数据的具体步骤可以包括:
获取每种标注类型对应的各目标标注数据。即可以将为漏报点的一类标注数据作为一类目标标注数据;将为误报点的一类标注数据作为另一类目标标注数据。
对数据集中的数据进行初筛选,以获取需保留的备选数据;数据集可以是整个数据库中所有数据组成的集合,初筛选可以是对所有数据进行过滤,过滤掉明显不合格的数据,例如缺失字段的数据等。
根据所述预设特征组合匹配所有备选数据分别对应的待匹配特征组合集合。预设特征组合可以表示为:
G={(F1,dfunc1),(F2,dfunc2),...(Fi,dfunci)...,(Fm,dfuncm)}
其中表示特征集F的一个子集;dfunci表示应用于特征组合Fi上的距离函数,对于由连续变量组成的特征组合,dfunci可以是欧式距离、余弦距离等,对于类别特征,dfunci采用jaccard相似性衡量,对于包含两类特征的特征组合,dfunci采用二者的加权和衡量。即每个备选数据对应上述m个特征组合,m个特征组合组成待匹配特征组合集合。
根据所有待匹配特征组合集合、所有特征组合集合和预设相似度度量函数,计算所有备选数据与各目标标注数据之间的第一相似度。具体说明如下:
1)确定标注数据集合trX在特征组合G上的组合特征集XG,
XG={xg11,xg12,....,xgij,......xgnm}
xgij={xfi1,.....,xfia,......xfik}
其中,x∈trX,g∈G,f∈g,x为各标注数据、g为各特征组合、f为每个特征组合中的各特征值、n为标注数据数量,m为特征组合数量,k为特征组合中特征的数量,xgij表示第i个标注点在第j个特征组合上的特征值集合,xfia表示第i个标注点对应的第j个特征组合中的第a个特征值。
2)确定备选数据集合E在特征组合G上的组合特征集EG,
EG={eg11,eg12,......,egij,....,eghm}
egij={efi1,.....,efia,......,efhk}
其中,h为待选数据集合E中的数据数量,egij为集合E中第i个数据在第j个特征组合上的特征值集合,efia为集合E中第i个数据点对应的第j个特征组合中的第a个特征值。
3)对于xfia∈xgij,egij∈EG,计算集合E中的数据与trX集合中的数据的相似性,
Dij={dfuncj(xfia,efla),efla∈eglj}
其中,dfuncj表示应用于特征组合Fi上的距离函数,可以是欧式距离、余弦距离等。Dij表示第i个标注数据在特征组合Fj上与集合E中所有数据点的相似性度量,efla是进行相似性比较的集合E中的各数据点,其中,l∈[1,h],表示集合E中所有数据点中的每一个。
将第一相似度数值大于第一预设数值的备选数据作为所述候选数据。
4)对于xgij∈trX,返回集合E中在特征组合Fj上与其相似的数据点Wj={eb},其中,eb满足:
①b∈argmin(Dij),表示在特征组合Fj上最相似的b个点。
②dfuncj(xfia,efla)<α,α为该第一预设数值,可根据实际情况选择。
S103:在所有候选数据中提取可用于优化预设模型的目标数据;其中,所述预设模型包括用于生成误判规则的第一预设模型和用于检测时间序列是否异常的第二预设模型。
具体的,装置在所有候选数据中提取可用于优化预设模型的目标数据;其中,所述预设模型包括用于生成误判规则的第一预设模型和用于检测时间序列是否异常的第二预设模型。具体可以包括:
获取各候选数据的检测类型。检测类型可以包括正常点、告警点或异常点。
在第一预设时间窗口内获取检测类型为正常点的各第一候选数据。第一预设时间窗口可根据实际情况自主设置,可选为一天。可以理解的是当标注类型含有漏检时,触发该步骤。
分别计算各标注数据与各第一候选数据之间的第二相似度。
将第二相似度数值大于第二预设数值的第一候选数据作为所述目标数据。第二预设数值可以根据实际情况自主设置,可选为0.7。进一步可以采用dtw算法计算第二相似度。
获取检测类型为告警点或异常点的各第二候选数据。可以理解的是当标注类型含有漏报和误报时,触发该步骤。
根据预设时段内的告警点或异常点统计量,确定第二预设时间窗口;其中,所述第二预设时间窗口是在各候选数据中选取的大于所述告警点或异常点统计量的告警点数或异常点数对应的时间段。预设时段可以根据实际情况自主设置,可选为一周,第二预设时间窗口为w2,w2满足Cw2>N,其中,Cw2代表在窗口w2范围内,某个或者某几个检测器的异常点或者告警点数量,N为在预设时段内的告警点或异常点统计量。目标数据的确定方法是,在以确定时刻为中心,宽度为w2的时间窗口内,与标注数据有相同类型(告警点或异常点)的各第二候选数据。
根据所述第二预设时间窗口、所述确定时刻和所述检测类型,确定所述目标数据。可参照上述说明。
参照表2举例说明如下:
表2
例如对于序列si,假设用户标注第10个数据点为误报,由表2可知,该告警点来自于检测器4和子序列sisi1si2,则在w2=3的情况下,如果sj的子序列sjsj1sj2在第8~10个数据点中存在检测器4的告警点,则该告警点被确认为目标数据。
S104:根据所有目标数据,确定对所述预设模型的优化处理策略;以通过优化处理过的预设模型对待检测时间序列进行异常检测。
具体的,装置根据所有目标数据,确定对所述预设模型的优化处理策略;以通过优化处理过的预设模型对待检测时间序列进行异常检测。具体包括:
获取各目标数据分别对应的标注类型。可以包括误报、漏报等。
若判断获知至少一个目标数据对应的标注类型为误报,则根据第一处理策略更新所述第一预设模型的误报过滤规则。第一处理策略可以理解为基于消除误报目的的误报过滤规则调整策略。
若判断获知至少一个目标数据对应的标注类型为漏报,则确定所有漏报点是否全部存在于异常点中,若确定为是,则根据第二处理策略更新所述第一预设模型的误报过滤规则。第二处理策略可以理解为基于消除漏报目的的误报过滤规则调整策略。
进一步地,该方法还可以包括:
若确定为否,则统计不存在异常点中的全部漏报点。若全部漏报点的数量大于预设数量,则重新训练所述第二预设模型。预设数量可以根据实际情况自主设置。第二预设模型的具体训练为本领域成熟技术,不再赘述。
为了便于实现本发明实施例的方法,可以基于模块化进行设计实现。图2为基于模块化设计的实现本发明实施例的方法的示意图;如图2所示,共包括7大模块,具体说明如下:
模块1:时间序列处理装置:主要包括两个部分,时间序列采集器和时间序列处理器。
模块2:异常检测装置:主要根据异常检测器管理装置中的检测器以及配置规则对序列进行异常检测。
模块3:异常点分析展示装置:主要包括异常点过滤融合器、数据点相似性分析器、相似数据点规则生成器。
模块4:业务人员反馈装置:主要包括误报/漏报标注器以及误报/漏报类型判断器。
模块5:特征管理装置:主要包括特征定义器、特征组合管理器以及特征计算器。
模块6:误判规则管理器:主要包括误判规则生成器、规则冲突检测器。
模块7:异常检测器管理装置:主要包括异常检测规则配置器、异常检测器更新装置、异常检测器生成装置。
各模块组成部分的详细介绍如下:
1.时间序列处理装置
时间序列处理装置主要包括两个部分:时间序列采集器以及时间序列预处理器。
1.1时间序列采集器
其主要作用是根据网络流量日志生成时间序列,序列中的每个数据点由时间戳和数值组成,数值可以是以时间戳为起点,窗口大小为N(N可以是5分钟、1小时、1天等等)的统计量。例如:
对某网页以10分钟为窗口的访客量进行计数统计,考虑时间因素可以得到序列[(2018-08-07 09:10:00,34),(2018-08-07 09:20:00,12),(2018-08-07 09:30:00,67),(2018-08-07 09:40:00,34),……,(2018-08-07 10:10:00,2)],如果不考虑时间因素可以得到序列:[34,12,67,34,.....,2]。
1.2时间序列预处理器
其主要作用是对原始时间序列做预处理,假设有时间序列si,其主要处理步骤包括:
a)进行窗口大小为w的移动平均计算,得到序列si1和残差序列si2
b)进行STL分解,将原始序列分解为趋势、周期、残余项,分别用si3,si4,si5表示。
c)最终原始序列si经过预处理阶段会得到由6个子序列组成的序列列表S=[si,si1,si2,si3,si4,si5]。
2.异常检测装置
异常检测装置主要是根据异常检测器管理装置中的检测器和配置规则对模块1.2中得到的序列列表中的子序列进行检测。对于有10个数据点的序列Si,其检测结果如上述表2所示,其中,0表示正常,1表示告警,X表示根据异常检测器管理的配置规则,该检测器不适用于该序列,所以没有检测结果。
3.异常点分析与展示装置
异常点分析与展示装置完成与用户交互相关的功能,主要目的在于为用户的高效标注提供辅助分析与展示。
3.1异常点过滤器
异常点过滤器的主要作用在于根据误判规则管理器中的误判规则对模块2中得到的各子序列中的异常点进行过滤。例如,假设有规则(r1:Cw>3&i=2&j=4,表示子序列编号为2,检测器编号为4的检测结果中窗口大小为w的时间段内,告警点数量大于3),按照该规则保留子序列。所有规则的过滤结果经过融合得到最终的结果。例如,对于表2,假设应用完所有误判规则之后得到的结果如表3所示(加粗部分是应用误判规则后结果发生改变的地方)。
表3
对以上结果进行融合,这里融合方案是对所有子序列所有检测器的结果进行或操作,以si为例,最终的结果si:0000100000,其中0表示正常点,1表示告警点。
3.2相似性分析器
相似性分析器的功能由业务人员反馈装置触发,其作用是在业务人员对展示结果有更正标注时,计算并返回与更正点同类型的候选数据点和目标数据。候选数据点也包括两类:1)同一序列中具有相似模式的数据点;2)不同序列中具有相似模式的数据点。更正标注分三类:漏报、误报、漏检。候选数据点和目标数据的产生步骤可参照上述说明,不再赘述。
4.业务人员反馈装置
反馈装置的主要作用是实现业务人员对误报、漏报和漏检的高效标注,其主要流程是:1)对展示的结果进行标注,触发模块3.2中的相似性分析器;2)编辑相似性分析器的返回结果。可编辑的内容包括:a)计算相似数据点的范围,包含时间范围和序列对象;b)目标数据;c)返回的数据点。其中前两项的修改会触发相似性分析器重新计算相似数据点和目标数据。
图3为本发明实施例对预设模型的优化处理流程图,如图3所示,可以分别对用于生成误判规则的第一预设模型和用于检测时间序列是否异常的第二预设模型触发相应的触发动作。
5.特征管理装置
5.1特征的定义器
特征定义器的主要作用是维护特征列表,由F表示。在实际使用过程中,该列表可以灵活删除、添加、修改。特征主要包括4个大类:
a)统计特征,例如当前序列的均值、方差、中位数、不同周期的周期性、同比变化率、环比变化率,自相关系数、变异系数、一定大小的时间窗口内异常点个数、不同周期不同类型的异常点数量的平均数,当前时间点模块2中分解出的序列中异常的序列数等等。
b)拟合特征,例如当前时间点为结尾,窗口大小为w的时间子序列的移动均值、移动方差、自相关系数、BG分割后的线段拟合残差等
c)类别特征,例如异常点所属序列在模块2中得到的序列列表中的编号、异常点所属的检测器编号、窗口大小为w的子序列中是否包含BG算法检测到的突变点、窗口大小为w范围类各类型的异常点数量等。
d)业务特征,业务特征可有效的结合业务人员的专业经验,例如异常点发生的时段是早中晚还是深夜、是否是节假日周末双休、流量的来源(例如来自某个协议、某条业务线、某个机房等)。
5.2.特征组合管理器
特征组合的作用是将模块5.1中定义的特征集组合成不同的特征组,不同的特征组可以理解为不同的特征子空间,能不同程度的反映不同的异常模式,为误判规则的生成、数据点的相似性分析、相似数据点规则生成提供基础。不同特征组之间可以有交集,具体表示方式可参照上述说明,不再赘述。
需要说明的是:特征组合来源可以如下:
一是依赖于业务人员经验的自定义组合,比如某些对象的误报异常点表现为与时间因素关联较大,且主要模式为自相关性的破坏,那么g={异常发生的时段、是否是周末、是否是节假日、序列的自相关系数、w窗口的子序列自相关系数}就可以成为一个有效的特征组。
二是根据误判规则生成器中的机器学习模型学习得到,误判规则学习器的详细解释见步骤。通过误判规则生成器进行特征组合的方法包括:1)抽取决策树类机器学习模型的决策路径,对决策路径进行融合修剪后,提取出相关的特征构成特征组合;2)通过分类模型的特征重要性权重取topN个特征构成特征组合;3)根据标注的误判点,计算各特征的信息增益,取信息增益最大且大于一定阈值的N个特征构成特征组合。其中1)、2)适用于业务人员对检测结果有较多标注更正的时候,而3)适用于更正点较少的时候。
5.3特征计算器
特征计算器的主要作用是根据模块5.1中的定义好的特征,计算时间序列中各个数据点的特征,将数据点映射到特征空间,用于相似性分析、误报规则生成、误报规则调整、新异常检测器生成。数据点分为两类,告警点和非告警点,其特征计算的触发条件有所不同。具体表现在:1)向用户的展示过程中,用户没有反馈标注时,不进行特征计算;2)当展示过程中,有反馈标注时,如果反馈标注是误报,则触发对告警点的特征计算,如果是漏报,则触发对异常非告警点的特征计算,如果是漏检则出发对正常点的特征计算;3)对计算对象或者时间范围有修改时。在进行特征计算前,会先确定进行特征计算的计算对象,以及时间范围。默认的计算对象和时间范围确认方法可参照上述说明,不再赘述。
6.误判规则管理器
6.1误判规则生成器
误判规则生成器的主要作用是根据模块4中业务人员的标注结果以及模块5.3中的特征计算结果,对已有的规则进行调整或者生成新的规则以满足业务人员的标注反馈。其触发条件如模块4中图3所示。主要步骤包括:1)根据标注结果,按照模块5.3中计算相似性时确定计算的时间范围和对象的方法得到序列对象和时间范围,然后产生训练样本,样本特征由模块5.3得到,样本标签为业务人员的标注结果。2)用随机森林训练分类模型;3)根据得到的模型抽取规则。具体抽取方法为:a)分别对随机森林中的每一课决策树提取出规则,一条规则既是决策树中的一条路径;b)简化规则中的冗余项目,例如有规则为(r1:A>2and A>4and A<10and B=1and B=1then 1)简化后得到(r1:A>4and A<10and B=1then1);c)对简化后的规则去重;d)删除结果冲突规则,例如(r1:A>4and B=1then 1,r2:A>4and B=1then 0),则删除这两条规则;e)处理条件冲突规则,例如(r1:A>5and C>4then1,r2:A>5and C<8then 0),则处理后为(r1:A>5and C>=8then 1,r2:A>5and C<=4then0);f)对最后的结果再次去重。
6.2规则冲突检测器
冲突检测主要是检测与已有规则的冲突,主要处理方法同模块6.1中的步骤3)。
7.异常检测器管理装置
7.1异常检测规则配置器
异常检测规则配置器中包含异常检测器和检测器的适用规则。检测器包含两类:一是基于无监督方法的检测器,主要包括基于统计类的方法和基于回归预测类的方法,这一类检测器根据历史数据建模得到并预置于检测器管理装置中。二是通过业务人员的反馈标注产生训练数据,利用GBDT算法进行训练得到有监督检测器。两类方法都有一定的适用性,也就是某个检测器只对某类序列,或者某类序列的部分子序列能起到较好的检测效果。通过配置规则可以很好的进行检测器检测对象的管理,如:
{detector:检测器1,type:flow_level,obj:[ip1,ip2,host1],flag:tp1,sub:3}。表示检测器1适用于列表obj范围内,流量类型为flow_level,flag标志位tp1的流量对象的第3个子序列。配置规则会在适用过程中,根据用户的反馈结果进行调整。
7.2异常检测器生成器
异常检测器生成器主要在用户有漏报标注,且标注结果无法通过规则进行调整时才会触发。该异常检测器生成器主要是采用GBDT进行有监督检测模型的训练。首次训练对标注的数量有一定要求,保证有足够的训练数据。后期的训练,训练数据集Xt={Xt-1,Xc,Xd}由三部分组成:
1)Xt-1,上一次训练模型所用训练数据集。
2)Xc,当前累计的更正标注结果。
3)Xd,期间有监督检测模型检测结果被确定为告警的数据点。
图4为本发明另一实施例时间序列异常检测方法流程示意图,具体说明可参照上述实施例的说明,不再赘述。
本发明实施例提供的时间序列异常检测方法,通过获取与更新标注对应的各标注数据相似的候选数据、并基于候选数据提取目标数据,再根据目标数据确定对预设模型的优化处理策略,通过优化过的预设模型检测时间序列,能够提高时间序列异常检测的适用性。
在上述实施例的基础上,所述根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据,包括:
获取每种标注类型对应的各目标标注数据。
具体的,装置获取每种标注类型对应的各目标标注数据。可参照上述实施例,不再赘述。
对数据集中的数据进行初筛选,以获取需保留的备选数据。
具体的,装置对数据集中的数据进行初筛选,以获取需保留的备选数据。可参照上述实施例,不再赘述。
根据所述预设特征组合匹配所有备选数据分别对应的待匹配特征组合集合。
具体的,装置根据所述预设特征组合匹配所有备选数据分别对应的待匹配特征组合集合。可参照上述实施例,不再赘述。
根据所有待匹配特征组合集合、所有特征组合集合和预设相似度度量函数,计算所有备选数据与各目标标注数据之间的第一相似度。
具体的,装置根据所有待匹配特征组合集合、所有特征组合集合和预设相似度度量函数,计算所有备选数据与各目标标注数据之间的第一相似度。可参照上述实施例,不再赘述。
将第一相似度数值大于第一预设数值的备选数据作为所述候选数据。
具体的,装置将第一相似度数值大于第一预设数值的备选数据作为所述候选数据。可参照上述实施例,不再赘述。
本发明实施例提供的时间序列异常检测方法,进一步能够提高时间序列异常检测的适用性。
在上述实施例的基础上,所述在所有候选数据中提取可用于优化预设模型的目标数据,包括:
获取各候选数据的检测类型。
具体的,装置获取各候选数据的检测类型。可参照上述实施例,不再赘述。
在第一预设时间窗口内获取检测类型为正常点的各第一候选数据。
具体的,装置在第一预设时间窗口内获取检测类型为正常点的各第一候选数据。可参照上述实施例,不再赘述。
分别计算各标注数据与各第一候选数据之间的第二相似度。
具体的,装置分别计算各标注数据与各第一候选数据之间的第二相似度。可参照上述实施例,不再赘述。
将第二相似度数值大于第二预设数值的第一候选数据作为所述目标数据。
具体的,装置将第二相似度数值大于第二预设数值的第一候选数据作为所述目标数据。可参照上述实施例,不再赘述。
获取检测类型为告警点或异常点的各第二候选数据。
具体的,装置获取检测类型为告警点或异常点的各第二候选数据。可参照上述实施例,不再赘述。
根据预设时段内的告警点或异常点统计量,确定第二预设时间窗口;其中,所述第二预设时间窗口是在各候选数据中选取的大于所述告警点或异常点统计量的告警点数或异常点数对应的时间段。
具体的,装置根据预设时段内的告警点或异常点统计量,确定第二预设时间窗口;其中,所述第二预设时间窗口是在各候选数据中选取的大于所述告警点或异常点统计量的告警点数或异常点数对应的时间段。可参照上述实施例,不再赘述。
根据所述第二预设时间窗口、所述确定时刻和所述检测类型,确定所述目标数据。
具体的,装置根据所述第二预设时间窗口、所述确定时刻和所述检测类型,确定所述目标数据。可参照上述实施例,不再赘述。
本发明实施例提供的时间序列异常检测方法,进一步能够提高时间序列异常检测的适用性。
在上述实施例的基础上,所述根据所有目标数据,确定对所述预设模型的优化处理策略,包括:
获取各目标数据分别对应的标注类型。
具体的,装置获取各目标数据分别对应的标注类型。可参照上述实施例,不再赘述。
若判断获知至少一个目标数据对应的标注类型为误报,则根据第一处理策略更新所述第一预设模型的误报过滤规则。
具体的,装置若判断获知至少一个目标数据对应的标注类型为误报,则根据第一处理策略更新所述第一预设模型的误报过滤规则。可参照上述实施例,不再赘述。
若判断获知至少一个目标数据对应的标注类型为漏报,则确定所有漏报点是否全部存在于异常点中,若确定为是,则根据第二处理策略更新所述第一预设模型的误报过滤规则。
具体的,装置若判断获知至少一个目标数据对应的标注类型为漏报,则确定所有漏报点是否全部存在于异常点中,若确定为是,则根据第二处理策略更新所述第一预设模型的误报过滤规则。可参照上述实施例,不再赘述。
本发明实施例提供的时间序列异常检测方法,进一步能够提高时间序列异常检测的适用性。
在上述实施例的基础上,所述方法还包括:
若确定为否,则统计不存在异常点中的全部漏报点。
具体的,装置若确定为否,则统计不存在异常点中的全部漏报点。可参照上述实施例,不再赘述。
若全部漏报点的数量大于预设数量,则重新训练所述第二预设模型。
具体的,装置若全部漏报点的数量大于预设数量,则重新训练所述第二预设模型。可参照上述实施例,不再赘述。
本发明实施例提供的时间序列异常检测方法,进一步能够提高时间序列异常检测的适用性。
图5为本发明实施例时间序列异常检测装置结构示意图,如图5所示,本发明实施例提供了一种时间序列异常检测装置,包括第一获取单元501、第二获取单元502、提取单元503和检测单元504,其中:
第一获取单元501用于获取包含有标注数据的标注数据集合;所述标注数据是经过确认的、在时间序列检测结果中存在错误的对应数据;第二获取单元502用于获取所述标注数据集合中的各标注数据分别对应的特征组合集合;并根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据;提取单元503用于在所有候选数据中提取可用于优化预设模型的目标数据;其中,所述预设模型包括用于生成误判规则的第一预设模型和用于检测时间序列是否异常的第二预设模型;检测单元504用于根据所有目标数据,确定对所述预设模型的优化处理策略;以通过优化处理过的预设模型对待检测时间序列进行异常检测。
具体的,第一获取单元501用于获取包含有标注数据的标注数据集合;所述标注数据是经过确认的、在时间序列检测结果中存在错误的对应数据;第二获取单元502用于获取所述标注数据集合中的各标注数据分别对应的特征组合集合;并根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据;提取单元503用于在所有候选数据中提取可用于优化预设模型的目标数据;其中,所述预设模型包括用于生成误判规则的第一预设模型和用于检测时间序列是否异常的第二预设模型;检测单元504用于根据所有目标数据,确定对所述预设模型的优化处理策略;以通过优化处理过的预设模型对待检测时间序列进行异常检测。
本发明实施例提供的时间序列异常检测装置,通过获取与更新标注对应的各标注数据相似的候选数据、并基于候选数据提取目标数据,再根据目标数据确定对预设模型的优化处理策略,通过优化过的预设模型检测时间序列,能够提高时间序列异常检测的适用性。
在上述实施例的基础上,所述第二获取单元502具体用于:获取每种标注类型对应的各目标标注数据;对数据集中的数据进行初筛选,以获取需保留的备选数据;根据所述预设特征组合匹配所有备选数据分别对应的待匹配特征组合集合;根据所有待匹配特征组合集合、所有特征组合集合和预设相似度度量函数,计算所有备选数据与各目标标注数据之间的第一相似度;将第一相似度数值大于第一预设数值的备选数据作为所述候选数据。
具体的,所述第二获取单元502具体用于:获取每种标注类型对应的各目标标注数据;对数据集中的数据进行初筛选,以获取需保留的备选数据;根据所述预设特征组合匹配所有备选数据分别对应的待匹配特征组合集合;根据所有待匹配特征组合集合、所有特征组合集合和预设相似度度量函数,计算所有备选数据与各目标标注数据之间的第一相似度;将第一相似度数值大于第一预设数值的备选数据作为所述候选数据。
本发明实施例提供的时间序列异常检测装置,进一步能够提高时间序列异常检测的适用性。
在上述实施例的基础上,所述提取单元503具体用于:获取各候选数据的检测类型;在第一预设时间窗口内获取检测类型为正常点的各第一候选数据;分别计算各标注数据与各第一候选数据之间的第二相似度;将第二相似度数值大于第二预设数值的第一候选数据作为所述目标数据;获取检测类型为告警点或异常点的各第二候选数据;根据预设时段内的告警点或异常点统计量,确定第二预设时间窗口;其中,所述第二预设时间窗口是在各候选数据中选取的大于所述告警点或异常点统计量的告警点数或异常点数对应的时间段;根据所述第二预设时间窗口、所述确定时刻和所述检测类型,确定所述目标数据。
具体的,所述提取单元503具体用于:获取各候选数据的检测类型;在第一预设时间窗口内获取检测类型为正常点的各第一候选数据;分别计算各标注数据与各第一候选数据之间的第二相似度;将第二相似度数值大于第二预设数值的第一候选数据作为所述目标数据;获取检测类型为告警点或异常点的各第二候选数据;根据预设时段内的告警点或异常点统计量,确定第二预设时间窗口;其中,所述第二预设时间窗口是在各候选数据中选取的大于所述告警点或异常点统计量的告警点数或异常点数对应的时间段;根据所述第二预设时间窗口、所述确定时刻和所述检测类型,确定所述目标数据。
本发明实施例提供的时间序列异常检测装置,进一步能够提高时间序列异常检测的适用性。
在上述实施例的基础上,所述检测单元504具体用于:获取各目标数据分别对应的标注类型;若判断获知至少一个目标数据对应的标注类型为误报,则根据第一处理策略更新所述第一预设模型的误报过滤规则;若判断获知至少一个目标数据对应的标注类型为漏报,则确定所有漏报点是否全部存在于异常点中,若确定为是,则根据第二处理策略更新所述第一预设模型的误报过滤规则。
具体的,所述检测单元504具体用于:获取各目标数据分别对应的标注类型;若判断获知至少一个目标数据对应的标注类型为误报,则根据第一处理策略更新所述第一预设模型的误报过滤规则;若判断获知至少一个目标数据对应的标注类型为漏报,则确定所有漏报点是否全部存在于异常点中,若确定为是,则根据第二处理策略更新所述第一预设模型的误报过滤规则。
本发明实施例提供的时间序列异常检测装置,进一步能够提高时间序列异常检测的适用性。
在上述实施例的基础上,所述装置还用于:若确定为否,则统计不存在异常点中的全部漏报点;若全部漏报点的数量大于预设数量,则重新训练所述第二预设模型。
具体的,所述装置还用于:若确定为否,则统计不存在异常点中的全部漏报点;若全部漏报点的数量大于预设数量,则重新训练所述第二预设模型。
本发明实施例提供的时间序列异常检测装置,进一步能够提高时间序列异常检测的适用性。
本发明实施例提供的时间序列异常检测装置具体可以用于执行上述各方法实施例的处理流程,其功能在此不再赘述,可以参照上述方法实施例的详细描述。
图6为本发明实施例提供的电子设备实体结构示意图,如图6所示,所述电子设备包括:处理器(processor)601、存储器(memory)602和总线603;
其中,所述处理器601、存储器602通过总线603完成相互间的通信;
所述处理器601用于调用所述存储器602中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:获取包含有标注数据的标注数据集合;所述标注数据是经过确认的、在时间序列检测结果中存在错误的对应数据;获取所述标注数据集合中的各标注数据分别对应的特征组合集合;并根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据;在所有候选数据中提取可用于优化预设模型的目标数据;其中,所述预设模型包括用于生成误判规则的第一预设模型和用于检测时间序列是否异常的第二预设模型;根据所有目标数据,确定对所述预设模型的优化处理策略;以通过优化处理过的预设模型对待检测时间序列进行异常检测。
本实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:获取包含有标注数据的标注数据集合;所述标注数据是经过确认的、在时间序列检测结果中存在错误的对应数据;获取所述标注数据集合中的各标注数据分别对应的特征组合集合;并根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据;在所有候选数据中提取可用于优化预设模型的目标数据;其中,所述预设模型包括用于生成误判规则的第一预设模型和用于检测时间序列是否异常的第二预设模型;根据所有目标数据,确定对所述预设模型的优化处理策略;以通过优化处理过的预设模型对待检测时间序列进行异常检测。
本实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:获取包含有标注数据的标注数据集合;所述标注数据是经过确认的、在时间序列检测结果中存在错误的对应数据;获取所述标注数据集合中的各标注数据分别对应的特征组合集合;并根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据;在所有候选数据中提取可用于优化预设模型的目标数据;其中,所述预设模型包括用于生成误判规则的第一预设模型和用于检测时间序列是否异常的第二预设模型;根据所有目标数据,确定对所述预设模型的优化处理策略;以通过优化处理过的预设模型对待检测时间序列进行异常检测。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的电子设备等实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上各实施例仅用以说明本发明的实施例的技术方案,而非对其限制;尽管参照前述各实施例对本发明的实施例进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明的各实施例技术方案的范围。

Claims (12)

1.一种时间序列异常检测方法,其特征在于,包括:
获取包含有标注数据的标注数据集合;所述标注数据是经过确认的、在时间序列检测结果中存在错误的对应数据;
获取所述标注数据集合中的各标注数据分别对应的特征组合集合;并根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据;
在所有候选数据中提取可用于优化预设模型的目标数据;其中,所述预设模型包括用于生成误判规则的第一预设模型和用于检测时间序列是否异常的第二预设模型;
根据所有目标数据,确定对所述预设模型的优化处理策略;以通过优化处理过的预设模型对待检测时间序列进行异常检测。
2.根据权利要求1所述的方法,其特征在于,所述根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据,包括:
获取每种标注类型对应的各目标标注数据;
对数据集中的数据进行初筛选,以获取需保留的备选数据;
根据所述预设特征组合匹配所有备选数据分别对应的待匹配特征组合集合;
根据所有待匹配特征组合集合、所有特征组合集合和预设相似度度量函数,计算所有备选数据与各目标标注数据之间的第一相似度;
将第一相似度数值大于第一预设数值的备选数据作为所述候选数据。
3.根据权利要求1所述的方法,其特征在于,所述在所有候选数据中提取可用于优化预设模型的目标数据,包括:
获取各候选数据的检测类型;
在第一预设时间窗口内获取检测类型为正常点的各第一候选数据;
分别计算各标注数据与各第一候选数据之间的第二相似度;
将第二相似度数值大于第二预设数值的第一候选数据作为所述目标数据;
获取检测类型为告警点或异常点的各第二候选数据;
根据预设时段内的告警点或异常点统计量,确定第二预设时间窗口;其中,所述第二预设时间窗口是在各候选数据中选取的大于所述告警点或异常点统计量的告警点数或异常点数对应的时间段;
根据所述第二预设时间窗口、所述确定时刻和所述检测类型,确定所述目标数据。
4.根据权利要求1所述的方法,其特征在于,所述根据所有目标数据,确定对所述预设模型的优化处理策略,包括:
获取各目标数据分别对应的标注类型;
若判断获知至少一个目标数据对应的标注类型为误报,则根据第一处理策略更新所述第一预设模型的误报过滤规则;
若判断获知至少一个目标数据对应的标注类型为漏报,则确定所有漏报点是否全部存在于异常点中,若确定为是,则根据第二处理策略更新所述第一预设模型的误报过滤规则。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
若确定为否,则统计不存在异常点中的全部漏报点;
若全部漏报点的数量大于预设数量,则重新训练所述第二预设模型。
6.一种时间序列异常检测装置,其特征在于,包括:
第一获取单元,用于获取包含有标注数据的标注数据集合;所述标注数据是经过确认的、在时间序列检测结果中存在错误的对应数据;
第二获取单元,用于获取所述标注数据集合中的各标注数据分别对应的特征组合集合;并根据所有特征组合集合、各标注数据对应的所有标注类型和预设特征组合,分别获取与各标注数据相似的候选数据;
提取单元,用于在所有候选数据中提取可用于优化预设模型的目标数据;其中,所述预设模型包括用于生成误判规则的第一预设模型和用于检测时间序列是否异常的第二预设模型;
检测单元,用于根据所有目标数据,确定对所述预设模型的优化处理策略;以通过优化处理过的预设模型对待检测时间序列进行异常检测。
7.根据权利要求6所述的装置,其特征在于,所述第二获取单元具体用于:
获取每种标注类型对应的各目标标注数据;
对数据集中的数据进行初筛选,以获取需保留的备选数据;
根据所述预设特征组合匹配所有备选数据分别对应的待匹配特征组合集合;
根据所有待匹配特征组合集合、所有特征组合集合和预设相似度度量函数,计算所有备选数据与各目标标注数据之间的第一相似度;
将第一相似度数值大于第一预设数值的备选数据作为所述候选数据。
8.根据权利要求6所述的装置,其特征在于,所述提取单元具体用于:
获取各候选数据的检测类型;
在第一预设时间窗口内获取检测类型为正常点的各第一候选数据;
分别计算各标注数据与各第一候选数据之间的第二相似度;
将第二相似度数值大于第二预设数值的第一候选数据作为所述目标数据;
获取检测类型为告警点或异常点的各第二候选数据;
根据预设时段内的告警点或异常点统计量,确定第二预设时间窗口;其中,所述第二预设时间窗口是在各候选数据中选取的大于所述告警点或异常点统计量的告警点数或异常点数对应的时间段;
根据所述第二预设时间窗口、所述确定时刻和所述检测类型,确定所述目标数据。
9.根据权利要求6所述的装置,其特征在于,所述检测单元具体用于:
获取各目标数据分别对应的标注类型;
若判断获知至少一个目标数据对应的标注类型为误报,则根据第一处理策略更新所述第一预设模型的误报过滤规则;
若判断获知至少一个目标数据对应的标注类型为漏报,则确定所有漏报点是否全部存在于异常点中,若确定为是,则根据第二处理策略更新所述第一预设模型的误报过滤规则。
10.根据权利要求9所述的装置,其特征在于,所述装置还用于:
若确定为否,则统计不存在异常点中的全部漏报点;
若全部漏报点的数量大于预设数量,则重新训练所述第二预设模型。
11.一种电子设备,其特征在于,包括:处理器、存储器和总线,其中,
所述处理器和所述存储器通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至5任一所述的方法。
12.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至5任一所述的方法。
CN201811603934.9A 2018-12-26 2018-12-26 一种时间序列异常检测方法及装置 Active CN109871401B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811603934.9A CN109871401B (zh) 2018-12-26 2018-12-26 一种时间序列异常检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811603934.9A CN109871401B (zh) 2018-12-26 2018-12-26 一种时间序列异常检测方法及装置

Publications (2)

Publication Number Publication Date
CN109871401A true CN109871401A (zh) 2019-06-11
CN109871401B CN109871401B (zh) 2021-05-25

Family

ID=66917126

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811603934.9A Active CN109871401B (zh) 2018-12-26 2018-12-26 一种时间序列异常检测方法及装置

Country Status (1)

Country Link
CN (1) CN109871401B (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110211353A (zh) * 2019-06-12 2019-09-06 国家电网有限公司 监控***告警信息抑制的一种有效方法
CN110266552A (zh) * 2019-08-15 2019-09-20 华为技术有限公司 流量异常检测的方法、模型训练方法和装置
CN110321366A (zh) * 2019-06-27 2019-10-11 中国科学院自动化研究所 基于在线学习的统计量确定方法及***
CN110990242A (zh) * 2019-11-29 2020-04-10 上海观安信息技术股份有限公司 一种用户操作次数波动异常的确定方法及装置
CN110991504A (zh) * 2019-11-22 2020-04-10 齐鲁工业大学 基于motcn-ae的多维时间序列异常值检测方法及***
CN110990449A (zh) * 2019-10-29 2020-04-10 贝壳技术有限公司 时间序列处理方法、装置、存储介质及处理器
CN111291096A (zh) * 2020-03-03 2020-06-16 腾讯科技(深圳)有限公司 数据集构建方法、装置和存储介质及异常指标检测方法
CN111314110A (zh) * 2020-01-17 2020-06-19 南京大学 一种用于分布式***的故障预警方法
CN111400284A (zh) * 2020-03-20 2020-07-10 广州咨元信息科技有限公司 一种基于性能数据建立动态异常探测模型的方法
CN111612082A (zh) * 2020-05-26 2020-09-01 河北小企鹅医疗科技有限公司 检测时间序列中异常子序列的方法及设备
CN112131274A (zh) * 2020-09-22 2020-12-25 平安科技(深圳)有限公司 时间序列异常点的检测方法、装置、设备及可读存储介质
CN112532467A (zh) * 2019-09-17 2021-03-19 华为技术有限公司 用于实现故障检测的方法、装置及***
CN112905671A (zh) * 2021-03-24 2021-06-04 北京必示科技有限公司 时间序列异常处理方法、装置、电子设备及存储介质
CN112966222A (zh) * 2021-03-10 2021-06-15 中国民航信息网络股份有限公司 一种时间序列异常数据检测方法及相关设备
CN113132301A (zh) * 2019-12-30 2021-07-16 腾讯科技(深圳)有限公司 异常数据汇集的检测方法、装置和计算机存储介质
CN113157760A (zh) * 2020-01-22 2021-07-23 阿里巴巴集团控股有限公司 目标数据确定方法及装置
CN113852603A (zh) * 2021-08-13 2021-12-28 京东科技信息技术有限公司 网络流量的异常检测方法、装置、电子设备和可读介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101872343A (zh) * 2009-04-24 2010-10-27 罗彤 半监督式的海量数据层次分类方法
CN103686806A (zh) * 2013-12-02 2014-03-26 清华大学 一种网络异常事件检测方法和***
CN105425583A (zh) * 2015-11-05 2016-03-23 浙江大学 基于协同训练lwpls的青霉素生产过程的控制方法
US20160261622A1 (en) * 2015-03-06 2016-09-08 Ca, Inc. Anomaly detection based on cluster transitions
CN106778878A (zh) * 2016-12-21 2017-05-31 东方网力科技股份有限公司 一种人物关系分类方法及装置
CN109032829A (zh) * 2018-07-23 2018-12-18 腾讯科技(深圳)有限公司 数据异常检测方法、装置、计算机设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101872343A (zh) * 2009-04-24 2010-10-27 罗彤 半监督式的海量数据层次分类方法
CN103686806A (zh) * 2013-12-02 2014-03-26 清华大学 一种网络异常事件检测方法和***
US20160261622A1 (en) * 2015-03-06 2016-09-08 Ca, Inc. Anomaly detection based on cluster transitions
CN105425583A (zh) * 2015-11-05 2016-03-23 浙江大学 基于协同训练lwpls的青霉素生产过程的控制方法
CN106778878A (zh) * 2016-12-21 2017-05-31 东方网力科技股份有限公司 一种人物关系分类方法及装置
CN109032829A (zh) * 2018-07-23 2018-12-18 腾讯科技(深圳)有限公司 数据异常检测方法、装置、计算机设备及存储介质

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110211353A (zh) * 2019-06-12 2019-09-06 国家电网有限公司 监控***告警信息抑制的一种有效方法
CN110321366A (zh) * 2019-06-27 2019-10-11 中国科学院自动化研究所 基于在线学习的统计量确定方法及***
CN110321366B (zh) * 2019-06-27 2021-06-25 中国科学院自动化研究所 基于在线学习的统计量确定方法及***
CN110266552A (zh) * 2019-08-15 2019-09-20 华为技术有限公司 流量异常检测的方法、模型训练方法和装置
CN112532467A (zh) * 2019-09-17 2021-03-19 华为技术有限公司 用于实现故障检测的方法、装置及***
CN112532467B (zh) * 2019-09-17 2022-12-27 华为技术有限公司 用于实现故障检测的方法、装置及***
CN110990449A (zh) * 2019-10-29 2020-04-10 贝壳技术有限公司 时间序列处理方法、装置、存储介质及处理器
CN110991504A (zh) * 2019-11-22 2020-04-10 齐鲁工业大学 基于motcn-ae的多维时间序列异常值检测方法及***
CN110990242A (zh) * 2019-11-29 2020-04-10 上海观安信息技术股份有限公司 一种用户操作次数波动异常的确定方法及装置
CN110990242B (zh) * 2019-11-29 2023-06-20 上海观安信息技术股份有限公司 一种用户操作次数波动异常的确定方法及装置
CN113132301A (zh) * 2019-12-30 2021-07-16 腾讯科技(深圳)有限公司 异常数据汇集的检测方法、装置和计算机存储介质
CN111314110A (zh) * 2020-01-17 2020-06-19 南京大学 一种用于分布式***的故障预警方法
CN113157760A (zh) * 2020-01-22 2021-07-23 阿里巴巴集团控股有限公司 目标数据确定方法及装置
CN111291096A (zh) * 2020-03-03 2020-06-16 腾讯科技(深圳)有限公司 数据集构建方法、装置和存储介质及异常指标检测方法
CN111400284A (zh) * 2020-03-20 2020-07-10 广州咨元信息科技有限公司 一种基于性能数据建立动态异常探测模型的方法
CN111400284B (zh) * 2020-03-20 2023-09-12 广州咨元信息科技有限公司 一种基于性能数据建立动态异常探测模型的方法
CN111612082A (zh) * 2020-05-26 2020-09-01 河北小企鹅医疗科技有限公司 检测时间序列中异常子序列的方法及设备
CN112131274A (zh) * 2020-09-22 2020-12-25 平安科技(深圳)有限公司 时间序列异常点的检测方法、装置、设备及可读存储介质
CN112131274B (zh) * 2020-09-22 2024-01-19 平安科技(深圳)有限公司 时间序列异常点的检测方法、装置、设备及可读存储介质
CN112966222A (zh) * 2021-03-10 2021-06-15 中国民航信息网络股份有限公司 一种时间序列异常数据检测方法及相关设备
CN112905671A (zh) * 2021-03-24 2021-06-04 北京必示科技有限公司 时间序列异常处理方法、装置、电子设备及存储介质
CN113852603A (zh) * 2021-08-13 2021-12-28 京东科技信息技术有限公司 网络流量的异常检测方法、装置、电子设备和可读介质
CN113852603B (zh) * 2021-08-13 2023-11-07 京东科技信息技术有限公司 网络流量的异常检测方法、装置、电子设备和可读介质

Also Published As

Publication number Publication date
CN109871401B (zh) 2021-05-25

Similar Documents

Publication Publication Date Title
CN109871401A (zh) 一种时间序列异常检测方法及装置
Khoshgoftaar et al. Fault prediction modeling for software quality estimation: Comparing commonly used techniques
CN111507376B (zh) 一种基于多种无监督方法融合的单指标异常检测方法
Celikmih et al. Failure prediction of aircraft equipment using machine learning with a hybrid data preparation method
CN109840157A (zh) 故障诊断的方法、装置、电子设备和存储介质
CN110097037A (zh) 智能监测方法、装置、存储介质及电子设备
Kadwe et al. A review on concept drift
CN109501834A (zh) 一种道岔转辙机故障预测方法及装置
CN113887616A (zh) 一种epg连接数的实时异常检测***及方法
CN109741797A (zh) 一种利用深度学习技术预测小分子化合物水溶性等级的方法
CN111126820A (zh) 反窃电方法及***
CN108985467A (zh) 基于人工智能的二次设备精益化管控方法
CN108470022A (zh) 一种基于运维管理的智能工单质检方法
CN108647730A (zh) 一种基于历史行为共现的数据划分方法及***
Oliveira et al. Automated monitoring of construction sites of electric power substations using deep learning
CN106953766A (zh) 一种报警方法及装置
CN113157800A (zh) 实时发现空中动态目标识别方法
KR20230030542A (ko) 랜덤 컷 포레스트 알고리즘을 이용한 ai 기반의 설비 데이터 이상 감지 시스템과 그 방법
CN110175272A (zh) 一种基于特征建模实现工单收敛的控制方法及控制装置
CN111368926A (zh) 图像筛选方法、装置和计算机可读存储介质
CN110166289A (zh) 一种识别目标信息资产的方法及装置
CN113822366A (zh) 业务指标异常检测方法及装置、电子设备、存储介质
CN112215254A (zh) 一种基于改进案例推理的变电站故障诊断方法以及诊断装置
García-Vico et al. Fepds: A proposal for the extraction of fuzzy emerging patterns in data streams
CN116865994A (zh) 一种基于大数据的网络数据安全预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: Room 332, 3 / F, Building 102, 28 xinjiekouwei street, Xicheng District, Beijing 100088

Patentee after: QAX Technology Group Inc.

Address before: 100015 15, 17 floor 1701-26, 3 building, 10 Jiuxianqiao Road, Chaoyang District, Beijing.

Patentee before: BEIJING QIANXIN TECHNOLOGY Co.,Ltd.