CN113986711A - 一种时间序列数据的峰值检测方法、装置及设备 - Google Patents

一种时间序列数据的峰值检测方法、装置及设备 Download PDF

Info

Publication number
CN113986711A
CN113986711A CN202111614786.2A CN202111614786A CN113986711A CN 113986711 A CN113986711 A CN 113986711A CN 202111614786 A CN202111614786 A CN 202111614786A CN 113986711 A CN113986711 A CN 113986711A
Authority
CN
China
Prior art keywords
peak
candidate
value
list
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111614786.2A
Other languages
English (en)
Inventor
徐昕军
严川
张博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cloudwise Beijing Technology Co Ltd
Original Assignee
Cloudwise Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cloudwise Beijing Technology Co Ltd filed Critical Cloudwise Beijing Technology Co Ltd
Priority to CN202111614786.2A priority Critical patent/CN113986711A/zh
Publication of CN113986711A publication Critical patent/CN113986711A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Hardware Design (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明的实施例提供一种时间序列数据的峰值检测方法、装置及设备,方法包括:获取时间序列数据;对所述时间序列数据中的数据点进行差分运算处理,得到所述时间序列数据的差分序列;根据所述差分序列,获取所述时间序列数据的候选峰值列表;对所述候选峰值列表中的候选峰值进行筛选,获得第一目标峰值候选列表;根据所述第一目标峰值候选列表中的候选峰值的峰值因子和预设阈值,获得所述时间序列数据的第二目标峰值列表。本发明的实施例解决了运维时间序列数据中窄阶梯峰值漏判和局部小幅度波动误判为峰值的问题,使准确率大大提高,可提高用户故障排查的效率。

Description

一种时间序列数据的峰值检测方法、装置及设备
技术领域
本发明涉及运维技术领域,特别是指一种时间序列数据的峰值检测方法、装置及设备。
背景技术
伴随人工智能、云计算、大数据、物联网等技术创新,运维行业从传统运维流程化管理逐步向智能化演进,如今智能运维已被广泛应用于多个领域。在智能运维领域的海量运维数据中,由一系列时间戳和对应数值组成的时间序列数据是最重要的数据类型之一。时间序列的峰值判定是指运用算法判断一维时间序列中的数据点是否为峰值,可广泛的应用于时间序列周期性提取、时间序列预处理中的离群点判定以及异常检测中异常点的判定等多种运维场景。时间序列峰值判定方法可分为两类:时域判定法和频域判定法。
频域类方法通常利用傅里叶变换等算法将时间序列转换到频域上进行处理,该类方法对计算机算力要求高,通常难以适应运维领域海量数据的处理需求,而且对峰值判定存在时移问题,因此在实际业务环境中应用较少,更适合于学术研究。
时域判定法利用时间序列峰值处的幅值较高的特点进行峰值判定,该类方法通常只能识别单点峰值,而无法识别实际运维场景中的窄阶梯峰值;此外,该类方法易将运维场景中的局部小幅度波动误识别为峰值。
发明内容
本发明提供了一种时间序列数据的峰值检测方法、装置及设备。解决了运维时间序列数据中窄阶梯峰值被漏判和局部小幅度波动误判为峰值的问题,使准确率大大提高,可提高用户故障排查的效率。
为解决上述技术问题,本发明的实施例提供以下方案:
一种时间序列数据的峰值检测方法,包括:
获取时间序列数据;
对所述时间序列数据中的数据点进行差分运算处理,得到所述时间序列数据的差分序列;
根据所述差分序列,获取所述时间序列数据的候选峰值列表;
对所述候选峰值列表中的候选峰值进行筛选,获得第一目标峰值候选列表;
根据所述第一目标峰值候选列表中的候选峰值的峰值因子和预设阈值,获得所述时间序列数据的第二目标峰值列表。
可选的,所述差分序列DIFF_X=diff(X);
X为时间序列数据,X=(x1,x2,…,xm);
diff(xi)=xi+1-xi,其中,i=1,2,…,m-1,m为时间序列数据中数据点的个数;
其中,xi为下标为i的当前数据点;xi+1为当前数据点的后一个数据点。
可选的,根据所述差分序列,获取所述时间序列数据的候选峰值列表,包括:
将所述差分序列中的前一值点的差分值大于零且后一值点的差分值小于零的峰值形成的列表,作为所述时间序列数据的候选峰值列表;和/或
将所述差分序列中的相邻值点之间构成至少一个连续的差分值为零的零值对,且所述至少一个连续的差分值为零的零值对的前一值点的差分值大于零,所述至少一个连续的差分值为零的零值对的后一值点的差分值小于零的峰值形成的列表,作为所述时间序列数据的候选峰值列表。
可选的,对所述候选峰值列表中的候选峰值进行筛选,获得第一目标峰值候选列表,包括:
以所述候选峰值列表中的候选峰值中任意一峰值为中心,选取一预设时间窗口;
判断所述候选峰值是否为所述预设时间窗口中的最大值,若不是,将所述候选峰值从候选峰值列表中删除,获得第一目标峰值候选列表。
可选的,所述预设时间窗口中的最大值通过如下公式计算:
Figure 214825DEST_PATH_IMAGE001
其中,xmax为预设时间窗口内最大值;icenter为当前峰值的下标;win为设置的预设时间窗口的长度。
可选的,根据所述第一目标峰值候选列表中的候选峰值的峰值因子和预设阈值,获得所述时间序列数据的第二目标峰值列表,包括:
将所述第一目标峰值候选列表中的目标候选峰值的峰值因子大于预设阈值的所有目标候选峰值加入所述时间序列数据的第二目标峰值列表。
可选的,所述峰值因子通过公式
Figure 459861DEST_PATH_IMAGE002
获得;其中,Crest为峰值因子;
Figure 770757DEST_PATH_IMAGE003
为第一目标峰值候选列表中的候选峰值的绝对值;xrms为以候选峰值为中心的窗口内的时间序列数据的有效值;
有效值通过公式:
Figure 431545DEST_PATH_IMAGE004
计算;其中,xi为时间序列数据中的第i个点;N为参与计算的时间序列数据的长度。
本发明还提供一种时间序列数据的峰值检测装置,包括:
获取模块,用于获取时间序列数据;
处理模块,用于对所述时间序列数据中的数据点进行差分运算处理,得到所述时间序列数据的差分序列;以及根据所述差分序列,获取所述时间序列数据的候选峰值列表;对所述候选峰值列表中的候选峰值进行筛选,获得第一目标峰值候选列表;根据所述第一目标峰值候选列表中的候选峰值的峰值因子和预设阈值,获得所述时间序列数据的第二目标峰值列表。
本发明提供一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如上述的方法对应的操作。
本发明还提供一种计算机可读存储介质,存储有指令,所述指令在计算机上运行时,使得计算机执行如上述的方法。
本发明的上述方案至少包括以下有益效果:
本发明的上述方案,通过获取时间序列数据;对所述时间序列数据中的数据点进行差分运算处理,得到所述时间序列数据的差分序列;根据所述差分序列,获取所述时间序列数据的候选峰值列表;对所述候选峰值列表中的候选峰值进行筛选,获得第一目标峰值候选列表;根据所述第一目标峰值候选列表中的候选峰值的峰值因子和预设阈值,获得所述时间序列数据的第二目标峰值列表;解决了运维时间序列数据中窄阶梯峰值被漏判和局部小幅度波动误判为峰值的问题,使准确率大大提高,可提高用户故障排查的效率。
附图说明
图1为本发明实施例的时间序列数据的峰值检测方法的流程示意图;
图2为本发明提供的具体的实施例1的运维领域实际场景中的时间序列数据的示意图;
图3为本发明提供的具体的实施例3中未通过时间序列数据的峰值检测方法的检测结果示意图;
图4为本发明提供的具体的实施例3中通过时间序列数据的峰值检测方法的检测结果示意图;
图5为本发明提供的具体的实施例4中时间序列数据的峰值检测方法的流程示意图;
图6为本发明提供的具体的实施例4中获取候选峰值下标的列表的流程示意图;
图7为本发明提供的具体的实施例4中筛选候选峰值为窗内最大值的下标列表的流程示意图;
图8为本发明提供的具体的实施例4中获取最终输出结果的流程示意图;
图9为本发明实施例的时间序列数据的峰值检测装置的模块示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
如图1所示,本发明提供一种时间序列数据的峰值检测方法,包括:
步骤11,获取时间序列数据;
步骤12,对所述时间序列数据中的数据点进行差分运算处理,得到所述时间序列数据的差分序列;
步骤13,根据所述差分序列,获取所述时间序列数据的候选峰值列表;
步骤14,对所述候选峰值列表中的候选峰值进行筛选,获得第一目标峰值候选列表;
步骤15,根据所述第一目标峰值候选列表中的候选峰值的峰值因子和预设阈值,获得所述时间序列数据的第二目标峰值列表。
该实施例中,从数据源获取时间序列数据,该时间序列数据优选为X=(x1,x2,…,xm),对时间序列数据进行差分运算处理,生成时间序列数据的差分序列,进而根据差分序列,获取时间序列数据的候选峰值列表,对候选峰值列表进行筛选,得到第一目标峰值候选列表,结合预设阈值,得到时间序列数据的第二目标峰值列表,解决了运维时间序列数据中窄阶梯峰值被漏判和局部小幅度波动误判为峰值的问题,使准确率大大提高,可提高用户故障排查的效率。
一个具体的实施例1中,如图2所示,图2所示为来自运维领域实际场景中的时间序列数据。
本发明一可选的实施例中,步骤12中的差分序列DIFF_X=diff(X);
X为时间序列数据,X=(x1,x2,…,xm);
diff(xi)=xi+1-xi,其中,i=1,2,…,m-1,m为时间序列数据中数据点的个数;
其中,xi为下标为i的当前数据点;xi+1为当前数据点的后一个数据点。
本实施例中,对时间序列数据X=(x1,x2,…,xm)进行差分运算处理,生成差分序列DIFF_X,该差分运算是指将时间序列数据中的后一个点减去当前点,即当当前点为xi时,当前点xi的后一个点为xi+1,则对当前点进行差分运算,得到差分值diff(xi)=xi+1-xi,其中,i=1,2,…,m-1,遍历时间序列数据X=(x1,x2,…,xm)中的每一个数据,得到差分序列DIFF_X=diff(X)。
本发明一可选的实施例中,步骤13包括:
步骤131,将所述差分序列中的前一值点的差分值大于零且后一值点的差分值小于零的峰值形成的列表,作为所述时间序列数据的候选峰值列表;和/或
步骤132,将所述差分序列中的相邻值点之间构成至少一个连续的差分值为零的零值对,且所述至少一个连续的差分值为零的零值对的前一值点的差分值大于零,所述至少一个连续的差分值为零的零值对的后一值点的差分值小于零的峰值形成的列表,作为所述时间序列数据的候选峰值列表。
本实施例中,差分序列中的相邻值点之间构成至少一个连续的差分值为零的零值对,且所述至少一个连续的差分值为零的零值对的前一值点的差分值大于零,所述至少一个连续的差分值为零的零值对的后一值点的差分值小于零的峰值可称之为窄阶梯形态下的峰值,至少一个连续的差分值为零的零值对可称之为窄阶梯形态下的值对,窄阶梯形态下的峰值的特点为:
(1)窄阶梯形态下的峰值对应的时间序列数据与相邻的时间序列数据相等;
(2)窄阶梯形态下的峰值对应的时间序列数据与相邻的时间序列数据的差分值都为0;
(3)窄阶梯形态下的峰值与差分值都为0的相邻的时间序列数据构成的零值对,前一值点的差分值大于零,后一值点的差分值小于零;
具体的,步骤13可通过下列公式中的条件:
Figure DEST_PATH_IMAGE005
进行筛选得到;
其中,xpeak为候选峰值列表中的候选峰值,xneg为差分值小于零的值点,index(x)是值点x对应的下标;limit是设置的窄阶梯长度限制参数,该窄阶梯长度限制参数limit可根据实际情况而设定。
一个具体的实施例2中,时间序列数据X=(x1,x2,…,xm),第一峰值的为x7,第一峰值x7的前一值点为x6,后一值点为x8,diff(x6)>0,且diff(x5)<0,则第一峰值可确定为候选峰值;
第二峰值为x14,第二峰值的前几个值点依次为x10、x11、x12、x13,后几个值点依次为x15、x16、x17,具体的:
diff(x10)>0;diff(x11)=0;diff(x12)=0;diff(x13)=0;diff(x14)=0;diff(x15)=0;diff(x16)=0;diff(x17)<0;
则,根据上述值点x10至x17对应的差分值可见,第二峰值x14与前几个值点中的x11、x12、x13的差分值都为0,同时与后几个值点中的x15、x16的差分值都为0,则第二峰值x14与值点x11、x12、x13、x15、x16构成至少一个连续的差分值为零的零值对,且该至少一个连续的差分值为零的零值对的前一值点为x10,其对应的差分值diff(x10)>0,该至少一个连续的差分值为零的零值对的后一值点为x17,其对应的差分值diff(x17)<0,因此,可将第二峰值x14确定为候选峰值。
本发明一可选的实施例中,步骤14包括:
步骤141,以所述候选峰值列表中的候选峰值中任意一峰值为中心,选取一预设时间窗口;
步骤142,判断所述候选峰值是否为所述预设时间窗口中的最大值,若不是,将所述候选峰值从候选峰值列表中删除,获得第一目标峰值候选列表。
本实施例中,由于候选峰值应为局部的最大值,以候选峰值中的峰值为中心,选取一预设时间窗口,筛选出预设时间窗口内的最大值的值点,若预设时间窗口内的最大值的值点为候选峰值中的峰值,则将该候选峰值的峰值作为候选峰值列表中的一个候选峰值,若预设时间窗口内的最大值的值点不是候选峰值中的峰值,则将该候选峰值的峰值删除,遍历所有的候选峰值,得到第一目标峰值候选列表。
其中,步骤1412中的所述预设时间窗口中的最大值通过如下公式计算:
Figure 308235DEST_PATH_IMAGE006
其中,xmax为预设时间窗口内最大值;icenter为当前峰值的下标;win为设置的预设时间窗口的长度。
本实施例中,预设时间窗口为win,以当前峰值的下标icenter对应的峰值为中心,从下标icenter对应的峰值的前win/2的值点中和后win/2的值点中找到最大值xmax,将判断该xmax是否为下标icenter对应的峰值,若是,则将下标icenter对应的峰值作为第一目标候选峰值,若不是,则将该下标icenter对应的峰值删除。
本发明一可选的实施例中,步骤15包括:
将所述第一目标峰值候选列表中的目标候选峰值的峰值因子大于预设阈值的所有目标候选峰值加入所述时间序列数据的第二目标峰值列表。可选的,所述峰值因子通过公式
Figure 458593DEST_PATH_IMAGE007
获得;其中,Crest为峰值因子;
Figure 256785DEST_PATH_IMAGE008
为第一目标峰值候选列表中的候选峰值的绝对值;xrms为以候选峰值为中心的窗口内的时间序列数据的有效值;
有效值通过公式:
Figure 721264DEST_PATH_IMAGE009
计算;其中,xi为时间序列中的第i个点;N为参与计算的时间序列数据的长度。
本实施例中,计算所有目标候选峰值的峰值因子,峰值因子是用于衡量时间序列的波动幅度的指标,峰值因子由时间序列数据的峰值与有效值RMS的比值计算得到,用于表示峰值在时间序列数据中波动的极端程度;通过公式
Figure 921302DEST_PATH_IMAGE007
计算得到,其中,有效值RMS也可以称作均方根,通过公式
Figure 242561DEST_PATH_IMAGE009
,先将所有目标候选峰值的平方进行求和,再计算均值,最后进行开方运算,得到均方根(有效值RMS)。
由于时间序列数据中的小幅波动在实际运维场景中不应被识别为峰值,该波动幅度微弱的峰值称为伪峰值,通过上述步骤将目标候选峰值的峰值因子和预设阈值的比较,可将时间序列数据中的伪峰值滤掉,将第一目标峰值候选列表中的目标候选峰值的峰值因子大于预设阈值的所有目标候选峰值加入第二目标峰值列表。
如图3和图4所示,一个具体的实施例3中,图3是未通过上述方法对图2中的时间序列数据进行峰值判断,图4是通过上述方法对图2中的时间序列数据进行峰值判断,可见,图3中将局部小幅度波动识别为峰值,同时漏判了数据中的窄阶梯峰值,图4中将窄阶梯准确判定为峰值,同时过滤掉了数据中的局部小幅度波动,更符合实际应用需求。
如图5所示,一个具体的实施例4中,在实际运维场景中,通过运维***获取原始时间序列数据X=(x1,x2,…,xm)作为输入时间序列,对该输入时间序列进行一阶差分运算,得到差分序列,以每个候选峰值中的峰值为中心,选取一预设时间窗口win,计算预设时间窗口win内的最大值,将该最大值与候选峰值中的峰值进行比对,筛选出最大值与候选峰值中的峰值相同的峰值,计算所有候选峰值的峰值因子,筛选出候选峰值的峰值因子大于阈值的峰值作为目标候选峰值(最终输出结果)。
如图6所示,步骤a1,初始化参数:当前下标cur=0;候选峰值下标peak_index=-1;有效指示符flag=0;候选峰值列表peak_list=null;长度限制阈值limit=L,这里,limit参数是可调参数,优选自定义范围为[2,3,4];
步骤a2,遍历差分序列diff_X,判断当前下标是否超过差分序列长度,如果超过,则结束流程,如果不超过,则进行当前下标差分值判断;
步骤a3,获取当前下标cur处的差分值diff_X[cur],并根据取值不同进入下列不同流程:
步骤a31,如果diff_X[cur]取值为0,则进入下列步骤a4;
步骤a32,如果diff_X[cur]取值为1,将有效指示符flag置1,当前下标cur赋予候选峰值下标peak_index;
步骤a33,如果diff_X[cur]取值为-1,则需进一步判断指示符flag是否为1,如果不为1,则直接进入步骤a34;如果为1,则需判断峰值长度是否超过阈值limit;即计算当前下标cur与候选峰值下标peak_index的差值,判断是否小于长度限制阈值limit;
步骤a331,如果大于或等于limit,则将flag置0,则进入下列步骤a4;
步骤a332,如果小于limit,则将候选峰值下标peak_index加入候选峰值列表peak_list,并将flag置0,并进入下列步骤b1;
步骤a4,将当前下标cur加1,判断是否超出差分序列边界,进入下一次循环。
基于具体的实施例4,如图7所示,以候选峰值为中心设置窗口,筛选候选峰值为窗内最大值的下标列表:
步骤b1,读入图6中的输出结果候选峰值下标列表peak_list和原始输入序列X;
步骤b2,初始化参数:当前下标cur=0;最大值列表max_list置为空;窗口长度win,其中,该窗口长度的参数是可调参数,取值范围优选设置为[5,20];
步骤b3,遍历候选峰值列表peak_list,判断当前下标cur是否超过列表边界,如果超过直接结束流程,如果不超过,则进入步骤b4;
步骤b4,以当前下标为中心,win为窗口长度,计算窗口的左右边界,左边界l为cur-win/2和0的最大值,右边界为cur+win/2和列表长度中的最小值;
步骤b5,计算窗口内的最大值max(X[l:r]),并判断当前值X[cur]是否为最大值;
步骤b51,如果当前值X[cur]大于或等与最大值,则将当前候选峰值下标加入最大值列表max_list,并进入步骤b6;
步骤b52,如果当前值小于最大值,则直接进入步骤b6;
步骤b6,将当前下标cur加1,判断是否超出候选峰值列表边界,进入下一次循环。
基于具体的实施例4,如图8所示,计算所有最大值列表中的峰值因子,筛选峰值因子大于阈值的峰值下标,作为最终输出结果:
步骤c1,读入图7中的输出结果最大值列表max_list和原始输入序列X;
步骤c2,初始化参数:当前下标cur=0;窗口长度win;结果输出列表output_list;峰值因子阈值threshold,该峰值因子阈值的参数是可调参数,取值范围优选为[1:3];
步骤c3,遍历最大值列表max_list,判断当前下标是否超过列表边界,如果超过,直接结束流程,否则进入步骤c4;
步骤c4,以当前下标为中心,win为窗口长度,计算窗口边界,取得窗口内的序列X[l:r];
步骤c5,计算窗口序列的有效值RMS,计算方法是将窗口序列X[l:r]中的每个值取平方,然后将平方结果求均值,最后进行开方运算,得到均方根值(RMS值);
步骤c6,计算当前点的峰值因子C,用当前点值X[cur]除以有效值RMS得到当前点的峰值因子;
步骤c7,判断当前点峰值因子是否大于或等于阈值threshold;如果是,则将当前下标cur加入结果输出列表output_list,将当前下标加1,进入下一循环;如果不是,则直接将当前下标加1,进入下一循环;
步骤c8,output_list即为最终判定的峰值输出结果。
本发明的实施例通过获取时间序列数据;对所述时间序列数据中的数据点进行差分运算处理,得到所述时间序列数据的差分序列;根据所述差分序列,获取所述时间序列数据的候选峰值列表;对所述候选峰值列表中的候选峰值进行筛选,获得第一目标峰值候选列表;根据所述第一目标峰值候选列表中的候选峰值的峰值因子和预设阈值,获得所述时间序列数据的第二目标峰值列表;解决了运维时间序列数据中窄阶梯峰值被漏判的问题,使准确率大大提高,可提高用户故障排查的效率。
如图9所示,本发明的实施例还提供时间序列数据的峰值检测装置90,所述装置90包括:
获取模块91,用于获取时间序列数据;
处理模块92,用于对所述时间序列数据中的数据点进行差分运算处理,得到所述时间序列数据的差分序列;以及根据所述差分序列,获取所述时间序列数据的候选峰值列表;对所述候选峰值列表中的候选峰值进行筛选,获得第一目标峰值候选列表;根据所述第一目标峰值候选列表中的候选峰值的峰值因子和预设阈值,获得所述时间序列数据的第二目标峰值列表。
可选的,所述差分序列DIFF_X=diff(X);
X为时间序列数据,X=(x1,x2,…,xm);
diff(xi)=xi+1-xi,其中,i=1,2,…,m-1,m为时间序列数据中数据点的个数;
其中,xi为下标为i的当前数据点;xi+1为当前数据点的后一个数据点。
可选的,根据所述差分序列,获取所述时间序列数据的所有候选峰值,包括:
将所述差分序列中的前一值点的差分值大于零且后一值点的差分值小于零的峰值形成的列表,作为所述时间序列数据的候选峰值列表;和/或
将所述差分序列中的相邻值点之间构成至少一个连续的差分值为零的零值对,且所述至少一个连续的差分值为零的零值对的前一值点的差分值大于零,所述至少一个连续的差分值为零的零值对的后一值点的差分值小于零的峰值形成的列表,作为所述时间序列数据的候选峰值列表。
可选的,对所述候选峰值列表中的候选峰值进行筛选,获得第一目标峰值候选列表,包括:
以所述候选峰值列表中的候选峰值中任意一峰值为中心,选取一预设时间窗口;
判断所述候选峰值是否为所述预设时间窗口中的最大值,若不是,将所述候选峰值从候选峰值列表中删除,获得第一目标峰值候选列表。
可选的,所述预设时间窗口中的最大值通过如下公式计算:
Figure 262470DEST_PATH_IMAGE006
其中,xmax为预设时间窗口内最大值;icenter为当前峰值的下标;win为设置的预设时间窗口的长度。
可选的,根据所述第一目标峰值候选列表中的候选峰值的峰值因子和预设阈值,获得所述时间序列数据的第二目标峰值列表,包括:
将所述第一目标峰值候选列表中的目标候选峰值的峰值因子大于预设阈值的所有目标候选峰值加入所述时间序列数据的第二目标峰值列表。
可选的,所述峰值因子通过公式
Figure 339097DEST_PATH_IMAGE007
获得;其中,Crest为峰值因子;
Figure 128061DEST_PATH_IMAGE008
为第一目标峰值候选列表中的候选峰值的绝对值;xrms为以候选峰值为中心的窗口内的时间序列数据的有效值;
有效值通过公式:
Figure 89064DEST_PATH_IMAGE009
计算;其中,xi为时间序列数据中的第i个点;N为参与计算的时间序列数据的长度。
需要说明的是,该装置是与上述方法对应的装置,上述方法实施例中的所有实现方式均适用于该装置的实施例中,也能达到相同的技术效果。
本发明的实施例还提供一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如上所述的方法对应的操作。
本发明的实施例还提供一种计算机可读存储介质,存储有指令,所述指令在计算机上运行时,使得计算机执行如上所述的方法。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
此外,需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行,某些步骤可以并行或彼此独立地执行。对本领域的普通技术人员而言,能够理解本发明的方法和装置的全部或者任何步骤或者部件,可以在任何计算装置(包括处理器、存储介质等)或者计算装置的网络中,以硬件、固件、软件或者它们的组合加以实现,这是本领域普通技术人员在阅读了本发明的说明的情况下运用他们的基本编程技能就能实现的。
因此,本发明的目的还可以通过在任何计算装置上运行一个程序或者一组程序来实现。所述计算装置可以是公知的通用装置。因此,本发明的目的也可以仅仅通过提供包含实现所述方法或者装置的程序代码的程序产品来实现。也就是说,这样的程序产品也构成本发明,并且存储有这样的程序产品的存储介质也构成本发明。显然,所述存储介质可以是任何公知的存储介质或者将来所开发出来的任何存储介质。还需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行。某些步骤可以并行或彼此独立地执行。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种时间序列数据的峰值检测方法,其特征在于,包括:
获取时间序列数据;
对所述时间序列数据中的数据点进行差分运算处理,得到所述时间序列数据的差分序列;
根据所述差分序列,获取所述时间序列数据的候选峰值列表;
对所述候选峰值列表中的候选峰值进行筛选,获得第一目标峰值候选列表;
根据所述第一目标峰值候选列表中的候选峰值的峰值因子和预设阈值,获得所述时间序列数据的第二目标峰值列表。
2.根据权利要求1所述的时间序列数据的峰值检测方法,其特征在于,所述差分序列DIFF_X=diff(X);X为时间序列数据,X=(x1,x2,…,xm);diff(xi)=xi+1-xi,其中,i=1,2,…,m-1,m为时间序列数据中数据点的个数;其中,xi为下标为i的当前数据点;xi+1为当前数据点的后一个数据点。
3.根据权利要求1所述的时间序列数据的峰值检测方法,其特征在于,根据所述差分序列,获取所述时间序列数据的候选峰值列表,包括:
将所述差分序列中的前一值点的差分值大于零且后一值点的差分值小于零的峰值形成的列表,作为所述时间序列数据的候选峰值列表;和/或
将所述差分序列中的相邻值点之间构成至少一个连续的差分值为零的零值对,且所述至少一个连续的差分值为零的零值对的前一值点的差分值大于零,所述至少一个连续的差分值为零的零值对的后一值点的差分值小于零的峰值形成的列表,作为所述时间序列数据的候选峰值列表。
4.根据权利要求1所述的时间序列数据的峰值检测方法,其特征在于,对所述候选峰值列表中的候选峰值进行筛选,获得第一目标峰值候选列表,包括:
以所述候选峰值列表中的候选峰值中任意一峰值为中心,选取一预设时间窗口;
判断所述候选峰值是否为所述预设时间窗口中的最大值,若不是,将所述候选峰值从候选峰值列表中删除,获得第一目标峰值候选列表。
5.根据权利要求4所述的时间序列数据的峰值检测方法,其特征在于,所述预设时间窗口中的最大值通过如下公式计算:
Figure DEST_PATH_IMAGE002
其中,xmax为预设时间窗口内最大值;icenter为当前峰值的下标;win为设置的预设时间窗口的长度。
6.根据权利要求1所述的时间序列数据的峰值检测方法,其特征在于,根据所述第一目标峰值候选列表中的候选峰值的峰值因子和预设阈值,获得所述时间序列数据的第二目标峰值列表,包括:
将所述第一目标峰值候选列表中的目标候选峰值的峰值因子大于预设阈值的所有目标候选峰值加入所述时间序列数据的第二目标峰值列表。
7.根据权利要求1或6所述的时间序列数据的峰值检测方法,其特征在于,所述峰值因子通过公式
Figure DEST_PATH_IMAGE004
获得;其中,Crest为峰值因子;
Figure DEST_PATH_IMAGE006
为第一目标峰值候选列表中的候选峰值的绝对值;xrms为以候选峰值为中心的窗口内的时间序列数据的有效值;
有效值通过公式:
Figure DEST_PATH_IMAGE008
计算;其中,xi为时间序列数据中的第i个点;N为参与计算的时间序列数据的长度。
8.一种时间序列数据的峰值检测装置,其特征在于,包括:
获取模块,用于获取时间序列数据;
处理模块,用于对所述时间序列数据中的数据点进行差分运算处理,得到所述时间序列数据的差分序列;以及根据所述差分序列,获取所述时间序列数据的候选峰值列表;对所述候选峰值列表中的候选峰值进行筛选,获得第一目标峰值候选列表;根据所述第一目标峰值候选列表中的候选峰值的峰值因子和预设阈值,获得所述时间序列数据的第二目标峰值列表。
9.一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的方法对应的操作。
10.一种计算机可读存储介质,其特征在于,存储有指令,所述指令在计算机上运行时,使得计算机执行如权利要求1至7任一项所述的方法。
CN202111614786.2A 2021-12-28 2021-12-28 一种时间序列数据的峰值检测方法、装置及设备 Pending CN113986711A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111614786.2A CN113986711A (zh) 2021-12-28 2021-12-28 一种时间序列数据的峰值检测方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111614786.2A CN113986711A (zh) 2021-12-28 2021-12-28 一种时间序列数据的峰值检测方法、装置及设备

Publications (1)

Publication Number Publication Date
CN113986711A true CN113986711A (zh) 2022-01-28

Family

ID=79734568

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111614786.2A Pending CN113986711A (zh) 2021-12-28 2021-12-28 一种时间序列数据的峰值检测方法、装置及设备

Country Status (1)

Country Link
CN (1) CN113986711A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118013257A (zh) * 2024-04-07 2024-05-10 一网互通(北京)科技有限公司 基于数据序列的峰值查找方法、装置及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488772A (zh) * 2016-01-26 2016-04-13 北京市环境保护监测中心 一种传感器信号峰值检测方法
CN105962920A (zh) * 2016-04-20 2016-09-28 广州视源电子科技股份有限公司 血压脉率检测方法及其***
US20170363072A1 (en) * 2016-06-21 2017-12-21 Doosan Heavy Industries & Construction Co., Ltd. Vibration monitoring and diagnosing system for wind power generator
CN108151869A (zh) * 2017-11-27 2018-06-12 广州航新航空科技股份有限公司 一种机械振动特征指标提取方法、***及装置
CN111929074A (zh) * 2020-08-19 2020-11-13 北京经纬恒润科技有限公司 车辆机械旋转部件故障诊断方法及装置
CN112364069A (zh) * 2020-09-14 2021-02-12 光大环境科技(中国)有限公司 基于时间序列的热电偶故障预警方法、***及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488772A (zh) * 2016-01-26 2016-04-13 北京市环境保护监测中心 一种传感器信号峰值检测方法
CN105962920A (zh) * 2016-04-20 2016-09-28 广州视源电子科技股份有限公司 血压脉率检测方法及其***
US20170363072A1 (en) * 2016-06-21 2017-12-21 Doosan Heavy Industries & Construction Co., Ltd. Vibration monitoring and diagnosing system for wind power generator
CN108151869A (zh) * 2017-11-27 2018-06-12 广州航新航空科技股份有限公司 一种机械振动特征指标提取方法、***及装置
CN111929074A (zh) * 2020-08-19 2020-11-13 北京经纬恒润科技有限公司 车辆机械旋转部件故障诊断方法及装置
CN112364069A (zh) * 2020-09-14 2021-02-12 光大环境科技(中国)有限公司 基于时间序列的热电偶故障预警方法、***及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118013257A (zh) * 2024-04-07 2024-05-10 一网互通(北京)科技有限公司 基于数据序列的峰值查找方法、装置及电子设备
CN118013257B (zh) * 2024-04-07 2024-06-07 一网互通(北京)科技有限公司 基于数据序列的峰值查找方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN110839016B (zh) 异常流量监测方法、装置、设备及存储介质
CN107563433B (zh) 一种基于卷积神经网络的红外小目标检测方法
CN108763346B (zh) 一种滑窗箱型图中值滤波的异常点处理方法
CN111177505A (zh) 指标异常检测模型的训练方法、推荐的方法及装置
WO2014198052A1 (en) Fast grouping of time series
CN111445108B (zh) 数据驱动的配电网线变关系诊断方法、装置及***
CN112560803A (zh) 基于时频分析与机器学习的雷达信号调制识别方法
CN108549078B (zh) 一种雷达脉冲信号跨信道合并及检测方法
CN112416662A (zh) 多时间序列数据异常检测方法与装置
CN112821559A (zh) 一种非侵入式家电负荷深度再识别方法
CN114978956A (zh) 智慧城市网络设备性能异常突变点检测方法及装置
CN113986711A (zh) 一种时间序列数据的峰值检测方法、装置及设备
Ferreira et al. Exploiting principal curves for power quality monitoring
CN105866748B (zh) 一种基于检测先验的固定窗长恒虚警检测方法
CN117290788B (zh) 一种基于改进小波变换算法的配电网故障辨识方法及***
CN114397569A (zh) 基于vmd参数优化、样本熵的断路器故障电弧检测方法
CN117290719B (zh) 基于数据分析的巡检管理方法、装置及存储介质
JP6148229B2 (ja) 遷移信号の動的クラスタリング
CN107392948B (zh) 一种分振幅实时偏振成像***的图像配准方法
CN117454081A (zh) 一种机械振动信号的去噪处理方法及装置
CN113740671A (zh) 一种基于vmd和elm的故障电弧识别方法
CN117330906A (zh) 设备电弧故障检测方法、装置、设备及存储介质
CN115510998A (zh) 交易异常值检测方法及装置
Ruchay et al. Removal of impulsive noise from color images with cascade switching algorithm
CN114548173A (zh) 一种精准的周期性检测方法、***及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20220128