CN113704323A - 一种基于htm改进的时序异常检测算法 - Google Patents

一种基于htm改进的时序异常检测算法 Download PDF

Info

Publication number
CN113704323A
CN113704323A CN202110978846.2A CN202110978846A CN113704323A CN 113704323 A CN113704323 A CN 113704323A CN 202110978846 A CN202110978846 A CN 202110978846A CN 113704323 A CN113704323 A CN 113704323A
Authority
CN
China
Prior art keywords
abnormal
htm
spatial
value
space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110978846.2A
Other languages
English (en)
Inventor
谢林涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dacheng Intelligent Technology Co ltd
Original Assignee
Hangzhou Dacheng Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dacheng Intelligent Technology Co ltd filed Critical Hangzhou Dacheng Intelligent Technology Co ltd
Priority to CN202110978846.2A priority Critical patent/CN113704323A/zh
Publication of CN113704323A publication Critical patent/CN113704323A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Algebra (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Operations Research (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Fuzzy Systems (AREA)
  • Computational Linguistics (AREA)
  • Combined Controls Of Internal Combustion Engines (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明公开了一种基于HTM改进的时序异常检测算法,包括:时序数据同时进入HTM算法、第一种异常空间范围、第二种异常空间范围以及第三种空间异常判定方法中;如果时序数据的当前值同时超出第一种异常空间范围和第二种异常空间范围,会被判定为异常;如果第三种空间异常判定方法中的异常概率
Figure 569822DEST_PATH_IMAGE001
大于阈值
Figure 676318DEST_PATH_IMAGE002
,则时序数据的当前值也会被判定为异常。经过HTM算法计算后的异常概率
Figure 763354DEST_PATH_IMAGE003
大于阈值
Figure 347919DEST_PATH_IMAGE004
,则时序数据的当前值也会被判定为异常。本发明解决HTM算法无法检测出偶发性尖峰突变的异常点。本发明提出了三种空间异常判定方法,配合使用,使得准确率大幅提高。

Description

一种基于HTM改进的时序异常检测算法
技术领域
本发明涉及时间序列数据异常检测领域,具体涉及一种基于HTM改进的时序异常检测算法。
背景技术
时序异常检测:现实生活中很多数据都是不断变化的时间序列数据,比如发动机上温度传感器监测到的温度,则是随着时间变化的时序数据,以及家中每分钟消耗的用电量,使用电脑时CPU的使用率等。这些数据中常常包含了异常点,所谓异常点,即***异常行为且与过去行为明显不同的时间点。不同***中的异常点往往反馈出不同的重要信息,温度传感器数据突然上升到临界值,表示温度过高,提醒操作人员需要及时对发动机降温,新产品网页上的页面点击率突然上升到异常高,表示需求大,消费者对该新产品有很大的兴趣。当然时序数据的异常检测还有很多用例,包括预防性维护,防欺诈,故障检测和监控等。且在许多行业中都有实际和重要的应用,包括金融、IT、安全、能源等。
算法HTM:对于流式时序数据的异常检测,分层时间记忆算法HTM,在各方面都表现出了很好的效果。大多数异常检测算法,需要事先学习批量时序数据,再做检测,而HTM算法可以实现在线学习不断调整模型,以无监督的方式实时输出决策结果。且HTM算法无需手动调整参数。作者们还在NAB项目中测试了多个异常检测的算法,包括著名的EtsySkyline,Twitter ADVec等,HTM最终取得了最高的准确率。
但在生产实践中,发现HTM算法异常检测的效果仍然达不到要求,其在准确率上仍有很大的提升空间,因此本发明基于HTM算法提出了优化方案,并在实际生产环境中测试,优化后的算法准确率得到了很大的提升,减少了很多误报,并发现了很多原HTM未检测出的异常。
现有技术对于空间异常的判定比较简单,即用(历史最大值-历史最小值)*空间容忍系数(通常是10%)得到空间容忍度。然后用历史最大值+空间容忍度得到空间容忍范围上界,用历史最小值-空间容忍度得到空间容忍范围下界。最后用当前值和空间容忍范围上下界比较,如果当前值大于空间容忍范围上界或当前值小于空间容忍范围下界,则判定为异常。该方法没有考虑到时序数据自身的波动性对于空间异常判定的影响,通常,波动较大的数据,应该有更大的空间异常容忍范围,而对于比较稳定的数据,空间异常容忍范围应该更小。因此,本发明在该基础上添加了变异系数和激活函数,来平衡自身数据波动对空间异常范围的影响。
发明内容
本发明提供了一种基于HTM改进的时序异常检测算法,本发明解决HTM算法无法检测出偶发性尖峰突变的异常点。本发明解决HTM算法对于空间异常的判定过于简单,没有考虑到时序数据本身的波动性对异常判定的影响。本发明解决HTM算法有时误报较多,有时检测不出真正异常等准确率低的问题。
本发明主要提出三种空间异常判定方法。第一、第二种判定方法均使用了滑动历史最大值和滑动历史最小值,应用激活函数和变异系数,得到两个异常空间范围,并根据当前值是否同时超出两个异常空间范围来判定是否异常。第三种判定方法通过使用了滑动历史平均值和滑动历史标准差,对当前时间前10个点的平均值应用互补误差函数
Figure 287227DEST_PATH_IMAGE001
和对数,得到异常分,并根据异常分是否大于阈值来判定是否异常。
一种基于HTM改进的时序异常检测算法,包括以下步骤:
1)时序数据同时进入HTM算法、第一种空间异常判定方法产生的第一种异常空间范围、第二种空间异常判定方法产生的第二种异常空间范围以及第三种空间异常判定方法中;
2)如果时序数据的当前值同时超出第一种异常空间范围和第二种异常空间范围,会被判定为异常;
如果第三种空间异常判定方法中的异常概率
Figure 658166DEST_PATH_IMAGE002
大于阈值
Figure 683366DEST_PATH_IMAGE003
,则时序数据的当前值也会被判定为异常,阈值
Figure 506966DEST_PATH_IMAGE003
的范围为[0.6,1),通常阈值
Figure 160801DEST_PATH_IMAGE003
设定为0.8;
经过HTM算法计算后的异常概率
Figure 386246DEST_PATH_IMAGE004
大于阈值
Figure 319698DEST_PATH_IMAGE005
,则时序数据的当前值也会被判定为异常,阈值
Figure 161752DEST_PATH_IMAGE005
的范围为[0.6,1),通常阈值
Figure 88120DEST_PATH_IMAGE005
设定为0.8。
本发明提出第一种空间异常判定方法中,空间容忍度的系数为
Figure 184383DEST_PATH_IMAGE006
,由激活函数和变异系数线性组合而成,其中激活函数不限于使用tanh。
本发明提出第二种空间异常判定方法,其中滑动历史最大值和滑动历史最小值的系数为
Figure 803583DEST_PATH_IMAGE007
,由激活函数和变异系数线性组合而成,其中激活函数不限于使用tanh。
对于前两种空间异常判定方法,需要结合使用,只有当前值同时超出两种判定方法得到异常空间范围则判定为异常。
本发明提出第三种空间异常判定方法,利用高斯尾概率和公式
Figure 601775DEST_PATH_IMAGE008
得到异常概率,用
Figure 348145DEST_PATH_IMAGE009
和阈值进行比较,判定当前值是否异常。
步骤1)中,第一种空间异常判定方法、第二种空间异常判定方法和第三种空间异常判定方法中
Figure 282603DEST_PATH_IMAGE010
Figure 72704DEST_PATH_IMAGE011
Figure 623771DEST_PATH_IMAGE012
参数建立,具体包括: 对于一条时序数据
Figure 639745DEST_PATH_IMAGE013
,随着时间的变化,数据每隔一段时间都在不断产生新的数值,每隔
Figure 959867DEST_PATH_IMAGE014
点,计算出当前时间点前
Figure 920870DEST_PATH_IMAGE015
个点的滑动历史最大值
Figure 444387DEST_PATH_IMAGE010
和滑动历史最小值
Figure 516248DEST_PATH_IMAGE011
,不包括当前时间点。
Figure 690877DEST_PATH_IMAGE014
=5~100,
Figure 573514DEST_PATH_IMAGE015
为1000~10000,其中
Figure 833594DEST_PATH_IMAGE015
通常为8640;
Figure 443567DEST_PATH_IMAGE016
Figure 738282DEST_PATH_IMAGE017
其中,
Figure 526240DEST_PATH_IMAGE018
为当前时间点前
Figure 273616DEST_PATH_IMAGE015
个点的时序数据,不包括当前时间点;
同时得到滑动历史均值
Figure 952859DEST_PATH_IMAGE019
和滑动历史标准差
Figure 584305DEST_PATH_IMAGE020
,其中
Figure 58011DEST_PATH_IMAGE021
函数是求最大值,
Figure 292683DEST_PATH_IMAGE022
函数是求最小值,
Figure 244459DEST_PATH_IMAGE023
函数是求和。
步骤1)中,第一种空间异常判定方法,具体包括:
1.1.1)得到空间容忍度
Figure 998919DEST_PATH_IMAGE024
Figure 643527DEST_PATH_IMAGE025
1.1.2)得到空间容忍范围上界
Figure 99917DEST_PATH_IMAGE026
Figure 606115DEST_PATH_IMAGE027
,其中,
Figure 729929DEST_PATH_IMAGE028
为双曲正切函数,cv为变异系数,
Figure 545438DEST_PATH_IMAGE029
Figure 489124DEST_PATH_IMAGE030
取0.1~10,
Figure 799013DEST_PATH_IMAGE031
取0 ~1,通常
Figure 511754DEST_PATH_IMAGE030
取2,
Figure 498165DEST_PATH_IMAGE031
取0.1;
1.1.3)得到空间容忍范围下界
Figure 942528DEST_PATH_IMAGE032
Figure 39797DEST_PATH_IMAGE033
步骤1)中,第二种空间异常判定方法,具体包括:
1.2.1)得到空间容忍范围上界:
Figure 607045DEST_PATH_IMAGE034
Figure 780668DEST_PATH_IMAGE035
1.2.2)得到空间容忍范围下界:
Figure 698946DEST_PATH_IMAGE036
Figure 599906DEST_PATH_IMAGE037
,abs为取绝对值;
其中,
Figure 287239DEST_PATH_IMAGE028
为双曲正切函数,cv为变异系数,
Figure 366185DEST_PATH_IMAGE029
Figure 506179DEST_PATH_IMAGE038
取0.1~10,
Figure 476409DEST_PATH_IMAGE039
取0~1,通常
Figure 768981DEST_PATH_IMAGE038
取0.5,
Figure 533675DEST_PATH_IMAGE039
取0.1。
步骤1)中,第三种空间异常判定方法,具体包括:
1.3.1)将时序数据的原始数据分布建模为滚动正态分布,即均值和标准差不断更新,这里的均值和标准差采用的是上述计算得到的
Figure 160965DEST_PATH_IMAGE040
Figure 138149DEST_PATH_IMAGE041
1.3.2)计算当前时间最近
Figure 813456DEST_PATH_IMAGE042
个点的平均值,
Figure 483472DEST_PATH_IMAGE042
=5~100,包括当前时间点:
Figure 598058DEST_PATH_IMAGE043
1.3.3)利用互补误差函数
Figure 395244DEST_PATH_IMAGE001
计算得到异常概率
Figure 911676DEST_PATH_IMAGE044
为:
Figure 752593DEST_PATH_IMAGE045
,其中,
Figure 370787DEST_PATH_IMAGE046
,x为该函数的积分下限,t为积分变量;
1.3.4)通常
Figure 955353DEST_PATH_IMAGE044
的数值很小,不方便应用阈值判定异常,因此对该异常概率值
Figure 326291DEST_PATH_IMAGE044
取对数得到新的概率值
Figure 603689DEST_PATH_IMAGE047
Figure 178021DEST_PATH_IMAGE048
,其中
Figure 566277DEST_PATH_IMAGE049
为以自然常数
Figure 57301DEST_PATH_IMAGE050
为底的对数。
与现有技术相比,本发明具有如下优点。
(1)准确率高:本发明提出了三种空间异常判定方法,配合使用,使得准确率大幅提高,在多个真实数据集样例上测试,平均准确率提高达20%以上。
(2)适用范围广:本发明在前两种异常判定方法中,提出用激活函数tanh和变异系数组成的复合函数作为系数,使得该判定方法不仅能识别波动性大的时序数据中的异常点,同时对于波动性小的数据,以及由波动性大变化到波动性小的数据,由波动性小变化到波动性大的数据,都能很好的识别出异常点。
(3)使用范围广:本发明提出的基于HTM改进的异常检测算法,适用于任何时序数据。
(4)简单阈值:本发明中第三种空间异常判定方法应用互补误差函数
Figure 987823DEST_PATH_IMAGE001
和对数,使得简单阈值的方式来判定是否异常。
(5)实时性:每隔
Figure 564298DEST_PATH_IMAGE014
(如10)个点取滑动窗口W个点内的数据,计算相应的指标,减少了计算开销,保证了实时性。
附图说明
图1是本发明基于HTM改进的时序异常检测算法的异常检测的原理图。
具体实施方式
如图1所示,一种基于HTM改进的时序异常检测算法,包括以下步骤:
1)时序数据同时进入HTM算法、第一种空间异常判定方法产生的第一种异常空间范围、第二种空间异常判定方法产生的第二种异常空间范围以及第三种空间异常判定方法中;
2)如果时序数据的当前值同时超出第一种异常空间范围和第二种异常空间范围,会被判定为异常;
如果第三种空间异常判定方法中的异常概率
Figure 756245DEST_PATH_IMAGE047
大于阈值
Figure 836196DEST_PATH_IMAGE003
,则时序数据的当前值也会被判定为异常,阈值
Figure 206129DEST_PATH_IMAGE003
的范围为[0.6,1),通常阈值
Figure 269900DEST_PATH_IMAGE003
设定为0.8。
经过HTM算法计算后的异常概率
Figure 734379DEST_PATH_IMAGE051
大于阈值
Figure 950728DEST_PATH_IMAGE005
,则时序数据的当前值也会被判定为异常,阈值
Figure 740830DEST_PATH_IMAGE005
的范围为[0.6,1),通常阈值
Figure 760738DEST_PATH_IMAGE005
设定为0.8。
本发明是为了改进HTM算法在做时序数据异常检测时,对于空间异常的判定过于简单,导致误报较多或准确率较低的问题,通过优化算法提高异常检测的准确率。包括以下方面:
首先,对于一条时序数据
Figure 310799DEST_PATH_IMAGE013
,随着时间的变化,数据每隔一段时间都在不断产生新的数值,为了计算性能,每隔10个点,计算出当前时间点前
Figure 365343DEST_PATH_IMAGE015
个点的滑动历史最大值
Figure 60767DEST_PATH_IMAGE010
和滑动历史最小值
Figure 99130DEST_PATH_IMAGE011
,不包括当前时间点,其中
Figure 918794DEST_PATH_IMAGE015
通常为8640。
Figure 93423DEST_PATH_IMAGE052
Figure 225327DEST_PATH_IMAGE053
。同时可以得到滑动历史均值
Figure 970560DEST_PATH_IMAGE019
和滑动历史标准差
Figure 846112DEST_PATH_IMAGE020
。其中
Figure 140828DEST_PATH_IMAGE021
函数是求最大值,
Figure 178054DEST_PATH_IMAGE022
函数是求最小值,
Figure 676162DEST_PATH_IMAGE023
函数是求和。
一、第一种空间异常判定方法:
1、得到空间容忍度:
Figure 355405DEST_PATH_IMAGE025
2、得到空间容忍范围上界:
Figure 239048DEST_PATH_IMAGE054
Figure 463487DEST_PATH_IMAGE055
,其中
Figure 432580DEST_PATH_IMAGE056
为双曲正切函数,cv为变异系数,
Figure 649935DEST_PATH_IMAGE029
,通常
Figure 388083DEST_PATH_IMAGE030
取2,
Figure 69511DEST_PATH_IMAGE031
取0.1。
3、得到空间容忍范围下界:
Figure 525900DEST_PATH_IMAGE057
Figure 281366DEST_PATH_IMAGE058
二、第二种空间异常判定方法:
1、得到空间容忍范围上界:
Figure 155913DEST_PATH_IMAGE059
Figure 971422DEST_PATH_IMAGE060
,通常
Figure 915107DEST_PATH_IMAGE038
取0.5,
Figure 224997DEST_PATH_IMAGE039
取0.1;
2、得到空间容忍范围下界:
Figure 937738DEST_PATH_IMAGE061
Figure 924148DEST_PATH_IMAGE062
三、第三种空间异常判定方法:
1、我们将原始数据分布建模为滚动正态分布,即均值和标准差不断更新,这里的均值和标准差采用的是上述计算得到的
Figure 620709DEST_PATH_IMAGE040
Figure 468710DEST_PATH_IMAGE041
2、计算当前时间最近10个点的平均值,包括当前时间点:
Figure 301537DEST_PATH_IMAGE063
3、利用互补误差函数
Figure 458849DEST_PATH_IMAGE001
计算得到异常概率
Figure 859350DEST_PATH_IMAGE044
为:
Figure 25889DEST_PATH_IMAGE064
,其中,
Figure 713222DEST_PATH_IMAGE065
,x为该函数的积分下限,t为积分变量;
4、通常
Figure 41436DEST_PATH_IMAGE044
的数值很小,不方便应用阈值判定异常,因此对该异常概率值取对数得到新的概率值
Figure 932162DEST_PATH_IMAGE047
Figure 636813DEST_PATH_IMAGE048
,其中
Figure 178653DEST_PATH_IMAGE049
为以自然常数
Figure 694079DEST_PATH_IMAGE050
为底的对数。
四、判定当前值是否空间异常:
1、如果当前值同时超出两种空间异常范围,会被判定为异常,即
Figure 321369DEST_PATH_IMAGE066
Figure 564132DEST_PATH_IMAGE067
为异常,其中
Figure 242369DEST_PATH_IMAGE068
为当前值;
2、如果第三种空间异常判定方法中的异常概率
Figure 912385DEST_PATH_IMAGE069
大于阈值
Figure 761392DEST_PATH_IMAGE070
,则当前时间点的数值也会被判定为异常,通常阈值
Figure 73425DEST_PATH_IMAGE070
设定为0.8。
现有技术中对空间异常的判定,没有考虑到时序数据的波动性会发生较大变化的情况,比如由波动性较大的模式转变成波动性较小的模式,空间容忍范围,即历史最大值和最小值仍由波动性较大时间段的数据所决定。因此,本发明不采用历史最大值和历史最小值去构建空间容忍范围,而是使用近historicWindowSize(通常为8640)个点的数据的滑动历史最大值和滑动历史最小值代替。
现有技术中对空间异常的判定,不能很好地检测出波动性一直较小的数据的空间异常,因为波动性一直较小的数据,空间容忍度较小,因此稍有波动,误报就会增多。本发明提出了第二种空间异常的判定方法,即得到第二种空间容忍范围,由滑动历史最小值和滑动历史最大值各自乘以一个系数组合得到的容忍范围,只有当前值同时超出了两个空间容忍范围时,才会被判定异常。
现有技术中无论是对空间异常的判定还是对时机异常的判定,都无法检出较缓慢出现的尖峰异常值,因此,本发明提出了第三种空间异常的判定方法,即对原始时序数据,求得当前时刻前10个点的平均值作为当前值,并利用近historicWindowSize个点的数据得到滑动历史平均值和滑动历史标准差,最后应用互补误差函数判定当前值是否异常。

Claims (8)

1.一种基于HTM改进的时序异常检测算法,其特征在于,包括以下步骤:
1)时序数据同时进入HTM算法、第一种空间异常判定方法产生的第一种异常空间范围、第二种空间异常判定方法产生的第二种异常空间范围以及第三种空间异常判定方法;
2)如果时序数据的当前值同时超出第一种异常空间范围和第二种异常空间范围,会被判定为异常;
如果第三种空间异常判定方法中的异常概率
Figure 817913DEST_PATH_IMAGE001
大于阈值
Figure 813682DEST_PATH_IMAGE002
,则时序数据的当前值也会被判定为异常;
经过HTM算法计算后的异常概率
Figure 186895DEST_PATH_IMAGE003
大于阈值
Figure 785366DEST_PATH_IMAGE004
,则时序数据的当前值也会被判定为异常。
2.根据权利要求1所述的基于HTM改进的时序异常检测算法,其特征在于,步骤1)中,第一种空间异常判定方法、第二种空间异常判定方法和第三种空间异常判定方法中
Figure 678367DEST_PATH_IMAGE005
Figure 94305DEST_PATH_IMAGE006
Figure 830180DEST_PATH_IMAGE007
Figure 104779DEST_PATH_IMAGE008
参数建立,具体包括:
对于一条时序数据
Figure 242499DEST_PATH_IMAGE009
,随着时间的变化,数据每隔一段时间都在不断产生新的数值,每隔
Figure 563759DEST_PATH_IMAGE010
个点,计算出当前时间点前
Figure 662296DEST_PATH_IMAGE011
个点的滑动历史最大值
Figure 602570DEST_PATH_IMAGE012
和滑动历史最小值
Figure 719431DEST_PATH_IMAGE013
,不包括当前时间点;
Figure 618117DEST_PATH_IMAGE014
其中,
Figure 938371DEST_PATH_IMAGE015
为当前时间点前
Figure 806970DEST_PATH_IMAGE016
个点的时序数据,不包括当前时间点;
同时得到滑动历史均值
Figure 653703DEST_PATH_IMAGE017
和滑动历史标准差
Figure 333077DEST_PATH_IMAGE018
,其中
Figure 530840DEST_PATH_IMAGE019
函数是求最大值,
Figure 937551DEST_PATH_IMAGE020
函数是求最小值,
Figure 776806DEST_PATH_IMAGE021
函数是求和。
3.根据权利要求2所述的基于HTM改进的时序异常检测算法,其特征在于,步骤1)中,
Figure 751716DEST_PATH_IMAGE022
=5~100,
Figure 295829DEST_PATH_IMAGE011
为1000~10000。
4.根据权利要求2所述的基于HTM改进的时序异常检测算法,其特征在于,步骤1)中,第一种空间异常判定方法,具体包括:
1.1.1)得到空间容忍度
Figure 647176DEST_PATH_IMAGE023
Figure 343868DEST_PATH_IMAGE024
1.1.2)得到空间容忍范围上界
Figure 614312DEST_PATH_IMAGE025
Figure 521088DEST_PATH_IMAGE027
1.1.3)得到空间容忍范围下界
Figure 20334DEST_PATH_IMAGE028
Figure 961745DEST_PATH_IMAGE030
其中,
Figure 668670DEST_PATH_IMAGE031
为双曲正切函数,cv为变异系数,
Figure 672529DEST_PATH_IMAGE032
Figure 365679DEST_PATH_IMAGE033
取0.1~10,
Figure 20651DEST_PATH_IMAGE034
取0~1。
5.根据权利要求2所述的基于HTM改进的时序异常检测算法,其特征在于,步骤1)中,第二种空间异常判定方法,具体包括:
1.2.1)得到空间容忍范围上界:
Figure 508264DEST_PATH_IMAGE035
Figure 262069DEST_PATH_IMAGE036
1.2.2)得到空间容忍范围下界:
Figure 758909DEST_PATH_IMAGE037
Figure 268388DEST_PATH_IMAGE038
,abs为取绝对值;
其中,
Figure 802269DEST_PATH_IMAGE039
为双曲正切函数,cv为变异系数,
Figure 170933DEST_PATH_IMAGE040
Figure 64940DEST_PATH_IMAGE041
Figure 835450DEST_PATH_IMAGE042
取0.1~10,
Figure 274653DEST_PATH_IMAGE043
取0~1。
6.根据权利要求2所述的基于HTM改进的时序异常检测算法,其特征在于,步骤1)中,第三种空间异常判定方法,具体包括:
1.3.1)将时序数据的原始数据分布建模为滚动正态分布,即均值
Figure 255247DEST_PATH_IMAGE044
和标准差
Figure 828311DEST_PATH_IMAGE045
不断更新;
1.3.2)计算当前时间最近
Figure 63114DEST_PATH_IMAGE046
个点的平均值
Figure 329010DEST_PATH_IMAGE047
Figure 265742DEST_PATH_IMAGE048
=5~100,包括当前时间点:
Figure 780513DEST_PATH_IMAGE049
1.3.3)利用互补误差函数
Figure 994456DEST_PATH_IMAGE050
计算得到异常概率
Figure 555888DEST_PATH_IMAGE051
为:
Figure 120861DEST_PATH_IMAGE052
Figure 911094DEST_PATH_IMAGE053
1.3.4)对异常概率值
Figure 369757DEST_PATH_IMAGE054
取对数得到新的概率值
Figure 977456DEST_PATH_IMAGE055
Figure 639513DEST_PATH_IMAGE056
,其中
Figure 358070DEST_PATH_IMAGE057
为以自然常数
Figure 671240DEST_PATH_IMAGE058
为底的对数。
7.根据权利要求1所述的基于HTM改进的时序异常检测算法,其特征在于,步骤1)中,阈值
Figure 325206DEST_PATH_IMAGE059
的范围为[0.6,1)。
8.根据权利要求1所述的基于HTM改进的时序异常检测算法,其特征在于,步骤1)中,阈值
Figure 864772DEST_PATH_IMAGE060
的范围为[0.6,1)。
CN202110978846.2A 2021-08-25 2021-08-25 一种基于htm改进的时序异常检测算法 Pending CN113704323A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110978846.2A CN113704323A (zh) 2021-08-25 2021-08-25 一种基于htm改进的时序异常检测算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110978846.2A CN113704323A (zh) 2021-08-25 2021-08-25 一种基于htm改进的时序异常检测算法

Publications (1)

Publication Number Publication Date
CN113704323A true CN113704323A (zh) 2021-11-26

Family

ID=78654494

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110978846.2A Pending CN113704323A (zh) 2021-08-25 2021-08-25 一种基于htm改进的时序异常检测算法

Country Status (1)

Country Link
CN (1) CN113704323A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115158399A (zh) * 2022-06-14 2022-10-11 通号城市轨道交通技术有限公司 时序信号异常检测方法及***

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115158399A (zh) * 2022-06-14 2022-10-11 通号城市轨道交通技术有限公司 时序信号异常检测方法及***
CN115158399B (zh) * 2022-06-14 2023-10-17 通号城市轨道交通技术有限公司 时序信号异常检测方法及***

Similar Documents

Publication Publication Date Title
CN117093879B (zh) 一种数据中心智能化运营管理方法及***
He et al. Performance assessment of wind turbines: Data-derived quantitative metrics
CN112284440B (zh) 一种传感器数据偏差自适应修正方法
El-Midany et al. A proposed framework for control chart pattern recognition in multivariate process using artificial neural networks
CN103488135B (zh) 一种用于半导体生产加工过程监控的统计过程控制方法
Ma et al. Fault detection for dynamic processes based on recursive innovational component statistical analysis
CN111582542B (zh) 一种基于异常修复的电力负荷预测方法及***
CN111931834B (zh) 基于孤立森林算法的铝型材挤压过程流数据异常检测方法、设备及存储介质
CN111445103A (zh) 一种基于工业互联网的输电线缆生产质量管理反馈***
Wang et al. Fault detection and diagnosis for multiple faults of VAV terminals using self-adaptive model and layered random forest
CN104537220A (zh) 基于主元分析和d-s证据理论的故障诊断方法
CN117668684B (zh) 基于大数据分析的电网电能数据异常检测方法
Zhong et al. Multimode non‐Gaussian process monitoring based on local entropy independent component analysis
CN117783745B (zh) 用于换电柜的数据在线监测方法及***
CN112598144A (zh) 基于相关性分析的cnn-lstm突发故障预警方法
CN113704323A (zh) 一种基于htm改进的时序异常检测算法
CN114004331A (zh) 一种基于关键指标和深度学习的故障分析方法
CN116235148A (zh) 干泵宕机的预警方法、装置、电子设备、存储介质及程序
CN114770607A (zh) 一种基于大数据的机器人健康监控方法及***
CN106325258B (zh) 一种基于在线监测信息的继电保护装置状态评估方法
CN116151799A (zh) 一种基于bp神经网络的配电线路多工况故障率快速评估方法
CN114254904B (zh) 一种风电机组机舱运行健康度评价方法及装置
Mesa-Jiménez et al. Early warning signals of failures in building management systems
Maqbool et al. An efficient fault-prediction mechanism for improving yield in industry 5.0
Lee et al. Autoencoder-based detector for distinguishing process anomaly and sensor failure

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 310000 Room 401, building 1, 1399 liangmu Road, Cangqian street, Yuhang District, Hangzhou City, Zhejiang Province

Applicant after: Hangzhou Chengyun Digital Technology Co.,Ltd.

Address before: 310000 Room 401, building 1, 1399 liangmu Road, Cangqian street, Yuhang District, Hangzhou City, Zhejiang Province

Applicant before: Hangzhou Dacheng Intelligent Technology Co.,Ltd.