CN112257917A - 一种基于熵特征和神经网络的时间序列异常模式检测方法 - Google Patents

一种基于熵特征和神经网络的时间序列异常模式检测方法 Download PDF

Info

Publication number
CN112257917A
CN112257917A CN202011116876.4A CN202011116876A CN112257917A CN 112257917 A CN112257917 A CN 112257917A CN 202011116876 A CN202011116876 A CN 202011116876A CN 112257917 A CN112257917 A CN 112257917A
Authority
CN
China
Prior art keywords
sequence
score
abnormal
sample
entropy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011116876.4A
Other languages
English (en)
Other versions
CN112257917B (zh
Inventor
苏维均
牛雨晴
于重重
赵霞
韩璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Technology and Business University
Original Assignee
Beijing Technology and Business University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Technology and Business University filed Critical Beijing Technology and Business University
Priority to CN202011116876.4A priority Critical patent/CN112257917B/zh
Publication of CN112257917A publication Critical patent/CN112257917A/zh
Application granted granted Critical
Publication of CN112257917B publication Critical patent/CN112257917B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Agronomy & Crop Science (AREA)
  • Animal Husbandry (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Mining & Mineral Resources (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)
  • Complex Calculations (AREA)

Abstract

本发明提出一种基于熵特征和神经网络的时间序列异常模式检测方法,该方法的步骤为:1)对训练数据集中的时间序列提取二阶差分率样本熵特征序列;2)训练生成对抗网络模型得到生成器和对应的判别器;3)计算特征序列的异常分数并构建阈值;4)根据阈值对输入的待检测数据进行异常判断。本发明的优点是利用差分率样本熵对时间序列数据进行特征提取,使异常模式更加显著;建立了新的异常分数计算方法,提高了模型识别的准确性和泛化性,使其具有更高的实用性和应用价值。

Description

一种基于熵特征和神经网络的时间序列异常模式检测方法
技术领域
本发明涉及煤矿热动力复合灾害的预测,具体涉及一种基于熵特征和神经网络的时间序列异常模式检测方法,属于应急安全领域。
背景技术
煤炭作为主体能源在我国能源结构中占有不可替代的重要地位,煤矿开采完后遗留的区域为采空区,采空区内通风不良且遗煤较多,不断氧化产生可燃性气体从而容易引发煤自燃、瓦斯***等煤矿热动力灾害。释放出的可燃性气体的浓度变化随着时间的发展呈现一定的规律,有效地检测出不同阶段监测数据发生的拐点,当气体浓度发生较大变化时,可以认为进入了异常模式,表明有煤自燃等灾害发生的可能。不同煤矿气体产生含量不同,如果只以气体含量值的大小作为灾害发生的判定标准,应用于其他煤矿时可能会造成很大的误差,因此,异常模式的检测可以提高灾害的判定的泛化性,为煤炭复合灾害的检测提供一种新思路。
随着人们对人工智能理论研究与深入,应用时间序列预测方法对煤与瓦斯进行预测成为一种新的趋势,人们将其引入到煤与瓦斯灾害定量评价与分析中,并融合了计算机技术、支持向量机、人工神经网络等理论进行研究,但这些预测方法难以运用在复杂数据中,存在易陷入局部最小值的问题,出现过拟合现象,准确率低,局限性大。
随着信息化技术的提高,时间序列中的异常检测问题成为近年来的研究热点。时间序列异常通常是指在一系列数据中有着明显不同于其他数据,这种异常并不是指随机偏差产生的,而是因为不同的机制所产生的差异。对气体时序数据的异常模式进行检测,可以为煤矿热动力灾害提供理论基础。若时序数据中存在异常模式,则说明数据的变化趋势发生了较大的改变,可作为灾害发生的判断依据。
现有方法(CN201910809956.9)利用GAN对时间序列进行异常检测,主要是用优化的GAN生成器和判别器搭建异常检测的模型,用模型输出的生成残差和鉴别损失作为判断异常数据的判断依据。但是大部分时间序列的变化不显著,直接用时间序列作为GAN的输入数据,其特征不够显著;同时用模型输出的生成残差和鉴别损失获取更为有效的评判准则,如何提高异常判断的准确性和普适性都还有待研究。
发明内容
本发明的目的在于实现一种基于熵特征和神经网络的时间序列异常模式检测方法。本发明的方法分为4个阶段:对训练数据集中的时间序列提取二阶差分率样本熵特征序列;训练生成对抗网络模型得到生成器和对应的判别器;计算特征序列的异常分数并构建阈值;根据阈值对输入的待检测数据进行异常判断。具体来说,本发明的方法包括下列步骤:
A.对训练数据集中的时间序列提取二阶差分率样本熵特征序列,具体实现如下:
A1.将训练数据集分成两个集合,分别记为训练数据集1和训练数据集2;
所述的训练数据集1中全部为正常数据,训练数据集2中包括正常数据和异常数据;
A2.对训练数据集1时间序列
Figure BDA0002730598460000021
通过式1以窗口大小w和步长d滑动进行分段,得到长度为L的序列段集合W,其中第i个时间序列片段记为si
si=[x1+(i-1)d,x2+(i-1)d,…,x1+(i-1)d+w] (式1)
所述的Ttrain表示训练数据集时间序列个数,1×Ttrain表示训练数据集时间序列维度;
A3.对序列段集合W中的每个序列段进行差分率运算,得到所有序列段的二阶差分率序列,具体实现如下:
A3.1.对序列段si利用式2计算其二阶差分率序列G={g1,g2,…,gw′},并求其标准差std;
Figure BDA0002730598460000022
所述的
Figure BDA0002730598460000023
为u时间点的e阶差分值,
Figure BDA0002730598460000024
为u-1时间点的e阶差分值;
A3.2.以m个时序数据点为一个子片段划分具有w′个数据点的二阶差分率序列,共计w′-m+1个子序列片段,记为K2i={q1,q2,…,qw′-m+1};
A4.对所有序列段的二阶差分率序列进行样本熵特征提取,得到所有序列段的二阶差分率样本熵特征序列,具体实现如下:
A4.1.计算任意两个子序列片段qa和qb之间的距离D[qa,qb],该距离由两个子序列片段中对应位置元素的最大差值决定;
A4.2.计算子序列片段qa与其余子序列片段的相似概率,通过式3得到子序列段间距离小于阈值的子序列段的占比,通过式4得到该二阶差分率序列的平均相似概率;
Figure BDA0002730598460000031
Figure BDA0002730598460000032
所述的r为相似度阈值;
A4.3.按照步骤A4.1-A4.2,以m+1为子序列长度重新计算其平均相似概率Bm+1(r),通过式5得到二阶差分率样本熵特征SE;
Figure BDA0002730598460000033
A5.对差分率样本熵序列进行分段平均预处理,得到差分率样本熵序列,具体实现如下:
A5.1.从Xt(t=1,2...t-w),取出长度为w的序列段St={Xt,Xt+1,...,Xw+t-1}1×t,先根据式6求和,再根据式7求平均值;
sumt=Xt+Xt+1...Xw+t-1 (式6)
sumt=sumt/w; (式7)
A5.2.重复步骤A4.1,共取出t-w个序列段,并将sumt组成新的差分率样本熵序列St'={sum1,sum2,…,sumt-w}1×t
B.训练生成对抗网络模型得到生成器和对应的判别器,具体实现如下:
B1.随机采样噪声数据Z={zi,i=1,2,…,n},其中n与样本数对应。生成器模型G为多个LSTM记忆单元,并且设置记忆单元的个数,将Z输入到生成器模型G中,生成重构的样本序列数据G(Z);
B2.将新的差分率样本熵序列St'和生成的重构样本序列数据G(Z)输入搭建好的判别器模型D中;
B3.根据损失函数的值利用随机梯度下降算法更新模型参数,并且先更新判别器的参数,然后通过Adam优化算法并根据噪声数据更新生成器的参数;
B4.保存模型参数,再重复步骤B1-B3进行循环迭代,最后得到训练好的能够产生正常时间序列的生成器模型G*和对应的判别器模型D*;
C.计算特征序列的异常分数并构建阈值,具体实现如下:
C1.利用训练数据集2中的时间序列
Figure BDA0002730598460000041
重复步骤A2-A5,提取特征得到新特征序列
Figure BDA0002730598460000042
C2.将随机采样噪声数据Zval输入到训练完成的生成器G*中,生成重构样本G*(Zval),再利用生成误差计算输入样本的生成异常分数Rscore,具体实现如下:
C2.1.对长度为n的重构样本G*(Zval)与训练数据集2的新特征序列
Figure BDA0002730598460000043
的绝对误差e中元素从小到大进行排序,得到排序后的绝对误差Ei′={e′1,e′2,…,e′n},求排序后绝对误差Ei′={e′1,e′2,…,e′n}的平均值M;
C2.2.将E′i提中元素与平均值M比较,取出E′i中{e′k,e′k+1,…,e′n}为大于平均值M的数据元素,个数为n-k+1;初始化权值序列Wi′={w′1,w′2,…,w′n}T,w′1~n-2=0,设置x′n对应的权重w′n为λ,x′n-1对应的权重w′n-1为1-λ,更新权值序列Wi′中元素的大小,通过式8将Wi′进行更新;
Figure BDA0002730598460000044
C2.3.利用更新后的权值序列Wi′和排序后样本E′i,通过式9计算训练样本集2的生成异常分数Rscore
Rscore=Ei′·Wi′ (式9)
C3.利用步骤B训练完成的判别器D*输出生成样本与新特征序列
Figure BDA0002730598460000046
的相似概率P,计算判别异常分数Dscore为1-P;
C4.利用判别异常分数Dscore和生成异常分数Rscore,通过式10计算异常分数O,并根据训练数据集2建立阈值,具体实现如下:
O=WD×Dscore+WG×Rscore (式10)
所述的WD和WG分别为判别异常分数和样本生成异常分数的权重;
C4.1.将训练数据集
Figure BDA0002730598460000045
结果中的最大异常分数与最小异常分数作为最大、最小边界,对其进行平均划分,通过式11计算出第q段训练数据集2的异常分数;
Figure BDA0002730598460000051
C4.2.最大F1分数对应的异常分数作为阈值,F1的计算方式如式12;
Figure BDA0002730598460000052
Figure BDA0002730598460000053
所述的Pre为预测为正的正样本在所有预测为正的样本中所占比例,Rec为预测为正的正样本在所有正样本中所占比例;TP为被模型预测为正的正样本;FP为被模型预测为正的负样本;FN为被模型预测为负的正样本;
D.根据阈值对输入的待检测数据进行异常判断,具体实现如下:
D1.输入待检测数据集时间序列
Figure BDA0002730598460000054
重复步骤A1-A5,进行差分率样本熵特征提取得到新的时间序列
Figure BDA0002730598460000055
D2.重复步骤C1-C4,将
Figure BDA0002730598460000056
输入到已经训练好的生成对抗网络中,利用公式10计算出待检测数据的异常分数Oreal
D3.通过计算得到的异常分数Oreal与步骤C中计算得到的阈值进行比较,若异常分数大于阈值,则判定该待检测数据含有异常模式,否则不含有异常模式。
本发明的优点是利用差分率样本熵对时间序列数据进行特征提取,使异常模式更加显著;建立了新的异常分数计算方法,提高了时间序列异常模式检测的准确性和泛化性,使其具有更高的实用性和应用价值。
附图说明
图1:异常模式检测总体流程图
具体实施方式
下面结合附图,通过对实验数据进行CO时间序列预测,并根据时间序列数据量、输入输出维度等进行基于差分率熵特征和生成对抗网络的时间系列异常模式检测方法的说明,作为实施例对本发明作进一步描述。
方法总体流程图如图1所示。本发明方法包括:1)对训练数据集中的时间序列提取二阶差分率样本熵特征序列;2)训练生成对抗网络模型得到生成器和对应的判别器;3)计算特征序列的异常分数并构建阈值;4)根据阈值对输入的待检测数据进行异常判断。下面按照步骤,结合实例对本发明作进一步描述:
A.对训练数据集中的时间序列提取二阶差分率样本熵特征序列,具体实现如下:
A1.选取实验数据,研究对象为CO气体浓度一维时间序列,选取训练数据集,并将训练数据集分成两个集合,分别记为训练数据集1和训练数据集2;
所述的训练数据集1中全部为正常数据,训练数据集2中包括正常数据和异常数据;
A2.对全为正常数据的训练数据集1设置序列段的滑动窗口大小为10,步长为1滑动进行分段;
A3.对序列段集合中的每个序列段进行差分率运算,得到所有序列段的二阶差分率序列,具体实现如下:
A3.1.对CO气体浓度序列共计348条数据,利用公式
Figure BDA0002730598460000061
得到其二阶差分率序列共345条部分数据如表2所示G={g1,g2,…,gw′},并求其标准差std为0.11,部分数据如下:
Figure BDA0002730598460000062
Figure BDA0002730598460000071
A3.2.以6个时序数据点为一个子片段划分具有345个数据点的二阶差分率序列,共计340个子序列片段,记为K2i={q1,q2,…,qw′-m+1},部分数据如下:
Figure BDA0002730598460000072
A4.对所有序列段的二阶差分率序列进行样本熵特征提取,得到所有序列段的二阶差分率样本熵特征序列,具体实现如下;
A4.1.计算每一个序列段的二阶差分率样本熵特征,最终得到完整的二阶差分率样本熵序列,部分数据如下:
Figure BDA0002730598460000073
A5.对差分率样本熵序列进行分段平均预处理,得到差分率样本熵序列,具体实现如下:
A5.1.从Xt(t=1,2...t-w),取出长度为w的序列段St={Xt,Xt+1,...,Xw+t-1}1×t,先求和,再求平均值;
A5.2.重复步骤A4.1,共取出t-w个序列段,并将sumt组成新的序列St'={sum1,sum2,…,sumt-w}1×t,部分数据如下:
Figure BDA0002730598460000081
B.训练生成对抗网络模型得到生成器和对应的判别器,具体实现如下:
B1.随机采样噪声数据Z={zi,i=1,2,…,n},其中n为330。生成器模型为多个LSTM记忆单元,并且设置记忆单元的个数,将Z输入搭建好的生成器模型,生成重构的样本序列数据G(Z);
B2.将新的差分率样本熵St'和生成的重构样本序列数据G(Z)输入搭建好的判别器模型D*中,部分参数数据如下:
Figure BDA0002730598460000082
B3.根据损失函数的值利用随机梯度下降算法更新模型参数,并且先更新判别器的参数,然后通过Adam优化算法并根据噪声数据更新生成器的参数;
B4.保存模型参数,返回B2进行循环迭代1000次,学习率设为0.1,最后得到训练好的生成器模型G*和判别器模型D*;
C.计算特征序列的异常分数并构建阈值,具体实现如下:
C1.首先重复步骤A2-A5,对包含正常数据和异常数据的训练数据集2的时间序列
Figure BDA0002730598460000091
进行特征提取得到新特征序列
Figure BDA0002730598460000092
部分数据如下:
Figure BDA0002730598460000093
C2.利用判别异常分数Dscore和样本生成异常分数Rscore计算异常分数O;
C2.1.将训练数据集
Figure BDA0002730598460000094
结果中的最大异常分数与最小异常分数作为最大最小边界,对其进行平均划分,得出第q段的训练数据集2的异常分数
Figure BDA0002730598460000095
C2.2.最大F1分数为0.8916,其对应的异常分数O作为阈值,得到阈值为0.375;
D.根据阈值对输入的待检测数据进行异常判断,具体实现如下:
D1.输入待检测数据集时间序列样本
Figure BDA0002730598460000096
先重复步骤A2-A5,进行差分率样本熵特征提取得到新的时间序列
Figure BDA0002730598460000097
部分数据如下:
Figure BDA0002730598460000098
D2.重复步骤C1-C4,将
Figure BDA0002730598460000099
输入到已经训练好的生成对抗网络中,计算出实际数据样本的异常分数Oreal为0.572;
D3.通过计算得到的异常分数Oreal与步骤C中计算得到的阈值进行比较,发现异常分数大于阈值,则判定该样本为异常样本,整个样本实际处理的结果如下:
Figure BDA0002730598460000101
本发明的方法实现了基于差分率熵特征和生成对抗网络的时间序列异常模式检测方法,能够检测序列段中是否包含异常模式,从而达到为煤矿热动力灾害的发生提供判断依据的目的,本发明能够突出异常与正常样本的差异,使异常模式更加显著,进而提高模型的检测精度;建立了新的异常分数计算方法,提高了模型识别的准确性和泛化性,使其更具有应用价值。
最后需要注意的是,公布实施例的目的在于帮助进一步理解本发明,但是本领域的技术人员可以理解:在不脱离本发明及所附的权利要求的精神和范围内,各种替换和修改都是可能的。因此,本发明不应局限于实施例所公开的内容,本发明要求保护的范围以权利要求书界定的范围为准。

Claims (6)

1.一种基于熵特征和神经网络的时间序列异常模式检测方法,其步骤包括:
A.对训练数据集中的时间序列提取二阶差分率样本熵特征序列,具体实现如下:
A1.将训练数据集分成两个集合,分别记为训练数据集1和训练数据集2;
所述的训练数据集1中全部为正常数据,训练数据集2中包括正常数据和异常数据;
A2.对训练数据集1时间序列
Figure FDA0002730598450000011
以窗口大小w和步长d滑动进行分段,得到长度为L的序列段集合W,其中第i个时间序列片段记为si,计算公式为:
si=[x1+(i-1)d,x2+(i-1)d,…,x1+(i-1)d+w]
所述的Ttrain表示训练数据集时间序列个数,1×Ttrain表示训练数据集时间序列维度;
A3.对序列段集合W中的每个序列段进行差分率运算,得到所有序列段的二阶差分率序列;
A4.对所有序列段的二阶差分率序列进行样本熵特征提取,得到所有序列段的二阶差分率样本熵特征序列;
A5.对差分率样本熵序列进行分段平均预处理,得到差分率样本熵序列;
B.训练生成对抗网络模型得到生成器和对应的判别器,具体实现如下:
B1.随机采样噪声数据Z={zi,i=1,2,…,n},其中n与样本数对应。生成器模型G为多个LSTM记忆单元,并且设置记忆单元的个数,将Z输入到生成器模型G中,生成重构的样本序列数据G(Z);
B2.将新的差分率样本熵序列St'和生成的重构样本序列数据G(Z)输入搭建好的判别器模型D中;
B3.根据损失函数的值利用随机梯度下降算法更新模型参数,并且先更新判别器的参数,然后通过Adam优化算法并根据噪声数据更新生成器的参数;
B4.保存模型参数,再重复步骤B1-B3进行循环迭代,最后得到训练好的能够产生正常时间序列的生成器模型G*和对应的判别器模型D*;
C.计算特征序列的异常分数并构建阈值,具体实现如下:
C1.利用训练数据集2中的时间序列
Figure FDA0002730598450000012
重复步骤A2-A5,提取特征得到新特征序列
Figure FDA0002730598450000013
C2.将随机采样噪声数据Zval输入到训练完成的生成器G*中,生成重构样本G*(Zval),再利用生成误差计算输入样本的生成异常分数Rscore
C3.利用步骤B训练完成的判别器D*输出生成样本与新特征序列
Figure FDA0002730598450000021
的相似概率P,计算判别异常分数Dscore为1-P;
C4.利用判别异常分数Dscore和生成异常分数Rscore,计算异常分数O,并根据训练数据集2建立阈值,计算公式为:
O=WD×Dscore+WG×Rscore
所述的WD和WG分别为判别异常分数和样本生成异常分数的权重;
D.根据阈值对输入的待检测数据进行异常判断,具体实现如下:
D1.输入待检测数据集时间序列
Figure FDA0002730598450000022
重复步骤A1-A5,进行差分率样本熵特征提取得到新的时间序列
Figure FDA0002730598450000023
D2.重复步骤C1-C4,将
Figure FDA0002730598450000024
输入到已经训练好的生成对抗网络中,利用公式10计算出待检测数据的异常分数Oreal
D3.通过计算得到的异常分数Oreal与步骤C中计算得到的阈值进行比较,若异常分数大于阈值,则判定该待检测数据含有异常模式,否则不含有异常模式。
2.如权利要求1所述的基于熵特征和神经网络的时间序列异常模式检测方法,其特征在于,对序列段集合W中的每个序列段进行差分率运算,得到所有序列段的二阶差分率序列,具体实现如下:
A3.1.对序列段si计算其二阶差分率序列G={g1,g2,…,gw′},并求其标准差std,计算公式为:
Figure FDA0002730598450000025
所述的
Figure FDA0002730598450000026
为u时间点的e阶差分值,
Figure FDA0002730598450000027
为u-1时间点的e阶差分值;
A3.2.以m个时序数据点为一个子片段划分具有w′个数据点的二阶差分率序列,共计w′-m+1个子序列片段,记为K2i={q1,q2,…,qw′-m+1}。
3.如权利要求1所述的基于熵特征和神经网络的时间序列异常模式检测方法,其特征在于,对所有序列段的二阶差分率序列进行样本熵特征提取,得到所有序列段的二阶差分率样本熵特征序列,具体实现步骤如下:
A4.1.计算任意两个子序列片段qa和qb之间的距离D[qa,qb],该距离由两个子序列片段中对应位置元素的最大差值决定;
A4.2.计算子序列片段qa与其余子序列片段的相似概率。用子序列段间距离小于阈值的子序列段的占比,该二阶差分率序列的平均相似概率,作为二阶差分率样本熵,计算公式为:
Figure FDA0002730598450000031
Figure FDA0002730598450000032
所述的r为相似度阈值;
A4.3.按照步骤A4.1-A4.2,以m+1为子序列长度重新计算其平均相似概率Bm+1(r),二阶差分率样本熵特征SE,计算方式为:
Figure FDA0002730598450000033
4.如权利要求1所述的基于熵特征和神经网络的时间序列异常模式检测方法,其特征在于,对差分率样本熵序列进行分段平均预处理,得到差分率样本熵序列,具体实现如下:
A5.1.从Xt(t=1,2...t-w),取出长度为w的序列段St={Xt,Xt+1,...,Xw+t-1}1×t,先求和再求平均值,计算公式为:
sumt=Xt+Xt+1...Xw+t-1
sumt=sumt/w;
A5.2.重复步骤A4.1,共取出t-w个序列段,并将sumt组成新的差分率样本熵序列St'={sum1,sum2,…,sumt-w}1×t
5.如权利要求1所述的基于熵特征和神经网络的时间序列异常模式检测方法,其特征在于,将随机采样噪声数据Zval输入到训练完成的生成器G*中,生成重构样本G*(Zval),再利用生成误差计算输入样本的生成异常分数Rscore,具体实现如下:
C2.1.对长度为n的重构样本G*(Zval)与训练数据集2的新特征序列
Figure FDA0002730598450000041
的绝对误差e中元素从小到大进行排序,得到排序后的绝对误差Ei′={e′1,e′2,…,e′n},求排序后绝对误差E′i={e′1,e′2,…,e′n}的平均值M;
C2.2.将E′i提中元素与平均值M比较,取出E′i中{e′k,e′k+1,…,e′n}为大于平均值M的数据元素,个数为n-k+1;初始化权值序列Wi′={w′1,w′2,…,w′n}T,w′1~n-2=0,设置x′n对应的权重w′n为λ,x′n-1对应的权重w′n-1为1-λ,更新权值序列Wi′中元素的大小,计算公式为:
Figure FDA0002730598450000042
C2.3.利用更新后的权值序列Wi′和排序后样本E′i,计算训练样本集2的生成异常分数Rscore,计算公式为:
Rscore=Ei′·Wi′。
6.如权利要求1所述的基于熵特征和神经网络的时间序列异常模式检测方法,其特征在于,利用判别异常分数Dscore和生成异常分数Rscore,通过式10计算异常分数O,并根据训练数据集2建立阈值,具体实现如下:
C4.1.将训练数据集
Figure FDA0002730598450000043
结果中的最大异常分数与最小异常分数作为最大、最小边界,对其进行平均划分,计算出第q段训练数据集2的异常分数,计算公式为:
Figure FDA0002730598450000044
C4.2.最大F1分数对应的异常分数作为阈值,F1的计算公式为:
Figure FDA0002730598450000045
Figure FDA0002730598450000046
所述的Pre为预测为正的正样本在所有预测为正的样本中所占比例;Rec为预测为正的正样本在所有正样本中所占比例。TP为被模型预测为正的正样本;FP为被模型预测为正的负样本;FN为被模型预测为负的正样本。
CN202011116876.4A 2020-10-19 2020-10-19 一种基于熵特征和神经网络的时间序列异常模式检测方法 Active CN112257917B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011116876.4A CN112257917B (zh) 2020-10-19 2020-10-19 一种基于熵特征和神经网络的时间序列异常模式检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011116876.4A CN112257917B (zh) 2020-10-19 2020-10-19 一种基于熵特征和神经网络的时间序列异常模式检测方法

Publications (2)

Publication Number Publication Date
CN112257917A true CN112257917A (zh) 2021-01-22
CN112257917B CN112257917B (zh) 2023-05-12

Family

ID=74244702

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011116876.4A Active CN112257917B (zh) 2020-10-19 2020-10-19 一种基于熵特征和神经网络的时间序列异常模式检测方法

Country Status (1)

Country Link
CN (1) CN112257917B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113127705A (zh) * 2021-04-02 2021-07-16 西华大学 一种异构双向生成对抗网络模型及时间序列异常检测方法
CN114386454A (zh) * 2021-12-09 2022-04-22 首都医科大学附属北京友谊医院 基于信号混合策略的医疗时序信号数据处理方法
CN114844796A (zh) * 2022-04-29 2022-08-02 济南浪潮数据技术有限公司 一种对时序kpi的异常检测的方法、装置及介质
CN115600116A (zh) * 2022-12-15 2023-01-13 西南石油大学(Cn) 时间序列异常的动态检测方法、***、存储介质及终端

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001092990A2 (en) * 2000-06-01 2001-12-06 Variagenics, Inc. Structure-based methods for assessing amino acid variances
CN103886405A (zh) * 2014-02-20 2014-06-25 东南大学 一种基于信息熵特征和概率神经网络的锅炉燃烧工况识别方法
CN109035488A (zh) * 2018-08-07 2018-12-18 哈尔滨工业大学(威海) 基于cnn特征提取的航空发动机时间序列异常检测方法
CN110071913A (zh) * 2019-03-26 2019-07-30 同济大学 一种基于无监督学习的时间序列异常检测方法
CN110211114A (zh) * 2019-06-03 2019-09-06 浙江大学 一种基于深度学习的装箱缺条视觉检测方法
CN110598851A (zh) * 2019-08-29 2019-12-20 北京航空航天大学合肥创新研究院 一种融合lstm和gan的时间序列数据异常检测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001092990A2 (en) * 2000-06-01 2001-12-06 Variagenics, Inc. Structure-based methods for assessing amino acid variances
CN103886405A (zh) * 2014-02-20 2014-06-25 东南大学 一种基于信息熵特征和概率神经网络的锅炉燃烧工况识别方法
CN109035488A (zh) * 2018-08-07 2018-12-18 哈尔滨工业大学(威海) 基于cnn特征提取的航空发动机时间序列异常检测方法
CN110071913A (zh) * 2019-03-26 2019-07-30 同济大学 一种基于无监督学习的时间序列异常检测方法
CN110211114A (zh) * 2019-06-03 2019-09-06 浙江大学 一种基于深度学习的装箱缺条视觉检测方法
CN110598851A (zh) * 2019-08-29 2019-12-20 北京航空航天大学合肥创新研究院 一种融合lstm和gan的时间序列数据异常检测方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113127705A (zh) * 2021-04-02 2021-07-16 西华大学 一种异构双向生成对抗网络模型及时间序列异常检测方法
CN113127705B (zh) * 2021-04-02 2022-08-05 西华大学 一种异构双向生成对抗网络模型及时间序列异常检测方法
CN114386454A (zh) * 2021-12-09 2022-04-22 首都医科大学附属北京友谊医院 基于信号混合策略的医疗时序信号数据处理方法
CN114386454B (zh) * 2021-12-09 2023-02-03 首都医科大学附属北京友谊医院 基于信号混合策略的医疗时序信号数据处理方法
CN114844796A (zh) * 2022-04-29 2022-08-02 济南浪潮数据技术有限公司 一种对时序kpi的异常检测的方法、装置及介质
CN115600116A (zh) * 2022-12-15 2023-01-13 西南石油大学(Cn) 时间序列异常的动态检测方法、***、存储介质及终端

Also Published As

Publication number Publication date
CN112257917B (zh) 2023-05-12

Similar Documents

Publication Publication Date Title
CN112257917B (zh) 一种基于熵特征和神经网络的时间序列异常模式检测方法
CN113434357B (zh) 基于序列预测的日志异常检测方法及装置
CN110213222B (zh) 基于机器学习的网络入侵检测方法
CN111914873A (zh) 一种两阶段云服务器无监督异常预测方法
CN107194524B (zh) 一种基于rbf神经网络的煤与瓦斯突出预测方法
KR102361423B1 (ko) 인공지능 기반의 정비 수요 예측 시스템 및 방법
CN112199670B (zh) 一种基于深度学习改进iforest对行为异常检测的日志监控方法
CN108446714B (zh) 一种多工况下的非马尔科夫退化***剩余寿命预测方法
CN113505826B (zh) 基于联合特征选择的网络流量异常检测方法
CN114281864A (zh) 一种面向电力网络告警信息的关联分析方法
CN112761628A (zh) 基于长短期记忆神经网络的页岩气产量确定方法、装置
CN112329974B (zh) 基于lstm-rnn的民航安保事件行为主体识别与预测方法及***
CN111881299B (zh) 基于复制神经网络的离群事件检测与识别方法
CN113806889A (zh) 一种tbm刀盘扭矩实时预测模型的处理方法、装置以及设备
CN115018512A (zh) 基于Transformer神经网络的窃电检测方法及装置
Li et al. A rockburst prediction model based on extreme learning machine with improved Harris Hawks optimization and its application
CN114742165A (zh) 基于深度自编码器的航空发动机气路性能异常检测***
Yu et al. Anomaly detection in unstructured logs using attention-based Bi-LSTM network
US20230401454A1 (en) Method using weighted aggregated ensemble model for energy demand management of buildings
CN115017015B (zh) 一种边缘计算环境下程序异常行为检测方法及***
CN115048873B (zh) 一种用于飞机发动机的剩余使用寿命预测***
CN116883128A (zh) 洗钱团伙的挖掘方法、装置、电子设备及计算机存储介质
CN114826718A (zh) 一种基于多维度信息的内部网络异常检测方法及***
CN113326371B (zh) 一种融合预训练语言模型与抗噪声干扰远程监督信息的事件抽取方法
CN110991363B (zh) 不同采煤工序下煤矿安全监控***co涌出特征提取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant