CN112257917A - 一种基于熵特征和神经网络的时间序列异常模式检测方法 - Google Patents
一种基于熵特征和神经网络的时间序列异常模式检测方法 Download PDFInfo
- Publication number
- CN112257917A CN112257917A CN202011116876.4A CN202011116876A CN112257917A CN 112257917 A CN112257917 A CN 112257917A CN 202011116876 A CN202011116876 A CN 202011116876A CN 112257917 A CN112257917 A CN 112257917A
- Authority
- CN
- China
- Prior art keywords
- sequence
- score
- abnormal
- sample
- entropy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 77
- 238000001514 detection method Methods 0.000 title claims abstract description 17
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 12
- 238000012549 training Methods 0.000 claims abstract description 51
- 238000000034 method Methods 0.000 claims abstract description 29
- 238000004364 calculation method Methods 0.000 claims abstract description 19
- 238000000605 extraction Methods 0.000 claims abstract description 5
- 230000005856 abnormality Effects 0.000 claims description 6
- 239000012634 fragment Substances 0.000 claims description 6
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 238000012935 Averaging Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 101150000419 GPC gene Proteins 0.000 claims description 2
- 101150026392 N gene Proteins 0.000 claims description 2
- 238000005070 sampling Methods 0.000 claims description 2
- 238000012163 sequencing technique Methods 0.000 claims description 2
- 239000003245 coal Substances 0.000 description 14
- 238000011160 research Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000002485 combustion reaction Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002269 spontaneous effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000011158 quantitative evaluation Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000009423 ventilation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Agronomy & Crop Science (AREA)
- Animal Husbandry (AREA)
- Marine Sciences & Fisheries (AREA)
- Mining & Mineral Resources (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
- Complex Calculations (AREA)
Abstract
本发明提出一种基于熵特征和神经网络的时间序列异常模式检测方法,该方法的步骤为:1)对训练数据集中的时间序列提取二阶差分率样本熵特征序列;2)训练生成对抗网络模型得到生成器和对应的判别器;3)计算特征序列的异常分数并构建阈值;4)根据阈值对输入的待检测数据进行异常判断。本发明的优点是利用差分率样本熵对时间序列数据进行特征提取,使异常模式更加显著;建立了新的异常分数计算方法,提高了模型识别的准确性和泛化性,使其具有更高的实用性和应用价值。
Description
技术领域
本发明涉及煤矿热动力复合灾害的预测,具体涉及一种基于熵特征和神经网络的时间序列异常模式检测方法,属于应急安全领域。
背景技术
煤炭作为主体能源在我国能源结构中占有不可替代的重要地位,煤矿开采完后遗留的区域为采空区,采空区内通风不良且遗煤较多,不断氧化产生可燃性气体从而容易引发煤自燃、瓦斯***等煤矿热动力灾害。释放出的可燃性气体的浓度变化随着时间的发展呈现一定的规律,有效地检测出不同阶段监测数据发生的拐点,当气体浓度发生较大变化时,可以认为进入了异常模式,表明有煤自燃等灾害发生的可能。不同煤矿气体产生含量不同,如果只以气体含量值的大小作为灾害发生的判定标准,应用于其他煤矿时可能会造成很大的误差,因此,异常模式的检测可以提高灾害的判定的泛化性,为煤炭复合灾害的检测提供一种新思路。
随着人们对人工智能理论研究与深入,应用时间序列预测方法对煤与瓦斯进行预测成为一种新的趋势,人们将其引入到煤与瓦斯灾害定量评价与分析中,并融合了计算机技术、支持向量机、人工神经网络等理论进行研究,但这些预测方法难以运用在复杂数据中,存在易陷入局部最小值的问题,出现过拟合现象,准确率低,局限性大。
随着信息化技术的提高,时间序列中的异常检测问题成为近年来的研究热点。时间序列异常通常是指在一系列数据中有着明显不同于其他数据,这种异常并不是指随机偏差产生的,而是因为不同的机制所产生的差异。对气体时序数据的异常模式进行检测,可以为煤矿热动力灾害提供理论基础。若时序数据中存在异常模式,则说明数据的变化趋势发生了较大的改变,可作为灾害发生的判断依据。
现有方法(CN201910809956.9)利用GAN对时间序列进行异常检测,主要是用优化的GAN生成器和判别器搭建异常检测的模型,用模型输出的生成残差和鉴别损失作为判断异常数据的判断依据。但是大部分时间序列的变化不显著,直接用时间序列作为GAN的输入数据,其特征不够显著;同时用模型输出的生成残差和鉴别损失获取更为有效的评判准则,如何提高异常判断的准确性和普适性都还有待研究。
发明内容
本发明的目的在于实现一种基于熵特征和神经网络的时间序列异常模式检测方法。本发明的方法分为4个阶段:对训练数据集中的时间序列提取二阶差分率样本熵特征序列;训练生成对抗网络模型得到生成器和对应的判别器;计算特征序列的异常分数并构建阈值;根据阈值对输入的待检测数据进行异常判断。具体来说,本发明的方法包括下列步骤:
A.对训练数据集中的时间序列提取二阶差分率样本熵特征序列,具体实现如下:
A1.将训练数据集分成两个集合,分别记为训练数据集1和训练数据集2;
所述的训练数据集1中全部为正常数据,训练数据集2中包括正常数据和异常数据;
si=[x1+(i-1)d,x2+(i-1)d,…,x1+(i-1)d+w] (式1)
所述的Ttrain表示训练数据集时间序列个数,1×Ttrain表示训练数据集时间序列维度;
A3.对序列段集合W中的每个序列段进行差分率运算,得到所有序列段的二阶差分率序列,具体实现如下:
A3.1.对序列段si利用式2计算其二阶差分率序列G={g1,g2,…,gw′},并求其标准差std;
A3.2.以m个时序数据点为一个子片段划分具有w′个数据点的二阶差分率序列,共计w′-m+1个子序列片段,记为K2i={q1,q2,…,qw′-m+1};
A4.对所有序列段的二阶差分率序列进行样本熵特征提取,得到所有序列段的二阶差分率样本熵特征序列,具体实现如下:
A4.1.计算任意两个子序列片段qa和qb之间的距离D[qa,qb],该距离由两个子序列片段中对应位置元素的最大差值决定;
A4.2.计算子序列片段qa与其余子序列片段的相似概率,通过式3得到子序列段间距离小于阈值的子序列段的占比,通过式4得到该二阶差分率序列的平均相似概率;
所述的r为相似度阈值;
A4.3.按照步骤A4.1-A4.2,以m+1为子序列长度重新计算其平均相似概率Bm+1(r),通过式5得到二阶差分率样本熵特征SE;
A5.对差分率样本熵序列进行分段平均预处理,得到差分率样本熵序列,具体实现如下:
A5.1.从Xt(t=1,2...t-w),取出长度为w的序列段St={Xt,Xt+1,...,Xw+t-1}1×t,先根据式6求和,再根据式7求平均值;
sumt=Xt+Xt+1...Xw+t-1 (式6)
sumt=sumt/w; (式7)
A5.2.重复步骤A4.1,共取出t-w个序列段,并将sumt组成新的差分率样本熵序列St'={sum1,sum2,…,sumt-w}1×t;
B.训练生成对抗网络模型得到生成器和对应的判别器,具体实现如下:
B1.随机采样噪声数据Z={zi,i=1,2,…,n},其中n与样本数对应。生成器模型G为多个LSTM记忆单元,并且设置记忆单元的个数,将Z输入到生成器模型G中,生成重构的样本序列数据G(Z);
B2.将新的差分率样本熵序列St'和生成的重构样本序列数据G(Z)输入搭建好的判别器模型D中;
B3.根据损失函数的值利用随机梯度下降算法更新模型参数,并且先更新判别器的参数,然后通过Adam优化算法并根据噪声数据更新生成器的参数;
B4.保存模型参数,再重复步骤B1-B3进行循环迭代,最后得到训练好的能够产生正常时间序列的生成器模型G*和对应的判别器模型D*;
C.计算特征序列的异常分数并构建阈值,具体实现如下:
C2.将随机采样噪声数据Zval输入到训练完成的生成器G*中,生成重构样本G*(Zval),再利用生成误差计算输入样本的生成异常分数Rscore,具体实现如下:
C2.1.对长度为n的重构样本G*(Zval)与训练数据集2的新特征序列的绝对误差e中元素从小到大进行排序,得到排序后的绝对误差Ei′={e′1,e′2,…,e′n},求排序后绝对误差Ei′={e′1,e′2,…,e′n}的平均值M;
C2.2.将E′i提中元素与平均值M比较,取出E′i中{e′k,e′k+1,…,e′n}为大于平均值M的数据元素,个数为n-k+1;初始化权值序列Wi′={w′1,w′2,…,w′n}T,w′1~n-2=0,设置x′n对应的权重w′n为λ,x′n-1对应的权重w′n-1为1-λ,更新权值序列Wi′中元素的大小,通过式8将Wi′进行更新;
C2.3.利用更新后的权值序列Wi′和排序后样本E′i,通过式9计算训练样本集2的生成异常分数Rscore;
Rscore=Ei′·Wi′ (式9)
C4.利用判别异常分数Dscore和生成异常分数Rscore,通过式10计算异常分数O,并根据训练数据集2建立阈值,具体实现如下:
O=WD×Dscore+WG×Rscore (式10)
所述的WD和WG分别为判别异常分数和样本生成异常分数的权重;
C4.2.最大F1分数对应的异常分数作为阈值,F1的计算方式如式12;
所述的Pre为预测为正的正样本在所有预测为正的样本中所占比例,Rec为预测为正的正样本在所有正样本中所占比例;TP为被模型预测为正的正样本;FP为被模型预测为正的负样本;FN为被模型预测为负的正样本;
D.根据阈值对输入的待检测数据进行异常判断,具体实现如下:
D3.通过计算得到的异常分数Oreal与步骤C中计算得到的阈值进行比较,若异常分数大于阈值,则判定该待检测数据含有异常模式,否则不含有异常模式。
本发明的优点是利用差分率样本熵对时间序列数据进行特征提取,使异常模式更加显著;建立了新的异常分数计算方法,提高了时间序列异常模式检测的准确性和泛化性,使其具有更高的实用性和应用价值。
附图说明
图1:异常模式检测总体流程图
具体实施方式
下面结合附图,通过对实验数据进行CO时间序列预测,并根据时间序列数据量、输入输出维度等进行基于差分率熵特征和生成对抗网络的时间系列异常模式检测方法的说明,作为实施例对本发明作进一步描述。
方法总体流程图如图1所示。本发明方法包括:1)对训练数据集中的时间序列提取二阶差分率样本熵特征序列;2)训练生成对抗网络模型得到生成器和对应的判别器;3)计算特征序列的异常分数并构建阈值;4)根据阈值对输入的待检测数据进行异常判断。下面按照步骤,结合实例对本发明作进一步描述:
A.对训练数据集中的时间序列提取二阶差分率样本熵特征序列,具体实现如下:
A1.选取实验数据,研究对象为CO气体浓度一维时间序列,选取训练数据集,并将训练数据集分成两个集合,分别记为训练数据集1和训练数据集2;
所述的训练数据集1中全部为正常数据,训练数据集2中包括正常数据和异常数据;
A2.对全为正常数据的训练数据集1设置序列段的滑动窗口大小为10,步长为1滑动进行分段;
A3.对序列段集合中的每个序列段进行差分率运算,得到所有序列段的二阶差分率序列,具体实现如下:
A3.2.以6个时序数据点为一个子片段划分具有345个数据点的二阶差分率序列,共计340个子序列片段,记为K2i={q1,q2,…,qw′-m+1},部分数据如下:
A4.对所有序列段的二阶差分率序列进行样本熵特征提取,得到所有序列段的二阶差分率样本熵特征序列,具体实现如下;
A4.1.计算每一个序列段的二阶差分率样本熵特征,最终得到完整的二阶差分率样本熵序列,部分数据如下:
A5.对差分率样本熵序列进行分段平均预处理,得到差分率样本熵序列,具体实现如下:
A5.1.从Xt(t=1,2...t-w),取出长度为w的序列段St={Xt,Xt+1,...,Xw+t-1}1×t,先求和,再求平均值;
A5.2.重复步骤A4.1,共取出t-w个序列段,并将sumt组成新的序列St'={sum1,sum2,…,sumt-w}1×t,部分数据如下:
B.训练生成对抗网络模型得到生成器和对应的判别器,具体实现如下:
B1.随机采样噪声数据Z={zi,i=1,2,…,n},其中n为330。生成器模型为多个LSTM记忆单元,并且设置记忆单元的个数,将Z输入搭建好的生成器模型,生成重构的样本序列数据G(Z);
B2.将新的差分率样本熵St'和生成的重构样本序列数据G(Z)输入搭建好的判别器模型D*中,部分参数数据如下:
B3.根据损失函数的值利用随机梯度下降算法更新模型参数,并且先更新判别器的参数,然后通过Adam优化算法并根据噪声数据更新生成器的参数;
B4.保存模型参数,返回B2进行循环迭代1000次,学习率设为0.1,最后得到训练好的生成器模型G*和判别器模型D*;
C.计算特征序列的异常分数并构建阈值,具体实现如下:
C2.利用判别异常分数Dscore和样本生成异常分数Rscore计算异常分数O;
C2.2.最大F1分数为0.8916,其对应的异常分数O作为阈值,得到阈值为0.375;
D.根据阈值对输入的待检测数据进行异常判断,具体实现如下:
D3.通过计算得到的异常分数Oreal与步骤C中计算得到的阈值进行比较,发现异常分数大于阈值,则判定该样本为异常样本,整个样本实际处理的结果如下:
本发明的方法实现了基于差分率熵特征和生成对抗网络的时间序列异常模式检测方法,能够检测序列段中是否包含异常模式,从而达到为煤矿热动力灾害的发生提供判断依据的目的,本发明能够突出异常与正常样本的差异,使异常模式更加显著,进而提高模型的检测精度;建立了新的异常分数计算方法,提高了模型识别的准确性和泛化性,使其更具有应用价值。
最后需要注意的是,公布实施例的目的在于帮助进一步理解本发明,但是本领域的技术人员可以理解:在不脱离本发明及所附的权利要求的精神和范围内,各种替换和修改都是可能的。因此,本发明不应局限于实施例所公开的内容,本发明要求保护的范围以权利要求书界定的范围为准。
Claims (6)
1.一种基于熵特征和神经网络的时间序列异常模式检测方法,其步骤包括:
A.对训练数据集中的时间序列提取二阶差分率样本熵特征序列,具体实现如下:
A1.将训练数据集分成两个集合,分别记为训练数据集1和训练数据集2;
所述的训练数据集1中全部为正常数据,训练数据集2中包括正常数据和异常数据;
si=[x1+(i-1)d,x2+(i-1)d,…,x1+(i-1)d+w]
所述的Ttrain表示训练数据集时间序列个数,1×Ttrain表示训练数据集时间序列维度;
A3.对序列段集合W中的每个序列段进行差分率运算,得到所有序列段的二阶差分率序列;
A4.对所有序列段的二阶差分率序列进行样本熵特征提取,得到所有序列段的二阶差分率样本熵特征序列;
A5.对差分率样本熵序列进行分段平均预处理,得到差分率样本熵序列;
B.训练生成对抗网络模型得到生成器和对应的判别器,具体实现如下:
B1.随机采样噪声数据Z={zi,i=1,2,…,n},其中n与样本数对应。生成器模型G为多个LSTM记忆单元,并且设置记忆单元的个数,将Z输入到生成器模型G中,生成重构的样本序列数据G(Z);
B2.将新的差分率样本熵序列St'和生成的重构样本序列数据G(Z)输入搭建好的判别器模型D中;
B3.根据损失函数的值利用随机梯度下降算法更新模型参数,并且先更新判别器的参数,然后通过Adam优化算法并根据噪声数据更新生成器的参数;
B4.保存模型参数,再重复步骤B1-B3进行循环迭代,最后得到训练好的能够产生正常时间序列的生成器模型G*和对应的判别器模型D*;
C.计算特征序列的异常分数并构建阈值,具体实现如下:
C2.将随机采样噪声数据Zval输入到训练完成的生成器G*中,生成重构样本G*(Zval),再利用生成误差计算输入样本的生成异常分数Rscore;
C4.利用判别异常分数Dscore和生成异常分数Rscore,计算异常分数O,并根据训练数据集2建立阈值,计算公式为:
O=WD×Dscore+WG×Rscore
所述的WD和WG分别为判别异常分数和样本生成异常分数的权重;
D.根据阈值对输入的待检测数据进行异常判断,具体实现如下:
D3.通过计算得到的异常分数Oreal与步骤C中计算得到的阈值进行比较,若异常分数大于阈值,则判定该待检测数据含有异常模式,否则不含有异常模式。
3.如权利要求1所述的基于熵特征和神经网络的时间序列异常模式检测方法,其特征在于,对所有序列段的二阶差分率序列进行样本熵特征提取,得到所有序列段的二阶差分率样本熵特征序列,具体实现步骤如下:
A4.1.计算任意两个子序列片段qa和qb之间的距离D[qa,qb],该距离由两个子序列片段中对应位置元素的最大差值决定;
A4.2.计算子序列片段qa与其余子序列片段的相似概率。用子序列段间距离小于阈值的子序列段的占比,该二阶差分率序列的平均相似概率,作为二阶差分率样本熵,计算公式为:
所述的r为相似度阈值;
A4.3.按照步骤A4.1-A4.2,以m+1为子序列长度重新计算其平均相似概率Bm+1(r),二阶差分率样本熵特征SE,计算方式为:
4.如权利要求1所述的基于熵特征和神经网络的时间序列异常模式检测方法,其特征在于,对差分率样本熵序列进行分段平均预处理,得到差分率样本熵序列,具体实现如下:
A5.1.从Xt(t=1,2...t-w),取出长度为w的序列段St={Xt,Xt+1,...,Xw+t-1}1×t,先求和再求平均值,计算公式为:
sumt=Xt+Xt+1...Xw+t-1
sumt=sumt/w;
A5.2.重复步骤A4.1,共取出t-w个序列段,并将sumt组成新的差分率样本熵序列St'={sum1,sum2,…,sumt-w}1×t。
5.如权利要求1所述的基于熵特征和神经网络的时间序列异常模式检测方法,其特征在于,将随机采样噪声数据Zval输入到训练完成的生成器G*中,生成重构样本G*(Zval),再利用生成误差计算输入样本的生成异常分数Rscore,具体实现如下:
C2.1.对长度为n的重构样本G*(Zval)与训练数据集2的新特征序列的绝对误差e中元素从小到大进行排序,得到排序后的绝对误差Ei′={e′1,e′2,…,e′n},求排序后绝对误差E′i={e′1,e′2,…,e′n}的平均值M;
C2.2.将E′i提中元素与平均值M比较,取出E′i中{e′k,e′k+1,…,e′n}为大于平均值M的数据元素,个数为n-k+1;初始化权值序列Wi′={w′1,w′2,…,w′n}T,w′1~n-2=0,设置x′n对应的权重w′n为λ,x′n-1对应的权重w′n-1为1-λ,更新权值序列Wi′中元素的大小,计算公式为:
C2.3.利用更新后的权值序列Wi′和排序后样本E′i,计算训练样本集2的生成异常分数Rscore,计算公式为:
Rscore=Ei′·Wi′。
6.如权利要求1所述的基于熵特征和神经网络的时间序列异常模式检测方法,其特征在于,利用判别异常分数Dscore和生成异常分数Rscore,通过式10计算异常分数O,并根据训练数据集2建立阈值,具体实现如下:
C4.2.最大F1分数对应的异常分数作为阈值,F1的计算公式为:
所述的Pre为预测为正的正样本在所有预测为正的样本中所占比例;Rec为预测为正的正样本在所有正样本中所占比例。TP为被模型预测为正的正样本;FP为被模型预测为正的负样本;FN为被模型预测为负的正样本。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011116876.4A CN112257917B (zh) | 2020-10-19 | 2020-10-19 | 一种基于熵特征和神经网络的时间序列异常模式检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011116876.4A CN112257917B (zh) | 2020-10-19 | 2020-10-19 | 一种基于熵特征和神经网络的时间序列异常模式检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112257917A true CN112257917A (zh) | 2021-01-22 |
CN112257917B CN112257917B (zh) | 2023-05-12 |
Family
ID=74244702
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011116876.4A Active CN112257917B (zh) | 2020-10-19 | 2020-10-19 | 一种基于熵特征和神经网络的时间序列异常模式检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112257917B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113127705A (zh) * | 2021-04-02 | 2021-07-16 | 西华大学 | 一种异构双向生成对抗网络模型及时间序列异常检测方法 |
CN114386454A (zh) * | 2021-12-09 | 2022-04-22 | 首都医科大学附属北京友谊医院 | 基于信号混合策略的医疗时序信号数据处理方法 |
CN114844796A (zh) * | 2022-04-29 | 2022-08-02 | 济南浪潮数据技术有限公司 | 一种对时序kpi的异常检测的方法、装置及介质 |
CN115600116A (zh) * | 2022-12-15 | 2023-01-13 | 西南石油大学(Cn) | 时间序列异常的动态检测方法、***、存储介质及终端 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001092990A2 (en) * | 2000-06-01 | 2001-12-06 | Variagenics, Inc. | Structure-based methods for assessing amino acid variances |
CN103886405A (zh) * | 2014-02-20 | 2014-06-25 | 东南大学 | 一种基于信息熵特征和概率神经网络的锅炉燃烧工况识别方法 |
CN109035488A (zh) * | 2018-08-07 | 2018-12-18 | 哈尔滨工业大学(威海) | 基于cnn特征提取的航空发动机时间序列异常检测方法 |
CN110071913A (zh) * | 2019-03-26 | 2019-07-30 | 同济大学 | 一种基于无监督学习的时间序列异常检测方法 |
CN110211114A (zh) * | 2019-06-03 | 2019-09-06 | 浙江大学 | 一种基于深度学习的装箱缺条视觉检测方法 |
CN110598851A (zh) * | 2019-08-29 | 2019-12-20 | 北京航空航天大学合肥创新研究院 | 一种融合lstm和gan的时间序列数据异常检测方法 |
-
2020
- 2020-10-19 CN CN202011116876.4A patent/CN112257917B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001092990A2 (en) * | 2000-06-01 | 2001-12-06 | Variagenics, Inc. | Structure-based methods for assessing amino acid variances |
CN103886405A (zh) * | 2014-02-20 | 2014-06-25 | 东南大学 | 一种基于信息熵特征和概率神经网络的锅炉燃烧工况识别方法 |
CN109035488A (zh) * | 2018-08-07 | 2018-12-18 | 哈尔滨工业大学(威海) | 基于cnn特征提取的航空发动机时间序列异常检测方法 |
CN110071913A (zh) * | 2019-03-26 | 2019-07-30 | 同济大学 | 一种基于无监督学习的时间序列异常检测方法 |
CN110211114A (zh) * | 2019-06-03 | 2019-09-06 | 浙江大学 | 一种基于深度学习的装箱缺条视觉检测方法 |
CN110598851A (zh) * | 2019-08-29 | 2019-12-20 | 北京航空航天大学合肥创新研究院 | 一种融合lstm和gan的时间序列数据异常检测方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113127705A (zh) * | 2021-04-02 | 2021-07-16 | 西华大学 | 一种异构双向生成对抗网络模型及时间序列异常检测方法 |
CN113127705B (zh) * | 2021-04-02 | 2022-08-05 | 西华大学 | 一种异构双向生成对抗网络模型及时间序列异常检测方法 |
CN114386454A (zh) * | 2021-12-09 | 2022-04-22 | 首都医科大学附属北京友谊医院 | 基于信号混合策略的医疗时序信号数据处理方法 |
CN114386454B (zh) * | 2021-12-09 | 2023-02-03 | 首都医科大学附属北京友谊医院 | 基于信号混合策略的医疗时序信号数据处理方法 |
CN114844796A (zh) * | 2022-04-29 | 2022-08-02 | 济南浪潮数据技术有限公司 | 一种对时序kpi的异常检测的方法、装置及介质 |
CN115600116A (zh) * | 2022-12-15 | 2023-01-13 | 西南石油大学(Cn) | 时间序列异常的动态检测方法、***、存储介质及终端 |
Also Published As
Publication number | Publication date |
---|---|
CN112257917B (zh) | 2023-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112257917B (zh) | 一种基于熵特征和神经网络的时间序列异常模式检测方法 | |
CN113434357B (zh) | 基于序列预测的日志异常检测方法及装置 | |
CN110213222B (zh) | 基于机器学习的网络入侵检测方法 | |
CN111914873A (zh) | 一种两阶段云服务器无监督异常预测方法 | |
CN107194524B (zh) | 一种基于rbf神经网络的煤与瓦斯突出预测方法 | |
KR102361423B1 (ko) | 인공지능 기반의 정비 수요 예측 시스템 및 방법 | |
CN112199670B (zh) | 一种基于深度学习改进iforest对行为异常检测的日志监控方法 | |
CN108446714B (zh) | 一种多工况下的非马尔科夫退化***剩余寿命预测方法 | |
CN113505826B (zh) | 基于联合特征选择的网络流量异常检测方法 | |
CN114281864A (zh) | 一种面向电力网络告警信息的关联分析方法 | |
CN112761628A (zh) | 基于长短期记忆神经网络的页岩气产量确定方法、装置 | |
CN112329974B (zh) | 基于lstm-rnn的民航安保事件行为主体识别与预测方法及*** | |
CN111881299B (zh) | 基于复制神经网络的离群事件检测与识别方法 | |
CN113806889A (zh) | 一种tbm刀盘扭矩实时预测模型的处理方法、装置以及设备 | |
CN115018512A (zh) | 基于Transformer神经网络的窃电检测方法及装置 | |
Li et al. | A rockburst prediction model based on extreme learning machine with improved Harris Hawks optimization and its application | |
CN114742165A (zh) | 基于深度自编码器的航空发动机气路性能异常检测*** | |
Yu et al. | Anomaly detection in unstructured logs using attention-based Bi-LSTM network | |
US20230401454A1 (en) | Method using weighted aggregated ensemble model for energy demand management of buildings | |
CN115017015B (zh) | 一种边缘计算环境下程序异常行为检测方法及*** | |
CN115048873B (zh) | 一种用于飞机发动机的剩余使用寿命预测*** | |
CN116883128A (zh) | 洗钱团伙的挖掘方法、装置、电子设备及计算机存储介质 | |
CN114826718A (zh) | 一种基于多维度信息的内部网络异常检测方法及*** | |
CN113326371B (zh) | 一种融合预训练语言模型与抗噪声干扰远程监督信息的事件抽取方法 | |
CN110991363B (zh) | 不同采煤工序下煤矿安全监控***co涌出特征提取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |