CN104915434A - 一种基于马氏距离dtw的多维时间序列分类方法 - Google Patents

一种基于马氏距离dtw的多维时间序列分类方法 Download PDF

Info

Publication number
CN104915434A
CN104915434A CN201510351181.7A CN201510351181A CN104915434A CN 104915434 A CN104915434 A CN 104915434A CN 201510351181 A CN201510351181 A CN 201510351181A CN 104915434 A CN104915434 A CN 104915434A
Authority
CN
China
Prior art keywords
series
dtw
time
multidimensional time
mahalanobis distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510351181.7A
Other languages
English (en)
Other versions
CN104915434B (zh
Inventor
刘大同
陈静
彭宇
彭喜元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN201510351181.7A priority Critical patent/CN104915434B/zh
Publication of CN104915434A publication Critical patent/CN104915434A/zh
Application granted granted Critical
Publication of CN104915434B publication Critical patent/CN104915434B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Arrangements For Transmission Of Measured Signals (AREA)

Abstract

一种基于马氏距离DTW的多维时间序列分类方法,本发明涉及多维时间序列分类方法。本发明是要解决针对卫星遥测数据进行固定点分段效果不理想、由于多维时间序列之间存在相关性以及时间序列存在微小偏移而使度量结果不够准确进而导致分类结果不够准确的问题,而提出了一种基于马氏距离DTW的多维时间序列分类方法。该方法是通过1、获得用于训练的多维时间序列X={x1,x2,...,xj,...xn}及类别标签L={l1,l2,…,ln};2、提取待分类多维时间序列X′={x′1,x′2,...,x′m};3、计算X′={x′1,x′2,...,x′m}与X={x1,x2,...,xj,...xn}之间的DTW距离序列;4、采用基于马氏距离的DTW距离的KNN分类方法,根据设定的K近邻数目对待分类的多维时间序列X′={x′1,x′2,...,x′m}进行分类,确定待分类的多维时间序列的所属类别等步骤实现的。本发明应用于多维时间序列分类领域。

Description

一种基于马氏距离DTW的多维时间序列分类方法
技术领域
本发明涉及基于马氏距离DTW的多维时间序列分类方法。
背景技术
通过对卫星遥测数据中的偏航姿态角进行分析,偏航姿态角的整体变化趋势如图1所示,其细节变化如图2所示,得出卫星遥测数据具有明显地周期性,且该特性已与卫星遥测数据提供单位进行了确认。通过对遥测数据的每个周期进行分析,可以得出卫星在该周期之内的运行状态是否正常,按照固定点对卫星遥测数据分段效果不理想的情况,如图3所示,分段后得到的各个时间序列之间的耦合度不够高,存在一定的偏差,且随着时间的推进这种偏差会愈发明显。
对卫星遥测数据进行分类是对卫星遥测数据进行数据挖掘的一项重要功能,在分类的基础之上可以完成多种数据挖掘任务,比如模式识别、异常检测等等。而卫星遥测数据有其自身特点,比如:参数多、维度高、存在漂移等,这些特点致使在针对卫星遥测数据的分类采用经典的时间序列相似性度量方法,如欧式距离、皮尔森相关系数等,体现出不适应性。经典的时间序列相似性度量方法,不能排除多维时间序列之间的相关性影响,同时,针对时间序列存在微小偏移不能实现异步度量使得度量结果不够准确,进而导致对卫星遥测数据的分类结果不够准确。
发明内容
本发明的目的是为了解决针对卫星遥测数据进行固定点分段效果不理想、由于多维时间序列之间存在相关性以及时间序列存在微小偏移而使度量结果不够准确进而导致分类结果不够准确的问题,而提出了一种基于马氏距离DTW的多维时间序列分类方法。
上述的发明目的是通过以下技术方案实现的:
步骤一:将卫星正常运行状态下的历史卫星遥测数据Y以幅角突变点为标识进行分段,得到正常多维时间序列X={x1,x2,...,xj,...xn},其中,Y为nd行na列的历史卫星遥测数据矩阵,nd为多维时间序列的维度值,na为所有历史卫星遥测数据的数据点数,xj为nd行nlen列数据矩阵表示X的第j个序列,j=1,2,…,n,nlen为时间序列长度,n为X中的成员数目;
步骤二、将分段后所得到的多维时间序列X={x1,x2,...,xj,...xn},通过层次聚类方法设定聚类目标类别数目为c对序列进行聚类操作,从而获得多维时间序列的类别标签L={l1,l2,…,ln};其中,c为大于1小于n的正整数,ls表示L序列的第s个元素,其取值由层次聚类结果确定,其中s=1,2,…,n;
步骤三:提取最新卫星遥测数据中相邻m+1个幅角突变点对应时间点之内的测试数据即待分类多维时间序列为X′={x′1,x′2,...,x′m},其中,m为大于0的正整数;
步骤四、计算出待分类的多维时间序列X′={x′1,x′2,...,x′m}与含有类别标签的多维时间序列X={x1,x2,...,xj,...xn}之间的DTW距离序列
其中,dij的计算方式如下:
dij=DTWma(x'i,xj)
x'i表示X′的第i个序列,i=1,2,…,m;DTWma表示基于马氏距离的DTW距离算法;DTW,dij为x'i与xj之间的基于马氏距离的DTW距离;
步骤五、采用基于马氏距离的DTW距离的KNN分类方法,根据设定的K近邻数目对待分类的多维时间序列X′={x′1,x′2,...,x′m}进行分类,确定待分类的多维时间序列X′={x′1,x′2,...,x′m}的所属类别L′={l′1,l′2,…,l′m},其中,K=1,2,…,n;所属类别l'为1,2,L,c中确定的某个数;KNN为K最近邻分类算法;即完成了一种基于马氏距离DTW的多维时间序列分类方法。
发明效果
对卫星遥测数据进行分类是对卫星遥测数据进行数据挖掘的一项重要功能,在分类的基础之上可以完成多种数据挖掘任务,比如模式识别、异常检测等等。而卫星遥测数据有其自身特点,比如:参数多、维度高、存在漂移等,这些特点致使在针对卫星遥测数据的分类采用经典的时间序列相似性度量方法,如欧式距离、皮尔森相关系数等,体现出不适应性。经典的时间序列度量方法,不能排除多维时间序列之间的相关性影响,同时,针对时间序列存在微小偏移不能实现异步度量使得度量结果不够准确,进而导致对卫星遥测数据的分类结果不够准确。因此,需要应用更为合理的时间序列相似性度量方法。针对一些复杂或者特点不尽相同的卫星遥测数据,选取适当的时间序列相似性度量方法,可以确保相应的模式挖掘取得更为良好的效果。各部分的具体发明效果如下:
本发明首先针对按照固定点对卫星遥测数据分段效果不理想的情况如图3所示,提出了按照卫星遥测数据中的幅角突变点为标识进行分段的方法,其分段效果如图4所示,以幅角为标识进行分段的分段结果更为紧凑,各个分段序列之间的耦合度更高、更为合理。
然后,采用基于马氏距离的动态时间规整(Dynamic Time Warping,DTW)距离对多维卫星遥测数据时间序列之间的距离进行度量,排除了多维时间序列之间的相关性影响,实现异步度量,解决了由于时间序列存在微小偏移而使度量结果不够确的问题。
最后,结合K最近邻居(K-Nearest Neighbor,KNN)分类算法以及卫星遥测数据历史多维时间序列对最新遥测多维时间序列进行分类,更好地实现了对卫星目前的运行状态的判别。
附图说明
图1为背景技术提出的偏航姿态角序列示例示意图;
图2为背景技术提出的偏航姿态角序列细节变化示例示意图;
图3为具体实施方式一提出的采用固定点对卫星遥测数据分段的结果;
图4为具体实施方式一提出的以幅角突变点为标识对卫星遥测数据分段的结果;
图5为实施例提出的Wafer参量1示例示意图;
图6为实施例提出的Wafer参量2示例示意图;
图7为实施例提出的Wafer参量3示例示意图;
图8为实施例提出的Wafer参量4示例示意图;
图9为实施例提出的Wafer参量5示例示意图;
图10为实施例提出的Wafer参量6示例示意图;
图11(a)为实施例提出的卫星遥测数据维度1的第1类数据示意图;
图11(b)为实施例提出的卫星遥测数据维度1的第2类数据示意图;
图11(c)为实施例提出的卫星遥测数据维度1的第3类数据示意图;
图11(d)为实施例提出的卫星遥测数据维度1的第4类数据示意图;
图12(a)为实施例提出的卫星遥测数据维度2的第1类数据示意图;
图12(b)为实施例提出的卫星遥测数据维度2的第2类数据示意图;
图12(c)为实施例提出的卫星遥测数据维度2的第3类数据示意图;
图12(d)为实施例提出的卫星遥测数据维度2的第4类数据示意图;
图13(a)为实施例提出的卫星遥测数据维度3的第1类数据示意图;
图13(b)为实施例提出的卫星遥测数据维度3的第2类数据示意图;
图13(c)为实施例提出的卫星遥测数据维度3的第3类数据示意图;
图13(d)为实施例提出的卫星遥测数据维度3的第4类数据示意图;
图14(a)为实施例提出的卫星遥测数据维度1的第1类结果示意图;
图14(b)为实施例提出的卫星遥测数据维度1的第2类结果示意图;
图14(c)为实施例提出的卫星遥测数据维度1的第3类结果示意图;
图14(d)为实施例提出的卫星遥测数据维度1的第4类结果示意图;
图15(a)为实施例提出的卫星遥测数据维度2的第1类结果示意图;
图15(b)为实施例提出的卫星遥测数据维度2的第2类结果示意图;
图15(c)为实施例提出的卫星遥测数据维度2的第3类结果示意图;
图15(d)为实施例提出的卫星遥测数据维度2的第4类结果示意图;
图16(a)为实施例提出的卫星遥测数据维度3的第1类结果示意图;
图16(b)为实施例提出的卫星遥测数据维度3的第2类结果示意图;
图16(c)为实施例提出的卫星遥测数据维度3的第3类结果示意图;
图16(d)为实施例提出的卫星遥测数据维度3的第4类结果示意图。
具体实施方式
具体实施方式一:本实施方式的一种基于马氏距离DTW的多维时间序列分类方法,具体是按照以下步骤制备的:
步骤一:将卫星正常运行状态下的历史卫星遥测数据Y以幅角突变点为标识进行分段,得到正常多维时间序列X={x1,x2,...,xj,...xn},其中,Y为nd行na列的历史卫星遥测数据矩阵,nd为多维时间序列的维度值,na为所有历史卫星遥测数据的数据点数,xj为nd行nlen列数据矩阵表示X的第j个序列,j=1,2,…,n,nlen为时间序列长度,n为X中的成员数目;
步骤二、将分段后所得到的多维时间序列X={x1,x2,...,xj,...xn},通过层次聚类方法设定聚类目标类别数目为c对序列进行聚类操作,从而获得多维时间序列的类别标签L={l1,l2,…,ln};其中,c为大于1小于n的正整数,ls表示L序列的第s个元素,其取值由层次聚类结果确定,其中s=1,2,…,n;此处类别指定工作,其方法并不固定,能够实现类别指定任何现有方法都可以,层次聚类方法是能够实现类别指定的方法之一;
步骤三:提取最新卫星遥测数据中相邻m+1个幅角突变点对应时间点之内的测试数据即待分类多维时间序列为X′={x′1,x′2,...,x′m},其中,m为大于0的正整数;
步骤四、计算出待分类的多维时间序列X′={x′1,x′2,...,x′m}与含有类别标签的多维时间序列X={x1,x2,...,xj,...xn}之间的DTW距离序列
其中,dij的计算方式如下:
dij=DTWma(x'i,xj)
x'i表示X′的第i个序列,i=1,2,…,m;DTWma表示基于马氏距离的DTW距离算法;DTW(Dynamic Time Warping)是一种通过弯曲时间轴来更好地对时间序列形态进行匹配映射的相似性度量方法(现有理论),dij为x'i与xj之间的基于马氏距离的DTW距离;
步骤五、采用基于马氏距离的DTW距离的KNN分类方法,根据设定的K近邻数目对待分类的多维时间序列X′={x′1,x′2,...,x′m}进行分类,确定待分类的多维时间序列X′={x′1,x′2,...,x′m}的所属类别L′={l′1,l′2,…,l′m},其中,K=1,2,…,n;所属类别l'为1,2,L,c中确定的某个数;KNN(K-Nearest Neighbor)为K最近邻分类算法;即完成了一种基于马氏距离DTW的多维时间序列分类方法。
本实施方式效果:
对卫星遥测数据进行分类是对卫星遥测数据进行数据挖掘的一项重要功能,在分类的基础之上可以完成多种数据挖掘任务,比如模式识别、异常检测等等。而卫星遥测数据有其自身特点,比如:参数多、维度高、存在漂移等,这些特点致使在针对卫星遥测数据的分类采用经典的时间序列相似性度量方法,如欧式距离、皮尔森相关系数等,体现出不适应性。经典的时间序列度量方法,不能排除多维时间序列之间的相关性影响,同时,针对时间序列存在微小偏移不能实现异步度量使得度量结果不够准确,进而导致对卫星遥测数据的分类结果不够准确。因此,需要应用更为合理的时间序列相似性度量方法。针对一些复杂或者特点不尽相同的卫星遥测数据,选取适当的时间序列相似性度量方法,可以确保相应的模式挖掘取得更为良好的效果。各部分的具体发明效果如下:
本发明首先针对按照固定点对卫星遥测数据分段效果不理想的情况如图4所示,提出了按照卫星遥测数据中的幅角突变点为标识进行分段的方法,其分段效果如图5所示,以幅角为标识进行分段的分段结果更为紧凑,各个分段序列之间的耦合度更高、更为合理。
然后,采用基于马氏距离的动态时间规整(Dynamic Time Warping,DTW)距离对多维卫星遥测数据时间序列之间的距离进行度量,排除了多维时间序列之间的相关性影响,实现异步度量,解决了由于时间序列存在微小偏移而使度量结果不够确的问题。
最后,结合K最近邻居(K-Nearest Neighbor,KNN)分类算法以及卫星遥测数据历史多维时间序列对最新遥测多维时间序列进行分类,更好地实现了对卫星目前的运行状态的判别。
具体实施方式二:本实施方式与具体实施方式一不同的是:步骤一中幅角为卫星遥测数据的测试参量之一,幅角变化规律为从0°~360°依次递增,具有明显的周期性,幅角值由360°变为0°为幅角突变点。其它步骤及参数与具体实施方式一相同。
具体实施方式三:本实施方式与具体实施方式一或二不同的是:步骤一中将卫星正常运行状态下的历史卫星遥测数据Y以幅角突变点为标识进行分段,得到正常多维时间序列X={x1,x2,...,xj,...xn}具体过程为:
(1)当幅角达到360°后,则变为0°重新开始递增,从360°变为0°这个点为幅角突变点;
(2)记录幅角突变点的对应时间;
(3)根据幅角突变点对应的时间,提取相邻两个幅角突变点对应时间之内的测试数据为时间序列;其中多维时间序列是由多条时间序列组成;其中,测试数据为偏航姿态角、飞轮转速和母线电压。其它步骤及参数与具体实施方式一或二相同。
具体实施方式四:本实施方式与具体实施方式一至三之一不同的是:步骤四中计算出dij的具体过程为:
(1)计算待分类的多维时间序列各维度之间的协方差矩阵Ccov,其计算方式为:
Ccov=E{[Y-E(Y)][Y-E(Y)]T}
其中,Y为nd行na列的历史卫星遥测数据矩阵么,E是表示计算期望值;
(2)基于马氏距离的DTW距离即在两条时间序列之间寻找最优弯曲路径来得到最小马氏距离度量值DTWma(x'i,xj);采用马氏距离进行计算得出d(pk),计算方式为:
d ( p k ) = D M ( x ′ ii ′ k , x jj ′ k ) = x ′ ii ′ k - x jj ′ k ) T C cov - 1 ( x ′ ii ′ k , x jj ′ k )
在弯曲路径中,存在一条最优路径使得它的弯曲总代价最小,即:
DTW m a ( x ′ i , x j ) = min p Σ k = 1 K ′ d ( p k )
其中,P={p1,p2,…,pK'}表示弯曲路径,pk表示P的第k个成员,k=1,2,…,K',并用来表示x'i中的第i'个元素x'ii'k与xj中的第j'个元素xjj'k之间的对应关系i'=1,2,…,nlen,j'=1,2,…,nlen,d(pk)表示x'ii'k与xjj'k的弯曲代价;
(3)为了求解通过动态规划来构造一个代价矩阵R(i',j'),即:
R(i',j')=d(i',j')+min{R(i',j'-1),R(i'-1,j'-1),R(i'-1,j')}
其中,R(0,0)=0,R(i',0)=R(0,j')=+∞;R(nlen,nlen)就是DTW度量时间序列x'i和xj的最小距离值,即得到DTWma(x'i,xj)=R(nlen,nlen)。其它步骤及参数与具体实施方式一至三之一相同。
具体实施方式五:本实施方式与具体实施方式一至四之一不同的是:步骤五中采用基于马氏距离的DTW距离的KNN分类方法,根据设定的K近邻数目对待分类的多维时间序列X′={x′1,x′2,...,x′m}进行分类,确定待分类的多维时间序列X′={x′1,x′2,...,x′m}的所属类别L′={l′1,l′2,…,l′m}的过程为:
(1)确定与待分类的多维时间序列X′={x′1,x′2,...,x′m}中的各成员之间基于马氏距离的DTW距离最小的K个含有类别标签的多维时间序列,即在中,每行元素中取出K个最小的数值,确定这K个最小的数值对应的含有类别标签的多维时间序列,对应的类别标签为
(2)统计类别每行类别标签中出现频率最高的类别,即为分类的多维时间序列X′={x′1,x′2,...,x′m}的所属类别为L′={l′1,l′2,…,l′m}。其它步骤及参数与具体实施方式一至四之一相同。
采用以下实施例验证本发明的有益效果:
实施例:
针对Wafer数据集开展基于不同时间序列相似性度量方法的KNN分类仿真实验,Wafer数据集共包含6个维度,各维度数据如图5至图10所示,其分类结果如表1所示。
表1针对Wafer数据集采用不同相似性度量方法的分类结果
通过实验结果可以发现,传统欧式距离的度量结果表现最差,而基于马氏距离的DTW距离表现最好,其中当设定限制窗口长度为5时效果达到最佳准确率达到98.10%,相对于欧式距离的准确率提升了10.85%。
卫星遥测数据分类实验:
针对卫星遥测数据开展基于不同时间序列相似性度量方法的KNN分类实验,其中训练样本数为50,样本包含三个维度其对应关系分别是:偏航姿态角对应维度1、飞轮转速D对应维度2、母线电压对应维度3,其总共分为4个类别各类别数据如图11(a)~(d)至图13(a)~(d)示,测试样本为50,其分类结果如表2所示,图14(a)~(d)、图15(a)~(d)和图16(a)~(d)为采用基于马氏距离的DTW距离的KNN算法具体分类情况,其分类结果如表2所示。
表2针对卫星遥测数据采用不同相似性度量方法的分类结果
通过实验结果可以发现,传统欧式距离的度量结果依旧表现最差,而基于马氏距离的DTW距离表现最好,其准确率达到98.00%,相对于欧式距离的准确率提升了4.35%.
本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,本领域技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims (5)

1.一种基于马氏距离DTW的多维时间序列分类方法,其特征在于一种基于马氏距离DTW的多维时间序列分类方法具体是按照以下步骤进行的:
步骤一:将卫星正常运行状态下的历史卫星遥测数据Y以幅角突变点为标识进行分段,得到正常多维时间序列X={x1,x2,...,xj,...xn},其中,Y为nd行na列的历史卫星遥测数据矩阵,nd为多维时间序列的维度值,na为所有历史卫星遥测数据的数据点数,xj为nd行nlen列数据矩阵表示X的第j个序列,j=1,2,…,n,nlen为时间序列长度,n为X中的成员数目;
步骤二、将分段后所得到的多维时间序列X={x1,x2,...,xj,...xn},通过层次聚类方法设定聚类目标类别数目为c对序列进行聚类操作,从而获得多维时间序列的类别标签L={l1,l2,…,ln};其中,c为大于1小于n的正整数,ls表示L序列的第s个元素,其取值由层次聚类结果确定,其中s=1,2,…,n;
步骤三:提取最新卫星遥测数据中相邻m+1个幅角突变点对应时间点之内的测试数据即待分类多维时间序列为X′={x′1,x′2,...,x′m},其中,m为大于0的正整数;
步骤四、计算出待分类的多维时间序列X′={x′1,x′2,...,x′m}与含有类别标签的多维时间序列X={x1,x2,...,xj,...xn}之间的DTW距离序列
其中,dij的计算方式如下:
dij=DTWma(x'i,xj)
x'i表示X′的第i个序列,i=1,2,…,m;DTWma表示基于马氏距离的DTW距离算法;DTW,dij为x'i与xj之间的基于马氏距离的DTW距离;
步骤五、采用基于马氏距离的DTW距离的KNN分类方法,根据设定的K近邻数目对待分类的多维时间序列X′={x′1,x′2,...,x′m}进行分类,确定待分类的多维时间序列X′={x′1,x′2,...,x′m}的所属类别L′={l′1,l′2,…,l′m},其中,K=1,2,…,n;所属类别l'为1,2,L,c中确定的某个数;KNN为K最近邻分类算法;即完成了一种基于马氏距离DTW的多维时间序列分类方法。
2.根据权利要求1所述一种基于马氏距离DTW的多维时间序列分类方法,其特征在于:步骤一中幅角为卫星遥测数据的测试参量之一,幅角变化规律为从0°~360°依次递增,具有明显的周期性,幅角值由360°变为0°为幅角突变点。
3.根据权利要求1所述一种基于马氏距离DTW的多维时间序列分类方法,其特征在于:步骤一中将卫星正常运行状态下的历史卫星遥测数据Y以幅角突变点为标识进行分段,得到正常多维时间序列X={x1,x2,...,xj,...xn}具体过程为:
(1)当幅角达到360°后,则变为0°重新开始递增,从360°变为0°这个点为幅角突变点;
(2)记录幅角突变点的对应时间;
(3)根据幅角突变点对应的时间,提取相邻两个幅角突变点对应时间之内的测试数据为时间序列;其中多维时间序列是由多条时间序列组成;其中,测试数据为偏航姿态角、飞轮转速和母线电压。
4.根据权利要求1所述一种基于马氏距离DTW的多维时间序列分类方法,其特征在于:步骤四中计算出dij的具体过程为:
(1)计算待分类的多维时间序列各维度之间的协方差矩阵Ccov,其计算方式为:
Ccov=E{[Y-E(Y)][Y-E(Y)]T}
其中,Y为nd行na列的历史卫星遥测数据矩阵么,E是表示计算期望值;
(2)基于马氏距离的DTW距离即在两条时间序列之间寻找最优弯曲路径来得到最小马氏距离度量值DTWma(x'i,xj);采用马氏距离进行计算得出d(pk),计算方式为:
d ( p k ) = D M ( x ′ ii ′ k , x jj ′ k ) = x ′ ii ′ k , x jj ′ k ) T C cov - 1 ( x ′ ii ′ k , x jj ′ k )
在弯曲路径中,存在一条最优路径使得它的弯曲总代价最小,即:
DTW m a ( x ′ i , x i ) = min p Σ k = 1 K ′ d ( p k )
其中,P={p1,p2,…,pK'}表示弯曲路径,pk表示P的第k个成员,k=1,2,…,K',并用来表示x'i中的第i'个元素x'ii'k与xj中的第j'个元素xjj'k之间的对应关系i'=1,2,…,nlen,j'=1,2,…,nlen,d(pk)表示x'ii'k与xjj'k的弯曲代价;
(3)为了求解通过动态规划来构造一个代价矩阵R(i',j'),即:
R(i',j')=d(i',j')+min{R(i',j'-1),R(i'-1,j'-1),R(i'-1,j')}
其中,R(0,0)=0,R(i',0)=R(0,j')=+∞;R(nlen,nlen)就是DTW度量时间序列x'i和xj的最小距离值,即得到DTWma(x'i,xj)=R(nlen,nlen)。
5.根据权利要求1所述一种基于马氏距离DTW的多维时间序列分类方法,其特征在于:步骤五中采用基于马氏距离的DTW距离的KNN分类方法,根据设定的K近邻数目对待分类的多维时间序列X′={x′1,x′2,...,x′m}进行分类,确定待分类的多维时间序列X′={x′1,x′2,...,x′m}的所属类别L′={l′1,l′2,…,l′m}的过程为:
(1)确定与待分类的多维时间序列X′={x′1,x′2,...,x′m}中的各成员之间基于马氏距离的DTW距离最小的K个含有类别标签的多维时间序列,即在中,每行元素中取出K个最小的数值,确定这K个最小的数值对应的含有类别标签的多维时间序列,对应的类别标签为
(2)统计类别每行类别标签中出现频率最高的类别,即为分类的多维时间序列X′={x′1,x′2,...,x′m}的所属类别为L′={l′1,l′2,…,l′m}。
CN201510351181.7A 2015-06-24 2015-06-24 一种基于马氏距离dtw的多维时间序列分类方法 Active CN104915434B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510351181.7A CN104915434B (zh) 2015-06-24 2015-06-24 一种基于马氏距离dtw的多维时间序列分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510351181.7A CN104915434B (zh) 2015-06-24 2015-06-24 一种基于马氏距离dtw的多维时间序列分类方法

Publications (2)

Publication Number Publication Date
CN104915434A true CN104915434A (zh) 2015-09-16
CN104915434B CN104915434B (zh) 2018-03-27

Family

ID=54084497

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510351181.7A Active CN104915434B (zh) 2015-06-24 2015-06-24 一种基于马氏距离dtw的多维时间序列分类方法

Country Status (1)

Country Link
CN (1) CN104915434B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709509A (zh) * 2016-11-30 2017-05-24 哈尔滨工业大学 一种基于时间序列特殊点的卫星遥测数据聚类方法
CN107451231A (zh) * 2017-07-24 2017-12-08 上海电力学院 基于相似性查询的示功图分类算法
CN108228832A (zh) * 2018-01-04 2018-06-29 南京大学 一种基于距离矩阵的时间序列数据补全方法
CN109034179A (zh) * 2018-05-30 2018-12-18 河南理工大学 一种基于马氏距离idtw的岩层分类方法
CN109241077A (zh) * 2018-08-30 2019-01-18 东北大学 基于相似性的生产指标变化趋势可视化查询***及方法
CN109362036A (zh) * 2018-10-17 2019-02-19 桂林电子科技大学 一种基于图像与wifi相结合的多模态室内定位方法
CN109816211A (zh) * 2018-12-29 2019-05-28 北京英视睿达科技有限公司 判断污染区域相似性及提高治理污染效率的方法及装置
CN109828952A (zh) * 2019-01-18 2019-05-31 上海卫星工程研究所 Pcm体制卫星遥测数据分类提取方法、***
CN110288003A (zh) * 2019-05-29 2019-09-27 北京师范大学 数据变化识别方法及设备
CN110289986A (zh) * 2019-05-27 2019-09-27 武汉大学 一种网络仿真数据的准确性量化方法
CN111104438A (zh) * 2019-11-21 2020-05-05 新浪网技术(中国)有限公司 时间序列的周期性确定方法、装置及电子设备
WO2020220438A1 (zh) * 2019-04-29 2020-11-05 东北大学 一种针对虚拟机不同类型的业务并发量预测方法
CN112380992A (zh) * 2020-11-13 2021-02-19 上海交通大学 一种加工过程监控数据准确性评估与优化方法及装置
CN116504416A (zh) * 2023-06-27 2023-07-28 福建无止境光学仪器有限公司 基于机器学习的眼睛度数预测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101561878A (zh) * 2009-05-31 2009-10-21 河海大学 基于改进cure聚类算法的无监督异常检测方法和***
US8005771B2 (en) * 2007-10-04 2011-08-23 Siemens Corporation Segment-based change detection method in multivariate data stream
CN103646167A (zh) * 2013-11-22 2014-03-19 北京空间飞行器总体设计部 一种基于遥测数据的卫星异常状态检测***
CN104102726A (zh) * 2014-07-22 2014-10-15 南昌航空大学 基于层次聚类的改进k均值聚类算法
CN104123368A (zh) * 2014-07-24 2014-10-29 中国软件与技术服务股份有限公司 基于聚类的大数据属性重要性和辨识度的预警方法及***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8005771B2 (en) * 2007-10-04 2011-08-23 Siemens Corporation Segment-based change detection method in multivariate data stream
CN101561878A (zh) * 2009-05-31 2009-10-21 河海大学 基于改进cure聚类算法的无监督异常检测方法和***
CN103646167A (zh) * 2013-11-22 2014-03-19 北京空间飞行器总体设计部 一种基于遥测数据的卫星异常状态检测***
CN104102726A (zh) * 2014-07-22 2014-10-15 南昌航空大学 基于层次聚类的改进k均值聚类算法
CN104123368A (zh) * 2014-07-24 2014-10-29 中国软件与技术服务股份有限公司 基于聚类的大数据属性重要性和辨识度的预警方法及***

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709509B (zh) * 2016-11-30 2021-05-28 哈尔滨工业大学 一种基于时间序列特殊点的卫星遥测数据聚类方法
CN106709509A (zh) * 2016-11-30 2017-05-24 哈尔滨工业大学 一种基于时间序列特殊点的卫星遥测数据聚类方法
CN107451231A (zh) * 2017-07-24 2017-12-08 上海电力学院 基于相似性查询的示功图分类算法
CN108228832A (zh) * 2018-01-04 2018-06-29 南京大学 一种基于距离矩阵的时间序列数据补全方法
CN108228832B (zh) * 2018-01-04 2022-04-22 南京大学 一种基于距离矩阵的时间序列数据补全方法
CN109034179A (zh) * 2018-05-30 2018-12-18 河南理工大学 一种基于马氏距离idtw的岩层分类方法
CN109241077A (zh) * 2018-08-30 2019-01-18 东北大学 基于相似性的生产指标变化趋势可视化查询***及方法
CN109362036A (zh) * 2018-10-17 2019-02-19 桂林电子科技大学 一种基于图像与wifi相结合的多模态室内定位方法
CN109816211B (zh) * 2018-12-29 2023-11-24 北京英视睿达科技股份有限公司 判断污染区域相似性及提高治理污染效率的方法及装置
CN109816211A (zh) * 2018-12-29 2019-05-28 北京英视睿达科技有限公司 判断污染区域相似性及提高治理污染效率的方法及装置
CN109828952B (zh) * 2019-01-18 2021-05-11 上海卫星工程研究所 Pcm体制卫星遥测数据分类提取方法、***
CN109828952A (zh) * 2019-01-18 2019-05-31 上海卫星工程研究所 Pcm体制卫星遥测数据分类提取方法、***
WO2020220438A1 (zh) * 2019-04-29 2020-11-05 东北大学 一种针对虚拟机不同类型的业务并发量预测方法
CN110289986B (zh) * 2019-05-27 2021-05-18 武汉大学 一种网络仿真数据的准确性量化方法
CN110289986A (zh) * 2019-05-27 2019-09-27 武汉大学 一种网络仿真数据的准确性量化方法
CN110288003A (zh) * 2019-05-29 2019-09-27 北京师范大学 数据变化识别方法及设备
CN110288003B (zh) * 2019-05-29 2022-01-18 北京师范大学 数据变化识别方法及设备
CN111104438A (zh) * 2019-11-21 2020-05-05 新浪网技术(中国)有限公司 时间序列的周期性确定方法、装置及电子设备
CN112380992A (zh) * 2020-11-13 2021-02-19 上海交通大学 一种加工过程监控数据准确性评估与优化方法及装置
CN112380992B (zh) * 2020-11-13 2022-12-20 上海交通大学 一种加工过程监控数据准确性评估与优化方法及装置
CN116504416A (zh) * 2023-06-27 2023-07-28 福建无止境光学仪器有限公司 基于机器学习的眼睛度数预测方法
CN116504416B (zh) * 2023-06-27 2023-09-08 福建无止境光学仪器有限公司 基于机器学习的眼睛度数预测方法

Also Published As

Publication number Publication date
CN104915434B (zh) 2018-03-27

Similar Documents

Publication Publication Date Title
CN104915434A (zh) 一种基于马氏距离dtw的多维时间序列分类方法
CN109271975B (zh) 一种基于大数据多特征提取协同分类的电能质量扰动识别方法
Hsu et al. Multiple time-series convolutional neural network for fault detection and diagnosis and empirical study in semiconductor manufacturing
CN110336534B (zh) 一种基于光伏阵列电气参数时间序列特征提取的故障诊断方法
Zheng et al. A new unsupervised data mining method based on the stacked autoencoder for chemical process fault diagnosis
Chen et al. A just-in-time-learning-aided canonical correlation analysis method for multimode process monitoring and fault detection
CN112101220B (zh) 一种无监督模型参数迁移的滚动轴承寿命预测方法
Zhou et al. Bearing fault recognition method based on neighbourhood component analysis and coupled hidden Markov model
Wang et al. A novel weighted sparse representation classification strategy based on dictionary learning for rotating machinery
CN107561997B (zh) 一种基于大数据决策树的电力设备状态监测方法
Hachicha et al. A survey of control-chart pattern-recognition literature (1991–2010) based on a new conceptual classification scheme
CN104915568B (zh) 基于dtw的卫星遥测数据异常检测方法
CN109297689B (zh) 一种引入权重因子的大型水力机械智能诊断方法
CN104931263B (zh) 一种基于符号化概率有限状态机的轴承故障诊断方法
CN110018670A (zh) 一种基于动态关联规则挖掘的工业过程异常工况预测方法
CN102435910B (zh) 基于支持向量分类的功率电子电路健康监测方法
CN104655423A (zh) 一种基于时频域多维振动特征融合的滚动轴承故障诊断方法
CN106709509A (zh) 一种基于时间序列特殊点的卫星遥测数据聚类方法
CN109542952A (zh) 一种时间序列异常点的检测方法
Parvez et al. Comparison of the Smith-Waterman and Needleman-Wunsch algorithms for online similarity analysis of industrial alarm floods
CN111783336A (zh) 一种基于深度学习理论的不确定性结构频响动力学模型修正方法
CN109145764B (zh) 综合检测车的多组检测波形的未对齐区段识别方法及装置
CN108256274B (zh) 基于搜索吸引子误差算法的电力***状态识别方法
CN118037112A (zh) 一种基于数据驱动的胎面质量预测模型构建方法
Si et al. A data-driven fault detection framework using mahalanobis distance based dynamic time warping

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant