CN109359135A - 一种基于分段权重的时间序列相似性搜索方法 - Google Patents

一种基于分段权重的时间序列相似性搜索方法 Download PDF

Info

Publication number
CN109359135A
CN109359135A CN201811024227.4A CN201811024227A CN109359135A CN 109359135 A CN109359135 A CN 109359135A CN 201811024227 A CN201811024227 A CN 201811024227A CN 109359135 A CN109359135 A CN 109359135A
Authority
CN
China
Prior art keywords
sequence
weight
time series
segmentation
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811024227.4A
Other languages
English (en)
Other versions
CN109359135B (zh
Inventor
王继民
刘琪
张鹏程
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hohai University HHU
Original Assignee
Hohai University HHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU filed Critical Hohai University HHU
Priority to CN201811024227.4A priority Critical patent/CN109359135B/zh
Publication of CN109359135A publication Critical patent/CN109359135A/zh
Application granted granted Critical
Publication of CN109359135B publication Critical patent/CN109359135B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于分段权重的时间序列相似性搜索方法,步骤为:(1)采用时间序列重要转折点对查询序q进行分段;(2)建立带权重的分段欧式距离作为时间序列相似度量;(3)对q进行k‑近邻相似查询,检索查询序列q的k个最相似的序列;(4)如果用户对步骤(3)得出的查询结果满意,则查询结束;若用户对步骤(3)得出的查询结果不满意,则对结果进行标记并进入步骤(5);(5)***利用用户标记的序列对分段的权重进行更新,并返回步骤(2)。本发明通过用户反馈进行权重自动更新,自适应地学习用户对不同段的关注程度,能够提高相似性度量的准确度,进而优化搜索结果。

Description

一种基于分段权重的时间序列相似性搜索方法
技术领域
本发明属于信息处理技术领域,特别涉及一种基于分段权重的时间序列相似性搜索方法。
背景技术
数据挖掘就是从大型数据库的数据中提取人们感兴趣的、隐含的和事先未知的知识。在许多现实数据库中,数据常常是按时间顺序记录的一系列观测值,对象的属性值可能会随时间而变化。因此,从时间序列数据中挖掘潜在的有用知识具有重要的理论和实践意义。针对时间序列数据模式挖掘的研究,主要集中于时间序列数据相似性模式挖掘。时间序列数据相似性模式挖掘就是在数据库中发现与给定时间序列数据模式很相似的时间序列序列。它具有广泛的实用价值,例如:对观测的空间数据库记录的恒星和行星的时间序列数据进行相似性分析,能帮助天文学家发现新的星星;根据各种商品的销售记录,找出具有相似的商品销售模式,根据相似产品的销售模式来制定相似的销售策略等;找出自然灾害发生的相同前兆,从而对预报自然灾害进行决策研究等。
相似性搜索在1993年由R.Agrawal首次提出,他是时间序列预测、分类、聚类以及序列模式挖掘等等的重要基础。时间序列相似性查找与传统的精确查询不同,由于时间序列在数值上具有连续性以及有不同的噪声影响,因此,大部分情况下不需要时间序列很精确匹配。另一方面是时间序列相似性查询不是针对时间序列中的某个具体的数值,而根据给定的查询序列在所给的时间序列数据集来找查找是在一段时间内具有相似形态特征和变化趋势的时间序列。在时间序列相似性搜索中,需解决的问题包括时间序列特征提取、时间序列索引以及相似度量等。针对相似度量,研究人员提出了各种度量方法,如欧氏距离及其基于Lp准则的变种、动态时间弯曲距离(Dynamic Time Warping,DTW)、编辑距离(EditDistance,ED)、模式距离(Pattern Distance,PD)、以及最长公共子串(Longest CommonSubsequence,LCSS)等。
在实际应用中,很多时候用户对每条相关序列的感兴趣程度并不是一样,甚至对一条时间序列不同分段的感兴趣程度也不一样。如在水文序列中,用户更关注洪水峰值附近的序列。目前的时间序列数据相似性模式挖掘算法缺乏有效手段进一步获得使用户满意的结果,而且在上述算法中,用户难以有效地参与时间序列数据相似性模式的挖掘过程。
相关反馈技术(relevance feedback)可以让用户与查询***进行交互,用户对查询结果进行标注(指出结果中相似和不相似的部分),查询***根据用户的反馈重新组织查询,以提高用户的满意度。
发明内容
发明目的:为了克服现有技术中存在的不足,本发明提供一种查询效率高,查询结果精准,满意度高的基于分段权重的时间序列相似性搜索方法。
技术方案:为实现上述目的,本发明提供一种基于分段权重的时间序列相似性搜索方法,包括如下步骤:
(1)采用时间序列重要转折点对查询序q进行分段;
(2)建立带权重的分段欧式距离作为时间序列相似度量;
(3)对q进行k-近邻相似查询,检索查询序列q的k个最相似的序列;
(4)如果用户对步骤(3)得出的查询结果满意,则查询结束;若用户对步骤(3)得出的查询结果不满意,则对结果进行标记并进入步骤(5);
(5)***利用用户标记的序列对分段的权重进行更新,并返回步骤(2)。
进一步的,所述步骤(1)中采用时间序列重要转折点对时间序列分段的具体步骤如下:
序列转折点定义为:对时间序列X={x1,x2,...,xi,...,xm},当xi满足下述公式中的任意一个,那么xi则称为序列转折点;
{(xi≥xi-1)(xi>xi+1)}{(xi>xi-1)(xi≥xi+1)}
{(xi≤xi-1)(xi<xi+1)}{(xi<xi-1)(xi≤xi+1)}
对原始序列提取转折点得到的转折序列对转折点序列XT中,三个连续转折点构成的序列中,当区域的距离大于阈值ε时,则称为重要转折点;数据点Xj=(vj,tj)到点Xj-1=(vj-1,tj-1)和Xj+1=(vj+1,tj+1)之间的距离其中,vj是数据点Xj的取值,tj是数据点Xj的时间下标。
进一步的,所述步骤(2)中采用带权重的分段欧式距离建立时间序列相似性度量的具体步骤如下:
查询序列Q被重要转折点拆分成n段{q1,q2,…,qn},每段权重分别为W1,W2,…,Wn,待查序列T在同样下标位置被分割成n段,则带分段权重的欧式距离如下:
Dist(Q,T)=W1×D(q1,t1)+W2×D(q2,t2)+...+Wn×D(qn,tn)
每段的初始权重都相同,为1/n;其中,D(qi,ti)表示Q,T第i段之间的欧式距离。
进一步的,所述步骤(4)中进行相似查询,检索查询序列q的k-近邻,的并以距离作为相似度评价标准,距离越远,相似度越低,距离越近,相似度越高,将查询结果按照从距离最近到最远展示给用户;用户若对查询结果满意,则结束查询;若对查询结果不满意,则对查询结果进行标注,用户标注出所有和查询序列相似的序列。
进一步的,所述步骤(5)中利用用户标注的相似序列对分段权重进行更新的具体步骤如下:
针对第i段,计算所有相似序列第i段到查询序列第i段的距离,并计算所有距离的标准差和均值,然后采用下述公式进行权重更新;
其中Wi表示第i段序列段的在整条时间序列中所占的比重,σi和μi是所有第i段序列的相似距离的标准差和平均差;然后采用下述公式对权重进行标准化;
有益效果:本发明与现有技术相比具有以下优点:
本发明所提供的一种基于分段权重的时间序列相似性搜索方法,考虑到实际应用中,用户可能对序列各部分的兴趣程度并不同,如在水文序列中,用户更关注洪水峰值附近的序列。本发明首先将查询序列基于重要转折点进行分段表示,与之相匹配,在计算序列相似性时采用分段带有权重的方式计算。在初始查询中每一段的权重一样,在反馈过程中利用用户反馈自适应地学习用户对不同段的关注程度,更新每段权重,以提高相似性度量的准确度,进而提高查询的准确率。
附图说明
图1是本发明的流程图;
图2;(a)为具体实施例中Adiac数据集中一条查询序列图;(b)为具体实施例中阈值0.5的分割图;
图3;为具体实施例中初次查询结果图;
图4;为具体实施例中权重更新后查询结果图;
图5为具体实施例中数据集Adiac中的某个查询序列的分割图;
图6为具体实施例中数据集Cricket_X中的某个查询序列的分割图;
图7为具体实施例中数据集50words中的某个查询序列的分割图;
图8为具体实施例中Adaic、Cricket_X以及50words数据集中某次查询序列在不同阈值的查准率;
图9为具体实施例中Adaic数据集中不同阈值下的P-R曲线图;
图10为具体实施例中Cricket_X数据集中不同阈值下的P-R曲线图;
图11为具体实施例中50words数据集中不同阈值下的P-R曲线图。
具体实施方式
下面结合附图对本发明作更进一步的说明。
如图1所示,本发明的一种基于分段权重的时间序列相似性搜索方法的流程图,步骤如下:
步骤1:读取查询序列q以及时间序列数据集S;
步骤3:采用重要转折点对查询序列Q进行分段得到Q={q1,q2,...,qn},并记录相应的分段点位置,具体算法如下。
提取序列重要转折点算法的具体流程见算法1。
步骤4:采用分段权重的相似性度量方法计算数据集中所有待查序列T与查询序列Q的相似度。公式如下:
Dist(Q,T)=W1×D(q1,t1)+W2×D(q2,t2)+...+Wn×D(qn,tn)
其中Dist(Q,T)表示时间序列T和查询序列Q之间的相似度,D(qn,tn)表示tn和qn之间的相似度,其度量函数度量包括欧氏距离及其基于Lp准则的变种、动态时间弯曲距离(Dynamic Time Warping,DTW)、编辑距离(EditDistance,ED)、模式距离(PatternDistance,PD)、以及最长公共子串(Longest Common Subsequence,LCSS)等。W1,W2,…,Wn为每段权重。将所有的权重Wn初始化为W0,W0是一个无偏权重,使得每一分段具有等同的权重。权重更新算法具体流程如下算法1描述。
步骤5:并采用topK方法返回排序靠前的N个序列给用户。
以分段欧式距离作为相似度评价标准,距离越远,相似度越低,距离越近,相似度越高。查询相似序列,并展示距离最近的k个相似序列。
步骤:6:进行用户交互,用户若对查询结果满意则结束查询,若不满意则进入步骤6。
步骤7:根据查询结果标注出相关序列即用户满意的时间序列。
步骤8:计算每条相关序列与查询序列的每段之间距离,可以是欧式距离、DTW距离等。
步骤9:计算第i段的距离的标准差和平均值,更新权重:并归一化权重,
其中Wi表示第i段序列段的在整条时间序列中所占的比重,σi和μi是所有第i段序列的相似距离的标准差和平均差。公式(4.16)则是对各分段权重进行归一化处理。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
实施例
本实施例采用UCR数据集中的Adiac数据集为例做详细步骤介绍,分段阈值大小仅选择0.5作示范,在实际应用中分段阈值的大小可以通过实验调试的方法或对凭经验来确定。分段距离的计算以欧式距离为例。
(1)选择Adiac数据集中的一条数据作为查询序列,如图2(a)所示;
(2)选择一个阈值,并利用重要转折点对查询序列进行分段,如图2(b)所示,分段阈值为0.5时提取出6个分割点。
(3)初始化各段权重为1/6,采分段权重的相似性度量方法进行度量,计算各待查序列与查询序列之间的分段欧式距离,采用topK方法得到前3个查询结果。如图3所示。
(4)用户对查询结果进行标注,并反馈给***,对各段权重进行更新,更新各段权重如表2所示,
(5)采用新的分段权重计算距离,采用topK方法得到前3个查询结果,如图4所示。
从图3和图4的对比中可以明显看出图4中的3条结果序列和查询序列更加相似,明显优于图3中的结果序列。因此可以说本发明的方法能够有效的提高查询的准确率。
实验与分析
采用UCR数据集中21组数据集进行实验,每个子数据集都含有训练集和测试集,在训练集中每个数据集中所有序列都已经被标注类别,且各数据集中时间序列等长。UCR数据集中标注的类别是分类得来的,而分类的依据则是它们的相似程度,因此,同一个类别的序列是具有一定相似性的。在实验中,为了简化用户反馈这一行为,采用训练集数据作为实验数据,以时间序列的类别作为用户反馈的依据,当时间序列类别和查询时间序列类别一致时,则认为该条时间序列为正相关序列,反之则为负相关序列。当数据集类别较单一时,较容易出现搜索结果的序列类别与查询序列均一致,影响实验效果,所以采用数据集类别数均大于2的数据集进行实验。所用数据集的基本信息如下表1所示,其中包含了数据集的长度、大小以及类别数。
表1各子数据集基本信息
(1)重要转折点分段方法有效性的验证
首先为验证基于重要转折点分段方法是否能有效识别出序列的重要转折点进行了以下实验:对不同数据集中的某次查询序列进行了不同阈值下的分段点提取。图5至图7分别是数据集Adiac、Cricket_X以及50words中的某个查询序列的分割图。从图5中可以发现分段阈值为0.3时提取出10个分割点;分段阈值为0.5时提取出6个分割点,相对减少了4个;分段阈值为0.7时提取出4个分割点,相对减少了2个。从图6中可以发现分段阈值为0.3时提取出10个分割点;分段阈值为0.5时提取出7个分割点,相对减少了3个;分段阈值为0.7时提取出6个分割点,相对减少了1个。从图7中可以发现分段阈值为0.3时提取出9个分割点;分段阈值为0.5时提取出7个分割点,相对减少了2个;分段阈值为0.7时提取出4个分割点,相对减少了3个。从这些分割图中可以发现当阈值越大,重要转折点提取的越少,分段数也越少。如果直接将这些分割点连成一条序列,则发现当阈值越大时,连接成的序列和原序列拟合误差较大。
(2)分段阈值大小对搜索精度的影响
为验证分段阈值大小对搜索精度的影响,进行了不同阈值下的实验。图8是Adaic、Cricket_X以及50words数据集中某次查询序列在不同阈值的查准率,从图中可以清晰地看到阈值0.5的查准率明显高于阈值0.3的查准率,而阈值为0.7时,这3组数据集中只有一组是保持上升趋势,其他2组则有下降的趋势。图9至图11则是Adaic、Cricket_X以及50words数据集中不同阈值下的P-R曲线,从图中可以观察到这几组数据集均是阈值0.3的P-R曲线最低,阈值0.5的P-R曲线和阈值0.7的P-R曲线相差无几,难以判断谁更好。
综上所述,可以得出以下结论:当分段阈值越大时,查准率也会随之变大,但到达一定程度时,变大的幅度就会减小,甚至出现下降的趋势;P-R曲线也是如此。
为进一步弄清楚阈值的大小为何会影响搜索的查准率以及P-R曲线,详细记录了图5中的查询序列在对应阈值分段情况下的权重更新。
表2 Adiac阈值0.3的权重更新表
初始权重 更新1次 更新2次
W<sub>1</sub> 0.08333 0.07346 0.07023
W<sub>2</sub> 0.08333 0.09014 0.09361
W<sub>3</sub> 0.08333 0.08284 0.08125
W<sub>4</sub> 0.08333 0.07519 0.07412
W<sub>5</sub> 0.08333 0.10238 0.09621
W<sub>6</sub> 0.08333 0.09193 0.09245
W<sub>7</sub> 0.08333 0.08549 0.08249
W<sub>8</sub> 0.08333 0.08263 0.08765
W<sub>9</sub> 0.08333 0.09043 0.09215
W<sub>10</sub> 0.08333 0.07527 0.07524
W<sub>11</sub> 0.08333 0.08049 0.08326
W<sub>12</sub> 0.08333 0.07084 0.07145
从表2可以发现在权重更新时,第一次权重更新时,权重极差为0.03,第二次权重更新时,权重极差为0.02,和第一次权重更新相比,变化的幅度略小。
表3 Adiac阈值0.5时权重更新表
W<sub>1</sub> W<sub>2</sub> W<sub>3</sub> W<sub>4</sub> W<sub>5</sub> W<sub>6</sub> W<sub>7</sub>
初始权重 0.14285 0.14285 0.14285 0.14285 0.14285 0.14285 0.14285
更新1次 0.10026 0.17135 0.12776 0.17563 0.19216 0.13285 0.09988
更新2次 0.09143 0.17947 0.13054 0.16325 0.18973 0.14886 0.09549
从表3中可以发现在权重更新时,第一次权重更新时,权重极差为0.1,第二次权重更新时,权重极差为0.09,和阈值为0.3的权重更新相比,本表的权重整体更新的幅度较大。
表4 Adiac阈值0.7的权重更新表
W<sub>1</sub> W<sub>2</sub> W<sub>3</sub> W<sub>4</sub> W<sub>5</sub>
初始权重 0.20000 0.20000 0.20000 0.20000 0.20000
更新1次 0.18026 0.25713 0.26476 0.14563 0.14216
更新2次 0.16432 0.26847 0.25854 0.15563 0.15463
从表4可以发现在权重更新时,第一次权重更新时,权重极差为0.12,第二次权重更新时,权重极差为0.11。和阈值为0.3的权重更新相比,本表的权重整体更新的幅度较大。和阈值为0.5的权重更新相比,本表的权重整体更新的幅度略大。
由此可见,当分段数过多或过少都会导致最终的权重更新幅度不明显,从而导致最终的搜索结果没有达到预期的效果。
通过多组实验表明,当阈值在0.5左右时,大多数数据集实验效果达到最佳因此在下面的实验当中选取阈值为0.5的结果进行比较。
(3)反馈对搜索查准率的影响
为验证方法中反馈是否能优化搜索精度,实验中共做了2轮的权重更新反馈查询,并详细记录了每一轮的查准率,如表5所示。从表5第1轮反馈查询和初始查询的查准率对比中,可以看出在第1轮反馈查询中,所有数据集的查准率均有不同程度的上升,平均上升约0.2;在第2轮反馈查询和第1轮反馈查询的查准率对比中,可以发现大部分数据集查准率同样有不同程度的上升,平均上升约0.02。只有InlineSkate、Cricket_Z等少部分数据集在第2轮反馈查询中查准率有轻微下降,平均下降约0.01。总体来说,基于分段权重的相似性搜索方法是可以在不断的反馈中提高序列相似性搜索的查准率。
表5基于分段权重的查准率
序号 数据集名 初始查询 第1轮反馈 第2轮反馈
1 ChlorineConcentration 0.692245 0.883150 0.900218
2 StarLightCurves 0.861314 0.941548 0.957981
3 Two_Patterns 0.889160 0.968650 0.995890
4 Trace 0.556000 0.738197 0.744438
5 OliveOil 0.710000 0.866667 0.876667
6 Haptics 0.369114 0.575794 0.593542
7 Beef 0.381667 0.546667 0.564667
8 OSULeaf 0.483937 0.729885 0.745136
9 synthetic_control 0.844500 0.932367 0.953357
10 InlineSkate 0.298769 0.508154 0.487148
11 fish 0.682000 0.869315 0.885764
12 Lighting7 0.483916 0.701368 0.713521
13 MedicalImages 0.635933 0.826767 0.842866
14 Cricket_X 0.423590 0.622308 0.641070
15 Cricket_Y 0.462051 0.696154 0.720128
16 Cricket_Z 0.428846 0.661264 0.655328
17 FacesUCR 0.841156 0.943561 0.946384
18 SwedishLeaf 0.667733 0.854685 0.869754
19 WordsSynonyms 0.551160 0.712168 0.743204
20 Adiac 0.472727 0.658423 0.657815
21 50words 0.531160 0.641657 0.661549
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (5)

1.一种基于分段权重的时间序列相似性搜索方法,其特征在于,包括如下步骤:
(1)采用时间序列重要转折点对查询序q进行分段;
(2)建立带权重的分段欧式距离作为时间序列相似度量;
(3)对q进行k-近邻相似查询,检索查询序列q的k个最相似的序列;
(4)如果用户对步骤(3)得出的查询结果满意,则查询结束;若用户对步骤(3)得出的查询结果不满意,则对结果进行标记并进入步骤(5);
(5)***利用用户标记的序列对分段的权重进行更新,并返回步骤(2)。
2.根据权利要求1所述的一种基于分段权重的时间序列相似性搜索方法,其特征在于,所述步骤(1)中采用时间序列重要转折点对时间序列分段的具体步骤如下:
序列转折点定义为:对时间序列X={x1,x2,...,xi,...,xm},当xi满足下述公式中的任意一个,那么xi则称为序列转折点;
{(xi≥xi-1) (xi>xi+1)}{(xi>xi-1) (xi≥xi+1)}
{(xi≤xi-1) (xi<xi+1)}{(xi<xi-1) (xi≤xi+1)}
对原始序列提取转折点得到的转折序列对转折点序列XT中,三个连续转折点构成的序列中,当区域的距离大于阈值ε时,则称为重要转折点;数据点Xj=(vj,tj)到点Xj-1=(vj-1,tj-1)和Xj+1=(vj+1,tj+1)之间的距离其中,vj是数据点Xj的取值,tj是数据点Xj的时间下标。
3.根据权利要求1所述的一种基于分段权重的时间序列相似性搜索方法,其特征在于,所述步骤(2)中采用带权重的分段欧式距离建立时间序列相似性度量的具体步骤如下:
查询序列Q被重要转折点拆分成n段{q1,q2,…,qn},每段权重分别为W1,W2,…,Wn,待查序列T在同样下标位置被分割成n段,则带分段权重的欧式距离如下:
Dist(Q,T)=W1×D(q1,t1)+W2×D(q2,t2)+...+Wn×D(qn,tn)
每段的初始权重都相同,为1/n;其中,D(qi,ti)表示Q,T第i段之间的欧式距离。
4.根据权利要求1所述的一种基于分段权重的时间序列相似性搜索方法,其特征在于,所述步骤(4)中进行相似查询,检索查询序列q的k-近邻,的并以距离作为相似度评价标准,距离越远,相似度越低,距离越近,相似度越高,将查询结果按照从距离最近到最远展示给用户;用户若对查询结果满意,则结束查询;若对查询结果不满意,则对查询结果进行标注,用户标注出所有和查询序列相似的序列。
5.根据权利要求1所述的一种基于分段权重的时间序列相似性搜索方法,其特征在于,所述步骤(5)中利用用户标注的相似序列对分段权重进行更新的具体步骤如下:
针对第i段,计算所有相似序列第i段到查询序列第i段的距离,并计算所有距离的标准差和均值,然后采用下述公式进行权重更新;
其中Wi表示第i段序列段的在整条时间序列中所占的比重,σi和μi是所有第i段序列的相似距离的标准差和平均差;然后采用下述公式对权重进行标准化;
CN201811024227.4A 2018-09-04 2018-09-04 一种基于分段权重的时间序列相似性搜索方法 Active CN109359135B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811024227.4A CN109359135B (zh) 2018-09-04 2018-09-04 一种基于分段权重的时间序列相似性搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811024227.4A CN109359135B (zh) 2018-09-04 2018-09-04 一种基于分段权重的时间序列相似性搜索方法

Publications (2)

Publication Number Publication Date
CN109359135A true CN109359135A (zh) 2019-02-19
CN109359135B CN109359135B (zh) 2021-11-12

Family

ID=65350627

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811024227.4A Active CN109359135B (zh) 2018-09-04 2018-09-04 一种基于分段权重的时间序列相似性搜索方法

Country Status (1)

Country Link
CN (1) CN109359135B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110414726A (zh) * 2019-07-15 2019-11-05 南京灿能电力自动化股份有限公司 一种基于监测数据分析的电能质量预警方法
CN110647647A (zh) * 2019-09-03 2020-01-03 西安外事学院 一种基于时间序列复杂度差异性的封闭图形相似性搜索方法
CN112035718A (zh) * 2020-08-13 2020-12-04 西安外事学院 基于趋势一致性匹配的时间序列分类方法的肉类检测方法
CN113449626A (zh) * 2021-06-23 2021-09-28 中国科学院上海高等研究院 隐马尔科夫模型振动信号分析方法装置、存储介质和终端
CN114444623A (zh) * 2022-04-11 2022-05-06 智昌科技集团股份有限公司 面向工业机器人的异常检测分析方法及***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104794153A (zh) * 2015-03-06 2015-07-22 河海大学 利用用户交互的相似水文过程搜索方法
CN104794484A (zh) * 2015-04-07 2015-07-22 浙江大学 基于分段正交多项式分解的时序数据最近邻分类方法
CN104820673A (zh) * 2015-03-27 2015-08-05 浙江大学 基于自适应性分段统计近似的时间序列相似性度量方法
CN105069093A (zh) * 2015-08-05 2015-11-18 河海大学 一种基于嵌入式索引的水文时间序列相似性搜索方法
CN105224543A (zh) * 2014-05-30 2016-01-06 国际商业机器公司 用于处理时间序列的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224543A (zh) * 2014-05-30 2016-01-06 国际商业机器公司 用于处理时间序列的方法和装置
CN104794153A (zh) * 2015-03-06 2015-07-22 河海大学 利用用户交互的相似水文过程搜索方法
CN104820673A (zh) * 2015-03-27 2015-08-05 浙江大学 基于自适应性分段统计近似的时间序列相似性度量方法
CN104794484A (zh) * 2015-04-07 2015-07-22 浙江大学 基于分段正交多项式分解的时序数据最近邻分类方法
CN105069093A (zh) * 2015-08-05 2015-11-18 河海大学 一种基于嵌入式索引的水文时间序列相似性搜索方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
尚福华等: "基于时间序列趋势转折点的分段线性表示", 《计算机应用研究》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110414726A (zh) * 2019-07-15 2019-11-05 南京灿能电力自动化股份有限公司 一种基于监测数据分析的电能质量预警方法
CN110647647A (zh) * 2019-09-03 2020-01-03 西安外事学院 一种基于时间序列复杂度差异性的封闭图形相似性搜索方法
CN110647647B (zh) * 2019-09-03 2022-02-08 西安外事学院 一种基于时间序列复杂度差异性的封闭图形相似性搜索方法
CN112035718A (zh) * 2020-08-13 2020-12-04 西安外事学院 基于趋势一致性匹配的时间序列分类方法的肉类检测方法
CN112035718B (zh) * 2020-08-13 2023-07-21 西安外事学院 基于趋势一致性匹配的时间序列分类方法的肉类检测方法
CN113449626A (zh) * 2021-06-23 2021-09-28 中国科学院上海高等研究院 隐马尔科夫模型振动信号分析方法装置、存储介质和终端
CN113449626B (zh) * 2021-06-23 2023-11-07 中国科学院上海高等研究院 隐马尔科夫模型振动信号分析方法装置、存储介质和终端
CN114444623A (zh) * 2022-04-11 2022-05-06 智昌科技集团股份有限公司 面向工业机器人的异常检测分析方法及***
CN114444623B (zh) * 2022-04-11 2022-08-12 智昌科技集团股份有限公司 面向工业机器人的异常检测分析方法及***

Also Published As

Publication number Publication date
CN109359135B (zh) 2021-11-12

Similar Documents

Publication Publication Date Title
CN109359135A (zh) 一种基于分段权重的时间序列相似性搜索方法
CN107515895B (zh) 一种基于目标检测的视觉目标检索方法与***
CN102855268B (zh) 基于属性关系进行图像排序的方法和***
CN105117424B (zh) 一种基于停留时间的移动对象语义行为模式挖掘方法
CN102663447B (zh) 基于判别相关分析的跨媒体检索方法
CN103530321A (zh) 一种基于机器学习的排序***
CN110866030A (zh) 一种基于无监督学习的数据库异常访问检测方法
CN107291895B (zh) 一种快速的层次化文档查询方法
CN101963971A (zh) 使用相关性反馈进行数据库搜索的方法及相应的储存介质
CN105205501A (zh) 一种多分类器联合的弱标注图像对象检测方法
CN104035996A (zh) 基于Deep Learning的领域概念抽取方法
CN101751455A (zh) 采用人工智能技术自动产生标题的方法
CN111325264A (zh) 一种基于熵的多标签数据分类方法
CN112800249A (zh) 基于生成对抗网络的细粒度跨媒体检索方法
CN103778206A (zh) 一种网络服务资源的提供方法
CN106649605B (zh) 一种推广关键词的触发方法及装置
CN109299357B (zh) 一种老挝语文本主题分类方法
Nunthanid et al. Parameter-free motif discovery for time series data
CN114139634A (zh) 一种基于成对标签权重的多标签特征选择方法
CN110059755B (zh) 一种多特征评价准则融合的地震属性优选方法
CN105701227B (zh) 一种基于局部关联图的跨媒体相似性度量方法和检索方法
Haripriya et al. Multi label prediction using association rule generation and simple k-means
KR102358357B1 (ko) 시장규모추정장치 및 그 동작 방법
CN108805162A (zh) 一种基于粒子群优化的酵母菌多标记特征选择方法及装置
CN105550226B (zh) 一种基于知识库的查询分面生成方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant