CN113723201B - 时间序列局部趋势的识别方法、装置、***和存储介质 - Google Patents
时间序列局部趋势的识别方法、装置、***和存储介质 Download PDFInfo
- Publication number
- CN113723201B CN113723201B CN202110888823.2A CN202110888823A CN113723201B CN 113723201 B CN113723201 B CN 113723201B CN 202110888823 A CN202110888823 A CN 202110888823A CN 113723201 B CN113723201 B CN 113723201B
- Authority
- CN
- China
- Prior art keywords
- sequence
- points
- peak
- point
- interval
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000009467 reduction Effects 0.000 claims abstract description 41
- 239000011159 matrix material Substances 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 13
- 238000001914 filtration Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 10
- 230000007704 transition Effects 0.000 claims description 7
- 230000005284 excitation Effects 0.000 claims description 4
- 238000005259 measurement Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims 1
- 238000002372 labelling Methods 0.000 abstract description 10
- 238000012545 processing Methods 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 101100299505 Schizosaccharomyces pombe (strain 972 / ATCC 24843) ptn1 gene Proteins 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
- G06F2218/04—Denoising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
- G06F2218/10—Feature extraction by analysing the shape of a waveform, e.g. extracting parameters relating to peaks
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Technology Law (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Signal Processing (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Complex Calculations (AREA)
Abstract
本发明实施例提供一种时间序列局部趋势的识别方法、装置、***和存储介质,涉及大数据处理技术领域。其中,这种识别方法包括步骤S1至S4。S1、获取时序数据。S2、对时序数据进行降噪,以获得降噪序列。S3、根据所述降噪序列,获取区域峰值点和区域峰谷点,以获得峰谷序列。S4、根据峰谷序列,生成时序数据的局部趋势图。通过本发明提供的时间序列数据局部趋势的识别方法能够在海量金融数据、经济学指标或因子中实现高质量的智能识别与自动标注,有效提升标注效率、降低企业成本。
Description
技术领域
本发明涉及大数据处理技术领域,具体而言,涉及一种时间序列局部趋势的识别方法、装置、***和存储介质。
背景技术
金融大数据是金融科技和数字经济领域的技术基础之一,一般是指大数据中蕴含的反映人们金融交易行为互动的基本信息,具有极大量、多维度和完备性等特征,人们根据金融大数据进行决策,需要有处理这些特征数据的新科技手段。金融大数据的处理过程,即是运用大数据分析方法从事金融活动的方法和过程,也是基于大数据、互联网和人工智能等领域的融合对金融决策行为进行重塑。
随着信息技术在各行各业的扩张,金融大数据在经济金融领域获得了纵深发展的平台,同样也面临着机遇和挑战,在实践应用中往往呈现维度多、复杂度高、随机性强、噪声大等处理问题。在诸多应用场景中,大部分原始数据在进入决策分析阶段前,往往需要人工进行特定数据特征的识别与标注,对相关的金融机构和企业形成了不可忽视的时间和经济成本。
有鉴于此,申请人在研究了现有的技术后特提出本申请。
发明内容
本发明提供了一种时间序列局部趋势的识别方法、装置、***和存储介质,以改善相关技术中的大部分原始数据需要人工进行特定数据特征的识别与标注问题。
第一方面、
本发明实施例提供了一种时间序列局部趋势的识别方法,其包含以下步骤获取时序数据;
对所述时序数据进行降噪,以获得降噪序列;
根据所述降噪序列,获取区域峰值点和区域峰谷点,以获得峰谷序列;
根据所述峰谷序列,生成所述时序数据的局部趋势图。
可选地,所述根据所述降噪序列,获取区域峰值点和区域峰谷点,以获得峰谷序列,具体包括:
根据所述降噪序列,基于最小趋势幅度,以及各个序列点左右两侧的序列,获取区域峰值点和区域峰谷点,以获得峰谷序列;
可选地,所述根据所述降噪序列,基于最小趋势幅度,以及各个序列点左右两侧的序列,获取区域峰值点,具体包括:
根据所述降噪序列,判断各个序列点左侧是否存在序列点/>且右侧是否存在序列点/>其中,/>u为最小趋势幅度;
当判断到序列点和序列点/>之间的第一区间内任意两个序列点满足第一关系模型,且序列点/>和序列点/>之间的第二区间内任意两个序列点满足第二关系模型时,获取序列点/>并标记为区域峰值点;其中,所述第一区间[tk1,tk]内任意两个序列点为和/>tm1<tn1,第一关系模型为/>所述第二区间[tk,tk2]内任意两个序列点为/>和/>tm2<tn2,第二关系模型为/>
可选地,所述根据所述降噪序列,基于最小趋势幅度,以及各个序列点左右两侧的序列,获取区域峰谷点,具体包括:
根据所述降噪序列,判断各个序列点左侧是否存在序列点/>且右侧是否存在序列点/>其中,/>u为最小趋势幅度;
当判断到序列点和序列点/>之间的第一区间内任意两个序列点满足第一关系模型,且序列点/>和序列点/>之间的第二区间内任意两个序列点满足第二关系模型时,获取序列点/>并标记为区域峰谷点;其中,所述第一区间[tk1,tk]内任意两个序列点为和/>tm1<tn1,第一关系模型为/>所述第二区间[tk,tk2]内任意两个序列点为/>和/>tm2<tn2,第二关系模型为/>
可选地,所述根据所述峰谷序列,生成所述时序数据的局部趋势图,具体包括
根据所述峰谷序列,通过折线连接各个序列点,以生成所述时序数据的局部趋势图。
可选地,所述对所述时序数据进行降噪,以获得降噪序列,具体包括:
通过卡尔曼滤波模型,对所述时序数据进行降噪,以获得降噪序列;其中,所述卡尔曼滤波模型为:
其中,为序号k的先验状态估计值,k为数据点的序号,A为状态转移矩阵,/>为序号k-1的后验状态估计值,u为控制输入,B为控制输入的增益,/>为序号k的先验估计协方差,/>为序号k-1的后验估计协方差,AT为A的转置矩阵,Q为过程激励噪声的协方差,/>为序号k的后验状态估计值,Kk为滤波增益矩阵,zk为测量值;H为测量值与状态变量间的转换矩阵,HT为H的转置矩阵,R为测量噪声协方差,/>为序号k的后验估计协方差,I为1的矩阵。
第二方面、
本发明实施例提供了一种时间序列局部趋势的识别装置,其包含:
获取模块,用于获取时序数据;
降噪模块,用于对所述时序数据进行降噪,以获得降噪序列;
峰谷模块,用于根据最小趋势幅度,以及各个序列点左右两侧的序列,获取所述降噪序列的区域峰值点和区域峰谷点,以获得峰谷序列;
趋势模块,用于根据所述峰谷序列,生成所述时序数据的局部趋势图。
可选地,所述峰谷模块,具体用于:
根据所述降噪序列,基于最小趋势幅度,以及各个序列点左右两侧的序列,获取区域峰值点和区域峰谷点,以获得峰谷序列;
可选地,所述峰谷模块,包括:
第一单元,用于根据所述降噪序列,判断各个序列点左侧是否存在序列点/>且右侧是否存在序列点/>其中,/>u为最小趋势幅度;
第二单元,用于当判断到序列点和序列点/>之间的第一区间内任意两个序列点满足第一关系模型,且序列点/>和序列点/>之间的第二区间内任意两个序列点满足第二关系模型时,获取序列点/>并标记为区域峰值点;其中,所述第一区间[tk1,tk]内任意两个序列点为/>和/>tm1<tn1,,第一关系模型为/>所述第二区间[tk,tk2]内任意两个序列点为/>和/>tm2<tn2,第二关系模型为
可选地,所述峰谷模块,还包括:
第三单元,用于根据所述降噪序列,判断各个序列点左侧是否存在序列点/>且右侧是否存在序列点/>其中,/>u为最小趋势幅度;
第四单元,用于当判断到序列点和序列点/>之间的第一区间内任意两个序列点满足第一关系模型,且序列点/>和序列点/>之间的第二区间内任意两个序列点满足第二关系模型时,获取序列点/>并标记为区域峰谷点;其中,所述第一区间[tk1,tk]内任意两个序列点为/>和/>tm1<tn1,,第一关系模型为/>所述第二区间[tk,tk2]内任意两个序列点为/>和/>tm2<tn2,第二关系模型为
第三方面、
本发明实施例提供了一种时间序列局部趋势的识别设备,其包括处理器、存储器,以及存储在所述存储器内的计算机程序;所述计算机程序能够被所述处理器执行,以实现如第一方面任一段所说的时间序列局部趋势的识别方法。
第四方面、
本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如第一方面任一段所说的时间序列局部趋势的识别方法。
通过采用上述技术方案,本发明可以取得以下技术效果:
通过本发明提供的时间序列数据局部趋势的识别方法能够在海量金融数据、经济学指标或因子中实现高质量的智能识别与自动标注,有效提升标注效率、降低企业成本。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本发明第一实施例提供的识别方法的流程示意图。
图2是时序序列和降噪序列的波形图。
图3是时序序列的波形图和峰谷序列的折线图。
图4是采用第一个最小趋势幅度识别出来的局部趋势图。
图5是采用第二个最小趋势幅度识别出来的局部趋势图。
图6是本发明第二实施例提供的识别装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
实施例中提及的“第一\第二”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二”区分的对象在适当情况下可以互换,以使这里描述的实施例能够以除了在这里图示或描述的那些内容以外的顺序实施。
下面结合附图与具体实施方式对本发明作进一步详细描述:
实施例一:
请参阅图1至图5,本发明第一实施例提供的一种时间序列局部趋势的识别方法,其可由时间序列局部趋势的识别设备来执行。特别地,由识别设备中的一个或者多个处理器来执行,以实现如步骤S1至步骤S4:
S1、获取时序数据。
可以理解的是,随着社会的发展,人们记录收集到的数据量越来越多。特别地,经济金融行业的数据,每天都在发生变化,每天都在产生新的数据(例如股票开(收)盘价、价格波动率等金融市场数据,或CPI、PPI等宏观经济数据)。因此时序型的数据(即时序数据)越来越多。因此,如何更加高效、准确的对这些时序数据进行处理,以使人们能够更加方便的从这些数据中获取信息,成了急需解决的问题。
具体地,大部分原始数据在进入决策分析阶段前,往往需要人工进行特定数据特征的识别与标注,但是人工处理的速度太慢,而且长时间的工作人体疲劳容易造成标注误差,从而影响数据的有效性。
识别设备为计算机、膝上型计算机,或者云端的服务器,用于执行本发明提供的识别方法,对时序数据进行趋势识别。
S2、对时序数据进行降噪,以获得降噪序列。
如图2所示,分别是原始数据的图形和噪声过滤后的降噪序列的图形。
需要说明的是,时序数据中,存在着一些高斯型白噪声,如果直接采用时序数据进行处理容易产生误差,因此,需要对时序数据进行噪声过滤。以获得降噪序列,从而提高趋势识别的准确性。
在本实施例中,步骤S2具体包括步骤S21:
S21、通过卡尔曼滤波模型,对时序数据进行降噪,以获得降噪序列。其中,卡尔曼滤波模型为:
下一数据点的预测:
当前***的更新:
其中,为序号k的先验状态估计值,k为数据点的序号,A为状态转移矩阵,/>为序号k-1的后验状态估计值,u为控制输入,B为控制输入的增益,/>为序号k的先验估计协方差,/>为序号k-1的后验估计协方差,AT为A的转置矩阵,Q为过程激励噪声的协方差,/>为序号k的后验状态估计值,Kk为滤波增益矩阵,zk为测量值。H为测量值与状态变量间的转换矩阵,HT为H的转置矩阵,R为测量噪声协方差,/>为序号k的后验估计协方差,I为1的矩阵。
在本实施例中,通过卡尔曼滤波模型,将时序数据中的噪声过滤掉,实现自适应的线性最优估计,以获得降噪序列。使用降噪序列来进行后续步骤能够识别出更加准确的局部趋势,具有很好的实际意义。
在其它实施例中,还可以采用其它现有的噪声过滤模型实现,本发明对此不做具体限定,只要其能够将时序数据中的噪声过滤掉即可。
S3、根据所述降噪序列,获取区域峰值点和区域峰谷点,以获得峰谷序列。具体包括:
根据降噪序列,基于最小趋势幅度,以及各个序列点左右两侧的序列,获取区域峰值点和区域峰谷点,以获得峰谷序列。
需要说明的是,如图3至图5所示,最小趋势幅度为预设值,是一个人为设定的值。通过最小趋势幅度来判断各个序列点的两侧的序列相对于该序列点的变化情况。当序列点的左右两侧为向下的趋势时,序列点为峰值点。当序列点的左右两侧为向上的趋势时,序列点为峰谷点。并且通过最小趋势幅度,能够调整识别的精度,以适应不同的数据,具有很好的实际意义。
在本实施例中,步骤S3包括步骤S31至步骤S35:
S31、根据降噪序列,判断各个序列点左侧是否存在序列点/>且右侧是否存在序列点/>其中,/>u为最小趋势幅度。
S32、当判断到序列点和序列点/>之间的第一区间内任意两个序列点满足第一关系模型,且序列点/>和序列点/>之间的第二区间内任意两个序列点满足第二关系模型时,获取序列点/>并标记为区域峰值点。其中,,第一区间[tk1,tk]内任意两个序列点为/>和/>tm1<tn1,第一关系模型为/>第二区间[tk,tk2]内任意两个序列点为/>和/>tm2<tn2,第二关系模型为/>
S33、根据降噪序列,判断各个序列点左侧是否存在序列点/>且右侧是否存在序列点/>其中,/>u为最小趋势幅度。
S34、当判断到序列点和序列点/>之间的第一区间内任意两个序列点满足第一关系模型,且序列点/>和序列点/>之间的第二区间内任意两个序列点满足第二关系模型时,获取序列点/>并标记为区域峰谷点。其中,,第一区间[tk1,tk]内任意两个序列点为/>和/>tm1<tn1,第一关系模型为/>第二区间[tk,tk2]内任意两个序列点为/>和/>tm2<tn2,第二关系模型为/>
S35、根据时间顺序将各个区域峰值点和区域峰谷点依次排序形成峰谷序列。
具体地:
在时间序列{Pt}中,若某个点Ptk左侧存在一个点Ptk1,,右侧存在一个点Ptk2,满足:
对[tk1,tk]之间的任意两个点Ptm1,Ptn1(tm1<tn1),有:
对[tk,tk2]之间的任意两个点Ptm2,Ptn2(tm2<tn2),有:
则自动标注点Ptk为区域峰值点。
反之,若某个点Ptk左侧存在一个点Ptk1,右侧存在一个点Ptk2,满足:
对[tk1,tk]之间的任意两个点Ptm1,Ptn1(tm1<tn1),有:
对[tk,tk2]之间的任意两个点Ptm2,Ptn2(tm2<tn2),有:
则自动标注点Ptk为区域峰谷点。
最后,将得到的新序列{Ptk}以折线连接,自动标注出以最小趋势幅度u定义的原始时间序列的每一段区域趋势。优选地,在Matlab环境下实现上述步骤。
在本实施例的识别方法中,只有最小趋势幅度一个变量,使用更为便捷。并且能够通过调整最小趋势幅度以识别和标注不同级别的局部趋势,实现趋势分级功能,具有很好的实际意义。
S4、根据峰谷序列,生成时序数据的局部趋势图。
如图3所示,在本实施例中,采用折线图的方式来展示局部趋势图。步骤S4具体包括:
S41、根据峰谷序列,通过折线连接各个序列点,以生成时序数据的局部趋势图。
具体地,时序数据采用折线图的形式能够更为清楚直观的暂时突来各个时间段的上升阶段、下降阶段。具有很好的实际意义。在其它实施例中,还可以采用柱状图、条形图,或者面积图等可视化图表来展示,本发明对此不做具体限定,只要其能够更加直观的将局部趋势给展示出来即可。
为便于对本发明的理解,下面以实际的应用场景来说明本实施例的应用。
应用场景一:
以1996年10月至2017年12月的工业品出厂价格指数(PPI)当月同比这一时间序列数据为例,现通过本发明专利提供的***设计(在Matlab环境下实现),对该数据进行涨跌趋势状态的自动识别与标注:
步骤一:把原始数据输入,基于卡尔曼滤波模型的调制参数设计,进行噪声过滤,效果见附图2。
步骤二:把经过步骤一降噪后的数据输入,应用自主设计的趋势状态识别模型,进行趋势状态的自动识别与标注,效果见附图3。
通过本发明提供的时间序列数据局部趋势的识别方法能够在海量金融数据、经济学指标或因子中实现高质量的智能识别与自动标注,有效提升标注效率、降低企业成本。
实施例二、
本发明实施例提供了一种时间序列局部趋势的识别装置,其包含:
获取模块1,用于获取时序数据。
降噪模块2,用于对时序数据进行降噪,以获得降噪序列。
峰谷模块3,用于根据最小趋势幅度,以及各个序列点左右两侧的序列,获取降噪序列的区域峰值点和区域峰谷点,以获得峰谷序列。
趋势模块4,用于根据峰谷序列,生成时序数据的局部趋势图。
具体地,通过本发明提供的时间序列数据局部趋势的识别方法能够在海量金融数据、经济学指标或因子中实现高质量的智能识别与自动标注,有效提升标注效率、降低企业成本。
可选地,峰谷模块3,具体用于:
根据降噪序列,基于最小趋势幅度,以及各个序列点左右两侧的序列,获取区域峰值点和区域峰谷点,以获得峰谷序列。
可选地,峰谷模块3,包括:
第一单元,用于根据降噪序列,判断各个序列点左侧是否存在序列点/>且右侧是否存在序列点/>其中,/>u为最小趋势幅度。
第二单元,用于当判断到序列点和序列点/>之间的第一区间内任意两个序列点满足第一关系模型,且序列点/>和序列点/>之间的第二区间内任意两个序列点满足第二关系模型时,获取序列点/>并标记为区域峰值点。其中,第一区间[tk1,tk]内任意两个序列点为/>和/>tm1<tn1,第一关系模型为/>第二区间[tk,tk2]内任意两个序列点为/>和/>tm2<tn2,第二关系模型为/>
可选地,峰谷模块3,还包括:
第三单元,用于根据降噪序列,判断各个序列点左侧是否存在序列点/>且右侧是否存在序列点/>其中,/>u为最小趋势幅度。
第四单元,用于当判断到序列点和序列点/>之间的第一区间内任意两个序列点满足第一关系模型,且序列点/>和序列点/>之间的第二区间内任意两个序列点满足第二关系模型时,获取序列点/>并标记为区域峰谷点。其中,第一区间[tk1,tk]内任意两个序列点为/>和/>tm1<tn1,第一关系模型为/>第二区间[tk,tk2]内任意两个序列点为/>和/>tm2<tn2,第二关系模型为/>
可选地,趋势模块4,具体用于:
根据峰谷序列,通过折线连接各个序列点,以生成时序数据的局部趋势图。
可选地,降噪模块2,具体用于:
通过卡尔曼滤波模型,对时序数据进行降噪,以获得降噪序列。其中,卡尔曼滤波模型为:
其中,为序号k的先验状态估计值,k为数据点的序号,A为状态转移矩阵,/>为序号k-1的后验状态估计值,u为控制输入,B为控制输入的增益,/>为序号k的先验估计协方差,/>为序号k-1的后验估计协方差,AT为A的转置矩阵,Q为过程激励噪声的协方差,/>为序号k的后验状态估计值,Kk为滤波增益矩阵,zk为测量值。H为测量值与状态变量间的转换矩阵,HT为H的转置矩阵,R为测量噪声协方差,/>为序号k的后验估计协方差,I为1的矩阵。
实施例三、
本发明实施例提供了一种时间序列局部趋势的识别设备,其包括处理器、存储器,以及存储在存储器内的计算机程序。计算机程序能够被处理器执行,以实现如实施例一任一段所说的时间序列局部趋势的识别方法。
实施例四、
本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质包括存储的计算机程序,其中,在计算机程序运行时控制计算机可读存储介质所在设备执行如实施例一任一段所说的时间序列局部趋势的识别方法。
在本发明实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,电子设备,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.一种时间序列局部趋势的识别方法,其特征在于,包含:
获取时序数据;其中,所述时序数据为工业品出厂价格指数当月同比;
通过卡尔曼滤波模型,对所述时序数据进行降噪,以获得降噪序列;
根据所述降噪序列,基于最小趋势幅度,以及各个序列点左右两侧的序列,基于当序列点的左右两侧为向下的趋势时序列点为峰值点,当序列点的左右两侧为向上的趋势时序列点为峰谷点的自然规律,获取区域峰值点和区域峰谷点,以获得峰谷序列;
根据所述峰谷序列,通过折线连接各个序列点,以生成所述时序数据的局部趋势图;
根据所述降噪序列,基于最小趋势幅度,以及各个序列点左右两侧的序列,获取区域峰值点,具体包括:
根据所述降噪序列,判断各个序列点左侧是否存在序列点/>且右侧是否存在序列点/>;其中,/> , /> ,u为最小趋势幅度;
当判断到序列点和序列点/>之间的第一区间内任意两个序列点满足第一关系模型,且序列点/>和序列点/>之间的第二区间内任意两个序列点满足第二关系模型时,获取序列点/>并标记为区域峰值点;其中,所述第一区间/>内任意两个序列点为/>和/> ,/> ,第一关系模型为/> ,所述第二区间/>内任意两个序列点为/>和/> ,/> ,第二关系模型为/> ;
根据所述降噪序列,基于最小趋势幅度,以及各个序列点左右两侧的序列,获取区域峰谷点,具体包括:
根据所述降噪序列,判断各个序列点左侧是否存在序列点/>且右侧是否存在序列点/>;其中,/> , /> ,u为最小趋势幅度;
当判断到序列点和序列点/>之间的第一区间内任意两个序列点满足第一关系模型,且序列点/>和序列点/>之间的第二区间内任意两个序列点满足第二关系模型时,获取序列点/>并标记为区域峰谷点;其中,所述第一区间/>内任意两个序列点为/>和/> ,/> ,第一关系模型为/> ,所述第二区间/>内任意两个序列点为/>和/> ,/> ,第二关系模型为/> 。
2.根据权利要求1所述的时间序列局部趋势的识别方法,其特征在于,所述卡尔曼滤波模型为:
其中,为序号k的先验状态估计值,k为数据点的序号,A为状态转移矩阵,/>为序号k-1的后验状态估计值,u为控制输入,B为控制输入的增益,/>为序号k的先验估计协方差,/>为序号k-1的后验估计协方差,/>为A的转置矩阵,Q为过程激励噪声的协方差,/>为序号k的后验状态估计值,/>为滤波增益矩阵,/>为测量值;H为测量值与状态变量间的转换矩阵,/>为H的转置矩阵,R为测量噪声协方差,/>为序号k的后验估计协方差,/>为1的矩阵。
3.一种时间序列局部趋势的识别装置,其特征在于,包含:
获取模块,用于获取时序数据;其中,所述时序数据为工业品出厂价格指数当月同比;
降噪模块,用于通过卡尔曼滤波模型,对所述时序数据进行降噪,以获得降噪序列;
峰谷模块,用于根据所述降噪序列,基于最小趋势幅度,以及各个序列点左右两侧的序列,基于当序列点的左右两侧为向下的趋势时序列点为峰值点,当序列点的左右两侧为向上的趋势时序列点为峰谷点的自然规律,获取区域峰值点和区域峰谷点,以获得峰谷序列;
趋势模块,用于根据所述峰谷序列,通过折线连接各个序列点,以生成所述时序数据的局部趋势图;
所述峰谷模块,包括:
第一单元,用于根据所述降噪序列,判断各个序列点左侧是否存在序列点/>且右侧是否存在序列点/>;其中,/> , /> ,u为最小趋势幅度;
第二单元,用于当判断到序列点和序列点/>之间的第一区间内任意两个序列点满足第一关系模型,且序列点/>和序列点/>之间的第二区间内任意两个序列点满足第二关系模型时,获取序列点/>并标记为区域峰值点;其中,所述第一区间/>内任意两个序列点为/>和/> ,/> ,第一关系模型为/> ,所述第二区间/>内任意两个序列点为/>和/> ,/> ,第二关系模型为 ;
第三单元,用于根据所述降噪序列,判断各个序列点左侧是否存在序列点/>且右侧是否存在序列点/>;其中,/> , /> ,u为最小趋势幅度;
第四单元,用于当判断到序列点和序列点/>之间的第一区间内任意两个序列点满足第一关系模型,且序列点/>和序列点/>之间的第二区间内任意两个序列点满足第二关系模型时,获取序列点/>并标记为区域峰谷点;其中,所述第一区间/>内任意两个序列点为/>和/> ,/> ,第一关系模型为/> ,所述第二区间/>内任意两个序列点为/>和/> ,/> ,第二关系模型为 。
4.一种时间序列局部趋势的识别设备,其特征在于,包括处理器、存储器,以及存储在所述存储器内的计算机程序;所述计算机程序能够被所述处理器执行,以实现如权利要求1至2任意一项所述的时间序列局部趋势的识别方法。
5.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至2任意一项所述的时间序列局部趋势的识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110888823.2A CN113723201B (zh) | 2021-08-03 | 2021-08-03 | 时间序列局部趋势的识别方法、装置、***和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110888823.2A CN113723201B (zh) | 2021-08-03 | 2021-08-03 | 时间序列局部趋势的识别方法、装置、***和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113723201A CN113723201A (zh) | 2021-11-30 |
CN113723201B true CN113723201B (zh) | 2024-06-14 |
Family
ID=78674787
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110888823.2A Active CN113723201B (zh) | 2021-08-03 | 2021-08-03 | 时间序列局部趋势的识别方法、装置、***和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113723201B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116955932B (zh) * | 2023-09-18 | 2024-01-12 | 北京天泽智云科技有限公司 | 一种基于趋势的时间序列分割方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102650527A (zh) * | 2012-05-25 | 2012-08-29 | 北京航空航天大学 | 一种基于时间序列分析消噪的光纤陀螺温度补偿方法 |
CN107451004A (zh) * | 2017-07-01 | 2017-12-08 | 南京理工大学 | 一种基于定性趋势分析的道岔故障诊断方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8200454B2 (en) * | 2007-07-09 | 2012-06-12 | International Business Machines Corporation | Method, data processing program and computer program product for time series analysis |
CN101083508B (zh) * | 2007-07-19 | 2010-06-02 | 清华大学 | 基于低峰谷比序列传输的ofdm调制***性能测试方法 |
WO2013023004A2 (en) * | 2011-08-08 | 2013-02-14 | Solinsky James C | Systems and methods for sensing balanced-action for improving mammal work-track efficiency |
CN104216924A (zh) * | 2013-06-03 | 2014-12-17 | 肖瑞 | 基于趋势的时间序列索引 |
US10318970B2 (en) * | 2013-10-04 | 2019-06-11 | International Business Machines Corporation | Generating a succinct approximate representation of a time series |
US10085684B2 (en) * | 2015-03-10 | 2018-10-02 | The University Of Chicago | State identification in data with a temporal dimension |
EP3353688A4 (en) * | 2015-09-21 | 2019-06-26 | Equifax, Inc. | UPDATING ATTRIBUTE DATA STRUCTURES TO INDICATE TRENDS IN ATTRIBUTE DATA PROVIDED TO AUTOMATED MODELING SYSTEMS |
US11887015B2 (en) * | 2019-09-13 | 2024-01-30 | Oracle International Corporation | Automatically-generated labels for time series data and numerical lists to use in analytic and machine learning systems |
CN112464794A (zh) * | 2020-11-25 | 2021-03-09 | 易方达基金管理有限公司 | 基于图像的波动趋势识别方法、装置、计算机设备和介质 |
CN112782523B (zh) * | 2020-12-23 | 2022-12-02 | 南京工程学院 | 基于动态模式匹配距离的配电网单相接地故障选线方法 |
-
2021
- 2021-08-03 CN CN202110888823.2A patent/CN113723201B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102650527A (zh) * | 2012-05-25 | 2012-08-29 | 北京航空航天大学 | 一种基于时间序列分析消噪的光纤陀螺温度补偿方法 |
CN107451004A (zh) * | 2017-07-01 | 2017-12-08 | 南京理工大学 | 一种基于定性趋势分析的道岔故障诊断方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113723201A (zh) | 2021-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Issa et al. | Research ideas for artificial intelligence in auditing: The formalization of audit and workforce supplementation | |
Petersen | Measuring and predicting software productivity: A systematic map and review | |
US9047559B2 (en) | Computer-implemented systems and methods for testing large scale automatic forecast combinations | |
US20190236497A1 (en) | System and method for automated model selection for key performance indicator forecasting | |
Utans et al. | Input variable selection for neural networks: Application to predicting the US business cycle | |
JP4710011B2 (ja) | 企業価値分析装置及び企業価値分析方法 | |
Hujainah et al. | StakeQP: A semi-automated stakeholder quantification and prioritisation technique for requirement selection in software system projects | |
CN113723201B (zh) | 时间序列局部趋势的识别方法、装置、***和存储介质 | |
Burnecki et al. | Identification and validation of stable ARFIMA processes with application to UMTS data | |
Sims | Scientific standards in econometric modeling | |
Verger et al. | Is Your Model" MADD"? A Novel Metric to Evaluate Algorithmic Fairness for Predictive Student Models | |
US10373093B2 (en) | Identifying patterns of learning content consumption across multiple entities and automatically determining a customized learning plan based on the patterns | |
Heydarian et al. | Automated benchmarking and monitoring of an earthmoving operation's carbon footprint using video cameras and a greenhouse gas estimation model | |
Burattin et al. | Who is behind the model? classifying modelers based on pragmatic model features | |
Hasan et al. | Inference and sampling of point processes from diffusion excursions | |
San et al. | Dc-srgm: Deep cross-project software reliability growth model | |
Rostami-Tabar et al. | On the inventory performance of demand forecasting methods of medical items in humanitarian operations | |
Kathirgamanathan et al. | Using Barycenters as Aggregate Representations of Repetition-Based Time-Series Exercise Data | |
Patnaik et al. | Selection problems for application of probit. tobit. logit and maximum likelihood estimation: A methodological issue | |
Haerani et al. | Classification academic data using machine learning for decision making process | |
JP5826891B1 (ja) | 予測装置、予測方法、及びコンピュータプログラム | |
Revandi et al. | Classification of Company Level Based on Student Competencies in Tracer Study 2022 using SVM and XGBoost Method | |
Yusupova et al. | Data Mining Application for Anti-Crisis Management | |
Fröhlich | Outlier identification and adjustment for time series | |
Bao et al. | Single Image Based Random-Value Impulse Noise Level Estimation Algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |