CN113297443A - 分类方法、装置、计算设备和介质 - Google Patents

分类方法、装置、计算设备和介质 Download PDF

Info

Publication number
CN113297443A
CN113297443A CN202010401207.5A CN202010401207A CN113297443A CN 113297443 A CN113297443 A CN 113297443A CN 202010401207 A CN202010401207 A CN 202010401207A CN 113297443 A CN113297443 A CN 113297443A
Authority
CN
China
Prior art keywords
node
edge
classified
graph
time sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010401207.5A
Other languages
English (en)
Inventor
杨帆
常剑
陈三鉴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN202010401207.5A priority Critical patent/CN113297443A/zh
Publication of CN113297443A publication Critical patent/CN113297443A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种分类方法、装置、计算设备和介质。该方法,包括:获取待分类时间序列;对待分类时间序列进行图结构化处理,得到第一图结构数据;将第一图结构数据输入训练后的图神经网络模型,得到待分类时间序列对应的表征向量;将待分类时间序列对应的表征向量输入训练后的分类器中,得到待分类时间序列的分类结果。根据本发明实施例,可以提高对时间序列分类的准确性。

Description

分类方法、装置、计算设备和介质
技术领域
本发明涉及数据处理领域,尤其涉及一种分类方法、装置、计算设备和介质。
背景技术
时间序列数据是指在时间上顺序排序的数据序列,其经常出现在各种领域,包括物联网、医疗和健康、***监控以及工业自动化应用。由于其广泛的应用场景和丰富性,从时间序列数据库中提取有用的信息,进行有效的知识发现,这类需求越来越多。时间序列挖掘的主要任务之一是时间序列分类任务。
由于时间序列数据的顺序特征,通用数据上表现良好的分类算法(例如:支持向量机分类算法和随机森林分类算法等)通常不适用于时间序列分类任务。因此,急需提供一种对时间序列进行精确分类的方法。
发明内容
本发明实施例提供一种分类方法、装置、计算设备和介质,能够解决相关技术领域中对时间序列的分类准确度低下的问题。
根据本发明实施例的第一方面,提供一种分类方法,包括:
获取待分类时间序列;
对待分类时间序列进行图结构化处理,得到第一图结构数据;
将第一图结构数据输入训练后的图神经网络模型,得到待分类时间序列对应的表征向量;
将待分类时间序列对应的表征向量输入训练后的分类器中,得到待分类时间序列的分类结果。
根据本发明实施例的第二方面,提供一种分类装置,包括:
时间序列获取模块,用于获取待分类时间序列;
第一图结构数据确定模块,用于对待分类时间序列进行图结构化处理,得到第一图结构数据;
表征向量确定模块,用于将第一图结构数据输入训练后的图神经网络模型,得到待分类时间序列对应的表征向量;
分类结果确定模块,用于将待分类时间序列对应的表征向量输入训练后的分类器中,得到待分类时间序列的分类结果。
根据本发明实施例的第三方面,提供了一种计算设备,包括:处理器以及存储有计算机程序指令的存储器;
处理器执行计算机程序指令时实现如上述第一方面提供的分类方法。
根据本发明实施例的第四方面,提供一种计算机存储介质,计算机存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如上述第一方面提供的分类方法。
根据本发明实施例,图结构数据包括与该图结构数据对应的图结构中节点的节点特征和图结构中边的边特征。从节点的节点特征以及与该节点关联的边的边特征,可以体现出时间序列数据的局部特征以及时间序列中不同数据之间的依赖关系。从图结构数据的整体分布特性可以体现出时间序列数据的全局特性。因此,对待分类时间序列进行图结构化处理,得到的第一图结构数据,既体现了该时间序列数据的全局特性,又考虑了该时间序列的局部特性。因此,第一图结构数据中包含了待分类时间序列的丰富的特征信息。将包含了待分类时间序列的丰富的特征信息第一图结构数据输入训练后的图神经网络模型后得到的待分类时间序列对应的表征向量,可以体现待分类时间序列的丰富特征信息,因此对该表征向量进行分类,可以提高对该待分类时间序列分类的准确率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种图结构的结构示意图;
图2为本发明实施例提供的分类***的架构示意图;
图3为本发明一实施例提供的分类方法的流程示意图;
图4为本发明实施例提供的一种可见性图结构的示意图;
图5为本发明实施例提供的一种水平可见性图结构的示意图;
图6为本发明实施例提供的一种K邻近图结构的示意图;
图7为本发明另一实施例提供的分类方法的流程示意图;
图8为本发明实施例提供的图神经网络模型和分类器的训练方法的流程示意图;
图9为本发明实施例提供的分类装置的结构示意图;
图10为发明实施例提供的计算设备的硬件结构示意图。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
在实际应用中,数据分析可帮助人们作出判断,以便采取适当行动。而数据可通过图结构表征。以下首先对图结构相关的技术术语介绍。
图结构包括节点和边,其是由节点的有穷非空集合和节点之间边的集合组成。其中,每个节点具有对应的节点特征,每个边具有对应的边特征。图结构的图结构数据包括每个节点的节点特征和每个边的边特征。
图结构通常表示为:
Figure BDA0002489540140000041
其中,
Figure BDA0002489540140000042
表示一个图结构,
Figure BDA0002489540140000043
是图结构中节点的集合,ε是图结构中边的集合,V为图结构中所有节点的节点特征的集合,E为图结构中所有边的边特征的集合。若有一条边连一个图结构的某两个节点,则称这两个节点相邻,并称这两个节点为这条边的端点。若某一节点是某一条边的端点,则称这个节点和这条边关联。
其中,节点集合
Figure BDA0002489540140000044
边集合
Figure BDA0002489540140000045
Figure BDA0002489540140000046
表示“定义为”,{1,2,……,N}表示包含整数1,2,……,N的集合。[N]×[N]表示集合[N]和其自身的笛卡尔积。其中,N为大于1的正整数。
作为一个示例,每个节点携带一个dv维的向量作为节点特征,每条边携带一个de维的向量作为边特征。则图结构中的节点特征的集合可以表示为
Figure BDA0002489540140000048
图结构中的边特征的集合可以表示为
Figure BDA0002489540140000049
dv和de均为正整数。|ε|表示集合ε的大小。
图1为本发明实施例提供的一种图结构的结构示意图。如图1所示,该图结构有编号为1,2,……,6的6个节点,以及每个节点关联的边。每个节点携带一个dv维的向量作为节点特征,每条边携带一个de维的向量作为边特征。则节点集合
Figure BDA0002489540140000047
边集合合ε={(1,2),(2,1),(2,3),(2,4),(3,2),(3,4),(4,2),(4,3),(4,5),(4,6),(5,4),(5,6),(6,4),(6,5)}。
由于图结构数据包括与该图结构数据对应的图结构中节点的节点特征数据和图结构中边的边特征数据,因此从节点的节点特征数据以及与该节点关联的边的边特征数据,可以体现出时间序列数据的局部特征以及时间序列中不同数据之间的依赖关系。从图结构数据的整体分布特性可以体现出时间序列数据的全局特性。因此,基于上述技术问题,本发明实施例提供一种分类方法、装置、计算设备及介质,对待分类时间序列进行图结构化处理,得到的第一图结构数据,既体现了该时间序列数据的全局特性,又考虑了该时间序列的局部特性。因此,第一图结构数据中包含了待分类时间序列的丰富的特征信息。将包含了待分类时间序列的丰富的特征信息第一图结构数据输入训练后的图神经网络模型后得到的待分类时间序列对应的表征向量,可以体现待分类时间序列的丰富特征信息,因此对该表征向量进行分类,可以提高对该待分类时间序列分类的准确率。
图2为本发明实施例提供的分类***的架构示意图。如图2所示,该***包括终端210和服务器220。
在本发明的实施例中,终端210可以是笔记本电脑、智能手机、平板电脑或个人计算机等电子设备。服务器220可以是一种高性能的电子计算器,可以响应于终端210发送的服务请求处理数据。终端210和服务器220之间可以通过网络进行通信。
用户可以通过终端210输入待分类时间序列。终端210发送待分类时间序列至服务器220。其中,待分类时间序列为同一个统计指标的数值按照时间发生的先后顺序排列起来的数列。统计指标可以为商品的销量、股票价格等不同领域的指标。
作为一个示例,待分类时间序列为{a,b,c,d,e,f,g}。其中,待分类时间序列中的值分别代表在不同时刻商品A的销量。
服务器220获取待分类时间序列,对待分类时间序列进行图结构化处理,得到第一图结构数据。然后服务器220将第一图结构数据输入训练后的图神经网络模型,得到待分类时间序列对应的表征向量;接着服务器220将待分类时间序列对应的表征向量输入训练后的分类器中,得到待分类时间序列的分类结果。
作为一个示例,分类结果可以为异常,则代表商品A的销量出现异常。通过待分类时间序列的分类结果可以提醒商家关注商品A的销售情况。
在本发明的实施例中,由于将待分类时间序列进行图结构化处理,因此可以得到包含待分类时间序列的丰富的特征信息的第一图结构数据。将包含了待分类时间序列的丰富的特征信息第一图结构数据输入训练后的图神经网络模型后得到的待分类时间序列对应的表征向量,可以体现待分类时间序列的丰富特征信息,因此对该表征向量进行分类,可以提高对该待分类时间序列分类的准确率。
图3为本发明一实施例提供的分类方法的流程示意图。如图3所示,该方法包括:
S310,获取待分类时间序列。
S320,对待分类时间序列进行图结构化处理,得到第一图结构数据。
S330,将第一图结构数据输入训练后的图神经网络模型,得到待分类时间序列对应的表征向量。
S340,将待分类时间序列对应的表征向量输入训练后的分类器中,得到待分类时间序列的分类结果。
下面介绍S310~S340中每个步骤的具体实现方式。
在S310中,待分类时间序列为同一个统计指标的数值按照时间发生的先后顺序排列起来的数列。根据统计需求,统计指标可以不同。通过对待分类时间序列进行分类,可以从时间序列数据中提取有用的信息,进行有效的知识发现。作为一个示例,在电商领域,统计指标可为商品的销量、商品的价格、商品的点击量等不同的指标。在经济领域,统计指标可以为股票价格等指标。
下面介绍S320的具体实现方式。在一些实施例中,S320包括S3201~S3203。S3201,基于预设的图结构构建算法,构建待分类时间序列对应的图结构。S3202,对于图结构中每个节点,基于节点与待分类时间序列的关联关系,以及图结构中与节点关联的边,确定节点的原始节点特征。S3203,对于图结构中的每个边,基于边所关联的节点的原始节点特征,确定边的原始边特征。
在本发明的一些实施例中,图结构包括多个节点和每个节点关联的边,因此S3201包括:将待分类时间序列中的每个数值对应的时间点作为图结构中的一个节点;基于预设边确定规则,确定每个节点关联的边。
在一些实施例中,图结构构建算法包括以下算法中的任意一种:可见性图构建算法、水平可见性图构建算法以及K-最邻近图构建算法。
在一些实施例中,若将一个时间序列转化为图结构,可采用可见性图(VisibilityGraph)构建算法进行构造。VG构建算法的原理是:图结构中的每个节点对应到离散时间序列数据中的每个时间点。将这些节点中满足提前规定好的可视性规则的两个点连接起来,此即为图结构的边。
图4为本发明实施例提供的一种可见性图结构的示意图。参见图4,对于一个具有在18个时间点(t1,t2,……,t18)分别对应的18个数值的待分类时间序列,用18个直方条代表待分类时间序列中的18个数据点。图4中直方条的高度代表待分类时间序列中每个时间点的数据值。其中,可视性规则(即预设边确定规则)为:如果两个直方条的顶端相互可视,则连接这两个直方图对应的节点,即,从两个直方条的顶部存在直线而不与其他垂直条相交。其中,可视性规则(即预设边确定规则)定义如下:
给定时间序列T={v1,v2,……,vn},它的可见性图结构
Figure BDA0002489540140000071
Figure BDA0002489540140000072
图结构G1有n个节点,即
Figure BDA0002489540140000073
对于图结构G1的边e1=(i1,j1)∈ε1,当且仅当
Figure BDA0002489540140000074
使得i1<k1<j1,不等式vk1<vj1+(vi1-vj1)*(j1-k1)/(j1-i1)成立。其中,1≤i1≤n,1≤j1≤n,1≤k1≤n。n为大于1的整数。
很明显,VG图结构是无向的,尽管可以通过限制垂直条的视点方向来创建定向版本。此外,VG图结构始终是连接的,因为每个节点始终对其邻居可见。最后,当时间序列经历仿射变换时,VG图结构是不变的,即:当水平或垂直地重新缩放时间序列时,可见性标准仍然满足。VG图结构可以更有能力捕获全局特征。
在一些实施例中,水平可见性图构建算法的原理与可见性图构建算法的原理相似。水平可见性图构建算法的原理:图结构中的每个节点对应到离散时间序列数据中的每个时间点。将这些节点中满足提前规定好的水平可视性规则(即预设边确定规则)的两个节点连接起来,此即为图结构的边。
图5为本发明实施例提供的一种水平可见性图结构的示意图。参见图5,对于一个具有在18个时间点(t1,t2,……,t18)分别对应的18个数值的待分类时间序列,用18个直方条代表待分类时间序列中的18个数据点。图5中直方条的高度代表待分类时间序列中每个时间点的数据值。其中,水平可视性规则(即预设边确定规则)为:如果两个直方条之间能够画出一条不穿过其他直方条的水平可视线,则将这两个直方条对应的节点连接。也就是说,若两个节点对应的直方条高度比位于这两个节点间的其他节点的直方条的高度都大,那连接这两个节点。其中,水平可视性规则定义如下:
给定时间序列T={v1,v2,……,vq},它的HVG图结构
Figure BDA0002489540140000081
Figure BDA0002489540140000082
图结构G2有q个节点,即
Figure BDA0002489540140000083
对于图结构G2的边e2=(i2,j2)∈ε2,当且仅当
Figure BDA0002489540140000084
使得i2<k2<j2,不等式vk2<vj2+(vi2-vj2)*(j2-k2)/(j2-i2)成立。其中,1≤i2≤q,1≤j2≤q,1≤k2≤q。q为大于1的整数。
直观地说,VG构建算法和HVG构建算法是非常相似的概念。HVG图结构是VG图结构的子图。HVG图结构通常对局部变化更敏感。
在一些实施例中,K-最邻近图构建算法的原理如下:
首先,将时间序列中的每个数值对应的时间点作为K邻近图结构中的一个节点。然后使用预设的滑动窗口将时间序列划分成多个时间子序列,并将每个子时间序列看作一个向量。
作为一个示例,给定一个时间序列{X1,X2,……,Xn}。若滑动窗口大小等于1,滑动步长为1,则可以得到n个子时间序列:[X1],[X2],……,[Xn]。若滑动窗口等于3,滑动步长为1,则可以得到n-2个子时间序列:[X1,X2,X3],[X2,X3,X4],……,[Xn-2,Xn-1,Xn]。若滑动窗口等于5,滑动步长为1,则可以得到n-4个子时间序列:[X1,X2,X3,X4,X5],[X2,X3,X4,X5,X6],……,[Xn-4,Xn-3,Xn-2,Xn-1,Xn]。
然后,对于每个子时间序列,计算该子时间序列与多个时间子序列中除该子时间序列之外的其他每个子时间序列之间的距离,并筛选出与该子时间序列的距离K邻近的K个子时间序列,即与该子时间序列的距离最相近的K个子时间序列。
接着,对于任意一个子时间序列,将该子时间序列中的第一个数值对应的节点分别和与该子时间序列的距离K邻近的K个子时间序列的第一个数值对应的节点连接。K为大于等于1的整数。
作为一个示例,若K=2,以子时间序列[X1,X2,X3,X4,X5]为例,则需要筛选出与该子时间序列第1邻近的子时间序列和第2邻近的子时间序列。假设,与子时间序列[X1,X2,X3,X4,X5]第1邻近的子时间序列为[X2,X3,X4,X5,X6],与子时间序列[X1,X2,X3,X4,X5]第2邻近的子时间序列为[Xn-4,Xn-3,Xn-2,Xn-1,Xn]。则连接X1对应的节点和X2对应的节点,以及连接X1对应的节点和Xn-4对应的节点。
参见图6,图6为本发明实施例提供的K邻近图结构的示意图。对于待分类时间序列T0,该待分类时间序列具有M个数值。若以m为滑动窗口的大小,滑动步长为1,对待分类时间序列进行拆分,则可以得到M-m+1个子时间序列。然后,根据上述的K-最邻近图构建算法的具体实现过程,可以得到待分类时间序列对应的K邻近结构图。其中,图6中的K邻近图结构中的每个实点对应一个节点。
在本发明的一些实施例中,S3202包括对于每个节点,将节点在待分类时间序列中对应的数值和图结构中与节点关联的边的个数作为节点的原始节点特征。
在本发明的实施例中,当得到待分类时间序列对应的图结构之后,则需要对该图结构中的每个节点添加节点特征(即该节点的原始节点特征)。
假设图1中的图结构为待分类时间序列{a1,a2,……,a6}对应的图结构。以图1中的节点4为例,与节点4关联的边的个数为4。待分类时间序列中与节点4对应的数值,即为待分类时间序列中的第四个数值a4。因此,可以将a4和4构成一个二维的向量,作为节点4的原始节点特征。类似地,按照上述方法可以得到每个节点的原始节点特征。
在本发明的一些实施例中,S3203包括:对于图结构中的每个边,将边的方向特征、边的类型特征以及边对应的差值作为边的原始边特征;其中,该差值为边的两端的节点在待分类时间序列中对应的数值之间的差值。
在本发明的一些实施例中,当得到待分类时间序列对应的图结构之后,也需要对图结构中的每个边添加边特征(即边的原始边特征)。
需要说明的是,边的类型特征即是确定图结构中的边所使用的图结构构建算法的标识。
对于有向图结构,该图结构中的边是有方向的。作为一个示例,对于某条边,若该边的方向为由数值大的节点指向数值小的节点,则该边的方向特征可以设置为1,若该边的方向为由数值小的节点指向数值大的节点,则该边的方向特征可以设置为1。值得一提的是,对于无向图结构,则可以先将该无向图结构转化为有向图结构,即两个节点之间的边具有两个方向。
以图1中的边(1,2)为例,该边对应的差值为节点1在待分类时间序列{a1,a2,……,a6}中对应的数值a1和节点2在该待分类时间序列中对应的数值a2之间的差值的绝对值。
在本发明的实施例中,可以将边的方向特征、边的类型特征以及边对应的差值构成一个三维向量,作为该边的原始边特征。
下面介绍S330的具体实现方式。在一些实施例中,S330包括:将每个节点的原始节点特征和每个边的原始边特征输入图神经网络模型,得到每个节点的目标节点特征和每个边的目标边特征;基于每个节点的目标节点特征和每个边的目标边特征,得到待分类时间序列对应的表征向量。
在本发明的一些实施例中,训练后的图神经网络模型可以包括由L个消息传递层,其中,第l个消息传递层MPl以第l-1个消息传递层的输出为输入。其中,l为大于等于1且小于等于L的整数。L为大于或等于1的整数。其中,第1层消息传递层以待分类时间序列的第一图结构数据中包括的每个节点的原始节点特征和每个边的原始边特征作为输入,L个消息传递层会逐层更新待分类时间序列对应的图结构中的每个节点的节点特征和每个边的边特征,第L个消息传递层将会输出每个节点的目标节点特征和每个边的目标边特征。
假设待分类时间序列对应的图结构表示为
Figure BDA0002489540140000101
节点集合
Figure BDA0002489540140000102
边集合
Figure BDA0002489540140000103
则对于该图结构中的每条边(j,k)∈ε,其中,1≤j≤N,1≤k≤N。j,k均为整数。
其中,每个边的原始边特征可以表示为
Figure BDA0002489540140000104
对于该图结构中的每个节点
Figure BDA0002489540140000105
的原始节点特征可以表示为
Figure BDA0002489540140000106
其中,1≤i≤N,i为整数。
对于第l个消息传递层MPl,该层输出的每个边的边特征可以表示为
Figure BDA0002489540140000107
该层输出的每个节点的节点特征可以表示为
Figure BDA0002489540140000111
其中,对于第l个消息传递层MPl,该传递层首先更新每个边的边特征,然后聚合每个节点关联的边的边特征,最后,利用每个节点关联的边的边特征更新每个节点的节点特征。
首先介绍第l个消息传递层更新边特征的实现方式。
对于待分类时间序列对应的图结构中的每条边(j,k)∈ε,根据第l-1个消息传递层输出的该边的边特征
Figure BDA0002489540140000112
和第l-1个消息传递层输出的该边的两端节点的特征
Figure BDA0002489540140000113
Figure BDA0002489540140000114
计算第l个消息传递层MPl输出的该边的边特征
Figure BDA0002489540140000115
Figure BDA0002489540140000116
其中
Figure BDA0002489540140000117
表示一个多层感知机,[x1,x2…,xs]表示对x1,x2…,xs进行向量拼接操作后得到的向量,即将多个向量拼接为一个向量。s为大于1的正整数。也就是说,
Figure BDA0002489540140000118
表示对
Figure BDA0002489540140000119
Figure BDA00024895401400001110
进行向量拼接后的得到的向量。
其中,MLPe(x)的具体计算表达式如下:
MLPe(x)=tanh(W2 tanh(W1x+b1)+b2)) (2)
其中tanh()为作用于向量每个元素的双曲正切函数,W1,W2为映射矩阵,b1,b2为偏移向量。其中,{W1,W2,b1,b2}是可学习的参数。需要说明的是,对于L个消息传递层,每个消息传递层具有各自的{W1,W2,b1,b2}。
接着,介绍第l个消息传递层聚合每个节点关联的边的边特征的具体实现方式。
对于待分类时间序列对应的图结构中的每个节点
Figure BDA00024895401400001111
令εi表示该图结构中所有以节点i为尾端点的边,即
Figure BDA00024895401400001112
将εi中所有边特征聚合至节点i,则对节点i关联的边的边特征聚合后得到的聚合特征为
Figure BDA00024895401400001113
Figure BDA00024895401400001114
最后,介绍第l个消息传递层更新待分类时间序列对应的图结构中的节点特征的具体实现方式。
对于每个节点
Figure BDA0002489540140000121
根据第l-1个消息传递层输出的该节点的节点特征
Figure BDA0002489540140000122
和第l个消息传递层对节点i关联的边的边特征聚合后得到的聚合特征
Figure BDA0002489540140000123
计算第l个消息传递层MPl输出的该节点的节点特征
Figure BDA0002489540140000124
Figure BDA0002489540140000125
其中MLPv为另一个多层感知机,与上述的MLPe(x)的实现方式类似,在此不再赘述。
根据上述过程可以得到第L个消息传递层输出待分类时间序列对应的图结构中每个节点的目标节点特征
Figure BDA0002489540140000126
(记为V′i)和该图结构中每个边的目标边特征
Figure BDA0002489540140000127
(记为E′jk)。
最后,每将个节点的目标节点特征V′i和每个边的目标边特征E′jk,聚合为单个向量,即待分类时间序列对应的表征向量g:
Figure BDA0002489540140000128
在本发明的实施例中,图神经网络模型的消息传递层的层次数量以及每个层次的神经元类型都是可以根据需求更改的,在此不做具体限定。
在本发明的实施例中,训练后的图神经网络模型也可以包括但不限于自适应感受路径的图神经网络模型(GeniePath)、图卷积神经网络(GCN)、归纳式的图神经网络模型(GraphSage)、图注意力网络模型(GAT)和图同构网络模型(GIN)等模型。
在S340中,训练后的分类器可以为三层多元分类模型(DNN),也可以替换成其他逻辑回归模型,二分类树模型等。
图7为本发明另一实施例提供的分类方法的流程示意图。如图7所示,通过利用可见性图构建算法对待分类时间序列进行图结构化处理,得到第一图结构数据。
假设待分类时间序列对应的图结构中包括N个节点。其中,ht代表待分类时间序列对应的图结构中节点t的原始节点特征以及与该节点t关联的每个边的原始边特征所构成的向量。1≤t≤N,t为整数。
然后,将ht输入训练后的图神经网络模型,可以得到每个节点对应的表征向量h′t。将每个节点对应的表征向量h′t进行平均,则可以得到待分类时间序列对应的表征向量。最后,将待分类时间序列对应的表征向量输入训练后的分类器,则可以得到待分类时间序列的分类结果。
由于在对待分类时间序列进行分类时,需要用到训练后的图神经网络模型和训练后的分类器。因此,需要预先训练图神经网络和分类器。下面介绍图神经网络模型和分类器的训练方法。图8为本发明实施例提供的图神经网络模型和分类器的训练方法的流程示意图。在本发明的实施例中,图神经网络模型和分类器的训练方法包括S810~S870。
S810,获取训练样本集,训练样本集包括多个样本时间序列;
对于每个样本时间序列,执行S820~S840:
S820,对样本时间序列进行图结构化处理,得到第二图结构数据。
S830,将第二图结构数据输入待训练图神经网络模型,得到样本时间序列对应的表征向量。
S840,将样本时间序列对应的表征向量输入待训练分类器中,得到样本时间序列的分类预测结果。
其中,S820的具体实现方式与S320的具体实现方式类似,S830的具体实现方式与S330的具体实现方式类似,S840的具体实现方式与S340的具体实现方式类似,在此不再赘述。
S850,判断是否满足预设训练条件。若满足,则进入S860,若不满足,则进入S870。
在本发明的一个实施例中,预设训练条件包括迭代次数达到预设次数阈值。
在发明的另一个实施例中,预设训练条件包括待训练分类器的损失函数与上一次迭代过程中确定的损失函数之间的差值不超过预设差值阈值。也就是说待训练分类器的损失函数与上一次迭代过程中计算的损失函数较为接近,则可以认为训练出的分类器的性能已相对较好。
S860,模型训练结束,得到训练后的图神经网络模型和训练后的分类器。
S870,基于每个样本时间序列的分类预测结果和每个样本时间序列的分类标签值,调整待训练分类器的参数和待训练图神经网络模型的参数,并返回S820,以继续利用训练样本集训练调整后的待训练分类器和调整后的待训练图神经网络模型。
在一些实施例中,S870包括基于每个样本时间序列的分类预测结果和每个样本时间序列的分类标签值,以及预设的损失函数和反向传播算法,调整待训练分类器的参数和待训练图神经网络模型的参数。
在本说明书的一个或多个实施例中,损失函数(Loss Function)可以用于估计模型训练的结果与模型训练的目标之间的差距。例如,模型训练的结果是每次训练的分类器输出的分类预测结果,而模型训练的目标是输入的样本时间序列的分类标签值。
在一个实施例中,待训练分类器的参数和待训练图神经网络模型的参数的初始值可以是一个随机参数或用户根据经验设定的一个参数值。
在本说明书一个或多个实施例中,在待训练图神经网络和待训练分类器的训练过程中,利用梯度下降算法,确定损失函数对应的梯度,并根据损失函数对应的梯度,调整待训练分类器的参数和待训练图神经网络模型的参数。
在本发明的实施例中,基于每个样本时间序列的分类预测结果和每个样本时间序列的分类标签值,调整待训练分类器的参数和待训练图神经网络模型的参数,即采用端到端的训练方式,不需要定制化的为不同的时间序列数据集设计分类器,进而可以提高训练的分类器对待分类时间序列的分类准确度。
图9为本发明实施例提供的分类装置900的结构示意图。如图9所示,该分类装置包括:
时间序列获取模块910,用于获取待分类时间序列。
第一图结构数据确定模块920,用于对待分类时间序列进行图结构化处理,得到第一图结构数据。
表征向量确定模块930,用于将第一图结构数据输入训练后的图神经网络模型,得到待分类时间序列对应的表征向量。
分类结果确定模块940,用于将待分类时间序列对应的表征向量输入训练后的分类器中,得到待分类时间序列的分类结果。
在本发明的实施例中,对待分类时间序列进行图结构化处理,得到的第一图结构数据,既体现了该时间序列数据的全局特性,又考虑了该时间序列的局部特性。因此,第一图结构数据中包含了待分类时间序列的丰富的特征信息。将包含了待分类时间序列的丰富的特征信息第一图结构数据输入训练后的图神经网络模型后得到的待分类时间序列对应的表征向量,可以体现待分类时间序列的丰富特征信息,因此对该表征向量进行分类,可以提高对该待分类时间序列分类的准确率。
在本发明的一些实施例中,第一图结构数据确定模块920包括:
图结构构建单元,用于基于预设的图结构构建算法,构建待分类时间序列对应的图结构。
节点特征确定单元,用于对于图结构中每个节点,基于节点与待分类时间序列的关联关系,以及图结构中与节点关联的边,确定节点的原始节点特征。
边特征确定单元,用于对于图结构中的每个边,基于边所关联的节点的原始节点特征,确定边的原始边特征。
在本发明的一些实施例中,图结构构建单元具体用于:
将待分类时间序列中的每个数值对应的时间点作为图结构中的一个节点;
基于预设边确定规则,确定每个节点关联的边。
在本发明的一些实施例中,图结构构建算法包括以下算法中的任意一种:
可见性图构建算法、水平可见性图构建算法以及K-最邻近图构建算法。
在本发明的一些实施例中,节点特征确定单元具体用于:
对于每个节点,将节点在待分类时间序列中对应的数值和图结构中与节点关联的边的个数作为节点的原始节点特征。
在本发明的一些实施例中,边特征确定单元具体用于:
对于图结构中的每个边,将边的方向特征、边的类型特征以及边对应的差值作为边的原始边特征;
其中,差值为边的两端的节点在待分类时间序列中对应的数值之间的差值。
在本发明的一些实施例中,表征向量确定模块930具体用于:
将每个节点的原始节点特征和每个边的原始边特征输入图神经网络模型,得到每个节点的目标节点特征和每个边的目标边特征;
基于每个节点的目标节点特征和每个边的目标边特征,得到待分类时间序列对应的表征向量。
在本发明的一些实施例中,分类装置900还可以包括:
样本集获取模块,用于获取训练样本集,训练样本集包括多个样本时间序列;
第一处理模块,用于对于每个样本时间序列,执行以下步骤:
对样本时间序列进行图结构化处理,得到第二图结构数据;
将第二图结构数据输入待训练图神经网络模型,得到样本时间序列对应的表征向量;
将样本时间序列对应的表征向量输入待训练分类器中,得到样本时间序列的分类预测结果。
判断模块,用于判断是否满足预设训练条件。
第二处理模块用于,若不满足,基于每个样本时间序列的分类预测结果和每个样本时间序列的分类标签值,调整待训练分类器的参数和待训练图神经网络模型的参数,并继续利用训练样本集训练调整后的待训练分类器和调整后的待训练图神经网络模型,直至满足预设训练条件,得到训练后的分类器和训练后的图神经网络模型。
在本发明的一些实施例中,第二处理模块具体用于:
基于每个样本时间序列的分类预测结果和每个样本时间序列的分类标签值,以及预设的损失函数和反向传播算法,调整待训练分类器的参数和待训练图神经网络模型的参数。
根据本发明实施例的分类装置900的其他细节与以上结合图3至图7描述的根据本说明书实施例的分类方法类似,在此不再赘述。
结合图3~图9描述的根据本发明实施例的分类方法和装置可以由计算设备来实现。图10为发明实施例提供的计算设备1000的硬件结构示意图。
如图10所示,计算设备1000包括输入设备1001、输入接口1002、中央处理器1003、存储器1004、输出接口1005、以及输出设备1006。其中,输入接口1002、中央处理器1003、存储器1004、以及输出接口1005通过总线1010相互连接,输入设备1001和输出设备1006分别通过输入接口1002和输出接口1005与总线1010连接,进而与计算设备1000的其他组件连接。
具体地,输入设备1001接收来自外部的输入信息,并通过输入接口1002将输入信息传送到中央处理器1003;中央处理器1003基于存储器1004中存储的计算机可执行指令对输入信息进行处理以生成输出信息,将输出信息临时或者永久地存储在存储器1004中,然后通过输出接口1005将输出信息传送到输出设备1006;输出设备1006将输出信息输出到计算设备1000的外部供用户使用。
也就是说,图10所示的计算设备也可以被实现为包括:存储有计算机可执行指令的存储器;以及处理器,该处理器在执行计算机可执行指令时可以实现结合图3至图9描述的分类方法和装置。
本发明实施例还提供一种计算机存储介质,该计算机存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现本发明实施例提供的分类方法。
以上的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或***。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
以上,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的***、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。

Claims (12)

1.一种分类方法,其中,所述方法包括:
获取待分类时间序列;
对所述待分类时间序列进行图结构化处理,得到第一图结构数据;
将所述第一图结构数据输入训练后的图神经网络模型,得到所述待分类时间序列对应的表征向量;
将所述待分类时间序列对应的表征向量输入训练后的分类器中,得到所述待分类时间序列的分类结果。
2.根据权利要求1所述的方法,其中,所述对所述待分类时间序列进行图结构化处理,得到第一图结构数据,包括:
基于预设的图结构构建算法,构建所述待分类时间序列对应的图结构;
对于所述图结构中每个节点,基于所述节点与所述待分类时间序列的关联关系,以及所述图结构中与所述节点关联的边,确定所述节点的原始节点特征;
对于所述图结构中的每个边,基于所述边所关联的节点的原始节点特征,确定所述边的原始边特征。
3.根据权利要求2所述的方法,其中,所述基于预设的图结构构建算法,构建所述待分类时间序列对应的图结构,包括:
将所述待分类时间序列中的每个数值对应的时间点作为所述图结构中的一个节点;
基于预设边确定规则,确定每个所述节点关联的边。
4.根据权利要求2所述的方法,其中,所述图结构构建算法包括以下算法中的任意一种:
可见性图构建算法、水平可见性图构建算法以及K-最邻近图构建算法。
5.根据权利要求3所述的方法,其中,所述对于所述图结构中每个节点,基于所述节点与所述待分类时间序列的关联关系,以及所述图结构中与所述节点关联的边,确定所述节点的原始节点特征,包括:
对于每个所述节点,将所述节点在所述待分类时间序列中对应的数值和所述图结构中与所述节点关联的边的个数作为所述节点的原始节点特征。
6.根据权利要求5所述的方法,其中,所述对于所述图结构中的每个边,基于所述边所关联的节点的原始节点特征,确定所述边的原始边特征,包括:
对于所述图结构中的每个边,将所述边的方向特征、所述边的类型特征以及所述边对应的差值作为所述边的原始边特征;
其中,所述差值为所述边的两端的节点在所述待分类时间序列中对应的数值之间的差值。
7.根据权利要求2所述的方法,其中,所述将所述第一图结构数据输入训练后的图神经网络模型,得到所述待分类时间序列对应的表征向量,包括:
将每个所述节点的原始节点特征和每个所述边的原始边特征输入所述图神经网络模型,得到每个所述节点的目标节点特征和每个所述边的目标边特征;
基于每个所述节点的目标节点特征和每个所述边的目标边特征,得到所述待分类时间序列对应的表征向量。
8.根据权利要求1所述的方法,其中,所述获取待分类时间序列之前,所述方法还包括:
获取训练样本集,所述训练样本集包括多个样本时间序列;
对于每个所述样本时间序列,执行以下步骤:
对所述样本时间序列进行图结构化处理,得到第二图结构数据;
将所述第二图结构数据输入待训练图神经网络模型,得到所述样本时间序列对应的表征向量;
将所述样本时间序列对应的表征向量输入待训练分类器中,得到所述样本时间序列的分类预测结果;
判断是否满足预设训练条件;
若不满足,基于每个所述样本时间序列的分类预测结果和每个所述样本时间序列的分类标签值,调整所述待训练分类器的参数和所述待训练图神经网络模型的参数,并继续利用所述训练样本集训练调整后的待训练分类器和调整后的待训练图神经网络模型,直至满足所述预设训练条件,得到训练后的分类器和训练后的图神经网络模型。
9.根据权利要求8所述的方法,其中,所述基于每个所述样本时间序列的分类预测结果和每个所述样本时间序列的分类标签值,调整所述待训练分类器的参数和所述待训练图神经网络模型的参数,包括:
基于每个所述样本时间序列的分类预测结果和每个所述样本时间序列的分类标签值,以及预设的损失函数和反向传播算法,调整所述待训练分类器的参数和所述待训练图神经网络模型的参数。
10.一种分类装置,其中,所述装置包括:
时间序列获取模块,用于获取待分类时间序列;
第一图结构数据确定模块,用于对所述待分类时间序列进行图结构化处理,得到第一图结构数据;
表征向量确定模块,用于将所述第一图结构数据输入训练后的图神经网络模型,得到所述待分类时间序列对应的表征向量;
分类结果确定模块,用于将所述待分类时间序列对应的表征向量输入训练后的分类器中,得到所述待分类时间序列的分类结果。
11.一种计算设备,其中,所述计算设备包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如权利要求1-9任意一项所述的分类方法。
12.一种计算机存储介质,其中,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-9任意一项所述的分类方法。
CN202010401207.5A 2020-05-13 2020-05-13 分类方法、装置、计算设备和介质 Pending CN113297443A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010401207.5A CN113297443A (zh) 2020-05-13 2020-05-13 分类方法、装置、计算设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010401207.5A CN113297443A (zh) 2020-05-13 2020-05-13 分类方法、装置、计算设备和介质

Publications (1)

Publication Number Publication Date
CN113297443A true CN113297443A (zh) 2021-08-24

Family

ID=77318020

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010401207.5A Pending CN113297443A (zh) 2020-05-13 2020-05-13 分类方法、装置、计算设备和介质

Country Status (1)

Country Link
CN (1) CN113297443A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113743618A (zh) * 2021-09-03 2021-12-03 北京航空航天大学 时间序列数据处理方法、装置、可读介质及电子设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113743618A (zh) * 2021-09-03 2021-12-03 北京航空航天大学 时间序列数据处理方法、装置、可读介质及电子设备

Similar Documents

Publication Publication Date Title
CN108090093B (zh) 生成推荐结果的方法和装置
CN112989064B (zh) 一种聚合知识图神经网络和自适应注意力的推荐方法
CN111737546B (zh) 确定实体业务属性的方法及装置
CN113256367B (zh) 用户行为历史数据的商品推荐方法、***、设备及介质
WO2022152161A1 (zh) 混合图神经网络模型的训练、预测
CN112085565A (zh) 基于深度学习的信息推荐方法、装置、设备及存储介质
CN112541575B (zh) 图神经网络的训练方法及装置
CN112086144A (zh) 分子生成方法、装置、电子设备及存储介质
CN112580733A (zh) 分类模型的训练方法、装置、设备以及存储介质
WO2023217127A1 (zh) 一种因果关系确定方法及相关设备
CN114240555A (zh) 训练点击率预测模型和预测点击率的方法和装置
CN116635877A (zh) 模型生成装置、推测装置、模型生成方法以及模型生成程序
CN115879508A (zh) 一种数据处理方法及相关装置
CN111641517A (zh) 同质网络的社群划分方法、装置、计算机设备和存储介质
CN111159481A (zh) 图数据的边预测方法、装置及终端设备
CN115114484A (zh) 异常事件检测方法、装置、计算机设备和存储介质
CN113297443A (zh) 分类方法、装置、计算设备和介质
CN114445121A (zh) 一种广告点击率预测模型构建及广告点击率预测方法
US20230052255A1 (en) System and method for optimizing a machine learning model
CN113450167A (zh) 一种商品推荐方法和装置
CN115860856A (zh) 一种数据处理方法、装置、电子设备及存储介质
Pan et al. Stagewise learning for noisy k-ary preferences
CN114900435B (zh) 一种连接关系预测方法及相关设备
CN108898227A (zh) 学习率计算方法及装置、分类模型计算方法及装置
CN115456708A (zh) 推荐模型的训练方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40057461

Country of ref document: HK