CN115130554A - 对象分类方法、装置、电子设备及存储介质 - Google Patents

对象分类方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN115130554A
CN115130554A CN202210602732.2A CN202210602732A CN115130554A CN 115130554 A CN115130554 A CN 115130554A CN 202210602732 A CN202210602732 A CN 202210602732A CN 115130554 A CN115130554 A CN 115130554A
Authority
CN
China
Prior art keywords
training
graph
classification
convolutional layer
ith
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210602732.2A
Other languages
English (en)
Inventor
赵宏宇
赵国庆
蒋宁
王洪斌
吴海英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mashang Consumer Finance Co Ltd
Original Assignee
Mashang Consumer Finance Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mashang Consumer Finance Co Ltd filed Critical Mashang Consumer Finance Co Ltd
Priority to CN202210602732.2A priority Critical patent/CN115130554A/zh
Publication of CN115130554A publication Critical patent/CN115130554A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书实施例提供了对象分类方法、装置、电子设备及存储介质,其中,一种对象分类方法包括:获取待分类对象的图数据;根据第i‑1次训练所使用的图边训练信息,生成第i次训练所使用的目标邻接矩阵;将目标邻接矩阵和节点特征输入至对象分类模型进行分类预测,得到第i次训练对应的第i次损失函数值以及第i次分类结果,并将第i次训练对应的训练损失函数值添加到训练参考信息集中;若第i次训练满足训练结束条件,则从训练参考信息集中确定满足训练要求的第j次训练损失函数值,并将第j次分类结果确定为待分类对象的目标分类,以此,可以在不改变关系图结构的情况下,提高利用图数据进行对象分类的准确性。

Description

对象分类方法、装置、电子设备及存储介质
技术领域
本申请涉及图数据领域,尤其涉及一种对象分类方法、装置、电子设备及存储介质。
背景技术
现实生活中存在大量的图数据,如社交网络、电子商务、生物信息等领域均存在图数据。图数据包括由多个节点以及多个边形成的集合,可用于自然地表示多个对象以及各个对象之间的关联关系。图数据的结构复杂,蕴含着丰富的信息。图数据可以应用于对象分类领域,具体地,图数据中蕴含的信息可用于预测图数据中待分类节点对应的分类标签,以此,利用图数据可实现对各个待分类节点所表示的待分类对象的分类。如何基于某个领域的图数据准确地进行对象分类成为当前研究的热点问题之一。
发明内容
本申请实施例提供了一种对象分类方法、装置、电子设备及存储介质,以提高利用图数据进行对象分类的准确性。
第一方面,本申请实施例提供了一种对象分类方法,包括:
获取待分类对象的图数据;所述图数据包括由多个对象节点和多个边构成的待分类对象的关系图,以及每个所述对象节点的节点特征,一个对象节点对应一个待分类对象;
根据第i-1次训练所使用的图边训练信息,生成第i次训练所使用的目标邻接矩阵;所述图边训练信息包括如下任意一个或多个:初始邻接矩阵、待训练的图边参数以及图边参数调整规则;i为大于或等于1的整数;所述初始邻接矩阵是基于所述关系图的多个所述对象节点之间的连接关系构建;
将所述目标邻接矩阵和所述节点特征输入至对象分类模型进行分类预测,得到第i次训练对应的第i次损失函数值以及第i次分类结果,并将所述第i次训练对应的训练损失函数值添加到训练参考信息集中,所述训练参考信息集中存储多次训练中每次训练对应的损失函数值以及分类结果;
若所述第i次训练满足训练结束条件,则从所述训练参考信息集中确定满足训练要求的第j次训练损失函数值,并将所述第j次分类结果确定为所述待分类对象的目标分类。
第二方面,本申请实施例提供了一种对象分类装置,包括:
获取单元,用于获取待分类对象的图数据;所述图数据包括由多个对象节点和多个边构成的待分类对象的关系图,以及每个对象的节点特征,一个对象节点对应一个待分类对象;
生成单元,用于根据第i-1次训练所使用的图边训练信息,生成第i次训练所使用的目标邻接矩阵;所述图边训练信息包括如下任意一个或多个:初始邻接矩阵、待训练的图边参数以及图边参数调整规则;i为大于或等于1的整数;所述初始邻接矩阵是基于所述关系图的多个所述对象节点之间的连接关系构建;
预测单元,用于将所述目标邻接矩阵和所述节点特征输入至对象分类模型进行分类预测,得到第i次训练对应的第i次损失函数值以及第i次分类结果,并将所述第i次训练对应的训练损失函数值添加到训练参考信息集中,所述训练参考信息集中存储多次训练中每次训练对应的损失函数值以及分类结果;
第一确定单元,用于若所述第i次训练满足训练结束条件,则从所述训练参考信息集中确定满足训练要求的第j次训练损失函数值,并将所述第j次分类结果确定为所述待分类对象的目标分类。
第三方面,本申请实施例提供了一种电子设备,包括:处理器;以及,被配置为存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器执行第一方面所述的对象分类方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现如第一方面所述的对象分类方法。
可以看出,在本申请实施例中,在需要对待分类对象进行分类时,首先要获取待分类对象的图数据;该图数据包括由多个对象节点和多个边构成的待分类对象的关系图,以及每个对象节点的节点特征;进一步的,根据第i-1次训练所使用的图边训练信息,生成第i次训练所使用的目标邻接矩阵;图边训练信息包括如下任意一个或多个:初始邻接矩阵、待训练的图边参数以及图边参数调整规则;i为大于或等于1的整数;初始邻接矩阵是基于关系图的多个对象节点之间的连接关系构建;将目标邻接矩阵和节点特征输入至对象分类模型进行分类预测,得到第i次训练对应的第i次损失函数值以及第i次分类结果,并将第i次训练对应的训练损失函数值添加到训练参考信息集中,训练参考信息集中存储多次训练中每次训练对应的损失函数值以及分类结果;若第i次训练满足训练结束条件,则从训练参考信息集中确定满足训练要求的第j次训练损失函数值,并将第j次分类结果确定为待分类对象的目标分类。以此,基于获取的待分类对象的图数据对对象分类模型进行多次训练,其中,第i次训练所使用的可反映关系图的图边权重的目标邻接矩阵是根据第i-1次训练所使用的图边训练信息生成,从而在不改变关系图结构的情况下,通过训练调整关系图中各个边的权重,优化了用于在对象分类过程中辅助节点特征提取的目标邻接矩阵,进而优化了对象分类模型对关系图的特征提取效果,提高了利用图数据进行对象分类的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图;
图1为本申请实施例提供的一种对象分类方法的处理流程图;
图2为本申请实施例提供的一种待分类对象的关系图;
图3为本申请实施例提供的一种对象分类模型的网络架构示意图;
图4为本申请实施例提供的商品分类场景下对象分类模型的应用示意图;
图5为本申请实施例提供的一种对象分类模型的应用示意图;
图6为本申请实施例提供的一种对象分类装置示意图;
图7为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请实施例中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书的一部分实施例,而不是全部的实施例。基于本申请实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请的保护范围。
现实生活中,图数据广泛应用于社交网络、电子商务以及生物信息等领域。图数据可以包括由多个节点和多个边构成的关系图。图数据的结构复杂,蕴含着丰富的信息,该信息可用于预测图数据中待分类节点对应的分类标签,以此,利用图数据可实现对各个待分类节点所表示的待分类对象的分类。然而,随着科学技术的发展,人们对基于图数据进行对象分类的准确性提出了更高的要求。为此,本申请实施例提供了一种对象分类方法。
图1为本申请实施例提供的一种对象分类方法的处理流程图。图1所述的对象分类方法可由电子设备执行,该电子设备可以是终端设备,比如手机、笔记本电脑、智能交互设备等等;或者,该电子设备还可以是服务器,比如独立的物理服务器、服务器集群或者是能够进行云计算的云服务器。参照图1,本实施例提供的对象分类方法,具体包括步骤S102至步骤S106:
步骤S102,获取待分类对象的图数据;图数据包括由多个对象节点和多个边构成的待分类对象的关系图,以及每个对象节点的节点特征,一个对象节点对应一个待分类对象。
待分类对象可以是需要被分类的人或物体,例如,商品、文章等。在由多个对象节点和多个边构成的待分类对象的关系图中,每个对象节点对应于一个待分类对象,任意两个对象节点之间可能通过一条边连接,也可能不存在连接关系。对象节点的节点特征,可以是该对象节点对应的待分类对象的特征参数。该节点特征可以通过多维矩阵的形式表示。
多个对象节点可以包括多个标签节点和多个无标签节点。标签节点,可以是携带有分类标签的对象节点;无标签节点,可以是未携带分类标签的对象节点。对于每一个标签节点,该标签节点携带的分类标签可以是该标签节点对应的一个待分类对象的实际分类结果,则每一个标签节点的实际分类结果均为已知的,每一个无标签节点的实际分类结果均为未知的。对于一个待分类对象的关系图,该关系图所包括的标签节点可以视为模型训练过程中的训练集,无标签节点可以视为模型训练过程中的测试集。
需要注意的是,针对任意一个待分类对象,在进行模型训练的过程中,对于任意一个图数据,该图数据中的关系图既包括可作为训练集的标签节点,又包括可作为测试集的无标签节点。该图数据还包括各个标签节点的节点特征,以及,各个无标签节点的节点特征。
标签节点的数量可以大于无标签节点的数量,也可以小于等于无标签节点的数量。例如,待分类对象的关系图共包括100个节点,其中,30个是标签节点,70个是无标签节点。
示例性地,待分类对象的关系图可以参照图2。图2为本申请实施例提供的一种待分类对象的关系图。
如图2所示,假设待分类对象的数量为7个,因此在图2所示的关系图中包括7个待分类对象对应的7个对象节点,不同对象节点之间的连接线是关系图中的边。为了便于区分,标签节点2011和标签节点2012用黑色实心圆表示,无标签节点2021、无标签节点2022、无标签节点2023、无标签节点2024以及无标签节点2025用空心圆表示。则图2所示的关系图中,包括两个标签节点和5个无标签节点。
如图2所示,标签节点2011与标签节点2012之间通过边2031连接;标签节点2011与无标签节点2021之间通过边2032连接;标签节点2012与无标签节点2023之间通过边2033连接;无标签节点2023与无标签节点2024之间通过边2034连接;无标签节点2023与无标签节点2025之间通过边2035连接;无标签节点2021与无标签节点2022之间通过边2036连接。
对象节点与对象节点之间,可以通过边连接,也可以不存在任何连接关系。待分类对象的关系图中的边可以基于各个待分类对象之间的关联关系构建。具体地,如果两个待分类对象之间存在一定的关联关系,那么这两个待分类对象对应的对象节点之间是需要建立边的;反之,如果两个待分类对象之间不存在一定的关联关系,那么这两个待分类对象对应的对象节点之间则不需要建立边。
在一个实施例中,两个待分类对象之间存在关联关系可以是指两个待分类对象具有一种相同的特征。该相同的特征为预先配置的N个关联特征中的至少一者。
例如,待分类对象为文章,每个对象节点对应于一篇文章,对于任意两篇文章,若该两篇文章引用了同样的数据集,则确定该两篇文章之间存在关联关系,那么这两篇文章分别对应的对象节点之间通过边连接在一起。对象节点1对应于文章1,对象节点2对应于文章2,对象节点3对应于文章3,文章1与文章2均引用了数据集A,文章1与文章3均引用了数据集B,则对象节点1与对象节点2通过边1连接在一起,对象节点1与对象节点3通过边2连接在一起。
又例如,待分类对象为商品。若两件商品属于同一品牌,则该两件商品之间存在第一关联关系;若两件商品的用途相同,则该两件商品之间存在第二关联关系;若两件商品的产地相同,则该两件商品之间存在第三关联关系。具体实施时,可以预先配置对象节点的关系图的构建规则为:若两件商品之间存在第一关联关系、第二关联关系以及第三关联关系中的至少一者,则该两件商品所对应的两个对象节点之间通过边连接;若两件商品之间存在不存在第一关联关系、第二关联关系以及第三关联关系中的至少一者,则该两件商品所对应的两个对象节点之间不存在任何连接关系。
另一个实施例中,两个待分类对象之间存在关联关系可以是指两个待分类对象的同种特征的相似度小于等于预设相似度阈值。
例如,待分类对象为新闻报道,每个对象节点对应于一篇新闻报道,对于任意两篇新闻报道,若该两篇新闻报道的文字相似度大于等于预设相似度阈值,则确定该两篇新闻报道分别对应的对象节点之间通过边连接在一起。对象节点1对应于新闻报道1,对象节点2对应于新闻报道2,对象节点3对应于新闻报道3,预设相似度阈值为80%,新闻报道1与新闻报道2的文字相似度为89%,新闻报道2与新闻报道3的文字相似度为82%,新闻报道1与新闻报道3的文字相似度为69%,则对象节点1与对象节点2通过边1连接在一起,对象节点2与对象节点3通过边2连接在一起,对象节点1与对象节点3之间不存在任何连接关系。
又一个实施例中,两个待分类对象之间存在关联关系也可以是两个待分类对象之间具备一定的包含关系或者从属关系。比如一个待分类对象是A单位,一个待分类对象是在A单位工作的员工,那么这两个待分类对象之间也是存在关联关系。在关系图中,这两个对象对应的对象节点之间就会存在一条边。
可选地,待分类对象包括商品;对象节点包括商品节点;对象节点的节点特征包括商品的重量、品牌、价格以及售出量中的至少一者;商品的关系图基于每个商品节点所属商品类别之间的相似度构建。
例如,商品的关系图包括100个商品节点,每个商品节点对应于一种商品,每个商品节点的节点特征包括该商品节点对应的商品的品牌和价格。对于任意两种商品,若该两种商品的商品类别之间的相似度大于预设相似度阈值70%,则确定该两种商品分别对应的商品节点之间通过边连接在一起。
100个商品节点包括30个标签节点和70个无标签节点,对于任意一个标签节点,该标签节点携带有购买历史标签,该购买历史标签包括两个类别,第一类别用于标示用户曾经购买过该种商品,第二类别用于标示用户未购买过该种商品。对于任意一个无标签节点,该无标签节点未携带购买历史标签。步骤S104,根据第i-1次训练所使用的图边训练信息,生成第i次训练所使用的目标邻接矩阵。
需要说明的是,本申请实施例所提供的对象分类模型,是一种半监督学习模型,同时进行模型训练和模型测试,从而在分类标签数量较少的情况下实现对待分类对象的对象分类结果的准确预测。
具体地,该对象分类模型,并不是先基于多个样本数据进行多次模型训练,直到满足训练停止条件,将最后一次训练所得到的模型确定为训练后的模型,接着,该训练后的模型投入使用,对不同于样本数据的待测试数据进行预测。而是,对同一个既包括样本数据又包括待测试数据的图数据进行多次训练,训练样本数据与测试待测试数据是同时进行的。
示例性地,图数据所包括的100个对象节点可以包括20个标签节点和80个无标签节点,该20个标签节点为样本数据,该80个无标签节点为待测试数据。该20个标签节点的实际分类结果是已知的,则各个标签节点可用于模型训练;该80个无标签节点的实际分类结果是未知的,则各个无标签节点可用于模型测试。通过第i次训练获得的第i次分类结果既包括该20个节点标签的第i次分类预测标签,又包括该80个无标签节点的第i次分类预测标签。
第i-1次训练可以是对本申请实施例所提供的一种对象分类模型进行第i-1次模型训练,i为大于或等于1的整数。对象分类模型可以是一种包括多个卷积层的图神经网络模型。对象分类模型包括的卷积层的数量可以大于预设数量阈值。预设数量阈值可以是3,也可以是其他预先设置的大于3的自然数。
GCN(Graph Convolutional Network,图神经网络)常应用于图数据的处理。通过GCN进行图数据处理,既能够学习节点表示,又能够学习节点与节点之间的关联关系,能够有效地完成针对不规则结构的关系图的图数据处理任务,例如,节点分类任务,等等。
在经典网络GCN中,一个卷积层(GCNConv)相当于对一阶邻居节点信息进行特征聚合。若基于GCN构建的图数据处理模型的网络结构过深,则易导致过平滑(Over-Smooth)现象。网络结构过深可以是指图数据处理模型包括的卷积层的数量大于等于预设数量阈值。
每个卷积层可以看作是一个低通滤波器,每个卷积层可以使经过其中的信号变得更加平滑,若依次连接的卷积层的数量大于预设数量阈值,可能会导致信号趋于一致,丧失了节点特征的多样性,降低了各个卷积层的特征提取效果,影响模型性能。
然而,在一些图数据处理过程中,使用依次连接的多个卷积层是必要的,例如,图分类任务。通过设置依次连接的多个卷积层,可以增大聚合的半径,从而获得更为完整的全图信息,有利于提高分类任务的准确性。
基于第i-1次训练所使用的图边训练信息生成第i次训练所使用的目标邻接矩阵,该生成的目标邻接矩阵可以反映第i次训练中关系图的图边权重,还可以用于在第i次训练时辅助对象分类模型中的各个卷积层进行节点特征提取,保持节点特征的多样性,避免信号趋向于一致,提高了各个卷积层的特征提取效果,有利于提高分类的准确性。
下面可以结合公式(1)具体说明如何生成第i次训练所使用的目标邻接矩阵,下述使用A’来表示目标邻接矩阵。
A'=softmax(A0*W0) (1)
在公式(1)中,*表示元素相乘,图边参数矩阵W0∈RV×V服从均匀分布,W0由多个待训练的图边参数构成,V表示关系图中的对象节点的个数,softmax函数,又名归一化指数函数,用于将多个神经元的输出,映射到(0,1)区间内。A0是构造的初始邻接矩阵,用0或1表示节点连接情况。
例如,
Figure BDA0003670268920000091
W0为一个2x2的矩阵,则待训练的图边参数的数量为4个,该4个图边参数分别为a1、a2、a3、a4。
初始邻接矩阵可以是基于关系图的多个对象节点之间的连接关系构建的。具体实施时,可以是在关系图中,若任意两个对象节点之间存在边,标记为1,若任意两个对象节点之间不存在边,标记为0,进而通过矩阵形式来反映各个对象节点之间的连接关系。
示例性地,关系图可以包括3个对象节点,分别为,对象节点1、对象节点2以及对象节点3,且,对象节点1分别与对象节点2和对象节点3连接,则可通过构造一个3x3的初始邻接矩阵A0来反映各个对象节点之间的连接关系,如下所示:
Figure BDA0003670268920000092
在A0中,从上到下三行分别对应于对象节点1、对象节点2以及对象节点3,从左到右三列分别对应于对象节点1、对象节点2以及对象节点3。
各个对象节点无法与自己连接,故第一行第一列、第二行第二列以及第三行第三列的元素默认为“0”。
第一行第二列的元素“1”表示对象节点1与对象节点2连接;第一行第三列的元素“1”表示对象节点1与对象节点3连接;第二行第一列的元素“1”表示对象节点2与对象节点1连接;第二行第三列的元素“0”表示对象节点2与对象节点3之间未连接;第三行第一列的元素“1”表示对象节点3与对象节点1连接;第三行第二列的元素“0”表示对象节点3与对象节点2未连接。
在对对象分类模型进行多次训练的过程中,每一次训练基于同一个图数据,因此,关系图的结构是固定不变的,进而,基于关系图的多个对象节点之间的连接关系构建的初始邻接矩阵A0的数值不变。
第i次训练所使用的图边参数的数值可以由第i-1次训练所使用的图边训练信息确定,进而,可以确定第i次训练所使用的图边参数矩阵W0的数值。在确定第i次训练所使用的图边参数矩阵W0的数值之后,可以将数值固定不变的初始邻接矩阵A0和第i次训练所使用的图边参数矩阵W0代入公式(1)。
首先,将初始邻接矩阵A0与第i次训练所使用的图边参数矩阵W0元素相乘,得到第一矩阵;其次,将元素相乘得到的第一矩阵输入softmax函数以进行映射处理,得到第i次训练所使用的目标邻接矩阵A’。
由于softmax函数可以将第一矩阵中的各个元素映射到(0,1)区间内,故该映射处理也可以视为一种归一化处理。
具体实施时,可以预存初始图边参数。初始图边参数的数值可以是在预设数值区间范围内的随机值,例如,位于[0,1]区间内的随机值。
图边参数调整规则可以配置为:在i=1时,读取该预存的初始图边参数,在i>1时,按照预设调整规则对第i-1次训练所使用的各个图边参数进行调整,得到第i次训练所使用的各个图边参数。
可选地,若i等于1,则第i-1次训练所使用的图边训练信息包括初始邻接矩阵和图边参数调整规则,根据第i-1次训练所使用的图边训练信息,生成第i次训练所使用的目标邻接矩阵,包括:从图边参数调整规则中读取初始图边参数;按照初始图边参数对初始邻接矩阵进行调整,将调整后的初始邻接矩阵作为第i次训练所使用的目标邻接矩阵。
若i等于1,实际上不存在第0次训练。具体实施时,可以预先设置,在i=1时,第i-1次训练所使用的图边训练信息包括初始邻接矩阵和图边参数调整规则。则按照预先配置的图边参数调整规则,在i=1时,读取预存的初始图边参数,以确定第1次训练所使用的图边参数矩阵W0的数值。
例如,图边参数矩阵
Figure BDA0003670268920000101
读取得到的预存的初始图边参数包括:a1=0.5,a2=0.5,a3=0.5,a4=0.5,则第1次训练所使用的图边参数矩阵
Figure BDA0003670268920000102
又第1次训练所使用的图边训练信息包括初始邻接矩阵A0
按照初始图边参数对初始邻接矩阵进行调整,将调整后的初始邻接矩阵作为第1次训练所使用的目标邻接矩阵,可以是,按照如初始图边参数所示的图边权重,对初始邻接矩阵所对应的关系图的图边权重进行调整,得到调整后的初始邻接矩阵,该调整后的初始邻接矩阵中各个元素可以反映关系图调整后的图边权重,将调整后的初始邻接矩阵确定为第1次训练所使用的目标邻接矩阵。
具体实施时,可以是,将由初始图边参数确定的第1次训练所使用的图边参数矩阵W0和初始邻接矩阵A0代入公式(1):对第1次训练所使用的图边参数矩阵W0和初始邻接矩阵A0进行元素相乘,计算得到第一矩阵,将第一矩阵输入softmax函数以进行映射处理,得到第1次训练所使用的目标邻接矩阵A’的数值。
可选地,若i大于1,则第i-1次训练所使用的图边训练信息包括初始邻接矩阵、待训练的图边参数以及图边参数调整规则,根据第i-1次训练所使用的图边训练信息,生成第i次训练所使用的目标邻接矩阵,包括:按照图边参数调整规则对待训练的图边参数进行调整,得到调整后的图边参数;按照调整后的图边参数对初始邻接矩阵进行调整,将调整后的初始邻接矩阵作为第i次训练所使用的目标邻接矩阵。
若i大于1,第i-1次训练所使用的图边训练信息可以包括初始邻接矩阵、待训练的图边参数以及图边参数调整规则。其中,待训练的图边参数可以是第i-1次训练所使用的图边参数。
具体地,若i=2,第i-1次训练为第1次训练,第1次训练所使用的图边参数为由初始图边参数确定的第1次训练所使用的图边参数矩阵
Figure BDA0003670268920000111
若i>2,则第i-1次训练可以是第2次训练、第3次训练……第x次训练等等(x为大于1的自然数),第i-1次训练所使用的图边参数为,在第i-1次训练时对第i-2次训练所使用的图边参数进行调整,得到的调整后的图边参数。
例如,第1次训练所使用的图边参数矩阵
Figure BDA0003670268920000112
在i=2时,第1次训练所使用的图边训练信息包括初始邻接矩阵、第1次训练所使用的图边参数矩阵
Figure BDA0003670268920000113
以及图边参数调整规则。
又例如,第2次训练中,按照图边参数调整规则对第1次训练所使用的图边参数矩阵
Figure BDA0003670268920000114
进行调整,得到调整后的图边参数矩阵
Figure BDA0003670268920000115
将该调整后的图边参数矩阵确定为第2次训练所使用的图边参数矩阵。进而,第3次训练中按照图边参数调整规则对第2次训练所使用的图边参数矩阵
Figure BDA0003670268920000116
进行调整,得到调整后的图边参数矩阵
Figure BDA0003670268920000117
将该调整后的图边参数矩阵确定为第3次训练所使用的图边参数矩阵,等等。
图边参数调整规则可以包括预设调整规则。示例性地,预设调整规则可以是,通过对第i-1次训练所使用的图边参数增减预设数值,计算得到第i次训练所使用的图边参数,还可以是,基于对象分类模型的第i-1次训练对应的损失函数值,对第i-1次训练所使用的图边参数进行调整,确定第i次训练所使用的图边参数。
在i大于1时,按照图边参数调整规则对待训练的图边参数进行调整,得到调整后的图边参数,可以是,按照预设调整规则对第i-1次训练所使用的各个图边参数进行调整,得到第i次训练所使用的各个图边参数,以确定第i次训练所使用的图边参数矩阵W0
按照调整后的图边参数对初始邻接矩阵进行调整,将调整后的初始邻接矩阵作为第i次训练所使用的目标邻接矩阵,可以是,按照如调整后的图边参数所示的图边权重,对初始邻接矩阵所对应的关系图的图边权重进行调整,得到调整后的初始邻接矩阵,该调整后的初始邻接矩阵中各个元素可以反映关系图调整后的图边权重,将调整后的初始邻接矩阵确定为第i次训练所使用的目标邻接矩阵。
具体实施时,可以是,将第i次训练所使用的图边参数矩阵W0和初始邻接矩阵A0代入公式(1):对第i次训练所使用的图边参数矩阵W0和初始邻接矩阵A0进行元素相乘,计算得到第一矩阵,将第一矩阵输入softmax函数以进行映射处理,得到第i次训练所使用的目标邻接矩阵A’的数值。
步骤S106,将目标邻接矩阵和节点特征输入至对象分类模型进行分类预测,得到第i次训练对应的第i次损失函数值以及第i次分类结果,并将第i次训练对应的训练损失函数值添加到训练参考信息集中,训练参考信息集中存储多次训练中每次训练对应的损失函数值以及分类结果。
在第i次训练时,将第i次训练所使用的目标邻接矩阵A’和图数据中的节点特征输入至对象分类模型进行分类预测,得到第i次训练对应的第i次损失函数值以及第i次分类结果。
由于用于训练对象分类模型的图数据为同一图数据,则每次训练中输入对象分类模型的节点特征是固定不变的,而目标邻接矩阵A’会不断变化。
每个标签节点的分类预测标签与标签节点携带的分类标签可能相同,也可能不同。每个无标签节点未携带分类标签。
第i次分类结果包括关系图中的各个标签节点的分类预测标签以及各个无标签节点的分类预测标签,例如,标签节点1携带的实际标签为x1,对应的分类预测标签为x1,标签节点2携带的实际标签为x2,对应的分类预测标签为x3;无标签节点1的分类预测标签为x1,无标签节点2的分类预测标签为x2,无标签节点3的分类预测标签为x3,等等。
具体地,例如,待分类对象为某个创作App的文章页面,每个文章页面配置有点赞控件,则标签节点携带有用于表征用户曾经对对应文章页面进行过点赞的x1标签,或者,用于表征用户没有对对应文章页面进行过点赞的x2标签,各个无标签节点的分类结果可能是x1标签,也可以是x2标签,还可能是其他预设标签。
若无标签节点的分类结果为x1标签,表示对象分类模型对用户是否会对对应文章页面点赞的预测结果为是,进而可推出用户可能会对该文章页面感兴趣,据此可以进行文章推送;若无标签节点的分类结果为x2标签,表示对象分类模型对用户是否会对对应文章页面点赞的预测结果为否,进而可推出用户对该文章页面感兴趣的可能性很小,无需将对应文章推送给用户。
在第i次训练之后,可以将第i次训练对应的损失函数值以及分类结果添加到训练参考信息集中。
可选地,对象分类模型包括多个依次连接的卷积层,将目标邻接矩阵和节点特征输入至对象分类模型进行分类预测,得到第i次训练对应的第i次损失函数值以及第i次分类结果,包括:将目标邻接矩阵和节点特征依次输入至各个卷积层,以基于各个卷积层的卷积参数依次进行卷积运算,得到第i次训练对应的第i次损失函数值以及确定第i次分类结果。
对象分类模型所包括的卷积层的数量可以大于等于预设数量阈值。应当理解的,使用更多的卷积层对关系图进行处理,可以不断的增大聚合的半径,从而能够获取更为完整的全图信息,进而提高对象分类的准确性。
各个卷积层的卷积参数为待训练的参数,第i次训练所使用的各个卷积层的卷积参数可以在第i-1次训练对应的第i-1次损失函数值的驱动下调整,即根据第i-1次损失函数值可以确定第i次训练所使用的各个卷积层的卷积参数的调整方向和调整数值。
在第i次训练过程中,将第i次训练所使用的目标邻接矩阵A’和节点特征输入依次输入至各个卷积层,以基于第i次训练所使用的各个卷积层的卷积参数依次进行卷积运算,得到第i次训练对应的第i次损失函数值以及确定第i次分类结果。
可选地,至少一个中间卷积层包括第一中间卷积层和第二中间卷积层;确定第i次分类结果,包括:利用初始卷积层,基于初始卷积层的卷积参数对目标邻接矩阵和节点特征进行卷积运算,得到初始卷积层的输出结果;通过第一中间卷积层基于第一中间卷积层的卷积参数对目标邻接矩阵和初始卷积层的输出结果进行卷积运算,得到第一中间向量;对初始卷积层的输出结果和第一中间向量进行残差计算处理,得到第一中间卷积层的输出结果;利用第二中间卷积层基于第二中间卷积层的卷积参数对目标邻接矩阵和第一中间卷积层的输出结果进行卷积运算,得到第二中间向量;对第一中间卷积层的输出结果和第二中间向量进行残差计算处理,得到第二中间卷积层的输出结果;通过末尾卷积层基于末尾卷积层的卷积参数对目标邻接矩阵和第二中间卷积层的输出结果进行卷积运算,得到第i次分类结果。
下文可结合图3共同说明对象分类模型如何确定第i次分类结果。图3为本申请实施例提供的一种对象分类模型的网络架构示意图。
如图3所示,对象分类模型包括依次连接的初始卷积层302、中间卷积层1(即图3中的中间卷积层304)……中间卷积层n(即图3中的中间卷积层306)以及末尾卷积层308。n可以为大于等于1的自然数。省略号用于表示未画出的多个卷积层。
在n=1的情况下,至少一个中间卷积层仅包括中间卷积层1,即,初始卷积层302、中间卷积层1以及末尾卷积层308依次连接。
在n=2的情况下,至少一个中间卷积层包括中间卷积层1和中间卷积层2,即,初始卷积层302、中间卷积层1、中间卷积层2以及末尾卷积层308依次连接。
在n>2的情况下,至少一个中间卷积层包括中间卷积层1和中间卷积层2……中间卷积层n以及末尾卷积层308,即,初始卷积层302、中间卷积层1、中间卷积层2……中间卷积层n以及末尾卷积层308依次连接。
如图3所示,该对象分类模型的输入值为进行图边权重初始化后的图数据,图边权重初始化,指的是通过前述步骤S104生成第i次训练所使用的目标邻接矩阵,则进行图边权重初始化后的图数据,可以包括图数据中的节点特征和第i次训练所使用的目标邻接矩阵。该对象分类模型的输出值为第i次训练对应的分类结果。图3右边的虚线框中的内容用于放大展示左边的虚线框中的内容,可以视为用于放大展示一部分中间卷积层。
在图3右边的虚线框中,
Figure BDA0003670268920000151
用于表示残差计算处理,如图3所示,对中间卷积层1的输入值和输出值进行残差计算处理,以及,对中间卷积层2的输入值和输出值进行残差计算处理。关于规范化和残差计算处理,将在下文中分别结合公式具体陈述,此处不再赘述。
利用初始卷积层,基于初始卷积层的卷积参数对目标邻接矩阵和节点特征进行卷积运算,得到初始卷积层的输出结果。具体实施时,可以是,将节点特征、目标邻接矩阵以及初始卷积层的卷积层参数矩阵依次相乘,计算得到第一乘积;将第一乘积输入初始卷积层的激活函数进行激活处理,生成初始卷积层的输出结果。
下面可以结合公式(2)-(4),具体说明初始卷积层的卷积计算过程。
Z(l+1)=GCN(A,X(l))=σ(AX(l)W(l+1)) (2)
Figure BDA0003670268920000152
上述的公式(2)为卷积层的通用计算公式。在l大于0的请下,X(l)用于表示第l层的输出结果;在l等于0的情况下,X(0)用于表示初始输入值,该初始输入值由对象分类模型的输入值确定。l表示层数,例如,初始卷积层的层数l=1,第一中间卷积层的层数l=2,第二中间卷积层的层数l=3,末尾卷积层的层数1=4。σ为激活函数。A∈RV×V表示归一化后的邻接矩阵。W∈RC×F是卷积层参数矩阵,用于表示待训练的卷积参数,W可以用于对X进行仿射变换,X∈RV×C为卷积层的输入向量,Z∈RV×F为卷积层的输出向量。V表示关系图中的对象节点的个数,C表示输入维度,F表示输出维度。输入维度C可以由图数据中各个对象节点的节点特征确定。
上述的归一化的邻接矩阵,可以是,通过归一化处理,将邻接矩阵中的每个元素转换为0到1之间的一个数值。
上述的公式(3)为初始卷积层的计算公式,可以视为对公式(2)的一种具体应用,具体地,将层数l设置为0,初始输入值X(0)为图数据中各个对象节点的节点特征。初始卷积层的输入值包括目标邻接矩阵A’和初始输入值X(0)
结合公式(2)和公式(3)可推知:
Figure BDA0003670268920000161
该公式(4)中,
Figure BDA0003670268920000162
是初始卷积层的输出结果,A’是前述的目标邻接矩阵,X(0)是由图数据中每个对象节点的节点特征构成的初始节点特征矩阵,W(1)是初始卷积层的卷积层参数矩阵,σ为初始卷积层的激活函数。
基于公式(4),将节点特征与目标邻接矩阵A’输入初始卷积层的激活函数,以基于第一乘积进行激活处理,输出初始卷积层的输出结果。第一乘积由节点特征与目标邻接矩阵A’以及初始卷积层的卷积层参数矩阵依次相乘计算得到。
通过第一中间卷积层基于第一中间卷积层的卷积参数对目标邻接矩阵和初始卷积层的输出结果进行卷积运算,得到第一中间向量;对初始卷积层的输出结果和第一中间向量进行残差计算处理,得到第一中间卷积层的输出结果。具体实施时,可以是,将初始卷积层的输出结果、目标邻接矩阵以及第一中间卷积层的卷积层参数矩阵依次相乘,计算得到第二乘积;将第二乘积输入第一中间卷积层的激活函数进行激活处理,生成激活后的第二乘积,将激活后的第二乘积确定为第一中间向量;对初始卷积层的输出结果和第一中间向量进行残差计算处理,得到第一中间卷积层的输出结果。
通过第一中间卷积层基于第一中间卷积层的卷积参数对目标邻接矩阵和初始卷积层的输出结果进行卷积运算的计算过程与初始卷积层卷积运算的计算过程类似,可参照前述的公式(4),区别点仅仅在于,初始卷积层的输入值包括节点特征和目标邻接矩阵,而第一中间卷积层的输入值包括初始卷积层的输出结果和目标邻接矩阵。残差处理计算过程在后文中结合公式具体说明,此处不再赘述。
利用第二中间卷积层基于第二中间卷积层的卷积参数对目标邻接矩阵和第一中间卷积层的输出结果进行卷积运算,得到第二中间向量;对第一中间卷积层的输出结果和第二中间向量进行残差计算处理,得到第二中间卷积层的输出结果。具体实施时,可以是,将第一中间卷积层的输出结果、目标邻接矩阵以及第二中间卷积层的卷积层参数矩阵依次相乘,计算得到第三乘积;将第三乘积输入第二中间卷积层的激活函数进行激活处理,生成激活后的第三乘积,将激活后的第三乘积确定为第二中间向量;对第一中间卷积层的输出结果和第二中间向量进行残差计算处理,得到第二中间卷积层的输出结果。
利用第二中间卷积层基于第二中间卷积层的卷积参数对目标邻接矩阵和第一中间卷积层的输出结果进行卷积运算的计算过程与初始卷积层卷积运算的计算过程类似,可参照前述的公式(4),区别点仅仅在于,初始卷积层的输入值包括节点特征和目标邻接矩阵,而第二中间卷积层的输入值包括第一中间卷积层的输出结果和目标邻接矩阵。
通过末尾卷积层基于末尾卷积层的卷积参数对目标邻接矩阵和第二中间卷积层的输出结果进行卷积运算,得到第i次分类结果。具体实施时,可以是,将第二中间卷积层的输出结果、目标邻接矩阵以及末尾卷积层的卷积层参数矩阵依次相乘,计算得到末尾乘积;将末尾乘积输入末尾卷积层的激活函数进行激活处理,生成末尾卷积层的输出结果,将末尾卷积层的输出结果确定为第i次分类结果。
下面可以结合公式(5)和公式(6),具体说明初始卷积层的卷积计算过程。
Figure BDA0003670268920000171
其中,A’为目标邻接矩阵,H(l+1)用于表示与末尾卷积层连接且位于末尾卷积层之前的中间卷积层,例如,第二中间卷积层,
Figure BDA0003670268920000172
表示分类结果,即末尾卷积层的输出结果,E表示分类结果对应的类别个数,V表示关系图中的对象节点的个数。
在l+1=3的情况下,结合公式(2)可推知:
Figure BDA0003670268920000173
其中,A′为目标邻接矩阵,H(3)为第二中间卷积层的输出结果,W(4)为末尾卷积层的卷积层参数矩阵,σ为末尾卷积层的激活函数,
Figure BDA0003670268920000174
为末尾卷积层的输出结果,末尾卷积层的层数l=4。
基于公式(6),将第二中间卷积层的输出结果H(3)与目标邻接矩阵A’输入末尾卷积层的激活函数,以基于末尾乘积进行激活处理,输出末尾卷积层的输出结果。末尾乘积由第二中间卷积层的输出结果H(3)与目标邻接矩阵A’以及初始卷积层的卷积层参数矩阵W(4)依次相乘计算得到。可选地,对初始卷积层的输出结果和第一中间向量进行残差计算处理,得到第一中间卷积层的输出结果,包括:对预设数值与预设的第一调节系数求差,计算得到第二调节系数;将第一中间向量与第二调节系数求乘积,计算得到第一子乘积;将初始卷积层的输出结果与第一调节系数求乘积,计算得到第二子乘积;对第一子乘积和第二子乘积求和,计算得到第一中间卷积层的输出结果。
下面可以结合公式(7)和公式(8),具体说明残差处理计算过程。
H(l+1)=(1-α)*GCN(A′,H(l))+αH(l) (7)
公式(7)中,H(l+1)用于表示第l+1个卷积层的输出结果,该第l+1个卷积层为中间卷积层,满足l+1大于1。例如,第一中间卷积层的层数(l+1)=2,则该第一中间卷积层的输出结果可用H(2)表示。α为第一调节系数,A′为目标邻接矩阵,H(l)用于表示第l个卷积层的输出结果,该第l个卷积层可能是初始卷积层,也可能是任意一个中间卷积层,满足l大于0。
示例性地,第一调节系数α的数值可以设置为0.1。
通过公式(5)可以对第l+1个卷积层的卷积结果进行残差计算,从而保证该第1+1个卷积层的输出结果不出现大幅度变化,提高了对象分类模型的稳定性。
示例性地,第一中间卷积层的层数(l+1)=2,α=0.1,结合公式(2),可推知:
H(2)=(1-α)*GCN(A′,H(1))+αH(1)=(1-α)*σ(A′H(1)W(2))+αH(1)
=0.9*σ(A′H(1)W(2))+0.1H(1) (8)
其中,H(1)为初始卷积层的输出结果,H(2)为第一中间卷积层的输出结果,A’为目标邻接矩阵,W(2)为第一中间卷积层的卷积层参数矩阵,σ为第一中间卷积层的激活函数。
将初始卷积层的输出结果H(1)、目标邻接矩阵A’以及第一中间卷积层的卷积层参数矩阵W(2)依次相乘,计算得到第二乘积A′H(1)W(2);将第二乘积A′H(1)W(2)输入第一中间卷积层的激活函数σ进行激活处理,生成激活后的第二乘积σ(A′H(1)W(2)),将激活后的第二乘积σ(A′H(1)W(2))确定为第一中间向量。
对预设数值“1”与预设的第一调节系数“0.1”求差,计算得到第二调节系数“0.9”;将第一中间向量σ(A′H(1)W(2))与第二调节系数“0.9”求乘积,计算得到第一子乘积0.9*σ(A′H(1)W(2));将初始卷积层的输出结果H(1)与第一调节系数“0.1”求乘积,计算得到第二子乘积0.1H(1);对第一子乘积0.9*σ(A′H(1)W(2))和第二子乘积0.1H(1)求和,计算得到第一中间卷积层的输出结果H(2)。步骤“对第一中间卷积层的输出结果和第二中间向量进行残差计算处理,得到第二中间卷积层的输出结果”与步骤“对初始卷积层的输出结果和第一中间向量进行残差计算处理,得到第一中间卷积层的输出结果”的计算过程类似,此处不再赘述。
可选地,多个依次连接的卷积层包括依次连接的初始卷积层、至少一个中间卷积层以及末尾卷积层;在后一个卷积层的输入为在前一个卷积层的输出;将目标邻接矩阵和节点特征输入至对象分类模型进行分类预测,得到第i次训练对应的第i次损失函数值,包括:对每个中间卷积层的输出结果进行规范化约束处理,得到规范化损失函数;根据末尾卷积层的输出结果中每个标签节点的分类预测结果以及对应的分类标签,计算得到节点分类的分类损失函数;计算对象分类模型中由各个待训练参数形成的待训练参数矩阵的二范数,将二范数确定为惩罚项;待训练参数包括图边参数和卷积参数;根据多个预设的损失函数调节参数、节点分类的分类损失函数、规范化损失函数以及惩罚项,计算得到第i次损失函数值。
以至少一个中间卷积层包括第一中间卷积层和第二中间卷积层为例,示例性地说明在后一个卷积层的输入为在前一个卷积层的输出:初始卷积层的输出为第一中间卷积层的输入;第一中间卷积层的输出为第二中间卷积层的输入;第二中间卷积层的输出为末尾卷积层的输入。
对每个中间卷积层的输出结果进行规范化约束处理,得到规范化损失函数,下面可以结合公式(9)和公式(10)共同说明。
Figure BDA0003670268920000191
LNormal=tr(DM(B)-DM(A′))=I(B,A′) (10)
在公式(9)和公式(10)中,Sigmoid为激活函数,B∈RV×V为对中间卷积层的输出结果H(l+1)重构得到的邻接矩阵,重构的邻接矩阵B可以用于表示一个重构图,该重构图的图边权重为两个对象节点之间存在边的概率,DM函数用于计算目标邻接矩阵A’或者重构的邻接矩阵B对应的度矩阵,tr函数用于计算矩阵对角线元素之和。LNormal为规范化损失函数,LNormal用于度量根据每一个中间卷积层的输出结果对关系图进行重构之后是否出现较大的变化,该规范化损失函数的数值越小越好。I函数可以是一种为了简化公式而自定义的用于计算邻接矩阵重建误差的函数。
此处的规范化约束处理与图3中的规范化为同一概念。
根据末尾卷积层的输出结果中每个标签节点的分类预测结果以及对应的分类标签,计算得到节点分类的分类损失函数。
计算对象分类模型中由各个待训练参数形成的待训练参数矩阵的二范数,将二范数确定为惩罚项;待训练参数包括图边参数和卷积参数。
根据多个预设的损失函数调节参数、节点分类的分类损失函数、规范化损失函数以及惩罚项,计算得到第i次损失函数值,具体实施时,可以是,多个预设的损失函数调节参数可以包括第一损失函数调节参数和第二损失函数调节参数。具体实施时,将第一损失函数调节参数与规范化损失函数求乘积,计算得到第一损失函数;将第二损失函数调节参数与惩罚项求乘积,计算得到第二损失函数;对节点分类的损失函数、第一损失函数以及第二损失函数求和,计算得到第i次损失函数值。
接下来可以结合公式,具体说明如何根据多个预设的损失函数调节参数、节点分类的分类损失函数、规范化损失函数以及惩罚项,计算得到第i次损失函数值。
Figure BDA0003670268920000201
式中,β和λ为预先设置的损失函数调节参数。LGCN为节点分类的损失函数,
Figure BDA0003670268920000202
为分类预测结果,即末尾卷积层的输出结果,Y为实际分类结果,LNormal为规范化损失函数,Lreg为惩罚项,J为交叉熵函数,θ用于表示模型训练中的所有待训练的参数,例如,图边参数和各个卷积层的卷积参数。||θ||2可以理解为,求模型训练中的所有待训练的参数的2范数。
基于公式(11),将第一损失函数调节参数β与规范化损失函数I(B,A)求乘积,计算得到第一损失函数βI(B,A);将第二损失函数调节参数λ与惩罚项||θ||2求乘积,计算得到第二损失函数λ||θ||2;对节点分类的损失函数
Figure BDA0003670268920000203
第一损失函数βI(B,A)以及第二损失函数λ||θ||2求和,计算得到第i次损失函数任
Figure BDA0003670268920000204
通过设置惩罚项,可以实现对象分类模型的L2正则化,降低模型复杂度,防止对象分类模型被过度训练,避免出现过拟合的情况。
与传统的图神经网络模型的损失函数相比,本发明通过对每一个中间卷积层的输出结果进行规范化约束处理,以获得规范化损失函数,将规范化损失函数引入对象分类模型的损失函数中,能够起到约束模型训练的作用,使重构图不出现较大程度的变化,从而提升了对象分类模型的稳定性。
步骤S108,若第i次训练满足训练结束条件,则从训练参考信息集中确定满足训练要求的第j次训练损失函数值,并将第j次分类结果确定为待分类对象的目标分类。
训练结束条件可以配置为,在i大于预设训练次数时停止训练。训练要求可以配置为,将训练参考信息集中数值最小的损失函数值确定为满足训练要求的损失函数值。以预设训练次数为M为例,M为大于0的自然数,对本申请实施例提供的对象分类模型进行说明。本申请实施例提供的对象分类模型,针对一个同时包括标签节点和无标签节点的图数据,进行M次模型训练,且模型训练与模型测试同时进行,获得M个损失函数值和M个分类结果,在M个损失函数值中,假设第j次训练的损失函数值数值最小,则将第j次分类结果确定为待分类对象的目标分类。目标分类可以是执行M次训练中预测效果最准确的分类结果。
例如,在经过200次训练后,得到了200个分类结果和200个损失函数值,该200个分类结果和200个损失函数值均写入训练参考信息集中。从200个损失函数值中确定该200次训练中损失函数值最低的一个为第80次训练的损失函数值,则将第80次训练的分类结果确定为预测效果最准确的目标分类。
具体地,例如,待分类对象的图数据包括关系图甲,该关系图甲由100个对象节点以及多个边构成,100个对象节点包括30个标签节点以及70个无标签节点。每一次训练将关系图甲输入对象分类模型,输出对应的分类结果以及损失函数值并写入训练参考信息集中。将该关系图甲输入对象分类模型200次,可得到200个对象分类结果以及200个损失函数值。在200个损失函数值中选取数值最小的损失函数值,即最小损失函数值,例如,第121次训练得到的损失函数值为最小损失函数值,则将该第121次训练得到的分类结果确定为待分类对象的目标分类。该目标分类包括100个对象节点的分类结果,其中,70个无标签节点的对象分类结果对应的实际分类结果是未知的,目标分类针对该70个无标签节点进行分类结果的预测,可用于表示每个无标签节点在多种预设的分类结果中任意一种分类结果的预测概率。
需要注意的是,本申请实施例提供的对象分类模型不是先通过200次训练得到一个成熟的模型,再利用该成熟的模型对任意一个图数据进行测试。即便找到了对一个图数据的预测效果准确性最高的对象分类模型,该对象分类模型也无法用于对一个新的图数据进行分类预测,如果想要对一个新的图数据进行预测,必须再对该新的图数据训练预设数量次。
可选地,将第j次分类结果确定为待分类对象的目标分类之后,还包括:根据目标分类,在每个商品节点中确定用户的兴趣节点;基于兴趣节点,向用户进行商品推荐。
需要注意的是,在构建基于每个商品节点的商品类别之间的相似度构建商品的关系图的过程中,由于商品与商品之间具有稀疏性,常常需要多个卷积层来聚合远处的节点特征。该多个卷积层的数量可以大于等于预设数量阈值。预设数量阈值的定义如前文所述,此处不再赘述。
下面可以结合图4示例性说明商品分类场景下如何应用对象分类模型。图4为本申请实施例提供的商品分类场景下对象分类模型的应用示意图。
如图4所示,关系图包括七个对象节点,每个对象节点分别对应于一种商品。其中,商品401为购买过的商品,与商品402之间存在预设关联关系,二者对应的对象节点之间存在一条边。商品402与商品403之间存在预设关联关系,二者对应的对象节点之间存在一条边。商品401与商品404之间存在预设关联关系,二者对应的对象节点之间存在一条边。商品404与商品405之间存在预设关联关系,二者对应的对象节点之间存在一条边。商品405与商品406之间存在预设关联关系,二者对应的对象节点之间存在一条边。商品405与商品407之间存在预设关联关系,二者对应的对象节点之间存在一条边。以及,商品403、商品404以及商品407为需要判断用户是否存在购买意愿的待预测商品,图4中对该商品403、商品404以及商品407标注有“是否购买”。
则该关系图中,商品节点中的标签节点可以对应于购买过的商品,无标签节点可以对应于用户的购物意愿未知的商品。关系图中,标签节点与无标签节点之间的距离越短,可以反映出用户的购物意愿较高,标签节点与无标签节点之间的距离越长,可以反映出用户的购物意愿较低。
在关系图中,商品404与商品401之间仅需要1层网络连接,可以反映出用户的购物意愿高,即用户的购买概率高;商品403与商品401之间需要2层网络连接,可以反映出用户的购物意愿中等,即用户的购买概率中;商品407与商品401之间需要3层网络连接,可以反映出用户的购物意愿低,即用户的购物概率低。网络的层数用于表征两个商品节点之间的距离,例如,若两个商品节点之间通过一条边直接连接,则该两个商品节点之间通过1层网络连接;若两个商品节点并未直接通过一条边连接,而是通过一个中间商品节点和两条边间接连接,则该两个商品节点之间通过2层网络连接。
将关系图输入本申请实施例所提供的一种对象分类模型,进行预设数量次训练,得到目标分类,以生成标注有目标分类的目标关系图。目标分类包括:商品403的购买概率中,商品404的购买概率高,商品407的购买概率低。
在商品分类的场景中,采用本申请实施例所提供的对象分类方法进行商品分类,可以缓解包括多个卷积层的商品分类模型中易出现的过平滑的问题,提高利用商品的关系图进行商品分类的准确性。下面以待分类对象为商品为例,说明本对象分类方法在商品分类场景中的应用。
首先,可以根据商品类别的相似度,构造由多个商品节点与边构成的初始图,该初始图可以通过初始邻接矩阵A0表示。商品节点的节点特征表示为X0,该节点特征X0可以是商品的重量、品牌、价位、售出量等。一部分商品节点对应的商品携带有用于表示用户已购买该商品的类别标签,另一部分商品节点对应的商品携带有用于表示用户未购买该商品的类别标签,还有一部分商品节点未携带任何标签。
将该初始图的图数据输入前述的对象分类模型中,通过训练预设数量次对象分类模型,一边训练一边测试,得到目标分类,将该目标分类作为商品节点的对应商品的购买概率的预测结果,该预测结果针对未携带任何标签的商品节点。
进一步地,在获得预测结果之后,可以根据商品的购买概率的预测结果,对用户进行商品推荐。
具体地,可以先根据目标分类,在每个商品节点中,将预测结果对应于购买类别的商品节点确定用户的兴趣节点,再向用户推荐兴趣节点的对应商品。
上述的商品分类场景中,假设不考虑商品节点的节点特征的影响,仅仅考虑了商品节点的相邻关系,具有标签的商品节点通过对象分类模型的多层卷积计算来传递节点信息。一层卷积只传递直接相邻的节点信息,本发明的对象分类模型可以通过多层网络来聚合远端的邻接节点特征。在对该对象分类模型进行多次模型训练后,该对象分类模型能够为未知类别的商品节点直接预测出商品的购买概率,降低了对标签的依赖,从而,在需要通过多层网络聚合远处的节点特征,以及,标签数量较少的场景中,可以取得准确性较高的分类预测结果。
对象分类模型还可以用于其他对象分类任务相关的场景中,例如,基于用户兴趣的文章推送、黑白名单的构建,等等,此处不再赘述。
下面可以通过多个数据集来验证本发明实施例所提供的对象分类模型的有效性。多个数据集包括且不限于:公开数据集Cora、Citeseer、Pubmed。前述各个公开数据集是经典的文章引用网络数据集。具体的实验结果参照表1。
表1示出了多种不同的模型根据引用关系预测文章的类别的预测准确度。其中,表1中共列出了11种模型,分别为:ManiReg(manifold regularization,流形正则化)模型,SemiEmb(Semi-supervised embedding,半监督嵌入)模型,LP(Linear Programming,线性规划)模型,DeepWalk(图游走类算法)模型,ICA(Independent Component Analysis,独立成分分析)模型,Planetoid(小行星)模型,Chebyshev(切比雪夫)模型,GCN,PPNP(Personalized Propagation of Neural Predictions,神经预测的个性化传播)模型以及本申请实施例所提供的一种对象分类模型。
模型 数据集1 数据集2 数据集3
ManiReg 59.5 60.1 70.7
SemiEmb 59.0 59.6 71.7
LP 68.0 45.3 63.0
DeepWalk 67.2 43.2 65.3
ICA 75.1 69.1 73.9
Planetoid 75.7 64.7 77.2
Chebyshev 81.2 69.8 74.4
GCN 81.5 70.3 79.0
PPNP 85.09±0.25 75.73±0.30 79.73±0.31
对象分类模型 88.35±0.40 75.34±0.53 85.82±0.15
表1
如表1所示,将数据集1中的数据输入ManiReg模型,根据引用关系对文章的类别进行预测处理,得到第m次预测对应的第m个类别预测结果,基于第m个类别预测结果确定第m次预测的准确度,m大于0且m小于等于100。进而,在通过ManiReg模型对数据集1中的数据进行100次预测之后,将100次预测的准确度求平均值,得到ManiReg模型的第一准确度59.5,该第一准确度用于表征ManiReg模型对数据集1的预测准确性效果。同理,在通过ManiReg模型对数据集2中的数据进行100次预测之后,得到ManiReg模型的第二准确度60.1,该第二准确度用于表征ManiReg模型对数据集2的预测准确性效果;在通过ManiReg模型对数据集3中的数据进行100次预测之后,得到ManiReg模型的第三准确度70.7,该第三准确度用于表征ManiReg模型对数据集3的预测准确性效果。
数据集1、数据集2以及数据集3可以是数据不同的数据集。示例性地,数据集1可以是公开数据集Cora,数据集2可以是公开数据集Citeseer,数据集3可以是公开数据集Pubmed。
下面示例性地介绍其中几种模型的准确度,其他模型的准确度具体如表1所示,不再一一列举。
与ManiReg模型同理,GCN模型的第一准确度为81.5,该第一准确度用于表征GCN模型对数据集1的预测准确性效果;GCN模型的第二准确度为70.3,该第二准确度用于表征GCN模型对数据集2的预测准确性效果;GCN模型的第三准确度为79.0,该第三准确度用于表征GCN模型对数据集3的预测准确性效果。
与ManiReg模型同理,PPNP模型的第一准确度为85.09±0.25,该第一准确度用于表征PPNP模型对数据集1的预测准确性效果,PPNP模型的第二准确度为75.73±0.30,该第二准确度用于表征PPNP模型对数据集2的预测准确性效果,PPNP模型的第三准确度为79.73±0.31,该第三准确度用于表征PPNP模型对数据集3的预测准确性效果。
其中,“85.09±0.25”用于表示PPNP模型的第一准确度的取值范围在84.84与85.34之间,其他包括“±”的数值与“85.09±0.25”类似,下文不再赘述。
与ManiReg模型同理,本申请实施例所提供的对象分类模型的第一准确度为88.35±0.40,该第一准确度用于表征对象分类模型对数据集1的预测准确性效果,对象分类模型的第二准确度为75.34±0.53,该第二准确度用于表征对象分类模型对数据集2的预测准确性效果,对象分类模型的第三准确度为85.82±0.15,该第三准确度用于表征对象分类模型对数据集3的预测准确性效果。
对比可知,本申请实施例所提供的对象分类模型的第一准确度、第二准确度以及第三准确度均大于GCN模型,且对象分类模型的第一准确度与第三准确度均大于PPNP模型,对象分类模型的第二准确度与PPNP模型的第二准确度的数值接近。以此,通过上述数据可以验证本申请实施例所提供的对象分类模型具有预测准确性较高的优点。
在如图1所示的实施例中,在需要对待分类对象进行分类时,首先要获取待分类对象的图数据;该图数据包括由多个对象节点和多个边构成的待分类对象的关系图,以及每个对象节点的节点特征;进一步的,根据第i-1次训练所使用的图边训练信息,生成第i次训练所使用的目标邻接矩阵;图边训练信息包括如下任意一个或多个:初始邻接矩阵、待训练的图边参数以及图边参数调整规则;i为大于或等于1的整数;初始邻接矩阵是基于关系图的多个对象节点之间的连接关系构建;将目标邻接矩阵和节点特征输入至对象分类模型进行分类预测,得到第i次训练对应的第i次损失函数值以及第i次分类结果,并将第i次训练对应的训练损失函数值添加到训练参考信息集中,训练参考信息集中存储多次训练中每次训练对应的损失函数值以及分类结果;若第i次训练满足训练结束条件,则从训练参考信息集中确定满足训练要求的第j次训练损失函数值,并将第j次分类结果确定为待分类对象的目标分类。以此,基于获取的待分类对象的图数据对对象分类模型进行多次训练,其中,第i次训练所使用的可反映关系图的图边权重的目标邻接矩阵根据第i-1次训练所使用的图边训练信息生成,从而在不改变关系图结构的情况下,通过训练调整关系图中各个边的权重,优化了用于在对象分类过程中辅助节点特征提取的目标邻接矩阵,进而优化了对象分类模型对关系图的特征提取效果,提高了利用图数据进行对象分类的准确性。
图5为本申请实施例提供的一种对象分类模型的应用示意图。图5示出了一个示例性的关系图,并示出了基于该关系图,通过对象分类模型对多种火腿产品进行分类,以得到标注有火腿产品的目标分类的目标关系图。如图5所示,关系图包括六个对象节点,每个对象节点分别对应于一种火腿产品。其中,甲火腿肠501和甲火腿502之间存在预设关联关系,二者对应的对象节点之间存在一条边。甲火腿502与乙火腿503之间存在预设关联关系,二者对应的对象节点之间存在一条边。甲火腿肠501与丙火腿肠504之间存在预设关联关系,二者对应的对象节点之间存在一条边。丙火腿肠504与丁火腿肠505之间存在预设关联关系,二者对应的对象节点之间存在一条边。丁火腿肠505与戊火腿肠506之间存在预设关联关系,二者对应的对象节点之间存在一条边。以及,甲火腿肠501的分类标签为香肠,乙火腿503的分类标签为火腿,其他各个对象节点的分类标签未知。
将上述关系图输入本申请实施例所提供的一种对象分类模型,进行预设数量次训练,得到目标分类,以生成标注有目标分类的目标关系图。目标分类包括:甲火腿502的分类标签为火腿,丙火腿肠504的分类标签为香肠,丁火腿肠505的分类标签为香肠,戊火腿肠506的分类标签为香肠。
由于图5的实施例的技术构思与前述对象分类方法实施例的技术构思相同,描述得比较简单,相关的部分请参照前述对象分类方法实施例的对应说明即可。
本说明书提供的一种对象分类装置实施例如下:
在上述的实施例中,提供了一种对象分类方法,出于相同的技术构思,本申请实施例还提供了一种对象分类装置,下面结合附图进行说明。
图6为本申请实施例提供的一种对象分类装置示意图。本实施例提供一种对象分类装置,包括:
获取单元601,用于获取待分类对象的图数据;图数据包括由多个对象节点和多个边构成的待分类对象的关系图,以及每个对象的节点特征,一个对象节点对应一个待分类对象;
生成单元602,用于根据第i-1次训练所使用的图边训练信息,生成第i次训练所使用的目标邻接矩阵;图边训练信息包括如下任意一个或多个:初始邻接矩阵、待训练的图边参数以及图边参数调整规则;i为大于或等于1的整数;初始邻接矩阵是基于关系图的多个对象节点之间的连接关系构建;
预测单元603,用于将目标邻接矩阵和节点特征输入至对象分类模型进行分类预测,得到第i次训练对应的第i次损失函数值以及第i次分类结果,并将第i次训练对应的训练损失函数值添加到训练参考信息集中,训练参考信息集中存储多次训练中每次训练对应的损失函数值以及分类结果;
第一确定单元604,用于若第i次训练满足训练结束条件,则从训练参考信息集中确定满足训练要求的第j次训练损失函数值,并将第j次分类结果确定为待分类对象的目标分类。
可选地,对象分类模型包括多个依次连接的卷积层,预测单元603,具体用于:将目标邻接矩阵和节点特征依次输入至各个卷积层,以基于各个卷积层的卷积参数依次进行卷积运算,得到第i次训练对应的第i次损失函数值以及确定第i次分类结果。
可选地,若i等于1,则第i-1次训练所使用的图边训练信息包括初始邻接矩阵和图边参数调整规则,生成单元602,具体用于:从图边参数调整规则中读取初始图边参数;按照初始图边参数对初始邻接矩阵进行调整,将调整后的初始邻接矩阵作为第i次训练所使用的目标邻接矩阵。
可选地,若i大于1,则第i-1次训练所使用的图边训练信息包括初始邻接矩阵、待训练的图边参数以及图边参数调整规则,生成单元602,具体用于:按照图边参数调整规则对待训练的图边参数进行调整,得到调整后的图边参数;按照调整后的图边参数对初始邻接矩阵进行调整,将调整后的初始邻接矩阵作为第i次训练所使用的目标邻接矩阵。
可选地,多个依次连接的卷积层包括依次连接的初始卷积层、至少一个中间卷积层以及末尾卷积层;在后一个卷积层的输入为在前一个卷积层的输出;预测单元603,具体用于:对每个中间卷积层的输出结果进行规范化约束处理,得到规范化损失函数;根据末尾卷积层的输出结果中每个标签节点的分类预测结果以及对应的分类标签,计算得到节点分类的分类损失函数;计算对象分类模型中由各个待训练参数形成的待训练参数矩阵的二范数,将二范数确定为惩罚项;待训练参数包括图边参数和卷积参数;根据多个预设的损失函数调节参数、节点分类的分类损失函数、规范化损失函数以及惩罚项,计算得到第i次损失函数值。
可选地,至少一个中间卷积层包括第一中间卷积层和第二中间卷积层;预测单元603,包括:第一计算子单元,用于利用初始卷积层,基于初始卷积层的卷积参数对目标邻接矩阵和节点特征进行卷积运算,得到初始卷积层的输出结果;第二计算子单元,用于通过第一中间卷积层基于第一中间卷积层的卷积参数对目标邻接矩阵和初始卷积层的输出结果进行卷积运算,得到第一中间向量;第三计算子单元,用于对初始卷积层的输出结果和第一中间向量进行残差计算处理,得到第一中间卷积层的输出结果;第四计算子单元,用于利用第二中间卷积层基于第二中间卷积层的卷积参数对目标邻接矩阵和第一中间卷积层的输出结果进行卷积运算,得到第二中间向量;第五计算子单元,用于对第一中间卷积层的输出结果和第二中间向量进行残差计算处理,得到第二中间卷积层的输出结果;第六计算子单元,用于通过末尾卷积层基于末尾卷积层的卷积参数对目标邻接矩阵和第二中间卷积层的输出结果进行卷积运算,得到第i次分类结果。
可选地,第三计算子单元,具体用于:对预设数值与预设的第一调节系数求差,计算得到第二调节系数;将第一中间向量与第二调节系数求乘积,计算得到第一子乘积;将初始卷积层的输出结果与第一调节系数求乘积,计算得到第二子乘积;对第一子乘积和第二子乘积求和,计算得到第一中间卷积层的输出结果。
可选地,待分类对象包括商品;对象节点包括商品节点;对象节点的节点特征包括商品的重量、品牌、价格以及售出量中的至少一者;商品的关系图基于每个商品节点所属商品类别之间的相似度构建。
可选地,对象分类装置还包括:第二确定单元,用于根据目标分类,在每个商品节点中确定用户的兴趣节点;推荐单元,用于基于兴趣节点,向用户进行商品推荐。
基于本申请实施例所提供的对象分类装置包括获取单元、生成单元、预测单元以及第一确定单元,其中,获取单元,可用于获取待分类对象的图数据;图数据包括由多个对象节点和多个边构成的待分类对象的关系图,以及每个对象的节点特征,一个对象节点对应一个待分类对象;生成单元,可用于根据第i-1次训练所使用的图边训练信息,生成第i次训练所使用的目标邻接矩阵;图边训练信息包括如下任意一个或多个:初始邻接矩阵、待训练的图边参数以及图边参数调整规则;i为大于或等于1的整数;初始邻接矩阵是基于关系图的多个对象节点之间的连接关系构建;预测单元,可用于将目标邻接矩阵和节点特征输入至对象分类模型进行分类预测,得到第i次训练对应的第i次损失函数值以及第i次分类结果,并将第i次训练对应的训练损失函数值添加到训练参考信息集中,训练参考信息集中存储多次训练中每次训练对应的损失函数值以及分类结果;第一确定单元,可用于若第i次训练满足训练结束条件,则从训练参考信息集中确定满足训练要求的第j次训练损失函数值,并将第j次分类结果确定为待分类对象的目标分类。以此,基于获取单元获取的待分类对象的图数据,通过生成单元和预测单元,对对象分类模型进行多次训练,并通过第一确定单元获得目标分类,其中,第i次训练所使用的可反映关系图的图边权重的目标邻接矩阵根据第i-1次训练所使用的图边训练信息生成,从而在不改变关系图结构的情况下,通过训练调整关系图中各个边的权重,优化了用于在对象分类过程中辅助节点特征提取的目标邻接矩阵,进而优化了对象分类模型对关系图的特征提取效果,提高了利用图数据进行对象分类的准确性。
对应上述描述的一种对象分类方法,基于相同的技术构思,本申请实施例还提供一种电子设备,该电子设备用于执行上述提供的对象分类方法,图7为本申请实施例提供的一种电子设备的结构示意图。
如图7所示,电子设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器701和存储器702,存储器702中可以存储有一个或一个以上存储应用程序或数据。其中,存储器702可以是短暂存储或持久存储。存储在存储器702的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括电子设备中的一系列计算机可执行指令。更进一步地,处理器701可以设置为与存储器702通信,在电子设备上执行存储器702中的一系列计算机可执行指令。电子设备还可以包括一个或一个以上电源703,一个或一个以上有线或无线网络接口704,一个或一个以上输入/输出接口705,一个或一个以上键盘706等。
在一个具体的实施例中,电子设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对电子设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
获取待分类对象的图数据;图数据包括由多个对象节点和多个边构成的待分类对象的关系图,以及每个对象节点的节点特征,一个对象节点对应一个待分类对象;
根据第i-1次训练所使用的图边训练信息,生成第i次训练所使用的目标邻接矩阵;图边训练信息包括如下任意一个或多个:初始邻接矩阵、待训练的图边参数以及图边参数调整规则;i为大于或等于1的整数;初始邻接矩阵是基于关系图的多个对象节点之间的连接关系构建;
将目标邻接矩阵和节点特征输入至对象分类模型进行分类预测,得到第i次训练对应的第i次损失函数值以及第i次分类结果,并将第i次训练对应的训练损失函数值添加到训练参考信息集中,训练参考信息集中存储多次训练中每次训练对应的损失函数值以及分类结果;
若第i次训练满足训练结束条件,则从训练参考信息集中确定满足训练要求的第j次训练损失函数值,并将第j次分类结果确定为待分类对象的目标分类。
对应上述描述的一种对象分类方法,基于相同的技术构思,本申请实施例还提供一种计算机可读存储介质。
本实施例提供的计算机可读存储介质,用于存储计算机可执行指令,计算机可执行指令在被处理器执行时实现以下流程:
获取待分类对象的图数据;图数据包括由多个对象节点和多个边构成的待分类对象的关系图,以及每个对象节点的节点特征,一个对象节点对应一个待分类对象;
根据第i-1次训练所使用的图边训练信息,生成第i次训练所使用的目标邻接矩阵;图边训练信息包括如下任意一个或多个:初始邻接矩阵、待训练的图边参数以及图边参数调整规则;i为大于或等于1的整数;初始邻接矩阵是基于关系图的多个对象节点之间的连接关系构建;
将目标邻接矩阵和节点特征输入至对象分类模型进行分类预测,得到第i次训练对应的第i次损失函数值以及第i次分类结果,并将第i次训练对应的训练损失函数值添加到训练参考信息集中,训练参考信息集中存储多次训练中每次训练对应的损失函数值以及分类结果;
若第i次训练满足训练结束条件,则从训练参考信息集中确定满足训练要求的第j次训练损失函数值,并将第j次分类结果确定为待分类对象的目标分类。
需要说明的是,本说明书中关于计算机可读存储介质的实施例与本说明书中关于对象分类方法的实施例基于同一发明构思,因此该实施例的具体实施可以参见前述对应方法的实施,重复之处不再赘述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本领域内的技术人员应明白,本申请实施例可提供为方法、***或计算机程序产品。因此,本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可读存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程电子设备的处理器以产生一个机器,使得通过计算机或其他可编程电子设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程电子设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程电子设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本申请实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书的一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本文件的实施例而已,并不用于限制本文件。对于本领域技术人员来说,本文件可以有各种更改和变化。凡在本文件的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本文件的权利要求范围之内。

Claims (12)

1.一种对象分类方法,其特征在于,包括:
获取待分类对象的图数据;所述图数据包括由多个对象节点和多个边构成的待分类对象的关系图,以及每个所述对象节点的节点特征,一个对象节点对应一个待分类对象;
根据第i-1次训练所使用的图边训练信息,生成第i次训练所使用的目标邻接矩阵;所述图边训练信息包括如下任意一个或多个:初始邻接矩阵、待训练的图边参数以及图边参数调整规则;i为大于或等于1的整数;所述初始邻接矩阵是基于所述关系图的多个所述对象节点之间的连接关系构建;
将所述目标邻接矩阵和所述节点特征输入至对象分类模型进行分类预测,得到第i次训练对应的第i次损失函数值以及第i次分类结果,并将所述第i次训练对应的训练损失函数值添加到训练参考信息集中,所述训练参考信息集中存储多次训练中每次训练对应的损失函数值以及分类结果;
若所述第i次训练满足训练结束条件,则从所述训练参考信息集中确定满足训练要求的第j次训练损失函数值,并将所述第j次分类结果确定为所述待分类对象的目标分类。
2.根据权利要求1所述的方法,其特征在于,所述对象分类模型包括多个依次连接的卷积层,所述将所述目标邻接矩阵和所述节点特征输入至对象分类模型进行分类预测,得到第i次训练对应的第i次损失函数值以及第i次分类结果,包括:
将所述目标邻接矩阵和所述节点特征依次输入至各个卷积层,以基于各个卷积层的卷积参数依次进行卷积运算,得到第i次训练对应的第i次损失函数值以及确定第i次分类结果。
3.根据权利要求1所述的方法,其特征在于,若i等于1,则所述第i-1次训练所使用的图边训练信息包括所述初始邻接矩阵和所述图边参数调整规则,所述根据第i-1次训练所使用的图边训练信息,生成第i次训练所使用的目标邻接矩阵,包括:
从所述图边参数调整规则中读取初始图边参数;
按照所述初始图边参数对所述初始邻接矩阵进行调整,将调整后的初始邻接矩阵作为第i次训练所使用的目标邻接矩阵。
4.根据权利要求1所述的方法,其特征在于,若i大于1,则所述第i-1次训练所使用的图边训练信息包括所述初始邻接矩阵、所述待训练的图边参数以及所述图边参数调整规则,所述根据第i-1次训练所使用的图边训练信息,生成第i次训练所使用的目标邻接矩阵,包括:
按照所述图边参数调整规则对所述待训练的图边参数进行调整,得到调整后的图边参数;
按照所述调整后的图边参数对所述初始邻接矩阵进行调整,将调整后的初始邻接矩阵作为第i次训练所使用的目标邻接矩阵。
5.根据权利要求2所述的方法,其特征在于,所述多个依次连接的卷积层包括依次连接的初始卷积层、至少一个中间卷积层以及末尾卷积层;在后一个卷积层的输入为在前一个卷积层的输出;所述将所述目标邻接矩阵和所述节点特征输入至对象分类模型进行分类预测,得到第i次训练对应的第i次损失函数值,包括:
对每个所述中间卷积层的输出结果进行规范化约束处理,得到规范化损失函数;
根据所述末尾卷积层的输出结果中每个所述标签节点的分类预测结果以及对应的分类标签,计算得到节点分类的分类损失函数;
计算所述对象分类模型中由各个待训练参数形成的待训练参数矩阵的二范数,将所述二范数确定为惩罚项;所述待训练参数包括所述图边参数和所述卷积参数;
根据多个预设的损失函数调节参数、所述节点分类的分类损失函数、所述规范化损失函数以及所述惩罚项,计算得到所述第i次损失函数值。
6.根据权利要求5所述的方法,其特征在于,所述至少一个中间卷积层包括第一中间卷积层和第二中间卷积层;所述确定第i次分类结果,包括:
利用所述初始卷积层,基于所述初始卷积层的卷积参数对所述目标邻接矩阵和所述节点特征进行卷积运算,得到所述初始卷积层的输出结果;
通过所述第一中间卷积层基于所述第一中间卷积层的卷积参数对所述目标邻接矩阵和所述初始卷积层的输出结果进行卷积运算,得到第一中间向量;
对所述初始卷积层的输出结果和所述第一中间向量进行残差计算处理,得到所述第一中间卷积层的输出结果;
利用所述第二中间卷积层基于所述第二中间卷积层的卷积参数对所述目标邻接矩阵和所述第一中间卷积层的输出结果进行卷积运算,得到第二中间向量;
对所述第一中间卷积层的输出结果和所述第二中间向量进行残差计算处理,得到所述第二中间卷积层的输出结果;
通过所述末尾卷积层基于所述末尾卷积层的卷积参数对所述目标邻接矩阵和所述第二中间卷积层的输出结果进行卷积运算,得到所述第i次分类结果。
7.根据权利要求6所述的方法,其特征在于,所述对所述初始卷积层的输出结果和所述第一中间向量进行残差计算处理,得到所述第一中间卷积层的输出结果,包括:
对预设数值与预设的第一调节系数求差,计算得到第二调节系数;
将所述第一中间向量与所述第二调节系数求乘积,计算得到第一子乘积;
将所述初始卷积层的输出结果与所述第一调节系数求乘积,计算得到第二子乘积;
对所述第一子乘积和所述第二子乘积求和,计算得到所述第一中间卷积层的输出结果。
8.根据权利要求1-7任一项所述的方法,其特征在于,所述待分类对象包括商品;所述对象节点包括商品节点;所述对象节点的节点特征包括商品的重量、品牌、价格以及售出量中的至少一者;所述商品的关系图基于每个所述商品节点所属商品类别之间的相似度构建。
9.根据权利要求8所述的方法,其特征在于,所述将所述第j次分类结果确定为所述待分类对象的目标分类之后,还包括:
根据所述目标分类,在每个所述商品节点中确定用户的兴趣节点;
基于所述兴趣节点,向所述用户进行商品推荐。
10.一种对象分类装置,其特征在于,包括:
获取单元,用于获取待分类对象的图数据;所述图数据包括由多个对象节点和多个边构成的待分类对象的关系图,以及每个对象的节点特征,一个对象节点对应一个待分类对象;
生成单元,用于根据第i-1次训练所使用的图边训练信息,生成第i次训练所使用的目标邻接矩阵;所述图边训练信息包括如下任意一个或多个:初始邻接矩阵、待训练的图边参数以及图边参数调整规则;i为大于或等于1的整数;所述初始邻接矩阵是基于所述关系图的多个所述对象节点之间的连接关系构建;
预测单元,用于将所述目标邻接矩阵和所述节点特征输入至对象分类模型进行分类预测,得到第i次训练对应的第i次损失函数值以及第i次分类结果,并将所述第i次训练对应的训练损失函数值添加到训练参考信息集中,所述训练参考信息集中存储多次训练中每次训练对应的损失函数值以及分类结果;
第一确定单元,用于若所述第i次训练满足训练结束条件,则从所述训练参考信息集中确定满足训练要求的第j次训练损失函数值,并将所述第j次分类结果确定为所述待分类对象的目标分类。
11.一种电子设备,其特征在于,包括:
处理器;以及,被配置为存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器执行如权利要求1至9中任一项所述的对象分类方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现如权利要求1至9中任一项所述的对象分类方法。
CN202210602732.2A 2022-05-30 2022-05-30 对象分类方法、装置、电子设备及存储介质 Pending CN115130554A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210602732.2A CN115130554A (zh) 2022-05-30 2022-05-30 对象分类方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210602732.2A CN115130554A (zh) 2022-05-30 2022-05-30 对象分类方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN115130554A true CN115130554A (zh) 2022-09-30

Family

ID=83378516

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210602732.2A Pending CN115130554A (zh) 2022-05-30 2022-05-30 对象分类方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN115130554A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024120166A1 (zh) * 2022-12-08 2024-06-13 马上消费金融股份有限公司 数据处理方法、类别识别方法及计算机设备
CN118193797A (zh) * 2024-05-17 2024-06-14 之江实验室 一种业务执行的方法、装置、存储介质及电子设备
CN118193797B (zh) * 2024-05-17 2024-07-26 之江实验室 一种业务执行的方法、装置、存储介质及电子设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024120166A1 (zh) * 2022-12-08 2024-06-13 马上消费金融股份有限公司 数据处理方法、类别识别方法及计算机设备
CN118193797A (zh) * 2024-05-17 2024-06-14 之江实验室 一种业务执行的方法、装置、存储介质及电子设备
CN118193797B (zh) * 2024-05-17 2024-07-26 之江实验室 一种业务执行的方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
Phan et al. Stable low-rank tensor decomposition for compression of convolutional neural network
Chamberlain et al. Customer lifetime value prediction using embeddings
Tang et al. Machine learning approach to uncovering residential energy consumption patterns based on socioeconomic and smart meter data
Matijaš et al. Load forecasting using a multivariate meta-learning system
Zhang et al. Daily-aware personalized recommendation based on feature-level time series analysis
Wang et al. Predicting construction cost and schedule success using artificial neural networks ensemble and support vector machines classification models
US20120030020A1 (en) Collaborative filtering on spare datasets with matrix factorizations
CN111667022A (zh) 用户数据处理方法、装置、计算机设备和存储介质
CN110717098A (zh) 基于元路径的上下文感知用户建模方法、序列推荐方法
Shchetinin Cluster-based energy consumption forecasting in smart grids
CN111582538A (zh) 一种基于图神经网络的社群价值预测方法及***
CN112861936A (zh) 一种基于图神经网络知识蒸馏的图节点分类方法及装置
Maldonado et al. Embedded heterogeneous feature selection for conjoint analysis: A SVM approach using L1 penalty
CN115130554A (zh) 对象分类方法、装置、电子设备及存储介质
Seema et al. Development of fading channel patch based convolutional neural network models for customer churn prediction
Hauzenberger et al. Dynamic shrinkage priors for large time-varying parameter regressions using scalable Markov chain Monte Carlo methods
Chen et al. Integration of genetic algorithms and neural networks for the formation of the classifier of the hierarchical Choquet integral
Yang et al. Examining multi-category cross purchases models with increasing dataset scale–An artificial neural network approach
Mawane et al. Unsupervised deep collaborative filtering recommender system for e-learning platforms
Rawat et al. Advancement of recommender system based on clickstream data using gradient boosting and random forest classifiers
Li et al. An improved genetic-XGBoost classifier for customer consumption behavior prediction
CN116340635A (zh) 物品推荐方法、模型训练方法、装置及设备
Fuentes Mastering Predictive Analytics with scikit-learn and TensorFlow: Implement machine learning techniques to build advanced predictive models using Python
Volná et al. Elliott waves classification by means of neural and pseudo neural networks
CN111275176B (zh) 分布式计算方法及分布式计算***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination