CN114528441A - 一种图结构数据节点分类方法、装置及电子设备 - Google Patents

一种图结构数据节点分类方法、装置及电子设备 Download PDF

Info

Publication number
CN114528441A
CN114528441A CN202111651405.8A CN202111651405A CN114528441A CN 114528441 A CN114528441 A CN 114528441A CN 202111651405 A CN202111651405 A CN 202111651405A CN 114528441 A CN114528441 A CN 114528441A
Authority
CN
China
Prior art keywords
node
nodes
label
labeled
structure data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111651405.8A
Other languages
English (en)
Inventor
杨一帆
余晓填
王孝宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Intellifusion Technologies Co Ltd
Original Assignee
Shenzhen Intellifusion Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Intellifusion Technologies Co Ltd filed Critical Shenzhen Intellifusion Technologies Co Ltd
Priority to CN202111651405.8A priority Critical patent/CN114528441A/zh
Publication of CN114528441A publication Critical patent/CN114528441A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种图结构数据节点分类方法、装置及电子设备,该方法包括:将图结构数据输入到预设的图神经网络模型,得到图结构数据中各节点的特征;针对图结构数据中的每个带标签节点,根据各带标签节点的特征,确定各带标签节点的预测标签;依据带标签节点的预测标签和真值标签之间的残差,对带标签节点的特征进行修复,得到各带标签节点的目标特征;根据各带标签节点的目标特征和各带标签节点与无标签节点之间的图连接关系,对各无标签节点的特征进行调整;根据各无标签节点调整后的目标特征,确定图结构数据的节点分类结果。消除了图神经网络模型所导致节点特征过平滑问题对节点分类造成的影响,提高了图结构数据的节点分类结果的准确性。

Description

一种图结构数据节点分类方法、装置及电子设备
技术领域
本申请涉及网络技术领域,尤其涉及一种图结构数据节点分类方法、装置及电子设备。
背景技术
图结构数据是通过节点的特征以及节点之间的连边关系来描述各种复杂的数据对象,例如,将监控数据中每个人脸图像作为一个节点,若两个人脸图像相似,则在这两个人脸图像对应的节点之间连接边,以实现整个监控数据的信息整合。
在现有技术中,通常基于预设的图神经网络,通过每一层聚合邻接节点的特征生成节点特征,然后根据该节点特征进行节点分类。
但是,随着图神经网络的网络层数增加和迭代次数的增加,将导致节点特征出现过平滑问题,降低了图结构数据的节点分类结果的准确性。
发明内容
本申请提供一种图结构数据节点分类方法、装置及电子设备,以解决现有技术,降低了图结构数据的节点分类结果的准确性等缺陷。
本申请第一个方面提供一种图结构数据节点分类方法,包括:
获取待进行节点分类的图结构数据;其中,所述图结构数据包括带标签节点和无标签节点;
将所述图结构数据输入到预设的图神经网络模型,得到所述图结构数据中各节点的特征;
针对所述图结构数据中的每个带标签节点,根据各所述带标签节点的特征,确定各所述带标签节点的预测标签;
依据所述带标签节点的预测标签和真值标签之间的残差,对所述带标签节点的特征进行修复,以得到各所述带标签节点的目标特征;
根据各所述带标签节点的目标特征和各所述带标签节点与无标签节点之间的图连接关系,对各所述无标签节点的特征进行调整,以得到各所述无标签节点的目标特征;
根据各所述无标签节点的目标特征,确定所述图结构数据的节点分类结果。
可选的,所述依据所述带标签节点的预测标签和真值标签之间的残差,对所述带标签节点的特征进行修复,以得到各所述带标签节点的目标特征,包括:
根据所述带标签节点的预测标签和真值标签之间的残差所表征的预测误差,对所述带标签节点的特征进行修复;
再次根据修复后的特征,预测所述带标签节点的预测标签,并返回到所述根据所述带标签节点的预测标签和真值标签之间的残差所表征的预测误差,对所述带标签节点的特征进行修复的步骤;
当所述带标签节点的预测标签和真值标签之间的残差所表征的预测误差达到预设标准时,将当前用于预测该预测标签的特征,确定为所述带标签节点的目标特征。
可选的,所述将所述图结构数据输入到预设的图神经网络模型,得到所述图结构数据中各节点的特征,包括:
针对所述图结构数据中的每个节点,基于所述图神经网络模型,根据与所述节点相连接的邻接节点的特征,确定该节点自身的特征。
可选的,所述根据各所述带标签节点的目标特征和各所述带标签节点与无标签节点之间的图连接关系,对各所述无标签节点的特征进行调整,包括:
根据各所述带标签节点与无标签节点之间的图连接关系,确定与所述带标签节点的构成邻接关系的目标无标签节点;
根据所述带标签节点的目标特征,调整所述目标无标签节点的特征。
可选的,还包括:
根据已完成特征调整的无标签节点与其他无标签节点之间的图连接关系,对所述其他无标签节点的特征进行调整。
可选的,所述根据所述带标签节点的目标特征,调整所述目标无标签节点的特征,包括:
基于所述图神经网络模型,根据所述带标签节点的目标特征,重新确定所述目标无标签节点的特征。
可选的,所述根据各所述无标签节点的目标特征,确定所述图结构数据的节点分类结果,包括:
根据各所述无标签节点的目标特征,确定各所述无标签节点的预测标签;
根据各所述无标签节点的预测标签,对所述无标签节点进行分类,以得到所述图结构数据的节点分类结果。
本申请第二个方面提供一种图结构数据节点分类装置,包括:
获取模块,用于获取待进行节点分类的图结构数据;其中,所述图结构数据包括带标签节点和无标签节点;
特征提取模块,用于将所述图结构数据输入到预设的图神经网络模型,得到所述图结构数据中各节点的特征;
预测模块,用于针对所述图结构数据中的每个带标签节点,根据各所述带标签节点的特征,确定各所述带标签节点的预测标签;
特征修复模块,用于依据所述带标签节点的预测标签和真值标签之间的残差,对所述带标签节点的特征进行修复,以得到各所述带标签节点的目标特征;
特征调整模块,用于根据各所述带标签节点的目标特征和各所述带标签节点与无标签节点之间的图连接关系,对各所述无标签节点的特征进行调整,以得到各所述无标签节点的目标特征;
分类模块,用于根据各所述无标签节点的目标特征,确定所述图结构数据的节点分类结果。
可选的,所述特征修复模块,具体用于:
根据所述带标签节点的预测标签和真值标签之间的残差所表征的预测误差,对所述带标签节点的特征进行修复;
再次根据修复后的特征,预测所述带标签节点的预测标签,并返回到所述根据所述带标签节点的预测标签和真值标签之间的残差所表征的预测误差,对所述带标签节点的特征进行修复的步骤;
当所述带标签节点的预测标签和真值标签之间的残差所表征的预测误差达到预设标准时,将当前用于预测该预测标签的特征,确定为所述带标签节点的目标特征。
可选的,所述特征提取模块,具体用于:
针对所述图结构数据中的每个节点,基于所述图神经网络模型,根据与所述节点相连接的邻接节点的特征,确定该节点自身的特征。
可选的,所述特征调整模块,具体用于:
根据各所述带标签节点与无标签节点之间的图连接关系,确定与所述带标签节点的构成邻接关系的目标无标签节点;
根据所述带标签节点的目标特征,调整所述目标无标签节点的特征。
可选的,所述特征调整模块,还用于:
根据已完成特征调整的无标签节点与其他无标签节点之间的图连接关系,对所述其他无标签节点的特征进行调整。
可选的,所述特征调整模块,具体用于:
基于所述图神经网络模型,根据所述带标签节点的目标特征,重新确定所述目标无标签节点的特征。
可选的,所述分类模块,具体用于:
根据各所述无标签节点的目标特征,确定各所述无标签节点的预测标签;
根据各所述无标签节点的预测标签,对所述无标签节点进行分类,以得到所述图结构数据的节点分类结果。
本申请第三个方面提供一种电子设备,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上第一个方面以及第一个方面各种可能的设计所述的方法。
本申请第四个方面提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一个方面以及第一个方面各种可能的设计所述的方法。
本申请技术方案,具有如下优点:
本申请提供一种图结构数据节点分类方法、装置及电子设备,该方法包括:获取待进行节点分类的图结构数据;其中,图结构数据包括带标签节点和无标签节点;将图结构数据输入到预设的图神经网络模型,得到图结构数据中各节点的特征;针对图结构数据中的每个带标签节点,根据各带标签节点的特征,确定各带标签节点的预测标签;依据带标签节点的预测标签和真值标签之间的残差,对带标签节点的特征进行修复,以得到各带标签节点的目标特征;根据各带标签节点的目标特征和各带标签节点与无标签节点之间的图连接关系,对各无标签节点的特征进行调整,以得到各无标签节点的目标特征;根据各无标签节点的目标特征,确定图结构数据的节点分类结果。上述方案提供的方法,通过对图神经网络模型直接得到的带标签节点的特征进行修复,并适应性地调整无标签节点的特征,消除了图神经网络模型所导致节点特征过平滑问题对节点分类造成的影响,提高了图结构数据的节点分类结果的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的图结构数据节点分类方法的流程示意图;
图2为本申请实施例提供的一种示例性的图结构数据的结构示意图;
图3为本申请实施例提供的另一种示例性的图结构数据的结构示意图;
图4为本申请实施例提供的图结构数据节点分类装置的结构示意图;
图5为本申请实施例提供的电子设备的结构示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。在以下各实施例的描述中,“多个”的含义是两个以上,除非另有明确具体的限定。
在现有技术中,通常基于预设的图神经网络,通过每一层聚合邻接节点的特征生成节点特征,然后根据该节点特征进行节点分类。但是,随着图神经网络的网络层数增加和迭代次数的增加,将导致节点特征出现过平滑问题,降低了图结构数据的节点分类结果的准确性。
针对上述问题,本申请实施例提供的图结构数据节点分类方法、装置及电子设备,通过获取待进行节点分类的图结构数据;其中,图结构数据包括带标签节点和无标签节点;将图结构数据输入到预设的图神经网络模型,得到图结构数据中各节点的特征;针对图结构数据中的每个带标签节点,根据各带标签节点的特征,确定各带标签节点的预测标签;依据带标签节点的预测标签和真值标签之间的残差,对带标签节点的特征进行修复,以得到各带标签节点的目标特征;根据各带标签节点的目标特征和各带标签节点与无标签节点之间的图连接关系,对各无标签节点的特征进行调整,以得到各无标签节点的目标特征;根据各无标签节点的目标特征,确定图结构数据的节点分类结果。上述方案提供的方法,通过对图神经网络模型直接得到的带标签节点的特征进行修复,并适应性地调整无标签节点的特征,消除了图神经网络模型所导致节点特征过平滑问题对节点分类造成的影响,提高了图结构数据的节点分类结果的准确性。
下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明实施例进行描述。
本申请实施例提供了一种图结构数据节点分类方法,用于对图结构数据的节点进行分类,以实现数据聚类。本申请实施例的执行主体为电子设备,比如服务器、台式电脑、笔记本电脑、平板电脑及其他可用于对图结构数据的节点进行分类的电子设备。
如图1所示,为本申请实施例提供的图结构数据节点分类方法的流程示意图,该方法包括:
步骤101,获取待进行节点分类的图结构数据。
其中,图结构数据包括带标签节点和无标签节点。图结构数据由节点和边的连接关系构成,可以记为:G=(V,E),其中,V表示节点,E表示边。
示例性的,以应用于人像归档领域为例,图结构数据可以是监控数据,每个节点对应一个人脸图像,若两个人脸图像相似,则在这两个人脸图像对应的节点之间连接边,已经确定人物身份的节点则为带标签节点,未确定人身份的节点则为无标签节点。其中,带标签节点为已经确定具体类别的节点,这样的节点可以作为训练样本,该节点的类别即为标签,无标签节点为当前还未确定具体类别的节点。
步骤102,将图结构数据输入到预设的图神经网络模型,得到图结构数据中各节点的特征。
其中,图神经网络模型可以基于图卷积网络(GCN)或图注意力机制网络(GAT)等机器学习网络构建,其具体构建过程可以参考现有技术,本申请实施例不做限定。
具体地,图神经网络模型可以根据得到的图结构数据中各节点之间的连接关系所体现的节点间相似性,确定图结构数据中各节点的特征。
在图结构数据中,若两个节点间存在一定的相似性,则这两个节点之间也就存在连接关系,即互为邻接节点。针对某一节点,具体可以根据与其相邻的邻接节点的特征,确定该节点的特征。
步骤103,针对图结构数据中的每个带标签节点,根据各带标签节点的特征,确定各带标签节点的预测标签。
具体地,可以利用带标签节点对图神经网络模型进行模型训练,以使该图神经网络模型可以基于带标签节点的特征,为各带标签节点检测其对应的预测标签。
步骤104,依据带标签节点的预测标签和真值标签之间的残差,对带标签节点的特征进行修复,以得到各带标签节点的目标特征。
需要说明的是,图神经网络模型输出的预测标签是向量编码形式的,真值标签也是向量编码形式的,具体可以基于预设的损失函数,如交叉熵损失函数等,根据带标签节点的预测标签和真值标签,确定当前图神经网络的预测误差,即带标签节点的预测标签和真值标签之间的残差。
具体地,可以假设当前图神经网络模型的预测误差是带标签节点的特征不准确所导致,因此可以以减小带标签节点的预测标签和真值标签之间的残差为目标,修复该带标签节点的特征,以得到对应的目标特征。
步骤105,根据各带标签节点的目标特征和各带标签节点与无标签节点之间的图连接关系,对各无标签节点的特征进行调整,以得到各无标签节点的目标特征。
具体地,由于图神经网络模型是在确定某一节点的特征是根据该节点的邻接节点的特征确定的,因此在图结构数据中的带标签节点的特征完成修复后,可以根据带标签节点修复后的特征(目标特征),适应性调整与带标签节点之间具备邻接关系的无标签节点的特征,以得到当前图结构数据中各无标签节点的目标特征。
步骤106,根据各无标签节点的目标特征,确定图结构数据的节点分类结果。
其中,节点的目标特征通常为M维的实数向量,N个节点特征矩阵即为X∈RNxM,节点的类别Y∈WNxC为单一编码的标签类别,类别数目为C。邻接矩阵S∈WNxN为图结构数据中连接关系的标识。
具体地,可以将节点特征(目标特征)和邻接矩阵作为图网络模型的输入,以基于图神经网络模型预测无标签节点的类别。
具体地,在一实施例中,可以根据各无标签节点的目标特征,确定各无标签节点的预测标签;根据各无标签节点的预测标签,对无标签节点进行分类,以得到图结构数据的节点分类结果。
具体地,目标特征和预测标签的数据格式均为实数向量,可以预先设置不同特征与预测标签之间的对应关系,并将大量的不同特征与预测标签之间的对应关系存储到预设的数据库中,在得到无标签节点的目标特征后,参照预先设置在数据库中的不同特征与预测标签之间的对应关系,确定该无标签节点的预测标签。
进一步地,在得到多个无标签节点的预测标签后,可以按照各无标签节点的预测标签,对无标签节点进行聚类,以得到图结构数据的节点分类结果。其中,节点分类结果表明了哪些无标签节点为一类,及这一类无标签节点对应哪种预测标签。
具体地,为了提高节点分类效率,可以在图神经网络模型的基础上增设多层传感器,以基于该多层感知器,根据各无标签节点的目标特征,确定各无标签节点的预测标签,进而按照预测标签对无标签节点进行分类,以得到图结构数据的节点分类结果。
其中,多层感知器的训练过程可以参考现有技术,本申请实施例不做限定。
需要说明的是,由于在一些复杂的应用场景下,图结构数据通常由大量的节点构成,数据规模较为庞大,因此为了避免图神经网络模型超负荷运行,可以在图结构数据中使用近邻采样器采样子图,以将整个图结构数据划分为多个子图,每次对一个子图进行节点分类,在完成所有子图的节点分类操作后,进行分类结果的汇总,以得到该图结构数据的节点分类结果。
在上述实施例的基础上,作为一种可实施的方式,在一实施例中,依据带标签节点的预测标签和真值标签之间的残差,对带标签节点的特征进行修复,以得到各带标签节点的目标特征,包括:
步骤1041,根据带标签节点的预测标签和真值标签之间的残差所表征的预测误差,对带标签节点的特征进行修复;
步骤1042,再次根据修复后的特征,预测带标签节点的预测标签,并返回到根据带标签节点的预测标签和真值标签之间的残差所表征的预测误差,对带标签节点的特征进行修复的步骤;
步骤1043,当带标签节点的预测标签和真值标签之间的残差所表征的预测误差达到预设标准时,将当前用于预测该预测标签的特征,确定为带标签节点的目标特征。
具体地,可以使用标签传播算法,以减小预测误差为目标,对带标签节点的特征进行修复。其中,特征修复是指修改该特征对应的实数向量中某些/某个元素的具体数值。
具体地,针对带标签节点,可以每对其进行一次特征修复后,便重新进行一次标签预测,以得到当前特征对应的残差。当带标签节点的预测标签和真值标签之间的残差所表征的预测误差未达到预设标准时,则重复执行步骤1041-1042,至到带标签节点的预测标签和真值标签之间的残差所表征的预测误差达到预设标准为止。其中,预测标准可以是预测误差为0。
示例性的,可以基于如下公式检测当前残差所表征的测试误差是否达到预设标准:
Y=(1-λ)Y+λSY
其中,Y表示预测标签和真值标签之间的残差,S表示归一化的邻接矩阵,邻接矩阵用于表示图结构数据中节点连接关系,λ超参数用于控制初始化阶段对迭代结果的影响,具体参数值可以根据实际应用调整。具体可以基于该公式迭代,直至迭代收敛为止,Y收敛,则可以确定当前残差所表征的测试误差已达到预设标准。
在上述实施例的基础上,作为一种可实施的方式,在一实施例中,将图结构数据输入到预设的图神经网络模型,得到图结构数据中各节点的特征,包括:
步骤1021,针对图结构数据中的每个节点,基于图神经网络模型,根据与节点相连接的邻接节点的特征,确定该节点自身的特征。
需要说明的是,在图结构数据中,存在边连接关系的两个节点之间存在一定的相似性,其中,相似程度可以基于连接边的权重来表示。
相应地,在一实施例中,可以根据各带标签节点与无标签节点之间的图连接关系,确定与带标签节点的构成邻接关系的目标无标签节点;根据带标签节点的目标特征,调整目标无标签节点的特征。
其中,如图2所示,为本申请实施例提供的一种示例性的图结构数据的结构示意图,1.1、1.2和1.3表示带标签节点,2.1、2.2和2.3表示与带标签节点的构成邻接关系的目标无标签节点。
具体地,在一实施例中,可以基于图神经网络模型,根据带标签节点的目标特征,重新确定目标无标签节点的特征。
其中,节点特征的具体确定规则,可以根据实际需求设定,例如,将邻接节点的特征平均值确定为当前节点的特征。
示例性的,以图2中的2.1节点为例,与其构成邻接关系的带标签节点包括1.1节点和1.2节点,则可以将1.1节点和1.2节点的特征平均值,确定为2.1节点的特征。其中,如图3所示,为本申请实施例提供的另一种示例性的图结构数据的结构示意图,当前的图结构数据的边赋有权重,该权重表示两个节点间的相似程度,则可以将1.1节点和1.2节点的特征加权平均值,确定为2.1节点的特征。
进一步地,在一实施例中,还可以根据已完成特征调整的无标签节点与其他无标签节点之间的图连接关系,对其他无标签节点的特征进行调整。
具体地,可以基于标签传播的后处理算法,根据已完成特征调整的无标签节点与其他无标签节点之间的图连接关系,对其他无标签节点的特征进行调整,至到图结构数据中没有待进行特征调整的无标签节点为止。
具体地,当本申请实施例提供的图结构数据节点分类方法应用到人脸归档时,可以将新采集的抓拍样本归入历史数据库中。每一个人脸抓拍为图网络结构中的一个节点,节点特征为其图像特征,节点间的边为两两人脸特征的相似度。图片的标签可为历史标注好的标签数据集(带标签节点),无标签数据样本(无标签节点)为新采集的抓拍样本。基于上述实施例提供的图结构数据节点分类方法,基于标签数据集训练图注意力模型(图神经网络模型),并使用训练好的模型进行预测,并通过标签传播后处理算法提高样本预测准确率,生成归档结果。
本申请实施例提供的图结构数据节点分类方法,通过获取待进行节点分类的图结构数据;其中,图结构数据包括带标签节点和无标签节点;将图结构数据输入到预设的图神经网络模型,得到图结构数据中各节点的特征;针对图结构数据中的每个带标签节点,根据各带标签节点的特征,确定各带标签节点的预测标签;依据带标签节点的预测标签和真值标签之间的残差,对带标签节点的特征进行修复,以得到各带标签节点的目标特征;根据各带标签节点的目标特征和各带标签节点与无标签节点之间的图连接关系,对各无标签节点的特征进行调整,以得到各无标签节点的目标特征;根据各无标签节点的目标特征,确定图结构数据的节点分类结果。上述方案提供的方法,通过对图神经网络模型直接得到的带标签节点的特征进行修复,并适应性地调整无标签节点的特征,消除了图神经网络模型所导致节点特征过平滑问题对节点分类造成的影响,提高了图结构数据的节点分类结果的准确性。该方法可以应用在新增人脸抓拍归档场景中,可以提高归档准确率。
本申请实施例提供了一种图结构数据节点分类装置,用于执行上述实施例提供的图结构数据节点分类方法。
如图4所示,为本申请实施例提供的图结构数据节点分类装置的结构示意图。该图结构数据节点分类装置40包括:获取模块401、特征提取模块402、预测模块403、特征修复模块404、特征调整模块405和分类模块406。
其中,获取模块,用于获取待进行节点分类的图结构数据;其中,图结构数据包括带标签节点和无标签节点;特征提取模块,用于将图结构数据输入到预设的图神经网络模型,得到图结构数据中各节点的特征;预测模块,用于针对图结构数据中的每个带标签节点,根据各带标签节点的特征,确定各带标签节点的预测标签;特征修复模块,用于依据带标签节点的预测标签和真值标签之间的残差,对带标签节点的特征进行修复,以得到各带标签节点的目标特征;特征调整模块,用于根据各带标签节点的目标特征和各带标签节点与无标签节点之间的图连接关系,对各无标签节点的特征进行调整,以得到各无标签节点的目标特征;分类模块,用于根据各无标签节点的目标特征,确定图结构数据的节点分类结果。
具体地,在一实施例中,特征修复模块,具体用于:
根据带标签节点的预测标签和真值标签之间的残差所表征的预测误差,对带标签节点的特征进行修复;
再次根据修复后的特征,预测带标签节点的预测标签,并返回到根据带标签节点的预测标签和真值标签之间的残差所表征的预测误差,对带标签节点的特征进行修复的步骤;
当带标签节点的预测标签和真值标签之间的残差所表征的预测误差达到预设标准时,将当前用于预测该预测标签的特征,确定为带标签节点的目标特征。
具体地,在一实施例中,特征提取模块,具体用于:
针对图结构数据中的每个节点,基于图神经网络模型,根据与节点相连接的邻接节点的特征,确定该节点自身的特征。
具体地,在一实施例中,特征调整模块,具体用于:
根据各带标签节点与无标签节点之间的图连接关系,确定与带标签节点的构成邻接关系的目标无标签节点;
根据带标签节点的目标特征,调整目标无标签节点的特征。
具体地,在一实施例中,特征调整模块,还用于:
根据已完成特征调整的无标签节点与其他无标签节点之间的图连接关系,对其他无标签节点的特征进行调整。
具体地,在一实施例中,特征调整模块,具体用于:
基于图神经网络模型,根据带标签节点的目标特征,重新确定目标无标签节点的特征。
具体地,在一实施例中,分类模块,具体用于:
根据各无标签节点的目标特征,确定各无标签节点的预测标签;
根据各无标签节点的预测标签,对无标签节点进行分类,以得到图结构数据的节点分类结果。
关于本实施例中的图结构数据节点分类装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本申请实施例提供的图结构数据节点分类装置,用于执行上述实施例提供的图结构数据节点分类方法,其实现方式与原理相同,不再赘述。
本申请实施例提供了一种电子设备,用于执行上述实施例提供的图结构数据节点分类方法。
如图5所示,为本申请实施例提供的电子设备的结构示意图。该电子设备50包括:至少一个处理器51和存储器52;
存储器存储计算机执行指令;至少一个处理器执行存储器存储的计算机执行指令,使得至少一个处理器执行如上实施例提供的图结构数据节点分类方法。
本申请实施例提供的一种电子设备,用于执行上述实施例提供的图结构数据节点分类方法,其实现方式与原理相同,不再赘述。
本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当处理器执行计算机执行指令时,实现如上任一实施例提供的图结构数据节点分类方法。
本申请实施例的包含计算机可执行指令的存储介质,可用于存储前述实施例中提供的图结构数据节点分类方法的计算机执行指令,其实现方式与原理相同,不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (10)

1.一种图结构数据节点分类方法,其特征在于,包括:
获取待进行节点分类的图结构数据;其中,所述图结构数据包括带标签节点和无标签节点;
将所述图结构数据输入到预设的图神经网络模型,得到所述图结构数据中各节点的特征;
针对所述图结构数据中的每个带标签节点,根据各所述带标签节点的特征,确定各所述带标签节点的预测标签;
依据所述带标签节点的预测标签和真值标签之间的残差,对所述带标签节点的特征进行修复,以得到各所述带标签节点的目标特征;
根据各所述带标签节点的目标特征和各所述带标签节点与无标签节点之间的图连接关系,对各所述无标签节点的特征进行调整,以得到各所述无标签节点的目标特征;
根据各所述无标签节点的目标特征,确定所述图结构数据的节点分类结果。
2.根据权利要求1所述的方法,其特征在于,所述依据所述带标签节点的预测标签和真值标签之间的残差,对所述带标签节点的特征进行修复,以得到各所述带标签节点的目标特征,包括:
根据所述带标签节点的预测标签和真值标签之间的残差所表征的预测误差,对所述带标签节点的特征进行修复;
再次根据修复后的特征,预测所述带标签节点的预测标签,并返回到所述根据所述带标签节点的预测标签和真值标签之间的残差所表征的预测误差,对所述带标签节点的特征进行修复的步骤;
当所述带标签节点的预测标签和真值标签之间的残差所表征的预测误差达到预设标准时,将当前用于预测该预测标签的特征,确定为所述带标签节点的目标特征。
3.根据权利要求1所述的方法,其特征在于,所述将所述图结构数据输入到预设的图神经网络模型,得到所述图结构数据中各节点的特征,包括:
针对所述图结构数据中的每个节点,基于所述图神经网络模型,根据与所述节点相连接的邻接节点的特征,确定该节点自身的特征。
4.根据权利要求3所述的方法,其特征在于,所述根据各所述带标签节点的目标特征和各所述带标签节点与无标签节点之间的图连接关系,对各所述无标签节点的特征进行调整,包括:
根据各所述带标签节点与无标签节点之间的图连接关系,确定与所述带标签节点的构成邻接关系的目标无标签节点;
根据所述带标签节点的目标特征,调整所述目标无标签节点的特征。
5.根据权利要求4所述的方法,其特征在于,还包括:
根据已完成特征调整的无标签节点与其他无标签节点之间的图连接关系,对所述其他无标签节点的特征进行调整。
6.根据权利要求4所述的方法,其特征在于,所述根据所述带标签节点的目标特征,调整所述目标无标签节点的特征,包括:
基于所述图神经网络模型,根据所述带标签节点的目标特征,重新确定所述目标无标签节点的特征。
7.根据权利要求1所述的方法,其特征在于,所述根据各所述无标签节点的目标特征,确定所述图结构数据的节点分类结果,包括:
根据各所述无标签节点的目标特征,确定各所述无标签节点的预测标签;
根据各所述无标签节点的预测标签,对所述无标签节点进行分类,以得到所述图结构数据的节点分类结果。
8.一种图结构数据节点分类装置,其特征在于,包括:
获取模块,用于获取待进行节点分类的图结构数据;其中,所述图结构数据包括带标签节点和无标签节点;
特征提取模块,用于将所述图结构数据输入到预设的图神经网络模型,得到所述图结构数据中各节点的特征;
预测模块,用于针对所述图结构数据中的每个带标签节点,根据各所述带标签节点的特征,确定各所述带标签节点的预测标签;
特征修复模块,用于依据所述带标签节点的预测标签和真值标签之间的残差,对所述带标签节点的特征进行修复,以得到各所述带标签节点的目标特征;
特征调整模块,用于根据各所述带标签节点的目标特征和各所述带标签节点与无标签节点之间的图连接关系,对各所述无标签节点的特征进行调整,以得到各所述无标签节点的目标特征;
分类模块,用于根据各所述无标签节点的目标特征,确定所述图结构数据的节点分类结果。
9.一种电子设备,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1至7任一项所述的方法。
CN202111651405.8A 2021-12-30 2021-12-30 一种图结构数据节点分类方法、装置及电子设备 Pending CN114528441A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111651405.8A CN114528441A (zh) 2021-12-30 2021-12-30 一种图结构数据节点分类方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111651405.8A CN114528441A (zh) 2021-12-30 2021-12-30 一种图结构数据节点分类方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN114528441A true CN114528441A (zh) 2022-05-24

Family

ID=81620566

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111651405.8A Pending CN114528441A (zh) 2021-12-30 2021-12-30 一种图结构数据节点分类方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN114528441A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115293919A (zh) * 2022-07-22 2022-11-04 浙江大学 面向社交网络分布外泛化的图神经网络预测方法及***

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115293919A (zh) * 2022-07-22 2022-11-04 浙江大学 面向社交网络分布外泛化的图神经网络预测方法及***
CN115293919B (zh) * 2022-07-22 2023-08-04 浙江大学 面向社交网络分布外泛化的图神经网络预测方法及***

Similar Documents

Publication Publication Date Title
US11416772B2 (en) Integrated bottom-up segmentation for semi-supervised image segmentation
CN113614748A (zh) 用于对象检测的增量学习的***和方法
US20180300576A1 (en) Semi-automatic labelling of datasets
WO2019144066A1 (en) Systems and methods for preparing data for use by machine learning algorithms
CA3066029A1 (en) Image feature acquisition
CN110969200B (zh) 基于一致性负样本的图像目标检测模型训练方法及装置
JP2015504215A (ja) 画像を比較するための方法およびシステム
WO2023024670A1 (zh) 设备聚类方法、装置、计算机设备及存储介质
CN111694957B (zh) 基于图神经网络的问题单分类方法、设备及存储介质
CN111639607A (zh) 模型训练、图像识别方法和装置、电子设备及存储介质
CN110954734B (zh) 故障诊断方法、装置、设备和存储介质
CN112613569A (zh) 图像识别方法、图像分类模型的训练方法及装置
CN112818162A (zh) 图像检索方法、装置、存储介质和电子设备
US20230298314A1 (en) Image clustering method and apparatus, computer device, and storage medium
WO2021099938A1 (en) Generating training data for object detection
CN114528441A (zh) 一种图结构数据节点分类方法、装置及电子设备
CN115034315A (zh) 基于人工智能的业务处理方法、装置、计算机设备及介质
CN112966687B (zh) 图像分割模型训练方法、装置及通信设备
CN112115996B (zh) 图像数据的处理方法、装置、设备及存储介质
CN117649515A (zh) 一种基于数字孪生的半监督3d目标检测方法、***和设备
CN108830302B (zh) 一种图像分类方法、训练方法、分类预测方法及相关装置
US20230237272A1 (en) Table column identification using machine learning
CN116451081A (zh) 数据漂移的检测方法、装置、终端及存储介质
CN112861962B (zh) 样本处理方法、装置、电子设备和存储介质
US20230074640A1 (en) Duplicate scene detection and processing for artificial intelligence workloads

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination