CN115631057A - 一种基于图神经网络的社交用户分类方法及*** - Google Patents

一种基于图神经网络的社交用户分类方法及*** Download PDF

Info

Publication number
CN115631057A
CN115631057A CN202211307295.8A CN202211307295A CN115631057A CN 115631057 A CN115631057 A CN 115631057A CN 202211307295 A CN202211307295 A CN 202211307295A CN 115631057 A CN115631057 A CN 115631057A
Authority
CN
China
Prior art keywords
node
nodes
synthetic
graph
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211307295.8A
Other languages
English (en)
Inventor
张维玉
郭新超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qilu University of Technology
Original Assignee
Qilu University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qilu University of Technology filed Critical Qilu University of Technology
Priority to CN202211307295.8A priority Critical patent/CN115631057A/zh
Publication of CN115631057A publication Critical patent/CN115631057A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于图神经网络的社交用户分类方法、***、电子设备及计算机可读存储介质,属于社交用户分类技术领域。包括针对输入的基于社交用户数据构建的原始图结构数据,获取节点表示,基于节点表示,执行过采样操作;针对数据中的少数节点,生成合成节点;基于合成节点,获取合成节点的邻接信息;为合成节点分配伪标签;将合成节点、邻接信息、真实节点结合,构造节点平衡图,进行分类。能够解决不平衡分类问题,提高社交用户分类的准确性,解决了现有技术中存在“社交用户分类中,类别不平衡,导致准确率低、计算成本高”的问题。

Description

一种基于图神经网络的社交用户分类方法及***
技术领域
本申请涉及社交用户分类技术领域,特别是涉及一种基于图神经网络的社交用户分类方法及***。
背景技术
本部分的陈述仅仅是提到了与本申请相关的背景技术,并不必然构成现有技术。
近年来,随着图神经网络(GNN)的发展,图表示学***衡学习的研究上。
节点分类是图表示学***衡的问题;而对于许多真实场景,一些类的实例可能比其他类少得多。在这种情况下,直接训练GNN分类器将不足以代表来自那些少数类的样本,并导致次优性能。
然而,在现实世界的中,数据中不同类别样本的数量可能是不平衡的,即存在一些类比其他的类的样本多的多的现象。在虚假用户的检测问题上,由于视频网站、社交网站的社交用户中大多数都是真实用户,只有一小部分是机器人用户(虚假用户),使得这一现象尤为突出,存在不平衡分类问题。
半监督分类学习,是在大量的数据中,使用小部分的有标记的数据进行分类器的训练,从而完成最终的分类任务,由于进行社交用户分类时,只有有限的标记数据,半监督学习会使得标记的少数样本变的更少,进一步扩大了这一问题的严重性,因为我们只有有限的标记数据,这样标记的少数样本会变得更少。
在机器学***衡分类问题得到了广泛的研究,可以归纳为三类:数据级方法、算法级方法和混合方法。数据级方法通过使用过采样或欠采样技术使类别分布更加平衡,过采样通过对少数类样本进行过采样,欠采样对多数类样本进行欠采样来平衡数据集;欠采样可能会导致更有效的分类,但由于它丢弃了多数类中的有用信息,它最终会动摇决策边界并导致较差的分类器;相反,过采样通过复制现有样本或合成新样本来保存更多信息,复制(也称为随机过采样)随机复制一些少数样本,因此它通常产生较小的少数类区域,这可能导致过拟合。算法级方法通常为不同类别引入不同的误分类惩罚或先验概率;混合方法将两者结合起来。但是,直接将它们应用到图中可能会得到次优的结果,关系是图结构数据中需要挖掘的关键信息,少数样本表示不足不仅会影响嵌入质量,还会影响相邻节点间的知识交换过程。先前的算法未能解决这一问题,因为它们假设每个样本都是独立的。
虽然现有的方法证明了它们在不平衡数据学习中的成功,但仍然存在两个问题:
(1)在过采样策略中,合成提供了比复制更宽的决策区域,但是导致了沉重的计算成本;
(2)混合策略用宽的决策区域重新平衡数据集,但是集成学习策略在训练中需要大量的计算成本,特别是当与过采样策略结合时;
(3)对于像社交用户分类这样的真实场景,一些类的实例可能比其他类少得多。在这种情况下,直接训练GNN分类器将不足以代表来自那些少数类的样本,并导致次优性能。
发明内容
为了解决现有技术的不足,本申请提供了一种基于图神经网络的社交用户分类方法、***、电子设备及计算机可读存储介质,通过在基于GNN的特征提取器获得的表达性嵌入空间中插值来生成合成少数节点,并使用边生成器来预测合成节点的链接,以此来是少数节点和其他节点达到平衡,以便于通过GNN进行节点分类。
第一方面,本申请提供了一种基于图神经网络的社交用户分类方法;
一种基于图神经网络的社交用户分类方法,包括:
针对输入的基于社交用户数据构建的原始图结构数据,获取节点表示,基于节点表示,执行过采样操作;
针对数据中的少数节点,生成合成节点;
基于合成节点,获取合成节点的邻接信息;
为合成节点分配伪标签;
将合成节点、邻接信息、真实节点结合,构造节点平衡图,进行分类。
进一步的,所述基于节点表示,执行过采样操作以生成合成节点的具体步骤为:
基于节点表示,针对数据中的少数节点,通过特征提取获取相应的节点表示;
根据少数节点的属性信息和拓扑信息,生成合成节点。
进一步的,所述为部分合成节点分配伪标签的具体步骤为:
根据权重矩阵和邻域标签信息,获取邻域标签信息对预测标签的影响程度;
根据原有标签和邻域标签信息对预测标签的影响程度,获取预测标签。
进一步的,所述将合成节点、邻接信息、真实节点结合,构造节点平衡图的具体步骤为:
将真实节点嵌入与合成节点嵌入相连接,获取增强节点表示集;
将合成节点嵌入至标签节点集,获取增强标记集。
进一步的,在进行分类之前,通过目标函数对网络进行训练获取图神经网络分类模型。
进一步的,所述目标函数为:
Figure BDA0003905838940000041
其中,ηnode为交叉熵损失函数,ηedge为训练边生成器的损耗函数,ηp为自适应标签传播的目标函数,λ为超参数,θ,φ,
Figure BDA0003905838940000042
分别是特征提取器、边缘生成器和节点分类器的参数。
进一步的,采用两层GraphSage作为主干模型结构。
第二方面,本申请提供了一种基于图神经网络的社交用户分类***;
一种基于图神经网络的社交用户分类***,包括:
包括特征提取器、节点生成器、边生成器、标签传播器和GNN分类器;
特征提取器用于获取基于社交用户数据构建的原始图结构数据,根据原始图结构数据获取节点表示;
节点生成器用于基于节点表示,针对数据中的少数节点,生成合成节点;
边生成器用于基于合成节点,获取合成节点的邻接信息;
标签传播器用于为合成节点分配伪标签;
GNN分类器用于将合成节点、邻接信息、真实节点结合,构造节点平衡图,进行分类。
第三方面,本申请提供了一种电子设备;
一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成上述基于图神经网络的社交用户分类方法的步骤。
第四方面,本申请提供了一种计算机可读存储介质;
一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成上述基于图神经网络的社交用户分类方法的步骤。
与现有技术相比,本申请的有益效果是:
1、本申请将先前用于独立且同分布数据的不平衡学***衡节点分类任务,采用最稳定和最有效的合成少数过采样算法,为新合成的样本提供关系信息,基于类别平衡的数据进行分类,提高分类的准确性;
2、本申请针对少数节点的处理,通过GNN特征提取器生成嵌入,节点生成器在潜在空间中生成少数节点,然后边生成器为这些新的节点添加连接,得到具有类平衡的增强图,最后通过GNN分类器,对节点进行分类任务。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1为本申请实施例提供的基于图神经网络的社交用户分类方法的流程示意图;
图2为本申请实施例提供的框架示意图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本申请使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例一
现有技术中,社交用户分类问题中,虚假用户的类别远小于真实用户,在通过图神经网络进行预测分类的过程中,而现有的用于不平衡分类问题的方法,计算成本高,直接训练的样本不足以代表那些来自少数类的样本,会导致次优性能,降低分类的准确性;因此,本申请提供了一种基于图神经网络的社交用户分类方法。
接下来,结合图1-2对本实施例公开的一种基于图神经网络的社交用户分类方法进行详细说明。
本实施例提供了一种基于图神经网络的社交用户分类方法,包括:
S1、针对输入的基于社交用户数据构建的原始图结构数据,获取节点表示,基于节点表示,执行过采样操作;具体步骤为:
通过特征提取器提取输入的基于社交用户数据构建的原始图结构数据的节点表示;本实施例中,选用第一层GraphSage计算节点表示:
Figure BDA0003905838940000071
其中,F表示输入节点属性矩阵,F[,:]表示节点属性。A[:,]表示邻接矩阵中的第v列,
Figure BDA0003905838940000072
是节点的嵌入,W1是权重参数,表示像RELU这样的激活函数。
S2、在特征提取器构造的嵌入空间中获得每个节点的表示后,针对数据中的少数节点,生成合成节点;本实施例中,少数节点为数据中带标签的节点,具体的,采用SMOTE算法,通过改变重复的插值来增加普通过采样,SMOTE算法的基本思想是在嵌入空间中对来自目标少数类的样本进行插值,并在嵌入空间中对目标少数类的近邻进行插值;具体过程如下:
Figure BDA0003905838940000073
是一个带标签的少数节点,标签为Yu。首先找到与
Figure BDA0003905838940000074
相同类中最接近的标记节点,即,
Figure BDA0003905838940000075
其中,nn(v)指的是同一类中v的最近邻,在嵌入空间中使用欧几里得度量进行测量。
使用最近邻,生成合成节点为:
Figure BDA0003905838940000076
其中,δ是一个随机变量,在范围[0,1]内遵循均匀分布。
由于
Figure BDA0003905838940000077
Figure BDA0003905838940000078
属于同一个类并且彼此非常接近,,所以生成的合成节点
Figure BDA0003905838940000081
也应该属于同一个类,从而获得标记的合成节点。
S3、基于合成节点,获取合成节点的邻接信息;现在已经生成了合成节点来平衡类分布,由于这些节点与原始图G没有链接,所以与原始图G隔离。首先,通过真实节点和已有边生成器进行训练;然后,通过边生成器预测合成节点的邻接信息,将生成的合成节点和边添加到初始的邻接矩阵中。能够很好地利用节点表示重建邻接矩阵,为合成节点提供很好的链路预测。
为了保持模型的简单性并使分析更容易,采用加权内积来实现边生成器,如下所示:
Figure BDA0003905838940000082
其中,Ev,u表示节点v和u之间的预测关系信息,S表示捕获节点之间相互作用的参数矩阵。
通过损耗函数训练边生成器,损耗函数为:
Figure BDA0003905838940000083
其中,E表示V中的节点之间的预测连接。
S4、为合成节点分配伪标签;具体而言,标签传播的目标是找到与标签矩阵一致的预测矩阵YL。具体公式如下:
Figure BDA0003905838940000084
其中,Y(0)=Y,K表示幂次迭代步数,
Figure BDA0003905838940000085
是预测标签,转置矩阵用T表示,可以设置为归一化邻接矩阵。将标签传播K次后,预测标签可以得到K跳距离的邻域标签信息。为此,我们设计了一种自适应标签传播算法,具体公式可以表示为:
Figure BDA0003905838940000091
其中γik代表k-hop邻域信息对预测标签的影响程度,γik可以表示为:
Figure BDA0003905838940000092
其中,
Figure BDA0003905838940000093
注意向量W是权矩阵,ReLU是激活函数。自适应标签传播算子通过将注意力向量和权重矩阵设置为可学习参数,对每个节点调整自己的传播策略,最后光滑的标签可以捕获输入图中丰富的结构信息。
自适应标签传播的目标函数如下:
Figure BDA0003905838940000094
其中,
Figure BDA0003905838940000095
是对节点vi的预测,yi是原有标签,l()是交叉熵损失。
S5、将合成节点、邻接信息、真实节点结合,构造节点平衡图,进行分类。
Figure BDA0003905838940000096
是通过将H1(真实节点的嵌入)与合成节点嵌入相连接而得到的增强节点表示集,
Figure BDA0003905838940000097
是通过将合成节点嵌入到VL中而得到的增强标记集;从而得到带有标记节点集
Figure BDA0003905838940000098
的增强图
Figure BDA0003905838940000099
具体的,采用第二个GraphSage块,附加一个线性层用于
Figure BDA00039058389400000910
上的节点分类,如下所示:
Figure BDA00039058389400000911
Figure BDA00039058389400000912
其中,H2表示第2个GraphSage块的节点表示矩阵,W表示权重参数。Pv是节点v的类标签上的概率分布。利用交叉熵损失对分类器模块进行了优化:
Figure BDA0003905838940000101
在测试过程中,将节点v,Yv′的预测类设置为概率最高的类
Figure BDA0003905838940000102
进一步的,在进行社交用户分类之前,通过目标函数对网络进行训练获取图神经网络分类模型,目标函数最小时,获得最优的图神经网络分类模型,具体的训练步骤与上述方法的步骤相同,目标函数为:
Figure BDA0003905838940000103
其中,ηnode为交叉熵损失函数,ηedge为训练边生成器的损耗函数,ηp为自适应标签传播的目标函数,λ为超参数,θ,φ,
Figure BDA0003905838940000106
分别是特征提取器、边缘生成器和节点分类器的参数。
实施例二
本实施例公开了一种基于图神经网络的社交用户分类***,包括特征提取器、节点生成器、边生成器、标签传播器和GNN分类器;
特征提取器用于获取基于社交用户数据构建的原始图结构数据,根据原始图结构数据获取节点表示;特征提取器可以使用任意类型的GNN来实现,具体的,特征提取器选用GraphSage作为主干模型结构,因为它能有效地学习各种局部拓扑结构,并能很好地推广到新的结构。消息传递和融合过程为:
Figure BDA0003905838940000104
其中,F表示输入节点属性矩阵,F[,:]表示节点属性。A[:,]表示邻接矩阵中的第v列,
Figure BDA0003905838940000105
是节点的嵌入,W1是权重参数,表示像RELU这样的激活函数。
节点生成器用于基于节点表示,针对数据中的少数节点,生成合成节点;具体的,在特征提取器构造的嵌入空间中获得每个节点的表示后,针对数据中的少数节点,生成合成节点;具体的,采用SMOTE算法,通过改变重复的插值来增加普通过采样,SMOTE算法的基本思想是在嵌入空间中对来自目标少数类的样本进行插值,并在嵌入空间中对目标少数类的近邻进行插值;具体过程如下:
Figure BDA0003905838940000111
是一个带标签的少数节点,标签为Yu。首先找到与
Figure BDA0003905838940000112
相同类中最接近的标记节点,即,
Figure BDA0003905838940000113
其中,nn(v)指的是同一类中v的最近邻,在嵌入空间中使用欧几里得度量进行测量。
使用最近邻,生成合成节点为:
Figure BDA0003905838940000114
其中,δ是一个随机变量,在范围[0,1]内遵循均匀分布。
由于
Figure BDA0003905838940000115
Figure BDA0003905838940000116
属于同一个类并且彼此非常接近,所以生成的合成节点
Figure BDA0003905838940000117
也应该属于同一个类,从而获得标记的合成节点。
边生成器用于基于合成节点,获取合成节点的邻接信息;;具体的,该生成器对实际节点和已有边进行训练,用于预测合成节点的邻居信息。这些新的节点和边将被添加到初始的邻接矩阵中,并作为基于GNN的分类器的输入。
为了保持模型的简单性并使分析更容易,采用加权内积来实现边生成器,如下所示:
Figure BDA0003905838940000121
其中,Ev,u表示节点v和u之间的预测关系信息,S表示捕获节点之间相互作用的参数矩阵。
通过损耗函数训练边生成器,损耗函数为:
Figure BDA0003905838940000122
其中,E表示V中的节点之间的预测连接。
标签传播器用于为合成节点分配伪标签;标签传播的目标是找到与标签矩阵一致的预测矩阵YL。具体公式如下:
Figure BDA0003905838940000123
其中,Y(0)=Y,K表示幂次迭代步数,
Figure BDA0003905838940000124
是预测标签,转置矩阵用T表示,可以设置为归一化邻接矩阵。将标签传播K次后,预测标签可以得到K跳距离的邻域标签信息。为此,我们设计了一种自适应标签传播算法,具体公式可以表示为:
Figure BDA0003905838940000125
其中γik代表k-hop邻域信息对预测标签的影响程度,γik可以表示为:
Figure BDA0003905838940000126
其中,
Figure BDA0003905838940000127
注意向量W是权矩阵,ReLU是激活函数。自适应标签传播算子通过将注意力向量和权重矩阵设置为可学习参数,对每个节点调整自己的传播策略,最后光滑的标签可以捕获输入图中丰富的结构信息。
GNN分类器用于将合成节点、邻接信息、真实节点结合,构造节点平衡图,进行分类;采用第二个GraphSage块,附加一个线性层用于
Figure BDA0003905838940000131
上的节点分类,如下所示:
Figure BDA0003905838940000132
Figure BDA0003905838940000133
其中,H2表示第2个GraphSage块的节点表示矩阵,W表示权重参数。Pv是节点v的类标签上的概率分布。利用交叉熵损失对分类器模块进行了优化:
Figure BDA0003905838940000134
在测试过程中,将节点v,Yv′的预测类设置为概率最高的类
Figure BDA0003905838940000135
此处需要说明的是,上述特征提取器、节点生成器、边生成器、标签传播器和GNN分类器对应于实施例一中的步骤,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为***的一部分可以在诸如一组计算机可执行指令的计算机***中执行。
实施例三
本发明实施例三提供一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,计算机指令被处理器运行时,完成上述基于图神经网络的社交用户分类方法的步骤。
实施例四
本发明实施例四提供一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成上述基于图神经网络的社交用户分类方法的步骤。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
上述实施例中对各个实施例的描述各有侧重,某个实施例中没有详述的部分可以参见其他实施例的相关描述。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种基于图神经网络的社交用户分类方法,其特征是,包括:
针对输入的基于社交用户数据构建的原始图结构数据,获取节点表示,基于节点表示,执行过采样操作;
针对数据中的少数节点,生成合成节点;
基于合成节点,获取合成节点的邻接信息;
为合成节点分配伪标签;
将合成节点、邻接信息、真实节点结合,构造节点平衡图,进行分类。
2.如权利要求1所述的基于图神经网络的社交用户分类方法,其特征是,所述基于节点表示,执行过采样操作以生成合成节点的具体步骤为:
针对数据中的少数节点,通过特征提取获取相应的节点表示;
根据少数节点的属性信息和拓扑信息,生成合成节点。
3.如权利要求1所述的基于图神经网络的社交用户分类方法,其特征是,所述为部分合成节点分配伪标签的具体步骤为:
根据权重矩阵和邻域标签信息,获取邻域标签信息对预测标签的影响程度;
根据原有标签和邻域标签信息对预测标签的影响程度,获取预测标签。
4.如权利要求1所述的基于图神经网络的社交用户分类方法,其特征是,所述将合成节点、邻接信息、真实节点结合,构造节点平衡图的具体步骤为:
将真实节点嵌入与合成节点嵌入相连接,获取增强节点表示集;
将合成节点嵌入至标签节点集,获取增强标记集。
5.如权利要求1所述的基于图神经网络的社交用户分类方法,其特征是,在进行分类之前,通过目标函数对网络进行训练获取图神经网络分类模型。
6.如权利要求5所述的基于图神经网络的社交用户分类方法,其特征是,所述目标函数为:
Figure FDA0003905838930000021
其中,ηnode为交叉熵损失函数,ηedge为训练边生成器的损耗函数,ηp为自适应标签传播的目标函数,λ为超参数,θ,φ,
Figure FDA0003905838930000022
分别是特征提取器、边缘生成器和节点分类器的参数。
7.如权利要求5所述的基于图神经网络的社交用户分类方法,其特征是,采用两层GraphSage作为主干模型结构。
8.一种基于图神经网络的社交用户分类***,其特征是,包括特征提取器、节点生成器、边生成器、标签传播器和GNN分类器;
特征提取器用于获取基于社交用户数据构建的原始图结构数据,根据原始图结构数据获取节点表示;
节点生成器用于基于节点表示,针对数据中的少数节点,生成合成节点;
边生成器用于基于合成节点,获取合成节点的邻接信息;
标签传播器用于为合成节点分配伪标签;
GNN分类器用于将合成节点、邻接信息、真实节点结合,构造节点平衡图,进行分类。
9.一种电子设备,其特征在于,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1-7任一项所述的步骤。
10.一种计算机可读存储介质,其特征在于,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-7任一项所述的步骤。
CN202211307295.8A 2022-10-24 2022-10-24 一种基于图神经网络的社交用户分类方法及*** Pending CN115631057A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211307295.8A CN115631057A (zh) 2022-10-24 2022-10-24 一种基于图神经网络的社交用户分类方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211307295.8A CN115631057A (zh) 2022-10-24 2022-10-24 一种基于图神经网络的社交用户分类方法及***

Publications (1)

Publication Number Publication Date
CN115631057A true CN115631057A (zh) 2023-01-20

Family

ID=84907642

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211307295.8A Pending CN115631057A (zh) 2022-10-24 2022-10-24 一种基于图神经网络的社交用户分类方法及***

Country Status (1)

Country Link
CN (1) CN115631057A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116032665A (zh) * 2023-03-28 2023-04-28 北京芯盾时代科技有限公司 一种网络群体的发现方法、装置、设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116032665A (zh) * 2023-03-28 2023-04-28 北京芯盾时代科技有限公司 一种网络群体的发现方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
Chen et al. DNNOff: offloading DNN-based intelligent IoT applications in mobile edge computing
CN110263280B (zh) 一种基于多视图的动态链路预测深度模型及应用
CN109816032B (zh) 基于生成式对抗网络的无偏映射零样本分类方法和装置
CN112784964A (zh) 基于桥接知识蒸馏卷积神经网络的图像分类方法
US11934536B2 (en) Dynamic network risk predicting method based on a graph neural network
CN113326377A (zh) 一种基于企业关联关系的人名消歧方法及***
CN113988464B (zh) 基于图神经网络的网络链路属性关系预测方法及设备
CN113554100B (zh) 异构图注意力网络增强的Web服务分类方法
CN114064627A (zh) 一种针对多重关系的知识图谱链接补全方法及***
CN116541779B (zh) 个性化公共安全突发事件检测模型训练方法、检测方法及装置
CN114723037A (zh) 一种聚合高阶邻居节点的异构图神经网络计算方法
CN115631057A (zh) 一种基于图神经网络的社交用户分类方法及***
CN106407379A (zh) 一种基于Hadoop平台的电影推荐方法
CN117315331A (zh) 一种基于gnn和lstm的动态图异常检测方法及***
CN115396366A (zh) 基于图注意力网络的分布式智能路由方法
CN108614932B (zh) 基于边图的线性流重叠社区发现方法、***及存储介质
CN104732278A (zh) 一种基于海云协同架构的深度神经网络训练方法
CN106875043B (zh) 一种基于gn***算法的节点迁移网络分块优化方法
Meddouri et al. Parallel learning and classification for rules based on formal concepts
CN109599096B (zh) 一种数据筛选方法及装置
CN113159976B (zh) 一种微博网络重要用户的识别方法
CN110110764B (zh) 基于混合式网络的随机森林策略优化方法、存储介质
CN114357111A (zh) 政策关联影响分析方法、装置、电子设备及存储介质
Zhu et al. Community mining in complex network based on parallel genetic algorithm
Vatchova et al. DEEP LEARNING OF COMPLEX INTERCONNECTED PROCESSES FOR BILEVEL OPTIMIZATION PROBLEM UNDER UNCERTAINTY

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination