CN115293919A

CN115293919A - 面向社交网络分布外泛化的图神经网络预测方法及***

Info

Publication number: CN115293919A
Application number: CN202210871411.2A
Authority: CN
Inventors: 况琨; 陈政聿; 吴飞
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2022-07-22
Filing date: 2022-07-22
Publication date: 2022-11-04
Anticipated expiration: 2042-07-22
Also published as: CN115293919B

Abstract

本发明公开了一种面向社交网络分布外泛化的图神经网络预测方法及***。该方法包括：1)把社交网络数据中打标签的数据作为训练数据集，每个节点代表一个用户，两个节点之间的边代表两个用户彼此是好友关系；2)对训练数据集进行随机采样，形成不同批次的训练数据；3)利用不同批次的训练数据更新聚类中心，划分不同的子图，每个子图包含的用户由聚类中心决定；4)利用上一步得到的不同的子图，更新图神经网络参数；5)利用更新后的图神经网络参数，进行社交网络用户标签的预测，从而预测该用户的社交信。本发明将图神经网络应用于分布外的社交网络预测。相比一般图神经网络算法，本发明对训练集分布外的测试数据具有较强的鲁棒性和准确率。

Description

面向社交网络分布外泛化的图神经网络预测方法及***

技术领域

本发明涉及机器学习领域，尤其涉及面向社交网络分布外泛化的图神经网络预测方法及***。

背景技术

最近，图形神经网络在各种图形任务上取得了先进的性能，例如分子图属性预测，场景图分类，和社交网络分类。尽管图神经网络的性能令人震惊，但大多数现有方法都假设训练和测试数据是独立且分布相同的，而对于许多真实世界的图形和应用，即在社交网络领域，训练和测试数据之间的分布可能不同。由于缺乏分布外泛化能力，现有方法的模型性能在数据的分布变化下会显著降低。因此，学习具有分布外泛化能力的图神经网络是至关重要的。

发明内容

本发明的目的是克服现有图神经网络算法在社交网络数据中，训练数据与测试数据的分布不同造成性能下降的问题，并提出了一种面向社交网络分布外泛化的图神经网络预测方法，该方法可以直接在图神经网络的表征层面进行不变学习，从而在不同分布的测试数据集上都可以进行稳定而准确的社交信息标签预测。

为实现上述发明目的，本发明具体采用的技术方案如下：

第一方面，本发明提供了一种面向社交网络分布外泛化的图神经网络预测方法，其包括如下步骤：

S1、把社交网络数据中标记有社交信息标签的数据作为训练数据集；所述社交网络数据以社交网络图的形式存储，图中的每个节点代表一个用户，若用户与用户之间存在社交关系则在对应的两个用户节点之间建立边连接，若用户与用户之间不存在社交关系则在对应的两个用户节点之间不存在边连接；

S2、对训练数据集进行随机采样，形成不同批次的训练数据，每一个批次的训练数据构成一个社交图网络；

S3、根据预先设定的用户聚类数目，分别用一个第一图神经网络模为每个聚类簇的聚类中心，每个第一图神经网络的输入为社交图网络，输出为社交图网络中每个用户节点的社交信息标签；选择一个批次的训练数据迭代更新聚类中心，且聚类中心每更新一次，社交网络图中的所有用户节点需被更新划分至对该用户的标签预测准确度最高的第一图神经网络所在的聚类簇中，训练完毕后将社交网络图按照最终的聚类簇划分为多个子图；

S4、利用S3中当前输入批次的训练数据对应的各子图迭代训练第二图神经网络，第二图神经网络的输入为子图，输出为子图中每个节点的社交信息标签；

S5、利用S2中采集的不同批次的训练数据，通过不断执行S3和S4，迭代训练第二图神经网络，直至第二图神经网络收敛；

S6、利用训练得到的第二图神经网络对所述社交网络数据中的未知标签用户进行预测，得到各位置标签用户的社交信息标签。

在上述方案基础上，各步骤可以采用如下优选的具体方式实现。

作为上述第一份方面的优选，所述的S3具体包括以下子步骤：

S301、根据预先设定的用户聚类数目N，初始化N个图神经网络模型

作为N个聚类中心，其中θ_j为第j个图神经网络模型的参数；

S302、选择一个批次的训练数据作为输入，对当前输入批次的训练数据所对应的社交图网络G_t，初始化提取的图特征Ψ＝G_t，同时将社交图网络G_t中的所有用户节点初始化划分至当前最新的N个图神经网络模型

对应的聚类簇中；

S303、对每个聚类中心对应的图神经网络模型

通过最小化损失函数h_j(Ψ,Y)进行一轮更新：

其中Y是社交图网络G_t中用户节点的社交信息标签真值，Ψ是图神经网络模型中的特征提取操作，Ψ的输入是X_j和A，X_j是社交图网络G_t中当前属于第j个聚类簇的节点特征，A是社交图网络G_t中与X_j中所包含的节点相关的邻边数据，

输出社交图网络G_t中用户节点的社交信息标签预测值；

S304、根据S303中更新后的各聚类中心对应的图神经网络模型

对社交图网络G_t中的所有用户节点重新进行划分，每个用户节点被划分至对该用户节点的社交信息标签预测准确度最高的图神经网络模型所对应的聚类簇中；

S305、不断迭代重复S303和S304，从而将当前输入批次的训练数据中相似的图数据聚类在一起，而将不相似的图数据分隔开，迭代结束后以每一个聚类簇中的用户节点构建一个子图，子图中用户节点之间的边连接与社交图网络G_t一致。

作为上述第一份方面的优选，所述的S4中第二图神经网络的具体训练方法如下：

利用S3中基于当前输入批次的训练数据所得到的不同子图，训练第二图神经网络，更新图神经网络参数，训练采用的损失函数为：

其中：X^e,A^e分别是第e个子图中的节点特征和邻边数据；θ是第二图神经网络GNN的参数；

表示计算损失的期望，l表示损失计算函数；Y^e是第e个子图中用户节点的社交信息标签真值，GNN(Ψ(X^e,A^e)；θ)输出第e个子图中用户节点的社交信息标签预测值，e＝1,2,…,N。

作为上述第一份方面的优选，所述用户聚类数目N＝2～5。

作为上述第一份方面的优选，所述损失计算函数l为交叉熵损失函数。

作为上述第一份方面的优选，所述第一图神经网络和第二图神经网络均为带有分类器的图神经网络。

作为上述第一份方面的优选，所述社交网络数据中，两个用户之间存在社交关系和不存在社交关系分别表示这两个用户之间存在关联联系和不存在关联联系，用户的社交信息标签为用户的分类类型标签。

第二方面，本发明提供了一种面向社交网络分布外泛化的图神经网络预测***，其包括：

数据获取模块，用于把社交网络数据中标记有社交信息标签的数据作为训练数据集；所述社交网络数据以社交网络图的形式存储，图中的每个节点代表一个用户，若用户与用户之间存在社交关系则在对应的两个用户节点之间建立边连接，若用户与用户之间不存在社交关系则在对应的两个用户节点之间不存在边连接；

采样模块，用于对训练数据集进行随机采样，形成不同批次的训练数据，每一个批次的训练数据构成一个社交图网络；

子图划分模块，用于根据预先设定的用户聚类数目，分别用一个第一图神经网络模为每个聚类簇的聚类中心，每个第一图神经网络的输入为社交图网络，输出为社交图网络中每个用户节点的社交信息标签；选择一个批次的训练数据迭代更新聚类中心，且聚类中心每更新一次，社交网络图中的所有用户节点需被更新划分至对该用户的标签预测准确度最高的第一图神经网络所在的聚类簇中，训练完毕后将社交网络图按照最终的聚类簇划分为多个子图；

图网络更新模块，用于利用子图划分模块中当前输入批次的训练数据对应的各子图迭代训练第二图神经网络，第二图神经网络的输入为子图，输出为子图中每个节点的社交信息标签；

迭代训练模块，用于利用采样模块中采集的不同批次的训练数据，通过不断执行子图划分模块和图网络更新模块，迭代训练第二图神经网络，直至第二图神经网络收敛；

标签预测模块，用于利用训练得到的第二图神经网络对所述社交网络数据中的未知标签用户进行预测，得到各位置标签用户的社交信息标签。

第三方面，本发明提供了一种计算机可读存储介质，所述存储介质上存储有计算机程序，当所述计算机程序被处理器执行时，实现如第一方面中任一项所述的面向社交网络分布外泛化的图神经网络预测方法。

第四方面，本发明提供了一种计算机电子设备，其包括存储器和处理器；

所述存储器，用于存储计算机程序；

所述处理器，用于当执行所述计算机程序时，实现如第一方面中任一项所述的面向社交网络分布外泛化的图神经网络预测方法。

相对于现有技术而言，本发明提出了一种面向社交网络分布外泛化的图神经网络预测方法，该方法可以直接在图神经网络的表征层面进行不变学习，从而在不同分布的测试数据集上都可以进行稳定而准确的社交信息标签预测。本发明将图神经网络应用于分布外的社交网络预测，相比一般图神经网络算法，对训练数据分布外的数据具有更强的鲁棒性和准确率。

附图说明

图1是面向社交网络分布外泛化的图神经网络预测方法步骤示意图。

图2是面向社交网络分布外泛化的图神经网络预测方法流程示意图。

图3是面向社交网络分布外泛化的图神经网络预测***的模块组成示意图。

具体实施方式

下面结合附图和具体实施方式对本发明做进一步阐述和说明。

如图1所示，在本发明的一个较佳实施例中，提供了一种面向社交网络分布外泛化的图神经网络预测方法，该方法用于对社交网络数据中的无标签用户进行社交信息标签的预测。该预测方法具体包括如下步骤：

S1、把社交网络数据中标记有社交信息标签的数据作为训练数据集；所述社交网络数据以社交网络图的形式存储，图中的每个节点代表一个用户，若用户与用户之间存在社交关系则在对应的两个用户节点之间建立边连接，若用户与用户之间不存在社交关系则在对应的两个用户节点之间不存在边连接。

在本发明中，社交网络数据是反映用户的社交行为的数据，例如用户添加某位好友，用户删除某位好友等等，均可为构建社交网络提供构图依据。两个用户之间存在社交关系和不存在社交关系分别表示这两个用户之间存在关联联系和不存在关联联系，用户的社交信息标签为用户的分类类型标签。用户的社交信息标签是一种对用户进行画像时的分类类别标签，具体的标签形式可以根据实际的应用场景决定，例如用户喜欢的音乐类型标签、用户自身的研究领域标签等等。而且，用户之间的关联联系具体也可以根据实际应用场景决定，例如当标签形式为用户喜欢的音乐类型标签，用户之间的关联联系可以代表两个用户之间是否为好友，例如用户与其他用户如果是好友关系，则用户代表的节点与其他用户代表的节点之间有边作为连接，而不是好友关系，则没有边。在后续实例中，当标签形式为用户自身的研究领域标签，用户之间的关联联系可以代表两个用户之间是否有科研合作，例如出现合署论文等。

S2、对训练数据集进行随机采样，形成不同批次的训练数据，每一个批次的训练数据构成一个社交图网络。

需要说明的是，随机采样过程中，每一个批次的训练数据均为原始训练数据集的一部分，每一个批次的训练数据对应的社交图网络相当于原始训练数据集对应的社交图网络中的一部分。

S3、根据预先设定的用户聚类数目，分别用一个第一图神经网络模为每个聚类簇的聚类中心，每个第一图神经网络的输入为社交图网络，输出为社交图网络中每个用户节点的社交信息标签；选择一个批次的训练数据迭代更新聚类中心，且聚类中心每更新一次，社交网络图中的所有用户节点需被更新划分至对该用户的标签预测准确度最高的第一图神经网络所在的聚类簇中，训练完毕后将社交网络图按照最终的聚类簇划分为多个子图。

在本实施例中，上述步骤S3具体包括以下子步骤：

作为N个聚类中心，其中θ_j为第j个图神经网络模型的参数；

在本实施例中，上述步骤用户聚类数目可根据实际需要进行调整，可选的，N＝2～5。

对应的聚类簇中。

需要注意的是，此处所谓的“当前最新的N个图神经网络模型

”，对于第一轮训练而言就是S301中初始化的N个图神经网络模型

而对于其他训练轮数而言就是上一轮中训练后的N个图神经网络模型

S303、对每个聚类中心对应的图神经网络模型

通过最小化损失函数h_j(Ψ,Y)进行一轮更新：

输出社交图网络G_t中用户节点的社交信息标签预测值。

S304、根据S303中更新后的各聚类中心对应的图神经网络模型

需要说明的是，此处每个用户节点的聚类划分是以用户节点的社交信息标签预测准确度最高为基准的。在实际实现时，可以利用每一个图神经网络模型

对该用户节点的社交信息标签进行预测，获得其分类软标签即在不同标签类别上的概率分布，进而确定每一个图神经网络模型

下正确标签类别所对应的概率值，选择概率值最大的一个图神经网络模型

作为聚类中心，将该用户节点划分至对应的聚类簇中。

S4、利用S3中当前输入批次的训练数据对应的各子图迭代训练第二图神经网络，第二图神经网络的输入为子图，输出为子图中每个节点的社交信息标签。

在本实施例中，上述步骤S4中第二图神经网络的具体训练方法如下：

表示计算损失的期望，l表示损失计算函数；Y^e是第e个子图中用户节点的社交信息标签真值，第二图神经网络GNN(Ψ(X^e,A^e)；θ)基于X^e,A^e输出第e个子图中用户节点的社交信息标签预测值，e＝1,2,…,N。

在本实施例中，由于标签预测属于分类问题，因此损失计算函数l可采用交叉熵损失函数。

S5、利用S2中采集的不同批次的训练数据，通过不断执行S3和S4，迭代训练第二图神经网络，直至第二图神经网络收敛。

需要注意的是，基于实际的神经网络训练模式中，需要利用训练集进行训练，用验证集进行验证。因此，在实际应用时，可在S1中，把社交网络数据中打标签的数据作为训练数据集，随机抽样其中的30％作为数据作为验证数据集。在对S2中，亦可对训练数据集和验证数据集分别进行随机采样，形成不同批次的训练数据和验证数据，其训练流程如图2所示。训练数据和验证数据的具体划分和使用，与传统神经网络模型的训练类似，不再赘述。

在本实施例中，第一图神经网络和第二图神经网络均为带有分类器的图神经网络，即图神经网络中包含特征提取部分和分类器，先由特征提取部分提取图数据中的节点特征，再送入分类器中进行分类。图神经网络的具体结构属于现有技术，对此不再赘述。

同样的，基于同一发明构思，本发明的另一较佳实施例中还提供了与上述实施例提供的面向社交网络分布外泛化的图神经网络预测方法对应的一种面向社交网络分布外泛化的图神经网络预测***，如图3所示，该***包括：

由于本发明实施例中的面向社交网络分布外泛化的图神经网络预测***解决问题的原理与本发明上述实施例的面向社交网络分布外泛化的图神经网络预测方法相似，因此该实施例中***的各模块具体实现形式未尽之处亦可可以参见上述方法的具体实现形式，重复之处不再赘述。

同样的，基于同一发明构思，本发明的另一较佳实施例中还提供了与上述实施例提供的面向社交网络分布外泛化的图神经网络预测方法对应的一种电子设备，其包括存储器和处理器；

所述存储器，用于存储计算机程序；

所述处理器，用于当执行所述计算机程序时，实现如前所述的面向社交网络分布外泛化的图神经网络预测方法。

此外，上述的存储器中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。

由此，基于同一发明构思，本发明的另一较佳实施例中还提供了与上述实施例提供的面向社交网络分布外泛化的图神经网络预测方法对应的一种计算机可读存储介质，该所述存储介质上存储有计算机程序，当所述计算机程序被处理器执行时，能实现如前所述的面向社交网络分布外泛化的图神经网络预测方法。

具体而言，在上述两个实施例的计算机可读存储介质中，存储的计算机程序被处理器执行，可执行前述S1～S6的步骤。

可以理解的是，上述存储介质可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器。同时存储介质还可以是U盘、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

可以理解的是，上述的处理器可以是通用处理器，包括中央处理器(CentralProcessing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital SignalProcessing，DSP)、专用集成电路(Application Specific IntegratedCircuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

另外需要说明的是，所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的***的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。在本申请所提供的各实施例中，所述的***和方法中对于步骤或者模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块或步骤可以结合或者可以集成到一起，一个模块或者步骤亦可进行拆分。

下面利用前述实施例中S1～S6所示的面向社交网络分布外泛化的图神经网络方法，通过一个具体的应用实例来展示本发明在社交网络预测的具体效果。具体的方法步骤如前所述，不再赘述，下面仅展示其具体效果。

实施例

本实施例在公开的科研社交数据集Collab上进行实施及验证。图中每个节点对应于一个研究人员，即研究人员及其合作者是节点，边表示两个研究人员之间的互相认识，有科研合作。研究人员有三种代表研究领域的标签，即高能物理、凝聚态物理和天体物理，数据集由5000个研究人员的节点构成。算法的任务是给定研究人员的图数据，根据其与其他研究人员是否合作，预测其研究领域为高能物理、凝聚态物理和天体物理中的哪一种。

算法训练和测试中，将数据集中的10％作为有标签的训练集，剩余作为无标签的待预测的测试集。

为了客观评估本算法的性能，使用预测准确率(Accuracy)对该方法进行评价，并将其与目前广泛使用的图神经网络算法GCN和邻居聚合算法PNA进行对比。

所得实验结果如表1所示，结果表明，本发明的面向社交网络分布外泛化的图神经网络方法具有较高的准确率。

表1图数据的图预测分类准确率

以上所述的实施例只是本发明的一种较佳的方案，然其并非用以限制本发明。有关技术领域的普通技术人员，在不脱离本发明的精神和范围的情况下，还可以做出各种变化和变型。因此凡采取等同替换或等效变换的方式所获得的技术方案，均落在本发明的保护范围内。