CN111091005A

CN111091005A - 一种基于元结构的无监督异质网络表示学习方法

Info

Publication number: CN111091005A
Application number: CN201911327882.1A
Authority: CN
Inventors: 冯春燕; 楚云霏; 郭彩丽; 贺同泽
Original assignee: Beijing University of Posts and Telecommunications
Current assignee: Beijing University of Posts and Telecommunications
Priority date: 2019-12-20
Filing date: 2019-12-20
Publication date: 2020-05-01
Anticipated expiration: 2039-12-20
Also published as: CN111091005B

Abstract

本发明公开了一种基于元结构的无监督异质网络表示学习方法，属于人工智能领域。首先给出事件数据的定义，并构建针对事件数据的异质网络模型；采用元结构来描述事件数据中基于事件的关联关系类型，并基于给定的元结构进行邻居节点采样；提出基于元结构邻近度的网络表示学习模型，以捕捉单视角下基于事件语义的关联关系；提出融合多视角关联关系的网络表示学习模型，以捕捉多视角下基于事件语义的关联关系；最后用随机梯度下降法进行训练，得到各节点的特征向量表示。本发明提出用元结构描述复杂的事件语义关系，设计网络表示学习模型解决了事件数据缺乏标签、异质、关联多视角的挑战，提供了低复杂度的训练算法。

Description

一种基于元结构的无监督异质网络表示学习方法

技术领域

本发明属于人工智能领域，涉及网络表示学习，具体是一种基于元结构的无监督异质网络表示学习方法，该方法可以捕捉异质网络节点间的事件语义。

背景技术

互联网的普及以及社交媒体的井喷式发展，促使大量实体产生相互关联关系，组成了网络。独立同分布的假设在这种网络数据不再成立，使得传统的机器学习方法不再适用。

网络表示学习将相互关联的实体节点投射到低维稠密向量空间并保证尽可能多的蕴含原网络的信息，自动学习到网络中节点的特征表示，使得现成的机器学习算法可以直接运用于所学的节点表示上以实现节点分类、聚类、链接预测、数据可视化等数据挖掘任务，成为了人工智能领域面向网络数据挖掘的一种极具潜力的技术，受到学术界和工业界广泛关注。

在真实世界中，实体往往通过参与事件而产生关联，产生大量事件数据。相比于同类型的简单关联关系，如人与人之间的好友关系、文档中词语间的共现关系、互联网中页面的超链接关系等，事件数据中的关联关系更加复杂，具有以下四种特性。首先参与事件的实体往往为不同类型的，即这种关联关系为异质的，现成异质网络；其次，这种关联关系能反映出基于事件的语义信息；最后，实体参与的事件类型多样，形成了多视角的关联关系。除此之外，现实情况下，实体往往缺乏标签信息作为监督。

这些特性使得现有的网络表示学习方法难以适用。现有的网络表示学习方法按是否考虑节点类型可以分为同质网络表示学习和异质网络表示学习。同质网络表示学习方法忽略了节点的类型信息，同等对待不同类型的节点，导致语义信息捕捉不足。为解决这一问题，异质网络表示学习方法陆续提出，他们大多利用元路径结构，即由节点类型组成的序列结构来捕捉节点间关联的语义。然而复杂语义关系通常为子图结构，难以用路径结构捕捉，因此此类基于元路径的异质网络表示学习方法在捕捉复杂事件语义上受限。因此本发明研究一种可捕捉复杂事件关联关系的无监督异质网络表示学习方法以解决上述问题。

发明内容

本发明为了解决上述问题，提供了一种基于元结构的无监督异质网络表示学习方法，通过捕捉事件数据中的实体节点之间语义关系以解决缺乏标签信息的问题，将事件数据中的异质实体节点用异质网络描述以解决异质问题，提出采用元结构来捕捉节点间交互的事件语义，并采用联合训练的方式以整合多视角的关联关系。

具体步骤包括：

步骤一、构建针对事件数据的异质网络模型；

首先，将事件数据定义为实体通过参与事件产生的数据，用事件的集合

表示，其中e表示事件，

表示事件集合；每个事件e都有自己的事件类型

且描述了参与其中的实体节点的关联关系，定义为e＝{V_e,R_e}，其中V_e为节点集合，R_e为关系集合。

然后，给定事件数据

构建异质网络

来建模节点间关联，其中

表示节点集合，

表示关系集合。节点和关系有各自的类型映射函数

和

以指明节点和关系的类型。

步骤二、基于元结构的邻居节点采样；

给定建模后的异质网络

以及对应的节点类型集合

和关系类型集合

本发明采用元结构来描述事件数据中基于事件的关联关系类型。形式化地，元结构被定义为类型层面上的子图

其中

和

分别表示子图的节点集合和关系集合。

给定某个元结构

通过匹配符合元结构的子图实例来实现邻居节点采样，具体步骤如下：

步骤201、将给定的元结构

分解为多个元结构子图，记为{M_l}，其中M_l为第l个元结构子图，分解后使得复杂的元结构可表示成多个简单的元结构子图连结的序列，即

其中

为子图连结操作；

步骤202、为分解后的各个元结构子图M_l找到所有匹配的实例子图

其中

表示元结构子图M_l的实例集合；

步骤203、从各个元结构子图的实例子图中分别采样，连结起来得到最终属于元结构

的实例

及相应节点集合V_S；给定某个节点v，得到基于元结构的邻居节点集合N_s(v)＝V_s\{v}，

步骤三、基于元结构邻近度的网络表示学习模型；

给定节点v，其表示向量表示为z，为学习捕捉事件语义的节点表示向量，用某节点预测其邻居节点，则目标函数为可写作

经推导得到如下的目标函数：

步骤四、融合多视角关联关系的网络表示学习模型；

每个元结构表示一种视角下的关联关系，给定不同的元结构

采样他们各自的邻居节点集合，通过如下的目标函数实现多视角关联关系的融合：

步骤五、考虑到训练计算复杂度，对上述模型做近似改写，并用随机梯度下降法进行训练，得到各节点的向量表示；

改写后的模型为：

P_n为采样负样本的概率分布；

为sigmoid函数。

本发明的优点在于：

(1)一种基于元结构的无监督异质网络表示学习方法，将不同类型的相互关联的实体映射到统一的特征向量空间中，使得现成的机器学习算法可以运用于学习得到的节点向量上，方便实现各种数据挖掘任务；

(2)一种基于元结构的无监督异质网络表示学习方法，针对事件数据的关联复杂性，创新的引入元结构，设计了基于元结构的邻居采样算法，使得邻居间关系更能反映事件语义关系；

(3)一种基于元结构的无监督异质网络表示学习方法，创新的设计了基于元结构邻近度的网络表示学习模型，并在其基础上设计融合多视角关联关系的网络表示学习模型，使得所学节点向量得以捕捉多视角的事件语义关系；

(4)一种基于元结构的无监督异质网络表示学习方法，提供了低复杂度的近似模型以及相应的训练算法。

附图说明

图1为本发明针对事件数据构建的异质网络模型示意图；

图2为本发明提出的元结构示意图与传统元路径示意图；

图3为本发明一种基于元结构的无监督异质网络表示学习方法的摘要图；

图4为本发明提出的基于元结构的邻居节点采样示意图。

具体实施方式

为了使本发明能够更加清楚地理解其技术原理，下面结合附图具体、详细地阐述本发明实施例。

一种基于元结构的无监督异质网络表示学习方法(MGNE,Meta-Graph basedHeterogeneous Information Network Embedding)应用于描述实体之间相互关联关系的网络数据，将不同类型的实体投射到统一特征空间中，得到能捕捉事件语义的节点表示向量；首先本发明给出事件数据的定义，并针对事件数据构建异质网络模型；然后本发明采用元结构来描述事件数据中基于事件的关联关系类型，并设计基于元结构的邻居节点采样算法；根据邻居节点采样结果，设计基于元结构邻近度的网络表示学习模型，以学习捕捉事件语义的节点表示向量；为解决事件数据中多视角的关联关系捕捉问题，本发明设计融合多视角关联关系的网络表示学习模型；最后提供了低复杂度的近似模型以及相应的训练算法。

如图3所示，整体包括异质网络模型构建、基于元结构的邻居节点采样、基于元结构邻近度的网络表示学习模型、融合多视角关联关系的网络表示学习模型及模型训练五个步骤；其中基于元结构的邻居节点采样包括元结构分解、元结构子图匹配及实例采样三个步骤。

具体步骤如下：

步骤一、构建针对事件数据的异质网络模型；

相对于单一类型的相互关联关系，如人与人之间的好友关系、文档中词语间的共现关系、互联网中页面的超链接关系等，事件数据中实体的相互关联关系更为复杂。以描述论文发表的事件数据为例，示意图如图1所示，该事件数据涉及到四种实体及关系，描述了两类事件；

将事件数据定义为实体通过参与事件产生的数据，用事件的集合

表示。事件e属于某个事件类型，记为

其中函数τ(·)为事件类型映射函数，

表示事件类型的集合。事件e描述了参与其中的实体节点的关联关系，定义为e＝{V_e,R_e}，其中V_e为参与事件e的节点集合，R_e为事件e包含的关系集合；

给定事件数据

构建异质网络

来建模节点间关联，其中

表示节点集合，

表示关系集合，其中∪符号表示并集操作。节点和关系有各自的类型映射函数，即节点类型映射函数

和关系映射函数

它们分别指明节点和关系所属的类型，其中

为节点类型的集合，

为关系类型的集合。

步骤二、基于元结构的邻居节点采样；

给定建模后的异质网络

本发明采用元结构来描述事件数据中基于事件的关联关系类型。如图2所示，不同于元路径用节点类型序列来描述节点间的关联关系语义，元结构用子图来描述多个节点间更复杂的关联关系语义。形式化地，元结构被定义为类型层面上的子图

其中

和

分别表示子图的节点集合和关系集合。

如图4所示，基于元结构的邻居节点采样方法包含元结构分解、元结构子图匹配及实例采样三个步骤，具体步骤如下：

步骤201、元结构分解；

将给定的元结构

其中

为子图连结操作；

步骤202、元结构子图匹配；

为分解后的各个元结构子图M_l找到所有匹配的实例子图

其中

表示元结构子图M_l的实例集合；该步骤可采用任何常用的子图匹配算法，本发明采用了一种高效的元结构图匹配算法SubMatch工具。

步骤203、实例采样；

首先从根据元结构定义起始节点类型，如图4所示的示例中，

的起始节点类型为作者A；

从类型为起始节点类型的节点集合中，采样一个节点作为起始节点n_start，采样概率为

其中|·|为取集合元素个数的运算，

为起始节点类型的节点集合；如图4示例中，节点类型为作者A的节点个数为3，因此采样节点a₁的概率为

给定起始节点n_start和即将采样的元结构子图M₁，本发明采用随机均匀采样，则采样到子图实例S的概率为

其中

表示起始节点n_start的符合元结构子图M₁的邻居子图；如图4示例中，由于起始节点a₁的符合元结构子图M₁的邻居子图有S_1,1和S_1,2，其中S_i,j代表符合第i个元结构子图的第j个实例子图，因此给定起始节点a₁和元结构子图M₁采样出S_1,1的概率为

取采样得到的元结构子图的终止节点，作为当下元结构子图与下个即将采样的元结构子图的连结节点，如图4示例中的p₁和p₂；

给定第l个连结节点n_l和即将采样的元结构子图M_l，本发明采用随机均匀采样，则采样到子图实例S的概率为

其中

表示连结节点n_l的符合元结构子图M_l的邻居子图；如图4示例中，给定连结节点p₁和元结构子图M₂采样出S_2,2的概率为

给定连结节点p₂和元结构子图M₃采样出S_3,2的概率为Pr(S_3,2|p₂,M₃)＝1；

最后实例采样的概率用如下公式计算：

其中L为分解的元结构子图个数，第一个连结节点n₁定义为起始节点n_start；

将采样的各个元结构子图实例用连结节点连结起来得到最终属于元结构

的实例

及相应节点集合V_S；

给定某个节点v，得到基于元结构的邻居节点集合N_s(v)＝V_s\{v}，

其中

表示元结构子图

的实例集合，N_S(v)表示节点v在子图S下的邻居节点集合，\为取集合差集操作。

步骤三、基于元结构邻近度的网络表示学习模型；

首先本发明提出基于元结构的邻近度：给定元结构

及异质网络中两个节点(v_i,v_j)，如果存在包含这两个节点的元结构

的实例，那么它们存在基于元结构

的邻近度，否则它们基于元结构

的邻近度为0；

为捕捉基于元结构的邻近度，设计一个给定元结构

预测该元结构下邻居节点的目标函数：

其中

表示元结构子图

的实例集合，N_S(v)表示节点v在子图S下的邻居节点集合，P(N_S(v)|v；z)表示给定节点v及其表示z预测其邻居节点集合N_S(v)的条件概率，其计算方式如下：

P(c|v；z)为预测邻居节点c的条件概率，用如下softmax函数计算：

经推导得到如下的目标函数：

该模型学习反映单视角关联关系的网络表示。

步骤四、融合多视角关联关系的网络表示学习模型；

每个元结构表示一种视角下的关联关系，给定不同的元结构

步骤五、模型训练；

上述模型中的

计算复杂度过高，本发明采用负采样方法对上述模型做近似改写；对于每一对节点-邻居样本对(v,c)，采样N个负样本对(v,u_n)，其中u_n为节点v对应的负样本节点，改写后的模型为：

P_n为采样负样本的概率分布；

为sigmoid函数。

采用随机梯度下降法对模型进行训练；

训练步骤如下所示：

(1)从给定的元结构集合

中随机均匀采样一个元结构

(2)按照上述基于元结构的邻居节点采样，采样出一个属于元结构

的实例子图S；

(3)随机初始化所有节点的表示向量z_v,v∈V；

(4)对于子图S的节点集合V_S，选取任意一对节点(v,c)；

(5)更新z_c，即z_c←z_c+α(1-σ(z_v ^Tz_c))z_v，α为学习率；

(6)从概率分布P_n中随机采样负样本节点u_n，更新

即

α为学习率；重复N次；

(7)更新z_v，即

α为学习率；

(8)返回步骤(4)，直至V_S内节点对遍历完毕；

(9)返回步骤(1)，直至达到预设迭代次数；

(10)返回所有节点的表示向量z_v,v∈V。

综上所述，通过实施本发明一种基于元结构的无监督异质网络表示方法，通过捕捉事件数据中的实体节点之间语义关系以解决缺乏标签信息的问题，将事件数据中的异质实体节点用异质网络描述以解决异质问题，提出采用元结构来捕捉节点间交互的事件语义，并采用联合训练的方式以整合多视角的关联关系；相比于同质网络表示学习方法，本发明设计的方法，可以将不同类型的节点映射到统一的特征向量空间中，使得现成的机器学习算法可以直接运用，并且本发明方法无需利用标签信息，属于无监督的方法；相比于其他基于元路径的异质网络表示学习方法，本发明所设计的方法可以更好的捕捉复杂的事件语义关联关系。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也视为本发明的保护范围。