CN109063041A - 关系网络图嵌入的方法及装置 - Google Patents

关系网络图嵌入的方法及装置 Download PDF

Info

Publication number
CN109063041A
CN109063041A CN201810784744.5A CN201810784744A CN109063041A CN 109063041 A CN109063041 A CN 109063041A CN 201810784744 A CN201810784744 A CN 201810784744A CN 109063041 A CN109063041 A CN 109063041A
Authority
CN
China
Prior art keywords
node
vector
neighbor
association
strength
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810784744.5A
Other languages
English (en)
Other versions
CN109063041B (zh
Inventor
向彪
刘子奇
周俊
李小龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201810784744.5A priority Critical patent/CN109063041B/zh
Publication of CN109063041A publication Critical patent/CN109063041A/zh
Priority to TW108115553A priority patent/TWI700599B/zh
Priority to PCT/CN2019/089022 priority patent/WO2020015464A1/zh
Application granted granted Critical
Publication of CN109063041B publication Critical patent/CN109063041B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书实施例提供一种将关系网络图嵌入到多维空间的方法和装置,在该方法中,首先随机确定各个节点i在多维空间的初始嵌入向量Ci,然后对于各个节点i,获取其邻居节点,以及与各个邻居节点之间的关联强度。此外,还确定节点i的各个邻居节点的当前嵌入向量。基于预定的衰减系数、上述关联强度以及邻居节点的当前位置,形成节点i的位置初始项和位置偏移项,并据此确定节点i的当前嵌入向量。反复执行上述步骤直到收敛条件得到满足,此时即可以确定各个节点i在多维空间的嵌入向量。如此,高效地将关系网络图嵌入到多维空间中。

Description

关系网络图嵌入的方法及装置
技术领域
本说明书一个或多个实施例涉及计算机信息处理领域,尤其涉及关系网络图嵌入的方法和装置。
背景技术
关系网络图是对现实世界中实体之间的关系的描述,目前广泛地应用于各种计算机信息处理中。一般地,关系网络图包含一个节点集合和一个边集合,节点表示现实世界中的实体,边表示现实世界中实体之间的联系。例如,在社交网络中,人就是实体,人和人之间的关系或联系就是边。
在许多情况下,希望将关系网络图中的每个节点(实体)用多维空间中的坐标值来表示,也就是将各个节点映射到一个多维空间中,用多维空间中的点代表图中的节点。多维空间可以是2维、3维空间,也可以是更高维空间。用多维空间的坐标来表达图中的节点,可以应用于计算节点和节点之间的相似度,发现图中的社团结构,预测未来可能形成的边联系,以及对图进行可视化等。将图中的节点映射到多维空间的过程称为图嵌入。
图嵌入是一种非常重要的基础技术能力。当前学术界已研究出多种图嵌入方法,如DeepWalk,node2vec,GraphRep等。但由于这些算法内部均采用了蒙特卡洛采样方法,计算效率比较低。当图的规模变得很大时(如支付宝朋友关系网络有5亿以上节点),进行图嵌入计算将耗费巨大的计算资源。
因此,希望能有改进的方案,更加快速有效地进行关系网络图的图嵌入过程。
发明内容
本说明书一个或多个实施例描述了一种关系网络图的图嵌入方法,可以高效地将复杂关系网络图中的节点嵌入到多维空间中,以便于后续的信息处理。
根据第一方面,提供了一种将关系网络图嵌入到多维空间的方法,所述关系网络图包括多个节点,所述多个节点中具有关联关系的节点以一定关联强度互相连接,所述方法包括:
随机确定所述多个节点中各个节点i在多维空间的初始嵌入向量Ci;
对于各个节点i,获取与该节点i相连接的邻居节点,以及该节点i与各个邻居节点之间的关联强度;
确定该节点i的各个邻居节点的当前嵌入向量;
获取该节点i的位置初始项和位置偏移项,并根据所述位置初始项和位置偏移项,确定节点i的当前嵌入向量Ei,其中所述位置初始项基于所述初始嵌入向量Ci而确定,所述位置偏移项根据预定衰减系数α、所述各个邻居节点的当前嵌入向量以及该节点i与各个邻居节点之间的关联强度而确定;
判断预定收敛条件是否得到满足,在不满足该预定收敛条件的情况下,再次确定该节点i的各个邻居节点的当前嵌入向量,以及再次确定节点i的当前嵌入向量Ei,直到该预定收敛条件得到满足;
至少基于满足所述预定收敛条件的各个节点i的当前嵌入向量Ei,确定各个节点i在所述多维空间的嵌入向量。
根据一种实施方式,通过以下方式获取节点i的邻居节点信息:
获取记录所述关系网络图的网络关系的邻接矩阵,邻接矩阵中第m行第k列的元素对应于第m节点与第k节点之间的关联强度;
通过所述邻接矩阵,确定节点i的邻居节点,以及节点i与各个邻居节点之间的关联强度。
进一步地,通过邻接矩阵确定节点i的各个邻居节点,以及各个关联强度包括:
获取邻接矩阵中与节点i对应的第i行元素或第i列元素;
将所述第i行元素或第i列元素中非零元素对应的节点确定为节点i的邻居节点;将所述非零元素的值确定为节点i与对应邻居节点之间的关联强度。
根据一个实施例,位置初始项基于初始嵌入向量Ci以及所述预定衰减系数而确定。
在一个实施例中,通过以下方式获取节点i的位置偏移项:
以节点i与各个邻居节点之间的关联强度为权重,对各个邻居节点的当前嵌入向量求和,确定邻居中心位置;
至少基于所述预定衰减系数α,所述邻居中心位置,确定所述位置偏移项。
在另一实施例中,通过以下方式获取节点i的位置偏移项:
确定节点i与其所有邻居节点的关联强度的和值;
确定节点i与各个邻居节点之间的关联强度与所述和值的比例,作为相对关联强度;
以所述相对关联强度为权重,对各个邻居节点的当前嵌入向量求和,确定邻居中心位置;
将邻居中心位置与所述预定衰减系数α的乘积,作为所述位置偏移项。
根据一种可能的设计,上述预定收敛条件可以是:对于每个节点,本次确定的当前嵌入向量与前次确定的当前嵌入向量的差值小于第一预定值;或者,各个节点的本次确定的当前嵌入向量与前次确定的当前嵌入向量的差值的总和小于第二预定值。
根据另一种可能的设计,上述预定收敛条件可以是,确定各个节点i的当前嵌入向量Ei的次数达到预定次数阈值。
在一个实施例中,将节点i的嵌入向量确定为,满足所述预定收敛条件时节点i的当前嵌入向量Ei与其位置初始项之差。
根据第二方面,提供一种将关系网络图嵌入到多维空间的装置,所述关系网络图包括多个节点,所述多个节点中具有关联关系的节点以一定关联强度互相连接,所述装置包括:
初始位置确定单元,配置为随机确定所述多个节点中各个节点i在多维空间的初始嵌入向量Ci;
邻居节点确定单元,配置为对于各个节点i,获取与该节点i相连接的邻居节点,以及该节点i与各个邻居节点之间的关联强度;
邻居位置确定单元,配置为确定该节点i的各个邻居节点的当前嵌入向量;
节点位置确定单元,配置为获取该节点i的位置初始项和位置偏移项,并根据所述位置初始项和位置偏移项,确定节点i的当前嵌入向量Ei,其中所述位置初始项基于所述初始嵌入向量Ci而确定,所述位置偏移项根据预定衰减系数α、所述各个邻居节点的当前嵌入向量以及该节点i与各个邻居节点之间的关联强度而确定;
条件判定单元,配置为判断预定收敛条件是否得到满足,在不满足该预定收敛条件的情况下,使得所述邻居位置确定单元再次确定该节点i的各个邻居节点的当前嵌入向量,所述节点位置确定单元再次确定节点i的当前嵌入向量Ei,直到该预定收敛条件得到满足;
嵌入位置确定单元,配置为至少基于满足所述预定收敛条件的各个节点i的当前嵌入向量Ei,确定各个节点i在所述多维空间的嵌入向量。
根据第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。
根据第四方面,提供了一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。
通过本说明书实施例提供的方法和装置,可以高效地将关系网络图嵌入到多维空间中,便于后续的节点信息处理。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本说明书披露的一个实施例的关系网络图的示意图;
图2示出根据一个实施例的将关系网络图嵌入到多维空间的方法;
图3示出嵌入到二维空间的关系网络图的示例;
图4示出根据一个实施例的图嵌入装置的示意性框图。
具体实施方式
下面结合附图,对本说明书提供的方案进行描述。
图1为本说明书披露的一个实施例的关系网络图的示意图。如图1所示,该关系网络图包括多个节点,为了清楚起见,图1中为这些节点进行了编号。在这些节点中,具有关联关系的节点之间用边进行连接。在一个例子中,图1中的节点表示社交网络中的人或用户,两个节点之间通过边连接起来,即表示对应的两个用户存在社交上的关联,例如转账、留言、通讯等等。
在一个实施例中,节点之间的关联关系还具有不同的关联强度。例如,在一个例子中,针对不同的社交交互行为,设定不同的关联强度,比如,进行转账交互的用户的关联强度为0.8,进行留言操作的用户的关联强度为0.5,等等。在一个实施例中,在关联关系具有不同关联强度的情况下,可以利用边的属性或边的权值来表示该边所连接的两个用户之间的关联强度。
在图1中的关系网络图中,为了示出各个节点以及节点间的连接关系,而示意性地示出各个节点的位置。实际上,网络关系图并不对节点的位置进行设置。对于节点的位置,需要采用图嵌入的方法,将各个节点映射到多维空间中。下面描述本说明书实施例所提供的图嵌入的方法。
图2示出根据一个实施例的将关系网络图嵌入到多维空间的方法,其中关系网络图包括多个节点,多个节点中具有关联关系的节点以一定关联强度互相连接。上述方法可以由任何具有计算、处理能力的装置、设备、平台、设备集群执行。如图2所示,所述方法包括:步骤21,随机确定多个节点中各个节点i在多维空间的初始嵌入向量Ci;步骤22,对于各个节点i,获取与该节点i相连接的邻居节点,以及该节点i与各个邻居节点之间的关联强度;步骤23,确定该节点i的各个邻居节点的当前嵌入向量;步骤24,获取该节点i的位置初始项和位置偏移项,并根据所述位置初始项和位置偏移项,确定节点i的当前嵌入向量Ei,其中所述位置初始项基于所述初始嵌入向量Ci而确定,所述位置偏移项根据预定衰减系数α、所述各个邻居节点的当前嵌入向量以及该节点i与各个邻居节点之间的关联强度而确定;步骤25,判断预定收敛条件是否得到满足;如果不满足预定收敛条件,则再次确定该节点i的各个邻居节点的当前嵌入向量,以及再次确定节点i的当前嵌入向量Ei,直到该预定收敛条件得到满足;步骤26,至少基于满足所述预定收敛条件的各个节点i的当前嵌入向量Ei,确定各个节点i在多维空间的嵌入向量。下面描述以上各个步骤的执行方式。
首先,在步骤21,随机确定关系网络图的多个节点中各个节点i在多维空间的初始嵌入向量Ci。假定关系网络图包含N个节点,要嵌入的多维空间的维数为s,那么针对N个节点中的每个节点i,为其随机生成一个s维向量Ci,作为其初始嵌入向量。
另一方面,在步骤22,对于各个节点i,获取与该节点i相连接的邻居节点,以及该节点i与各个邻居节点之间的关联强度。
可以理解,在关系网络图中,具有关联关系的节点之间会互相连接,互相连接的节点之间,互为邻居节点。另外,可以理解,关系网络图的拓扑结构可以通过多种方式记录。例如,在一个示例中,通过图表记录关系网络图的连接关系。此时,可以从上述图表中读取各个节点i的邻居节点信息,以及节点i与邻居节点之间的关联强度。
在一个实施例中,通过矩阵来记录关系网络图的连接关系。例如,描述一个关系网络图的矩阵可以有邻接矩阵,度矩阵,拉普拉斯矩阵等。在一个示例中,通过记录关系网络图的网络关系的邻接矩阵来获取节点的邻居信息和关联强度信息。
具体地,假定矩阵A是关系网络图G的邻接矩阵,矩阵A可以表示为:
A=[amk]N*N
其中,第m行第k列的元素amk对应于节点m与节点k之间的关联强度。
如果两个节点之间没有连接,不存在关联关系,那么它们之间的关联强度为0。
通过这样的邻接矩阵,可以简单地获取各个节点的邻居信息和关联强度信息。具体地,对于节点i,获取邻接矩阵A中与节点i对应的第i行元素或第i列元素,即aij或aji;将第i行元素或第i列元素中非零元素对应的节点j确定为节点i的邻居节点,并将非零元素的值确定为节点i与对应邻居节点之间的关联强度。
在确定出各个节点i的邻居节点j的基础上,在步骤23,确定节点i的各个邻居节点j的当前嵌入向量Ej。
可以理解,由于在步骤21为每个节点都随机产生了初始嵌入向量,在第一次执行该步骤23时,对于未更新过当前嵌入向量的邻居节点j,其当前嵌入向量Ej即其对应的初始嵌入向量Cj。各个节点的当前嵌入向量会在后续进行迭代更新,这将在后续步骤中展开描述。
基于步骤22和步骤23针对节点i获得的相关信息,在步骤24,确定节点i的当前嵌入向量Ei。具体地,节点i的当前嵌入向量Ei可以认为由两部分组成:位置初始项VI和位置偏移项VD:
Ei=VI+VD,
其中位置初始项VI基于初始嵌入向量Ci而确定,位置偏移项VD根据预定衰减系数α、各个邻居节点j的当前嵌入向量Ej以及该节点i与各个邻居节点之间的关联强度aij而确定。
在一个实施例中,节点i的位置初始项VI即为其初始嵌入向量Ci,即:
VI=Ci。
在另一实施例中,初始位置项可以是初始嵌入向量Ci乘以一定系数。例如,该系数可以与在位置偏移项中引入的衰减系数α有关。因此,在一个实施例中,可以基于初始嵌入向量Ci以及该衰减系数α,确定位置初始项。具体地,在一个例子中,将位置初始项VI确定为:
VI=(1-α)Ci
一般地,位置初始项一旦确定,在后续更新迭代过程中固定不变。
另一方面,还要确定节点i的位置偏移项VD。根据说明书的至少一个实施例,根据预定衰减系数α、各个邻居节点j的当前嵌入向量Ej以及该节点i与各个邻居节点之间的关联强度aij来确定位置偏移项VD。
其中衰减系数α用于调节位置偏移调整的步长或大小,一般被预设为0到1之间的数值。
在一个实施例中,以节点i与各个邻居节点j之间的关联强度aij为权重,对各个邻居节点j的当前嵌入向量Ej求和,确定邻居中心位置;然后基于预定衰减系数α,上述邻居中心位置,确定位置偏移项VD。
在一个例子中,根据上述思想,将位置偏移项VD确定为:
其中N(i)表示节点i的邻居节点集合。
以上VD的计算方式比较适合于关联强度aij本身就定义在0到1之间的情况。如果关联强度aij的范围较大,可以在预先设定衰减系数的时候,将其设定为较小的数值。
在另一实施例中,通过以下方式确定节点i的位置偏移项VD:确定节点i与其所有邻居节点j的关联强度的和值di;确定节点i与各个邻居节点j之间的关联强度aij与所述和值di的比例,作为相对关联强度;以所述相对关联强度为权重,对各个邻居节点j的当前嵌入向量Ej求和,确定邻居中心位置;将邻居中心位置与预定衰减系数α的乘积,作为位置偏移项VD。
在一个例子中,根据上述思想,将位置偏移项VD确定为:
其中:
如此,考虑节点i与各个邻居节点j的关联强度,确定节点i的邻居中心位置,然后以衰减系数作为调节,确定位置偏移项VD,如此,该位置偏移项VD可以反映向邻居中心偏移的距离。
根据一个具体例子,结合前述的位置初始项,以及如上所述根据相对关联强度确定的位置偏移项,可以将节点i的当前嵌入向量Ei确定为:
以上描述了多种确定节点i的当前嵌入向量Ei的方式。
根据任一方式,对于关系网络图中的每个节点i执行以上的步骤23和24,从而为每个节点确定出当前嵌入向量。
接着,在步骤25,判断预定收敛条件是否得到满足。如果不满足预定收敛条件,则返回到步骤23和步骤24,再次确定节点i的各个邻居节点的当前嵌入向量,以及再次确定节点i的当前嵌入向量Ei。
可以理解,以上的步骤23和24是针对关系网络图中每个节点执行,因此每次执行步骤23和24的循环,各个节点的当前嵌入向量都会得到更新。相应地,在第n+1次执行步骤23时,对于同一节点i,其邻居节点j的当前嵌入向量Ej与第n次执行时有所不同,实际上在第n+1次执行时使用的是,第n次执行完步骤24时各个节点的当前嵌入向量。这样,步骤24中的位置偏移项在每次执行上述循环时都会发生改变,进而使得各个节点i的当前嵌入向量不断得到更新。
这样的循环反复执行,直到预定收敛条件得到满足。
在一个实施例中,预定收敛条件根据偏移调整量而设置,所述偏移调整量对应于本次确定的位置与前次确定的位置之间的偏移。
具体地,在一个实施例中,预定收敛条件可以设置为,对于每个节点,本次确定的当前嵌入向量与前次确定的当前嵌入向量的差值小于第一预定值。例如,对于关系网络图中的N个节点,如果每个节点的当前嵌入向量相对于上一次确定的嵌入向量之间的差值,也就是偏移距离,都小于一个距离阈值,那么说明,节点的位置调整已经小到一定程度,节点的位置趋于稳定和收敛,从而达到收敛条件。
在另一实施例中,预定收敛条件可以设置为,各个节点的本次确定的当前嵌入向量与前次确定的当前嵌入向量的差值的总和小于第二预定值。也就是说,考虑N个节点的偏移距离的总和DT:
其中Di为节点i的偏移距离,即当前嵌入向量相对于上一次确定的嵌入向量之间的差值。
当偏移距离的总和DT小于某个阈值,那么说明,节点的总***置调整较小,节点的位置趋于稳定和收敛,从而达到收敛条件。
在另一实施例中,还可以根据经验,预设循环的执行次数作为收敛条件。也就是说,当确定各个节点i的当前嵌入向量Ei的次数达到预定次数阈值,即认为满足收敛条件。根据经验,上述执行次数一般可以设置为10-20次之间。
如果收敛条件得到满足,那么退出循环,进入步骤26,至少基于满足预定收敛条件的各个节点i的当前嵌入向量Ei,确定各个节点i在多维空间的嵌入向量Qi。
在一个实施例中,将满足收敛条件的各个节点i的当前嵌入向量Ei,作为其嵌入向量Qi,即Qi=Ei。
在另一实施例中,为了减少最初随机产生的初始嵌入向量的影响,将节点i的嵌入向量确定为,满足预定收敛条件时节点i的当前嵌入向量Ei与其位置初始项之差,即:
Qi=Ei-VI
其中VI与初始嵌入向量Ci相关联,例如等于Ci,或者等于Ci乘以一定系数,比如(1-α)Ci。
如此,确定了各个节点i在多维空间的嵌入向量。
基于这样确定的嵌入向量,就可以将关系网络图中的节点嵌入到多维空间中。嵌入到多维空间中的节点具有了位置信息,并且由于嵌入过程中考虑了节点之间的连接关系和连接强度,因此其位置信息中也体现了节点之间的关联关系。例如,多维空间中位置相近的节点之间,关联关系更强。如此,非常有利于后续对节点关系信息的进一步处理,例如对节点进行聚类,发现节点形成的团体,计算节点之间的相似度,预测节点潜在的边联系,等等。当将关系网络图嵌入到二维空间或三维空间时,还非常有利于对关系网络的可视化呈现。
图3示出嵌入到二维空间的关系网络图的示例。更具体地,图3是采用图2所示的方法,将图1的关系网络图嵌入到二维空间的示例。相比于图1中出于示意而随意摆放的节点,图3中节点的位置含有更多的信息量,体现了节点之间的关联关系。一些节点之间位置非常靠近,意味着,这些节点之间具有更强的关联关系。并且,从节点位置分布上也可以看出,节点会呈现潜在的节点簇。这样的信息都会有利于对关系网络中节点信息的进一步处理。
根据另一方面,本说明书的实施例还提供一种将关系网络图嵌入到多维空间的装置,其中有待嵌入的关系网络图包括多个节点,多个节点中具有关联关系的节点以一定关联强度互相连接。图4示出根据一个实施例的图嵌入装置的示意性框图。如图4所示,图嵌入装置400包括:初始位置确定单元41,配置为随机确定所述多个节点中各个节点i在多维空间的初始嵌入向量Ci;邻居节点确定单元42,配置为对于各个节点i,获取与该节点i相连接的邻居节点,以及该节点i与各个邻居节点之间的关联强度;邻居位置确定单元43,配置为确定该节点i的各个邻居节点的当前嵌入向量;节点位置确定单元44,配置为获取该节点i的位置初始项和位置偏移项,并根据所述位置初始项和位置偏移项,确定节点i的当前嵌入向量Ei,其中所述位置初始项基于所述初始嵌入向量Ci而确定,所述位置偏移项根据预定衰减系数α、所述各个邻居节点的当前嵌入向量以及该节点i与各个邻居节点之间的关联强度而确定;条件判定单元45,配置为判断预定收敛条件是否得到满足,在不满足该预定收敛条件的情况下,使得所述邻居位置确定单元再次确定该节点i的各个邻居节点的当前嵌入向量,所述节点位置确定单元再次确定节点i的当前嵌入向量Ei,直到该预定收敛条件得到满足;以及嵌入位置确定单元46,配置为至少基于满足所述预定收敛条件的各个节点i的当前嵌入向量Ei,确定各个节点i在所述多维空间的嵌入向量。
根据一种实施方式,邻居节点确定单元42配置为:获取记录所述关系网络图的网络关系的邻接矩阵,所述邻接矩阵中第m行第k列的元素对应于第m节点与第k节点之间的关联强度;通过所述邻接矩阵,确定节点i的邻居节点,以及节点i与各个邻居节点之间的关联强度。
进一步地,在一个具体例子中,所述邻居节点确定单元42通过以下方式确定邻居节点信息:获取所述邻接矩阵中与节点i对应的第i行元素或第i列元素;将所述第i行元素或第i列元素中非零元素对应的节点确定为节点i的邻居节点;将所述非零元素的值确定为节点i与对应邻居节点之间的关联强度。
在一个实施例中,节点位置确定单元44包括,初始项确定模块441,配置为基于所述初始嵌入向量Ci以及所述预定衰减系数,确定所述位置初始项。
在一个实施例中,节点位置确定单元44包括偏移项确定模块442,用于确定偏移项。
在一个例子中,偏移项确定模块442配置为:以节点i与各个邻居节点之间的关联强度为权重,对各个邻居节点的当前嵌入向量求和,确定邻居中心位置;至少基于所述预定衰减系数α,所述邻居中心位置,确定所述位置偏移项。
在另一例子中,偏移项确定模块442配置为:确定节点i与其所有邻居节点的关联强度的和值;确定节点i与各个邻居节点之间的关联强度与所述和值的比例,作为相对关联强度;以所述相对关联强度为权重,对各个邻居节点的当前嵌入向量求和,确定邻居中心位置;将邻居中心位置与所述预定衰减系数α的乘积,作为所述位置偏移项。
根据一种可能的设计,条件判定单元45所依据的预定收敛条件可以是:对于每个节点,本次确定的当前嵌入向量与前次确定的当前嵌入向量的差值小于第一预定值;或者,各个节点的本次确定的当前嵌入向量与前次确定的当前嵌入向量的差值的总和小于第二预定值。
根据一种可能的设计,预定收敛条件也可以是,确定各个节点i的当前嵌入向量Ei的次数达到预定次数阈值。
在一个实施例中,嵌入位置确定单元46配置为,将节点i的嵌入向量确定为,满足所述预定收敛条件时节点i的当前嵌入向量Ei与其位置初始项之差。
通过以上的方法和装置,可以快速有效地将复杂的关系网络图嵌入到任意维度的多维空间中,从而便于后续的节点信息处理。
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图2所描述的方法。
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图2所述的方法。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

Claims (20)

1.一种将关系网络图嵌入到多维空间的方法,所述关系网络图包括多个节点,所述多个节点中具有关联关系的节点以一定关联强度互相连接,所述方法包括:
随机确定所述多个节点中各个节点i在多维空间的初始嵌入向量Ci;
对于各个节点i,获取与该节点i相连接的邻居节点,以及该节点i与各个邻居节点之间的关联强度;
确定该节点i的各个邻居节点的当前嵌入向量;
获取该节点i的位置初始项和位置偏移项,并根据所述位置初始项和位置偏移项,确定节点i的当前嵌入向量Ei,其中所述位置初始项基于所述初始嵌入向量Ci而确定,所述位置偏移项根据预定衰减系数α、所述各个邻居节点的当前嵌入向量以及该节点i与各个邻居节点之间的关联强度而确定;
判断预定收敛条件是否得到满足,在不满足该预定收敛条件的情况下,再次确定该节点i的各个邻居节点的当前嵌入向量,以及再次确定节点i的当前嵌入向量Ei,直到该预定收敛条件得到满足;
至少基于满足所述预定收敛条件的各个节点i的当前嵌入向量Ei,确定各个节点i在所述多维空间的嵌入向量。
2.根据权利要求1所述的方法,其中获取与该节点i相连接的邻居节点,以及该节点i与各个邻居节点之间的关联强度包括:
获取记录所述关系网络图的网络关系的邻接矩阵,所述邻接矩阵中第m行第k列的元素对应于第m节点与第k节点之间的关联强度;
通过所述邻接矩阵,确定节点i的邻居节点,以及节点i与各个邻居节点之间的关联强度。
3.根据权利要求2所述的方法,其中通过所述邻接矩阵,确定节点i的邻居节点,以及节点i与各个邻居节点之间的关联强度包括:
获取所述邻接矩阵中与节点i对应的第i行元素或第i列元素;
将所述第i行元素或第i列元素中非零元素对应的节点确定为节点i的邻居节点;将所述非零元素的值确定为节点i与对应邻居节点之间的关联强度。
4.根据权利要求1所述的方法,其中所述获取该节点i的位置初始项包括,基于所述初始嵌入向量Ci以及所述预定衰减系数,确定所述位置初始项。
5.根据权利要求1所述的方法,其中获取该节点i的位置偏移项包括:
以节点i与各个邻居节点之间的关联强度为权重,对各个邻居节点的当前嵌入向量求和,确定邻居中心位置;
至少基于所述预定衰减系数α,所述邻居中心位置,确定所述位置偏移项。
6.根据权利要求1所述的方法,其中获取该节点i的位置偏移项包括:
确定节点i与其所有邻居节点的关联强度的和值;
确定节点i与各个邻居节点之间的关联强度与所述和值的比例,作为相对关联强度;
以所述相对关联强度为权重,对各个邻居节点的当前嵌入向量求和,确定邻居中心位置;
将邻居中心位置与所述预定衰减系数α的乘积,作为所述位置偏移项。
7.根据权利要求1所述的方法,其中所述预定收敛条件包括:
对于每个节点,本次确定的当前嵌入向量与前次确定的当前嵌入向量的差值小于第一预定值;或者
各个节点的本次确定的当前嵌入向量与前次确定的当前嵌入向量的差值的总和小于第二预定值。
8.根据权利要求1所述的方法,其中所述预定收敛条件包括:确定各个节点i的当前嵌入向量Ei的次数达到预定次数阈值。
9.根据权利要求1所述的方法,其中确定各个节点i在所述多维空间的嵌入向量包括,将节点i的嵌入向量确定为,满足所述预定收敛条件时节点i的当前嵌入向量Ei与其位置初始项之差。
10.一种将关系网络图嵌入到多维空间的装置,所述关系网络图包括多个节点,所述多个节点中具有关联关系的节点以一定关联强度互相连接,所述装置包括:
初始位置确定单元,配置为随机确定所述多个节点中各个节点i在多维空间的初始嵌入向量Ci;
邻居节点确定单元,配置为对于各个节点i,获取与该节点i相连接的邻居节点,以及该节点i与各个邻居节点之间的关联强度;
邻居位置确定单元,配置为确定该节点i的各个邻居节点的当前嵌入向量;
节点位置确定单元,配置为获取该节点i的位置初始项和位置偏移项,并根据所述位置初始项和位置偏移项,确定节点i的当前嵌入向量Ei,其中所述位置初始项基于所述初始嵌入向量Ci而确定,所述位置偏移项根据预定衰减系数α、所述各个邻居节点的当前嵌入向量以及该节点i与各个邻居节点之间的关联强度而确定;
条件判定单元,配置为判断预定收敛条件是否得到满足,在不满足该预定收敛条件的情况下,使得所述邻居位置确定单元再次确定该节点i的各个邻居节点的当前嵌入向量,所述节点位置确定单元再次确定节点i的当前嵌入向量Ei,直到该预定收敛条件得到满足;
嵌入位置确定单元,配置为至少基于满足所述预定收敛条件的各个节点i的当前嵌入向量Ei,确定各个节点i在所述多维空间的嵌入向量。
11.根据权利要求10所述的装置,其中所述邻居节点确定单元配置为:
获取记录所述关系网络图的网络关系的邻接矩阵,所述邻接矩阵中第m行第k列的元素对应于第m节点与第k节点之间的关联强度;
通过所述邻接矩阵,确定节点i的邻居节点,以及节点i与各个邻居节点之间的关联强度。
12.根据权利要求11所述的装置,其中所述邻居节点确定单元配置为:
获取所述邻接矩阵中与节点i对应的第i行元素或第i列元素;
将所述第i行元素或第i列元素中非零元素对应的节点确定为节点i的邻居节点;将所述非零元素的值确定为节点i与对应邻居节点之间的关联强度。
13.根据权利要求10所述的装置,其中所述节点位置确定单元包括,初始项确定模块,配置为基于所述初始嵌入向量Ci以及所述预定衰减系数,确定所述位置初始项。
14.根据权利要求10所述的装置,其中所述节点位置确定单元包括偏移项确定模块,配置为:
以节点i与各个邻居节点之间的关联强度为权重,对各个邻居节点的当前嵌入向量求和,确定邻居中心位置;
至少基于所述预定衰减系数α,所述邻居中心位置,确定所述位置偏移项。
15.根据权利要求10所述的装置,其中所述节点位置确定单元包括偏移项确定模块,配置为:
确定节点i与其所有邻居节点的关联强度的和值;
确定节点i与各个邻居节点之间的关联强度与所述和值的比例,作为相对关联强度;
以所述相对关联强度为权重,对各个邻居节点的当前嵌入向量求和,确定邻居中心位置;
将邻居中心位置与所述预定衰减系数α的乘积,作为所述位置偏移项。
16.根据权利要求10所述的装置,其中所述预定收敛条件包括:
对于每个节点,本次确定的当前嵌入向量与前次确定的当前嵌入向量的差值小于第一预定值;或者
各个节点的本次确定的当前嵌入向量与前次确定的当前嵌入向量的差值的总和小于第二预定值。
17.根据权利要求10所述的装置,其中所述预定收敛条件包括:确定各个节点i的当前嵌入向量Ei的次数达到预定次数阈值。
18.根据权利要求10所述的装置,其中所述嵌入位置确定单元配置为,将节点i的嵌入向量确定为,满足所述预定收敛条件时节点i的当前嵌入向量Ei与其位置初始项之差。
19.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-9中任一项的所述的方法。
20.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-9中任一项所述的方法。
CN201810784744.5A 2018-07-17 2018-07-17 关系网络图嵌入的方法及装置 Active CN109063041B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201810784744.5A CN109063041B (zh) 2018-07-17 2018-07-17 关系网络图嵌入的方法及装置
TW108115553A TWI700599B (zh) 2018-07-17 2019-05-06 關係網絡圖嵌人的方法及裝置、電腦可讀儲存媒體及計算設備
PCT/CN2019/089022 WO2020015464A1 (zh) 2018-07-17 2019-05-29 关系网络图嵌入的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810784744.5A CN109063041B (zh) 2018-07-17 2018-07-17 关系网络图嵌入的方法及装置

Publications (2)

Publication Number Publication Date
CN109063041A true CN109063041A (zh) 2018-12-21
CN109063041B CN109063041B (zh) 2020-04-07

Family

ID=64816992

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810784744.5A Active CN109063041B (zh) 2018-07-17 2018-07-17 关系网络图嵌入的方法及装置

Country Status (3)

Country Link
CN (1) CN109063041B (zh)
TW (1) TWI700599B (zh)
WO (1) WO2020015464A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109919316A (zh) * 2019-03-04 2019-06-21 腾讯科技(深圳)有限公司 获取网络表示学习向量的方法、装置和设备及存储介质
CN109992700A (zh) * 2019-01-22 2019-07-09 阿里巴巴集团控股有限公司 获取关系网络图中节点的嵌入向量的方法和装置
CN110032665A (zh) * 2019-03-25 2019-07-19 阿里巴巴集团控股有限公司 确定关系网络图中图节点向量的方法及装置
CN110119475A (zh) * 2019-01-29 2019-08-13 成都信息工程大学 一种poi推荐方法及推荐***
CN110515986A (zh) * 2019-08-27 2019-11-29 腾讯科技(深圳)有限公司 一种社交网络图的处理方法、装置及存储介质
WO2020015464A1 (zh) * 2018-07-17 2020-01-23 阿里巴巴集团控股有限公司 关系网络图嵌入的方法及装置
CN112149000A (zh) * 2020-09-09 2020-12-29 浙江工业大学 一种基于网络嵌入和节点相似性的在线社交网络用户社区发现方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080033897A1 (en) * 2006-08-02 2008-02-07 Lloyd Kenneth A Object Oriented System and Method of Graphically Displaying and Analyzing Complex Systems
CN103838964A (zh) * 2014-02-25 2014-06-04 中国科学院自动化研究所 一种基于人工交通***的社交关系网络生成方法及装置
CN106445988A (zh) * 2016-06-01 2017-02-22 上海坤士合生信息科技有限公司 一种大数据的智能处理方法和***
CN107633263A (zh) * 2017-08-30 2018-01-26 清华大学 基于边的网络图嵌入方法
CN108062551A (zh) * 2017-06-28 2018-05-22 浙江大学 一种基于邻接矩阵的图特征提取***、图分类***和方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008086323A1 (en) * 2007-01-05 2008-07-17 Microsoft Corporation Directed graph embedding
TW201115366A (en) * 2009-10-27 2011-05-01 Hon Hai Prec Ind Co Ltd System and method for analyzing relationships among persons
TWI575470B (zh) * 2014-06-26 2017-03-21 國立臺灣大學 適用於社群網路之全域關係系統及搜尋關係方法
CN107145977B (zh) * 2017-04-28 2020-07-31 电子科技大学 一种对在线社交网络用户进行结构化属性推断的方法
CN107392782A (zh) * 2017-06-29 2017-11-24 上海斐讯数据通信技术有限公司 基于word2Vec的社团构建方法、装置及计算机处理设备
CN109063041B (zh) * 2018-07-17 2020-04-07 阿里巴巴集团控股有限公司 关系网络图嵌入的方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080033897A1 (en) * 2006-08-02 2008-02-07 Lloyd Kenneth A Object Oriented System and Method of Graphically Displaying and Analyzing Complex Systems
CN103838964A (zh) * 2014-02-25 2014-06-04 中国科学院自动化研究所 一种基于人工交通***的社交关系网络生成方法及装置
CN106445988A (zh) * 2016-06-01 2017-02-22 上海坤士合生信息科技有限公司 一种大数据的智能处理方法和***
CN108062551A (zh) * 2017-06-28 2018-05-22 浙江大学 一种基于邻接矩阵的图特征提取***、图分类***和方法
CN107633263A (zh) * 2017-08-30 2018-01-26 清华大学 基于边的网络图嵌入方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘永强: "基于编辑距离图嵌入的图匹配算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020015464A1 (zh) * 2018-07-17 2020-01-23 阿里巴巴集团控股有限公司 关系网络图嵌入的方法及装置
CN109992700A (zh) * 2019-01-22 2019-07-09 阿里巴巴集团控股有限公司 获取关系网络图中节点的嵌入向量的方法和装置
CN110119475A (zh) * 2019-01-29 2019-08-13 成都信息工程大学 一种poi推荐方法及推荐***
CN109919316A (zh) * 2019-03-04 2019-06-21 腾讯科技(深圳)有限公司 获取网络表示学习向量的方法、装置和设备及存储介质
CN109919316B (zh) * 2019-03-04 2021-03-12 腾讯科技(深圳)有限公司 获取网络表示学习向量的方法、装置和设备及存储介质
CN110032665A (zh) * 2019-03-25 2019-07-19 阿里巴巴集团控股有限公司 确定关系网络图中图节点向量的方法及装置
CN110032665B (zh) * 2019-03-25 2023-11-17 创新先进技术有限公司 确定关系网络图中图节点向量的方法及装置
CN110515986A (zh) * 2019-08-27 2019-11-29 腾讯科技(深圳)有限公司 一种社交网络图的处理方法、装置及存储介质
CN110515986B (zh) * 2019-08-27 2023-01-06 腾讯科技(深圳)有限公司 一种社交网络图的处理方法、装置及存储介质
CN112149000A (zh) * 2020-09-09 2020-12-29 浙江工业大学 一种基于网络嵌入和节点相似性的在线社交网络用户社区发现方法
CN112149000B (zh) * 2020-09-09 2021-12-17 浙江工业大学 一种基于网络嵌入的在线社交网络用户社区发现方法

Also Published As

Publication number Publication date
WO2020015464A1 (zh) 2020-01-23
TW202006571A (zh) 2020-02-01
CN109063041B (zh) 2020-04-07
TWI700599B (zh) 2020-08-01

Similar Documents

Publication Publication Date Title
CN109063041A (zh) 关系网络图嵌入的方法及装置
CN109948029B (zh) 基于神经网络自适应的深度哈希图像搜索方法
Barrat et al. Rate equation approach for correlations in growing network models
Raczy et al. A sort-based DDM matching algorithm for HLA
CN113543176A (zh) 基于智能反射面辅助的移动边缘计算***的卸载决策方法
Jayasena et al. Optimized task scheduling on fog computing environment using meta heuristic algorithms
CN108986872B (zh) 用于大数据电子病历约简的多粒度属性权重Spark方法
CN111723947A (zh) 一种联邦学习模型的训练方法及装置
CN105320702B (zh) 一种用户行为数据的分析方法、装置及智能电视
CN109819032B (zh) 一种联合考虑基站选择与计算迁移的云机器人任务分配方法
CN109829337A (zh) 一种社会网络隐私保护的方法、***及设备
CN114998525A (zh) 基于动态局部-全局图卷积神经网络的动作识别方法
CN111309472A (zh) 一种基于虚拟机预部署的在线虚拟资源分配方法
CN116362327A (zh) 一种模型训练方法、***及电子设备
CN104035978B (zh) 社团发现方法及***
CN103399799B (zh) 云操作***中计算物理资源节点负载评价的方法及装置
CN107528731B (zh) 应用于ns3并行仿真的网络分割优化算法
Bhuiyan et al. Fast parallel algorithms for edge-switching to achieve a target visit rate in heterogeneous graphs
CN109508785A (zh) 一种用于神经网络训练的异步并行优化方法
CN113034297A (zh) 基于节点吸引力的复杂网络关键节点识别方法及***
Baalamurugan et al. Analysis of Cloud Storage Issues in Distributed Cloud Data Centres by Parameter Improved Particle Swarm Optimization (PIPSO) Algorithm
CN111886605A (zh) 针对多个输入数据集的处理
CN114815755A (zh) 基于智能协作推理的分布式实时智能监控***的建立方法
Han et al. Opportunistic coded distributed computing: An evolutionary game approach
CN108320234A (zh) 一种数据处理方法、装置、及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40002010

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200930

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Patentee after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Patentee before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20200930

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Patentee after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Patentee before: Alibaba Group Holding Ltd.

TR01 Transfer of patent right