CN110442758A - 一种图对齐方法、装置和存储介质 - Google Patents

一种图对齐方法、装置和存储介质 Download PDF

Info

Publication number
CN110442758A
CN110442758A CN201910667549.9A CN201910667549A CN110442758A CN 110442758 A CN110442758 A CN 110442758A CN 201910667549 A CN201910667549 A CN 201910667549A CN 110442758 A CN110442758 A CN 110442758A
Authority
CN
China
Prior art keywords
node
source domain
aiming field
generator
diagnostic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910667549.9A
Other languages
English (en)
Other versions
CN110442758B (zh
Inventor
徐挺洋
陈超奇
谢伟平
荣钰
黄文炳
黄俊洲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910667549.9A priority Critical patent/CN110442758B/zh
Publication of CN110442758A publication Critical patent/CN110442758A/zh
Application granted granted Critical
Publication of CN110442758B publication Critical patent/CN110442758B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例公开了一种图对齐方法、装置和存储介质,其中,通过获取需要对齐的源域图和目标域图;对源域图进行无监督学习得到源域节点特征集合,以及对目标域图进行无监督学习得到目标域节点特征集合;构建生成对抗网络,生成对抗网络,并对生成对抗网络进行训练;根据训练后的生成对抗网络中的生成器预测源域图和目标域图之间的锚链接,并根据锚链接所对应的源域节点特征和目标域节点特征优化训练后的生成器,得到优化后的生成器;根据优化后的生成器将源域图中的源域节点与目标域图中的目标域节点对齐。由此,实现了无监督条件下的图对齐,摆脱了现有技术中对标注数据的依赖,不仅降低了实现图对齐的人力成本,还提高了图对齐的效率。

Description

一种图对齐方法、装置和存储介质
技术领域
本发明涉及数据挖掘技术领域,具体涉及一种图对齐方法、装置和存储介质。
背景技术
目前,图作为一种抽象程度高、表达能力强的数据结构,广泛用于社交网络、商品网络以及蛋白质结构的表达中,其通过对节点和边的定义来描述实体和实体之间的关联关系。
以社交网络为例,可以采用图的形式来表达社交网络,当需要在两个异构的社交网络中找到同一用户时,可以采用图分别表达两个异构的社交网络的社交网络,将其中一个图记为源域图,将另一个图记为目标域图,由此,将源域图中源域节点和目标域图中的目标域节点进行对齐,匹配的源域节点和目标域节点即代表同一用户。
在对现有技术的研究和实践过程中,本发明的发明人发现,用于图对齐的现有技术依赖于已知的锚链接,锚链接表征了两个图中已知的匹配的节点。然而,这需要技术人员来手动标注大量的锚链接,不仅使得实现图对齐的人力成本较高,且图对齐的效率较低。
发明内容
本发明实施例提供一种图对齐方法、装置和存储介质,可以降低实现图对齐的人力成本,并提高图对齐的效率。
本发明实施例提供一种图对齐方法,包括:
获取需要对齐的源域图和目标域图,所述源域图包括多个源域节点,所述目标域图包括多个目标域节点;
对所述源域图进行无监督学习得到源域节点特征集合,以及对所述目标域图进行无监督学习得到目标域节点特征集合;
构建生成对抗网络,所述生成对抗网络包括用于将源域节点特征映射到目标域节点特征所在特征空间的生成器,以及用于区分映射后的源域节点特征和目标域节点特征的判别器;
根据所述源域节点特征集合以及所述目标域节点特征集合对所述生成器和所述判别器进行交替训练,得到训练后的生成器;
根据所述训练后的生成器预测所述源域图和所述目标域图之间的锚链接,并根据所述锚链接所对应的源域节点特征和目标域节点特征优化所述训练后的生成器,得到优化后的生成器;
根据所述优化后的生成器将所述源域图中的源域节点与所述目标域图中的目标域节点对齐。
本发明实施例还提供一种图对齐装置,包括:
图获取模块,用于获取需要对齐的源域图和目标域图,所述源域图包括多个源域节点,所述目标域图包括多个目标域节点;
特征学习模块,用于对所述源域图进行无监督学习得到源域节点特征集合,以及对所述目标域图进行无监督学习得到目标域节点特征集合;
网络构建模块,用于构建生成对抗网络,所述生成对抗网络包括用于将源域节点特征映射到目标域节点特征所在特征空间的生成器,以及用于区分映射后的源域节点特征和目标域节点特征的判别器;
网络训练模块,用于根据所述源域节点特征集合以及所述目标域节点特征集合对所述生成器和所述判别器进行交替训练,得到训练后的生成器;
优化模块,用于根据所述训练后的生成器预测所述源域图和所述目标域图之间的锚链接,并根据所述锚链接所对应的源域节点特征和目标域节点特征优化所述训练后的生成器,得到优化后的生成器;
图对齐模块,用于根据所述优化后的生成器将所述源域图中的源域节点与所述目标域图中的目标域节点对齐。
在一实施例中,在根据所述训练后的生成器预测所述源域图和所述目标域图之间的锚链接时,所述优化模块用于:
将所述源域节点特征集合中的源域节点特征和所述目标域节点特征集合中的目标域节点特征进行两两组合,得到多个节点特征组合;
选中一节点特征组合,并根据所述训练后的生成器对选中的节点特征组合中的源域节点特征进行映射,得到映射节点特征;
根据所述映射节点特征与所述选中的节点特征组合之外的其它目标域节点特征的余弦相似度,以及所述选中的节点特征组合中目标域节点特征与所述其它目标域节点特征的余弦相似度,获取所述选中的节点特征组合对应的跨域相似度;
继续选中其它节点特征组合,直至获取到所有节点特征组合的跨域相似度,并将跨域相似度最高的节点特征组合所对应的源域节点和目标域节点作为所述锚链接。
在一实施例中,在根据所述映射节点特征与所述选中的节点特征组合之外的其它目标域节点特征的余弦相似度,以及所述选中的节点特征组合中目标域节点特征与所述其它目标域节点特征的余弦相似度,获取所述选中的节点特征组合对应的跨域相似度时,所述优化模块用于:
确定与所述映射节点特征余弦相似度最高的前预设数量的其它目标域节点特征,并获取所述映射节点特征与其对应的前预设数量的其它目标域节点特征与的平均余弦相似度,得到第一平均余弦相似度;
确定与所述选中的节点特征组合中的目标域节点特征余弦相似度最高的前预设数量的其它目标域节点特征,并获取所述选中的节点特征组合中的目标域节点特征与其对应的前预设数量的其它目标域节点特征与的平均余弦相似度,得到第二平均余弦相似度;
根据所述选中的节点特征组合中目标域节点特征和映射节点特征的的余弦相似度、所述第一平均余弦相似度以及所述第二平均余弦相似度,获取所述选中的节点特征组合对应的跨域相似度。
在一实施例中,在根据所述优化后的生成器将所述源域图中的源域节点与所述目标域图中的目标域节点对齐时,所述图对齐模块用于:
针对所述源域图中的任一源域节点,根据所述优化后的生成器获取所述任一源域节点与所述目标域图中各目标域节点的跨域相似度;
将对应跨域相似度最大的目标域节点作为所述任一源域节点匹配的目标域节点。
在一实施例中,在根据所述锚链接所对应的源域节点特征和目标域节点特征优化所述训练后的生成器,得到优化后的生成器时,所述优化模块用于:
以使得所述锚链接所对应的源域节点特征和目标域节点特征之间的欧式距离最近为优化目标,对所述训练后的生成器进行优化,得到所述优化后的生成器。
在一实施例中,在获取需要对齐的源域图和目标域图时,所述图获取模块用于:
获取第一社交网络中的用户信息,并根据所述第一社交网络中的用户信息生成多个节点以及连接不同节点的边,得到所述源域图;
获取第二社交网络中的用户信息,并根据第二社交网络中的用户信息生成多个节点以及连接不同节点的边,得到所述目标域图,所述第二社交网络与所述第一社交网络为异构社交网络。
在一实施例中,在根据所述优化后的生成器将所述源域图中的源域节点与所述目标域图中的目标域节点对齐之前,所述优化模块还用于:
对所述优化后的生成器进行正交化处理,得到正交化的生成器;
在根据优化后的生成器将所述源域图和所述目标域图中的节点对齐时,所述图对齐模块用于:
根据所述正交化的生成器将所述源域图和所述目标域图中的节点对齐。
在一实施例中,对所述源域图进行无监督学习得到源域节点特征集合,以及对所述目标域图进行无监督学习得到目标域节点特征集合之前,所述特征学习模块还用于:
判断是否存在已知的所述源域图和所述目标域图之间的锚链接;
若不存在,则对所述源域图进行无监督学习得到源域节点特征集合,以及对所述目标域图进行无监督学习得到目标域节点特征集合;
若存在,则对所述源域图进行有监督学习得到源域节点特征集合,以及对所述目标域图进行有监督学习得到目标域节点特征集合,并转入执行所述构建生成对抗网络。
此外,本发明实施例还提供一种存储介质,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本发明实施例所提供的任一种图对齐方法中的步骤。
本发明实施例获取需要对齐的源域图和目标域图,源域图包括多个源域节点,目标域图包括多个目标域节点;以及,对源域图进行无监督学习得到源域节点特征集合,以及对目标域图进行无监督学习得到目标域节点特征集合;以及,构建生成对抗网络,生成对抗网络包括用于将源域节点特征映射到目标域节点特征所在特征空间的生成器,以及用于区分映射后的源域节点特征和目标域节点特征的判别器;以及,根据源域节点特征集合以及目标域节点特征集合对生成器和判别器进行交替训练,得到训练后的生成器;以及,根据训练后的生成器预测源域图和目标域图之间的锚链接,并根据锚链接所对应的源域节点特征和目标域节点特征优化训练后的生成器,得到优化后的生成器;以及,根据优化后的生成器将源域图中的源域节点与目标域图中的目标域节点对齐。由此,实现了无监督条件下的图对齐,摆脱了现有图对齐技术中对标注数据的依赖,不仅降低了实现图对齐的人力成本,还提高了图对齐的效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的图对齐方法的场景示意图;
图2是本发明实施例提供的图对齐方法的一流程示意图;
图3是本发明实施例将源域图中的源域节点和目标域图中的目标域节点对齐的示意图;
图4是本发明实施例提供的图对齐方法另一流程示意图;
图5是本发明实施例提供的图对齐装置的一结构示意图;
图6是本发明实施例提供的终端的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
本申请实施例提供的方案涉及人工智能的机器学习技术,具体通过如下实施例进行说明:
本发明实施例提供一种图对齐方法、装置和存储介质。
请参阅图1,图1为本发明实施例所提供的图对齐方法的场景示意图,该图对齐方法可以应用于图对齐装置,该图对齐装置具体可以集成在平板电脑、手机、及笔记本电脑等具备储存器并安装有处理器而具有运算能力的终端中,例如,例如,该终端可以获取需要对齐的源域图和目标域图,该源域图包括多个源域节点,该目标域图包括多个目标域节点,比如,该源域图可以是A社交网络的图表示,源域节点即代表A社交网络中的用户,该目标域图可以是B社交网络的图表示,目标域节点即代表B社交网络中的用户;然后对源域图进行无监督学习得到源域节点特征集合,以及对目标域图进行无监督学习得到目标域节点特征集合,例如,可以采用DeepWalk算法来分别对源域图和目标域图进行无监督学习;以及,构建生成对抗网络,该生成对抗网络包括用于将源域节点特征映射到目标域节点特征所在特征空间的生成器,以及用于区分映射后的源域节点特征和目标域节点特征的判别器,例如,可以构建标准生成对抗网络;以及,根据源域节点特征集合以及目标域节点特征集合对生成器和判别器进行交替训练,得到训练后的生成器;再根据训练后的生成器预测源域图和目标域图之间的锚链接,并根据该锚链接所对应的源域节点和目标域节点特征对训练后的生成器进行优化,得到优化后的生成器;最后,即可利用优化后的生成器来将源域图中的源域节点和目标域图的目标域节点对齐,从而匹配出对应同一实体的源域节点和目标域节点。
需要说明的是,图1所示的图对齐方法的场景示意图仅仅是一个示例,本发明实施例描述的图对齐方法的场景是为了更加清楚的说明本发明实施例的技术方案,并不构成对于本发明实施例提供的技术方案的限定,本领域普通技术人员可知,随着图对齐方法的演变和新业务场景的出现,本发明实施例提供的技术方案对于类似的技术问题,同样适用。
以下分别进行详细说明。
在本实施例中,将从图对齐装置的角度进行描述,该图对齐装置具体可以集成在平板电脑、手机、及笔记本电脑等具备储存器并安装有处理器而具有运算能力的终端中。
一种图对齐方法,包括:获取需要对齐的源域图和目标域图,源域图包括多个源域节点,目标域图包括多个目标域节点;对源域图进行无监督学习得到源域节点特征集合,以及对目标域图进行无监督学习得到目标域节点特征集合;构建生成对抗网络,生成对抗网络包括用于将源域节点特征映射到目标域节点特征所在特征空间的生成器,以及用于区分映射后的源域节点特征和目标域节点特征的判别器;根据源域节点特征集合以及目标域节点特征集合对生成器和判别器进行交替训练,得到训练后的生成器;根据训练后的生成器预测源域图和目标域图之间的锚链接,并根据锚链接所对应的源域节点特征和目标域节点特征优化训练后的生成器,得到优化后的生成器;根据优化后的生成器将源域图中的源域节点与目标域图中的目标域节点对齐。
请参阅图2,图2是本发明一实施例提供的图对齐方法的流程示意图。该图对齐方法可以包括:
在201中,获取需要对齐的源域图和目标域图,源域图包括多个源域节点,目标域图包括多个目标域节点。
本发明实施例中,首先获取到需要对齐的源域图和目标域图,其中,源域图中包括多个节点,以及连接这些节点的边,本发明实施例中将源域图中的节点记为源域节点,同样的,目标域中包括多个节点,以及连接这些节点的边,本发明实施例中将目标域图中的节点记为目标域节点。
应当说明的是,将源域图和目标域图进行对齐,也即是将源域图中的源域节点和目标域图中目标域节点对应上。
目前,随着社交网络的繁荣,人们不只局限于使用一个社交网络,而是会同时使用多个社交网络以享受更多的应用,比如,同一用户可以在推特上关注一些明星、作家或者是感兴趣的人和事等,在YouTube上关注不同的视频主等。这些社交网络往往相互独立,但是又能够共同反映用户的信息,这为结合异构社交网络并共同挖掘它们所隐含的信息提供了机会和挑战。在不同的社交网络中寻找同一用户是许多数据挖掘任务的第一步,例如,在不同的社交网络中确定同一用户,就能结合更多的资源来挖掘用户信息,这类问题被称为社交网络对齐。而社交网络实际上可以表达为图,因此社交网络对齐问题也可以表述为图对齐问题。在一实施例中,“获取需要对齐的源域图和目标域图”,包括:
(1)获取第一社交网络中的用户信息,并根据第一社交网络中的用户信息生成多个节点以及连接不同节点的边,得到源域图;
(2)获取第二社交网络中的用户信息,并根据第二社交网络中的用户信息生成多个节点以及连接不同节点的边,得到目标域图,第二社交网络与第一社交网络为异构社交网络。
本发明实施例中,当需要对两个异构的社交网络进行对齐时,可以首先将其表达为图。其中,第一社交网络和第二社交网络为异构社交网络,应当说明的是,第一和第二并非特指某一社交网络,仅用于区分两个异构社交网络,第一社交网络和第二社交网络可以为任意两个异构社交网络。比如,第一社交网络可以为推特,第二神经网络可以为脸书等。
在将需要对齐的社交网络表达为图时,可以获取到第一社交网络中的用户信息,该用户信息描述了不同的用户,以及不同用户间的关系,由此,即可根据该用户信息将第一社交网络表达为多个节点,以及连接这些节点的边,得到第一社交网络的社交网络图,该社交网络图中的节点即代表了第一社交网络中的用户,两个节点之间的边即代表了两个用户之间的关系,本发明实施例中,将第一社交网络表达得到的社交网络图记为源域图,其中的节点即为源域节点。
同理,还可以获取到第二社交网络中的用户信息,并根据该用户信息将第二社交网络表达为多个节点,以及连接这些节点的边,得到第二社交网络的社交网络图,该社交网络中的节点即代表了第二社交网络中的用户,两个节点之间的边即代表了两个用户之间的关系,本发明实施例中,将第二社交网络表达得到的社交网络记为目标与图,其中的节点即为目标域节点。
应当说明的是,源域图和目标域图对齐,可以通俗的理解为:将源域图中的源域节点映射到目标域图中,找到与其匹配的目标域节点。
在202中,对源域图进行无监督学习得到源域节点特征集合,以及对目标域图进行无监督学习得到目标域节点特征集合。
本发明实施例中,在获取到需要对齐的源域图和目标域图之后,进一步通过无监督学习来学习源域图和目标域图的特征表示。其中,采用相同的无监督学习算法来对源域图和目标域图进行无监督学习,得到源域图的特征表示为源域节点特征集合,得到目标域图的特征表示为目标域节点特征集合。
应当说明的是,本发明实施例中对于采用何种无监督学习方法来学习得到源域图和目标域图的特征表示,可以由本领域普通技术人员根据实际需要进行选取,本发明实施例中对此不作具体限制。
比如,可以采用DeepWalk算法对源域图进行无监督学习,得到源域节点特征集合其中,n表示源域图中源域节点的个数,表示源域图中第一个源域节点的特征,表示目标域图中第n个源域节点的特征,以此类推。
同样的,可以采用DeepWalk算法对目标域图进行无监督学习,得到目标域节点特征集合其中,m表示目标域图中目标域节点的个数,表示目标域图中第一个目标域节点的特征,表示目标域图中第n个目标域节点的特征,以此类推。
在203中,构建生成对抗网络,生成对抗网络包括用于将源域节点特征映射到目标域节点特征所在特征空间的生成器,以及用于区分映射后的源域节点特征和目标域节点特征的判别器。
应当说明的是,由于需要对齐的源域图和目标域图异构,在分别对源域图和目标域图进行无监督学习之后,学习得到的源域节点特征结集合和目标域节点特征集合将位于不同的特征空间。
为了实现图对齐,本发明中期望源域节点特征通过某映射矩阵映射后能够与目标域节点特征尽可能的相似。因此,引入对抗训练,本发明实施例中,在学习得到源域图的源域节点特征集合以及目标域图的目标域节点特征集合之后,进一步构建生成对抗网络,该生成对抗网络有生成器和判别器组成,生成器可以为一个映射矩阵,用于将源域节点特征集合中的源域节点特征映射到目标域节点特征所在的特征空间,判别器用于区分映射后的源域节点特征和目标域节点特征。
应当说明的是,本发明实施例中对于构建何种生成对抗网络的架构不做限制,可由本领域普通技术人员根据实际需要选取,比如,可以构建标准的生成对抗网络,也可以构建改进的生成对抗网络,如基于Wasserstein距离的生成对抗网络等。
在204中,根据源域节点特征集合以及目标域节点特征集合对生成器和判别器进行交替训练,得到训练后的生成器。
本发明实施例中,在完成生成对抗网络的构建之后,进一步对构建的生成对抗网络进行训练。应当说明的是,对生成对抗网络的训练本质上可以看做是二人零和博弈的问题。
示例性的,以构建标准的生成对抗网络为例,判别器的损失函数为:
其中,W表示生成器,θD表示判别器,n表示源域节点的数量,m表示目标域节点的数量,表示经过生成器映射后的第i个源域节点特征,表示第j个目标域节点特征,表示判别器尽可能的区分出经过生成器映射后的第i个源域节点特征,反之亦然。
对应的,生成器的损失函数为:
在训练时,通过交替迭代优化生成器W和判别器θD来最小化生成器的损失函数和判别器的损失函数通俗的说,即当判别器无法准确的区分出经生成器映射后的源域节点特征时,即训练完成。
在205中,根据训练后的生成器预测源域图和目标域图之间的锚链接,并根据锚链接所对应的源域节点特征和目标域节点特征优化训练后的生成器,得到优化后的生成器。
应当说明的是,由于本发明实施例中在训练生成器时,并没有对源域图中的源域节点和目标域图中的目标域节点进行一对一约束,需要引入额外的监督信息来对训练得到的生成器进行优化,以实现源域节点和目标域节点的一对一对齐,从而避免对抗训练过程中潜在的模式崩塌问题。
因此,本发明实施例中进一步根据训练后的生成器预测源域图和目标域图之间的锚链接。应当说明的是,锚链接为已知的对应同一实体的源域节点和目标域节点。由于本发明实施中并不实际存在锚链接,而是预测得到,因此可将该预测得到的锚链接记为伪锚链接。
在预测得到伪锚链接之后,即可将该伪锚链接作为监督信息对训练得到的生成器进行优化,也即根据锚链接指示的源域节点的源域节点特征,以及目标域节点的目标域节点特征来对训练得到的生成器进行优化。
在一实施例中,“根据训练后的生成器预测源域图和目标域图之间的锚链接”,包括:
(1)将源域节点特征集合中的源域节点特征和目标域节点特征集合中的目标域节点特征进行两两组合,得到多个节点特征组合;
(2)选中一节点特征组合,并根据训练后的生成器对选中的节点特征组合中的源域节点特征进行映射,得到映射节点特征;
(3)根据映射节点特征与选中的节点特征组合之外的其它目标域节点特征的余弦相似度,以及选中的节点特征组合中目标域节点特征与其它目标域节点特征的余弦相似度,获取选中的节点特征组合对应的跨域相似度;
(4)继续选中其它节点特征组合,直至获取到所有节点特征组合的跨域相似度,并将跨域相似度最高的节点特征组合所对应的源域节点和目标域节点作为锚链接。
通俗的说,预测源域图和目标域与图之间的锚链接也即是找到可能对应同一实体的源域节点和目标域节点。
本发明实施例中,为了能够得到伪锚链接(即预测的锚链接),引入跨域相似度,该跨域相似度可以通过余弦相似度进行表达。
其中,可以将源域节点特征集合中的源域节点特征和目标域节点特征集合特征中的目标域节点特征进行两两组合,得到多个节点特征组合;之后,选中一节点特征组合,并根据训练后的生成器对选中的节点特征组合中的源域节点特征进行映射,将其映射到目标域节点特征所在的特征空间,得到映射节点特征;然后,根据该映射节点特征与选中的节点特征组合之外的其它目标域节点特征,以及选中的节点特征组合中目标域节点特征与其它目标域节点特征的余弦相似度,来表达映射节点特征和选中的节点特征组合中目标域节点特征的跨域相似度。
如此,继续选中其它节点特征组合,直至获取到所有节点特征组合的跨域相似度。在获取到所有节点特征组合的跨域相似度之后,本发明实施例中即将对应跨域相似度最高的节点特征组合所对应的源域节点和目标域节点作为预测得到的锚链接。
在一实施例中,为了能够得到高质量的伪锚链接(即预测得到的锚链接),“根据映射节点特征与选中的节点特征组合之外的其它目标域节点特征的余弦相似度,以及选中的节点特征组合中目标域节点特征与其它目标域节点特征的余弦相似度,获取选中的节点特征组合对应的跨域相似度”,包括:
(1)确定与映射节点特征余弦相似度最高的前预设数量的其它目标域节点特征,并获取映射节点特征与其对应的前预设数量的其它目标域节点特征与的平均余弦相似度,得到第一平均余弦相似度;
(2)确定与选中的节点特征组合中的目标域节点特征余弦相似度最高的前预设数量的其它目标域节点特征,并获取选中的节点特征组合中的目标域节点特征与其对应的前预设数量的其它目标域节点特征与的平均余弦相似度,得到第二平均余弦相似度;
(3)根据选中的节点特征组合中目标域节点特征和映射节点特征的余弦相似度、第一平均余弦相似度以及第二平均余弦相似度,获取选中的节点特征组合对应的跨域相似度。
本发明实施例中,为了能够得到高质量的伪锚链接,只保留源域节点和目标域节点中相互之间最接近的邻居节点,但考虑到最接近的邻居节点通常是不对称的,而这会影响图对齐的效果,进一步引入交叉图相似性来减轻这种中心问题。
其中,在根据映射节点特征与选中的节点特征组合之外的其它目标域节点特征的余弦相似度,以及选中的节点特征组合中目标域节点特征与其它目标域节点特征的余弦相似度,获取选中的节点特征组合对应的跨域相似度时,可以首先确定与映射节点特征余弦相似度最高的前预设数量的其它目标域节点特征,并获取映射节点特征与其对应的前预设数量的其它目标域节点特征与的平均余弦相似度,得到第一平均余弦相似度。表示为如下公式:
其中,Wzs表示映射节点特征,K表示预设数量(可由本领域普通技术人员根据实际需要取值),rT(Wzs)表示第一平均余弦相似度,表示与映射节点特征余弦相似度最高的前预设数量的其它目标域节点特征所对应的目标域节点,cos()表示求余弦相似度。
同理,本发明实施例中还确定与选中的节点特征组合中的目标域节点特征余弦相似度最高的前预设数量的其它目标域节点特征,并获取选中的节点特征组合中的目标域节点特征与其对应的前预设数量的其它目标域节点特征与的平均余弦相似度,得到第二平均余弦相似度rS(zt)。
在获取得到第一平均余弦相似度以及获取得到第二平均余弦相似度之后,即根据选中的节点特征组合中目标域节点特征和映射节点特征的余弦相似度、第一平均余弦相似度以及第二平均余弦相似度,获取选中的节点特征组合对应的跨域相似度,如下公式所示:
CGSS(Wzs,Zt)=2cos(Wzs,Zt)-rT(Wzs)-rs(Zt);
其中,CGSS(Wzs,Zt)表示的选中的节点特征组合中目标域节点特征和映射节点特征的跨域相似度。
在一实施例中,“根据锚链接所对应的源域节点特征和目标域节点特征优化训练后的生成器,得到优化后的生成器”,包括:
以使得预测得到的锚链接所对应的源域节点特征和目标域节点特征之间的欧式距离最近为优化目标,对训练后的生成器进行优化,得到优化后的生成器。
本发明实施例中,在对训练后的生成器进行优化时,如下公式所示:
其中,W*表示优化的生成器,W表示优化前的生成器,为d*d维度的映射矩阵,||Wzs-Zt||2表示预测得到的锚链接所对应的源域节点特征和目标域节点特征之间的欧式距离。
应当说明的是,205可以循环执行,直至满足预设的优化条件,其中,对于该优化条件的设置本发明实施例中不做具体限制,可由本领域普通技术人员根据实际需要进行设置,比如,可以设置优化条件为对训练后的生成器优化N 次,N为正整数。
在206中,根据优化后的生成器将源域图中的源域节点与目标域图中的目标域节点对齐。
本发明实施例中,完成对训练后的生成器的优化,并得到优化后的生成器之后,即可根据优化后的生成器将源域图中的源域节点与目标域图中的目标域节点对齐。比如,请参照图3,源域图为社交网络A的图表示,目标域图为社交网络B的图表示,对于源域图中的源域节点1,根据优化后的生成器将该源域节点1的源域节点特征映射到的目标域节点特征所在的特征空间,确定出与该映射后的源域节点特征余弦相似度最大的目标域节点特征,将该目标域节点特征对应的目标域节点1作为与源域节点1匹配的目标域节点,识别出源域节点 1和目标域节点1对应两个社交网络中的的同一用户“用户A”。
在一实施例中,为了能够更准确的对齐源域节点和目标域节点,“根据优化后的生成器将源域图中的源域节点与目标域图中的目标域节点对齐”,包括:
(1)针对源域图中的任一源域节点,根据优化后的生成器获取该源域节点与目标域图中各目标域节点的跨域相似度;
(2)将对应跨域相似度最大的目标域节点作为前述源域节点匹配的目标域节点。
本发明实施例中,可以采用之前引入的跨域相似度来衡量源域节点和目标域节点是否匹配。其中,针对源域图中的任一源域节点,根据优化后的生成器获取该源域节点与目标域图中各目标域节点的跨域相似度,也即是获取经优化后的生成器所映射后的源域节点的源域节点特征,与各目标域节点的目标域节点特征之间的跨域相似度,具体可参照以上实施例相应实施,此处不再赘述。
应当说明的是,本发明实施例中将对应跨域相似度最大的目标域节点作为与前述源域节点匹配的目标与节点,从而实现源域节点和目标域节点的对齐。
在一实施例中,“根据优化后的生成器将源域图中的源域节点与目标域图中的目标域节点对齐”之前,还包括:
(1)对优化后的生成器进行正交化处理,得到正交化的生成器;
“根据优化后的生成器将源域图和目标域图中的节点对齐”包括:
(2)根据正交化的生成器将源域图和目标域图中的节点对齐。
为了能够进一步提高图对齐的准确性,在本发明实施中,还对优化后的生成器进行正交化处理,使得生成器能够保持接近正交矩阵。
对优化后的生成器进行正交化处理可以表示为:
W←(1+β)W-β(WWT)W;
其中,左侧的W表示正交化的生成器,右侧的W表示正交化前的生成器(即利用锚链接作为监督学习优化后的生成器),β表示预设步长,T表示转置。根据正交约束可以通过对(Zt表示预测得到的锚链接对应的源域节点的源域节点特征,表示预测的锚链接对应的目标域节点的目标域节点特征的转置)的奇异值分解获得闭合形式解,如下所示:
其中,SVD()表示奇异值分解。
通过对优化后的生成器进行正交化处理,得到正交化的生成器,使得生成器保持接近正交矩阵。由此,即可根据正交化的生成器将源域图和目标域图中的节点对齐,具体可以参照以上实施例相应实施,此处不再赘述。
在一实施例中,“对源域图进行无监督学习得到源域节点特征集合,以及对目标域图进行无监督学习得到目标域节点特征集合”之前,还包括:
(1)判断是否存在已知的源域图和目标域图之间的锚链接;
(2)若不存在,则对源域图进行无监督学习得到源域节点特征集合,以及对目标域图进行无监督学习得到目标域节点特征集合;
(3)若存在,则对源域图进行有监督学习得到源域节点特征集合,以及对目标域图进行有监督学习得到目标域节点特征集合,并转入执行203。
本发明实施例中,在获取到需要对齐的源域图和目标域图之后,并不立即对源域图进行无监督学习得到源域节点特征集合,以及对目标域图进行无监督学习得到目标域节点特征集合,而是首先判断是否存在已知的源域图和目标域图之间的锚链接,若存在,再对源域图进行无监督学习得到源域节点特征集合,以及对目标域图进行无监督学习得到目标域节点特征集合,并利用无监督学习得到的目标域节点特征集合和源域节点特征集合来训练并优化用于对齐源域图和目标域图的生成器,并对齐,具体可参照以上实施例的相关描述,此处不再赘述。
此外,若存在已知的源域图和目标域图之间的锚链接,则可以将本发明中无监督学习替换为有监督学习,比如,采用图卷积网络对源域图进行有监督学习得到源域节点特征集合,以及采用图卷积网络对目标域图进行有监督学习得到目标域节点特征集合。
由上可知,本发明实施例中,获取需要对齐的源域图和目标域图,源域图包括多个源域节点,目标域图包括多个目标域节点;以及,对源域图进行无监督学习得到源域节点特征集合,以及对目标域图进行无监督学习得到目标域节点特征集合;以及,构建生成对抗网络,生成对抗网络包括用于将源域节点特征映射到目标域节点特征所在特征空间的生成器,以及用于区分映射后的源域节点特征和目标域节点特征的判别器;以及,根据源域节点特征集合以及目标域节点特征集合对生成器和判别器进行交替训练,得到训练后的生成器;以及,根据训练后的生成器预测源域图和目标域图之间的锚链接,并根据锚链接所对应的源域节点特征和目标域节点特征优化训练后的生成器,得到优化后的生成器;以及,根据优化后的生成器将源域图中的源域节点与目标域图中的目标域节点对齐。由此,实现了无监督条件下的图对齐,摆脱了现有图对齐技术中对标注数据的依赖,不仅降低了实现图对齐的人力成本,还提高了图对齐的效率。
实施例二、
根据前面实施例所描述的方法,以下将举例作进一步详细说明。
如图4所示,该图对齐方法的具体流程可以如下:
401,终端根据第一社交网络生成源域图,以及根据第二社交网络生成目标域图,源域图包括对应第一社交网络中用户的源域节点,目标域图包括对应第二社交网络中用户的目标域节点。
目前,随着社交网络的繁荣,人们不只局限于使用一个社交网络,而是会同时使用多个社交网络以享受更多的应用,比如,同一用户可以在推特上关注一些明星、作家或者是感兴趣的人和事等,在YouTube上关注不同的视频主等。这些社交网络往往相互独立,但是又能够共同反映用户的信息,这为结合异构社交网络并共同挖掘它们所隐含的信息提供了机会和挑战。在不同的社交网络中寻找同一用户是许多数据挖掘任务的第一步,例如,在不同的社交网络中确定同一用户,就能结合更多的资源来挖掘用户信息,这类问题被称为社交网络对齐。而社交网络实际上可以表达为图,因此社交网络对齐问题也可以表述为图对齐问题。
本发明实施例中,当需要对两个异构的社交网络进行对齐时,可以首先将其表达为图。其中,第一社交网络和第二社交网络为异构社交网络,应当说明的是,第一和第二并非特指某一社交网络,仅用于区分两个异构社交网络,第一社交网络和第二社交网络可以为任意两个异构社交网络。比如,第一社交网络可以为推特,第二神经网络可以为脸书等。
在将需要对齐的社交网络表达为图时,可以获取到第一社交网络中的用户信息,该用户信息描述了不同的用户,以及不同用户间的关系,由此,即可根据该用户信息将第一社交网络表达为多个节点,以及连接这些节点的边,得到第一社交网络的社交网络图,该社交网络图中的节点即代表了第一社交网络中的用户,两个节点之间的边即代表了两个用户之间的关系,本发明实施例中,将第一社交网络表达得到的社交网络图记为源域图,其中的节点即为源域节点。
同理,还可以获取到第二社交网络中的用户信息,并根据该用户信息将第二社交网络表达为多个节点,以及连接这些节点的边,得到第二社交网络的社交网络图,该社交网络中的节点即代表了第二社交网络中的用户,两个节点之间的边即代表了两个用户之间的关系,本发明实施例中,将第二社交网络表达得到的社交网络记为目标与图,其中的节点即为目标域节点。
应当说明的是,源域图和目标域图对齐,可以通俗的理解为:将源域图中的源域节点映射到目标域图中,找到与其匹配的目标域节点。
402,终端对源域图进行无监督学习得到源域节点特征集合,以及对目标域图进行无监督学习得到目标域节点特征集合。
进一步通过无监督学习来学习源域图和目标域图的特征表示。其中,采用相同的无监督学习算法来对源域图和目标域图进行无监督学习,得到源域图的特征表示为源域节点特征集合,得到目标域图的特征表示为目标域节点特征集合。
应当说明的是,本发明实施例中对于采用何种无监督学习方法来学习得到源域图和目标域图的特征表示,可以由本领域普通技术人员根据实际需要进行选取,本发明实施例中对此不作具体限制。
比如,可以采用DeepWalk算法对源域图进行无监督学习,得到源域节点特征集合其中,n表示源域图中源域节点的个数,表示源域图中第一个源域节点的特征,表示目标域图中第n个源域节点的特征,以此类推。
同样的,可以采用DeepWalk算法对目标域图进行无监督学习,得到目标域节点特征集合其中,m表示目标域图中目标域节点的个数,表示目标域图中第一个目标域节点的特征,表示目标域图中第n个目标域节点的特征,以此类推。
403,终端构建生成对抗网络,并基于源域节点特征集合和目标域节点特征集合对生成对抗网络进行训练。
应当说明的是,由于需要对齐的源域图和目标域图异构,在分别对源域图和目标域图进行无监督学习之后,学习得到的源域节点特征结集合和目标域节点特征集合将位于不同的特征空间。
为了实现图对齐,本发明中期望源域节点特征通过某映射矩阵映射后能够与目标域节点特征尽可能的相似。因此,引入对抗训练,本发明实施例中,在学习得到源域图的源域节点特征集合以及目标域图的目标域节点特征集合之后,进一步构建生成对抗网络,该生成对抗网络有生成器和判别器组成,生成器可以为一个映射矩阵,用于将源域节点特征集合中的源域节点特征映射到目标域节点特征所在的特征空间,判别器用于区分映射后的源域节点特征和目标域节点特征。
应当说明的是,本发明实施例中对于构建何种生成对抗网络的架构不做限制,可由本领域普通技术人员根据实际需要选取,比如,可以构建标准的生成对抗网络,也可以构建改进的生成对抗网络,如基于Wasserstein距离的生成对抗网络等。
本发明实施例中,在完成生成对抗网络的构建之后,进一步对构建的生成对抗网络进行训练。应当说明的是,对生成对抗网络的训练本质上可以看做是二人零和博弈的问题。
示例性的,以构建标准的生成对抗网络为例,判别器的损失函数为:
其中,W表示生成器,θD表示判别器,n表示源域节点的数量,m表示目标域节点的数量,表示经过生成器映射后的第i个源域节点特征,表示第j个目标域节点特征,表示判别器尽可能的区分出经过生成器映射后的第i个源域节点特征,反之亦然。
对应的,生成器的损失函数为:
在训练时,通过交替迭代优化生成器W和判别器θD来最小化生成器的损失函数和判别器的损失函数通俗的说,即当判别器无法准确的区分出经生成器映射后的源域节点特征时,即训练完成。
404、终端根据训练后的生成对抗网络中的生成器预测源域图和目标域图之间的锚链接,并根据该预测的锚链接对训练后的生成器进行优化,直至满足预设优化条件,得到优化后的生成器。
应当说明的是,由于本发明实施例中在训练生成器时,并没有对源域图中的源域节点和目标域图中的目标域节点进行一对一约束,需要引入额外的监督信息来对训练得到的生成器进行优化,以实现源域节点和目标域节点的一对一对齐,从而避免对抗训练过程中潜在的模式崩塌问题。
因此,本发明实施例中进一步根据训练后的生成器预测源域图和目标域图之间的锚链接。应当说明的是,锚链接为已知的对应同一实体的源域节点和目标域节点。由于本发明实施中并不实际存在锚链接,而是预测得到,因此可将该预测得到的锚链接记为伪锚链接。
在预测得到伪锚链接之后,即可将该伪锚链接作为监督信息对训练得到的生成器进行优化,也即根据锚链接指示的源域节点的源域节点特征,以及目标域节点的目标域节点特征来对训练得到的生成器进行优化。
405,终端根据优化的生成器将源域图中的源域节点与目标域图中的目标域节点对齐,识别出第一社交网络和第二社交网络中的相同用户。
本发明实施例中,完成对训练后的生成器的优化,并得到优化后的生成器之后,即可根据优化后的生成器将源域图中的源域节点与目标域图中的目标域节点对齐,这样,匹配的源域节点和目标域节点各自对应的用户即为同一用户。
实施例三、
为了更好地实施以上方法,本发明实施例还提供一种图对齐装置,该图对齐装置具体可以集成在如手机、平板电脑、笔记本电脑等终端中。
例如,如图5所示,该图对齐装置可以包括图获取模块501、特征学习模块 502、网络构建模块503、网络训练模块504、优化模块505以及图对齐模块506,如下:
图获取模块501,用于获取需要对齐的源域图和目标域图,源域图包括多个源域节点,目标域图包括多个目标域节点;
特征学习模块502,用于对源域图进行无监督学习得到源域节点特征集合,以及对目标域图进行无监督学习得到目标域节点特征集合;
网络构建模块503,用于构建生成对抗网络,生成对抗网络包括用于将源域节点特征映射到目标域节点特征所在特征空间的生成器,以及用于区分映射后的源域节点特征和目标域节点特征的判别器;
网络训练模块504,用于根据源域节点特征集合以及目标域节点特征集合对生成器和判别器进行交替训练,得到训练后的生成器;
优化模块505,用于根据训练后的生成器预测源域图和目标域图之间的锚链接,并根据锚链接所对应的源域节点特征和目标域节点特征优化训练后的生成器,得到优化后的生成器;
图对齐模块506,用于根据优化后的生成器将源域图中的源域节点与目标域图中的目标域节点对齐。
在一实施例中,在根据训练后的生成器预测源域图和目标域图之间的锚链接时,优化模块505用于:
将源域节点特征集合中的源域节点特征和目标域节点特征集合中的目标域节点特征进行两两组合,得到多个节点特征组合;
选中一节点特征组合,并根据训练后的生成器对选中的节点特征组合中的源域节点特征进行映射,得到映射节点特征;
根据映射节点特征与选中的节点特征组合之外的其它目标域节点特征的余弦相似度,以及选中的节点特征组合中目标域节点特征与其它目标域节点特征的余弦相似度,获取选中的节点特征组合对应的跨域相似度;
继续选中其它节点特征组合,直至获取到所有节点特征组合的跨域相似度,并将跨域相似度最高的节点特征组合所对应的源域节点和目标域节点作为锚链接。
在一实施例中,在根据映射节点特征与选中的节点特征组合之外的其它目标域节点特征的余弦相似度,以及选中的节点特征组合中目标域节点特征与其它目标域节点特征的余弦相似度,获取选中的节点特征组合对应的跨域相似度时,优化模块505用于:
确定与映射节点特征余弦相似度最高的前预设数量的其它目标域节点特征,并获取映射节点特征与其对应的前预设数量的其它目标域节点特征与的平均余弦相似度,得到第一平均余弦相似度;
确定与选中的节点特征组合中的目标域节点特征余弦相似度最高的前预设数量的其它目标域节点特征,并获取选中的节点特征组合中的目标域节点特征与其对应的前预设数量的其它目标域节点特征与的平均余弦相似度,得到第二平均余弦相似度;
根据选中的节点特征组合中目标域节点特征和映射节点特征的的余弦相似度、第一平均余弦相似度以及第二平均余弦相似度,获取选中的节点特征组合对应的跨域相似度。
在一实施例中,在根据优化后的生成器将源域图中的源域节点与目标域图中的目标域节点对齐时,图对齐模块506用于:
针对源域图中的任一源域节点,根据优化后的生成器获取任一源域节点与目标域图中各目标域节点的跨域相似度;
将对应跨域相似度最大的目标域节点作为任一源域节点匹配的目标域节点。
在一实施例中,在根据锚链接所对应的源域节点特征和目标域节点特征优化训练后的生成器,得到优化后的生成器时,优化模块505用于:
以使得锚链接所对应的源域节点特征和目标域节点特征之间的欧式距离最近为优化目标,对训练后的生成器进行优化,得到优化后的生成器。
在一实施例中,在获取需要对齐的源域图和目标域图时,图获取模块501 用于:
获取第一社交网络中的用户信息,并根据第一社交网络中的用户信息生成多个节点以及连接不同节点的边,得到源域图;
获取第二社交网络中的用户信息,并根据第二社交网络中的用户信息生成多个节点以及连接不同节点的边,得到目标域图,第二社交网络与第一社交网络为异构社交网络。
在一实施例中,在根据优化后的生成器将源域图中的源域节点与目标域图中的目标域节点对齐之前,优化模块505还用于:
对优化后的生成器进行正交化处理,得到正交化的生成器;
在根据优化后的生成器将源域图和目标域图中的节点对齐时,图对齐模块 506用于:
根据正交化的生成器将源域图和目标域图中的节点对齐。
在一实施例中,对源域图进行无监督学习得到源域节点特征集合,以及对目标域图进行无监督学习得到目标域节点特征集合之前,特征学习模块502还用于:
判断是否存在已知的源域图和目标域图之间的锚链接;
若不存在,则对源域图进行无监督学习得到源域节点特征集合,以及对目标域图进行无监督学习得到目标域节点特征集合;
若存在,则对源域图进行有监督学习得到源域节点特征集合,以及对目标域图进行有监督学习得到目标域节点特征集合,并转入执行构建生成对抗网络。
应当说明的是,本发明实施例提供的图对齐装置与上文实施例中的适于服务器的图对齐方法属于同一构思,其具体实现过程详见以上方法实施例,此处不再赘述。
实施例四、
本发明实施例还提供一种终端,该终端可以为手机、平板电脑、笔记本电脑等设备。如图6所示,其示出了本发明实施例所涉及的终端的结构示意图,具体来讲:
该终端可以包括一个或者一个以上处理核心的处理器601、一个或一个以上计算机可读存储介质的存储器602、电源603和输入单元604等部件。本领域技术人员可以理解,图6中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器601是该终端的控制中心,利用各种接口和线路连接整个终端的各个部分,通过运行或执行存储在存储器602内的软件程序和/或模块,以及调用存储在存储器602内的数据,执行终端的各种功能和处理数据。
存储器602可用于存储软件程序以及模块,处理器601通过运行存储在存储器602的软件程序以及模块,从而执行各种功能应用以及数据处理。此外,存储器602可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器602还可以包括存储器控制器,以提供处理器601对存储器602的访问。
终端还包括给各个部件供电的电源603,优选的,电源603可以通过电源管理***与处理器601逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。
该终端还可包括输入单元604,该输入单元604可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,终端还可以包括显示单元等,在此不再赘述。具体在本实施例中,终端中的处理器601会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器602中,并由处理器601来运行存储在存储器602中的应用程序,从而实现各种功能,如下:
获取需要对齐的源域图和目标域图,源域图包括多个源域节点,目标域图包括多个目标域节点;对源域图进行无监督学习得到源域节点特征集合,以及对目标域图进行无监督学习得到目标域节点特征集合;构建生成对抗网络,生成对抗网络包括用于将源域节点特征映射到目标域节点特征所在特征空间的生成器,以及用于区分映射后的源域节点特征和目标域节点特征的判别器;根据源域节点特征集合以及目标域节点特征集合对生成器和判别器进行交替训练,得到训练后的生成器;根据训练后的生成器预测源域图和目标域图之间的锚链接,并根据锚链接所对应的源域节点特征和目标域节点特征优化训练后的生成器,得到优化后的生成器;根据优化后的生成器将源域图中的源域节点与目标域图中的目标域节点对齐。
应当说明的是,本发明实施例提供的终端与上文实施例中的适用于终端的图对齐方法属于同一构思,其具体实现过程详见以上方法实施例,此处不再赘述。
实施例五、
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本发明实施例提供一种存储介质,其中存储有计算机程序,该计算机程序包括的多条指令能够被终端的处理器进行加载,以执行本发明实施例所提供的适用于终端的图对齐方法,例如:
获取需要对齐的源域图和目标域图,源域图包括多个源域节点,目标域图包括多个目标域节点;对源域图进行无监督学习得到源域节点特征集合,以及对目标域图进行无监督学习得到目标域节点特征集合;构建生成对抗网络,生成对抗网络包括用于将源域节点特征映射到目标域节点特征所在特征空间的生成器,以及用于区分映射后的源域节点特征和目标域节点特征的判别器;根据源域节点特征集合以及目标域节点特征集合对生成器和判别器进行交替训练,得到训练后的生成器;根据训练后的生成器预测源域图和目标域图之间的锚链接,并根据锚链接所对应的源域节点特征和目标域节点特征优化训练后的生成器,得到优化后的生成器;根据优化后的生成器将源域图中的源域节点与目标域图中的目标域节点对齐。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
本发明实施例所提供的存储介质能够实现本发明实施例所提供的对应图对齐方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本发明实施例所提供的一种图对齐方法、装置和存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种图对齐方法,其特征在于,包括:
获取需要对齐的源域图和目标域图,所述源域图包括多个源域节点,所述目标域图包括多个目标域节点;
对所述源域图进行无监督学习得到源域节点特征集合,以及对所述目标域图进行无监督学习得到目标域节点特征集合;
构建生成对抗网络,所述生成对抗网络包括用于将源域节点特征映射到目标域节点特征所在特征空间的生成器,以及用于区分映射后的源域节点特征和目标域节点特征的判别器;
根据所述源域节点特征集合以及所述目标域节点特征集合对所述生成器和所述判别器进行交替训练,得到训练后的生成器;
根据所述训练后的生成器预测所述源域图和所述目标域图之间的锚链接,并根据所述锚链接所对应的源域节点特征和目标域节点特征优化所述训练后的生成器,得到优化后的生成器;
根据所述优化后的生成器将所述源域图中的源域节点与所述目标域图中的目标域节点对齐。
2.根据权利要求1所述的图对齐方法,其特征在于,所述根据所述训练后的生成器预测所述源域图和所述目标域图之间的锚链接的步骤,包括:
将所述源域节点特征集合中的源域节点特征和所述目标域节点特征集合中的目标域节点特征进行两两组合,得到多个节点特征组合;
选中一节点特征组合,并根据所述训练后的生成器对选中的节点特征组合中的源域节点特征进行映射,得到映射节点特征;
根据所述映射节点特征与所述选中的节点特征组合之外的其它目标域节点特征的余弦相似度,以及所述选中的节点特征组合中目标域节点特征与所述其它目标域节点特征的余弦相似度,获取所述选中的节点特征组合对应的跨域相似度;
继续选中其它节点特征组合,直至获取到所有节点特征组合的跨域相似度,并将跨域相似度最高的节点特征组合所对应的源域节点和目标域节点作为所述锚链接。
3.根据权利要求2所述的图对齐方法,其特征在于,所述根据所述映射节点特征与所述选中的节点特征组合之外的其它目标域节点特征的余弦相似度,以及所述选中的节点特征组合中目标域节点特征与所述其它目标域节点特征的余弦相似度,获取所述选中的节点特征组合对应的跨域相似度的步骤,包括:
确定与所述映射节点特征余弦相似度最高的前预设数量的其它目标域节点特征,并获取所述映射节点特征与其对应的前预设数量的其它目标域节点特征与的平均余弦相似度,得到第一平均余弦相似度;
确定与所述选中的节点特征组合中的目标域节点特征余弦相似度最高的前预设数量的其它目标域节点特征,并获取所述选中的节点特征组合中的目标域节点特征与其对应的前预设数量的其它目标域节点特征与的平均余弦相似度,得到第二平均余弦相似度;
根据所述选中的节点特征组合中目标域节点特征和映射节点特征的的余弦相似度、所述第一平均余弦相似度以及所述第二平均余弦相似度,获取所述选中的节点特征组合对应的跨域相似度。
4.根据权利要求2所述的图对齐方法,其特征在于,所述根据所述优化后的生成器将所述源域图中的源域节点与所述目标域图中的目标域节点对齐的步骤包括:
针对所述源域图中的任一源域节点,根据所述优化后的生成器获取所述任一源域节点与所述目标域图中各目标域节点的跨域相似度;
将对应跨域相似度最大的目标域节点作为所述任一源域节点匹配的目标域节点。
5.根据权利要求1-4任一项所述的图对齐方法,其特征在于,所述根据所述锚链接所对应的源域节点特征和目标域节点特征优化所述训练后的生成器,得到优化后的生成器的步骤,包括:
以使得所述锚链接所对应的源域节点特征和目标域节点特征之间的欧式距离最近为优化目标,对所述训练后的生成器进行优化,得到所述优化后的生成器。
6.根据权利要求1-4任一项所述的图对齐方法,其特征在于,所述获取需要对齐的源域图和目标域图的步骤包括:
获取第一社交网络中的用户信息,并根据所述第一社交网络中的用户信息生成多个节点以及连接不同节点的边,得到所述源域图;
获取第二社交网络中的用户信息,并根据第二社交网络中的用户信息生成多个节点以及连接不同节点的边,得到所述目标域图,所述第二社交网络与所述第一社交网络为异构社交网络。
7.根据权利要求1-4任一项所述的图对齐方法,其特征在于,所述根据所述优化后的生成器将所述源域图中的源域节点与所述目标域图中的目标域节点对齐的步骤之前,还包括:
对所述优化后的生成器进行正交化处理,得到正交化的生成器;
所述根据优化后的生成器将所述源域图和所述目标域图中的节点对齐的步骤包括:
根据所述正交化的生成器将所述源域图和所述目标域图中的节点对齐。
8.根据权利要求1-4任一项所述的图对齐方法,其特征在于,所述对所述源域图进行无监督学习得到源域节点特征集合,以及对所述目标域图进行无监督学习得到目标域节点特征集合的步骤之前,还包括:
判断是否存在已知的所述源域图和所述目标域图之间的锚链接;
若不存在,则对所述源域图进行无监督学习得到源域节点特征集合,以及对所述目标域图进行无监督学习得到目标域节点特征集合;
若存在,则对所述源域图进行有监督学习得到源域节点特征集合,以及对所述目标域图进行有监督学习得到目标域节点特征集合,并转入执行所述构建生成对抗网络。
9.一种图对齐装置,其特征在于,包括:
图获取模块,用于获取需要对齐的源域图和目标域图,所述源域图包括多个源域节点,所述目标域图包括多个目标域节点;
特征学习模块,用于对所述源域图进行无监督学习得到源域节点特征集合,以及对所述目标域图进行无监督学习得到目标域节点特征集合;
网络构建模块,用于构建生成对抗网络,所述生成对抗网络包括用于将源域节点特征映射到目标域节点特征所在特征空间的生成器,以及用于区分映射后的源域节点特征和目标域节点特征的判别器;
网络训练模块,用于根据所述源域节点特征集合以及所述目标域节点特征集合对所述生成器和所述判别器进行交替训练,得到训练后的生成器;
优化模块,用于根据所述训练后的生成器预测所述源域图和所述目标域图之间的锚链接,并根据所述锚链接所对应的源域节点特征和目标域节点特征优化所述训练后的生成器,得到优化后的生成器;
图对齐模块,用于根据所述优化后的生成器将所述源域图中的源域节点与所述目标域图中的目标域节点对齐。
10.一种存储介质,其特征在于,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行如权利要求1至8任一项所述的图对齐方法。
CN201910667549.9A 2019-07-23 2019-07-23 一种图对齐方法、装置和存储介质 Active CN110442758B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910667549.9A CN110442758B (zh) 2019-07-23 2019-07-23 一种图对齐方法、装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910667549.9A CN110442758B (zh) 2019-07-23 2019-07-23 一种图对齐方法、装置和存储介质

Publications (2)

Publication Number Publication Date
CN110442758A true CN110442758A (zh) 2019-11-12
CN110442758B CN110442758B (zh) 2022-05-06

Family

ID=68431285

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910667549.9A Active CN110442758B (zh) 2019-07-23 2019-07-23 一种图对齐方法、装置和存储介质

Country Status (1)

Country Link
CN (1) CN110442758B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112507247A (zh) * 2020-12-15 2021-03-16 重庆邮电大学 一种融合用户状态信息的跨社交网络用户对齐方法
CN112667864A (zh) * 2021-03-17 2021-04-16 腾讯科技(深圳)有限公司 图对齐方法、装置、电子设备及存储介质
CN112861814A (zh) * 2021-03-29 2021-05-28 中信银行股份有限公司 遥感图像分类方法、装置、电子设备及可读存储介质
CN113176917A (zh) * 2020-01-27 2021-07-27 富士胶片商业创新有限公司 用于对比网络分析和可视化的***和方法
CN113284150A (zh) * 2021-07-26 2021-08-20 常州微亿智造科技有限公司 基于不成对工业数据的工业质检方法、工业质检装置
CN113723088A (zh) * 2020-05-25 2021-11-30 阿里巴巴集团控股有限公司 自然语言处理方法、装置、文本处理方法、设备和介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107480714A (zh) * 2017-08-09 2017-12-15 东北大学 基于全视角特征的跨社交网络用户识别方法
US20180196860A1 (en) * 2017-01-06 2018-07-12 International Business Machines Corporation Efficient representation, access and modification of variable length objects
CN109949174A (zh) * 2019-03-14 2019-06-28 哈尔滨工程大学 一种异构社交网络用户实体锚链接识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180196860A1 (en) * 2017-01-06 2018-07-12 International Business Machines Corporation Efficient representation, access and modification of variable length objects
CN107480714A (zh) * 2017-08-09 2017-12-15 东北大学 基于全视角特征的跨社交网络用户识别方法
CN109949174A (zh) * 2019-03-14 2019-06-28 哈尔滨工程大学 一种异构社交网络用户实体锚链接识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王莉等: "网络媒体大数据中的异构网络对齐关键技术和应用研究", 《太原理工大学学报》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113176917A (zh) * 2020-01-27 2021-07-27 富士胶片商业创新有限公司 用于对比网络分析和可视化的***和方法
CN113723088A (zh) * 2020-05-25 2021-11-30 阿里巴巴集团控股有限公司 自然语言处理方法、装置、文本处理方法、设备和介质
CN112507247A (zh) * 2020-12-15 2021-03-16 重庆邮电大学 一种融合用户状态信息的跨社交网络用户对齐方法
CN112507247B (zh) * 2020-12-15 2022-09-23 重庆邮电大学 一种融合用户状态信息的跨社交网络用户对齐方法
CN112667864A (zh) * 2021-03-17 2021-04-16 腾讯科技(深圳)有限公司 图对齐方法、装置、电子设备及存储介质
CN112861814A (zh) * 2021-03-29 2021-05-28 中信银行股份有限公司 遥感图像分类方法、装置、电子设备及可读存储介质
CN113284150A (zh) * 2021-07-26 2021-08-20 常州微亿智造科技有限公司 基于不成对工业数据的工业质检方法、工业质检装置

Also Published As

Publication number Publication date
CN110442758B (zh) 2022-05-06

Similar Documents

Publication Publication Date Title
CN110442758A (zh) 一种图对齐方法、装置和存储介质
Li et al. Lotteryfl: Personalized and communication-efficient federated learning with lottery ticket hypothesis on non-iid datasets
Shu et al. Host–parasite: Graph LSTM-in-LSTM for group activity recognition
Song et al. Jkt: A joint graph convolutional network based deep knowledge tracing
Guo et al. Iterative context-aware graph inference for visual dialog
Orekondy et al. Knockoff nets: Stealing functionality of black-box models
Feng et al. Poi2vec: Geographical latent representation for predicting future visitors
Du et al. Cross-network skip-gram embedding for joint network alignment and link prediction
Zhou et al. SELP: Semi-supervised evidential label propagation algorithm for graph data clustering
Azaouzi et al. New trends in influence maximization models
CN113780002B (zh) 基于图表示学习和深度强化学习的知识推理方法及装置
CN109919316A (zh) 获取网络表示学习向量的方法、装置和设备及存储介质
Shandilya et al. AI-assisted Computer Network Operations testbed for Nature-Inspired Cyber Security based adaptive defense simulation and analysis
Wang et al. Inductive learning on commonsense knowledge graph completion
CN104424507B (zh) 一种回声状态网络的预测方法和预测装置
CN110851491A (zh) 基于多重邻居节点的多重语义影响的网络链接预测方法
CN109960755B (zh) 一种基于动态迭代快速梯度的用户隐私保护方法
CN110413704A (zh) 基于加权邻居信息编码的实体对齐方法
Haihong et al. Theme and sentiment analysis model of public opinion dissemination based on generative adversarial network
Ju et al. Let graph be the go board: gradient-free node injection attack for graph neural networks via reinforcement learning
Portegys A maze learning comparison of Elman, long short-term memory, and Mona neural networks
Fang et al. URPI-GRU: An approach of next POI recommendation based on user relationship and preference information
Mei Simulation of Chinese online teaching invocational colleges based on complex evolution and improved neural network
Dabaghi-Zarandi et al. Community detection in complex network based on an improved random algorithm using local and global network information
Sun et al. HVLM: Exploring human-like visual cognition and language-memory network for visual dialog

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant