CN103729475A - 一种社交网络中的多标签传播重叠社区发现方法 - Google Patents

一种社交网络中的多标签传播重叠社区发现方法 Download PDF

Info

Publication number
CN103729475A
CN103729475A CN201410034425.4A CN201410034425A CN103729475A CN 103729475 A CN103729475 A CN 103729475A CN 201410034425 A CN201410034425 A CN 201410034425A CN 103729475 A CN103729475 A CN 103729475A
Authority
CN
China
Prior art keywords
node
label
community
level
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410034425.4A
Other languages
English (en)
Other versions
CN103729475B (zh
Inventor
陈羽中
陈国龙
郭文忠
施松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN201410034425.4A priority Critical patent/CN103729475B/zh
Publication of CN103729475A publication Critical patent/CN103729475A/zh
Application granted granted Critical
Publication of CN103729475B publication Critical patent/CN103729475B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及社交网络技术领域,特别是一种社交网络中的多标签传播重叠社区发现方法,包括如下步骤:读取社交网络数据,构造以社交网络用户为节点,用户关系为边的社交网络图;根据社交网络图,进行社交网络的初步社区划分,采用综合考虑节点中心度以及标签度分布约束的标签传播方法进行社区发现,获得非重叠社区结构;根据获得的非重叠社区结构以及节点在所属社区的中心度值,标记节点所属的层级;根据节点所属层级,计算不同层级节点之间的标签传播增益,并利用多标签传播进行重叠节点挖掘,得到社交网络的重叠社区结构。该方法可有效挖掘社交网络中的重叠社区结构,有利于提高社区检测的精度和效率,可应用于目标群体挖掘、精确营销等领域。

Description

一种社交网络中的多标签传播重叠社区发现方法
技术领域
本发明涉及社交网络技术领域,特别是一种社交网络中的多标签传播重叠社区发现方法。
背景技术
从社会网络中检测社区结构是社会网络分析中的一项重要任务,无论是理论上还是实际应用中都具有十分重要的意义。通过挖掘网络中的社区结构,能够发现网络中隐含的组织结构信息、社会功能以及社区成员之间隐含的有趣属性,如共同爱好等。通过研究社会网络中社区之间、个体之间以及个体与社区之间的关系,可以挖掘出大量有价值的信息,可应用于许多领域。
针对社区发现,已经出现了很多经典的方法。2002年Girvan和Newman基于边介数,提出GN方法,并最早提出模块度Q值作为网络社区划分结果好坏的指标。 总体上,社区发现的经典方法包括模块度优化算法、谱分析法、信息论方法以及标签传播方法等。在上述方法中,节点只能属于一个社区,但是真实的社会网络的社区往往是相互重叠的,即允许节点属于多个社区,如在一个社交网站上,一个用户会拥有多个朋友圈;科研工作者的研究领域经常存在交叉;在生物***中,一种蛋白质通常存在于多种复合物。Palla, G.等基于CPM(Clique Percolation Method)思想,提出用于重叠社区发现的CFinder方法。方法将社区定义为相互连通的k-派系构成的集合,归属于多个k-派系社区的节点即为社区间的重叠节点,之后通过节点社区归属情况输出重叠社区,该方法适用于社区内聚强的网络,难以应用在情况复杂的大规模复杂网络。Ahn等基于边划分的思想,将原始网络中的边映射成新的网络的节点,再利用非重叠社区发现方法划分转换后的网络,则原始网络中连接不同社区的边的节点即为重叠节点。Lancichinetti等利用局部优化及拓展的方法,随机选取种子节点集合,种子节点根据局部优化策略不断向外扩张,直至获得评价函数最大的社区,但是方法对优化函数以及种子节点的选择敏感且算法时间复杂度在最坏情况下为O(n2)。考虑到节点与社区之间的隶属度,Zhang等利用谱分析法将图映射到低维的欧几里得空间,利用模糊C均值聚类进行重叠社区发现,该方法需要每个节点的隶属向量的维数做为算法参数。
上述重叠社区发现算法通常存在参数敏感或者时间复杂度高的问题,难以应用于大规模复杂网络的社区发现,Raghavan等提出标签传播方法用于社区发现,该算法具有线性时间复杂度,但是只能用于非重叠社区发现。LPA的一些扩展方法如COPRA、SLPA、MLPA等允许一个节点拥有多个标签,可用于重叠社区发现,但是上述方法的鲁棒性有待提高,当网络的社区结构不明显或社区之间的重叠程度较高时,社区挖掘精度大大降低
综上,现有的社会网络社区发现方法从发现的社区结构质量以及时间效率上看都尚有很大的提升空间。面对大规模社交网络的场景,现有方法无论实在效果和效率上都难以满足要求。
发明内容
本发明的目的在于提供一种社交网络中的多标签传播重叠社区发现方法,该方法有利于提高社区检测的精度和效率。
为实现上述目的,本发明的技术方案是:一种社交网络中的多标签传播重叠社区发现方法,包括以下步骤:
步骤A:读取社交网络数据,构造以社交网络用户为节点,用户关系为边的社交网络图;
步骤B:初步社区划分:根据社交网络图,采用综合考虑节点中心度以及标签度分布约束的标签传播方法进行社区发现,获得非重叠社区结构;
步骤C:节点层级标记:根据初步社区划分获得的非重叠社区结构以及节点在所属社区的中心度值,标记节点所属的层级;
步骤D:重叠社区细化:根据节点所属的层级,计算不同层级节点之间的标签传播增益,并利用多标签传播进行重叠节点挖掘,得到社交网络的重叠社区结构。
进一步地,所述步骤B中,社交网络的初步社区划分具体包括以下步骤:
步骤B1:根据社交网络图,进行节点标签初始化,为社交网络图中的每个节点分配一个全局唯一的标签号;
步骤B2:根据标签更新规则,对社交网络图中的每个节点进行标签更新,同时根据邻居节点信息更新节点的中心度值,反复迭代,直到满足迭代终止条件;
步骤B3:根据迭代终止时节点所分配的标签,将具有相同标签的节点归属到同一社区,输出非重叠社区结构。
进一步地,所述步骤B2中,综合考虑了节点中心度与标签度分布差异约束条件,进行标签更新,标签更新规则为:
Figure 2014100344254100002DEST_PATH_IMAGE002
其中
Figure 2014100344254100002DEST_PATH_IMAGE004
表示进行标签更新后节点v选择的标签,N l (v)表示与节点v具有相同标签号的邻居节点集合,m为一参数,k v 为节点v的度大小,K l 为标签度的大小,表示属于标签l的各个节点的度大小的总和,定义为:
Figure 2014100344254100002DEST_PATH_IMAGE006
V为社交网络图的节点集合,
Figure 2014100344254100002DEST_PATH_IMAGE008
为克罗内克函数,定义为:
Figure 2014100344254100002DEST_PATH_IMAGE010
p u 为节点中心度,表示节点u处于社区内部的中心程度,p u 值越大表示节点越处于社区的中心位置,在社区发现的迭代过程中,社区归属越稳定;在标签更新的迭代过程中,每个节点u的中心度p u 基于节点u的所有邻居集合中与其具有同样标签的各个节点对其中心度值的贡献总和进行同步的迭代更新,节点中心度p u 定义为
Figure 2014100344254100002DEST_PATH_IMAGE012
其中l表示节点v的当前标签号,N l (u)表示与节点u具有相同标签号的邻居集合,
Figure 2014100344254100002DEST_PATH_IMAGE014
表示节点u的邻居中标签号为l的节点个数;
迭代终止条件为标签数目不再发生变化终止迭代。
进一步地,所述步骤C中,所述节点的层级定义为两级:核心层级与边界层级,用于层级划分的方法包括显式层级划分和模糊层级划分;
显式层级划分的节点层级映射函数定义为:
其中H(v)表示节点v所划分的层级,Boundary=1表示边界层级,Core=2表示核心层级,pMax l pMin l 分别表示各个社区内部节点中心度的最大值和最小值,r为阈值参数,取值范围为0.5~0.8;
模糊层级划分的节点层级映射函数定义为:
Figure 2014100344254100002DEST_PATH_IMAGE018
其中p v 为节点v的节点中心度值。
进一步地,所述步骤D中,重叠社区细化具体包括以下步骤:
步骤D1:标签初始化:每个节点的标签集合初始化为步骤B3迭代终止时所分配的唯一标签,同时设置该标签的隶属度为1;
步骤D2:按照随机顺序遍历社交网络中各节点,对每个节点v,遍历其邻居节点集合中的各节点,根据邻居节点的标签集合,按照标签集合更新规则,更新节点v的标签集合;
步骤D3:根据节点的标签集合中标签个数是否超过阈值,过滤与归一化节点的标签集合;
步骤D4:判断是否满足迭代条件,若满足迭代条件,则终止迭代,否则返回步骤D2执行;
步骤D5:后处理:根据节点的标签集合输出社交网络的重叠社区结构。
进一步地,所述步骤D2中,采用的标签集合更新规则为:随机获取还未更新标签的节点v,遍历该节点的邻居节点集合N(v),假定邻居节点u的标签集合为labelset(u),则节点v的标签集合labelset(v)更新为邻居节点的标签集合的并集,定义为:
Figure 2014100344254100002DEST_PATH_IMAGE020
节点v的标签集合labelset(v)中的标签l,隶属度定义为:
其中b(l,v)表示节点v隶属于标签l的程度,b(l,u)表示节点v的邻居节点u隶属于标签l的程度,gain(u,v)为节点v的邻居节点u对节点v的标签传播增益,gain(u,v)反映了不同类型节点之间的标签传播能力,定义为:
进一步地,所述步骤D3中,标签集合的过滤规则为:若节点v的标签集合labelset(v)中的标签个数超过给定的阈值LSIZE,则保留隶属度最大的前LSIZE个标签;若节点v的标签集合labelset(v)中的标签个数未超过给定的阈值LSIZE,则保留所有标签;标签集合过滤后,对节点v保留下来的标签进行隶属度归一化,保证保留下来的标签的隶属度之和为1。
进一步地,所述步骤D4中,迭代终止条件为社交网络中的标签数目不再发生变化终止迭代。
相较于现有技术,本发明的有益效果是:相较于现有的重叠社区发现算法,在保留现有多标签传播方法的时间效率高的优势的前提下,实现重叠社区的高精度挖掘,并提高了算法的稳定性,综上,本发明的方法能够高效的检测社交网络的社区结构。
附图说明
图1是本发明方法的实现流程图。 
图2是本发明方法中步骤B的实现流程图。
图3是本发明方法中步骤D的实现流程图。
具体实施方式
下面结合附图及具体实施例对本发明作进一步的说明。
图1是本发明的社交网络中的多标签传播重叠社区发现方法的实现流程图。如图1所示,所述方法包括以下步骤:
步骤A:读取社交网络数据,构造以社交网络用户为节点,用户关系为边的社交网络图。
如针对微博网络,将每个微博注册用户作为社交网络中的一个节点,以用户间的相互关注、评论关系作为社交网络中的一条边;如针对协作网络,将每个作者作为网络中的一个节点,以两个作者至少共同发表过一篇文章的协作关系作为社交网络中的一条边。采用稀疏矩阵的数据结构存储社交网络图的邻接矩阵。
步骤B:初步社区划分:根据社交网络图,采用综合考虑节点中心度以及标签度分布约束的标签传播方法进行社区发现,获得非重叠社区结构,同时在标签传播过程中,利用局部更新方法计算节点中心度。
具体的,图2是本发明的社交网络中的多标签传播重叠社区发现方法中步骤B的实现流程图,所述步骤B中,使用单标签传播方法进行社交网络的初步社区划分,具体包括以下步骤:
步骤B1:根据社交网络图,进行节点标签初始化,为社交网络图中的每个节点分配一个全局唯一的标签号;
步骤B2:根据标签更新规则,对社交网络图中的每个节点进行标签更新,同时根据邻居节点信息更新节点的中心度值,反复迭代,直到满足迭代终止条件;
步骤B3:根据迭代终止时节点所分配的标签,将具有相同标签的节点归属到同一社区,输出非重叠社区结构。
具体的,所述步骤B2中,综合考虑了节点中心度与标签度分布差异约束条件,进行标签更新,标签更新规则为:
Figure 692242DEST_PATH_IMAGE002
其中
Figure 671699DEST_PATH_IMAGE004
表示进行标签更新后节点v选择的标签,N l (v)表示与节点v具有相同标签号的邻居节点集合,m为一参数,k v 为节点v的度大小,K l 为标签度的大小,表示属于标签l的各个节点的度大小总和,定义为:
V为社交网络图的节点集合,
Figure 36526DEST_PATH_IMAGE008
为克罗内克函数,定义为:
Figure 913215DEST_PATH_IMAGE010
p u 为节点中心度,表示节点u处于社区内部的中心程度,p u 值越大表示节点越处于社区的中心位置,在社区发现的迭代过程中,社区归属越稳定;在标签更新的迭代过程中,每个节点u的中心度p u 基于节点u的所有邻居集合中与其具有同样标签的各个节点对其中心度值的贡献总和进行同步的迭代更新,节点中心度p u 定义为
Figure 797994DEST_PATH_IMAGE012
其中l表示节点v的当前标签号,N l (u)表示与节点u具有相同标签号的邻居集合,表示节点u的邻居中标签号为l的节点个数;
迭代终止条件为标签数目不再发生变化终止迭代。
步骤C:节点层级标记:根据初步社区划分获得的非重叠社区结构以及节点在所属社区的中心度值,标记节点所属的层级。
具体的,所述步骤C中,节点层级的标记方法如下:节点的层级定义为核心层级与边界层级两个层级,用于层级划分的方法包括显式层级划分和模糊层级划分两种。
显式层级划分的节点层级映射函数定义为:
Figure 450879DEST_PATH_IMAGE016
其中H(v)表示节点v所划分的层级,Boundary=1表示边界层级,Core=2表示核心层级,pMax l pMin l 分别表示各个社区内部节点中心度的最大值和最小值,r为阈值参数,通常取值范围为0.5~0.8。
模糊层级划分的节点层级映射函数定义为:
Figure 179145DEST_PATH_IMAGE018
其中p v 为节点v的节点中心度值。模糊层级划分直接利用节点中心度以一种模糊方式表明节点在所属社区内的层级高低。
显式层级划分的优势在于划分方法比较直观,严格区分社区内部节点的层级后,标签在社区间的传播受到更大程度限制,尽可能保证清晰的网络社区结构,模糊层级划分方式同样能够限制标签在社区间的传播力度,但通过更精细地刻画社区层级,细化不同节点间的标签传播强度。
步骤D:重叠社区细化:根据节点所属的层级,计算不同层级节点之间的标签传播增益,并利用多标签传播进行重叠节点挖掘,得到社交网络的重叠社区结构。
具体的,图3是本发明的社交网络中的多标签传播重叠社区发现方法中步骤D的实现流程图,所述步骤D中,使用多标签传播方法进行重叠社区细化,具体包括以下步骤:
步骤D1:标签初始化:每个节点的标签集合初始化为步骤B3迭代终止时所分配的唯一标签,同时设置该标签的隶属度为1;
步骤D2:按照随机顺序遍历社交网络中各节点,对每个节点v,遍历其邻居节点集合中的各节点,根据邻居节点的标签集合,按照标签集合更新规则,更新节点v的标签集合; 
步骤D3:根据节点的标签集合中标签个数是否超过阈值,过滤与归一化节点的标签集合;
步骤D4:判断是否满足迭代条件,若满足迭代条件,则终止迭代,否则返回步骤D2执行;
步骤D5:后处理:根据节点的标签集合输出社交网络的重叠社区结构。
具体的,所述步骤D2中,采用的标签集合更新规则为:随机获取还未更新标签的节点v,遍历该节点的邻居节点集合N(v),假定邻居节点u的标签集合为labelset(u),则节点v的标签集合labelset(v)更新为邻居节点的标签集合的并集,定义为:
Figure 421776DEST_PATH_IMAGE020
节点v的标签集合labelset(v)中的标签l,隶属度定义为:
Figure 238422DEST_PATH_IMAGE022
其中b(l,v)表示节点v隶属于标签l的程度,b(l,u)表示节点v的邻居节点u隶属于标签l的程度,gain(u,v)为节点v的邻居节点u对节点v的标签传播增益,gain(u,v)反映了不同类型节点之间的标签传播能力,定义为:
Figure 100068DEST_PATH_IMAGE024
其中,H(u)、H(v)为上面定义的显式层级划分或模糊层级划分的节点层级映射函数。标签传播增益使得边界层级的节点对核心层级节点的标签传播增益为负,弱化了核心节点在网络重叠程度高的情况下被边界节点影响的程度,优化了核心节点的稳定性。
具体的,所述步骤D3中,标签集合的过滤规则为:若节点v的标签集合labelset(v)中的标签个数超过给定的阈值LSIZE,则保留隶属度最大的前LSIZE个标签;若节点v的标签集合labelset(v)中的标签个数未超过给定的阈值LSIZE,则保留所有标签;标签集合过滤后,对节点v保留下来的标签进行隶属度归一化,保证保留下来的标签的隶属度之和为1。
具体的,所述步骤D4中,迭代终止条件为社交网络中的标签数目不再发生变化终止迭代。
本发明所述社交网络中的多标签传播重叠社区发现方法,将社区划分过程划分为初步社区发现、节点层级标记、重叠社区细化三个阶段,首先读取社交网络数据,构造以社交网络用户为节点,用户关系为边的社交网络图;根据社交网络图,进行社交网络的初步社区划分,采用综合考虑节点中心度以及标签度分布约束的标签传播方法进行社区发现,获得初步的非重叠社区结构,同时在标签传播过程中,利用局部更新方法计算节点中心度;根据初步社区划分获得的非重叠社区结构以及节点在所属社区的中心度值,标记节点所属的层级;根据节点所属层级,计算不同层级节点之间的标签传播增益,并利用多标签传播进行重叠节点挖掘,得到社交网络的重叠社区结构。所述方法通过引入节点层级的思想及不同层级节点间的标签传播增益来规范标签在节点间的强度,使得在社区发现过程中,减小高层级的节点收影响的程度,同时低层级节点通常处于多个社区的交叉区域,能够根据自身的邻居节点的社区归属及层级信息选择合理的标签集合。方法无需社区数目的先验知识,并对网络结构自适应,可有效的挖掘社交网络中的重叠社区结构,可应用于目标群体挖掘、精确营销等领域。
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。

Claims (8)

1.一种社交网络中的多标签传播重叠社区发现方法,其特征在于,所述方法包括以下步骤:
步骤A:读取社交网络数据,构造以社交网络用户为节点,用户关系为边的社交网络图;
步骤B:初步社区划分:根据社交网络图,采用综合考虑节点中心度以及标签度分布约束的标签传播方法进行社区发现,获得非重叠社区结构;
步骤C:节点层级标记:根据初步社区划分获得的非重叠社区结构以及节点在所属社区的中心度值,标记节点所属的层级;
步骤D:重叠社区细化:根据节点所属的层级,计算不同层级节点之间的标签传播增益,并利用多标签传播进行重叠节点挖掘,得到社交网络的重叠社区结构。
2.根据权利要求1所述的一种社交网络中的多标签传播重叠社区发现方法,其特征在于,所述步骤B中,社交网络的初步社区划分具体包括以下步骤:
步骤B1:根据社交网络图,进行节点标签初始化,为社交网络图中的每个节点分配一个全局唯一的标签号;
步骤B2:根据标签更新规则,对社交网络图中的每个节点进行标签更新,同时根据邻居节点信息更新节点的中心度值,反复迭代,直到满足迭代终止条件;
步骤B3:根据迭代终止时节点所分配的标签,将具有相同标签的节点归属到同一社区,输出非重叠社区结构。
3.根据权利要求2所述的一种社交网络中的多标签传播重叠社区发现方法,其特征在于,所述步骤B2中,综合考虑了节点中心度与标签度分布差异约束条件,进行标签更新,标签更新规则为:
Figure 2014100344254100001DEST_PATH_IMAGE002
其中
Figure 2014100344254100001DEST_PATH_IMAGE004
表示进行标签更新后节点v选择的标签,N l (v)表示与节点v具有相同标签号的邻居节点集合,m为一参数,k v 为节点v的度大小,K l 为标签度的大小,表示属于标签l的各个节点的度大小的总和,定义为:
Figure 2014100344254100001DEST_PATH_IMAGE006
V为社交网络图的节点集合,
Figure 2014100344254100001DEST_PATH_IMAGE008
为克罗内克函数,定义为:
Figure 2014100344254100001DEST_PATH_IMAGE010
p u 为节点中心度,表示节点u处于社区内部的中心程度,p u 值越大表示节点越处于社区的中心位置,在社区发现的迭代过程中,社区归属越稳定;在标签更新的迭代过程中,每个节点u的中心度p u 基于节点u的所有邻居集合中与其具有同样标签的各个节点对其中心度值的贡献总和进行同步的迭代更新,节点中心度p u 定义为
Figure 2014100344254100001DEST_PATH_IMAGE012
其中l表示节点v的当前标签号,N l (u)表示与节点u具有相同标签号的邻居集合,
Figure 2014100344254100001DEST_PATH_IMAGE014
表示节点u的邻居中标签号为l的节点个数;
迭代终止条件为标签数目不再发生变化终止迭代。
4.根据权利要求2所述的一种社交网络中的多标签重叠社区发现方法,其特征在于,所述步骤C中,所述节点的层级定义为两级:核心层级与边界层级,用于层级划分的方法包括显式层级划分和模糊层级划分;
显式层级划分的节点层级映射函数定义为:
其中H(v)表示节点v所划分的层级,Boundary=1表示边界层级,Core=2表示核心层级,pMax l pMin l 分别表示各个社区内部节点中心度的最大值和最小值,r为阈值参数,取值范围为0.5~0.8;
模糊层级划分的节点层级映射函数定义为:
Figure 2014100344254100001DEST_PATH_IMAGE018
其中p v 为节点v的中心度值。
5.根据权利要求2所述的一种社交网络中的多标签重叠社区发现方法,其特征在于,所述步骤D中,重叠社区细化具体包括以下步骤:
步骤D1:标签初始化:每个节点的标签集合初始化为步骤B3迭代终止时所分配的唯一标签,同时设置该标签的隶属度为1;
步骤D2:按照随机顺序遍历社交网络中各节点,对每个节点v,遍历其邻居节点集合中的各节点,根据邻居节点的标签集合,按照标签集合更新规则,更新节点v的标签集合;
步骤D3:根据节点的标签集合中标签个数是否超过阈值,过滤与归一化节点的标签集合;
步骤D4:判断是否满足迭代条件,若满足迭代条件,则终止迭代,否则返回步骤D2执行;
步骤D5:后处理:根据节点的标签集合输出社交网络的重叠社区结构。
6.根据权利要求5所述的一种社交网络中的多标签重叠社区发现方法,其特征在于,所述步骤D2中,采用的标签集合更新规则为:随机获取还未更新标签的节点v,遍历该节点的邻居节点集合N(v),假定邻居节点u的标签集合为labelset(u),则节点v的标签集合labelset(v)更新为邻居节点的标签集合的并集,定义为:
Figure 2014100344254100001DEST_PATH_IMAGE020
节点v的标签集合labelset(v)中的标签l,隶属度定义为:
Figure 2014100344254100001DEST_PATH_IMAGE022
其中b(l,v)表示节点v隶属于标签l的程度,b(l,u)表示节点v的邻居节点u隶属于标签l的程度,gain(u,v)为节点v的邻居节点u对节点v的标签传播增益,gain(u,v)反映了不同类型节点之间的标签传播能力,定义为:
Figure 2014100344254100001DEST_PATH_IMAGE024
7.根据权利要求5所述的一种社交网络中的多标签重叠社区发现方法,其特征在于,所述步骤D3中,标签集合的过滤规则为:若节点v的标签集合labelset(v)中的标签个数超过给定的阈值LSIZE,则保留隶属度最大的前LSIZE个标签;若节点v的标签集合labelset(v)中的标签个数未超过给定的阈值LSIZE,则保留所有标签;标签集合过滤后,对节点v保留下来的标签进行隶属度归一化,保证保留下来的标签的隶属度之和为1。
8.根据权利要求5所述的一种社交网络中的多标签重叠社区发现方法,其特征在于,所述步骤D4中,迭代终止条件为社交网络中的标签数目不再发生变化终止迭代。
CN201410034425.4A 2014-01-24 2014-01-24 一种社交网络中的多标签传播重叠社区发现方法 Expired - Fee Related CN103729475B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410034425.4A CN103729475B (zh) 2014-01-24 2014-01-24 一种社交网络中的多标签传播重叠社区发现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410034425.4A CN103729475B (zh) 2014-01-24 2014-01-24 一种社交网络中的多标签传播重叠社区发现方法

Publications (2)

Publication Number Publication Date
CN103729475A true CN103729475A (zh) 2014-04-16
CN103729475B CN103729475B (zh) 2016-10-26

Family

ID=50453549

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410034425.4A Expired - Fee Related CN103729475B (zh) 2014-01-24 2014-01-24 一种社交网络中的多标签传播重叠社区发现方法

Country Status (1)

Country Link
CN (1) CN103729475B (zh)

Cited By (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104598605A (zh) * 2015-01-30 2015-05-06 福州大学 一种社交网络中的用户影响力评估方法
CN104636978A (zh) * 2015-02-12 2015-05-20 西安电子科技大学 一种基于多标签传播的重叠社区检测方法
CN105069039A (zh) * 2015-07-22 2015-11-18 山东大学 一种基于spark平台的内存迭代的重叠社区并行发现方法
CN105279187A (zh) * 2014-07-15 2016-01-27 天津科技大学 一种基于边聚集系数的社会网络群体划分方法
CN105335438A (zh) * 2014-08-11 2016-02-17 天津科技大学 一种基于局部最短回路的社会网络群体划分方法
CN105893382A (zh) * 2014-12-23 2016-08-24 天津科技大学 一种基于先验知识的微博用户群体划分方法
CN105893381A (zh) * 2014-12-23 2016-08-24 天津科技大学 一种基于半监督标签传播的微博用户群体划分方法
CN105915376A (zh) * 2016-04-13 2016-08-31 华南理工大学 基于p2p点播***的日志信息网络结构化方法及其***
CN105915602A (zh) * 2016-04-13 2016-08-31 华南理工大学 基于社区检测算法p2p网络的调度方法及其***
CN106789588A (zh) * 2016-12-30 2017-05-31 东软集团股份有限公司 标签传播方法和装置
CN106991614A (zh) * 2017-03-02 2017-07-28 南京信息工程大学 Spark下基于标签传播的并行重叠社区发现方法
CN107240028A (zh) * 2017-05-03 2017-10-10 同济大学 复杂网络中基于节点活跃度的非对称社团扩展的重叠社区发现及预测方法
CN107251584A (zh) * 2014-12-18 2017-10-13 脸谱公司 定义场所和流量的位置数据
CN107578136A (zh) * 2017-09-14 2018-01-12 福州大学 基于随机游走与种子扩展的重叠社区发现方法
CN107862618A (zh) * 2017-11-06 2018-03-30 郑州云海信息技术有限公司 一种基于标签传播算法的社区发现方法和装置
CN108133426A (zh) * 2017-12-25 2018-06-08 北京理工大学 一种社交网络链路推荐方法及网络演化模型实施设计
CN108537452A (zh) * 2018-04-13 2018-09-14 中山大学 一种面向大规模复杂网络的密集可重叠社区划分方法
CN108681936A (zh) * 2018-04-26 2018-10-19 浙江邦盛科技有限公司 一种基于模块度和平衡标签传播的欺诈团伙识别方法
CN108763359A (zh) * 2018-05-16 2018-11-06 武汉斗鱼网络科技有限公司 一种具有关联关系的用户挖掘方法、装置及电子设备
CN108846543A (zh) * 2018-04-26 2018-11-20 深圳大学 一种非重叠社区集合质量度量指标的计算方法及装置
CN108898264A (zh) * 2018-04-26 2018-11-27 深圳大学 一种重叠社区集合质量度量指标的计算方法及装置
CN109086629A (zh) * 2018-09-19 2018-12-25 海南大学 基于社交网络的时效敏感的仿区块链密码体系
CN109344326A (zh) * 2018-09-11 2019-02-15 阿里巴巴集团控股有限公司 一种社交圈的挖掘方法和装置
CN109446713A (zh) * 2018-11-14 2019-03-08 重庆理工大学 针对在线社交网络数据提取后的稳定性判别方法
CN109948001A (zh) * 2019-03-07 2019-06-28 华中科技大学 一种亚线性时间分布式计算围长的最小社区发现方法
WO2019149268A1 (zh) * 2018-02-02 2019-08-08 众安信息技术服务有限公司 一种互联网保险产品的营销方法和***
CN110110154A (zh) * 2018-02-01 2019-08-09 腾讯科技(深圳)有限公司 一种图文件的处理方法、装置及存储介质
CN110166344A (zh) * 2018-04-25 2019-08-23 腾讯科技(深圳)有限公司 一种身份标识识别方法、装置以及相关设备
CN110309419A (zh) * 2018-05-14 2019-10-08 桂林远望智能通信科技有限公司 一种基于平衡多标签传播的重叠组织架构挖掘方法及装置
CN110457477A (zh) * 2019-08-09 2019-11-15 东北大学 一种面向社交网络的兴趣社群发现方法
CN110956553A (zh) * 2019-12-16 2020-04-03 电子科技大学 基于社交网络节点双标签传播算法的社区结构划分方法
CN110969526A (zh) * 2019-12-13 2020-04-07 南京三百云信息科技有限公司 重叠社群处理方法、装置以及电子设备
CN112084424A (zh) * 2020-09-10 2020-12-15 深圳市万佳安人工智能数据技术有限公司 一种基于属性图信息的社交网络社团发现方法和***
CN112464107A (zh) * 2020-11-26 2021-03-09 重庆邮电大学 一种基于多标签传播的社交网络重叠社区发现方法及装置
CN112967146A (zh) * 2021-02-03 2021-06-15 北京航空航天大学 一种基于标签传播的科研社区发现方法及装置
CN113487465A (zh) * 2021-06-22 2021-10-08 中国地质大学(武汉) 基于标签传播算法的城市重叠结构特征检测方法及***
CN113516562A (zh) * 2021-07-28 2021-10-19 中移(杭州)信息技术有限公司 家庭社交网络构建方法、装置、设备及存储介质
CN113704371A (zh) * 2021-07-16 2021-11-26 重庆工商大学 一种地理信息网络中自适应检测划分子区域的方法
CN113761305A (zh) * 2020-06-03 2021-12-07 北京沃东天骏信息技术有限公司 一种生成标签层级结构的方法和装置
CN114547143A (zh) * 2022-02-15 2022-05-27 支付宝(杭州)信息技术有限公司 一种核心业务对象的挖掘方法和装置
CN117808616A (zh) * 2024-02-28 2024-04-02 中国传媒大学 一种基于图嵌入和节点亲密度的社区发现方法及***

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109063173A (zh) * 2018-08-21 2018-12-21 电子科技大学 一种基于局部标签信息的半监督重叠社区发现方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101916256A (zh) * 2010-07-13 2010-12-15 北京大学 综合行动者兴趣与网络拓扑的社区发现方法
CN102073700A (zh) * 2010-12-30 2011-05-25 浙江大学 一种复杂网络社团的发现方法
CN102456062A (zh) * 2010-11-04 2012-05-16 中国人民解放军国防科学技术大学 社区相似度计算方法与社会网络合作模式发现方法
US20120123899A1 (en) * 2010-11-17 2012-05-17 Christian Wiesner Social network shopping system and method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101916256A (zh) * 2010-07-13 2010-12-15 北京大学 综合行动者兴趣与网络拓扑的社区发现方法
CN102456062A (zh) * 2010-11-04 2012-05-16 中国人民解放军国防科学技术大学 社区相似度计算方法与社会网络合作模式发现方法
US20120123899A1 (en) * 2010-11-17 2012-05-17 Christian Wiesner Social network shopping system and method
CN102073700A (zh) * 2010-12-30 2011-05-25 浙江大学 一种复杂网络社团的发现方法

Cited By (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105279187A (zh) * 2014-07-15 2016-01-27 天津科技大学 一种基于边聚集系数的社会网络群体划分方法
CN105335438A (zh) * 2014-08-11 2016-02-17 天津科技大学 一种基于局部最短回路的社会网络群体划分方法
CN107251584A (zh) * 2014-12-18 2017-10-13 脸谱公司 定义场所和流量的位置数据
CN107251584B (zh) * 2014-12-18 2020-04-28 脸谱公司 定义场所和流量的位置数据
CN105893382A (zh) * 2014-12-23 2016-08-24 天津科技大学 一种基于先验知识的微博用户群体划分方法
CN105893381A (zh) * 2014-12-23 2016-08-24 天津科技大学 一种基于半监督标签传播的微博用户群体划分方法
CN104598605A (zh) * 2015-01-30 2015-05-06 福州大学 一种社交网络中的用户影响力评估方法
CN104598605B (zh) * 2015-01-30 2018-01-12 福州大学 一种社交网络中的用户影响力评估方法
CN104636978A (zh) * 2015-02-12 2015-05-20 西安电子科技大学 一种基于多标签传播的重叠社区检测方法
CN104636978B (zh) * 2015-02-12 2017-11-14 西安电子科技大学 一种基于多标签传播的重叠社区检测方法
CN105069039B (zh) * 2015-07-22 2018-05-18 山东大学 一种基于spark平台的内存迭代的重叠社区并行发现方法
CN105069039A (zh) * 2015-07-22 2015-11-18 山东大学 一种基于spark平台的内存迭代的重叠社区并行发现方法
CN105915602A (zh) * 2016-04-13 2016-08-31 华南理工大学 基于社区检测算法p2p网络的调度方法及其***
CN105915376A (zh) * 2016-04-13 2016-08-31 华南理工大学 基于p2p点播***的日志信息网络结构化方法及其***
CN106789588B (zh) * 2016-12-30 2019-10-22 东软集团股份有限公司 标签传播方法和装置
CN106789588A (zh) * 2016-12-30 2017-05-31 东软集团股份有限公司 标签传播方法和装置
CN106991614A (zh) * 2017-03-02 2017-07-28 南京信息工程大学 Spark下基于标签传播的并行重叠社区发现方法
CN107240028B (zh) * 2017-05-03 2020-09-15 同济大学 一种Fedora***组件复杂网络中的重叠社区检测方法
CN107240028A (zh) * 2017-05-03 2017-10-10 同济大学 复杂网络中基于节点活跃度的非对称社团扩展的重叠社区发现及预测方法
CN107578136A (zh) * 2017-09-14 2018-01-12 福州大学 基于随机游走与种子扩展的重叠社区发现方法
CN107862618A (zh) * 2017-11-06 2018-03-30 郑州云海信息技术有限公司 一种基于标签传播算法的社区发现方法和装置
CN108133426A (zh) * 2017-12-25 2018-06-08 北京理工大学 一种社交网络链路推荐方法及网络演化模型实施设计
CN108133426B (zh) * 2017-12-25 2022-02-25 北京理工大学 一种社交网络链路推荐方法
CN110110154A (zh) * 2018-02-01 2019-08-09 腾讯科技(深圳)有限公司 一种图文件的处理方法、装置及存储介质
CN110110154B (zh) * 2018-02-01 2023-07-11 腾讯科技(深圳)有限公司 一种图文件的处理方法、装置及存储介质
WO2019149268A1 (zh) * 2018-02-02 2019-08-08 众安信息技术服务有限公司 一种互联网保险产品的营销方法和***
CN108537452A (zh) * 2018-04-13 2018-09-14 中山大学 一种面向大规模复杂网络的密集可重叠社区划分方法
CN110166344B (zh) * 2018-04-25 2021-08-24 腾讯科技(深圳)有限公司 一种身份标识识别方法、装置以及相关设备
CN110166344A (zh) * 2018-04-25 2019-08-23 腾讯科技(深圳)有限公司 一种身份标识识别方法、装置以及相关设备
CN108898264B (zh) * 2018-04-26 2021-10-29 深圳大学 一种重叠社区集合质量度量指标的计算方法及装置
CN108846543A (zh) * 2018-04-26 2018-11-20 深圳大学 一种非重叠社区集合质量度量指标的计算方法及装置
CN108681936A (zh) * 2018-04-26 2018-10-19 浙江邦盛科技有限公司 一种基于模块度和平衡标签传播的欺诈团伙识别方法
CN108846543B (zh) * 2018-04-26 2021-10-29 深圳大学 一种非重叠社区集合质量度量指标的计算方法及装置
CN108898264A (zh) * 2018-04-26 2018-11-27 深圳大学 一种重叠社区集合质量度量指标的计算方法及装置
CN110309419A (zh) * 2018-05-14 2019-10-08 桂林远望智能通信科技有限公司 一种基于平衡多标签传播的重叠组织架构挖掘方法及装置
CN108763359A (zh) * 2018-05-16 2018-11-06 武汉斗鱼网络科技有限公司 一种具有关联关系的用户挖掘方法、装置及电子设备
CN109344326B (zh) * 2018-09-11 2021-09-24 创新先进技术有限公司 一种社交圈的挖掘方法和装置
CN109344326A (zh) * 2018-09-11 2019-02-15 阿里巴巴集团控股有限公司 一种社交圈的挖掘方法和装置
CN109086629B (zh) * 2018-09-19 2019-07-30 海南大学 基于社交网络的时效敏感的仿区块链密码体系
CN109086629A (zh) * 2018-09-19 2018-12-25 海南大学 基于社交网络的时效敏感的仿区块链密码体系
CN109446713B (zh) * 2018-11-14 2020-04-03 重庆理工大学 针对在线社交网络数据提取后的稳定性判别方法
CN109446713A (zh) * 2018-11-14 2019-03-08 重庆理工大学 针对在线社交网络数据提取后的稳定性判别方法
CN109948001B (zh) * 2019-03-07 2021-04-20 华中科技大学 一种亚线性时间分布式计算围长的最小社区发现方法
CN109948001A (zh) * 2019-03-07 2019-06-28 华中科技大学 一种亚线性时间分布式计算围长的最小社区发现方法
CN110457477A (zh) * 2019-08-09 2019-11-15 东北大学 一种面向社交网络的兴趣社群发现方法
CN110969526A (zh) * 2019-12-13 2020-04-07 南京三百云信息科技有限公司 重叠社群处理方法、装置以及电子设备
CN110956553A (zh) * 2019-12-16 2020-04-03 电子科技大学 基于社交网络节点双标签传播算法的社区结构划分方法
CN113761305A (zh) * 2020-06-03 2021-12-07 北京沃东天骏信息技术有限公司 一种生成标签层级结构的方法和装置
CN113761305B (zh) * 2020-06-03 2024-07-16 北京沃东天骏信息技术有限公司 一种生成标签层级结构的方法和装置
CN112084424A (zh) * 2020-09-10 2020-12-15 深圳市万佳安人工智能数据技术有限公司 一种基于属性图信息的社交网络社团发现方法和***
CN112464107A (zh) * 2020-11-26 2021-03-09 重庆邮电大学 一种基于多标签传播的社交网络重叠社区发现方法及装置
CN112967146A (zh) * 2021-02-03 2021-06-15 北京航空航天大学 一种基于标签传播的科研社区发现方法及装置
CN113487465A (zh) * 2021-06-22 2021-10-08 中国地质大学(武汉) 基于标签传播算法的城市重叠结构特征检测方法及***
CN113704371A (zh) * 2021-07-16 2021-11-26 重庆工商大学 一种地理信息网络中自适应检测划分子区域的方法
CN113516562A (zh) * 2021-07-28 2021-10-19 中移(杭州)信息技术有限公司 家庭社交网络构建方法、装置、设备及存储介质
CN113516562B (zh) * 2021-07-28 2023-09-19 中移(杭州)信息技术有限公司 家庭社交网络构建方法、装置、设备及存储介质
CN114547143A (zh) * 2022-02-15 2022-05-27 支付宝(杭州)信息技术有限公司 一种核心业务对象的挖掘方法和装置
CN117808616A (zh) * 2024-02-28 2024-04-02 中国传媒大学 一种基于图嵌入和节点亲密度的社区发现方法及***

Also Published As

Publication number Publication date
CN103729475B (zh) 2016-10-26

Similar Documents

Publication Publication Date Title
CN103729475A (zh) 一种社交网络中的多标签传播重叠社区发现方法
Wang et al. Review on community detection algorithms in social networks
CN103678671A (zh) 一种社交网络中的动态社区检测方法
CN104598605A (zh) 一种社交网络中的用户影响力评估方法
CN105893382A (zh) 一种基于先验知识的微博用户群体划分方法
CN105279187A (zh) 一种基于边聚集系数的社会网络群体划分方法
CN103678669A (zh) 一种社交网络中的社区影响力评估***及方法
CN106709035A (zh) 一种电力多维全景数据的预处理***
CN105335438A (zh) 一种基于局部最短回路的社会网络群体划分方法
CN102915423B (zh) 一种基于粗糙集和基因表达式的电力业务数据过滤***及方法
CN105893381A (zh) 一种基于半监督标签传播的微博用户群体划分方法
CN103020267A (zh) 基于三角簇多标签传播的复杂网络社区结构挖掘方法
CN102799625A (zh) 一种挖掘社交网络中话题核心圈的方法及***
CN104700311B (zh) 一种社会网络中的邻域跟随社区发现方法
CN102663108B (zh) 基于复杂网络模型并行化标签传播算法的药物社团发现方法
CN103186628A (zh) 一种公共信息模型与关系型数据库之间的映射方法
CN105335478B (zh) 构建城市土地空间立体调查数据语义关联的方法和装置
Bradley Mumford dendrograms
Hiatt et al. Connectivity and directionality in estuarine channel networks
CN102622447A (zh) 一种基于Hadoop的频繁闭项集挖掘方法
CN104899283A (zh) 一种针对单个不确定图的频繁子图挖掘与优化方法
CN103534700A (zh) 用于配置策略提取的***和方法
Han et al. An Interval‐Parameter Fuzzy Linear Programming with Stochastic Vertices Model for Water Resources Management under Uncertainty
CN105159922A (zh) 基于标签传播算法面向寄递数据的并行化社团发现方法
CN104268270A (zh) 基于MapReduce挖掘海量社交网络数据中三角形的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20161026

Termination date: 20200124