CN107222334A - 适用于社交网络的基于核心三角的局部社团发现方法 - Google Patents

适用于社交网络的基于核心三角的局部社团发现方法 Download PDF

Info

Publication number
CN107222334A
CN107222334A CN201710372354.2A CN201710372354A CN107222334A CN 107222334 A CN107222334 A CN 107222334A CN 201710372354 A CN201710372354 A CN 201710372354A CN 107222334 A CN107222334 A CN 107222334A
Authority
CN
China
Prior art keywords
corporations
mrow
node
local
msub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710372354.2A
Other languages
English (en)
Inventor
吴骏
王晓彤
乔羽
王崇骏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CN201710372354.2A priority Critical patent/CN107222334A/zh
Publication of CN107222334A publication Critical patent/CN107222334A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种适用于社交网络的基于核心三角的局部社团发现方法,包括如下步骤:1)核心三角选取阶段:a确定核心节点;b找到核心节点与其邻居节点构成的所有三角形;c选取度数最高的作为核心三角;d结束;2)社团扩张阶段:a核心三角作为初始社团;b计算每个社团邻居节点的节点适应度;c选取节点适应度最大的邻居节点加入社团迭代生成局部社团;d结束;3)局部社团合并阶段:a计算两局部社团之间相似度;b基于相似度阈值两两合并局部社团;c结束。该方法无需获取全局网络结构信息,只需迭代获取局部信息即可生成的该社交网络的局部社团划分,为社交网络中发现局部社团结构提供了解决方案。

Description

适用于社交网络的基于核心三角的局部社团发现方法
技术领域
本发明涉及社会网络分析中的社团发现领域,具体涉及一种基于核心三角用于分析社交网络中的局部社团发现应用方法。
背景技术
目前,社团发现研究领域的研究热点主要有社团的重叠性,局部社团发现,异构网络的社团发现,动态网络的社团发现等等。本发明着重于社团网络的局部性特征。随着社团发现研究的进展,以及现实世界中社交网络规模的不断增大,社团发现方法研究方向也逐渐向超大规模社交网络的社团发现倾斜。在信息***的当代,在海量数据生成的社交网络之中,获取网络的全局结构信息变得十分困难,且通过全局的网络结构信息来生成整个网络的社团划分所需时间及计算成本变得过于高昂。而传统的应用于社交网络之上的社团发现方法通常依赖于全局网络结构信息的获取,进而难以应用于大规模社交网络,因此基于局部信息社团结构发现越来越受到重视。
所谓局部社团发现,即不依赖网络全局结构信息,基于一个初始节点或社团,通过某个节点或者边的局部信息进行扩散的方法。该类方法由于在生成一个社团时不需要获取网络的全局结构信息,大大加快了社团生成的速度。社交网络规模通常非常庞大,获取全局网络的社团划分通常成本较高且没有必要,基于单个用户的社团结构分析往往更具有实用价值。
发明内容
本发明即针对社交网络的社团发现问题提出了一种解决方案,即适用于社交网络的基于核心三角的局部社团发现方法。
具体技术方案如下:适用于社交网络的基于核心三角的局部社团发现方法包括如下步骤:
1)核心三角选取阶段:
a确定核心节点;
b找到核心节点与其邻居节点构成的所有三角形;
c选取度数最高的作为核心三角;
d结束;
2)局部社团扩张阶段:
a核心三角作为初始社团;
b计算每个社团邻居节点的节点适应度;
c选取节点适应度最大的邻居节点加入社团迭代生成局部社团;
d结束;
3)局部社团合并阶段:
a计算两局部社团之间相似度;
b基于相似度阈值两两合并局部社团;
c结束。
本发明中,步骤1)-a中所述核心节点由使用者自行确定。
本发明中,步骤1)-b中所述的三角形由以下公式定义:
T=Δ{va|(vb,vc)∈A}
其中A是节点va的所有邻居节点集合,vb、vc是集合A中的节点。
本发明中,2)-b中所述节点适应度的定义如下:
对于当前局部社团,社团适应度由以下公式定义:
其中,α∈(0,1]为一个用以控制社团规模大小的参数。为局部社团内部的边度数,公式中为局部社团外部的边度数;
根据以上局部社团适应度FG的定义,可以给出一个不属于社团G的节点v的节点适应度,即将节点v加入局部社团后,局部社团G的适应度的增量:
其中,FG+v表示加入了节点v后的局部社团的适应度,FG+v与FG的差值即是节点v对局部社团G的适应度的贡献度
本发明中,步骤3)-b中所述两局部社团之间相似度由以下公式定义:
其中Ci∩Cj为社团Ci和Cj中共有节点总数,MIN(Ci,Cj)为Ci和Cj两者中节点数最少的数值。制定参数∈,若两社团间相似度将其合并为一个社团。
本发明的有益效果:本发明的一种适用于社交网络的基于核心三角的局部社团发现方法,通过核心三角寻找,局部社团扩张等阶段,能够有效地生成社交网络中局部社团结构划分。有效解决了基于全局网络结构信息的社团发现方法计算效率低的问题。
附图说明
图1为适用于社交网络的基于核心三角的局部社团发现方法的流程图。
图2为选取核心三角的流程图。
图3为基于核心三角扩张生成一个局部社团的流程图。
具体实施方式
为了更了解本发明的技术内容,特举具体实施例并配合所附图式说明如下。
如图1为本发明实施适用于社交网络的基于核心三角的局部社团发现方法的流程图,具体步骤描述如下:
步骤1-0是该流程的开始;
步骤1-1是确定核心节点;
步骤1-2是找到核心节点与其邻居节点构成的所有三角形,三角形由以下公式定义:
T=Δ{va|(vb,vc)∈A}
其中A是节点va的所有邻居节点集合,vb、vc是集合A中的节点;
步骤1-3是选取度数最高的作为核心三角;
步骤1-4是基于核心三角初始化局部社团;
步骤1-5是计算局部社团所有邻居节点的适应度;
步骤1-6是选取适应度最高的节点加入到局部社团当中;
步骤1-7是计算两两局部社团之间的相似度,具体相似度公式如下:
步骤1-8是若两社团的相似度大于一定的阈值∈,则两社团相似,将两社团合并为一个社团,该过程迭代进行,直至所有局部社团之间都不相似为止,设定阈值参数∈为0.7;
步骤1-9是该流程的结束。
如图2所示,本发明在核心三角选取阶段的方法流程图,具体步骤描述如下:
步骤2-0是该流程的开始;
步骤2-1是选取核心节点a,并初始化核心三角集合T,初始值为空;
步骤2-2是分别遍历节点a的邻居节点b和c;
步骤2-3是判断是否遍历过所有的邻居节点,若遍历结束,跳转到步骤2-7;过没有遍历结束,继续步骤2-4;
步骤2-4是判断节点a,b,c是否能够构成一个三角形t,若不能构成三角形,跳转到步骤2-2;若能够构成一个三角形,继续步骤2-5;
步骤2-5是判断由节点a,b,c构成的三角形t的度数总和是否大于集合T的度数总和,若不大于,跳转到步骤2-2;若大于,继续步骤2-6;
步骤2-6是更新集合T,先清空集合T,并将节点a,b,c加入到集合T中,并跳转到步骤2-2;
步骤2-7是该流程的结束;
如图3所示,本发明在局部社团扩张阶段的方法流程图,具体步骤描述如下:
步骤2-0是该流程的开始;
步骤3-1是基于核心三角初始化局部社团D,并初始化该局部社团的邻居节点集和S;
步骤3-2是计算集合S中所有节点的节点适应度,具体计算方法如下:
1)使用如下公式计算当前社团的适应度:
2)使用如下计算当前社团加入节点v的适应度增量:
步骤3-3是判断是否集合S中所有节点适应度皆小于0,若都小于0,跳转到步骤3-6;若不是,继续步骤3-4;
步骤3-4是选取集合S中适应度最高的节点加入当前社团;
步骤3-5是更新节点集合D,S,将适应度最高的节点加入D,并将新的与D邻接且不属于D的节点加入S,并跳转到步骤3-2;
步骤3-6是流程的结束,输出局部社团划分的集合D。
综上所述,本发明的一种适用于社交网络的基于核心三角的局部社团发现方法,通过核心三角寻找,局部社团扩张等阶段,能够有效地生成社交网络中局部社团结构划分。有效解决了基于全局网络结构信息的社团发现方法计算效率低的问题。
虽然本发明已以较佳实施例揭露如上,然其并非用以限定本发明。本发明所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当可作各种的更动与润饰。因此,本发明的保护范围当视权利要求书所界定者为准。

Claims (6)

1.一种适用于社交网络的基于核心三角的局部社团发现方法,其特征在于,包括如下步骤:
1)社交网络的核心三角选取阶段:
a确定社交网络的核心节点;
b找到社交网络的核心节点与其邻居节点构成的所有三角形;
c选取度数最高的作为核心三角;
d结束;
2)社交网络的局部社团扩张阶段:
a核心三角作为初始社团;
b计算每个社团邻居节点的节点适应度;
c选取节点适应度最大的邻居节点加入社团迭代生成局部社团;
d结束;
3)社交网络的局部社团合并阶段:
a计算两局部社团之间相似度;
b基于相似度阈值两两合并局部社团;
c结束。
2.根据权利要求1所述的适用于发现社交网络中局部社团结构方法,其特征在于,其中步骤1)-b中所述的三角形定义如下:
T=Δ{va|(vb、vc)∈A}
其中,A是节点va的所有邻居节点集合,vb、vc是集合A中的节点。
3.根据权利要求1所述的适用于发现社交网络中局部社团结构方法,其特征在于,其中步骤2)-b中的节点适应度定义如下:
1)对于当前局部社团,社团适应度由以下公式定义:
<mrow> <msub> <mi>F</mi> <mi>G</mi> </msub> <mo>=</mo> <mfrac> <msubsup> <mi>k</mi> <mrow> <mi>i</mi> <mi>n</mi> </mrow> <mi>G</mi> </msubsup> <msup> <mrow> <mo>(</mo> <msubsup> <mi>k</mi> <mrow> <mi>i</mi> <mi>n</mi> </mrow> <mi>G</mi> </msubsup> <mo>+</mo> <msubsup> <mi>k</mi> <mrow> <mi>o</mi> <mi>u</mi> <mi>t</mi> </mrow> <mi>G</mi> </msubsup> <mo>)</mo> </mrow> <mi>&amp;alpha;</mi> </msup> </mfrac> </mrow>
其中,α∈(0,1]为一个用以控制社团规模大小的参数,为局部社团内部的边度数,公式中为局部社团外部的边度数;
2)根据局部社团适应度FG的定义,给出一个不属于社团G的节点v的节点适应度,即将节点v加入局部社团后,局部社团G适应度的增量:
<mrow> <msubsup> <mi>F</mi> <mi>v</mi> <mi>G</mi> </msubsup> <mo>=</mo> <msub> <mi>F</mi> <mrow> <mi>G</mi> <mo>+</mo> <mi>v</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>F</mi> <mi>G</mi> </msub> </mrow>
其中,FG+v表示加入了节点v后的局部社团的适应度,FG+v与FG的差值即是节点v对局部社团G的适应度的贡献度。
4.根据权利要求1所述的适用于发现社交网络中局部社团结构方法,其特征在于,其中步骤3)-a中的社团相似度公式定义如下:
<mrow> <msub> <mi>sim</mi> <mrow> <msub> <mi>C</mi> <mi>i</mi> </msub> <msub> <mi>C</mi> <mi>j</mi> </msub> </mrow> </msub> <mo>=</mo> <mfrac> <mrow> <msub> <mi>C</mi> <mi>i</mi> </msub> <mo>&amp;cap;</mo> <msub> <mi>C</mi> <mi>j</mi> </msub> </mrow> <mrow> <mi>M</mi> <mi>I</mi> <mi>N</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>C</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>
其中,Ci∩Cj为社团Ci和Cj中共有节点总数,MIN(Ci,Cj)为Ci和Cj两者中节点数最少的数值,制定参数∈,若两社团间相似度将其合并为一个社团。
5.根据权利要求1所述的适用于社交网络的基于核心三角的局部社团发现方法,其特征在于,若两社团的相似度大于一定的阈值∈,则两社团相似,将两社团合并为一个社团,该过程迭代进行,直至所有局部社团之间都不相似为止;设定阈值参数∈为0.7。
6.根据权利要求1所述的适用于社交网络的基于核心三角的局部社团发现方法,其特征在于,核心三角选取阶段具体步骤描述如下:
步骤2-0是该流程的开始;
步骤2-1是选取核心节点a,并初始化核心三角集合T,初始值为空;
步骤2-2是分别遍历节点a的邻居节点b和c;
步骤2-3是判断是否遍历过所有的邻居节点,若遍历结束,跳转到步骤2-7;过没有遍历结束,继续步骤2-4;
步骤2-4是判断节点a,b,c是否能够构成一个三角形t,若不能构成三角形,跳转到步骤2-2;若能够构成一个三角形,继续步骤2-5;
步骤2-5是判断由节点a,b,c构成的三角形t的度数总和是否大于集合T的度数总和,若不大于,跳转到步骤2-2;若大于,继续步骤2-6;
步骤2-6是更新集合T,先清空集合T,并将节点a,b,c加入到集合T中,并跳转到步骤2-2;
步骤2-7是该流程的结束;
局部社团扩张阶段的具体步骤描述如下:
步骤3-0是该流程的开始;
步骤3-1是基于核心三角初始化局部社团D,并初始化该局部社团的邻居节点集和S;
步骤3-2是计算集合S中所有节点的节点适应度,具体计算方法如下:
1)使用如下公式计算当前社团的适应度:
<mrow> <msub> <mi>F</mi> <mi>G</mi> </msub> <mo>=</mo> <mfrac> <msubsup> <mi>k</mi> <mrow> <mi>i</mi> <mi>n</mi> </mrow> <mi>G</mi> </msubsup> <msup> <mrow> <mo>(</mo> <msubsup> <mi>k</mi> <mrow> <mi>i</mi> <mi>n</mi> </mrow> <mi>G</mi> </msubsup> <mo>+</mo> <msubsup> <mi>k</mi> <mrow> <mi>o</mi> <mi>u</mi> <mi>t</mi> </mrow> <mi>G</mi> </msubsup> <mo>)</mo> </mrow> <mi>&amp;alpha;</mi> </msup> </mfrac> </mrow>
2)使用如下计算当前社团加入节点v的适应度增量:
<mrow> <msubsup> <mi>F</mi> <mi>v</mi> <mi>G</mi> </msubsup> <mo>=</mo> <msub> <mi>F</mi> <mrow> <mi>G</mi> <mo>+</mo> <mi>v</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>F</mi> <mi>G</mi> </msub> </mrow>
步骤3-3是判断是否集合S中所有节点适应度皆小于0,若都小于0,跳转到步骤3-6;若不是,继续步骤3-4;
步骤3-4是选取集合S中适应度最高的节点加入当前社团;
步骤3-5是更新节点集合D,S,将适应度最高的节点加入D,并将新的与D邻接且不属于D的节点加入S,并跳转到步骤3-2;
步骤3-6是流程的结束,输出局部社团划分的集合D。
CN201710372354.2A 2017-05-24 2017-05-24 适用于社交网络的基于核心三角的局部社团发现方法 Pending CN107222334A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710372354.2A CN107222334A (zh) 2017-05-24 2017-05-24 适用于社交网络的基于核心三角的局部社团发现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710372354.2A CN107222334A (zh) 2017-05-24 2017-05-24 适用于社交网络的基于核心三角的局部社团发现方法

Publications (1)

Publication Number Publication Date
CN107222334A true CN107222334A (zh) 2017-09-29

Family

ID=59944561

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710372354.2A Pending CN107222334A (zh) 2017-05-24 2017-05-24 适用于社交网络的基于核心三角的局部社团发现方法

Country Status (1)

Country Link
CN (1) CN107222334A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110086670A (zh) * 2019-04-29 2019-08-02 安徽大学 基于局部邻居信息的大规模复杂网络社团发现方法及应用
CN110287237A (zh) * 2019-06-25 2019-09-27 上海诚数信息科技有限公司 一种基于社会网络结构分析高效社团数据挖掘方法
CN112989272A (zh) * 2020-12-31 2021-06-18 中科院计算技术研究所大数据研究院 一种基于局部路径的社团发现算法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070118539A1 (en) * 2005-11-18 2007-05-24 International Business Machines Corporation Focused community discovery
CN102646168A (zh) * 2012-04-16 2012-08-22 南京大学 适用中药方剂网络的基于共近邻相似三角形凝聚的层次重叠社区发现方法
CN105184075A (zh) * 2015-09-01 2015-12-23 南京大学 适用tcmf网络的基于多三角形群组相似性凝聚的重叠社区发现方法
CN105302823A (zh) * 2014-06-27 2016-02-03 首都师范大学 重叠社区并行发现的方法及***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070118539A1 (en) * 2005-11-18 2007-05-24 International Business Machines Corporation Focused community discovery
CN102646168A (zh) * 2012-04-16 2012-08-22 南京大学 适用中药方剂网络的基于共近邻相似三角形凝聚的层次重叠社区发现方法
CN105302823A (zh) * 2014-06-27 2016-02-03 首都师范大学 重叠社区并行发现的方法及***
CN105184075A (zh) * 2015-09-01 2015-12-23 南京大学 适用tcmf网络的基于多三角形群组相似性凝聚的重叠社区发现方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
潘磊等: "社会网络中基于局部信息的边社区挖掘", 《电子学报》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110086670A (zh) * 2019-04-29 2019-08-02 安徽大学 基于局部邻居信息的大规模复杂网络社团发现方法及应用
CN110287237A (zh) * 2019-06-25 2019-09-27 上海诚数信息科技有限公司 一种基于社会网络结构分析高效社团数据挖掘方法
CN110287237B (zh) * 2019-06-25 2021-07-09 上海诚数信息科技有限公司 一种基于社会网络结构分析社团数据挖掘方法
CN112989272A (zh) * 2020-12-31 2021-06-18 中科院计算技术研究所大数据研究院 一种基于局部路径的社团发现算法
CN112989272B (zh) * 2020-12-31 2024-02-27 中科院计算技术研究所大数据研究院 一种基于局部路径的社团发现算法

Similar Documents

Publication Publication Date Title
CN107222334A (zh) 适用于社交网络的基于核心三角的局部社团发现方法
CN103942308A (zh) 大规模社交网络社区的检测方法及装置
CN105740245A (zh) 频繁项集挖掘方法
CN103530402A (zh) 一种基于改进的PageRank的微博关键用户识别方法
CN107121146A (zh) 基于路链深度的最优路径规划方法
CN106598965A (zh) 一种基于地址信息的账户映射方法及装置
CN110275929B (zh) 一种基于网格分割的候选路段筛选方法及网格分割方法
CN106780058A (zh) 动态网络的社团划分方法及装置
CN112446634B (zh) 一种社交网络中影响力最大化节点的探测方法及***
RU2019140930A (ru) Способ обработки данных для получения в реальном времени кастомизированной информации о движении транспорта
CN113626723A (zh) 一种基于表示学习的属性图社区搜索方法和***
CN110691000B (zh) 基于FAHP与规划图融合的Web服务组合方法
CN111385853B (zh) 无线传感器网络中基于改进蚁群算法的定向扩散路由方法
CN106022936B (zh) 适用论文合作网络的基于社团结构的影响最大化算法
CN102722530B (zh) 一种复杂网络中的社团探测方法
CN110881178B (zh) 一种基于分支游走的物联网数据聚合方法
CN101859315A (zh) 基于度启发式的社交网络影响力最大化求解方法
KR20200117690A (ko) 멀티 홉 이웃을 이용한 컨볼루션 학습 기반의 지식 그래프 완성 방법 및 장치
CN106127595A (zh) 一种基于正负边信息的社团结构检测方法
CN112507047B (zh) 一种基于兴趣点偏好的最优有序路径查询方法
CN102833326A (zh) 一种基于灰色预测的云存储负载均衡方法
CN108319727A (zh) 一种基于社团结构寻找社交网络中任意两点最短路径的方法
CN103428087B (zh) 采用循环深度优先遍历的最长路预置保护p圈生成方法
Tang et al. Supporting continuous skyline queries in dynamically weighted road networks
CN101840434A (zh) 一种在空间网络数据库中查找最近k个点对的广度优先方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170929

RJ01 Rejection of invention patent application after publication