CN109255433B - 一种基于相似性的社区检测的方法 - Google Patents

一种基于相似性的社区检测的方法 Download PDF

Info

Publication number
CN109255433B
CN109255433B CN201810987366.0A CN201810987366A CN109255433B CN 109255433 B CN109255433 B CN 109255433B CN 201810987366 A CN201810987366 A CN 201810987366A CN 109255433 B CN109255433 B CN 109255433B
Authority
CN
China
Prior art keywords
node
network
nodes
similarity
pagerank
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810987366.0A
Other languages
English (en)
Other versions
CN109255433A (zh
Inventor
杨旭华
沈敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201810987366.0A priority Critical patent/CN109255433B/zh
Publication of CN109255433A publication Critical patent/CN109255433A/zh
Application granted granted Critical
Publication of CN109255433B publication Critical patent/CN109255433B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于相似性的社区检测的方法,建立网络模型,计算并记录任意两个节点的共同邻居集合和联合邻居集合,计算网络中任意一个节点的局部度数比和PageRank值,计算并记录网络中所有节点及其连边的度数比聚类值,找到所有节点对应的度数比相似性最高的节点,计算并记录网络中所有节点及其连边的PageRank中心性聚类值,找到所有节点对应的PageRank相似性最高的节点,将所有节点与其度数比相似性最高的节点划入同一社团,得到初始社区划分,将每个节点与其PageRank相似性最高的节点所在的社区合并,得到最终的社区结构。本发明有效利用了节点的相关性信息,准确性较高,时间复杂度较低。

Description

一种基于相似性的社区检测的方法
技术领域
本发明涉及复杂网络与社团划分领域,特别是指一种基于相似性的社区检测的方法。
背景技术
随着复杂网络的小世界、无标度特性的发现,结合非线性科学和近现代物理学的概念与理论,网络科学的研究在网络结构、功能和性质等方面得到了快速发展。但是,网络科学中单一的指标如度、介数等以及抽象的建模如拓扑、加权、博弈模型等,都不能很好地描述实际网络的节点特性。而且,现实世界中的网络节点数量多且复杂,节点自身和节点之间的关系很多会不断变化,实际网络中节点是演化的、动态的,具有鲜明的主体性,不同的主体行为力体现了节点在网络功能和行为中的所起到的不同作用。也就是说,节点与节点通过连边相互产生影响,这种局域影响性在网络功能和行为中的研究必不可少。现有的社团划分算法十分丰富,如基于模块度优化的Newman快速算法和CNM算法,基于谱分析的算法,基于标签传播的算法,基于种子扩散的算法,基于边的社团划分算法等等。社团划分算法一般是根据拓扑结构来划分,拓扑结构是对复杂网络中的节点和连边的最基础的抽象。这种社团划分的方法没有合理的思考节点本身在社团形成过程中不可或缺的局域影响力。为网络加入节点重要性,利用重要性的概念来定量刻画节点间相互影响在形成社团结构时的作用,将可提高社团划分的质量和可信度,使得社团的物理意义更加明确,在网络演化过程中的社团变化特征更加准确。
基于局部相似度的社区检测算法在大规模网络中具有良好的性能。局部相似性指标包括CN指数,Jaccard指数,HPI指数等。但是这些方法仍然存在一些挑战,例如网络边缘的节点很容易被忽略。因此对于基于相似性的社区检测算法的研究显得非常必要。
发明内容
为了克服现有社区检测算法的获取网络全局信息困难、预测精度较低、时间复杂度较高的不足,本发明提出一种准确性较高,时间复杂度较低的基于相似性的社区检测的方法。
本发明解决其技术问题所采用的技术方案是:
一种基于相似性的社区检测的方法,包括如下步骤:
步骤一:构建一个具有N个节点的无向网络模型G(V,E),V为节点,E为连边;
步骤二:任意选取两个节点i和j,计算两个节点的共同邻居集合Int(i,j)=(Γi∩Γj)和联合邻居集合Uni(i,j)=(Γi∪Γj),遍历网络中所有节点对,计算并记录相应节点对的共同邻居集合和联合邻居集合;
步骤三:在网络中任取一个节点i,计算该节点的局部度数比
Figure GDA0003179510310000021
其中D(i)表示节点i的度数,一个节点的度数为该节点的相连邻居节点的数量,Γ(i)表示与节点i相连的所有邻居节点并包括节点i,遍历网络,计算并记录网络中所有节点的局部度数比;
步骤四:计算网络中包含每个节点的PageRank值的向量
x=D(D-αA)-1
其中,x就是所计算的包含网络每个节点的PageRank值的向量(PR1,PR2,PR3,…,PRN),上述向量计算公式多次迭代以后x会收敛到一个非常接近真实的中心性值的值,D是网络对应的对角矩阵,其元素是Dii=max(ki,1),ki是节点i的度;α是一个正的可调参数,A是网络的邻接矩阵,表示网络节点之间连边关系,Aij=1,表示节点i和j之间有连边,反之则表示没有连边;
步骤五:在网络中任意选取节点i,计算连边(i,j)的度数比聚类值
Figure GDA0003179510310000031
该值表示节点i和j的度数比相似性,遍历网络,计算并记录网络中所有节点及其连边的度数比聚类值;
步骤六:在网络中任意选取节点i,找出与其度数比相似性最高的节点w,w为当连边(i,j)的度数比聚类值取最大值max{sim_P(i,j)},j∈Γ(i)时的j,遍历网络,找出所有节点对应的度数比相似性最高的节点;
步骤七:在网络中任意选取节点i,计算连边(i,j)的PageRank中心性聚类值
Figure GDA0003179510310000032
该值表示节点i和j的PageRank相似性,遍历网络,计算并记录网络中所有节点及其连边的PageRank中心性聚类值;
步骤八:在网络中任意选取节点i,找出与其PageRank相似性最高的节点m,m为当连边(i,j)的PageRank中心性聚类值取最大值max{sim_PR(i,j)},j∈Γ(i)时的j,遍历网络,找出所有节点对应的PageRank相似性最高的节点;
步骤九:在网络中任意选取一个节点i,将与其度数比相似性最高的节点j划入到同一个社区,遍历网络,将所有节点与其度数比相似性最高的节点划入同一社区,得到初始社区划分;
步骤十:在网络中任意选取一个节点i,找到与其PageRank相似性最高的点j,如果节点i和j不在同一个社区,合并这个节点所在的初始社区;遍历网络,将每个节点与其PageRank相似性最高的节点所在的社区合并,得到最终的社区结构。
本发明的技术构思为:根据有连边的节点之间的度数比相似性划分初始社区,再根据有连边节点之间的PageRank相似性合并初始社区,进而得到网络的最终社区结构。
本发明的有益效果为:将节点之间的相似性运用于社区结构的划分,准确性较高,时间复杂度较低。
附图说明
图1为网络的示意图,具有8个节点和10条边。
具体实施方式
下面结合附图对本发明做进一步说明。
参照图1,一种基于相似性的社区检测的方法,包括如下步骤:
步骤一:构建一个具有N个节点的无向网络模型G(V,E),V为节点,E为连边;
步骤二:任意选取两个节点i和j,计算两个节点的共同邻居集合Int(i,j)=(Γi∩Γj),即图1中节点2和节点5的共同邻居是节点4和联合邻居集合Uni(i,j)=(Γi∪Γj),即图1中节点2和节点5的联合邻居是节点{1,2,4,5,6,7,8},遍历网络中所有节点对,计算并记录相应节点对的共同邻居集合和联合邻居集合;
步骤三:在网络中任取一个节点i,计算该节点的局部度数比
Figure GDA0003179510310000041
其中D(i)表示节点i的度数,一个节点的度数为该节点的相连邻居节点的数量,即图1中节点2的度数是2,Γ(i)表示与节点i相连的所有邻居节点并包括节点i,遍历网络,计算并记录网络中所有节点的局部度数比;
步骤四:计算网络中包含每个节点的PageRank值的向量
x=D(D-αA)-1
其中,x就是所计算的包含网络每个节点的PageRank值的向量(PR1,PR2,PR3,…,PRN),上述向量计算公式多次迭代以后x会收敛到一个非常接近真实的中心性值的值,D是网络对应的对角矩阵,其元素是Dii=max(ki,1),ki是节点i的度;α是一个正的可调参数,A是网络的邻接矩阵,表示网络节点之间连边关系,Aij=1,表示节点i和j之间有连边,反之则表示没有连边;
步骤五:在网络中任意选取节点i,计算连边(i,j)的度数比聚类值
Figure GDA0003179510310000051
该值表示节点i和j的度数比相似性,遍历网络,计算并记录网络中所有节点及其连边的度数比聚类值;
步骤六:在网络中任意选取节点i,找出与其度数比相似性最高的节点w,w为当连边(i,j)的度数比聚类值取最大值max{sim_P(i,j)},j∈Γ(i)时的j,遍历网络,找出所有节点对应的度数比相似性最高的节点;
步骤七:在网络中任意选取节点i,计算连边(i,j)的PageRank中心性聚类值
Figure GDA0003179510310000052
该值表示节点i和j的PageRank相似性,遍历网络,计算并记录网络中所有节点及其连边的PageRank中心性聚类值;
步骤八:在网络中任意选取节点i,找出与其PageRank相似性最高的节点m,m为当连边(i,j)的PageRank中心性聚类值取最大值max{sim_PR(i,j)},j∈Γ(i)时的j,遍历网络,找出所有节点对应的PageRank相似性最高的节点;
步骤九:在网络中任意选取一个节点i,将与其度数比相似性最高的节点j划入到同一个社区,遍历网络,将所有节点与其度数比相似性最高的节点划入同一社区,得到初始社区划分;
步骤十:在网络中任意选取一个节点i,找到与其PageRank相似性最高的点j,如果节点i和j不在同一个社区,合并这个节点所在的初始社区;遍历网络,将每个节点与其PageRank相似性最高的节点所在的社区合并,得到最终的社区结构。
如上所述,本专利实施的具体实现步骤使本发明更加清晰。在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。

Claims (1)

1.一种基于相似性的社区检测的方法,其特征在于:所述方法包括如下步骤:
步骤一:构建一个具有N个节点的无向网络模型G(V,E),V为节点,E为连边;
步骤二:任意选取两个节点i和j,计算两个节点的共同邻居集合Int(i,j)=(Γi∩Γj)和联合邻居集合Uni(i,j)=(Γi∪Γj),遍历网络中所有节点对,计算并记录相应节点对的共同邻居集合和联合邻居集合;
步骤三:在网络中任取一个节点i,计算该节点的局部度数比
Figure FDA0003179510300000011
其中D(i)表示节点i的度数,一个节点的度数为该节点的相连邻居节点的数量,Γ(i)表示与节点i相连的所有邻居节点并包括节点i,遍历网络,计算并记录网络中所有节点的局部度数比;
步骤四:计算网络中包含每个节点的PageRank值的向量
x=D(D-αA)-1
其中,x就是所计算的包含网络每个节点的PageRank值的向量(PR1,PR2,PR3,…,PRN),上述向量计算公式多次迭代以后x会收敛到一个非常接近真实的中心性值的值,D是网络对应的对角矩阵,其元素是Dii=max(ki,1),ki是节点i的度;α是一个正的可调参数,A是网络的邻接矩阵,表示网络节点之间连边关系,Aij=1,表示节点i和j之间有连边,反之则表示没有连边;
步骤五:在网络中任意选取节点i,计算连边(i,j)的度数比聚类值
Figure FDA0003179510300000012
该值表示节点i和j的度数比相似性,遍历网络,计算并记录网络中所有节点及其连边的度数比聚类值;
步骤六:在网络中任意选取节点i,找出与其度数比相似性最高的节点w,w为当连边(i,j)的度数比聚类值取最大值max{sim_P(i,j)},j∈Γ(i)时的j,遍历网络,找出所有节点对应的度数比相似性最高的节点;
步骤七:在网络中任意选取节点i,计算连边(i,j)的PageRank中心性聚类值
Figure FDA0003179510300000013
该值表示节点i和j的PageRank相似性,遍历网络,计算并记录网络中所有节点及其连边的PageRank中心性聚类值;
步骤八:在网络中任意选取节点i,找出与其PageRank相似性最高的节点m,m为当连边(i,j)的PageRank中心性聚类值取最大值max{sim_PR(i,j)},j∈Γ(i)时的j,遍历网络,找出所有节点对应的PageRank相似性最高的节点;
步骤九:在网络中任意选取一个节点i,将与其度数比相似性最高的节点j划入到同一个社区,遍历网络,将所有节点与其度数比相似性最高的节点划入同一社区,得到初始社区划分;
步骤十:在网络中任意选取一个节点i,找到与其PageRank相似性最高的点j,如果节点i和j不在同一个社区,合并这个节点所在的初始社区;遍历网络,将每个节点与其PageRank相似性最高的节点所在的社区合并,得到最终的社区结构。
CN201810987366.0A 2018-08-28 2018-08-28 一种基于相似性的社区检测的方法 Active CN109255433B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810987366.0A CN109255433B (zh) 2018-08-28 2018-08-28 一种基于相似性的社区检测的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810987366.0A CN109255433B (zh) 2018-08-28 2018-08-28 一种基于相似性的社区检测的方法

Publications (2)

Publication Number Publication Date
CN109255433A CN109255433A (zh) 2019-01-22
CN109255433B true CN109255433B (zh) 2021-10-29

Family

ID=65050450

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810987366.0A Active CN109255433B (zh) 2018-08-28 2018-08-28 一种基于相似性的社区检测的方法

Country Status (1)

Country Link
CN (1) CN109255433B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112434437B (zh) * 2020-12-02 2023-08-25 大连大学 考虑节点重组的装备保障超网络动态演化模型构建方法
CN112699108A (zh) * 2020-12-25 2021-04-23 中科恒运股份有限公司 婚姻登记***数据重构方法、装置及终端设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106301888A (zh) * 2016-07-27 2017-01-04 西安电子科技大学 基于核节点和社区融合策略的网络社区划分方法
CN106934722A (zh) * 2017-02-24 2017-07-07 西安电子科技大学 基于k节点更新与相似度矩阵的多目标社区检测方法
CN108073944A (zh) * 2017-10-18 2018-05-25 南京邮电大学 一种基于局部影响力的标签传播社区发现方法
CN108229546A (zh) * 2017-12-25 2018-06-29 浙江工业大学 一种基于特征向量中心性峰值聚类的重叠社团检测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106301888A (zh) * 2016-07-27 2017-01-04 西安电子科技大学 基于核节点和社区融合策略的网络社区划分方法
CN106934722A (zh) * 2017-02-24 2017-07-07 西安电子科技大学 基于k节点更新与相似度矩阵的多目标社区检测方法
CN108073944A (zh) * 2017-10-18 2018-05-25 南京邮电大学 一种基于局部影响力的标签传播社区发现方法
CN108229546A (zh) * 2017-12-25 2018-06-29 浙江工业大学 一种基于特征向量中心性峰值聚类的重叠社团检测方法

Also Published As

Publication number Publication date
CN109255433A (zh) 2019-01-22

Similar Documents

Publication Publication Date Title
Chakraborty et al. On the categorization of scientific citation profiles in computer science
CN106326637A (zh) 一种基于局部有效路径度的链路预测方法
CN103020163A (zh) 一种网络中基于节点相似度的网络社区划分方法
Zhang et al. A combinatorial model and algorithm for globally searching community structure in complex networks
CN109255433B (zh) 一种基于相似性的社区检测的方法
CN112949748A (zh) 基于图神经网络的动态网络异常检测算法模型
CN115456093A (zh) 一种基于注意力图神经网络的高性能图聚类方法
CN112182306A (zh) 一种基于不确定图的社区发现方法
Jabbour et al. Triangle-driven community detection in large graphs using propositional satisfiability
Pan et al. Overlapping community detection via leader-based local expansion in social networks
Wang et al. A novel measure for influence nodes across complex networks based on node attraction
Wang et al. [Retracted] Overlapping Community Detection Based on Node Importance and Adjacency Information
Chen et al. Overlapping community detection of complex network: A survey
CN111711530A (zh) 基于社区拓扑结构信息的链接预测算法
Purnawansyah et al. K-Means clustering implementation in network traffic activities
Zhou et al. Link prediction algorithm based on local centrality of common neighbor nodes using multi-attribute ranking
Yuan et al. A Multi‐Granularity Backbone Network Extraction Method Based on the Topology Potential
Berton et al. The Impact of Network Sampling on Relational Classification.
CN105337759A (zh) 一种基于社区结构的内外比度量方法及社区发现方法
Chen et al. Detecting overlapping community in complex network based on node similarity
El-Daghar et al. EGBTER: capturing degree distribution, clustering coefficients, and community structure in a single random graph model
Wang et al. Hierarchical community detection in social networks based on micro-community and minimum spanning tree
CN112579831B (zh) 基于SimRank全局矩阵平滑收敛的网络社区发现方法、装置及存储介质
Zhang et al. Key Nodes Mining in Complex Networks Based on Improved Pagerank Algorithm
CN112714080B (zh) 一种基于spark图算法的互连关系分类方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant