CN109255433B - 一种基于相似性的社区检测的方法 - Google Patents
一种基于相似性的社区检测的方法 Download PDFInfo
- Publication number
- CN109255433B CN109255433B CN201810987366.0A CN201810987366A CN109255433B CN 109255433 B CN109255433 B CN 109255433B CN 201810987366 A CN201810987366 A CN 201810987366A CN 109255433 B CN109255433 B CN 109255433B
- Authority
- CN
- China
- Prior art keywords
- node
- network
- nodes
- similarity
- pagerank
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 11
- 238000000034 method Methods 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000006399 behavior Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种基于相似性的社区检测的方法,建立网络模型,计算并记录任意两个节点的共同邻居集合和联合邻居集合,计算网络中任意一个节点的局部度数比和PageRank值,计算并记录网络中所有节点及其连边的度数比聚类值,找到所有节点对应的度数比相似性最高的节点,计算并记录网络中所有节点及其连边的PageRank中心性聚类值,找到所有节点对应的PageRank相似性最高的节点,将所有节点与其度数比相似性最高的节点划入同一社团,得到初始社区划分,将每个节点与其PageRank相似性最高的节点所在的社区合并,得到最终的社区结构。本发明有效利用了节点的相关性信息,准确性较高,时间复杂度较低。
Description
技术领域
本发明涉及复杂网络与社团划分领域,特别是指一种基于相似性的社区检测的方法。
背景技术
随着复杂网络的小世界、无标度特性的发现,结合非线性科学和近现代物理学的概念与理论,网络科学的研究在网络结构、功能和性质等方面得到了快速发展。但是,网络科学中单一的指标如度、介数等以及抽象的建模如拓扑、加权、博弈模型等,都不能很好地描述实际网络的节点特性。而且,现实世界中的网络节点数量多且复杂,节点自身和节点之间的关系很多会不断变化,实际网络中节点是演化的、动态的,具有鲜明的主体性,不同的主体行为力体现了节点在网络功能和行为中的所起到的不同作用。也就是说,节点与节点通过连边相互产生影响,这种局域影响性在网络功能和行为中的研究必不可少。现有的社团划分算法十分丰富,如基于模块度优化的Newman快速算法和CNM算法,基于谱分析的算法,基于标签传播的算法,基于种子扩散的算法,基于边的社团划分算法等等。社团划分算法一般是根据拓扑结构来划分,拓扑结构是对复杂网络中的节点和连边的最基础的抽象。这种社团划分的方法没有合理的思考节点本身在社团形成过程中不可或缺的局域影响力。为网络加入节点重要性,利用重要性的概念来定量刻画节点间相互影响在形成社团结构时的作用,将可提高社团划分的质量和可信度,使得社团的物理意义更加明确,在网络演化过程中的社团变化特征更加准确。
基于局部相似度的社区检测算法在大规模网络中具有良好的性能。局部相似性指标包括CN指数,Jaccard指数,HPI指数等。但是这些方法仍然存在一些挑战,例如网络边缘的节点很容易被忽略。因此对于基于相似性的社区检测算法的研究显得非常必要。
发明内容
为了克服现有社区检测算法的获取网络全局信息困难、预测精度较低、时间复杂度较高的不足,本发明提出一种准确性较高,时间复杂度较低的基于相似性的社区检测的方法。
本发明解决其技术问题所采用的技术方案是:
一种基于相似性的社区检测的方法,包括如下步骤:
步骤一:构建一个具有N个节点的无向网络模型G(V,E),V为节点,E为连边;
步骤二:任意选取两个节点i和j,计算两个节点的共同邻居集合Int(i,j)=(Γi∩Γj)和联合邻居集合Uni(i,j)=(Γi∪Γj),遍历网络中所有节点对,计算并记录相应节点对的共同邻居集合和联合邻居集合;
步骤三:在网络中任取一个节点i,计算该节点的局部度数比
其中D(i)表示节点i的度数,一个节点的度数为该节点的相连邻居节点的数量,Γ(i)表示与节点i相连的所有邻居节点并包括节点i,遍历网络,计算并记录网络中所有节点的局部度数比;
步骤四:计算网络中包含每个节点的PageRank值的向量
x=D(D-αA)-1,
其中,x就是所计算的包含网络每个节点的PageRank值的向量(PR1,PR2,PR3,…,PRN),上述向量计算公式多次迭代以后x会收敛到一个非常接近真实的中心性值的值,D是网络对应的对角矩阵,其元素是Dii=max(ki,1),ki是节点i的度;α是一个正的可调参数,A是网络的邻接矩阵,表示网络节点之间连边关系,Aij=1,表示节点i和j之间有连边,反之则表示没有连边;
步骤五:在网络中任意选取节点i,计算连边(i,j)的度数比聚类值
该值表示节点i和j的度数比相似性,遍历网络,计算并记录网络中所有节点及其连边的度数比聚类值;
步骤六:在网络中任意选取节点i,找出与其度数比相似性最高的节点w,w为当连边(i,j)的度数比聚类值取最大值max{sim_P(i,j)},j∈Γ(i)时的j,遍历网络,找出所有节点对应的度数比相似性最高的节点;
步骤七:在网络中任意选取节点i,计算连边(i,j)的PageRank中心性聚类值
该值表示节点i和j的PageRank相似性,遍历网络,计算并记录网络中所有节点及其连边的PageRank中心性聚类值;
步骤八:在网络中任意选取节点i,找出与其PageRank相似性最高的节点m,m为当连边(i,j)的PageRank中心性聚类值取最大值max{sim_PR(i,j)},j∈Γ(i)时的j,遍历网络,找出所有节点对应的PageRank相似性最高的节点;
步骤九:在网络中任意选取一个节点i,将与其度数比相似性最高的节点j划入到同一个社区,遍历网络,将所有节点与其度数比相似性最高的节点划入同一社区,得到初始社区划分;
步骤十:在网络中任意选取一个节点i,找到与其PageRank相似性最高的点j,如果节点i和j不在同一个社区,合并这个节点所在的初始社区;遍历网络,将每个节点与其PageRank相似性最高的节点所在的社区合并,得到最终的社区结构。
本发明的技术构思为:根据有连边的节点之间的度数比相似性划分初始社区,再根据有连边节点之间的PageRank相似性合并初始社区,进而得到网络的最终社区结构。
本发明的有益效果为:将节点之间的相似性运用于社区结构的划分,准确性较高,时间复杂度较低。
附图说明
图1为网络的示意图,具有8个节点和10条边。
具体实施方式
下面结合附图对本发明做进一步说明。
参照图1,一种基于相似性的社区检测的方法,包括如下步骤:
步骤一:构建一个具有N个节点的无向网络模型G(V,E),V为节点,E为连边;
步骤二:任意选取两个节点i和j,计算两个节点的共同邻居集合Int(i,j)=(Γi∩Γj),即图1中节点2和节点5的共同邻居是节点4和联合邻居集合Uni(i,j)=(Γi∪Γj),即图1中节点2和节点5的联合邻居是节点{1,2,4,5,6,7,8},遍历网络中所有节点对,计算并记录相应节点对的共同邻居集合和联合邻居集合;
步骤三:在网络中任取一个节点i,计算该节点的局部度数比
其中D(i)表示节点i的度数,一个节点的度数为该节点的相连邻居节点的数量,即图1中节点2的度数是2,Γ(i)表示与节点i相连的所有邻居节点并包括节点i,遍历网络,计算并记录网络中所有节点的局部度数比;
步骤四:计算网络中包含每个节点的PageRank值的向量
x=D(D-αA)-1,
其中,x就是所计算的包含网络每个节点的PageRank值的向量(PR1,PR2,PR3,…,PRN),上述向量计算公式多次迭代以后x会收敛到一个非常接近真实的中心性值的值,D是网络对应的对角矩阵,其元素是Dii=max(ki,1),ki是节点i的度;α是一个正的可调参数,A是网络的邻接矩阵,表示网络节点之间连边关系,Aij=1,表示节点i和j之间有连边,反之则表示没有连边;
步骤五:在网络中任意选取节点i,计算连边(i,j)的度数比聚类值
该值表示节点i和j的度数比相似性,遍历网络,计算并记录网络中所有节点及其连边的度数比聚类值;
步骤六:在网络中任意选取节点i,找出与其度数比相似性最高的节点w,w为当连边(i,j)的度数比聚类值取最大值max{sim_P(i,j)},j∈Γ(i)时的j,遍历网络,找出所有节点对应的度数比相似性最高的节点;
步骤七:在网络中任意选取节点i,计算连边(i,j)的PageRank中心性聚类值
该值表示节点i和j的PageRank相似性,遍历网络,计算并记录网络中所有节点及其连边的PageRank中心性聚类值;
步骤八:在网络中任意选取节点i,找出与其PageRank相似性最高的节点m,m为当连边(i,j)的PageRank中心性聚类值取最大值max{sim_PR(i,j)},j∈Γ(i)时的j,遍历网络,找出所有节点对应的PageRank相似性最高的节点;
步骤九:在网络中任意选取一个节点i,将与其度数比相似性最高的节点j划入到同一个社区,遍历网络,将所有节点与其度数比相似性最高的节点划入同一社区,得到初始社区划分;
步骤十:在网络中任意选取一个节点i,找到与其PageRank相似性最高的点j,如果节点i和j不在同一个社区,合并这个节点所在的初始社区;遍历网络,将每个节点与其PageRank相似性最高的节点所在的社区合并,得到最终的社区结构。
如上所述,本专利实施的具体实现步骤使本发明更加清晰。在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。
Claims (1)
1.一种基于相似性的社区检测的方法,其特征在于:所述方法包括如下步骤:
步骤一:构建一个具有N个节点的无向网络模型G(V,E),V为节点,E为连边;
步骤二:任意选取两个节点i和j,计算两个节点的共同邻居集合Int(i,j)=(Γi∩Γj)和联合邻居集合Uni(i,j)=(Γi∪Γj),遍历网络中所有节点对,计算并记录相应节点对的共同邻居集合和联合邻居集合;
步骤三:在网络中任取一个节点i,计算该节点的局部度数比
其中D(i)表示节点i的度数,一个节点的度数为该节点的相连邻居节点的数量,Γ(i)表示与节点i相连的所有邻居节点并包括节点i,遍历网络,计算并记录网络中所有节点的局部度数比;
步骤四:计算网络中包含每个节点的PageRank值的向量
x=D(D-αA)-1,
其中,x就是所计算的包含网络每个节点的PageRank值的向量(PR1,PR2,PR3,…,PRN),上述向量计算公式多次迭代以后x会收敛到一个非常接近真实的中心性值的值,D是网络对应的对角矩阵,其元素是Dii=max(ki,1),ki是节点i的度;α是一个正的可调参数,A是网络的邻接矩阵,表示网络节点之间连边关系,Aij=1,表示节点i和j之间有连边,反之则表示没有连边;
步骤五:在网络中任意选取节点i,计算连边(i,j)的度数比聚类值
该值表示节点i和j的度数比相似性,遍历网络,计算并记录网络中所有节点及其连边的度数比聚类值;
步骤六:在网络中任意选取节点i,找出与其度数比相似性最高的节点w,w为当连边(i,j)的度数比聚类值取最大值max{sim_P(i,j)},j∈Γ(i)时的j,遍历网络,找出所有节点对应的度数比相似性最高的节点;
步骤七:在网络中任意选取节点i,计算连边(i,j)的PageRank中心性聚类值
该值表示节点i和j的PageRank相似性,遍历网络,计算并记录网络中所有节点及其连边的PageRank中心性聚类值;
步骤八:在网络中任意选取节点i,找出与其PageRank相似性最高的节点m,m为当连边(i,j)的PageRank中心性聚类值取最大值max{sim_PR(i,j)},j∈Γ(i)时的j,遍历网络,找出所有节点对应的PageRank相似性最高的节点;
步骤九:在网络中任意选取一个节点i,将与其度数比相似性最高的节点j划入到同一个社区,遍历网络,将所有节点与其度数比相似性最高的节点划入同一社区,得到初始社区划分;
步骤十:在网络中任意选取一个节点i,找到与其PageRank相似性最高的点j,如果节点i和j不在同一个社区,合并这个节点所在的初始社区;遍历网络,将每个节点与其PageRank相似性最高的节点所在的社区合并,得到最终的社区结构。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810987366.0A CN109255433B (zh) | 2018-08-28 | 2018-08-28 | 一种基于相似性的社区检测的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810987366.0A CN109255433B (zh) | 2018-08-28 | 2018-08-28 | 一种基于相似性的社区检测的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109255433A CN109255433A (zh) | 2019-01-22 |
CN109255433B true CN109255433B (zh) | 2021-10-29 |
Family
ID=65050450
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810987366.0A Active CN109255433B (zh) | 2018-08-28 | 2018-08-28 | 一种基于相似性的社区检测的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109255433B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112434437B (zh) * | 2020-12-02 | 2023-08-25 | 大连大学 | 考虑节点重组的装备保障超网络动态演化模型构建方法 |
CN112699108A (zh) * | 2020-12-25 | 2021-04-23 | 中科恒运股份有限公司 | 婚姻登记***数据重构方法、装置及终端设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106301888A (zh) * | 2016-07-27 | 2017-01-04 | 西安电子科技大学 | 基于核节点和社区融合策略的网络社区划分方法 |
CN106934722A (zh) * | 2017-02-24 | 2017-07-07 | 西安电子科技大学 | 基于k节点更新与相似度矩阵的多目标社区检测方法 |
CN108073944A (zh) * | 2017-10-18 | 2018-05-25 | 南京邮电大学 | 一种基于局部影响力的标签传播社区发现方法 |
CN108229546A (zh) * | 2017-12-25 | 2018-06-29 | 浙江工业大学 | 一种基于特征向量中心性峰值聚类的重叠社团检测方法 |
-
2018
- 2018-08-28 CN CN201810987366.0A patent/CN109255433B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106301888A (zh) * | 2016-07-27 | 2017-01-04 | 西安电子科技大学 | 基于核节点和社区融合策略的网络社区划分方法 |
CN106934722A (zh) * | 2017-02-24 | 2017-07-07 | 西安电子科技大学 | 基于k节点更新与相似度矩阵的多目标社区检测方法 |
CN108073944A (zh) * | 2017-10-18 | 2018-05-25 | 南京邮电大学 | 一种基于局部影响力的标签传播社区发现方法 |
CN108229546A (zh) * | 2017-12-25 | 2018-06-29 | 浙江工业大学 | 一种基于特征向量中心性峰值聚类的重叠社团检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109255433A (zh) | 2019-01-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chakraborty et al. | On the categorization of scientific citation profiles in computer science | |
CN106326637A (zh) | 一种基于局部有效路径度的链路预测方法 | |
CN103020163A (zh) | 一种网络中基于节点相似度的网络社区划分方法 | |
Zhang et al. | A combinatorial model and algorithm for globally searching community structure in complex networks | |
CN109255433B (zh) | 一种基于相似性的社区检测的方法 | |
CN112949748A (zh) | 基于图神经网络的动态网络异常检测算法模型 | |
CN115456093A (zh) | 一种基于注意力图神经网络的高性能图聚类方法 | |
CN112182306A (zh) | 一种基于不确定图的社区发现方法 | |
Jabbour et al. | Triangle-driven community detection in large graphs using propositional satisfiability | |
Pan et al. | Overlapping community detection via leader-based local expansion in social networks | |
Wang et al. | A novel measure for influence nodes across complex networks based on node attraction | |
Wang et al. | [Retracted] Overlapping Community Detection Based on Node Importance and Adjacency Information | |
Chen et al. | Overlapping community detection of complex network: A survey | |
CN111711530A (zh) | 基于社区拓扑结构信息的链接预测算法 | |
Purnawansyah et al. | K-Means clustering implementation in network traffic activities | |
Zhou et al. | Link prediction algorithm based on local centrality of common neighbor nodes using multi-attribute ranking | |
Yuan et al. | A Multi‐Granularity Backbone Network Extraction Method Based on the Topology Potential | |
Berton et al. | The Impact of Network Sampling on Relational Classification. | |
CN105337759A (zh) | 一种基于社区结构的内外比度量方法及社区发现方法 | |
Chen et al. | Detecting overlapping community in complex network based on node similarity | |
El-Daghar et al. | EGBTER: capturing degree distribution, clustering coefficients, and community structure in a single random graph model | |
Wang et al. | Hierarchical community detection in social networks based on micro-community and minimum spanning tree | |
CN112579831B (zh) | 基于SimRank全局矩阵平滑收敛的网络社区发现方法、装置及存储介质 | |
Zhang et al. | Key Nodes Mining in Complex Networks Based on Improved Pagerank Algorithm | |
CN112714080B (zh) | 一种基于spark图算法的互连关系分类方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |