CN108809697A - 基于影响力最大化的社交网络关键节点识别方法及*** - Google Patents
基于影响力最大化的社交网络关键节点识别方法及*** Download PDFInfo
- Publication number
- CN108809697A CN108809697A CN201810482392.8A CN201810482392A CN108809697A CN 108809697 A CN108809697 A CN 108809697A CN 201810482392 A CN201810482392 A CN 201810482392A CN 108809697 A CN108809697 A CN 108809697A
- Authority
- CN
- China
- Prior art keywords
- node
- influence
- social networks
- value
- power
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 78
- 230000000977 initiatory effect Effects 0.000 claims description 28
- 238000004364 calculation method Methods 0.000 claims description 14
- 238000012163 sequencing technique Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 11
- 235000005156 Brassica carinata Nutrition 0.000 description 11
- 244000257790 Brassica carinata Species 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000003892 spreading Methods 0.000 description 3
- 230000007480 spreading Effects 0.000 description 3
- 238000000342 Monte Carlo simulation Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 102100034799 CCAAT/enhancer-binding protein delta Human genes 0.000 description 1
- 101000945965 Homo sapiens CCAAT/enhancer-binding protein delta Proteins 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/12—Discovery or management of network topologies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/142—Network analysis or design using statistical or mathematical methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/52—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Theoretical Computer Science (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Algebra (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Pure & Applied Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于影响力最大化的社交网络关键节点识别方法及***,所述方法包括如下步骤:对于给定的社交网络,根据节点度值计算所有节点影响力的初始值;对节点影响力进行排序,迭代更新节点影响力值,直到节点影响力值趋于全局稳定;根据全局稳定的节点影响力值,依据影响力最大原则,进行关键节点识别。本发明充分利用社交网络中节点影响力排名信息,并考虑节点邻居间影响力的差异性,采用全局策略进行关键节点选择,确保社交网络关键节点识别的准确性。
Description
技术领域
本发明涉及网络分析技术领域,尤其是一种基于影响力最大化的社交网络关键节点识别方法及***。
背景技术
利用社交网络中影响力最大的关键节点可以让信息的扩散范围尽可能地大,在市场营销和广告投放等方面有重大的意义和广泛的应用。基于影响力最大化的社交网络关键节点识别方法大致可以分为两类:基于网络拓扑的方法和基于传播的方法。
基于网络拓扑的方法一般计算简单,复杂度低,但是这类方法无法准确评估节点的影响力,对于不同网络的适应性也不够强。基于传播的方法虽然能够准确地评估节点的影响力,对于不同网络的适应性也很强,但是由于这类方法需要进行大量的蒙特卡洛模拟,导致复杂度很高,难以适用于大规模社交网络。
综上所述,现有基于影响力最大化的社交网络关键节点识别方法存在以下不足:(1)在节点影响力评估过程中,默认邻居节点最多的节点影响力最强,而没有进一步考虑这些邻居节点自身影响力的强弱,缺乏合理性;(2)在关键节点选取过程中,大多都是选取度值或修正后度值最大的节点,度值反映的信息过于局部化,无法反映全局信息,使得关键节点的选取不够准确。
发明内容
鉴于上述的分析,本发明旨在提供一种基于影响力最大化的社交网络关键节点识别方法及***,用于解决现有基于影响力最大化的社交网络关键节点识别方法忽略邻居节点间影响力的差异,以及关键节点选取策略过于局部化的问题。
本发明的目的主要是通过以下技术方案实现的:
一种基于影响力最大化的社交网络关键节点识别方法,包括以下步骤:
对于给定的社交网络,根据节点度值计算所有节点影响力的初始值;
对节点影响力进行排序,迭代更新节点影响力值,直到节点影响力值趋于全局稳定;当节点影响力值更新之前和更新之后,节点影响力的排序不变时,即达到所述全局稳定;
根据全局稳定的节点影响力值,依据影响力最大原则,进行关键节点识别。
进一步地,计算所述节点影响力的初始值包括:
式中,SNR0(v)为节点v的节点影响力初始值,N为社交网络的节点总数;neigh(v)为节点v的邻居节点集合;rankD(v)为节点v在节点度值降序排列中的排名。
进一步地,所述更新节点影响力值包括:
1)按照节点影响力值降序排列所有节点,得到节点v在所述节点影响力值降序排列中的排名rankS(v);
2)根据节点影响力排列结果更新节点的影响力值;
3)判断节点的影响力值是否趋于全局稳定,是,则进入下一步;否,则返回1)重新排序。
进一步地,所述更新节点的影响力值包括:
其中,SNR(v)为节点v更新后的影响力值,N为社交网络的节点总数;neigh(v)为节点v的邻居节点集合;rankS(v)为节点v在所述节点影响力值降序排列中的排名。
进一步地,所述关键节点识别方法包括:
1)选取影响力最大的节点,将其放入关键节点集合;
2)从社交网络中删除放入关键节点集合的节点以及其所有邻居节点,更新网络结构;
3)判断社交网络中是否还有剩余节点,是,则迭代更新剩余节点的影响力值,直到影响力值趋于全局稳定后,再次进行关键节点识别;否,则关键节点识别过程结束,输出识别出的社交网络关键节点。
一种基于影响力最大化的社交网络关键节点识别***,其特征在于,包括:初始影响力计算模块、影响力迭代计算模块和关键节点选取模块;
所述初始影响力计算模块,用于根据给定的社交网络,按照节点度值降序排列所有节点,并根据节点度值降序排序结果计算所有节点影响力的初始值;
所述影响力迭代计算模块,用于对节点影响力值进行降序排列,根据排列结果计算得到新的节点影响力值再进行降序排列,迭代此过程,直至计算出的节点影响力趋于全局稳定;
所述关键节点选取模块,用于选取全局稳定的影响力最大的节点放入关键节点集合,并从社交网络中删除所述节点及其所有邻居节点,更新网络结构;之后判断更新后的网络中是否有剩余节点,是,则调用所述影响力迭代计算模块迭代更新剩余节点的影响力值直至全局稳定,再次进行关键节点识别;否,则关键节点识别过程结束,输出识别出的社交网络关键节点。
进一步地,所述初始影响力值计算模块包括:节点度值排序单元和初始影响力计算单元;
所述度值排序单元根据节点度值降序排列所有节点,并保存排序结果;
所述节点初始影响力计算单元根据所述节点度值降序排列结果计算所有节点影响力的初始值。
进一步地,所述节点初始影响力计算单元的计算函数为:
式中,SNR0(v)表示社交网络节点v的初始影响力;N为社交网络的节点总数;neigh(v)为节点v的邻居节点集合;rankD(v)为节点v在所述节点度值降序排列中的排名。
进一步地,所述影响力迭代计算模块包括:节点影响力排序单元和节点影响力计算单元;
所述影响力排序单元根据节点影响力降序排列所有节点,并保存排序结果;
所述节点影响力迭代计算单元根据所述节点影响力降序排列结果计算所有节点的影响力值,并根据节点的影响力值重新降序排列,迭代此过程,直至计算出的节点影响力趋于全局稳定。
进一步地,所述影响力计算单元的计算函数为:
其中,SNR(v)表示社交网络节点v的影响力;N为社交网络的节点总数;neigh(v)为节点v的邻居节点集合;rankS(v)为节点v在所述节点影响力值降序排列中的排名。
本发明有益效果如下:
本发明充分利用社交网络中节点影响力排名信息,并考虑节点邻居间影响力的差异性,采用全局策略进行关键节点选择,确保社交网络关键节点识别的准确性。
附图说明
附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图中,相同的参考符号表示相同的部件。
图1为本发明实施例的社交网络关键节点识别方法的流程示意图;
图2为本发明实施例的社交网络关键节点识别***的结构示意图;
图3为空手道俱乐部社会网络的结构示意图;
图4为NetScience网络的影响力指标示意图;
图5为Power网络的影响力指标示意图;
图6为CaGrQc网络的影响力指标示意图;
图7为CaHepTh网络的影响力指标示意图。
具体实施方式
下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于阐释本发明的原理。
实施例一
如图1所示,本实施例提供了一种基于影响力最大化的社交网络关键节点识别方法,包括:
S110、对于给定的社交网络,根据节点度值计算所有节点影响力的初始值;
具体包括:
1)根据给定的社交网络,按照节点的度值降序排列所有节点,得到节点v在节点度值降序排列中的排名rankD(v);
2)根据节点度值降序排列结果计算所有节点的初始影响力;
特殊的,本实施例的网络中节点初始影响力根据下式获得:
式中,SNR0(v)表示社交网络节点v的初始影响力;N为社交网络的节点总数;neigh(v)为节点v的邻居节点集合;rankD(v)为节点v在所述节点度值降序排列中的排名。
S120、对节点影响力进行排序,迭代更新节点影响力值,直到节点影响力值趋于全局稳定;
具体包括:
1)按照节点影响力值降序排列所有节点,得到点v在所述节点影响力值降序排列中的排名rankS(v);
2)根据节点影响力排序结果,更新节点影响力值;
特殊的,本实施例的网络中节点影响力值根据下式获得:
其中,SNR(v)表示社交网络节点v的影响力;N为社交网络的节点总数;neigh(v)为节点v的邻居节点集合;rankS(v)为节点v在所述节点影响力值降序排列中的排名;
3)判断节点的影响力值是否趋于全局稳定,是,则进入下一步;否,则返回1)按照节点影响力值降序排列所有节点。
当节点影响力值更新之前和更新之后,节点影响力的排序不变时,即达到所述全局稳定。
S130、根据节点的影响力,依据影响力最大原则,进行关键节点识别;
具体包括:
1)选取影响力最大的节点,将其放入关键节点集合;
2)从社交网络中删除放入关键节点集合的节点以及其所有邻居节点,更新网络结构;
3)判断社交网络中是否还有剩余节点,是,则返回S102,重新对剩余的节点进行关键节点识别;否,则关键节点识别过程结束,输出识别出的社交网络关键节点。
最终得到的关键节点集合中的节点即为社交网络的关键节点。
综上所述,本实施例公开的基于影响力最大化的社交网络关键节点识别方法,充分利用社交网络中节点影响力排名信息,并考虑节点邻居间影响力的差异性,采用全局策略进行关键节点选择,确保社交网络关键节点识别的准确性。
实施例二
本实施例提供了一种基于影响力最大化的社交网络关键节点识别***,如图2所示,包括:初始影响力计算模块210,影响力迭代计算模块220,关键节点选取模块230。
***中,初始影响力计算模块210根据给定的社交网络,按照节点度值降序排列所有节点,并根据节点度值降序排序结果计算所有节点的初始影响力值。
具体的,所述初始影响力值计算模块210包括:节点度值排序单元211和初始影响力计算单元212;
其中,度值排序单元211根据节点度值降序排列所有节点,并保存排序结果;
节点初始影响力计算单元212与所述节点度值排序单元211相连,根据所述节点度值降序排列结果计算所有节点影响力的初始值。
特殊的,节点初始影响力计算单元212的计算函数为:
式中,SNR0(v)表示社交网络节点v的初始影响力;N为社交网络的节点总数;neigh(v)为节点v的邻居节点集合;rankD(v)为节点v在所述节点度值降序排列中的排名。
***中,影响力迭代计算模块220与所述初始影响力计算模块210相连,对节点影响力值进行降序排列,根据排列结果计算得到新的节点影响力值再进行降序排列,迭代此过程,直至计算出的节点影响力趋于全局稳定;
具体的,所述影响力迭代计算模块220包括:节点影响力排序单元221和节点影响力计算单元222;
其中,影响力排序单元221与所述初始影响力计算单元212相连,根据所述节点影响力降序排列所有节点,并保存排序结果;
节点影响力迭代计算单元222与所述节点影响力排序单元221相连,根据所述节点影响力降序排列结果计算所有节点的影响力值。
特殊的,影响力计算单元222的计算函数为:
其中,SNR(v)表示社交网络节点v的影响力;N为社交网络的节点总数;neigh(v)为节点v的邻居节点集合;rankS(v)为节点v在所述节点影响力值降序排列中的排名。
***中,关键节点选取模块230与所述影响力迭代计算模块220相连,选取影响力最大的节点放入关键节点集合,并从社交网络中删除所述节点及其所有邻居节点,更新网络结构;
判断更新后的网络中是否有剩余节点,是,则调用所述影响力迭代计算模块220,否,则关键节点识别过程结束,并输出识别出的社交网络关键节点。
综上所述,本实施例公开的基于影响力最大化的社交网络关键节点识别***,充分利用社交网络中节点影响力排名信息,并考虑节点邻居间影响力的差异性,采用全局策略进行关键节点选择,确保社交网络关键节点识别的准确性。
实施例三
本实施例以空手道俱乐部网络为例,将基于影响力最大化的社交网络关键节点识别方法用于识别空手道俱乐部网络的关键节点,空手道俱乐部网络的拓扑结构如图3所示。空手道俱乐部网络是一个空手道俱乐部网络,共有34名成员,该俱乐部由于***和教练产分矛盾分歧而***成2个小团体,***和教练(分别对应图3中的34号节点和1号节点)有着较强的影响力。本实施例包括以下具体步骤:
1)根据给定的空手道俱乐部网络,按照节点度值降序排列所述网络的34个节点,并保存34个节点的排名。对于空手道俱乐部网络,按照本发明实施例一所述的方法得到的34个节点的排名如表1所示。
表1:节点度值降序排列的结果
节点 | 排名 | 节点 | 排名 | 节点 | 排名 | 节点 | 排名 |
1 | 2 | 10 | 23 | 19 | 29 | 28 | 14 |
2 | 5 | 11 | 18 | 20 | 19 | 29 | 22 |
3 | 4 | 12 | 34 | 21 | 30 | 30 | 15 |
4 | 6 | 13 | 24 | 22 | 31 | 31 | 16 |
5 | 17 | 14 | 9 | 23 | 32 | 32 | 7 |
6 | 11 | 15 | 25 | 24 | 10 | 33 | 3 |
7 | 12 | 16 | 26 | 25 | 20 | 34 | 1 |
8 | 13 | 17 | 27 | 26 | 21 | ||
9 | 8 | 18 | 28 | 27 | 33 |
2)根据节点度值的排名信息,按照本发明实施例一所述的方法计算出34个节点的初始影响力,如表2所示。
表2:34个节点的初始影响力
3)根据计算出的节点影响力,按照本发明实施例一所述的方法降序排列34个节点,如表3所示。
表3:节点影响力降序排列的结果
节点 | 排名 | 节点 | 排名 | 节点 | 排名 | 节点 | 排名 |
1 | 1 | 10 | 23 | 19 | 27 | 28 | 13 |
2 | 5 | 11 | 19 | 20 | 14 | 29 | 17 |
3 | 3 | 12 | 34 | 21 | 28 | 30 | 15 |
4 | 7 | 13 | 26 | 22 | 31 | 31 | 12 |
5 | 20 | 14 | 6 | 23 | 30 | 32 | 9 |
6 | 18 | 15 | 24 | 24 | 10 | 33 | 4 |
7 | 16 | 16 | 25 | 25 | 22 | 34 | 2 |
8 | 11 | 17 | 33 | 26 | 21 | ||
9 | 8 | 18 | 29 | 27 | 32 |
4)根据节点影响力降序排列结果计算所述34个节点的影响力值。按照本发明实施例一所述的方法计算出的节点的影响力如表4所示。
表4:34个节点影响力
5)迭代执行步骤3)和步骤4),直至计算出的节点影响力趋于全局稳定,稳定时的节点影响力降序排列最终结果如表5所示。
表5:节点影响力降序排序最终结果
节点 | 排名 | 节点 | 排名 | 节点 | 排名 | 节点 | 排名 |
1 | 1 | 10 | 21 | 19 | 25 | 28 | 13 |
2 | 5 | 11 | 19 | 20 | 14 | 29 | 16 |
3 | 3 | 12 | 34 | 21 | 28 | 30 | 15 |
4 | 6 | 13 | 27 | 22 | 31 | 31 | 12 |
5 | 20 | 14 | 7 | 23 | 30 | 32 | 9 |
6 | 18 | 15 | 22 | 24 | 11 | 33 | 4 |
7 | 17 | 16 | 24 | 25 | 26 | 34 | 2 |
8 | 10 | 17 | 33 | 26 | 23 | ||
9 | 8 | 18 | 29 | 27 | 32 |
6)选取影响力值最大的节点(即1号节点)加入关键节点集合,并按照本发明实施例一所述的方法更新网络结构,从网络中删除的节点如表6所示。
表6:更新网络结构时删除的节点
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
11 | 12 | 13 | 14 | 17 | 18 | 20 | 22 |
7)重复步骤3)至步骤6),直至空手道网络中所有节点均被删除。最终,所述关键节点集合中的节点如表7所示。
表7:空手道俱乐部网络关键节点
1 | 34 | 25 |
本发明对空手道俱乐部网络识别出的关键节点为1号、34号、25号节点。可以发现,尽管按照度值排序的前三个节点分别为34号、1号、33号节点,但是由于1号节点邻居的综合影响力更强,因此1号节点的最终排名要优于34号节点;此外,由于34号节点和33号节点的邻居之间存在大量的重叠,因此在34号节点被选为关键节点之后,再选33号节点所能额外影响到的节点十分有限,本发明很好地避免了这一问题并选择了25号节点。此时,由1号、34号和25号节点所组成的关键节点集合影响的范围更广,由此证明了本发明实施例中的社交网络关键节点识别方法的有效性。
实施例三
本实施例以四个真实网络为例,将本发明提供的所述基于影响力最大化的社交网络关键节点识别方法用于所述四个真实网络的关键节点识别,并与其他典型基于影响力最大化的社交网络关键节点识别方法进行比较。选取的典型方法包括:节点度方法(Degree)、PageRank方法(简称PR)、DegreeDiscount方法(简称DD)、ProbDegree方法(Probability-Based Multi-hop Degree Method,简称ProbD)、LIR方法(Local Index Rank,简称LIR)以及经典贪心算法Greedy(算法实现时采用了CELF优化以提高算法效率)。本发明实施例公开的方法简称为SNR(Sum of Neighbour Rank)。为了更好地评价各种重要性评估方法的性能,此处引入影响力指标Influence spread。影响力指标定义如下:
Influence spread(k)=MCG(k,p)
其中,G为网络拓扑结构,k表示选取的关键节点个数,p表示网络中的传播概率,MCG(k,p)为选取k个关键节点在网络结构G中以传播概率p进行1万次蒙特卡洛模拟后得到的平均影响范围。影响力指标越大,表明选取出的关键节点的传播能力越强,方法越有效。
本实施例选取的四个真实网络分别为:
1)描述网络理论与实验领域科学家合作情况的NetScience网络;
2)反映美国西部电网分布的Power Grid网络;
3)反映广义相对论与量子宇宙学领域学者合作情况的Ca-GrQc网络;
4)反映高能物理理论领域学者合作情况的Ca-HepTh网络。
所述4个真实网络的详细参数见表8。
表8:真实网络的具体参数
网络名 | N | E | <k> | kmax | C | p |
NetScience | 1589 | 2742 | 3.4512 | 34 | 0.6378 | 0.323 |
Power | 4941 | 6594 | 2.6691 | 19 | 0.0801 | 0.437 |
Ca-GrQc | 5242 | 14496 | 5.5307 | 81 | 0.5296 | 0.091 |
Ca-HepTh | 9877 | 25998 | 5.2644 | 65 | 0.4714 | 0.072 |
表8中,N和E分别表示网络的节点总数和边总数;<k>表示网络节点的平均度;kmax表示网路节点的最大度;C是反映网络中节点聚集程度的聚集系数;而p则表示对应网络中的传播概率。
首先,选取NetScience网络,采用所述7种方法对NetScience网络进行关键节点识别。表9列出了不同方法识别出的前10个关键节点,每一列对应一种基于影响力最大化的社交网络关键节点识别方法。从表9中可以看出,不同方法的关键节点选取结果存在着一定的差异性。
表9:不同方法识别出的NetScience网络前10个关键节点
为了进一步说明本发明方法的性能,在所述4个真实网络中,分别计算并比较所述7种方法的影响力指标Influence Spread(表中简称IS)。表10显示了所述7种基于影响力最大化的社交网络关键节点识别方法选取的前50个关键节点的影响力指标。可以看出:针对所述的4个真实网络,本发明所述的方法(SNR)几乎都能够获得最大的IS值。此外,虽然Greedy方法也有着不错的效果,但是该方法所需要的计算时间非常庞大(通常需要几天甚至十几天),因而实用性不强。因此,较之其它6种基于影响力最大化的社交网络关键节点识别方法,本发明所述方法能够更准确地识别关键节点。
表10:不同方法选取的关键节点的影响力指标
为了进一步说明本发明方法的性能,对表10的结果进行扩展展示,即在所述4个真实网络中,计算并比较所述7种方法在关键节点的数量k从1增大50时的影响力指标Influence Spread。图4~图7分别对应NetScience网络、Power网络、CaGrQc网络和CaHepTh网络。从图4~图7可以看出,随着选择的关键节点规模变化,本发明所述方法始终可以取得非常好的效果。
综上所述,本实施例公开的基于影响力最大化的社交网络关键节点识别方法,与其他典型基于影响力最大化的社交网络关键节点识别方法相比,对于不同关键节点规模,都可以取得非常好的效果。
本领域技术人员可以理解,实现上述实施例方法的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读存储介质中。其中,所述计算机可读存储介质为磁盘、光盘、只读存储记忆体或随机存储记忆体等。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种基于影响力最大化的社交网络关键节点识别方法,其特征在于,包括以下步骤:
对于给定的社交网络,根据节点度值计算所有节点影响力的初始值;
对节点影响力进行排序,迭代更新节点影响力值,直到节点影响力值趋于全局稳定;当节点影响力值更新之前和更新之后,节点影响力的排序不变时,即达到所述全局稳定;
根据全局稳定的节点影响力值,依据影响力最大原则,进行关键节点识别。
2.根据权利要求1所述的社交网络关键节点识别方法,其特征在于,计算所述节点影响力的初始值包括:
式中,SNR0(v)为节点v的节点影响力初始值,N为社交网络的节点总数;neigh(v)为节点v的邻居节点集合;rankD(v)为节点v在节点度值降序排列中的排名。
3.根据权利要求1或2所述的社交网络关键节点识别方法,其特征在于,所述更新节点影响力值包括:
1)按照节点影响力值降序排列所有节点,得到节点v在所述节点影响力值降序排列中的排名rankS(v);
2)根据节点影响力排列结果更新节点的影响力值;
3)判断节点的影响力值是否趋于全局稳定,是,则进入下一步;否,则返回1)重新排序。
4.根据权利要求3所述的社交网络关键节点识别方法,其特征在于,所述更新节点的影响力值包括:
其中,SNR(v)为节点v更新后的影响力值,N为社交网络的节点总数;neigh(v)为节点v的邻居节点集合;rankS(v)为节点v在所述节点影响力值降序排列中的排名。
5.根据权利要求3所述的社交网络关键节点识别方法,其特征在于,所述关键节点识别方法包括:
1)选取影响力最大的节点,将其放入关键节点集合;
2)从社交网络中删除放入关键节点集合的节点以及其所有邻居节点,更新网络结构;
3)判断社交网络中是否还有剩余节点,是,则迭代更新剩余节点的影响力值,直到影响力值趋于全局稳定后,再次进行关键节点识别;否,则关键节点识别过程结束,输出识别出的社交网络关键节点。
6.一种应用权利要求1-5所述识别方法的基于影响力最大化的社交网络关键节点识别***,其特征在于,包括:初始影响力计算模块、影响力迭代计算模块和关键节点选取模块;
所述初始影响力计算模块,用于根据给定的社交网络,按照节点度值降序排列所有节点,并根据节点度值降序排序结果计算所有节点影响力的初始值;
所述影响力迭代计算模块,用于对节点影响力值进行降序排列,根据排列结果计算得到新的节点影响力值再进行降序排列,迭代此过程,直至计算出的节点影响力趋于全局稳定;
所述关键节点选取模块,用于选取全局稳定的影响力最大的节点放入关键节点集合,并从社交网络中删除所述节点及其所有邻居节点,更新网络结构;之后判断更新后的网络中是否有剩余节点,是,则调用所述影响力迭代计算模块迭代更新剩余节点的影响力值直至全局稳定,再次进行关键节点识别;否,则关键节点识别过程结束,输出识别出的社交网络关键节点。
7.根据权利要求6所述的社交网络关键节点识别***,其特征在于,所述初始影响力值计算模块包括:节点度值排序单元和初始影响力计算单元;
所述度值排序单元根据节点度值降序排列所有节点,并保存排序结果;
所述节点初始影响力计算单元根据所述节点度值降序排列结果计算所有节点影响力的初始值。
8.根据权利要求7所述的社交网络关键节点识别***,其特征在于,所述节点初始影响力计算单元的计算函数为:
式中,SNR0(v)表示社交网络节点v的初始影响力;N为社交网络的节点总数;neigh(v)为节点v的邻居节点集合;rankD(v)为节点v在所述节点度值降序排列中的排名。
9.根据权利要求7所述的社交网络关键节点识别***,其特征在于,所述影响力迭代计算模块包括:节点影响力排序单元和节点影响力计算单元;
所述影响力排序单元根据节点影响力降序排列所有节点,并保存排序结果;
所述节点影响力迭代计算单元根据所述节点影响力降序排列结果计算所有节点的影响力值,并根据节点的影响力值重新降序排列,迭代此过程,直至计算出的节点影响力趋于全局稳定。
10.根据权利要求9所述的社交网络关键节点识别***,其特征在于,所述影响力计算单元的计算函数为:
其中,SNR(v)表示社交网络节点v的影响力;N为社交网络的节点总数;neigh(v)为节点v的邻居节点集合;rankS(v)为节点v在所述节点影响力值降序排列中的排名。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810482392.8A CN108809697B (zh) | 2018-05-18 | 2018-05-18 | 基于影响力最大化的社交网络关键节点识别方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810482392.8A CN108809697B (zh) | 2018-05-18 | 2018-05-18 | 基于影响力最大化的社交网络关键节点识别方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108809697A true CN108809697A (zh) | 2018-11-13 |
CN108809697B CN108809697B (zh) | 2021-05-18 |
Family
ID=64091230
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810482392.8A Active CN108809697B (zh) | 2018-05-18 | 2018-05-18 | 基于影响力最大化的社交网络关键节点识别方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108809697B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110213164A (zh) * | 2019-05-21 | 2019-09-06 | 南瑞集团有限公司 | 一种基于拓扑信息融合的识别网络关键传播者的方法及装置 |
CN111191882A (zh) * | 2019-12-17 | 2020-05-22 | 安徽大学 | 一种识别异质信息网络中有影响力的开发者的方法及装置 |
CN111784206A (zh) * | 2020-07-29 | 2020-10-16 | 南昌航空大学 | 采用LeaderRank算法评估社交网络关键节点的方法 |
CN114553818A (zh) * | 2022-02-23 | 2022-05-27 | 中国矿业大学 | 社交网络影响力最大化节点识别方法及*** |
CN115134247A (zh) * | 2022-04-12 | 2022-09-30 | 深圳市腾讯计算机***有限公司 | 节点识别方法、装置、电子设备及计算机可读存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070005341A1 (en) * | 2005-06-30 | 2007-01-04 | Microsoft Corporation | Leveraging unlabeled data with a probabilistic graphical model |
CN103327092A (zh) * | 2012-11-02 | 2013-09-25 | 中国人民解放军国防科学技术大学 | 一种信息网络上的社区发现方法和*** |
CN104598605A (zh) * | 2015-01-30 | 2015-05-06 | 福州大学 | 一种社交网络中的用户影响力评估方法 |
CN105138667A (zh) * | 2015-09-07 | 2015-12-09 | 中南大学 | 一种考虑时延约束的社会网络初始关键节点选取方法 |
CN105653689A (zh) * | 2015-12-30 | 2016-06-08 | 杭州师范大学 | 一种用户传播影响力的确定方法和装置 |
CN106296426A (zh) * | 2016-08-01 | 2017-01-04 | 温州医科大学附属第医院 | 一种重叠社区确定方法及装置 |
CN106951524A (zh) * | 2017-03-21 | 2017-07-14 | 哈尔滨工程大学 | 基于节点影响力的重叠社区发现方法 |
CN107357886A (zh) * | 2017-07-10 | 2017-11-17 | 中国人民解放军国防科学技术大学 | 一种基于局部h‑index的信息传播关键节点识别方法 |
CN108073944A (zh) * | 2017-10-18 | 2018-05-25 | 南京邮电大学 | 一种基于局部影响力的标签传播社区发现方法 |
-
2018
- 2018-05-18 CN CN201810482392.8A patent/CN108809697B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070005341A1 (en) * | 2005-06-30 | 2007-01-04 | Microsoft Corporation | Leveraging unlabeled data with a probabilistic graphical model |
CN103327092A (zh) * | 2012-11-02 | 2013-09-25 | 中国人民解放军国防科学技术大学 | 一种信息网络上的社区发现方法和*** |
CN104598605A (zh) * | 2015-01-30 | 2015-05-06 | 福州大学 | 一种社交网络中的用户影响力评估方法 |
CN105138667A (zh) * | 2015-09-07 | 2015-12-09 | 中南大学 | 一种考虑时延约束的社会网络初始关键节点选取方法 |
CN105653689A (zh) * | 2015-12-30 | 2016-06-08 | 杭州师范大学 | 一种用户传播影响力的确定方法和装置 |
CN106296426A (zh) * | 2016-08-01 | 2017-01-04 | 温州医科大学附属第医院 | 一种重叠社区确定方法及装置 |
CN106951524A (zh) * | 2017-03-21 | 2017-07-14 | 哈尔滨工程大学 | 基于节点影响力的重叠社区发现方法 |
CN107357886A (zh) * | 2017-07-10 | 2017-11-17 | 中国人民解放军国防科学技术大学 | 一种基于局部h‑index的信息传播关键节点识别方法 |
CN108073944A (zh) * | 2017-10-18 | 2018-05-25 | 南京邮电大学 | 一种基于局部影响力的标签传播社区发现方法 |
Non-Patent Citations (1)
Title |
---|
李泽鹏等: "基于社交网络结构的节点影响力度量方法", 《电子学报》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110213164A (zh) * | 2019-05-21 | 2019-09-06 | 南瑞集团有限公司 | 一种基于拓扑信息融合的识别网络关键传播者的方法及装置 |
CN110213164B (zh) * | 2019-05-21 | 2021-06-08 | 南瑞集团有限公司 | 一种基于拓扑信息融合的识别网络关键传播者的方法及装置 |
CN111191882A (zh) * | 2019-12-17 | 2020-05-22 | 安徽大学 | 一种识别异质信息网络中有影响力的开发者的方法及装置 |
CN111191882B (zh) * | 2019-12-17 | 2022-11-25 | 安徽大学 | 一种识别异质信息网络中有影响力的开发者的方法及装置 |
CN111784206A (zh) * | 2020-07-29 | 2020-10-16 | 南昌航空大学 | 采用LeaderRank算法评估社交网络关键节点的方法 |
CN111784206B (zh) * | 2020-07-29 | 2021-03-19 | 南昌航空大学 | 采用LeaderRank算法评估社交网络关键节点的方法 |
CN114553818A (zh) * | 2022-02-23 | 2022-05-27 | 中国矿业大学 | 社交网络影响力最大化节点识别方法及*** |
CN115134247A (zh) * | 2022-04-12 | 2022-09-30 | 深圳市腾讯计算机***有限公司 | 节点识别方法、装置、电子设备及计算机可读存储介质 |
CN115134247B (zh) * | 2022-04-12 | 2023-08-11 | 深圳市腾讯计算机***有限公司 | 节点识别方法、装置、电子设备及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108809697B (zh) | 2021-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108809697A (zh) | 基于影响力最大化的社交网络关键节点识别方法及*** | |
CN108492201B (zh) | 一种基于社区结构的社交网络影响力最大化方法 | |
Comellas et al. | Recursive graphs with small-world scale-free properties | |
Orman et al. | Comparative evaluation of community detection algorithms: a topological approach | |
Yang et al. | Hypergraph partitioning for social networks based on information entropy modularity | |
CN109921939B (zh) | 一种通信网络中关键节点的选取方法及*** | |
Agarwal et al. | Parametric and kinetic minimum spanning trees | |
Bi et al. | An improved NSGA-III algorithm based on objective space decomposition for many-objective optimization | |
CN104657418B (zh) | 一种基于隶属度传播的复杂网络模糊社团挖掘方法 | |
US20090125620A1 (en) | Assigning telecommunications nodes to community of interest clusters | |
CN104995870A (zh) | 多目标服务器布局确定 | |
Cerinšek et al. | Generalized two-mode cores | |
CN109829337A (zh) | 一种社会网络隐私保护的方法、***及设备 | |
JP2005327299A (ja) | オブジェクトの類似性を異種の関係に基づいて判定するための方法およびシステム | |
Herrera et al. | Generating scale-free networks with adjustable clustering coefficient via random walks | |
CN103020163A (zh) | 一种网络中基于节点相似度的网络社区划分方法 | |
CN113190939B (zh) | 基于多边形系数的大型稀疏复杂网络拓扑分析和简化方法 | |
CN110263831A (zh) | 一种基于差分隐私的局部高阶图聚类方法 | |
Ghamgosar et al. | An extended distributed learning automata based algorithm for solving the community detection problem in social networks | |
Branting | Context-sensitive detection of local community structure | |
Alshahrani et al. | Top-k influential users selection based on combined katz centrality and propagation probability | |
CN110162692A (zh) | 用户标签确定方法、装置、计算机设备和存储介质 | |
CN103559318B (zh) | 对异质信息网络包含的对象进行排序的方法 | |
CN104715034A (zh) | 基于中心人物的有权图重叠社区发现方法 | |
CN110162716A (zh) | 一种基于社区检索的影响力社区搜索方法和*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |