CN106022936A - 适用论文合作网络的基于社团结构的影响最大化算法 - Google Patents
适用论文合作网络的基于社团结构的影响最大化算法 Download PDFInfo
- Publication number
- CN106022936A CN106022936A CN201610353585.4A CN201610353585A CN106022936A CN 106022936 A CN106022936 A CN 106022936A CN 201610353585 A CN201610353585 A CN 201610353585A CN 106022936 A CN106022936 A CN 106022936A
- Authority
- CN
- China
- Prior art keywords
- corporations
- node
- network
- influence
- limit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 45
- 238000000034 method Methods 0.000 description 13
- 102100034799 CCAAT/enhancer-binding protein delta Human genes 0.000 description 5
- 101000945965 Homo sapiens CCAAT/enhancer-binding protein delta Proteins 0.000 description 5
- 230000006854 communication Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000342 Monte Carlo simulation Methods 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种适用论文合作网络的基于社团结构的影响最大化算法(COMAX算法),包括如下步骤:1)社团发现阶段a构建论文合作网络图;b合并局部社团;c构建新的网络图;d结束;2)种子节点选取阶段a计算每个社团的影响力;b选择影响力最大社团中对应的节点;c结束。本发明的基于社团结构的影响最大化算法为论文合作网络的影响最大化问题提供了新的解决方案,结果表明,在ICM模型上,我们提出的COMAX算法在影响覆盖范围上与贪心算法接近,而且时间效率非常好。
Description
技术领域
本发明涉及一种论文合作网络的影响最大化问题求解方法,尤其涉及基于社团结构的影响最大化问题求解方法。
背景技术
近些年来,在线社交网络迅猛发展,出现了越来越多的社交网站。这些社交网络中的信息传播,无论是规模还是效率都已经超越了现实生活。影响最大化问题关注的是如何选取固定数量的种子节点,使得信息传播的覆盖范围最大化。当我们需要对某一学科或领域做调查或深入理解时,我们不会查看该领域的全部资料,我们会挑选一部分高影响力的作者的作品,如何寻找这些高影响力的作者就是种子节点选取的过程。
2003年,Kempe、Kleinberg和Tardos三人[Maximizing the Spread of Influencethrough a Social Network]形式化的定义了影响最大化问题,将影响最大化问题转为一个离散优化问题,并且证明该问题是NP-Hard难度。在线性阈值模型和独立级联模型下,他们给出了贪心算法,并且证明了贪心算法与最优算法的近似比为(1–1/e)。但是贪心算法的时间复杂度非常高,它没有考虑网络的度分度情况,没有考虑网络的社团结构,每次选取种子节点时都需要重新计算每个种子节点的影响力,时间效率比较低。
2007年,针对贪心算法时间复杂度高的问题,Leskovec等人[Cost-effectiveOutbreak Detection in Networks]运用影响最大化中的子模特性,提出了“LazyForward”的优化策略,并提出了CELF算法,CLEF算法由于运用了子模特性,在种子选取阶段,减少了计算规模,在一定程度上提高了贪心算法的效率,但还不适用于大规模的社会网络。
2009年,Chen Wei等人[Efficient Influence Maximization in Social Networks]在贪心算法的高时间复杂度的基础上,提出了NewGreedy算法和MixGreedy算法。其中NewGreedy算法是对原网络图进行预处理,将与传播过程无关的边进行删除,最终的问题就变成了求种子节点集合在新的网络图中的可达节点集。MixGreedy算法是NewGreedy算法与CELF算法的结合,选取第一个节点时使用NewGreedy算法,计算出每个节点的初始影响力,之后选取种子节点时使用CELF算法。结果表明,NewGreedy算法与MixGreedy算法的覆盖范围接近贪心算法,时间效率比贪心算法高,但也需要多次运用蒙特卡罗模拟实验,总体效率还比较低,不适用于大规模的社会网络。
很多影响最大化算法,未考虑到网络的社团结构,但社团内部的节点间的联系比社团外部联系紧密,相应的在信息传播过程中,节点激活与其处于同一社团内部的其他节点可能性也比激活社团外部节点可能性更大。我们提出了基于社团结构的影响最大化算法,将整个网络划分成一个个相对独立的社团,在每个社团内部计算节点影响力,然后将最大影响力作为社团影响力。选取了种子节点之后,只需要重新计算一个社团的影响力值,不需要全部重新计算,大大加快了选取种子节点的效率。
发明内容
本发明所要解决的技术问题是提供一种适用论文合作网络的影响最大化问题的种子节点选取方法。
技术方案:为解决上述问题,本发明的适用论文合作网络的基于社团结构的影响最大化算法包括如下步骤:
1)社团发现阶段;
a构建初始论文合作网络图;
b合并局部社团;
c构建新的网络图;
d结束;
2)种子节点选取阶段
a计算社团影响力;
b选择种子节点;
c结束。
本发明中,步骤1)-a中构建的网络图中节点代表作者,网络图中的边表示作者之间存在合作关系,共同发表过论文,边的权值表示共同发表过的论文的数量。
本发明中,步骤1)-b中合并局部社团是指,将每个节点都当做是一个局部社团,每个节点选取与自己相连且合并之后模块度值增量最大的社团合并,其中模块度值的公式为:
其中,nc表示所有社团的数量,inc表示社团c内部的边的数量,totc表示与社团c中节点相连的所有的边的数量。
节点i与社团c合并之后模块度值的增量为:
其中表示节点i与社团c相连的边的数量,合并之后变成了新社团的内部边,ki表示节点i的度数。
本发明中,步骤1)-c中构建新的网络图是指,将步骤1)-b中得到的合并之后的社团里的所有节点用一个节点表示作为新的网络图中的节点,原来社团之间的连边变成新的网络图中节点之间的连边。
本发明中,步骤2)-a中计算社团影响力是指将社团内部中,影响力最大节点的影响值作为社团的影响力,并记录对应节点。
本发明中,步骤2)-b中选择种子节点是指选取影响力最大社团中对应的节点,并且需要重新计算对应社团的影响力。
本发明的有益效果:本发明的基于社团结构的论文合作网络的影响最大化算法为解决影响最大化问题提供了一种新的启发式的解决方案,选取的种子节点的影响传播范围与贪心算法接近,而且时间效率比较高,适用于解决大规模社会网络的影响最大化问题。
附图说明
图1为本发明实施例的基于社团结构的论文合作网络的影响最大化方法的流程图。
图2为图1中社团发现阶段流程图。
图3为图1中种子阶段选取阶段的流程图。
图4为发明提出的算法(COMAX)与其他方法在Hep数据集上选取的种子节点的影响覆盖范围的对比。
具体实施方式
为了更了解本发明的技术内容,特举具体实施例并配合所附图式说明如下。
如图1所示,本方法一共有两个阶段,社团发现阶段和种子节点选取阶段。
适用论文合作网络的基于社团结构的影响最大化算法包括如下步骤:
1)社团发现阶段;
a构建初始论文合作网络图;
b合并局部社团;
c构建新的网络图;
d结束;
2)种子节点选取阶段
a计算社团影响力;
b选择种子节点;
c结束。
如图2所示为社团发现阶段的流程图,分为三大主要部分,构建原始网络图、合并局部社团以及构建新的网络图。其中合并了局部社团之后,需要将同一局部社团内的所有节点抽象成一个节点,组建新的网络,再次进行合并。当模块度值增量为正时才进行合并。
社团发现阶段的具体步骤如下:
步骤1-0为方法开始;
步骤1-1为遍历论文集,这是构建网络的第一步,需要将所有相关的论文集的作者信息记录下来。
步骤1-2为抽取合作关系,步骤1-1构建好了网络的节点,但是节点之间的边以及边的权值还未知,作者之间合作过论文,就在两者之间构建一条边,最终边的权值为两个作者合作过的论文的总的数量。
步骤1-3为构建合作网络图,利用步骤1-1构建的节点以及步骤1-2构建的边,构建一个无向加权图G(V,E,W)。V表示作者,E表示作者之间的合作关系,W表示作者之间合作论文的数量。
步骤1-4为计算节点与相连社团合并的模块度值增量,节点i与社团c合并之后的模块度值增量为:
其中表示节点i与社团c相连的边的数量,合并之后变成了新社团的内部边,ki表示节点i的度数。在这一步,对于每个节点,需要计算其与所有相连社团合并之后的模块度值增量,并记录最大增量值以及对应社团。
步骤1-5为判断在所有节点当中,是否存在某个节点与相连社团合并之后的最大模块度值增量大于0,如果不存在,则跳转到步骤1-8,社团发现阶段结束。
步骤1-6为合并阶段,对于每个节点,将其与大于0的最大模块度值增量的社团合并。
步骤1-7为构建新的网络图,将步骤1-6中合并之后的处于同一社团的所有节点抽象为一个节点,原来的社团之间的边作为新图中的节点之间的边,这样新的网络图中的节点数量与步骤1-6中合并之后的社团数量一致,每个节点代表之前的一个社团。然后再跳转到步骤1-4。
步骤1-8为返回社团网络的社团结构,社团发现阶段至此结束。
如图3所示为种子节点选取阶段的流程图,分为两大主要部分,计算社团影响力以及选取种子节点。我们首先需要计算所有社团的影响力,然后选取最大影响力社团对应的节点,之后只需要重新计算被选中的社团的影响力即可,其他社团无需重新计算。
种子节点选取阶段的具体步骤如下:
步骤2-0为方法开始;
步骤2-1为计算社团内部节点的影响力。我们使用信息传播模型是独立级联模型,对于加权网络图,节点v的影响力的期望值为:
其中inv为节点v与社团内部相连节点的边权值之和,tv为节点v的邻居中已经成为种子节点的边权值之和,p为每条边成功激活的概率。对于节点u和节点v,它们之间的边权值为t,假如u处于激活状态,则u激活v的概率为1-(1-p)t。
步骤2-2为计算社团影响力,社团的影响力为社团内部所有节点的最大影响力值,并记录对应该影响力值的节点。
步骤2-3为选取种子节点,首先定位到影响力最大的社团,然后选取社团对应的节点,将节点加入到种子节点集合当中。
步骤2-4为判断种子节点选取过程是否结束,如果选取的种子节点数量已经达到K个,则跳转到步骤2-6,算法结束。
步骤2-5为重新计算步骤2-3中影响力最大社团内部所有节点的影响值,然后计算社团的影响力,并跳转到步骤2-3。
步骤2-6返回选取到的种子节点集合,至此种子选取完成。
图4中所使用的数据集Hep是影响最大化问题经常使用的一个数据集,是高能物理方向的合作网络图。从图中可以发现,随着种子节点数量的增加,种子节点集合的影响覆盖范围都在增大,COMAX算法选取的种子节点集合的影响覆盖范围与加速之后的贪心算法CELF算法非常接近,但时间效率却比CELF算法高多个数量级。
综上所述,本发明的基于社团结构的影响最大化算法为论文合作网络发现高影响力节点提供了一种新的方法,该方法首先通过将网络划分成相对独立的社团结构,然后计算社团影响力,选取影响力最大的社团中的对应节点加入到种子节点,并重新计算社团影响力,如此循环找到K个种子节点。
虽然本发明已以较佳实施例揭露如上,然其并非用以限定本发明。本发明所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当可作各种的更动与润饰。因此,本发明的保护范围当视权利要求书所界定者为准。
Claims (6)
1.一种适用论文合作网络的基于社团结构的影响最大化算法,其特征在于,包括如下步骤:
1)社团发现阶段;
a构建初始论文合作网络图;
b合并局部社团;
c构建新的网络图;
d结束;
2)种子节点选取阶段
a计算社团影响力;
b选择种子节点;
c结束。
2.根据权利要求1所述的适用论文合作网络的基于社团结构的影响最大化算法,其特征在于,其中步骤1)-a中构建合作网络图指的是,构建的网络图中,节点表示作者,图中的边表示两个作者之间存在合作关系,共同发表过论文,并且边的权值表示共同发表的论文的数量,构建好的网络图为无向图。
3.根据权利要求1所述的适用论文合作网络的基于社团结构的影响最大化算法,其特征在于,其中步骤1)-b中合并局部社团是指,将每个节点都当做是一个局部社团,每个节点选取与自己相连且合并之后模块度值增量最大的社团合并,模块度值的公式如下:
其中,nc表示所有社团的数量,inc表示社团c内部的边的数量,totc表示与社团c中节点相连的所有的边的数量,m表示网络中所有的边的数量;
节点i与社团c合并之后模块度值的增量为:
其中表示节点i与社团c相连的边的数量,合并之后变成了新社团的内部边,ki表示节点i的度数。
4.根据权利要求1所述的适用论文合作网络的基于社团结构的影响最大化算法,其特征在于,其中步骤1)-c中构建新的网络图是指,将步骤1)-b中得到的合并之后的社团里的所有节点用一个节点表示作为新的网络图中的节点,原来社团之间的连边变成新的网络图中节点之间的连边。
5.根据权利要求1所述的适用论文合作网络的基于社团结构的影响最大化算法,其特征在于,其中步骤2)-a中计算社团影响力是指将社团内部中,影响力最大节点的影响值作为社团的影响力,并记录对应节点。
6.根据权利要求1所述的适用论文合作网络的基于社团结构的影响最大化算法,其特征在于,其中步骤2)-b中选择种子节点是指选取影响力最大社团中对应的节点,并且需要重新计算对应社团的影响力。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610353585.4A CN106022936B (zh) | 2016-05-25 | 2016-05-25 | 适用论文合作网络的基于社团结构的影响最大化算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610353585.4A CN106022936B (zh) | 2016-05-25 | 2016-05-25 | 适用论文合作网络的基于社团结构的影响最大化算法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106022936A true CN106022936A (zh) | 2016-10-12 |
CN106022936B CN106022936B (zh) | 2020-03-20 |
Family
ID=57093642
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610353585.4A Active CN106022936B (zh) | 2016-05-25 | 2016-05-25 | 适用论文合作网络的基于社团结构的影响最大化算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106022936B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107103551A (zh) * | 2017-03-20 | 2017-08-29 | 重庆邮电大学 | 一种选取种子节点的合著网络社区划分方法 |
CN109118381A (zh) * | 2018-08-29 | 2019-01-01 | 中国人民解放军陆军工程大学 | 一种基于博弈论的符号网络社团发现方法 |
CN109617871A (zh) * | 2018-12-06 | 2019-04-12 | 西安电子科技大学 | 基于社团结构信息和阈值的网络节点免疫方法 |
CN114707040A (zh) * | 2022-04-08 | 2022-07-05 | 中国电信股份有限公司 | 企业合作群体数据分类方法及装置、存储介质及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101383748A (zh) * | 2008-10-24 | 2009-03-11 | 北京航空航天大学 | 一种复杂网络中的社区划分方法 |
CN102202012A (zh) * | 2011-05-30 | 2011-09-28 | 中国人民解放军总参谋部第五十四研究所 | 通信网络的社团划分方法与*** |
CN103020302A (zh) * | 2012-12-31 | 2013-04-03 | 中国科学院自动化研究所 | 基于复杂网络的学术核心作者挖掘及相关信息抽取方法和*** |
CN104820945A (zh) * | 2015-04-17 | 2015-08-05 | 南京大学 | 基于社团结构挖掘算法的在线社会网络信息传播最大化方法 |
CN105184075A (zh) * | 2015-09-01 | 2015-12-23 | 南京大学 | 适用tcmf网络的基于多三角形群组相似性凝聚的重叠社区发现方法 |
-
2016
- 2016-05-25 CN CN201610353585.4A patent/CN106022936B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101383748A (zh) * | 2008-10-24 | 2009-03-11 | 北京航空航天大学 | 一种复杂网络中的社区划分方法 |
CN102202012A (zh) * | 2011-05-30 | 2011-09-28 | 中国人民解放军总参谋部第五十四研究所 | 通信网络的社团划分方法与*** |
CN103020302A (zh) * | 2012-12-31 | 2013-04-03 | 中国科学院自动化研究所 | 基于复杂网络的学术核心作者挖掘及相关信息抽取方法和*** |
CN104820945A (zh) * | 2015-04-17 | 2015-08-05 | 南京大学 | 基于社团结构挖掘算法的在线社会网络信息传播最大化方法 |
CN105184075A (zh) * | 2015-09-01 | 2015-12-23 | 南京大学 | 适用tcmf网络的基于多三角形群组相似性凝聚的重叠社区发现方法 |
Non-Patent Citations (4)
Title |
---|
N.RAMA SURI等: "Determining the Top-k Nodes in Social Networks using the Shapley Value (Short Paper)", 《PROC.OF 7TH INT. CONF. ON AUTONOMOUS AGENTS AND MULTIAGENT SYSTEMS (AAMAS 2008)》 * |
朱小虎等: "用于社团发现的Girvan-Newman 改进算法", 《计算机科学与探索》 * |
田家堂等: "一种新型的社会网络影响最大化算法", 《计算机学报》 * |
胡云等: "微博网络上的重叠社群发现与全局表示", 《软件学报》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107103551A (zh) * | 2017-03-20 | 2017-08-29 | 重庆邮电大学 | 一种选取种子节点的合著网络社区划分方法 |
CN109118381A (zh) * | 2018-08-29 | 2019-01-01 | 中国人民解放军陆军工程大学 | 一种基于博弈论的符号网络社团发现方法 |
CN109118381B (zh) * | 2018-08-29 | 2019-10-22 | 中国人民解放军陆军工程大学 | 一种基于博弈论的符号网络社团发现方法 |
CN109617871A (zh) * | 2018-12-06 | 2019-04-12 | 西安电子科技大学 | 基于社团结构信息和阈值的网络节点免疫方法 |
CN109617871B (zh) * | 2018-12-06 | 2020-04-14 | 西安电子科技大学 | 基于社团结构信息和阈值的网络节点免疫方法 |
CN114707040A (zh) * | 2022-04-08 | 2022-07-05 | 中国电信股份有限公司 | 企业合作群体数据分类方法及装置、存储介质及电子设备 |
CN114707040B (zh) * | 2022-04-08 | 2023-08-18 | 中国电信股份有限公司 | 企业合作群体数据分类方法及装置、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN106022936B (zh) | 2020-03-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106022936A (zh) | 适用论文合作网络的基于社团结构的影响最大化算法 | |
Ding et al. | Carbon-efficient scheduling of flow shops by multi-objective optimization | |
Wongwathanarat et al. | Three-dimensional simulations of core-collapse supernovae: from shock revival to shock breakout | |
CN106096075A (zh) | 一种基于社交网络的消息传播模型 | |
CN105407494A (zh) | 网络扩容方法及装置 | |
Ives | Mixed and phylogenetic models: a conceptual introduction to correlated data | |
CN106156067A (zh) | 用于为关系数据创建数据模型的方法和*** | |
CN109307835A (zh) | 基于锯齿波和遗传算法的模拟电路测点优选方法 | |
CN108197708A (zh) | 一种基于Spark的并行化遗传算法 | |
CN108809697A (zh) | 基于影响力最大化的社交网络关键节点识别方法及*** | |
CN102722530B (zh) | 一种复杂网络中的社团探测方法 | |
Vaknin et al. | Spreading of localized attacks on spatial multiplex networks with a community structure | |
Mo et al. | Network simplification and K-terminal reliability evaluation of sensor-cloud systems | |
CN103559318B (zh) | 对异质信息网络包含的对象进行排序的方法 | |
CN105913287A (zh) | 一种基于社区结构的影响最大化方法 | |
Gravner et al. | Limiting behavior of 3-color excitable media on arbitrary graphs | |
CN104881267B (zh) | 一种基于权重法的Nakagami‑m复衰落随机序列生成方法 | |
CN105764088A (zh) | 一种基于遗传算法的tdoa蜂窝定位方法 | |
CN106201655A (zh) | 虚拟机分配方法和虚拟机分配*** | |
CN107404437B (zh) | 一种报文的路径确定方法及装置 | |
CN101335538A (zh) | 一种扩频序列生成的方法和装置 | |
CN103617206A (zh) | 基于自适应小生境的遗传聚类方法 | |
CN113206712A (zh) | 一种软件无线电符合性测试方法及*** | |
Fraser et al. | Approaches to conflict modeling: a study of a possible USA-USSR nuclear confrontation | |
CN111753252A (zh) | 一种基于Nataf变换的随机变量样本生成方法和*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |