CN110213164A - 一种基于拓扑信息融合的识别网络关键传播者的方法及装置 - Google Patents
一种基于拓扑信息融合的识别网络关键传播者的方法及装置 Download PDFInfo
- Publication number
- CN110213164A CN110213164A CN201910423580.8A CN201910423580A CN110213164A CN 110213164 A CN110213164 A CN 110213164A CN 201910423580 A CN201910423580 A CN 201910423580A CN 110213164 A CN110213164 A CN 110213164A
- Authority
- CN
- China
- Prior art keywords
- node
- network
- path
- index
- disseminator
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 230000004927 fusion Effects 0.000 title claims abstract description 24
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 16
- 239000011159 matrix material Substances 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 3
- 238000004590 computer program Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 238000012163 sequencing technique Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000003860 storage Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/12—Shortest path evaluation
- H04L45/126—Shortest path evaluation minimising geographical or physical path length
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Computer Networks & Wireless Communication (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Computing Systems (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开一种基于拓扑信息融合的识别网络关键传播者的方法及装置,该方法包括:根据各个网络节点的直接连边数量计算网络中各个节点的度,即各个节点对应的邻居节点的个数;依据所述节点的度计算各个节点的H指数;计算所述网络中每对节点间的最短距离,进而得到各个节点的排名对应分值。本发明采用网络节点的常用指标得到一种可以全面反映社交网络节点角色的排名分值,可以更加准确的定位节点在社交网络中的定位角色,准确的挖掘出社交网络中的关键传播者,降低错判率;并且本发明采用Dijkstra算法,跟其他距离算法相比时间复杂度低,适用于复杂的社交网络时,时间成本更低,提高了识别效率。
Description
技术领域
本发明涉及网络信息挖掘领域,具体涉及一种基于拓扑信息融合的识别网络关键传播者的方法及装置。
背景技术
由于社交网络的异质性,每个个体在网络结构和功能上发挥的作用差异巨大。关键传播者就是那些能够在更大程度上影响社交网络的结构与功能的一些特殊个体。例如,微博大V可以加速谣言在社交网络中的扩散。因此需要从海量用户中准确发掘出社交网络中的关键传播者,这样可以更好地控制社交网络信息的传播,而解决上述问题的关键在于针对社交网络的节点排序方法的设计。
目前,大部分节点排序方法仅使用网络的结构化信息,且主要分为基于邻居的中心性和基于路径的中心性。基于邻居中心性的代表包括:度中心性、H指数以及k-壳分解方法。基于路径中心性的代表包括:接近中心性和介数中心性。但经典的节点排序方法无法全面评价节点在网络中的角色。
发明内容
发明目的:为了克服现有技术的不足,本发明提供一种基于拓扑信息融合的识别网络关键传播者的方法,该方法可以解决评价节点在网络中的角色不全面以及准确率低的问题,另一方面,本发明还提供一种基于拓扑信息融合的识别网络关键传播者的装置。
技术方案:本发明所述的基于拓扑信息融合的识别网络关键传播者的方法,该方法包括:
采集以个体为节点的社交软件中的好友列表数据,若个体之间是好友关系,则对应的两节点之间存在一条直接连边,从而得到各个节点对应的直接连边数量;
根据各个节点的直接连边数量确定网络中各个节点的度;
依据所述节点的度计算各个节点的H指数,所述H指数用来表征社交网络中个体的直接影响力;
计算所述网络中每对节点间的最短距离,根据所述H指数和最短距离计算各个节点的排名对应分值,进而得到网络中关键传播者,所述节点间的最短距离用来表征个体处于社交网络中的传播位置。
进一步地,包括:
所述依据所述节点的度计算各个节点的H指数,具体包括:
统计所述节点对应的邻居节点的度,当h=1时,判断是否满足有一个邻居节点的度不小于1;
若不满足,停止循环,H指数等于1,
若满足,则h+1,迭代循环,直至满足至多有h个邻居节点的度不小于h,其中,1≤h≤邻居节点的个数。
进一步地,包括:
所述网络中每对节点间的最短距离采用Dijkstra算法计算。
进一步地,包括:
采用Dijkstra算法计算节点间最短距离,具体包括:
输入:所述网络对应的网络邻接矩阵,
步骤:(1)指定起点s;
(2)引进两个集合S和U,S用来记录已求出最短路径的节点以及相应的最短路径长度,而U则是记录还未求出最短路径的节点以及该节点到起点s的距离;
(3)初始时,S中只有起点s;U中是除s之外的节点,并且U中节点的路径是起点s到该节点的路径;然后,从U中找出路径最短的节点,并将其加入到S中;接着,更新U中的节点和节点对应的路径,再从U中找出路径最短的节点,并将其加入到S中;接着,更新U中的节点和节点对应的路径;重复上述操作,直到遍历完所有节点;
输出:网络中节点间的距离矩阵。
进一步地,包括:
所述各个节点的排名分值公式为:
其中,H(j)为第j个网络节点对应的H指数,di,j表示节点i和j之间的最短距离。
一种基于拓扑信息融合的识别网络关键传播者的装置,包括:
采集模块,用于采集以个体为节点的社交软件中的好友列表数据,若个体之间是好友关系,则对应的两节点之间存在一条直接连边,从而得到各个节点对应的直接连边数量;
节点邻居计算模块,用于根据各个节点的直接连边数量确定网络中各个节点的度;
H指数计算模块,用于依据所述节点的度计算各个节点的H指数,所述H指数用来表征社交网络中个体的直接影响力;
分值计算模块,用于计算所述网络中每对节点间的最短距离后,根据所述H指数和最短距离计算各个节点的排名对应分值,进而得到网络中关键传播者,所述节点间的最短距离用来表征个体处于社交网络中的传播位置。
进一步地,包括:
所述H指数计算模块中,所述依据所述节点的度计算各个节点的H指数,具体包括:
统计所述节点对应的邻居节点的度,当h=1时,判断是否满足有一个邻居节点的度不小于1;
若不满足,停止循环,H指数等于1,
若满足,则h+1,迭代循环,直至满足至多有h个邻居节点的度不小于h,其中,1≤h≤邻居节点的个数。
进一步地,包括:
所述分值计算模块中,所述网络中每对节点间的最短距离采用Dijkstra算法计算。
进一步地,包括:
采用Dijkstra算法计算节点间最短距离,具体包括:
输入:所述网络对应的网络邻接矩阵,
步骤:(1)指定起点s;
(2)引进两个集合S和U,S用来记录已求出最短路径的节点以及相应的最短路径长度,而U则是记录还未求出最短路径的节点以及该节点到起点s的距离;
(3)初始时,S中只有起点s;U中是除s之外的节点,并且U中节点的路径是起点s到该节点的路径;然后,从U中找出路径最短的节点,并将其加入到S中;接着,更新U中的节点和节点对应的路径,再从U中找出路径最短的节点,并将其加入到S中;接着,更新U中的节点和节点对应的路径;重复上述操作,直到遍历完所有节点;
输出:网络中节点间的距离矩阵。
进一步地,包括:
所述分值计算模块中,各个节点的排名分值公式为:
其中,H(j)为第j个网络节点对应的H指数,di,j表示节点i和j之间的最短距离。
有益效果:本发明采用网络节点的常用指标得到一种可以全面反映社交网络节点角色的排名分值,可以更加准确的定位节点在社交网络中的定位,准确的挖掘出社交网络中的关键传播者,降低错判率;并且本发明采用Dijkstra算法,跟其他距离算法相比时间复杂度低,适用于复杂的社交网络时,时间成本更低,提高了识别效率。
附图说明
图1为本发明实施例中识别方法流程图图;
图2为本发明实施例中网络节点连接图;
图3为本发明实施例中是识别装置结构图;
图4为本发明实施例中电子设备结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,并不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
识别社交网络的关键传播者,除了能够被直接影响的个体数量外,其所处的传播位置是否足够中心也决定了其传播的影响力,故节点排序方法有必要同时考虑这两方面的作用,即节点自身的影响力(个体在社交网络中与之关系密切的个体的数量)及节点在网络中所处的位置(个体处于社交网络中的传播位置)。上述经典的节点排序方法均没有同时考虑这两方面的作用,这使得应用上述现有方法无法全面评价节点在网络中的角色。
本发明提出了一种基于拓扑信息融合的识别网络关键传播者的方法,采用H指数来表征社交网络中个体的直接影响力,采用节点间最短距离来表征个体处于社交网络中的传播位置,在此基础上,将两者有效结合进而达到全面反映社交网络节点角色的目的。
本发明不对涉及到的网络类型进行限制,参阅图1所示,为本发明实施例中基于拓扑信息融合的识别网络关键传播者的方法,包括:
S100采集以个体为节点的社交软件中的数据,若个体之间是好友关系,则对应的两节点之间存在一条连边;
具体的,本发明不对具体社交软件进行限制,若以个体的好友列表中,是直接朋友关系,则采集社交软件中对应的数据库中的好友列表关系,若两个体之间为朋友关系,则存在一条直接连边,若两个体之间不为好友关系,则不存在直接连边,不为好友的个体之间通过同时为好友的个体相互影响。
S110根据各个网络节点的直接连边数量确定网络中各个节点的度。
对网络中的进行节点编号,确定各个节点对应的直接连边数量,即为该节点对应的的度表示为K(i),其中,i为网络节点编号,1≤i≤N,N为该网络中节点的总数,同时有该节点具有直接连边的节点为该节点对应的邻居节点。
S120依据所述节点的度计算各个节点的H指数H(i),H指数用来表征社交网络中个体的直接影响力。
具体的,算子H(·)作用在一组实数上,返回一个非负整数,就是这组实数的H指数h,将这个算子H(·)作用在一个节点所有邻居的度上,就得到了这个节点的H指数H(i)。在本实施例中,社交网络中的节点的H指数的大小表征了其个体的直接影响力。
统计所述节点对应的邻居节点的度,当h=1时,判断是否满足有一个邻居节点的度不小于1,若不满足,停止循环,H指数=1,若满足,则h+1,迭代循环,直至满足至多有h个邻居节点的度不小于h,其中,1≤h≤邻居节点的个数。得到每个节点对应的H指数。
S130计算所述网络中每对节点间的最短距离di,j,后计算各个节点的排名对应分值,进而得到网络中关键传播者,所述节点间的最短距离用来表征个体处于社交网络中的传播位置。
进一步的,在本发明实施例中,采用Dijkstra算法计算每对节点间的最短距离di,j,其中,i,j为网络节点编号,Dijkstra算法是一个按照路径长度递增的次序产生的最短路径算法,具体包括:
带权值的有向图采用邻接矩阵graph来进行存储,在计算中就是采用n*n的二维数组来进行存储,数组中包括索引编号,二维数组的值表示节点之间的权值,若两个节点不能通行,那么采用计算机中最大正整数来进行表示。
具体的:(1)指定起点s,即从节点s开始计算。
(2)引进两个集合S和U。S的作用是记录已求出最短路径的节点以及相应的最短路径长度,而U则是记录还未求出最短路径的节点以及该节点到起点s的距离。
(3)初始时,S中只有起点s;U中是除s之外的节点,并且U中节点的路径是“起点s到该节点的路径”。然后,从U中找出路径最短的节点,并将其加入到S中;接着,更新U中的节点和节点对应的路径。然后,再从U中找出路径最短的节点,并将其加入到S中;接着,更新U中的节点和节点对应的路径。重复上述操作,直到遍历完所有节点。
进一步的,在本发明实施例中,进而得到各个节点的排名对应分值,公示表示为:根据该公式,排名得分越高说明节点越重要,即得分越高的节点更加体现了网络中的关键传播者。
值得说明的是,本发明实施例中的方法流程图是为了更加清楚地说明本发明实施例中的技术方案,并不构成对本发明实施例提供的技术方案的限制,并且,本发明实施例中也不仅限于社交网络的应用,对于其它的***结构和业务应用,本发明实施例提供的技术方案对于类似的问题,同样适用。
下面将结合图2中的算例网络对本发明的具体实施进行详细说明。
步骤1:计算各节点的度。
以节点1为例,节点1有3个邻居,因此K(1)=3。所有节点的度见表1:
表1各节点的度
步骤2:计算各节点的H指数。以节点1为例,节点1的邻居分别为节点2、3和4,对应的度分别为4、4和4,因为节点1的邻居至多有3个节点的度不小于3,因此H(1)=3。
以节点4为例,节点4的邻居分别为节点1、2、5、6,对应的度分别为3、4、4、2,可以看出{3、4、4、2}这个序列存在3个数(3、4、4)不小于3,但是不存在4个数不小于4,即只有2个数不小于4,就是节点2和节点5的度,因此至多有3个数不小于3,所以H指数为3所有节点的H指数见表2:
表2各节点的H指数
步骤3:计算网络中每对节点间的最短距离dij。以节点对(1,6)为例,d1,6=2。
输入为对应的网络邻接矩阵,输出为距离矩阵,本实施例中对应的邻接矩阵表示为:
0 1 1 1 0 0 0 0 0 0
1 0 1 1 0 0 0 0 1 0
1 1 0 0 0 0 0 0 1 1
1 1 0 0 1 1 0 0 0 0
0 0 0 1 0 1 1 1 0 0
0 0 0 1 1 0 0 0 0 0
0 0 0 0 1 0 0 0 0 0
0 0 0 0 1 0 0 0 0 0
0 1 1 0 0 0 0 0 0 0
0 0 1 0 0 0 0 0 0 0
以节点1为例,与节点2、3、4存在直接连边,故对应位置为1,与其余六个节点之间不存在直接连边,故对应位置为0。输出的所有节点对间的最短距离矩阵,见表3:
表3各节点对间的最短距离
步骤4:计算各节点的排名得分,排名得分越高节点越重要。
以节点1为例,
所有节点的得分见表4:
表4各节点的得分
根据表4的得分,可以得到最终的节点重要性排名,见表5:
表5各节点的重要性排名
通过表5可以看到,节点4最为重要。图2看出节点4连接着左右两个小社团,处于必经之路的节点4的确是最为重要的节点。反映到真实的社交网络中,节点4同时作为两个社团的个体,且不可替代。如果节点4作为传播者,消息会迅速在左右两个社团扩散。
基于上述实施例,参阅图3所示,本发明实施例中,基于拓扑信息融合的识别网络关键传播者的装置,具体包括:
采集模块20,用于采集以个体为节点的社交软件中的数据,若个体之间是好友关系,则对应的两节点之间存在一条连边;
节点邻居计算模块21,用于根据各个节点的直接连边数量确定网络中各个节点的度;
H指数计算模块22,用于依据所述节点的度计算各个节点的H指数,所述H指数用来表征社交网络中个体的直接影响力;
分值计算模块23,用于计算所述网络中每对节点间的最短距离后,根据所述H指数和最短距离计算各个节点的排名对应分值,进而得到网络中关键传播者,所述节点间的最短距离用来表征个体处于社交网络中的传播位置。
进一步地,包括:
所述H指数计算模块中22,所述依据所述节点的度计算各个节点的H指数,具体包括:
统计所述节点对应的邻居节点的度,当h=1时,判断是否满足有一个邻居节点的度不小于1;
若不满足,停止循环,H指数等于1,
若满足,则h+1,迭代循环,直至满足至多有h个邻居节点的度不小于h,其中,1≤h≤邻居节点的个数。
进一步地,包括:
所述分值计算模块23中,所述网络中每对节点间的最短距离采用Dijkstra算法计算。
进一步地,包括:
采用Dijkstra算法计算节点间最短距离,具体包括:
输入:所述网络对应的网络邻接矩阵,
步骤:(1)指定起点s;
(2)引进两个集合S和U,S用来记录已求出最短路径的节点以及相应的最短路径长度,而U则是记录还未求出最短路径的节点以及该节点到起点s的距离;
(3)初始时,S中只有起点s;U中是除s之外的节点,并且U中节点的路径是起点s到该节点的路径;然后,从U中找出路径最短的节点,并将其加入到S中;接着,更新U中的节点和节点对应的路径,再从U中找出路径最短的节点,并将其加入到S中;接着,更新U中的节点和节点对应的路径;重复上述操作,直到遍历完所有节点;
输出:网络中节点间的距离矩阵。
进一步地,包括:
所述分值计算模块23中,各个节点的排名分值公式为:
其中,H(j)为第j个网络节点对应的H指数,di,j表示节点i和j之间的最短距离。
参阅图4所示,本发明实施例中,一种电子设备结构示意图。
本发明实施例提供了一种电子设备,该电子设备可以包括处理器310(CenterProcessing Unit,CPU)、存储器320、输入设备330和输出设备340等,输入设备330可以包括键盘、鼠标、触摸屏等,输出设备340可以包括显示设备,如液晶显示器(Liquid CrystalDisplay,LCD)、阴极射线管(Cathode Ray Tube,CRT)等。
存储器320可以包括只读存储器(ROM)和随机存取存储器(RAM),并向处理器310提供存储器320中存储的程序指令和数据。在本发明实施例中,存储器320可以用于存储上述基于拓扑信息融合的识别网络关键传播者方法的程序。
处理器310通过调用存储器320存储的程序指令,处理器310用于按照获得的程序指令执行上述任一种基于拓扑信息融合的识别网络关键传播者的方法的步骤。
基于上述实施例,本发明实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意方法实施例中的基于拓扑信息融合的识别网络关键传播者的方法。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种基于拓扑信息融合的识别网络关键传播者的方法,其特征在于,该方法包括:
采集网络中以个体为节点的好友列表数据;
根据所述好友列表数据得到各个节点对应的连边数量;若个体之间是好友关系,则对应的两节点之间存在直接连边;
根据各个节点的直接连边数量确定网络中各个节点的度;
依据所述节点的度计算各个节点的H指数,所述H指数用来表征社交网络中个体的直接影响力;
根据所述H指数和节点间的最短距离计算各个节点的排名对应分值,进而得到网络中关键传播者,所述节点间的最短距离用来表征个体处于社交网络中的传播位置。
2.根据权利要求1所述的基于拓扑信息融合的识别网络关键传播者的方法,其特征在于,所述依据所述节点的度计算各个节点的H指数,具体包括:
统计所述节点对应的邻居节点的度,当h=1时,判断是否满足有一个邻居节点的度不小于1;
若不满足,停止循环,H指数等于1,
若满足,则h+1,迭代循环,直至满足至多有h个邻居节点的度不小于h,其中,1≤h≤邻居节点的个数。
3.根据权利要求1所述的基于拓扑信息融合的识别网络关键传播者的方法,其特征在于,所述网络中每对节点间的最短距离采用Dijkstra算法计算。
4.根据权利要求1所述的基于拓扑信息融合的识别网络关键传播者的方法,其特征在于,所述最短距离的计算过程,具体包括:
初始时,集合S中包括起点s;集合U中是除s之外的节点,并且U中节点的路径是起点s到该节点的路径;集合S用于记录已求出最短路径的节点以及相应的最短路径长度,集合U用于记录还未求出最短路径的节点以及该节点到起点s的距离;
根据预先得到的网络邻接矩阵从U中找出路径最短的节点,并将其加入到S中;更新U中的节点和节点对应的路径,再从U中找出路径最短的节点,并将其加入到S中;更新U中的节点和节点对应的路径;重复上述操作,直到遍历完所有节点,得到节点间的距离矩阵。
5.根据权利要求1所述的基于拓扑信息融合的识别网络关键传播者的方法,其特征在于,所述各个节点的排名分值公式为:
其中,H(j)为第j个网络节点对应的H指数,di,j表示节点i和j之间的最短距离。
6.一种基于拓扑信息融合的识别网络关键传播者的装置,其特征在于,包括:
采集模块,用于采集以个体为节点的社交软件中的好友列表数据,若个体之间是好友关系,则对应的两节点之间存在一条直接连边,从而得到各个节点对应的直接连边数量;
节点邻居计算模块,用于根据各个节点的直接连边数量确定网络中各个节点的度;
H指数计算模块,用于依据所述节点的度计算各个节点的H指数,所述H指数用来表征社交网络中个体的直接影响力;
分值计算模块,用于计算所述网络中每对节点间的最短距离后,根据所述H指数和最短距离计算各个节点的排名对应分值,进而得到网络中关键传播者,所述节点间的最短距离用来表征个体处于社交网络中的传播位置。
7.根据权利要求6所述的基于拓扑信息融合的识别网络关键传播者的装置,其特征在于,所述H指数计算模块中,所述依据所述节点的度计算各个节点的H指数,具体包括:
统计所述节点对应的邻居节点的度,当h=1时,判断是否满足有一个邻居节点的度不小于1;
若不满足,停止循环,H指数等于1,
若满足,则h+1,迭代循环,直至满足至多有h个邻居节点的度不小于h,其中,1≤h≤邻居节点的个数。
8.根据权利要求6所述的基于拓扑信息融合的识别网络关键传播者的装置,其特征在于,所述分值计算模块中,所述网络中每对节点间的最短距离采用Dijkstra算法计算。
9.根据权利要求8所述的基于拓扑信息融合的识别网络关键传播者的装置,其特征在于,采用Dijkstra算法计算节点间最短距离,具体包括:
输入:所述网络对应的网络邻接矩阵,
步骤:(1)指定起点s;
(2)引进两个集合S和U,S用来记录已求出最短路径的节点以及相应的最短路径长度,而U则是记录还未求出最短路径的节点以及该节点到起点s的距离;
(3)初始时,S中只有起点s;U中是除s之外的节点,并且U中节点的路径是起点s到该节点的路径;然后,从U中找出路径最短的节点,并将其加入到S中;接着,更新U中的节点和节点对应的路径,再从U中找出路径最短的节点,并将其加入到S中;接着,更新U中的节点和节点对应的路径;重复上述操作,直到遍历完所有节点;
输出:网络中节点间的距离矩阵。
10.根据权利要求6所述的基于拓扑信息融合的识别网络关键传播者的装置,其特征在于,所述分值计算模块中,各个节点的排名分值公式为:
其中,H(j)为第j个网络节点对应的H指数,di,j表示节点i和j之间的最短距离。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910423580.8A CN110213164B (zh) | 2019-05-21 | 2019-05-21 | 一种基于拓扑信息融合的识别网络关键传播者的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910423580.8A CN110213164B (zh) | 2019-05-21 | 2019-05-21 | 一种基于拓扑信息融合的识别网络关键传播者的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110213164A true CN110213164A (zh) | 2019-09-06 |
CN110213164B CN110213164B (zh) | 2021-06-08 |
Family
ID=67788018
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910423580.8A Active CN110213164B (zh) | 2019-05-21 | 2019-05-21 | 一种基于拓扑信息融合的识别网络关键传播者的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110213164B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111694995A (zh) * | 2020-05-15 | 2020-09-22 | 支付宝(杭州)信息技术有限公司 | 一种关系网络的优化方法、装置及处理设备 |
CN112929889A (zh) * | 2021-01-23 | 2021-06-08 | 西北工业大学 | 一种基于h指数进行5g超密度网络节点定位的方法 |
WO2021169454A1 (zh) * | 2020-02-25 | 2021-09-02 | 支付宝(杭州)信息技术有限公司 | 图特征处理的方法及装置 |
CN113450558A (zh) * | 2020-03-27 | 2021-09-28 | 上海仙豆智能机器人有限公司 | 一种识别网络关键节点的方法、***及存储介质 |
CN113486258A (zh) * | 2021-07-05 | 2021-10-08 | 北京易数科技有限公司 | 基于社交网络的数据分析方法、装置、介质、电子设备 |
CN115333945A (zh) * | 2022-07-03 | 2022-11-11 | 复旦大学 | 一种在线社交网络的局部拓扑推断方法 |
CN115442243A (zh) * | 2022-08-31 | 2022-12-06 | 西南大学 | 基于时序路径树的时序网络节点中心性评估方法及装置 |
CN117811992A (zh) * | 2024-02-29 | 2024-04-02 | 山东海量信息技术研究院 | 一种网络不良信息传播抑制方法、装置、设备及存储介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8010619B1 (en) * | 2004-04-07 | 2011-08-30 | Cisco Technology Inc. | Methods and apparatus for integrating social network metrics and reputation data |
CN102202012A (zh) * | 2011-05-30 | 2011-09-28 | 中国人民解放军总参谋部第五十四研究所 | 通信网络的社团划分方法与*** |
CN102262681A (zh) * | 2011-08-19 | 2011-11-30 | 南京大学 | 一种博客信息传播中识别关键博客集的方法 |
US20140188994A1 (en) * | 2012-12-28 | 2014-07-03 | Wal-Mart Stores, Inc. | Social Neighborhood Determination |
CN104317900A (zh) * | 2014-10-24 | 2015-01-28 | 重庆邮电大学 | 一种面向社交网络的多属性协同过滤推荐方法 |
CN104715034A (zh) * | 2015-03-16 | 2015-06-17 | 北京航空航天大学 | 基于中心人物的有权图重叠社区发现方法 |
CN104933624A (zh) * | 2015-06-29 | 2015-09-23 | 电子科技大学 | 复杂网络的社团发现方法及社团重要节点发现方法 |
CN105117422A (zh) * | 2015-07-30 | 2015-12-02 | 中国传媒大学 | 智能社交网络推荐*** |
CN106127590A (zh) * | 2016-06-21 | 2016-11-16 | 重庆邮电大学 | 一种基于节点影响力的信息态势感知及传播管控模型 |
CN108255987A (zh) * | 2017-12-28 | 2018-07-06 | 清华大学 | 基于社区的节点介数中心度更新方法 |
CN108809697A (zh) * | 2018-05-18 | 2018-11-13 | 中国矿业大学 | 基于影响力最大化的社交网络关键节点识别方法及*** |
-
2019
- 2019-05-21 CN CN201910423580.8A patent/CN110213164B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8010619B1 (en) * | 2004-04-07 | 2011-08-30 | Cisco Technology Inc. | Methods and apparatus for integrating social network metrics and reputation data |
CN102202012A (zh) * | 2011-05-30 | 2011-09-28 | 中国人民解放军总参谋部第五十四研究所 | 通信网络的社团划分方法与*** |
CN102262681A (zh) * | 2011-08-19 | 2011-11-30 | 南京大学 | 一种博客信息传播中识别关键博客集的方法 |
US20140188994A1 (en) * | 2012-12-28 | 2014-07-03 | Wal-Mart Stores, Inc. | Social Neighborhood Determination |
CN104317900A (zh) * | 2014-10-24 | 2015-01-28 | 重庆邮电大学 | 一种面向社交网络的多属性协同过滤推荐方法 |
CN104715034A (zh) * | 2015-03-16 | 2015-06-17 | 北京航空航天大学 | 基于中心人物的有权图重叠社区发现方法 |
CN104933624A (zh) * | 2015-06-29 | 2015-09-23 | 电子科技大学 | 复杂网络的社团发现方法及社团重要节点发现方法 |
CN105117422A (zh) * | 2015-07-30 | 2015-12-02 | 中国传媒大学 | 智能社交网络推荐*** |
CN106127590A (zh) * | 2016-06-21 | 2016-11-16 | 重庆邮电大学 | 一种基于节点影响力的信息态势感知及传播管控模型 |
CN108255987A (zh) * | 2017-12-28 | 2018-07-06 | 清华大学 | 基于社区的节点介数中心度更新方法 |
CN108809697A (zh) * | 2018-05-18 | 2018-11-13 | 中国矿业大学 | 基于影响力最大化的社交网络关键节点识别方法及*** |
Non-Patent Citations (2)
Title |
---|
AFTAB FAROOQ,ETC: "Detection of Influential Nodes Using Social Networks Analysis Based On Network Metrics", 《INTERNATIONAL CONFERENCE ON COMPUTING, MATHEMATICS AND ENGINEERING TECHNOLOGIES》 * |
韩忠明,等: "社会网络节点影响力分析研究", 《软件学报》 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021169454A1 (zh) * | 2020-02-25 | 2021-09-02 | 支付宝(杭州)信息技术有限公司 | 图特征处理的方法及装置 |
CN113450558B (zh) * | 2020-03-27 | 2022-11-08 | 上海仙豆智能机器人有限公司 | 一种识别网络关键节点的方法、***及存储介质 |
CN113450558A (zh) * | 2020-03-27 | 2021-09-28 | 上海仙豆智能机器人有限公司 | 一种识别网络关键节点的方法、***及存储介质 |
CN111694995A (zh) * | 2020-05-15 | 2020-09-22 | 支付宝(杭州)信息技术有限公司 | 一种关系网络的优化方法、装置及处理设备 |
CN111694995B (zh) * | 2020-05-15 | 2024-02-06 | 支付宝(杭州)信息技术有限公司 | 一种关系网络的优化方法、装置及处理设备 |
CN112929889A (zh) * | 2021-01-23 | 2021-06-08 | 西北工业大学 | 一种基于h指数进行5g超密度网络节点定位的方法 |
CN112929889B (zh) * | 2021-01-23 | 2022-01-07 | 西北工业大学 | 一种基于h指数进行5g超密度网络节点定位的方法 |
CN113486258A (zh) * | 2021-07-05 | 2021-10-08 | 北京易数科技有限公司 | 基于社交网络的数据分析方法、装置、介质、电子设备 |
CN115333945A (zh) * | 2022-07-03 | 2022-11-11 | 复旦大学 | 一种在线社交网络的局部拓扑推断方法 |
CN115333945B (zh) * | 2022-07-03 | 2023-06-16 | 复旦大学 | 一种在线社交网络的局部拓扑推断方法 |
CN115442243A (zh) * | 2022-08-31 | 2022-12-06 | 西南大学 | 基于时序路径树的时序网络节点中心性评估方法及装置 |
CN115442243B (zh) * | 2022-08-31 | 2024-04-16 | 西南大学 | 基于时序路径树的时序网络节点中心性评估方法及装置 |
CN117811992A (zh) * | 2024-02-29 | 2024-04-02 | 山东海量信息技术研究院 | 一种网络不良信息传播抑制方法、装置、设备及存储介质 |
CN117811992B (zh) * | 2024-02-29 | 2024-05-28 | 山东海量信息技术研究院 | 一种网络不良信息传播抑制方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110213164B (zh) | 2021-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110213164A (zh) | 一种基于拓扑信息融合的识别网络关键传播者的方法及装置 | |
CN109033234B (zh) | 一种基于状态更新传播的流式图计算方法及*** | |
CN104995870B (zh) | 多目标服务器布局确定方法和装置 | |
Yu et al. | A survey of multi-agent trust management systems | |
CN108985309A (zh) | 一种数据处理方法以及装置 | |
CN107895038A (zh) | 一种链路预测关系推荐方法及装置 | |
Li et al. | A trust evaluation scheme for complex links in a social network: a link strength perspective | |
Kurdi et al. | TrustyFeer: A Subjective Logic Trust Model for Smart City Peer‐to‐Peer Federated Clouds | |
Zhou et al. | Leveraging history for faster sampling of online social networks | |
CN109284449A (zh) | 兴趣点的推荐方法和装置 | |
CN110247805A (zh) | 一种基于k壳分解的识别传播关键节点的方法及装置 | |
CN109656898A (zh) | 基于节点度的分布式大规模复杂社团探测方法及装置 | |
Zhao et al. | Identifying influential spreaders in social networks via normalized local structure attributes | |
Yang et al. | AOGC: An improved gravity centrality based on an adaptive truncation radius and omni-channel paths for identifying key nodes in complex networks | |
Zou et al. | DEA Cross‐Efficiency Aggregation with Deviation Degree Based on Standardized Euclidean Distance | |
US20220141174A1 (en) | Method and system for selecting multiple target nodes within social network | |
CN110443648A (zh) | 信息投放方法、装置、电子设备及存储介质 | |
CN105956275A (zh) | 一种基于逻辑Petri网计算最优校准的方法 | |
Golbeck et al. | The ripple effect: change in trust and its impact over a social network | |
CN108345699A (zh) | 获取多媒体数据的方法、装置及存储介质 | |
CN109981361B (zh) | 一种传播网络中感染源的确定方法及装置 | |
Do et al. | Improving the core resilience of real-world hypergraphs | |
Li et al. | Sgvcut: a vertex-cut partitioning tool for random walks-based computations over social network graphs | |
CN111245657A (zh) | 两种基于邻居的网络拓扑类有向链路预测指标 | |
Liu et al. | Evolving bipartite model reveals the bounded weights in mobile social networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |