CN108470251A - 基于平均互信息的社区划分质量评价方法及*** - Google Patents
基于平均互信息的社区划分质量评价方法及*** Download PDFInfo
- Publication number
- CN108470251A CN108470251A CN201810263538.XA CN201810263538A CN108470251A CN 108470251 A CN108470251 A CN 108470251A CN 201810263538 A CN201810263538 A CN 201810263538A CN 108470251 A CN108470251 A CN 108470251A
- Authority
- CN
- China
- Prior art keywords
- community
- result
- betweenness
- divides
- mutual
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000005457 optimization Methods 0.000 claims abstract description 7
- 238000004364 calculation method Methods 0.000 claims description 23
- 238000005192 partition Methods 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 5
- 238000012217 deletion Methods 0.000 claims description 4
- 230000037430 deletion Effects 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 claims description 3
- 235000013399 edible fruits Nutrition 0.000 claims 2
- 238000011156 evaluation Methods 0.000 description 10
- 230000008859 change Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000013441 quality evaluation Methods 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Theoretical Computer Science (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种基于平均互信息的社区划分质量评价方法及***,在经典GN社区划分***的基础上,加入了基于平均互信息的社区划分质量评价方法,首先通过计算每次社区划分的平均互信息值从而选出平均互信息最大值所对应的最优社区划分,然后分别计算最优社区划分前后社区结构的信息熵从而确定优化的社区结构,紧接着对优化后的社区结构中的所有节点进行遍历,找到与多个社区的链接数相同的节点,最后分别计算将该节点放到不同社区时网络中总的信息熵,输出总信息熵最小值所对应的社区结构即为最优的社区结构,有效地提高了社区划分结果的准确性。
Description
技术领域
本发明涉及社区划分质量评价领域,具体涉及一种基于平均互信息的社区划分质量评价方法及***。
背景技术
随着互联网、物联网技术的快速发展,事物之间的联系更加紧密,错综复杂的联系形成了多样、多变、规模庞大的网络,这样的网络被称为复杂网络。所谓社区是指具有关联的个体所组成的集合,复杂网络由若干社区组成。社区划分涉及计算机、物理、生物、社会学以及复杂性***科学等多学科,近年来成为多个学科的研究热点之一。在社区划分中,社区划分***通常会构造并评判多种社区结构,并从一种社区结构演变到另一种社区结构。优化社区划分***的关键是找到一种社区划分质量评价方法,通过该评价方法优化社区划分***,从而提高社区划分***的准确性。但是,目前对社区划分质量评价方法的思路主要还是集中在模块度评价方法,而模块度评价方法存在Resolution limit的问题。虽然也有社区划分质量评价方法是基于信息论的相关知识,但是在使用基于信息论方面的评价方法时,需要知道一些先验条件。
发明内容
本发明的目的是针对现有技术的不足,提供了一种基于平均互信息的社区划分质量评价方法,所述方法针对已有的经典社区划分***,从社区划分质量评价的角度出发,以平均互信息为基础,可以在无先验条件的情况下,利用该评价方法从多个社区划分候选解中找出最优的社区划分,有效地提高了社区划分结果的准确性。同时本发明还公开了一种基于平均互信息的社区划分质量评价***。
本发明具体的技术方案为:一种基于平均互信息的社区划分质量评价方法,所述方法包括以下步骤:
S1、服务器接收社区划分请求;
S2、采用边介数算法对社区划分请求进行边介数计算,得到边介数计算结果;
S3、根据边介数计算结果,对边介数最大的边进行删除,得到删除边前后的社区划分结果,服务器查看删除边后的社区是否已经发生***,若是则进行步骤S4,若否,则返回步骤S2重新对删除边后的社区根据社区划分请求进行边介数计算;
S4、对步骤S3得到的所有删除边前后的社区划分结果计算平均互信息值,得到互信息结果,服务器查看本次删除边后的互信息结果是否为最大的互信息结果,若是则修改最大互信息结果并且记录最大互信息结果所对应的社区划分前后的社区结构,然后再进行步骤S5,若否,则直接进行步骤S5;
S5、判断当前社区是否还存在边,若是,则返回步骤S2重新对删除边后的社区根据社区划分请求进行边介数计算,若否则进行步骤S6;
S6、判断步骤S4中最大互信息结果对应社区划分前的社区结构的信息熵是否大于最大互信息结果对应社区划分后的社区结构的信息熵,若否,则记录最大互信息结果对应社区划分前的社区结构为社区划分结果,若是,则记录最大互信息结果对应社区划分后的社区结构为社区划分结果;
S7、根据步骤S6中的社区划分结果,利用与多个社区链接数相同的节点进一步优化社区划分结果,得到最终的社区划分结果;
S8、将最终的社区划分结果发送给客户端。
进一步地,步骤S2中所述采用边介数算法对社区划分请求进行边介数计算的具体操作为:对社区划分请求进行最短路径的计算从而得到边介数的计算结果。
进一步地,步骤S3的具体过程为:首先对边介数按从大到小排序,删除边介数最大的边,然后将删除前后的结果存入社区划分结果中。
进一步地,步骤S4中所述删除边前后的社区划分结果的平均互信息值的计算公式为:QI=E[I(Xi;Yj)]=ΣiΣjP(Xi,Yj)I(Xi;Yj),其中Xi表示社区划分前的第i个社区,Yj表示社区划分后的第j个社区,QI为平均互信息值。
进一步地,步骤S6中所述信息熵值的计算公式为:H(X)=-Σx(P(x=1)log2P(x=1)+P(x=0)log2P(x=0)),其中P(x=1)表示节点被划分到社区x的概率,P(x=0)表示节点未被划分到社区x的概率,H(X)为信息熵值。
进一步地,步骤S7的具体过程为:首先找到与多个社区相连的节点,然后分别将该节点放入多个相连的社区,分别计算将该节点放到不同社区时网络中总的信息熵,输出总信息熵最小值所对应的社区结构即为最终的社区划分结果。
同时,本发明公开了一种应用于上述基于平均互信息的社区划分质量评价方法的***,所述***包括客户端和服务器,其中服务器包括以下模块:
请求接收模块:用于接收客户端发送的社区划分请求;
计算边介数模块:用于计算边介数,得到边介数计算结果;
删除边介数模块:用于根据边介数计算结果,对边介数最大的边进行删除,得到删除边介数前后的社区划分结果;
计算平均互信息值模块:用于计算平均互信息值,得到互信息结果;
计算信息熵值模块:用于计算划分前后的信息熵值,得到信息熵值最小的社区划分结果;
优化模块:用于根据社区划分结果,利用与多个社区链接数相同的节点进一步优化社区划分结果,得到最终的社区划分结果;
输出模块:用于将最终的社区划分结果发送至客户端。
本发明与现有技术相比,具有如下优点和有益效果:
1、本发明通过在社区划分***中引入基于平均互信息的社区划分质量评价方法,该评价方法在每次社区划分过程中计算社区划分的平均互信息值,找出平均互信息最大值所对应的社区划分,进一步对平均互信息最大值所对应社区划分前后的社区结构进行信息熵的比较,得到信息熵最小的社区划分结构,最后利用与多个社区链接数相同的节点进一步优化社区划分结果,得到最终的社区划分结果,从而达到了提高社区划分结果准确性的目的。
2、本发明采用基于平均互信息的社区划分质量评价方法,该评价方法相对于其它基于信息论的评价方法来说,可以在不需要先验条件的前提下使用。
附图说明
图1为本发明实施例基于平均互信息的社区划分质量评价方法的流程图。
图2(a)为本发明实施例中社区没有发生***的示意图,图2(b)为本发明实施例中社区***成其他两个社区的示意图。
图3为本发明实施例中与多个社区的链接数相同的节点的示例图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例:
本发明实施例在经典GN社区划分***的基础上,加入了基于平均互信息的社区划分质量评价方法。基于平均互信息的社区划分质量评价方法是本发明的核心内容。加入基于平均互信息的社区划分质量评价方法后的社区划分***首先通过计算每次社区划分的平均互信息值从而选出平均互信息最大值所对应的最优社区划分,然后分别计算最优社区划分前后社区结构的信息熵从而确定优化的社区结构,紧接着对优化后的社区结构中的所有节点进行遍历,找到与多个社区的链接数相同的节点,最后分别计算将该节点放到不同社区时网络中总的信息熵,输出总信息熵最小值所对应的社区结构即为最优的社区结构。
本发明实施例另外提供了一种基于平均互信息的社区划分质量评价***,所述***包括客户端和服务器,其中服务器包括以下模块:请求接收模块:用于接收客户端发送的社区划分请求;计算边介数模块:用于计算边介数,得到边介数计算结果;删除边介数模块:用于根据边介数计算结果,对边介数最大的边进行删除,得到删除边介数前后的社区划分结果;计算平均互信息值模块:用于计算平均互信息值,得到互信息结果;计算信息熵值模块:用于计算划分前后的信息熵值,得到信息熵值最小的社区划分结果;优化模块:用于根据社区划分结果,利用与多个社区链接数相同的节点进一步优化社区划分结果,得到最终的社区划分结果;输出模块:用于将最终的社区划分结果发送至客户端。
下面对本发明实施例提供的基于平均互信息的社区划分质量评价方法及***做详细说明。
首先,对本发明实施例提供的方法及***中所涉及到的相关术语,我们给出如下定义,并结合定义说明该发明的基本原理:
定义1:社区结构X表示社区划分前的社区结构,Xi表示社区结构X中的第i个社区。社区结构Y表示经过社区划分后的社区结构,Yj表示社区结构Y中的第j个社区。nxi表示社区Xi中的节点总数,nyj表示社区Yj中的节点总数,n表示网络中的节点总数。
定义2:(平均互信息)平均互信息是一个随机变量包含另一个随机变量信息量的度量。对于两个随机变量X和Y,它们的联合概率密度函数为P(x,y),其边际概率密度函数分别是P(x)和P(y)。平均互信息I(X;Y)为联合分布P(x,y)和乘积分布P(x)P(y)之间的相对熵,其计算公式如下:
I(X;Y)=ΣxΣyP(x,y)log2[P(x,y)/(P(x)*P(y))] (1)
定义3:(信息熵)信息熵是信息论中用于度量信息量的一个概念。H(X)表示信息熵,P(x)表示一个概率密度函数,信息熵的计算公式如下:
H(X)=-ΣxP(x)log2P(x) (2)
定义4:(边介数)边介数定义为网络中所有最短路径中经过该边的路径数目占最短路径总数的比例。边介数越大,则这条边作为社区间连接边的概率就越大,所以通过不断删除边介数最大的边可以达到分离社区的目的。
定义5:(社区划分的平均互信息)对于每次社区划分,平均互信息表示本次社区划分后的社区结构Y包含本次社区划分前的社区结构X信息量的度量。根据平均互信息具有相加性,我们进一步将2个社区结构的平均互信息值近似为2个社区结构中社区之间平均互信息值的权重和,具体计算公式如下:
QI=E[I(Xi;Yj)]=ΣiΣjP(Xi,Yj)I(Xi;Yj) (3)
其中,I(Xi;Yj)表示社区Xi与社区Yj的平均互信息值,P(Xi,Yj)=P(Yj|Xi)×P(Xi),P(Yj|Xi)表示在社区Xi的点被划分到社区Yj的概率,P(Xi)表示网络中的点被划分到社区Xi的概率。
定义6:(社区划分的两种情况)因为经典GN社区划分***是基于***的社区划分***。所以,针对经典GN社区划分***只需考虑如下两种情况:
1.在社区划分中,某社区没有发生***;
2.在社区划分中,某社区***成其它两个社区。
图2(a)和图2(b)是社区划分中出现的两种情况示例。
于是,针对上述两种情况,分别计算P(Yj|Xi)。
对于第一种情况:
对于第二种情况:
其中,nxi表示社区Xi中的节点总数,nyj表示社区Yj中的节点总数。
定义7:P(Xi)表示网络中的点被划分到社区Xi的概率,所以P(Xi)的计算公式如下:
P(Xi)=nxi/n (6)
定义8:p(Xi=0)表示节点不属于社区Xi的概率,p(Xi=1)表示节点属于社区Xi的概率,其计算公式如下:
p(Xi=0)=(n-nxi)/n (7)
p(Xi=1)=nxi/n (8)
定义9:p(Yj=1|Xi=1)表示在节点属于社区Xi的条件下,该节点也属于社区Yj的概率,则p(Yj=1|Xi=1)的计算公式如下:
p(Yj=1|Xi=1)=nyj/nxi (9)
本实施例提供的基于平均互信息的社区划分质量评价方法的流程图如图1所示,具体包括以下步骤:
步骤101:用户以点和边的形式输入待社区划分的网络数据。
输入的网络数据格式为每一行输入两个数字,中间用空格分隔开,两个数字分别表示两个节点,比如“1 2”表示节点1和节点2中间有一条链接。
步骤102:计算网络中所有边的介数。边介数定义见定义4。
计算边介数的算法如下:
计算网络中最短路径的算法如下:
步骤103:删除网络中边介数最大的边。
本步骤在删除网络中某一条边后,网络中总的最短路径数也会发生变化,所以接下来要重新计算剩余边的介数。
步骤104:网络中是否有社区发生了***。在经典GN的社区划分***中,如果有社区发生了***才开始进行步骤105,或者会跳回步骤102。
步骤105:计算本次社区划分的平均互信息值I(X;Y)。平均互信息的定义见定义2,I(X;Y)的计算公式为:I(X;Y)=ΣiΣjP(Xi,Yj)I(Xi;Yj),其中I(Xi;Yj)=ΣaΣbP(Xi=a,Yj=b)[log2P(Xi=a,Yj=b)-(log2P(Xi=a)+log2P(Yj=b))]。如图2(a)和图2(b)所示,在计算平均互信息时,需要对每次社区划分考虑两种情况:1)在社区划分中,某社区没有发生***。2)在社区划分中,某社区***成其它两个社区。计算I(X;Y)的算法如下:
步骤106:判断I(X;Y)是否大于I(X;Y)的最大值。如果是大于I(X;Y)的最大值才开始进行步骤107,否则则直接进行步骤108。
步骤107:I(X;Y)的最大值等于I(X;Y)并记录本次社区划分前后的社区结构。并进行步骤108。
本步骤Max_I(X;Y)表示的就是I(X;Y)的最大值。
步骤108:判断网络数据中是否还存在边。如果存在边则继续进行社区划分,即返回执行步骤102,如果已经没有边可以***了,则说明整体社区划分已经结束了,则开始进行步骤109。
步骤109:计算并记录Max_I(X;Y)所对应的社区划分前后社区结构的信息熵。信息熵的定义见定义3。计算信息熵H(X)的算法如下:
步骤110:判断划分前社区结构的信息熵是否大于划分后社区结构的信息熵。如果划分前社区结构的信息熵是大于划分后社区结构的信息熵才开始进行步骤111,否则进行步骤112。
步骤111:记录社区划分后的社区结构。
本步骤是记录最小信息熵所对应的社区结构。因为信息熵越小,社区结构中的不确定性就越小,即社区结构更稳定。
步骤112:记录社区划分前的社区结构。
本步骤是记录最小信息熵所对应的社区结构。因为信息熵越小,社区结构中的不确定性就越小,即社区结构更稳定。
步骤113:在最终的社区划分结果中,遍历所有节点,然后找出与多个社区链接数相同的节点。
本步骤中,与多个社区的链接数相同的节点示例见图3中的节点A,找出与多个社区链接数相同节点的算法如下:
步骤114:分别计算将链接数相同的点放到不同社区时网络中总的信息熵,输出信息熵最小值所对应的社区结构。
本步骤中计算信息熵的算法可参照步骤109中的CalInformationEntropyAlgorithm。
综上所述,本发明实施例是为基于平均互信息的社区划分质量评价方法及***提供的一种改进社区划分***,该优化社区划分***通过计算每次社区划分的平均互信息值从而选出平均互信息最大值所对应的最优社区划分,然后分别计算最优社区划分前后社区结构的信息熵从而确定最优的社区结构。从而大幅度提高社区划分***的准确性,使得改进社区划分***成为一种新的社区划分***。
以上所述,仅为本发明专利较佳的实施例,但本发明专利的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明专利所公开的范围内,根据本发明专利的技术方案及其发明专利构思加以等同替换或改变,都属于本发明专利的保护范围。
Claims (7)
1.一种基于平均互信息的社区划分质量评价方法,其特征在于,所述方法包括以下步骤:
S1、服务器接收社区划分请求;
S2、采用边介数算法对社区划分请求进行边介数计算,得到边介数计算结果;
S3、根据边介数计算结果,对边介数最大的边进行删除,得到删除边前后的社区划分结果,服务器查看删除边后的社区是否已经发生***,若是则进行步骤S4,若否,则返回步骤S2重新对删除边后的社区根据社区划分请求进行边介数计算;
S4、对步骤S3得到的所有删除边前后的社区划分结果计算平均互信息值,得到互信息结果,服务器查看本次删除边后的互信息结果是否为最大的互信息结果,若是则修改最大互信息结果并且记录最大互信息结果所对应的社区划分前后的社区结构,然后再进行步骤S5,若否,则直接进行步骤S5;
S5、判断当前社区是否还存在边,若是,则返回步骤S2重新对删除边后的社区根据社区划分请求进行边介数计算,若否则进行步骤S6;
S6、判断步骤S4中最大互信息结果对应社区划分前的社区结构的信息熵是否大于最大互信息结果对应社区划分后的社区结构的信息熵,若否,则记录最大互信息结果对应社区划分前的社区结构为社区划分结果,若是,则记录最大互信息结果对应社区划分后的社区结构为社区划分结果;
S7、根据步骤S6中的社区划分结果,利用与多个社区链接数相同的节点进一步优化社区划分结果,得到最终的社区划分结果;
S8、将最终的社区划分结果发送给客户端。
2.根据权利要求1所述的一种基于平均互信息的社区划分质量评价方法,其特征在于,步骤S2中所述采用边介数算法对社区划分请求进行边介数计算的具体操作为:对社区划分请求进行最短路径的计算从而得到边介数的计算结果。
3.根据权利要求1所述的一种基于平均互信息的社区划分质量评价方法,其特征在于,步骤S3的具体过程为:首先对边介数按从大到小排序,删除边介数最大的边,然后将删除前后的结果存入社区划分结果中。
4.根据权利要求1所述的一种基于平均互信息的社区划分质量评价方法,其特征在于,步骤S4中所述删除边前后的社区划分结果的平均互信息值的计算公式为:QI=E[I(Xi;Yj)]=ΣiΣj P(Xi,Yj)I(Xi;Yj),其中Xi表示社区划分前的第i个社区,Yj表示社区划分后的第j个社区,QI为平均互信息值。
5.根据权利要求1所述的一种基于平均互信息的社区划分质量评价方法,其特征在于,步骤S6中所述信息熵值的计算公式为:H(X)=-Σx(P(x=1)log2P(x=1)+P(x=0)log2P(x=0)),其中P(x=1)表示节点被划分到社区x的概率,P(x=0)表示节点未被划分到社区x的概率,H(X)为信息熵值。
6.根据权利要求1所述的一种基于平均互信息的社区划分质量评价方法,其特征在于,步骤S7的具体过程为:首先找到与多个社区相连的节点,然后分别将该节点放入多个相连的社区,分别计算将该节点放到不同社区时网络中总的信息熵,输出总信息熵最小值所对应的社区结构即为最终的社区划分结果。
7.一种用于实现权利要求1-6任一所述的基于平均互信息的社区划分质量评价方法的***,其特征在于,所述***包括客户端和服务器,其中服务器包括以下模块:
请求接收模块:用于接收客户端发送的社区划分请求;
计算边介数模块:用于计算边介数,得到边介数计算结果;
删除边介数模块:用于根据边介数计算结果,对边介数最大的边进行删除,得到删除边介数前后的社区划分结果;
计算平均互信息值模块:用于计算平均互信息值,得到互信息结果;
计算信息熵值模块:用于计算划分前后的信息熵值,得到信息熵值最小的社区划分结果;
优化模块:用于根据社区划分结果,利用与多个社区链接数相同的节点进一步优化社区划分结果,得到最终的社区划分结果;
输出模块:用于将最终的社区划分结果发送至客户端。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810263538.XA CN108470251B (zh) | 2018-03-28 | 2018-03-28 | 基于平均互信息的社区划分质量评价方法及*** |
US17/041,747 US20210125127A1 (en) | 2018-03-28 | 2018-10-25 | Community division quality evaluation method and system based on average mutual information |
PCT/CN2018/111945 WO2019184325A1 (zh) | 2018-03-28 | 2018-10-25 | 基于平均互信息的社区划分质量评价方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810263538.XA CN108470251B (zh) | 2018-03-28 | 2018-03-28 | 基于平均互信息的社区划分质量评价方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108470251A true CN108470251A (zh) | 2018-08-31 |
CN108470251B CN108470251B (zh) | 2021-09-21 |
Family
ID=63264850
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810263538.XA Active CN108470251B (zh) | 2018-03-28 | 2018-03-28 | 基于平均互信息的社区划分质量评价方法及*** |
Country Status (3)
Country | Link |
---|---|
US (1) | US20210125127A1 (zh) |
CN (1) | CN108470251B (zh) |
WO (1) | WO2019184325A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019184325A1 (zh) * | 2018-03-28 | 2019-10-03 | 华南理工大学 | 基于平均互信息的社区划分质量评价方法及*** |
CN111464343A (zh) * | 2020-03-22 | 2020-07-28 | 华南理工大学 | 一种基于平均互信息的最大派系贪心扩展社区发现方法及*** |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113205117B (zh) * | 2021-04-15 | 2023-07-04 | 索信达(北京)数据技术有限公司 | 社区划分方法、装置、计算机设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105915376A (zh) * | 2016-04-13 | 2016-08-31 | 华南理工大学 | 基于p2p点播***的日志信息网络结构化方法及其*** |
CN106971205A (zh) * | 2017-04-06 | 2017-07-21 | 哈尔滨理工大学 | 一种基于k近邻互信息估计的嵌入式动态特征选择方法 |
CN107103053A (zh) * | 2017-04-10 | 2017-08-29 | 南京信息工程大学 | 基于重叠节点的复杂网络社区发现方法 |
CN107784327A (zh) * | 2017-10-27 | 2018-03-09 | 天津理工大学 | 一种基于gn的个性化社区发现方法 |
CN107784598A (zh) * | 2017-11-21 | 2018-03-09 | 山西大学 | 一种网络社区发现方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105389736A (zh) * | 2015-12-17 | 2016-03-09 | 南京信息工程大学 | 基于网络社区划分和少量样本朋友的隐私策略推荐方法 |
CN106599187B (zh) * | 2016-12-14 | 2020-06-16 | 北京航空航天大学 | 一种基于边不稳定度的社区发现***及方法 |
CN108470251B (zh) * | 2018-03-28 | 2021-09-21 | 华南理工大学 | 基于平均互信息的社区划分质量评价方法及*** |
-
2018
- 2018-03-28 CN CN201810263538.XA patent/CN108470251B/zh active Active
- 2018-10-25 US US17/041,747 patent/US20210125127A1/en not_active Abandoned
- 2018-10-25 WO PCT/CN2018/111945 patent/WO2019184325A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105915376A (zh) * | 2016-04-13 | 2016-08-31 | 华南理工大学 | 基于p2p点播***的日志信息网络结构化方法及其*** |
CN106971205A (zh) * | 2017-04-06 | 2017-07-21 | 哈尔滨理工大学 | 一种基于k近邻互信息估计的嵌入式动态特征选择方法 |
CN107103053A (zh) * | 2017-04-10 | 2017-08-29 | 南京信息工程大学 | 基于重叠节点的复杂网络社区发现方法 |
CN107784327A (zh) * | 2017-10-27 | 2018-03-09 | 天津理工大学 | 一种基于gn的个性化社区发现方法 |
CN107784598A (zh) * | 2017-11-21 | 2018-03-09 | 山西大学 | 一种网络社区发现方法 |
Non-Patent Citations (3)
Title |
---|
Y.ZHANG ET AL: "Community detection in networks with node features", 《ELECTRONIC JOURNAL OF STATISTICS》 * |
基于边分类的SVM模型在社区发现中的研究: "王鹏 等", 《长春理工大学学报(自然科学版)》 * |
王刚 等: "基于信息熵的社区发现算法研究", 《计算机科学》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019184325A1 (zh) * | 2018-03-28 | 2019-10-03 | 华南理工大学 | 基于平均互信息的社区划分质量评价方法及*** |
CN111464343A (zh) * | 2020-03-22 | 2020-07-28 | 华南理工大学 | 一种基于平均互信息的最大派系贪心扩展社区发现方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN108470251B (zh) | 2021-09-21 |
US20210125127A1 (en) | 2021-04-29 |
WO2019184325A1 (zh) | 2019-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104102745B (zh) | 基于局部最小边的复杂网络社团挖掘方法 | |
CN108470251A (zh) | 基于平均互信息的社区划分质量评价方法及*** | |
CN108334580A (zh) | 一种结合链接和属性信息的社区发现方法 | |
CN108304380A (zh) | 一种融合学术影响力的学者人名消除歧义的方法 | |
CN105893637A (zh) | 大规模微博异构信息网络中的链接预测方法 | |
CN109921921B (zh) | 一种时变网络中时效稳定社团的检测方法和装置 | |
Liang et al. | Detecting community structure using label propagation with consensus weight in complex network | |
CN106789338B (zh) | 一种在动态大规模社交网络中发现关键人物的方法 | |
CN110162692A (zh) | 用户标签确定方法、装置、计算机设备和存储介质 | |
CN104102699B (zh) | 一种聚簇图集合中的子图检索方法 | |
CN109002524A (zh) | 一种基于论文引用关系的黄金引用作者排序方法 | |
CN103559318B (zh) | 对异质信息网络包含的对象进行排序的方法 | |
CN110442800A (zh) | 一种融合节点属性和图结构的半监督社区发现方法 | |
CN108595624A (zh) | 一种大规模分布式函数依赖发现方法 | |
CN109255433B (zh) | 一种基于相似性的社区检测的方法 | |
Wang et al. | Community detection in dynamic networks using constraint non-negative matrix factorization | |
CN105740907A (zh) | 一种局部社团挖掘方法 | |
CN112579831A (zh) | 基于SimRank全局矩阵平滑收敛的网络社区发现方法、装置及存储介质 | |
CN109492677A (zh) | 基于贝叶斯理论的时变网络链路预测方法 | |
CN106296420A (zh) | 一种社区发现方法 | |
CN109902728A (zh) | 一种基于平均互信息的快速社区发现方法及*** | |
CN110704515B (zh) | 基于MapReduce模型的两阶段在线化采样方法 | |
CN108846543B (zh) | 一种非重叠社区集合质量度量指标的计算方法及装置 | |
CN109960750A (zh) | 一种基于标签传播概率的并行图划分方法 | |
CN114928545B (zh) | 一种基于Spark的大规模流量数据关键节点计算方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |