CN102799625B - 一种挖掘社交网络中话题核心圈的方法及*** - Google Patents
一种挖掘社交网络中话题核心圈的方法及*** Download PDFInfo
- Publication number
- CN102799625B CN102799625B CN201210210349.9A CN201210210349A CN102799625B CN 102799625 B CN102799625 B CN 102799625B CN 201210210349 A CN201210210349 A CN 201210210349A CN 102799625 B CN102799625 B CN 102799625B
- Authority
- CN
- China
- Prior art keywords
- core loop
- node
- topic
- loop
- under
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 230000006855 networking Effects 0.000 title abstract 7
- 238000010586 diagram Methods 0.000 claims abstract description 41
- 238000010276 construction Methods 0.000 claims description 10
- 238000009412 basement excavation Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例适用于社交网络领域,提供了一种挖掘社交网络中话题核心圈的方法及***,所述方法包括:构建社交网络图,所述社交网络图中包含多个相互连接的节点;从所述社交网络图中选择一个节点作为核心圈的第一节点,将与所述第一节点连接最多的第二节点划入所述核心圈,将核心圈外与所述核心圈内节点连接最多的第三节点划入所述核心圈,依此执行,直到核心圈外的第N节点划入所述核心圈,所述N为预先设定的所述核心圈包含的节点数;对所述包含N个节点的核心圈进行话题聚类,获取所述包含N个节点的核心圈内每个节点的关注话题。通过本发明实施例可有效挖掘出社交网络中话题相似、联系紧密的核心圈。
Description
技术领域
本发明属于社交网络技术领域,尤其涉及一种挖掘社交网络中话题核心圈的方法及***。
背景技术
目前互联网上的信息量越来越庞大,信息纷繁复杂,如何对其内容进行分析从而挖掘出人们所需要的内容呢?社交网络挖掘技术可在一定程度上解决这个问题。
现有技术提供了一种基于社区结构的社区挖掘方法,其具体步骤如下:
1)、在一个社交网络中,根据所要挖掘社区的规模范围划定一个搜索区域;其中,搜索区域的左边界L为当前期望挖掘的最大社区的大小,上边界U为所述社交网络中具有最多邻居的节点的邻居节点数,右边界为下边界为β(L-1),所述β表示一个预先设定的比例;
2)、在所述搜索区域内根据节点的邻居节点数做剪枝操作,将邻居节点数小于所要挖掘的社区的紧密度的节点从社交网络中剪除;
3)、在经过剪枝操作的社交网络的剩余节点中选定一个节点,在该节点的邻居节点中搜索大小为|S|-1的社区,找到后将该节点与搜索到的大小为|S|-1的社区形成所要挖掘的社区,加到结果集中,其中所述|S|表示期望挖掘社区的大小;
4)、将所述搜索区域的左边界向左移动,然后在扩大后的搜索区域内重新执行步骤2)和步骤3),直到搜索区域达到所要挖掘社区的规模的最小值。
现有技术虽然可在一定程度上挖掘出人们所需的内容。然而,现有技术无法挖掘出话题相似、联系紧密且影响力大的核心圈。
发明内容
本发明实施例提供一种挖掘社交网络中话题核心圈的方法,以在社交网络中挖掘出话题相似、联系紧密的核心圈。
本发明实施例是这样实现的,一种挖掘社交网络中话题核心圈的方法,所述方法包括:
构建社交网络图,所述社交网络图中包含多个相互连接的节点;
从所述社交网络图中选择一个节点作为核心圈的第一节点,将与所述第一节点连接最多的第二节点划入所述核心圈,将核心圈外与所述核心圈内节点连接最多的第三节点划入所述核心圈,依此执行,直到核心圈外的第N节点划入所述核心圈,所述N为预先设定的所述核心圈包含的节点数;
对所述包含N个节点的核心圈进行话题聚类,获取所述包含N个节点的核心圈内每个节点的关注话题。
本发明实施例还提供了一种挖掘社交网络中话题核心圈的***,所述***包括:
构建单元,用于构建社交网络图,所述社交网络图中包含多个相互连接的节点;
核心圈获取单元,用于从所述构建单元构建的社交网络图中选择一个节点作为核心圈的第一节点,将与所述第一节点连接最多的第二节点划入所述核心圈,将核心圈外与所述核心圈内节点连接最多的第三节点划入所述核心圈,依此执行,直到核心圈外的第N节点划入所述核心圈,所述N为预先设定的所述核心圈包含的节点数;
话题获取单元,用于对所述核心圈获取单元获取的包含N个节点的核心圈进行话题聚类,获取所述包含N个节点的核心圈内每个节点的关注话题。本发明实施例通过将社交网络图中核心圈外与核心圈内节点连接最多的节点划入所述核心圈,由于节点(用户)间连接关系多,说明用户间的关系紧密,而且话题相识的可能性最大。通过对所获取的核心圈进行话题聚类,获取所述核心圈内每个节点的关注话题,考虑了社交网络的话题。根据所述核心圈及关注话题,使得用户可以通过关键词搜索到话题相似、关系紧密的核心圈。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的挖掘社交网络中话题核心圈的方法的实现流程图;
图2是本发明另一实施例提供的挖掘社交网络中话题核心圈的方法的实现流程图;
图3是本发明另一实施例提供的挖掘社交网络中话题核心圈的方法的实现流程图;
图4本发明另一实施例提供的核心圈与辅助社区的关系示例图;
图5是本发明另一实施例提供的挖掘社交网络中话题核心圈的***的组成结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例用以解释本发明,并不用于限定本发明。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
图1示出了本发明一实施例提供的挖掘社交网络中话题核心圈的方法的实现流程的实现流程,该方法过程详述如下:
在步骤S101中,构建社交网络图,所述社交网络图中包含多个相互连接的节点。
优选的是,根据用户之间的合作关系或者关注关系等构建社交网络图。例如:对于学术论文合作关系网络,首先搜集计算机不同研究领域近两年发表的文章,所述研究领域包括:人工智能(AI),数据库(DB),分布式与并行计算(DP),图形、视觉与人机交互(GV)以及网络通信与性能分析(NC)。然后提取每篇文章的作者。根据用户之间的合作关系构建社交网络图,将每个作者当做社交网络图中的一个节点,每两个不同作者合作一篇或多篇文章当做社交网络图中的一条边,由此形成包含多个相互连接节点的社交网络图。
在步骤S102中,从所述社交网络图中随机的选择一个节点作为核心圈的第一节点,将与所述第一节点连接最多的第二节点划入所述核心圈,将核心圈外与所述核心圈内节点连接最多的第三节点划入所述核心圈,依此执行,直到核心圈外的第N节点划入所述核心圈,所述N为预先设定的所述核心圈包含的节点数。
在本实施例中,建立核心圈并设定核心圈的大小(即核心圈包含的节点数)。将该核心圈初始化为空,随机的选择一个节点作为该核心圈内的第一节点,查找与所述第一节点连接最多的第二节点,将查找到的所述第二节点也划入所述核心圈,继续将与所述核心圈内节点(即所述第一节点和第二节点)连接最多的第三节点也划入所述核心圈,依此执行,直到核心圈外的第N节点划入所述核心圈,此时,所述核心圈内的节点数达到了预设的临界值N,则停止节点的划入。由于节点(用户)间连接关系多,说明用户间的关系紧密,而且话题相识的可能性最大,因此通过本实施例可以获取关系紧密、话题相识的核心圈。
需要说明的是,如果与所述核心圈内节点连接最多的第n个节点有多个,则随机的选择其中一个划入所述核心圈,所述n=1,2,…,N。
优选的是,为了获取关系紧密、话题相识且影响力大的核心圈,本实施例在将所述第N节点划入所述核心圈后还包括:
B1、计算所述包含N个节点的核心圈内外节点的所有边的权重和,将核心圈外权重和最高的节点划入该核心圈,将核心圈内权重和最低的节点划出该核心圈;
B2、重复步骤B1,直到重复次数达到预设值(例如5次)或者所述核心圈外节点边的权重和小于或者等于所述核心圈内最低节点边的权重和。
需要说明的是,本实施例中每条边的权重可以设置为相同也可以设置为不同。例如,对于学术论文合作关系网络,可以根据文章所发表的期刊设定权重,对于发表在核心期刊的文章,其合作作者之间的边权重设置较高。
如表一所示,表一是本实施例针对上述学术论文合作关系网络获取的核心圈:
表一
从表一可以看出,表一所获取的五个核心圈是其对应领域内活跃度高(名字出现的频率大于预设值)和/或影响力大(例如教授、院士、知名企业家等)且相互之间联系紧密的代表性人物组成的社交圈。
在步骤S103中,对所述包含N个节点的核心圈进行话题聚类,获取所述包含N个节点的核心圈内每个节点的关注话题。
具体的,可以通过PLSA或LDA聚类算法对所述包含N个节点的核心圈进行话题聚类,获取所述包含N个节点的核心圈内每个节点的关注话题。例如通过PLSA或LDA聚类算法对每个成员所发表的文章进行话题聚类,获取每个成员关注的话题。
又例如,针对表一的核心圈,获取该核心圈内每个成员所发表的文章,对所述文章内容进行预处理,包括去掉停用词、高频词(例如的、地、是等)等。获取预处理后文章中出现的词,建立所述词与成员(ID)之间的映射表,统计每个成员所发表的文章中各个词出现的次数,将出现次数最高的前N个词提取出来,通过分析总结,获得每个成员关注的话题。如某成员文章中出现次数最高的前三个词为“学习”、“算法”、“模型”,则判定该成员关注的话题为“人工智能”。
需要说明的是,核心圈内每个节点关注的话题可能不只一个,每个节点可能同时处于多个核心圈内。
图2示出了本发明另一实施例提供的挖掘社交网络中话题核心圈方法的实现流程,该方法过程详述如下:
在步骤S201中,构建社交网络图,所述社交网络图中包含多个相互连接的节点;
在步骤S202中,从所述社交网络图中随机的选择一个节点作为核心圈的第一节点,将与所述第一节点连接最多的第二节点划入所述核心圈,将核心圈外与所述核心圈内节点连接最多的第三节点划入所述核心圈,依此执行,直到核心圈外的第N节点划入所述核心圈,所述N为预先设定的所述核心圈包含的节点数;
在步骤S203中,对所述包含N个节点的核心圈进行话题聚类,获取所述包含N个节点的核心圈内每个节点的关注话题。
在本实施例中,步骤S201~S203与图1对应实施例中的步骤S101~S 103相同,其具体实施过程详见图1对应实施例中的步骤S101~S103相关描述,在此不再赘述。
在步骤S204中,判断核心圈的个数是否达到预设的临界值,若是则执行步骤S205,否则返回步骤S202继续执行。
在本实施例中,预先设定核心圈的个数,在划分得到的核心圈的个数达到预设的临界值时,停止划分,否则返回步骤S202继续划分。
在本实施例中,每个划分的核心圈内的每个节点都有其对应的关注话题。
在步骤S205中,接收用户输入的关键词,输出与所述关键词对应的话题的核心圈,所述话题为所述核心圈内节点的关注话题。
在本实施例中,可以根据现有的搜索算法或者根据预先建立的关键词与话题的映射关系,获取与所述关键词对应的话题,进而获取关注该话题的节点,输出该节点所在的核心圈。举例说明,用户需要查找“数据库“领域的代表性人物,则输入关键词“数据库”,***根据用户输入的关键词获取与所述关键词对应的话题“数据库”,进而获取关注该话题的节点“Herbert Stoyan”,输出节点“Herbert Stoyan”所在核心圈,即表一中DB对应的核心圈。由于DB对应核心圈内的其他成员都是与“Herbert Stoyan”联系紧密的成员,从而通过“Herbert Stoyan”可以找到与话题“数据库”相似、联系紧密且影响力大的一组核心圈。
通过本发明实施例可有效挖掘出社交网络中话题相似、联系紧密且影响力大的核心圈。
图3示出了本发明另一实施例提供的挖掘社交网络中话题核心圈方法的实现流程,该方法过程详述如下:
在步骤S301中,构建社交网络图,所述社交网络图中包含多个相互连接的节点;
在步骤S302中,从所述社交网络图中随机的选择一个节点作为核心圈的第一节点,将与所述第一节点连接最多的第二节点划入所述核心圈,将核心圈外与所述核心圈内节点连接最多的第三节点划入所述核心圈,依此执行,直到核心圈外的第N节点划入所述核心圈,所述N为预先设定的所述核心圈包含的节点数;
在步骤S303中,对所述包含N个节点的核心圈进行话题聚类,获取所述包含N个节点的核心圈内每个节点的关注话题;
在步骤S304中,判断核心圈的个数是否达到预设的临界值,若是则执行步骤S305,否则返回步骤S302继续执行。
在本实施例中,步骤S301~S304与图2对应实施例中的步骤S201~S204相同,其具体实施过程详见图2对应实施例中的步骤S201~S204相关描述,在此不再赘述。
在步骤S305中,根据所获取的核心圈K1、K2、...、Kn建立对应的辅助社区A1、A2、...、An,令Ri=Ki ∪Ai,i=1,2,...,n,n为核心圈的个数。
在本实施例中,每个核心圈对应一个辅助社区,例如K1对应A1。其中所述辅助社区为对核心圈内话题感兴趣的人群,例如“粉丝团”等。
核心圈与辅助社区的关系图如图4所示,其中D11表示核心圈G1内节点之间的联系,D12表示核心圈G1内节点与辅助社区G2内节点的联系,D22表示辅助社区G2内节点的联系,D21表示辅助社区G2内节点与核心圈G1内节点的联系,D11、D12、D22、D21之间的联系紧密度为D21>D11>D22>D12。
在步骤S306中,在所述核心圈外的节点与Ri中节点的连接数大于其与其他Rj中节点的连接数时,将该节点划入Ai,其中i=1,2,...,n,j=1,2,i-1,i+1,...,n。
在步骤S307中,判断核心圈外的节点是否已全部划入所述辅助社区,若是则执行步骤S308,否则返回步骤S306继续执行。
在步骤S308中,接收用户输入的关键词,输出与所述关键词对应的话题的核心圈以及所述核心圈对应的辅助社区,所述话题为所述核心圈内节点的关注话题。
本发明实施例可以根据所述核心圈,获取对应的辅助社区,即对核心圈内话题感兴趣的人群,通过分析少量的核心圈用户实现对核心圈外大多数用户的划分,挖掘更多有相同兴趣爱好的用户群,提高社交网络划分的效率。
图5示出了本发明另一实施例提供的挖掘社交网络中话题核心圈的***的组成结构,为了便于说明,仅示出了与本发明实施例相关的部分。
该挖掘社交网络中话题核心圈的***可以是运行于各终端设备(例如手机、IPAD等)内的软件单元、硬件单元或者软硬件相结合的单元。
该挖掘社交网络中话题核心圈的***5包括构建单元51、核心圈获取单元52以及话题获取单元53,其具体功能如下:
构建单元51,用于构建社交网络图,所述社交网络图中包含多个相互连接的节点;优选的是,所述构建单元51用于根据用户之间的合作关系或者关注关系构建社交网络图。
核心圈获取单元52,用于从所述构建单元51构建的社交网络图中随机的选择一个节点作为核心圈的第一节点,将与所述第一节点连接最多的第二节点划入所述核心圈,将核心圈外与所述核心圈内节点连接最多的第三节点划入所述核心圈,依此执行,直到核心圈外的第N节点划入所述核心圈,所述N为预先设定的所述核心圈包含的节点数;
话题获取单元53,用于对所述核心圈获取单元52获取的包含N个节点的核心圈进行话题聚类,获取所述包含N个节点的核心圈内每个节点的关注话题。
进一步的,所述核心圈获取单元52还包括:
计算单元521,用于计算所述包含N个节点的核心圈内外节点的所有边的权重和,将核心圈外权重和最高的节点划入该核心圈,将核心圈内权重和最低的节点划出该核心圈;
第一控制单元522,用于在所述计算单元521计算的次数达到预设值或者所述核心圈外节点边的权重和小于或者等于所述核心圈内最低节点边的权重和时,停止所述计算单元521的计算。
进一步的,所述***5还包括:
第二控制单元54,用于判断所述社交网络图中核心圈的个数是否达到预设的临界值时,若是,停止所述核心圈的获取,否则继续获取,直到所述核心圈的个数达到预设的临界值,其中每个核心圈内的每个节点都存在其对应的关注话题。
进一步的,所述***5还包括:
辅助社区建立单元55,用于根据所获取的核心圈K1、K2、...、Kn建立对应的辅助社区A1、A2、...、An,令Ri=Ki ∪Ai,i=1,2,...,n,n为核心圈的个数;
划入单元56,用于在所述核心圈外的节点与Ri中节点的连接数大于其与其他Rj中节点的连接数时,将该节点划入Ai,其中i=1,2,...,n,j=1,2,i-1,i+1,...,n;
第三控制单元57,用于在所述核心圈外的节点全部划入所述辅助社区时,停止所述划入单元56节点的划入。
进一步的,所述***还包括:
输出单元58,用于接收用户输入的关键词,输出与所述关键词对应的话题的核心圈和/或与所述核心圈对应的辅助社区,所述话题为所述核心圈内节点的关注话题。
进一步的,所述构建单元51具体用于,根据用户之间的合作关系或者关注关系构建社交网络图。
本实施例提供的社交网络中话题核心圈的挖掘***可以使用在前述对应的社交网络中话题核心圈的挖掘方法,详情参见上述社交网络中话题核心圈的挖掘方法图1、图2和图3对应实施例的相关描述,在此不再赘述。
本领域普通技术人员可以理解为图3对应实施例所包括的各个单元只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
综上所述,本发明实施例通过获取的核心圈和核心圈内每个节点的关注话题,可方便用户挖掘出社交网络中话题相似、联系紧密且影响力大的核心圈。而且还可以根据所获取的核心圈,获取对应的辅助社区,即对核心圈内话题感兴趣的人群,通过分析少量的核心圈用户实现对核心圈外大多数用户的划分,挖掘更多有相同兴趣爱好的用户群,提高社交网络划分的效率。
本领域普通技术人员还可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以在存储于一计算机可读取存储介质中,所述的存储介质,包括ROM/RAM、磁盘、光盘等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种挖掘社交网络中话题核心圈的方法,其特征在于,所述方法包括:
构建社交网络图,所述社交网络图中包含多个相互连接的节点;
从所述社交网络图中选择一个节点作为核心圈的第一节点,将与所述第一节点连接最多的第二节点划入所述核心圈,将核心圈外与所述核心圈内节点连接最多的第三节点划入所述核心圈,依此执行,直到核心圈外的第N节点划入所述核心圈,所述N为预先设定的所述核心圈包含的节点数;
计算所述包含N个节点的核心圈内外节点的所有边的权重和,将核心圈外权重和最高的节点划入该核心圈,将核心圈内权重和最低的节点划出该核心圈,依此执行,直到计算的次数达到预设值或者所述核心圈外节点边的权重和小于或者等于所述核心圈内最低节点边的权重和;
对所述包含N个节点的核心圈进行话题聚类,获取所述包含N个节点的核心圈内每个节点的关注话题。
2.如权利要求1所述的方法,其特征在于,在所述对所述包含N个节点的核心圈进行话题聚类,获取所述包含N个节点的核心圈内每个节点的关注话题的步骤之后,还包括:
判断所述社交网络图中核心圈的个数是否达到预设的临界值时,若是,停止所述核心圈的获取,否则继续获取,直到所述核心圈的个数达到预设的临界值,其中每个核心圈内的每个节点都存在其对应的关注话题。
3.如权利要求1或2所述的方法,其特征在于,所述方法还包括:
根据所获取的核心圈K1、K2、...、Kn建立对应的辅助社区A1、A2、...、An,令Ri=Ki∪Ai,i=1,2,...,n,n为核心圈的个数;
在所述核心圈外的节点与Ri中节点的连接数大于其与其他Rj中节点的连接数时,将该节点划入Ai,其中i=1,2,...,n,j=1,2,i-1,i+1,...,n,依此执行,直到核心圈外的节点全部划入所述辅助社区。
4.如权利要求1所述的方法,其特征在于,所述方法还包括:
接收用户输入的关键词,输出与所述关键词对应的话题的核心圈和/或与所述核心圈对应的辅助社区,所述话题为所述核心圈内节点的关注话题。
5.如权利要求1所述的方法,其特征在于,所述构建社交网络图包括:
根据用户之间的合作关系或者关注关系构建社交网络图。
6.一种挖掘社交网络中话题核心圈的***,其特征在于,所述***包括:
构建单元,用于构建社交网络图,所述社交网络图中包含多个相互连接的节点;
核心圈获取单元,用于从所述构建单元构建的社交网络图中选择一个节点作为核心圈的第一节点,将与所述第一节点连接最多的第二节点划入所述核心圈,将核心圈外与所述核心圈内节点连接最多的第三节点划入所述核心圈,依此执行,直到核心圈外的第N节点划入所述核心圈,所述N为预先设定的所述核心圈包含的节点数;
所述核心圈获取单元还包括:
计算单元,用于计算所述包含N个节点的核心圈内外节点的所有边的权重和,将核心圈外权重和最高的节点划入该核心圈,将核心圈内权重和最低的节点划出该核心圈;
第一控制单元,用于在所述计算单元计算的次数达到预设值或者所述核心圈外节点边的权重和小于或者等于所述核心圈内最低节点边的权重和时,停止所述计算单元的计算;
话题获取单元,用于对所述核心圈获取单元获取的包含N个节点的核心圈进行话题聚类,获取所述包含N个节点的核心圈内每个节点的关注话题。
7.如权利要求6所述的***,其特征在于,所述***还包括:
第二控制单元,用于判断所述社交网络图中核心圈的个数是否达到预设的临界值时,若是,停止所述核心圈的获取,否则继续获取,直到所述核心圈的个数达到预设的临界值,其中每个核心圈内的每个节点都存在其对应的关注话题。
8.如权利要求6或7所述的***,其特征在于,所述***还包括:
辅助社区建立单元,用于根据所获取的核心圈K1、K2、...、Kn建立对应的辅助社区A1、A2、...、An,令Ri=Ki∪Ai,i=1,2,...,n,n为核心圈的个数;
划入单元,用于在所述核心圈外的节点与Ri中节点的连接数大于其与其他Rj中节点的连接数时,将该节点划入Ai,其中i=1,2,...,n,j=1,2,i-1,i+1,...,n;
第三控制单元,用于在所述核心圈外的节点全部划入所述辅助社区时,停止所述划入单元节点的划入。
9.如权利要求6所述的***,其特征在于,所述***还包括:
输出单元,用于接收用户输入的关键词,输出与所述关键词对应的话题的核心圈和/或与所述核心圈对应的辅助社区,所述话题为所述核心圈内节点的关注话题。
10.如权利要求6所述的***,其特征在于,所述构建单元具体用于,根据用户之间的合作关系或者关注关系构建社交网络图。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210210349.9A CN102799625B (zh) | 2012-06-25 | 2012-06-25 | 一种挖掘社交网络中话题核心圈的方法及*** |
PCT/CN2013/070549 WO2014000435A1 (zh) | 2012-06-25 | 2013-01-16 | 一种挖掘社交网络中话题核心圈的方法及*** |
US14/328,203 US20140324539A1 (en) | 2012-06-25 | 2014-07-10 | Method and system for mining topic core circle in social network |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210210349.9A CN102799625B (zh) | 2012-06-25 | 2012-06-25 | 一种挖掘社交网络中话题核心圈的方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102799625A CN102799625A (zh) | 2012-11-28 |
CN102799625B true CN102799625B (zh) | 2014-12-24 |
Family
ID=47198735
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210210349.9A Expired - Fee Related CN102799625B (zh) | 2012-06-25 | 2012-06-25 | 一种挖掘社交网络中话题核心圈的方法及*** |
Country Status (3)
Country | Link |
---|---|
US (1) | US20140324539A1 (zh) |
CN (1) | CN102799625B (zh) |
WO (1) | WO2014000435A1 (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102799625B (zh) * | 2012-06-25 | 2014-12-24 | 华为技术有限公司 | 一种挖掘社交网络中话题核心圈的方法及*** |
CN103853726B (zh) * | 2012-11-29 | 2018-03-02 | 腾讯科技(深圳)有限公司 | 一种挖掘社区用户的方法及装置 |
CN103744858B (zh) * | 2013-12-11 | 2017-09-22 | 深圳先进技术研究院 | 一种信息推送方法及*** |
CN105095228A (zh) | 2014-04-28 | 2015-11-25 | 华为技术有限公司 | 一种社交消息的监测方法及装置 |
CN104219139B (zh) * | 2014-08-13 | 2017-09-01 | 广州华多网络科技有限公司 | 一种生成好友访问频道列表的方法和装置 |
CN104951531B (zh) * | 2015-06-17 | 2018-10-19 | 深圳大学 | 基于图简化技术的社交网络中用户影响力估算方法及装置 |
CN107369099B (zh) * | 2017-06-28 | 2021-01-22 | 江苏云机汇软件科技有限公司 | 一种面向社交网络的用户行为分析*** |
CN113609345B (zh) * | 2021-09-30 | 2021-12-10 | 腾讯科技(深圳)有限公司 | 目标对象关联方法和装置、计算设备以及存储介质 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101383748B (zh) * | 2008-10-24 | 2011-04-13 | 北京航空航天大学 | 一种复杂网络中的社区划分方法 |
US20100185935A1 (en) * | 2009-01-21 | 2010-07-22 | Nec Laboratories America, Inc. | Systems and methods for community detection |
US9990429B2 (en) * | 2010-05-14 | 2018-06-05 | Microsoft Technology Licensing, Llc | Automated social networking graph mining and visualization |
CN102456064B (zh) * | 2011-04-25 | 2013-04-24 | 中国人民解放军国防科学技术大学 | 在社会网络中实现社区发现的方法 |
US20130006880A1 (en) * | 2011-06-29 | 2013-01-03 | International Business Machines Corporation | Method for finding actionable communities within social networks |
US8949237B2 (en) * | 2012-01-06 | 2015-02-03 | Microsoft Corporation | Detecting overlapping clusters |
CN102799625B (zh) * | 2012-06-25 | 2014-12-24 | 华为技术有限公司 | 一种挖掘社交网络中话题核心圈的方法及*** |
-
2012
- 2012-06-25 CN CN201210210349.9A patent/CN102799625B/zh not_active Expired - Fee Related
-
2013
- 2013-01-16 WO PCT/CN2013/070549 patent/WO2014000435A1/zh active Application Filing
-
2014
- 2014-07-10 US US14/328,203 patent/US20140324539A1/en not_active Abandoned
Non-Patent Citations (3)
Title |
---|
一种基于情感倾向分析的网络团体意见领袖识别算法;肖宇等;《计算机科学》;20120228;第39卷(第2期);第34-37、46页 * |
基于K-means聚类算法的复杂网络社团发现新方法;赵凤霞等;《计算机应用研究》;20090630;第26卷(第6期);第2041-2043、2049页 * |
基于聚类分析的复杂网络中的社团探测;刘婷等;《复杂***与复杂性科学》;20070331;第4卷(第1期);第28-35页 * |
Also Published As
Publication number | Publication date |
---|---|
US20140324539A1 (en) | 2014-10-30 |
WO2014000435A1 (zh) | 2014-01-03 |
CN102799625A (zh) | 2012-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102799625B (zh) | 一种挖掘社交网络中话题核心圈的方法及*** | |
Zhang et al. | An incremental CFS algorithm for clustering large data in industrial internet of things | |
Yao et al. | A fast space-saving algorithm for maximal co-location pattern mining | |
Lin et al. | Mining high utility itemsets in big data | |
Gregori et al. | Parallel k-clique community detection on large-scale networks | |
CN105721279B (zh) | 一种电信网络用户的交往圈挖掘方法及*** | |
CN105138600B (zh) | 基于图结构匹配的社交网络分析方法 | |
CN102571954B (zh) | 基于节点核心影响力的复杂网络聚类方法 | |
Guo et al. | Evolutionary community structure discovery in dynamic weighted networks | |
CN104933624A (zh) | 复杂网络的社团发现方法及社团重要节点发现方法 | |
TWI525460B (zh) | 電子計算裝置、其個人化資訊推薦方法及其電腦程式產品 | |
CN102194149A (zh) | 社区发现方法 | |
Xu et al. | Distributed maximal clique computation and management | |
CN104077723A (zh) | 一种社交网络推荐***及方法 | |
CN107679035A (zh) | 一种信息意图检测方法、装置、设备和存储介质 | |
CN108563715A (zh) | 一种分布式的趋同行为挖掘方法与*** | |
CN104700311B (zh) | 一种社会网络中的邻域跟随社区发现方法 | |
Gamgne Domgue et al. | Community structure extraction in directed network using triads | |
Mota et al. | A compact timed state space approach for the analysis of manufacturing systems: key algorithmic improvements | |
CN110189230B (zh) | 一种动态分区的解析化模型的构建方法 | |
Ling et al. | Fast community detection in large weighted networks using graphx in the cloud | |
Yang et al. | Efficient dense structure mining using mapreduce | |
Zhou et al. | Identifying technology evolution pathways by integrating citation network and text mining | |
CN102110151A (zh) | 出帐***的Petri网模型的分析方法 | |
Fang et al. | Towards network reduction on big data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20141224 |
|
CF01 | Termination of patent right due to non-payment of annual fee |