CN105721279A - 一种电信网络用户的交往圈挖掘方法及*** - Google Patents

一种电信网络用户的交往圈挖掘方法及*** Download PDF

Info

Publication number
CN105721279A
CN105721279A CN201610031592.2A CN201610031592A CN105721279A CN 105721279 A CN105721279 A CN 105721279A CN 201610031592 A CN201610031592 A CN 201610031592A CN 105721279 A CN105721279 A CN 105721279A
Authority
CN
China
Prior art keywords
relationship cycle
user
relationship
cycle
user node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610031592.2A
Other languages
English (en)
Other versions
CN105721279B (zh
Inventor
李红
吴迪
王飞
燕青
林泓旭
刘卉芳
刘文杰
王子锋
柯毅豪
柯东晓
郑元欢
万源沅
邓火平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
China United Network Communications Corp Ltd Guangdong Branch
Original Assignee
Sun Yat Sen University
China United Network Communications Corp Ltd Guangdong Branch
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University, China United Network Communications Corp Ltd Guangdong Branch filed Critical Sun Yat Sen University
Priority to CN201610031592.2A priority Critical patent/CN105721279B/zh
Publication of CN105721279A publication Critical patent/CN105721279A/zh
Application granted granted Critical
Publication of CN105721279B publication Critical patent/CN105721279B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • H04L51/046Interoperability with other network applications or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种电信网络用户的交往圈挖掘方法及***,方法包括:从当前网络拓扑图中选取权重最高的边,将该边的两个用户节点归为一个交往圈;查找构建交往圈内每个用户节点的邻居用户节点集合,计算集合内每个邻居用户节点对于交往圈的归属度,选取归属度最大且大于预定值的邻居用户节点u,将该邻居用户节点u加入到交往圈中,扩张交往圈,当归属度不大于预定值时,停止扩张;将交往圈中的用户节点之间的所有边从所述网络拓扑图中去除,若网络拓扑图中剩余边的数量大于零,则对去除边后的新的网络拓扑图重复上述步骤处理直至网络拓扑图中剩余边为零得到N个交往圈。本发明挖掘确定出的用户交往圈的准确度较高且应用范围广。

Description

一种电信网络用户的交往圈挖掘方法及***
技术领域
本发明涉及社交网络的用户交往圈挖掘领域,特别是一种应用于电信运营商的用户通话网络的电信网络用户的交往圈挖掘方法及***。
背景技术
进入21世纪,随着网络和通信技术的发展,用户之间的社交关系已从现实物理空间延伸到了虚拟的网络空间。通信网络作为人们日常接触最多同时也是最重要的网络,其中包含着海量的用户交互信息。如何使用这些信息从而在用户社交关系领域建立从信息空间中到物理空间的联系已经受到电信运营商的广泛关注。通过挖掘用户交往圈信息,电信运营商可以使用交往圈信息实施定向营销,广告推荐,开辟用户群等。
社交网络作为一种通用的概念广泛存在于各种学科研究之中,例如生物学、管理学等。而用户交往圈作为社交网络中的一部分相似用户的集合或社区,隶属于同一个交往圈的用户往往拥有相似的特征。用户交往圈代表社交网络中的一类拥有较强内部联系以及较弱对外联系的用户集合或社区。针对一个用户进行的研究和分析结果往往适用于交往圈中的其他用户。针对用户交往圈的科学研究是近年来最受关注的研究课题之一。
在社交网络中,研究人员根据社交网络特性将具体的社交网络抽象成图模型。社交网络中的用户对应于图模型中的节点,社交网络中用户之间的社交关系对应于图模型中的边。进一步地,根据图模型中边的有向性,研究人员又进一步地将图模型分为有向图模型和有向图模型。在基于有向图模型的社交网络中,用户之间交互信息具有方向性。因此,在组成一条交互信息的两个用户之间的关系是不对称的。有向图模型常被研究人员用于模拟社交网络中的信息流传播。研究人员可根据有向社交图模型挖掘用户交往圈。与此相对地,在基于无向图模型的社交网络中,用户之间的交互信息不具有方向性。即在无向图模型中,组成一条边的两个点无起点和终点之分。因此,在无向图模型中,隶属于同一条交互记录的两个用户的社交关系是对等的。研究人员也可基于无向图模型挖掘用户交往圈。目前挖掘用户交往圈的现有研究成果主要如下:
现有技术一提出一种基于模块化Modularity增益的社区划分方法。该方法首先将每个节点初始化为单一节点的社团,每个节点根据Modularity增益决定该节点是否与邻居节点所属的社团合并以及与哪个邻居节点所属的节点合并;然后重新构建网络,将上一步的每一个社团合并为一个节点,重复进行以上步骤直到网络结构不再发生变化。该方法对于每个节点,仅能将其划分到唯一的一个社区中,不能划分重叠的社区,导致挖掘出的交往圈的准确度较低。且该方法使用的Modularity增益的计算复杂度较高。
现有技术二提出了一种以节点为中心的交往圈挖掘方法。在该文献中,依据交往圈内部成员之间关系以及交往圈结构,将交往圈分为:Cohesive和2-mode两种类别。针对这两种类别的交往圈,设计出了一种能够同时适用于这两种类别交往圈的交往圈划分方法。在该方法的每次迭代中,方法总是从权重最高的节点出发,依据Modularity增益逐渐扩展交往圈。直至社交圈中所有的节点都隶属于某个交往圈。该方法以节点作为方法设计的出发点,每次方法迭代均从用户节点出发,依据Modularity增益变化动态构建交往圈。该方法的主要缺点在于:方法着重考虑交往圈节点信息,而忽略了同样含有社交信息的边。因此,使用该方法划分出的交往圈与实际情况有较大的出入,也导致挖掘出的交往圈的准确度较低。
现有技术三提出了一种同时使用社交网络中用户节点信息和边信息的方法。文献中所提出的方法从社交网络的网络结构和社交网络的节点信息两个层面设计方法。该文献中,方法使用传统交往圈挖掘方法利用网络结构进行交往圈挖掘,同时结合数据挖掘方法利用社交网络的节点信息对传统交往圈挖掘方法的结果进行修正。该方法只针对无向网络拓扑图进行设计,因此,该方法无法应用于基于有向社交网络的应用中。此外,在结合传统的基于边的交往圈挖掘方法与基于节点信息的数据挖掘方法时,该方法并没有考虑交往圈重叠用户信息。因此,该方法无法应用于挖掘可重叠的交往圈,应用范围有限。
现有技术四提出了BigClam方法,该方法由斯坦福大学研究并提出,利用非负矩阵分解方法,用户能在网络拓扑图、用户交往圈之间自由切换。该方法非常适用于无向带权重拓扑图及可重叠圈子的划分。但是BigClam方法实现复杂,而且需要预先给定交往圈数量K,或者通过预处理去计算近似的K,这大大限制了方法的应用场景,在很多场景下,用户很难提前知道交往圈的数量,且通过实验分析,该方法在节点数量达到十万级别时存在性能瓶颈,限制了该方法在大规模以及超大规模社交网络中的应用。
发明内容
本发明的目的是提供一种电信网络用户的交往圈挖掘方法及***,相比现有技术,其挖掘确定出的用户交往圈的准确度高。
本发明进一步的目的是提供一种电信网络用户的交往圈挖掘方法及***,相比现有技术,其能够应用于大规模或超大规模社交网络中,应用范围广。
为了实现上述目的,本发明采用如下技术方案:
本发明实施例提供一种电信网络用户的交往圈挖掘方法,包括如下步骤:
S1、获取用户在电信通话网络中的交互行为数据,根据所述交互行为数据生成用户联系的网络拓扑图,所述网络拓扑图包含多个用户节点和相互连接的若干条边;
S2、从当前所述网络拓扑图中选取权重最高的边,将该边的两个用户节点归为一个交往圈;
S3、查找构建所述交往圈内每个用户节点的邻居用户节点集合,计算邻居用户节点集合内每个邻居用户节点对于所述交往圈的归属度;
S4,判断归属度最大的邻居用户节点u的归属度是否大于预设值,如果是,则将该邻居用户节点u加入到所述交往圈中,扩张所述交往圈,返回S3;否则停止交往圈的扩张,执行S5;
S5、将停止扩张后的交往圈中的用户节点之间的所有边从所述网络拓扑图中去除,若所述网络拓扑图中剩余边的数量大于零,则对去除边后的新的网络拓扑图重复上述步骤S2-S4的处理,直至网络拓扑图中剩余边为零,得到N个交往圈;其中N为自然数。
本发明的有益效果是:本发明通过获取用户在电信通话网络中的交互行为数据,根据所述交互行为数据生成用户联系的网络拓扑图,所述网络拓扑图包含多个用户节点和相互连接的若干条边;然后从当前所述网络拓扑图中选取权重最高的边,将该边的两个用户节点归为一个交往圈,之后查找构建所述交往圈内每个用户节点的邻居用户节点集合,计算集合内每个邻居用户节点对于交往圈的归属度,选取归属度最大且大于预定值的邻居用户节点u,将该邻居用户节点u加入到所述交往圈中,扩张所述交往圈,当归属度最大的邻居用户节点的归属度不大于所述预定值时,停止交往圈的扩张;将停止扩张后的交往圈中的用户节点之间的所有边从所述网络拓扑图中去除,若所述网络拓扑图中剩余边的数量大于零,则对去除边后的新的网络拓扑图执行上述处理直至所述网络拓扑图中剩余边的数量为零时结束,共得到N个交往圈。本发明基于归属度指标划分交往圈,相比现有技术,其挖掘确定出的用户交往圈的准确度高,能够较接近实际情况。
在上述技术方案的基础上,本发明还可以做如下改进。
所述步骤S1之后还包括以下步骤:
S101、使用metis切割方法将所述网络拓扑图切割成若干个子图,然后并行地对每个子图进行步骤S2-S5的处理。
具体的,用户节点u对于交往圈C的归属度B(u,C)定义为:
B ( u , C ) = Σ v ∈ C w u v k u ; 其中, k u = Σ v ∈ N u w u v ; Nu为邻居用户节点集合,wuv表示用户节点u和v之间的边的权重;
所述预定值为表示交往圈C内的所有割边权重之和与交往圈C内用户节点间的所有的边的权重之和wc的比值;其中,cut(C,G\C)表示交往圈C中的所有割边的权重之和。
步骤S5之后还包括:对N个交往圈中的每个交往圈,分别获取每个交往圈内部每个用户节点对应的用户的个人信息,根据每个用户的个人信息判断该交往圈内部成员之间的关系进而得到该交往圈的类别,向用户推荐其所属的不同类别的交往圈。
该方法还还包括对每个用户的交往圈按照预定条件进行优先级排序,推荐输出优先级最高的交往圈,或推荐输出优先级排在前M位的交往圈,M为自然数。
进一步的,所述对每个用户的交往圈按照预定条件进行优先级排序具体为:对于一个用户所属的每一个交往圈,分别计算该用户在每一个交往圈中的关系权重,将用户关系权重最大的用户所属的至少一个交往圈归为一类,此类交往圈优先级高,将用户关系权重不是最大的用户所属的其余的交往圈归为一类,此类交往圈优先级低;在上述分类后,在每一类交往圈中,若一个用户在一个交往圈中的邻居数量越多,则优先级越高,或者,若一个用户在一个交往圈中拥有的边的权重和越大,则优先级越高。
该方法还包括交往圈过滤步骤,具体为:获取一个用户所属的所有交往圈,计算属于该用户的每个交往圈的成员的相似性,如果两个交往圈的成员的相似性大于预先设定的阈值,则过滤掉推荐次序中优先级最低的交往圈,保留推荐次序中优先级最高的交往圈。
所述交往圈的类别包括工作圈、朋友圈和亲人圈。
所述边的权重表示两个用户节点对应的用户之间通信的频度和/或时长。
本发明实施例还提供一种电信网络用户的交往圈挖掘***,包括:
拓扑图建立模块,用于获取用户在电信通话网络中的交互行为数据,根据所述交互行为数据生成用户联系的网络拓扑图,所述网络拓扑图包含多个用户节点和相互连接的若干条边;
交往圈初建模块,用于从当前所述网络拓扑图中选取权重最高的边,将该边的两个用户节点归为一个交往圈;
归属度计算模块,用于查找构建所述交往圈内每个用户节点的邻居用户节点集合,计算邻居用户节点集合内每个邻居用户节点对于所述交往圈的归属度;
交往圈扩张模块,用于判断归属度最大的邻居用户节点u的归属度是否大于预设值,如果是,则将该邻居用户节点u加入到所述交往圈中,扩张所述交往圈,之后返回所述归属度计算模块计算并由所述交往圈扩张模块继续扩张;否则停止交往圈的扩张;
交往圈建立模块,用于将停止扩张后的交往圈中的用户节点之间的所有边从所述网络拓扑图中去除,若所述网络拓扑图中剩余边的数量大于零,则对去除边后的新的网络拓扑图依次重复上述交往圈初建模块、归属度计算模块和交往圈扩张模块的处理,直至网络拓扑图中剩余边为零,得到N个交往圈;其中N为自然数。
本发明的有益效果是:本发明通过获取用户在电信通话网络中的交互行为数据,根据所述交互行为数据生成用户联系的网络拓扑图,所述网络拓扑图包含多个用户节点和相互连接的若干条边;然后从当前所述网络拓扑图中选取权重最高的边,将该边的两个用户节点归为一个交往圈,之后查找构建所述交往圈内每个用户节点的邻居用户节点集合,计算集合内每个邻居用户节点对于交往圈的归属度,选取归属度最大且大于预定值的邻居用户节点u,将该邻居用户节点u加入到所述交往圈中,扩张所述交往圈,当归属度最大的邻居用户节点的归属度不大于所述预定值时,停止交往圈的扩张;将停止扩张后的交往圈中的用户节点之间的所有边从所述网络拓扑图中去除,若所述网络拓扑图中剩余边的数量大于零,则对去除边后的新的网络拓扑图执行上述处理直至所述网络拓扑图中剩余边的数量为零时结束,共得到N个交往圈。本发明基于归属度指标划分交往圈,相比现有技术,其挖掘确定出的用户交往圈的准确度高,能够较接近实际情况。为了降低交往圈挖掘划分时长,本发明开创性地使用metis切割方法,先将完整的网络拓扑图切割成若干个子图,然后并行地对这些小的子图进行交往圈划分,处理时长大大降低,处理速度快,能够应用于大规模或超大规模电信通话网络中,应用范围广。
附图说明
图1是本发明电信网络用户的交往圈挖掘方法流程图;
图2是本发明电信网络用户的交往圈挖掘***示意图。
具体实施方式
下面结合附图和实施方式对本发明作进一步的说明。
如图1所示,本发明实施例提供一种电信网络用户的交往圈挖掘方法,包括如下步骤:
S1、获取用户在电信通话网络中的交互行为数据,根据所述交互行为数据生成用户联系的网络拓扑图,所述网络拓扑图包含多个用户节点和相互连接的若干条边;本实施例中所述交互行为数据为电话通信记录数据。
S2、从当前所述网络拓扑图中选取权重最高的边,将该边的两个用户节点归为一个交往圈;
S3、查找构建所述交往圈内每个用户节点的邻居用户节点集合,计算邻居用户节点集合内每个邻居用户节点对于所述交往圈的归属度;
S4,判断归属度最大的邻居用户节点u的归属度是否大于预设值,如果是,则将该邻居用户节点u加入到所述交往圈中,扩张所述交往圈,返回S3;否则停止交往圈的扩张,执行S5;
S5、将停止扩张后的交往圈中的用户节点之间的所有边从所述网络拓扑图中去除,若所述网络拓扑图中剩余边的数量大于零,则对去除边后的新的网络拓扑图重复上述步骤S2-S4的处理,直至网络拓扑图中剩余边为零,得到N个交往圈;其中N为自然数。
本发明通过获取用户在电信通话网络中的交互行为数据,根据所述交互行为数据生成用户联系的网络拓扑图,所述网络拓扑图包含多个用户节点和相互连接的若干条边;然后从当前所述网络拓扑图中选取权重最高的边,将该边的两个用户节点归为一个交往圈,之后查找构建所述交往圈内每个用户节点的邻居用户节点集合,计算集合内每个邻居用户节点对于交往圈的归属度,选取归属度最大且大于预定值的邻居用户节点u,将该邻居用户节点u加入到所述交往圈中,扩张所述交往圈,当归属度最大的邻居用户节点的归属度不大于所述预定值时,停止交往圈的扩张;将停止扩张后的交往圈中的用户节点之间的所有边从所述网络拓扑图中去除,若所述网络拓扑图中剩余边的数量大于零,则对去除边后的新的网络拓扑图执行上述处理直至所述网络拓扑图中剩余边的数量为零时结束,共得到N个交往圈。本发明基于归属度指标划分交往圈,相比现有技术,其挖掘确定出的用户交往圈的准确度高,能够较接近实际情况。
具体的,在一个实施例中,所述步骤S1之后还包括以下步骤:S101、使用metis切割方法将所述网络拓扑图切割成若干个子图,然后并行地对每个子图进行步骤S2-S5的处理。本发明开创性地使用metis切割方法,先将完整的网络拓扑图切割成若干个子图,然后并行地对这些小的子图进行交往圈划分,处理时长大大降低,处理速度快,能够应用于大规模或超大规模电信通话网络中,应用范围广。
具体的,用户节点u对于交往圈C的归属度B(u,C)定义为:
B ( u , C ) = Σ v ∈ C w u v k u ; 其中, k u = Σ v ∈ N u w u v ; Nu为邻居用户节点集合,wuv表示用户节点u和v之间的边的权重;归属度公式中的上部分(即分子)表示:节点u中所有与社交圈C内节点有联系的边,即边的一端是u,另一端是社交圈C中的某个节点。Nu表示u的所有邻居节点集合。分母ku公式等式右边部分中的下标v属于Nu表示,v是u的邻居节点。ku的物理意义是:u的所有边的权重和。所述预定值为 表示交往圈C内的所有割边权重之和与交往圈C内用户节点间的所有的边的权重之和wc的比值;其中,cut(C,G\C)表示交往圈C中的所有割边的权重之和。所述边的权重表示两个用户节点对应的用户之间通信的频度和/或时长。本发明基于归属度指标划分交往圈,相比现有技术,其挖掘确定出的用户交往圈的准确度高,能够较接近实际情况。
在一个示例中,步骤S4之后还包括:对所述N个交往圈中的每个交往圈,分别获取每个交往圈内部每个用户节点对应的用户的个人信息,根据每个用户的个人信息判断该交往圈内部成员之间的关系进而得到该交往圈的类别,向用户推荐其所属的不同类别的交往圈。所述交往圈的类别包括工作圈、朋友圈和亲人圈等等。通过分类可以向用户推荐不同类别的交往圈,以便用户根据需要获取。
该方法还还包括对每个用户的交往圈按照预定条件进行优先级排序,推荐输出优先级最高的交往圈,或推荐输出优先级排在前M位的交往圈,M为自然数。
所述对每个用户的交往圈按照预定条件进行优先级排序具体为:对于一个用户所属的每一个交往圈,分别计算该用户在每一个交往圈中的关系权重,将用户关系权重最大的用户所属的至少一个交往圈归为一类,此类交往圈优先级高,将用户关系权重不是最大的用户所属的其余的交往圈归为一类,此类交往圈优先级低。例如一个用户有3个交往圈,该用户在其中2个交往圈中的关系权重最大(可相等也可不相等),则这2个交往圈归为一类,优先级高,在另外一个交往圈中的关系权重不是最大的,则该一个交往圈归为一类,优先级低。在上述分类后,在每一类交往圈中,若一个用户在一个交往圈中的邻居数量越多,则优先级越高,或者,若一个用户在一个交往圈中拥有的边的权重和越大,则优先级越高。这样在上述分类后,进一步在每类交往圈中再分出优先级,便于全面准确判断交往圈优先级。
该方法还包括交往圈过滤步骤,具体为:获取一个用户所属的所有交往圈,计算属于该用户的每个交往圈的成员的相似性,如果两个交往圈的成员的相似性大于预先设定的阈值,则过滤掉推荐次序中优先级最低的交往圈,保留推荐次序中优先级最高的交往圈。
下面具体示例具体说明本发明。
首先说明一些概念和定义,在对社交网络进行建模的时候,图模型中节点之间边的权重是图模型的重要参数之一。针对于不同的应用场景,研究人员采用不同的方式定义边权重。在线上社交网络(例如新浪微博)的建模中,用户之间相互关注,个人主页浏览记录等数据是定义节点权重的重要指标。而在本发明中是基于电信运营商通话网络建模,用户之间的通话频率,通话时长,通话记录发生的时段等因素定义用户节点之间边的权重的重要指标。
在社交网络中,用户之间具有复杂的社交关系。多个交往圈之间可能具有多个相同的成员用户,即,某些用户可能多次出现在不同的交往圈中。交往圈之间的重叠性是交往圈的重要特性之一。此类拥有重叠成员用户的交往圈在广告推销应用中具有极高的价值。广告推送方通过向同时隶属于多个交往圈的用户推送广告,即能达到降低成本同时广泛传播广告的效果。
用户交往圈是由一群用户组成的社交单位或集合。属于同一个交往圈的用户往往拥有相似的价值观,或者处于同一个地理位置。此外,交往圈内部成员之间往往保持着较强的社交联系。通常普通人具有的不同类别的交往圈为亲友圈和工作圈。亲友圈是用户交往圈中的一个类别。亲友圈主要由家庭成员,亲密朋友等组成。亲友圈具有如下特点:成员用户之间往往拥有血缘关系;用户拥有较为相似的价值观;用户之间相互影响力较强;用户间社交活动往往发生在非工作时段。工作圈是用户交往圈中的一个类别。工作圈主要由具有工作关系的用户组成。工作圈具有如下特点:用户往往隶属于同一个公司,或者多个有合作关系的公司;用户之间呈现出一定的等级差别;用户影响力不对称;社交活动往往发生在工作时段。
本发明通过分析用户在通话网络中的交互行为(如通话频度、时长、所处时间段),划分出交往圈;然后结合用户的社交属性,对用户所属交往圈进行分类;最后对每个用户进行交往圈推荐。在这过程中需要解决的技术问题是挖掘确定出的交往圈的准确度要高的问题,以及数据规模的问题,即,可扩展性的问题。对于交往圈的准确度问题,本发明使用了归属度客观指标来具体实现,保证了交往圈划分的准确度可靠性。对于可扩展性方面,联通用户通信网络的数据规模达到亿级,现有的解决方案中,没有能够在可容忍时间内(例如1天)得到结果的方法。为了降低交往圈挖掘划分时长,本发明开创性地使用metis切割方法,先将完整的网络拓扑图切割成若干个子图,然后并行地对这些小的子图进行交往圈划分,处理时长大大降低,处理速度快,能够应用于大规模或超大规模电信通话网络中,应用范围广。
下面对本发明方法流程分别作出说明:
一、交往圈划分,基本定义如下:G=(V,E)表示从通话和短信数据抽象生成的整个用户联系网络***模型图,即网络拓扑图,包括多个用户节点和节点之间的若干条边,V为用户节点集合,E为边的集合,简称边集,wuv表示用户节点u和v之间的边的权重,该权重可以通话时长、通话频率等表征用户节点u和v之间的关系,权重越大,属于一个交往圈的可能性越大。C={C1,C2,C3,---}表示交往圈的集合,其中Ci∈C表示其中一个交往圈。对于用户节点u,定义节点邻居集合Nu以及节点度Nu表示用户u的邻居节点集合,对于一个交往圈C以及一个用户节点u,定义用户节点u对于交往圈C的归属度B(u,C),其表征该用户节点属于交往圈C的概率,归属度越大说明归属于交往圈C的概率越大;对于一个交往圈C,定义导率cut(C,G\C)表示交往圈C内的所有割边的权重之和,即,导率等于交往圈内所有割边权重之和与交往圈内用户节点的所有边(包含割边)的权重之和的比值。
交往圈划分方法流程描述如下:
1.从当前图中选取权重最高的边,将该边的两个用户节点归为交往圈C,计算交往圈C的导率Φ(C)。
2.查找交往圈C的邻居用户节点集合Nc。Nc表示交往圈C的邻居节点集合。
3.从邻居用户节点集合Nc中选取归属度B(u,C)最大的用户节点u,若则将该用户节点u加入到交往圈C中,构造新交往圈,以新交往圈代替C,转到2继续扩张该交往圈;否则,交往圈C不再扩张,转到4。
4.将交往圈C中的所有边,从边集E中去除形成新的网络拓扑图,若边集大小不为0,即边集中剩余边的数量不为零,转到1对新的网络拓扑图继续依次执行上述处理,直至网络拓扑图中剩余边为零(即边集为零)得到N个交往圈;若边集大小为0则结束。
二、交往圈分类:为了更加深入地探究交往圈的特性,本发明把交往圈分为两大类:亲友圈和工作圈。亲友圈和工作圈分别具有如下不同的特性:首先,亲友圈中的成员大多具有血缘关系或者成员之间拥有较亲密的私人关系。而工作圈中的成员大多隶属于同一个公司或者多个具有合作关系的公司,成员之间多属于同事关系或工作中的合作关系。其次,亲友圈中成员之间的社交行为多数发生于非工作时段。反之,工作圈中成员之间的社交行为多数发生于工作时段。最后,亲友圈中成员之间的相互影响力普遍大于工作圈中成员之间的相互影响力。交往圈分类方法以交往圈成员个人信息为原始数据判断交往圈内部成员之间的关系,通过成员间关系推断交往圈类别。该方法流程描述如下:
1.从划分方法部分划分好的交往圈中依次取出未判断类别的交往圈c;
2.获取交往圈c内部每个成员即用户节点u对应的用户的个人信息;
3.根据成员的个人信息判断交往圈c内部成员之间的关系;
4.根据交往圈c成员之间的关系得到交往圈c类别;本实施例中是以用户的通话记录中的通话时段来判断交往圈类别的,比如通话在工作时段(如周一至周五早9点至晚5点)则判断为工作圈,在非工作时段(如周末)则判断为亲友圈。当然也可以根据其他信息来判断,对此不作限制,本领域技术人员可根据具体情况设定。
5.如果还有未判断类别的交往圈,则返回1继续执行类别判断。否则结束判别。
三、交往圈推荐方法:实验结果显示,一部分用户隶属于超过30个交往圈。为了提供更细粒度的、更准确的交往圈数据,本发明对每个用户的交往圈按照一定的指标进行排序,优先输出优先级别高的圈子(即交往圈),同时推荐优先级排在前N位的交往圈。该方法流程描述如下:
对于每一个用户u所属的每一个圈子c,本发明采用如下标准进行推荐:
1.优先推荐用户u作为中心用户的圈子,即在一个圈子中该用户的关系权重最大;如一个用户对应所属于多个圈子,只要该用户在一个圈子中关系权重最大,那么把这些该用户关系权重最大的圈子归类为优先级高的圈子,其他圈子归类为优先级低的圈子。关系权重以用户节点对应的用户间的通话次数和时长决定,次数越多,时长越长则权重越大。
2.其次根据用户u在圈子c中的邻居数量进行推荐。邻居数量越多,则推荐优先级越高;
3.最后依据用户u在圈子c中拥有的边的权重和进行推荐。权重和越大,则推荐优先级越高。边的权重以该边两端的用户节点及用户间的通话次数和时长决定,次数越多,时长越长则权重越大。
为了能快速得到某个用户经过排序后的圈子列表,本发明在数据库中存储排好序的该用户所属交往圈的id,这样能方便用户通过输入用户名便得到排好序的交往圈,而不用每次运行交往圈推荐方法,方便用户根据需要获取。
为了验证推荐方法的有效性,本发明在真实的大规模数据集上执行圈子推荐方法,验证方法推荐结果。通过人工的进一步检验,验证了圈子推荐方法的有效性。
四、交往圈过滤方法:实验结果显示,交往圈划分方法得到的交往圈中很多具有相似的成员。这些相似的交往圈不仅仅影响交往圈推荐方法的推荐结果,还占用大量的存储空间造成不必要的浪费。为此,本发明进一步包括交往圈过滤方法。交往圈过滤方法以用户为中心,针对每一个用户进行过滤操作。具体描述如下:
1.从社交网络中的获取一个未处理的用户u,取得该用户所属的所有交往圈;
2.计算属于用户u的交往圈的成员的相似性,如果两个交往圈的相似性大于预先设定的阈值,则跳转到3。否则回到1;此处相似性可以根据统计计算两个交往圈中重复的用户节点的数量来判断,如重复的用户节点数量大于阈值则判断为相似;
3.根据交往圈推荐方法,过滤掉推荐次序中优先级低的交往圈,保留推荐次序中优先级高的交往圈;
4.如果社交网络中还有未被处理的用户,则跳转到1,否则跳转到结束。
本发明通过获取用户在电信通话网络中的交互行为数据,根据所述交互行为数据生成用户联系的网络拓扑图,所述网络拓扑图包含多个用户节点和相互连接的若干条边;然后从当前所述网络拓扑图中选取权重最高的边,将该边的两个用户节点归为一个交往圈,之后查找构建所述交往圈内每个用户节点的邻居用户节点集合,计算集合内每个邻居用户节点对于交往圈的归属度,选取归属度最大且大于预定值的邻居用户节点u,将该邻居用户节点u加入到所述交往圈中,扩张所述交往圈,当归属度最大的邻居用户节点的归属度不大于所述预定值时,停止交往圈的扩张;将停止扩张后的交往圈中的用户节点之间的所有边从所述网络拓扑图中去除,若所述网络拓扑图中剩余边的数量大于零,则对去除边后的网络拓扑图执行上述处理得到另一个交往圈,依次类推直至所述网络拓扑图中剩余边的数量为零时结束,共得到N个交往圈。本发明基于归属度指标划分交往圈,相比现有技术,其挖掘确定出的用户交往圈的准确度高,能够较接近实际情况。为了降低交往圈挖掘划分时长,本发明开创性地使用metis切割方法,先将完整的网络拓扑图切割成若干个子图,然后并行地对这些小的子图进行交往圈划分,处理时长大大降低,处理速度快,能够应用于大规模或超大规模电信通话网络中,应用范围广。
基于同一构思,如图2所示,本发明实施例还提供一种电信网络用户的交往圈挖掘***,包括:
拓扑图建立模块,用于获取用户在电信通话网络中的交互行为数据,根据所述交互行为数据生成用户联系的网络拓扑图,所述网络拓扑图包含多个用户节点和相互连接的若干条边;
交往圈初建模块,用于从当前所述网络拓扑图中选取权重最高的边,将该边的两个用户节点归为一个交往圈;
归属度计算模块,用于查找构建所述交往圈内每个用户节点的邻居用户节点集合,计算邻居用户节点集合内每个邻居用户节点对于所述交往圈的归属度;
交往圈扩张模块,用于判断归属度最大的邻居用户节点u的归属度是否大于预设值,如果是,则将该邻居用户节点u加入到所述交往圈中,扩张所述交往圈,之后返回所述归属度计算模块计算并由所述交往圈扩张模块继续扩张;否则停止交往圈的扩张;
交往圈建立模块,用于将停止扩张后的交往圈中的用户节点之间的所有边从所述网络拓扑图中去除,若所述网络拓扑图中剩余边的数量大于零,则对去除边后的新的网络拓扑图依次重复上述交往圈初建模块、归属度计算模块和交往圈扩张模块的处理,直至网络拓扑图中剩余边为零,得到N个交往圈;其中N为自然数。
本发明的有益效果是:本发明通过获取用户在电信通话网络中的交互行为数据,根据所述交互行为数据生成用户联系的网络拓扑图,所述网络拓扑图包含多个用户节点和相互连接的若干条边;然后从当前所述网络拓扑图中选取权重最高的边,将该边的两个用户节点归为一个交往圈,之后查找构建所述交往圈内每个用户节点的邻居用户节点集合,计算集合内每个邻居用户节点对于交往圈的归属度,选取归属度最大且大于预定值的邻居用户节点u,将该邻居用户节点u加入到所述交往圈中,扩张所述交往圈,当归属度最大的邻居用户节点的归属度不大于所述预定值时,停止交往圈的扩张;将停止扩张后的交往圈中的用户节点之间的所有边从所述网络拓扑图中去除,若所述网络拓扑图中剩余边的数量大于零,则对去除边后的新的网络拓扑图执行上述处理直至所述网络拓扑图中剩余边的数量为零时结束,共得到N个交往圈。本发明基于归属度指标划分交往圈,相比现有技术,其挖掘确定出的用户交往圈的准确度高,能够较接近实际情况。
具体的,在一个实施例中,所述拓扑图建立模块和交往圈初建模块之间还连接图切割处理模块(图未示),用于使用metis切割方法将所述网络拓扑图切割成若干个子图,然后交往圈初建模块、归属度计算模块和交往圈扩张模块依次并行地对每个子图进行处理。本发明开创性地使用metis切割方法,先将完整的网络拓扑图切割成若干个子图,然后并行地对这些小的子图进行交往圈划分,处理时长大大降低,处理速度快,能够应用于大规模或超大规模电信通话网络中,应用范围广。
具体的,用户节点u对于交往圈C的归属度B(u,C)定义为: B ( u , C ) = Σ v ∈ C w u v k u ; 其中, k u = Σ v ∈ N u w u v ; Nu为邻居用户节点集合,wuv表示用户节点u和v之间的边的权重;归属度公式中的上部分(即分子)表示:节点u中所有与社交圈C内节点有联系的边,即边的一端是u,另一端是社交圈C中的某个节点。Nu表示u的所有邻居节点集合。分母ku公式等式右边部分中的下标v属于Nu表示,v是u的邻居节点。ku的物理意义是:u的所有边的权重和。所述预定值为 表示交往圈C内的所有割边权重之和与交往圈C内用户节点间的所有的边的权重之和wc的比值;其中,cut(C,G\C)表示交往圈C中的所有割边的权重之和。所述边的权重表示两个用户节点对应的用户之间通信的频度和/或时长。本发明基于归属度指标划分交往圈,相比现有技术,其挖掘确定出的用户交往圈的准确度高,能够较接近实际情况。
在一个示例中,还包括交往圈推荐模块,与所述交往圈建立模块连接(图未示),用于对所述N个交往圈中的每个交往圈,分别获取每个交往圈内部每个用户节点对应的用户的个人信息,根据每个用户的个人信息判断该交往圈内部成员之间的关系进而得到该交往圈的类别,向用户推荐其所属的不同类别的交往圈。所述交往圈的类别包括工作圈、朋友圈和亲人圈等等。通过分类可以向用户推荐不同类别的交往圈,以便用户根据需要获取。
该***还还包括交往圈推荐子模块,与所述交往圈推荐模块连接,用于对每个用户的交往圈按照预定条件进行优先级排序,推荐输出优先级最高的交往圈,或推荐输出优先级排在前M位的交往圈,M为自然数。
所述对每个用户的交往圈按照预定条件进行优先级排序具体为:对于一个用户所属的每一个交往圈,分别计算该用户在每一个交往圈中的关系权重,将用户关系权重最大的用户所属的至少一个交往圈归为一类,此类交往圈优先级高,将用户关系权重不是最大的用户所属的其余的交往圈归为一类,此类交往圈优先级低。例如一个用户有3个交往圈,该用户在其中2个交往圈中的关系权重最大(可相等也可不相等),则这2个交往圈归为一类,优先级高,在另外一个交往圈中的关系权重不是最大的,则该一个交往圈归为一类,优先级低。在上述分类后,在每一类交往圈中,若一个用户在一个交往圈中的邻居数量越多,则优先级越高,或者,若一个用户在一个交往圈中拥有的边的权重和越大,则优先级越高。这样在上述分类后,进一步在每类交往圈中再分出优先级,便于全面准确判断交往圈优先级。
该***还包括交往圈过滤模块,与所述交往圈推荐模块或交往圈推荐子模块连接(图未示),用于获取一个用户所属的所有交往圈,计算属于该用户的每个交往圈的成员的相似性,如果两个交往圈的成员的相似性大于预先设定的阈值,则过滤掉推荐次序中优先级最低的交往圈,保留推荐次序中优先级最高的交往圈。交往圈划分得到的交往圈中很多具有相似的成员。这些相似的交往圈不仅仅影响交往圈的推荐结果,还占用大量的存储空间造成不必要的浪费。为此,本发明进一步包括交往圈过滤模块,提高交往圈的推荐结果精度,减少存储空间占用,提高***效率。需要说明的是,该***实施例与上述方法实施例相对应,具体可参看前述方法实施例部分的全部内容以及对应的详细描述,此处不再详述。
本发明通过获取用户在电信通话网络中的交互行为数据,根据所述交互行为数据生成用户联系的网络拓扑图,所述网络拓扑图包含多个用户节点和相互连接的若干条边;然后从当前所述网络拓扑图中选取权重最高的边,将该边的两个用户节点归为一个交往圈,之后查找构建所述交往圈内每个用户节点的邻居用户节点集合,计算集合内每个邻居用户节点对于交往圈的归属度,选取归属度最大且大于预定值的邻居用户节点u,将该邻居用户节点u加入到所述交往圈中,扩张所述交往圈,当归属度最大的邻居用户节点的归属度不大于所述预定值时,停止交往圈的扩张;将停止扩张后的交往圈中的用户节点之间的所有边从所述网络拓扑图中去除,若所述网络拓扑图中剩余边的数量大于零,则对去除边后的新的网络拓扑图执行上述处理直至所述网络拓扑图中剩余边的数量为零时结束,共得到N个交往圈。本发明基于归属度指标划分交往圈,相比现有技术,其挖掘确定出的用户交往圈的准确度高,能够较接近实际情况。为了降低交往圈挖掘划分时长,本发明开创性地使用metis切割方法,先将完整的网络拓扑图切割成若干个子图,然后并行地对这些小的子图进行交往圈划分,处理时长大大降低,处理速度快,能够应用于大规模或超大规模电信通话网络中,应用范围广。
以上对本发明进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述。以上实施例的说明只是用于帮助理解本发明的核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种电信网络用户的交往圈挖掘方法,其特征在于,包括以下步骤:
S1、获取用户在电信通话网络中的交互行为数据,根据所述交互行为数据生成用户联系的网络拓扑图,所述网络拓扑图包含多个用户节点和相互连接的若干条边;
S2、从当前所述网络拓扑图中选取权重最高的边,将该边的两个用户节点归为一个交往圈;
S3、查找构建所述交往圈内每个用户节点的邻居用户节点集合,计算邻居用户节点集合内每个邻居用户节点对于所述交往圈的归属度;
S4,判断归属度最大的邻居用户节点u的归属度是否大于预设值,如果是,则将该邻居用户节点u加入到所述交往圈中,扩张所述交往圈,返回S3;否则停止交往圈的扩张,执行S5;
S5、将停止扩张后的交往圈中的用户节点之间的所有边从所述网络拓扑图中去除,若所述网络拓扑图中剩余边的数量大于零,则对去除边后的新的网络拓扑图重复上述步骤S2-S4的处理,直至网络拓扑图中剩余边为零,得到N个交往圈;其中N为自然数。
2.根据权利要求1所述电信网络用户的交往圈挖掘方法,其特征在于,所述步骤S1之后还包括以下步骤:
S101、使用metis切割方法将所述网络拓扑图切割成若干个子图,然后并行地对每个子图进行步骤S2-S5的处理。
3.根据权利要求1所述电信网络用户的交往圈挖掘方法,其特征在于,用户节点u对于交往圈C的归属度B(u,C)定义为:
B ( u , C ) = Σ v ∈ C w u v k u ;
其中,Nu为邻居用户节点集合,wuv表示用户节点u和v之间的边的权重;
所述预定值为 表示交往圈C内的所有割边权重之和与交往圈C内用户节点间的所有的边的权重之和wc的比值;其中,cut(C,G\C)表示交往圈C中的所有割边的权重之和。
4.根据权利要求3所述电信网络用户的交往圈挖掘方法,其特征在于,步骤S5之后还包括:
对所述N个交往圈中的每个交往圈分别获取每个交往圈内部每个用户节点对应的用户的个人信息,根据每个用户的个人信息判断该交往圈内部成员之间的关系进而得到该交往圈的类别,向用户推荐其所属的不同类别的交往圈。
5.根据权利要求4所述电信网络用户的交往圈挖掘方法,其特征在于,还包括:
对每个用户的交往圈按照预定条件进行优先级排序,推荐输出优先级最高的交往圈,或推荐输出优先级排在前M位的交往圈,M为自然数。
6.根据权利要求5所述电信网络用户的交往圈挖掘方法,其特征在于,所述对每个用户的交往圈按照预定条件进行优先级排序具体为:
对于一个用户所属的每一个交往圈,分别计算该用户在每一个交往圈中的关系权重,将用户关系权重最大的用户所属的至少一个交往圈归为一类,此类交往圈优先级高,将用户关系权重不是最大的用户所属的其余的交往圈归为一类,此类交往圈优先级低;
在上述分类后,在每一类交往圈中,若一个用户在一个交往圈中的邻居数量越多,则优先级越高,或者,若一个用户在一个交往圈中拥有的边的权重和越大,则优先级越高。
7.根据权利要求6所述电信网络用户的交往圈挖掘方法,其特征在于,还包括交往圈过滤步骤,具体为:
获取一个用户所属的所有交往圈,计算属于该用户的每个交往圈的成员的相似性,如果两个交往圈的成员的相似性大于预先设定的阈值,则过滤掉推荐次序中优先级最低的交往圈,保留推荐次序中优先级最高的交往圈。
8.根据权利要求1-7任一项所述电信网络用户的交往圈挖掘方法,其特征在于,所述交往圈的类别包括工作圈、朋友圈和亲人圈。
9.根据权利要求8所述电信网络用户的交往圈挖掘方法,其特征在于,所述边的权重表示两个用户节点对应的用户之间通信的频度和/或时长。
10.一种电信网络用户的交往圈挖掘***,其特征在于,包括:
拓扑图建立模块,用于获取用户在电信通话网络中的交互行为数据,根据所述交互行为数据生成用户联系的网络拓扑图,所述网络拓扑图包含多个用户节点和相互连接的若干条边;
交往圈初建模块,用于从当前所述网络拓扑图中选取权重最高的边,将该边的两个用户节点归为一个交往圈;
归属度计算模块,用于查找构建所述交往圈内每个用户节点的邻居用户节点集合,计算邻居用户节点集合内每个邻居用户节点对于所述交往圈的归属度;
交往圈扩张模块,用于判断归属度最大的邻居用户节点u的归属度是否大于预设值,如果是,则将该邻居用户节点u加入到所述交往圈中,扩张所述交往圈,之后返回所述归属度计算模块计算并由所述交往圈扩张模块继续扩张;否则停止交往圈的扩张;
交往圈建立模块,用于将停止扩张后的交往圈中的用户节点之间的所有边从所述网络拓扑图中去除,若所述网络拓扑图中剩余边的数量大于零,则对去除边后的新的网络拓扑图依次重复上述交往圈初建模块、归属度计算模块和交往圈扩张模块的处理,直至网络拓扑图中剩余边为零,得到N个交往圈;其中N为自然数。
CN201610031592.2A 2016-01-15 2016-01-15 一种电信网络用户的交往圈挖掘方法及*** Expired - Fee Related CN105721279B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610031592.2A CN105721279B (zh) 2016-01-15 2016-01-15 一种电信网络用户的交往圈挖掘方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610031592.2A CN105721279B (zh) 2016-01-15 2016-01-15 一种电信网络用户的交往圈挖掘方法及***

Publications (2)

Publication Number Publication Date
CN105721279A true CN105721279A (zh) 2016-06-29
CN105721279B CN105721279B (zh) 2019-03-26

Family

ID=56147342

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610031592.2A Expired - Fee Related CN105721279B (zh) 2016-01-15 2016-01-15 一种电信网络用户的交往圈挖掘方法及***

Country Status (1)

Country Link
CN (1) CN105721279B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106557984A (zh) * 2016-11-18 2017-04-05 中国联合网络通信集团有限公司 一种社交群体的确定方法及装置
CN108154425A (zh) * 2018-01-19 2018-06-12 广州天源信息科技股份有限公司 一种结合社会网络和位置的线下商户推荐方法
CN109344326A (zh) * 2018-09-11 2019-02-15 阿里巴巴集团控股有限公司 一种社交圈的挖掘方法和装置
CN109766940A (zh) * 2018-12-29 2019-05-17 北京天诚同创电气有限公司 评估多个污水处理***间的相似度的方法和装置
CN110083677A (zh) * 2019-05-07 2019-08-02 北京字节跳动网络技术有限公司 联系人的搜索方法、装置、设备及存储介质
WO2019205373A1 (zh) * 2018-04-26 2019-10-31 平安科技(深圳)有限公司 相似用户查找装置、方法及计算机可读存储介质
CN110674390A (zh) * 2019-08-14 2020-01-10 国家计算机网络与信息安全管理中心 基于置信度的群体发现方法及装置
CN110704612A (zh) * 2019-08-09 2020-01-17 国家计算机网络与信息安全管理中心 一种社交群体发现方法、装置和存储介质
CN110855723A (zh) * 2020-01-16 2020-02-28 武汉斗鱼鱼乐网络科技有限公司 一种识别目标互动账号的方法及***、介质、设备
CN111917574A (zh) * 2020-07-21 2020-11-10 上海阿尔卡特网络支援***有限公司 社交网络拓扑模型及构建方法、用户置信度和亲密度计算方法及电信诈骗智能拦截***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103810260A (zh) * 2014-01-27 2014-05-21 西安理工大学 基于拓扑特性的复杂网络社团发现方法
CN104239390A (zh) * 2014-06-11 2014-12-24 杭州联汇数字科技有限公司 一种基于改进型协同过滤算法的音频推荐方法
CN104376083A (zh) * 2014-11-18 2015-02-25 电子科技大学 一种基于关注关系和多用户行为的图推荐方法
CN104731962A (zh) * 2015-04-03 2015-06-24 重庆邮电大学 一种社交网络中基于相似社团的好友推荐方法及***
US20150281444A1 (en) * 2014-03-27 2015-10-01 Carsten Busch System and method for an interaction page

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103810260A (zh) * 2014-01-27 2014-05-21 西安理工大学 基于拓扑特性的复杂网络社团发现方法
US20150281444A1 (en) * 2014-03-27 2015-10-01 Carsten Busch System and method for an interaction page
CN104239390A (zh) * 2014-06-11 2014-12-24 杭州联汇数字科技有限公司 一种基于改进型协同过滤算法的音频推荐方法
CN104376083A (zh) * 2014-11-18 2015-02-25 电子科技大学 一种基于关注关系和多用户行为的图推荐方法
CN104731962A (zh) * 2015-04-03 2015-06-24 重庆邮电大学 一种社交网络中基于相似社团的好友推荐方法及***

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
杨苗苗等: ""基于Hadoop的电信频繁交往圈算法研究"", 《电脑知识与技术》 *
柳国华等: ""基于短信的社会网络行为分析"", 《计算机应用与软件》 *
边凌燕: ""移动用户的动态信用评估模型的构建与应用"", 《运营技术广角》 *
黄银锋等: ""基于SMS /MMS 的移动社会网络行为建模与分析"", 《湖南科技大学学报(自然科学版)》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106557984B (zh) * 2016-11-18 2020-09-11 中国联合网络通信集团有限公司 一种社交群体的确定方法及装置
CN106557984A (zh) * 2016-11-18 2017-04-05 中国联合网络通信集团有限公司 一种社交群体的确定方法及装置
CN108154425A (zh) * 2018-01-19 2018-06-12 广州天源信息科技股份有限公司 一种结合社会网络和位置的线下商户推荐方法
CN108154425B (zh) * 2018-01-19 2021-03-26 广州天源信息科技股份有限公司 一种结合社会网络和位置的线下商户推荐方法
WO2019205373A1 (zh) * 2018-04-26 2019-10-31 平安科技(深圳)有限公司 相似用户查找装置、方法及计算机可读存储介质
CN109344326A (zh) * 2018-09-11 2019-02-15 阿里巴巴集团控股有限公司 一种社交圈的挖掘方法和装置
CN109344326B (zh) * 2018-09-11 2021-09-24 创新先进技术有限公司 一种社交圈的挖掘方法和装置
CN109766940A (zh) * 2018-12-29 2019-05-17 北京天诚同创电气有限公司 评估多个污水处理***间的相似度的方法和装置
CN109766940B (zh) * 2018-12-29 2024-02-02 北京天诚同创电气有限公司 评估多个污水处理***间的相似度的方法和装置
CN110083677A (zh) * 2019-05-07 2019-08-02 北京字节跳动网络技术有限公司 联系人的搜索方法、装置、设备及存储介质
CN110704612A (zh) * 2019-08-09 2020-01-17 国家计算机网络与信息安全管理中心 一种社交群体发现方法、装置和存储介质
CN110674390A (zh) * 2019-08-14 2020-01-10 国家计算机网络与信息安全管理中心 基于置信度的群体发现方法及装置
CN110855723A (zh) * 2020-01-16 2020-02-28 武汉斗鱼鱼乐网络科技有限公司 一种识别目标互动账号的方法及***、介质、设备
CN111917574A (zh) * 2020-07-21 2020-11-10 上海阿尔卡特网络支援***有限公司 社交网络拓扑模型及构建方法、用户置信度和亲密度计算方法及电信诈骗智能拦截***

Also Published As

Publication number Publication date
CN105721279B (zh) 2019-03-26

Similar Documents

Publication Publication Date Title
CN105721279A (zh) 一种电信网络用户的交往圈挖掘方法及***
Pettie A new approach to all-pairs shortest paths on real-weighted graphs
CN110704743B (zh) 一种基于知识图谱的语义搜索方法及装置
CN111831802B (zh) 一种基于lda主题模型的城市领域知识检测***及方法
CN109522420B (zh) 一种获取学习需求的方法及***
CN108549647B (zh) 基于SinglePass算法实现无标注语料主动预测移动客服领域中突发事件的方法
CN112989055B (zh) 文本识别方法、装置、计算机设备和存储介质
Hammouda et al. Hierarchically distributed peer-to-peer document clustering and cluster summarization
CN102135905B (zh) 基于用户定制的本体匹配***及方法
CN104699767B (zh) 一种面向中文语言的大规模本体映射方法
CN105843796A (zh) 一种微博情感倾向分析方法及装置
CN111460158B (zh) 一种基于情感分析的微博话题公众情感预测方法
CN110287329A (zh) 一种基于商品文本分类的电商类目属性挖掘方法
CN104850647A (zh) 一种微博团体的发现方法及装置
CN105678590A (zh) 一种面向社交网络基于云模型的topN推荐方法
Gutierrez et al. RDFS update: From theory to practice
CN103631862A (zh) 基于微博的事件特征演化挖掘方法及***
CN106202038A (zh) 基于迭代的同义词挖掘方法及装置
Kanti Kumar et al. Application of graph mining algorithms for the analysis of web data
CN108027824B (zh) 未来脚本生成装置和方法、以及计算机可读存储介质
CN107590189A (zh) 智能合约执行方法、装置、设备及存储介质
CN109597926A (zh) 一种基于社交媒体突发事件的信息获取方法及***
Wei et al. SPLMax: exploiting the simple path introduced locality for maximum flow acceleration
CN112487304A (zh) 基于观点向量化的影响力传播模型的建立方法
CN106372147B (zh) 基于文本网络的异构主题网络构建和可视化方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190326

Termination date: 20210115

CF01 Termination of patent right due to non-payment of annual fee