CN103136303A - 在社交网络服务网站中划分用户群组的方法和设备 - Google Patents
在社交网络服务网站中划分用户群组的方法和设备 Download PDFInfo
- Publication number
- CN103136303A CN103136303A CN2011104011783A CN201110401178A CN103136303A CN 103136303 A CN103136303 A CN 103136303A CN 2011104011783 A CN2011104011783 A CN 2011104011783A CN 201110401178 A CN201110401178 A CN 201110401178A CN 103136303 A CN103136303 A CN 103136303A
- Authority
- CN
- China
- Prior art keywords
- users
- user
- groups
- sns website
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明的实施方式涉及在社交网络服务网站中划分用户群组的方法和设备。具体而言,公开了一种用于在社交网络服务SNS网站中划分用户群组的方法,SNS网站具有多个用户,方法包括:对于多个用户中的每个给定用户,基于给定用户与其他用户之间的关联关系生成包含给定用户的用户群组,从而得到多个用户群组;以及基于多个用户群组之间的距离,迭代地对用户群组进行聚集直到满足预定条件,其中用户群组之间的距离由用户群组中的用户之间的关联关系的定量值确定。还公开了相应的设备。利用本发明的实施方式,可以更加准确、可靠地划分SNS网站中的用户群组,从而为分析用户相似性提供基础。
Description
技术领域
本发明的实施方式总体上涉及网络信息技术领域,更具体地,涉及用于在社交网络服务网站中划分用户群组的方法和设备。
背景技术
社交网络服务(SNS)网站已经发展为一种重要的网络服务平台。通过SNS网站,用户可以与其他人进行多种形式的交流和互动,完成各种各样的操作。SNS网站向对特定对象感兴趣或只是一起“闲逛”的人们提供虚拟社区的web站点。在注册和登录之后,社交网络的成员可以通过语音、聊天、即时消息、视频会议和博客等进行通信。社交网络通常向成员提供了联系其他成员的方法。社交网络还可以用作亲自会面的媒介。
当一个人向SNS网站进行了注册并且可能还通过了相关认认证之后,他/她称为该SNS网站的“用户”或“成员”。在SNS网站中,对具有相同特性或者社会关系的用户或成员划分群组常常是有益的。例如,这有助于了解和掌握SNS网站中的用户分布情况,从而为提供准确的、个性化的网络服务奠定基础。
为用户划分群组的关键问题是准确地度量用户之间的“距离”,以便将距离足够小的用户划分到一个群组中。在已知的现有技术中,可以利用用户之间的好友关系或者好友级数来确定彼此之间的距离。在此使用的术语“好友”是指SNS网站中彼此之间具有连接的用户。注意,SNS网站中的连接通常是双向的(但这不是必须的),因此术语“好友”可能依赖于参照系。用户之间的连接可以是直接连接。然而,SNS网站的某些实施方式允许经由一级或者多级连接的间接连接。SNS网站中的“好友”并非必须要求用户在现实生活中实际上是朋友,它仅仅表示SNS网站中的关系。另外,在此使用的术语“好友级数”是指两个用户之间在SNS网站中的连接数目。
直接通过好友关系或好友级数来确定用户距离是可行的,但是也存在若干问题。例如,很多具有相似特性的用户之间未必具有好有关系。为了解决这一问题,已经提出基于用户之间的交互行为来确定用户之间的距离。此类方法例如通过访问日志来统计用户在SNS网站中的行为,并且认为用户之间的交互动作越频繁,他们之间的距离越近。然而,由于用户在SNS网站中的行为种类众多,每种行为所代表的亲密程度各不相同。此时,这种方法可能导致距离度量的失衡。
因此,在本领域中需要一种以更为可靠和准确的方式在SNS网站中划分用户群组的技术方案。
发明内容
鉴于以上问题,本发明提出一种新颖的用于在社交网络服务网站中划分用户群组的方法和设备。
在本发明的一个方面,提供一种用于在社交网络服务SNS网站中划分用户群组的方法,所述SNS网站具有多个用户。所述方法包括:对于所述多个用户中的每个给定用户,基于所述给定用户与其他用户之间的关联关系生成包含所述给定用户的用户群组,从而得到多个用户群组;以及基于所述多个用户群组之间的距离,迭代地对用户群组进行聚集直到满足预定条件,其中用户群组之间的距离由用户群组中的用户之间的所述关联关系的定量值确定。
在本发明的另一方面,提供一种用于在社交网络服务SNS网站中划分用户群组的设备,所述SNS网站具有多个用户。所述设备包括:群组生成装置,配置用于对于所述多个用户中的每个给定用户,基于所述给定用户与其他用户之间的关联关系生成包含所述给定用户的用户群组,从而得到多个用户群组;以及群组聚集装置,配置用于基于所述多个用户群组之间的距离,迭代地对用户群组进行聚集直到满足预定条件,其中用户群组之间的距离由用户群组中的用户之间的所述关联关系的定量值确定。
根据本发明的实施方式,对于每个用户,最初基于SNS网站中的用户之间的关联关系来生成初始的用户群组。此后,可以利用不同群组之间的用户关联关系来确定群组之间的距离,并且将足够接近(相似)的群组进行聚集。通过迭代地执行聚类过程以及适当地设置聚类停止条件,能够更好地实现用户的分组,使得属于相同群组的用户之间具有明显的和稳定的相似性或社会关系。以此方式,实现了SNS网站中更为可靠和准确的用户群组划分,从而分析用户相似性以及提供可定制的个性化网络服务提供基础。
附图说明
通过参考附图阅读下文的详细描述,本发明实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
图1示出了根据本发明一个示例性实施方式的用于在SNS网站中划分用户群组的方法100的流程图;
图2示出了根据本发明一个示例性实施方式的用于在SNS网站中划分用户群组的方法200的流程图;
图3示出了根据本发明一个示例性实施方式的表示用户之间的关联关系的图(graph)300的示意图;
图4示出了根据本发明一个示例性实施方式的用于在SNS网站中划分用户群组的设备400的框图;以及
图5示出了适合用来实践本发明实施方式的计算机***500的框图。
在各个附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考附图中示出的若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。
首先参考图1,其示出了根据本发明一个示例性实施方式的用于在社交网络服务SNS网站中划分用户群组的方法100的流程图。应当理解,图1中所示的方法100的步骤仅仅是出于说明之目的。方法100可以包括附加的和/或备选的步骤。
方法100开始之后,在步骤S102,对于SNS网站的多个用户中的每个给定用户,基于该给定用户与其他用户之间的关联关系生成包含该给定用户的用户群组。
根据本发明的实施方式,对于SNS网站的两个用户而言,他们之间的关联关系可以包括二者之间的好友关系。换言之,如果两个用户之间具有好友关系或者好友连接,则可以认为二者之间具有关联关系。
备选地或者附加地,用户之间的关联关系还可以包括他们在SNS网站中的交互动作。例如,如果一个用户浏览另一用户在SNS网站中的主页,则认为二者之间发生了交互动作。这仅仅是一个示例,用户之间的交互动作例如还可以包括但不限于:访问相册、分享、留言、评论、共同参加SNS网站中的事件,等等。如果两个用户之间具有交互动作,则认为二者之间具有关联关系,即使他们彼此不是好友。在另一些实施方式中,可以要求这种交互动作超过一定的阈值次数,才认为两个用户之间具有关联关系。
在确定用户之间的关联关系的基础上,在步骤S102,可以利用任何适当的方式来生成包含给定用户的初始用户群组。例如,一种可行的实施方式是构建该给定用户的最大关联群组。这里使用的术语“最大关联群组”是指这样的群组,在该群组中的任何两个用户之间具有关联关系,而该群组之外的任何用户与该群组之内的至少一个用户之间不具有关联。这种实施方式的具体示例将在下文参考图2详细描述。
注意,上述实施方式仅仅是示例性的。在步骤S102还可以通过其他方式生成包含给定用户的初始群组。例如,在一种实施方式中,对于一个给定的用户,可以将所有与该给定用户具有关联关系的用户划分到以该给定用户为中心的初始群组中。又如,可以从与给定用户具有关联关系的所有其他用户中随机选择特定数目的用户以构造初始群组。初始用户群组甚至可以是人工指定的。其他任何适当的方式均是可行的,本发明的范围在此方面不受限制。
可以理解,通过执行步骤S102,为每个用户生成了包含该用户的一个初始用户群组,由此得到了多个用户群组。假设所考虑的用户总数为N(N为大于2的自然数),则步骤S102将会产生N个用户群组。注意,这些用户群组之间可能相交或者不相交。
接下来,方法100进行到步骤S104,在此基于用户群组之间的距离迭代地对步骤S102获得的用户群组进行聚集,直到满足预定条件。
根据本发明的实施方式,两个用户群组A和B之间的距离由用户群组A中的用户和用户群组B中的用户之间的关联关系的定量值确定。两个用户之间的关联关系的定量值可以称为这两个用户之间的社交距离或者简称距离。在本文中,“关联关系的值”与“距离”可以互换使用。
如上所述,如果两个用户之间具有好友关系,或者两个用户发生过交互动作等,则认为这两个用户之间具有关联关系。为了定量描述这种关联关系的紧密程度,根据本发明的实施方式,可以通过各种方法对其进行量化。例如,根据某些实施方式,可以基于两个用户之间的亲密度来确定这两个用户之间的关联关系的值。
在此使用的术语“亲密度”是指衡量SNS网站中的两个用户之间关系的密切程度的量。亲密度越高,用户的关联关系的值(即,用户之间的距离)也越大。
作为示例,两个用户之间的亲密度可以与这两个用户之间的好友级数有关,即这两个用户之间在SNS网站中的连接数目。两个用户之间的好友级数越小,他们之间的亲密度越高,关联关系也越紧密。
备选地或附加地,亲密度还可以基于用户对于SNS网站中的公共事件的关注程度。在SNS网站所构建的虚拟社区中,可以包括例如“投票”、“新闻”、“团购”、“话题”等事件。社交网络的所有成员均可关注和/或参与此类事件,因此将其称为“公共事件”。根据本发明的实施方式,可以认为:两个用户关注相同的公共事件越多,表明二者之间的亲密度也越高。例如,如果用户和他/她的一个好友总是对参与相同或相似的投票、购买相同和/或相似的团购产品、参与相同或相似的话题,可以说明他们的兴趣和关注点比较接近。由此,认为二者的亲密度越高。
又如,用户之间的亲密度还可以基于他们对于彼此在SNS网站网络中的个人事件的关注程度(即,用户之间的交互动作的频度)来确定。在SNS网站所创建的虚拟社区中,每个用户可以具有与之关联的“日志”、“照片”、“记录”等个人事件。根据本发明的实施方式,一个用户关注另一用户的个人事件越多,表明二者之间的亲密度也越高。例如,如果用户总是查看其某个好友上传的照片、回复其记录、参与该好友发起的活动等,则表明用户与该好友之间的亲密度越高。
此外,在确定用户的亲密度时,还可以考虑用户之间的交互动作的不同类别。例如,与一个用户仅仅浏览另一用户的主页相比,在另一用户的主页上留言或者向赠送虚拟礼物通常代表着更高的亲密度。因此,在本发明的实施方式中,可以事先为交互的类别设置不同的级别。在计算两个用户之间的亲密度时,可以利用相应的级别对用户之间的交互动作进行加权。
除了在SNS网站中的亲密度之外,还可以根据其他因素来确定两个用户之间的关联关系的值。例如,这种关联关系的值还可以根据用户在真实世界中形成的实际关系来确定。作为示例,这种实际关系例如可以通过访问SNS网站中的“简档”(profile)获得。
具体而言,尽管社交网络所构建的环境是一种虚拟环境,但是很多社交网络都以现实世界的实际生活中的社交为基础。换言之,尽管SNS网站中的用户关系和数据是虚拟化的,但是这些关系和数据之间的联系往往基于并且反映现实生活中确实存在的社交关系。例如,社交网络中的“好友”在很多情况下都是真实世界中的朋友、同事、同学这样的关系。
SNS网站中通常为每个用户创建称作“简档”的记录,其中存储有包含账号信息、个人联系信息、工作信息、兴趣爱好等用户个人信息和资料。由此,通过访问两个用户各自的简档,可以确定他们在真实世界中是否具有特定的关系。例如,通过访问简档中的相关信息,可以确定两个用户是否居住在相同的社区(邻居)、毕业于相同的学校(同学或校友)、在同一机构中工作(同事)、参加了相同的社团,等等。当两个具有上述实际关系时,可以认为二者之间的关联关系较为紧密,即,距离较小。
注意,根据本发明的实施方式,用户距离可以利用各种技术手段来量化。例如,基于好友级数、对公共/个人事件的关注次数、web页面点通次数、web页面停留时间、事件参与频度等各种数值,可以利用各种适当的运算来计算用户距离,本发明的范围在此方面不受限制。
特别地,如果两个用户之间没有关联关系,则可以认为他们之间的距离无限大。在实践中,可以将这样的用户之间的关联关系值设为一个足够大的值或者任何具有特殊含义的特定值。
上面已经详细讨论了如何确定两个用户之间的关联关系的定量值(或称用户之间的距离)。现在返回图1的步骤S104,基于用户之间的距离,可以通过多种方式来确定任意两个用户群组之间的距离。例如,在某些实施方式中,对于用户群组A和B,可以将群组A中所有用户与群组B中所有用户的距离的平均值作为这两个群组之间的距离。
备选地,在确定两个群组之间的距离时,还可以将群组A与群组B的交集的大小纳入考虑。具体而言,在用户的平均距离相同的情况下,交集越大表明两个用户群组之间的距离越小。这样的示例将在下文参考图2详细描述。
在步骤S104处执行的用户群组聚集可以根据不同的策略执行。例如,在某些实施方式中,可以将距离小于给定阈值的群组合并,以生成新的群组。备选地,可以将距离最小的N对群组进行合并,其中N是可配置的自然数。步骤S104的操作从本质上讲是一种聚类(clustering)操作,因此任何其他已知或者将来开发的聚类策略和算法均可以与本发明的实施方式结合使用。
步骤S104迭代地执行,直到满足预定的停止条件。这种预定的条件例如包括达到预定的迭代次数。备选地或附加地,预定条件可以是由聚集产生的用户群组彼此不相交。这仅仅是示例,其他任何适当的停止条件也是可以想到的,本发明的范围在此方面不受限制。
方法100在步骤S104之后结束。
通过方法100,可以有效地根据用户在SNS网站中的关联关系将用户划分为群组,属于相同群组的用户之间的距离足够接近。换言之,同一群组中的用户具有相似的社交特性或者行为。
下面参考图2,其示出了根据本发明一个实施方式的用于划分SNS网站中的用户群组的方法200的流程图。注意,方法200是上文描述的方法100的一个具体的示例性实施方式,并非意在限制本发明的范围。
方法200开始之后,在步骤S202,访问SNS网站中的用户简档和/或访问日志,从而获取用户之间的关联关系。如上所述,根据本发明的实施方式,如果两个用户之间具有好友关系,则认为二者具有关联关系。备选地或附加地,如果两个用户之间存在交互动作,也可认为二者之间具有关联关系。
接下来,方法200进行到步骤S204,在此构建表示用户之间关联关系的图。例如,可以将每个用户作为顶点;如果两个用户之间具有关联关系,则这两个顶点之间存在一条边。可以理解,以此方式在步骤S204构建的图是一个无向图。
作为示例,参考图3,其示出了表示用户1-6之间关联关系的图300。在图300中,每个用户1-6对应于一个顶点v1-v6。具有边的两个顶点所对应的用户在SNS网站中具有关联关系。例如,顶点v1与顶点v2之间存在边,表明用户1与用户2具有关联关系。反之,不具有边的顶点所对应的用户在SNS网站中不具有关联关系。例如,顶点v1与顶点v3,表明用户1和用户3不具有关联关系。
注意,利用图来表示用户之间的关联关系只是一个示例性的实施方式,其他任何适当的实施方式也是可行的。例如,本领域技术人员可以容易地理解,任何能够利用图结构表示的关系均可以利用表(table)进行等效的表示。另外,可以利用诸如XML之类的结构化语言来描述对象之间的连接关系,等等。因此,基于图的表示和运算并不对本发明的范围构成限制。
继而在步骤S206,计算图中的顶点之间的距离。如上所述,可以基于用户之间的亲密度和/或用户在真实世界中的实际关系来量化用户之间的关联关系,从而得到计算用户之间的距离。用户距离的值可被用作对应顶点之间的距离,即,边的长度。没有边连接的两个顶点之间的距离可以设置为一个足够大的值或者任何特殊值。
方法200接下来进行到步骤S208,在此生成每个顶点的最大完全子图,以作为包含该顶点的初始子图。可以理解,在方法200中,子图是用户群组的一种表示形式。在此使用的术语“最大完全子图”是指图中这样的子图,在该子图中的任意两个顶点之间具有边,同时该子图之外的任意顶点与该子图中的至少一个顶点之间不具有边。可以理解,“最大完全子图”是上文参考图1的步骤S102描述的“最大关联群组”的一个具体示例。
对于图中的每个顶点而言,例如可以从该顶点出发,利用回溯方法找到该顶点的所有最大完全子图,这是本领域中已知的。其他任何计算最大完全子图的算法都是可行的。
参考图3,对于顶点v1而言,其最大完全子图是{v1,v2}。对于顶点v2而言,其最大完全子图是{v1,v2}以及{v2,v3,v4,v5}。可以看到,对于某些顶点而言,包含它的最大完全子图可能不止一个。这时需要从中选择一个特定的最大完全子图。在某些实施方式中,这种选择可以随机地完成。备选地,可以计算每个完全子图中的所有边的权重之和,并且选择边的权重之和最大的一个最大完全子图。另外,也可由用户交互地指定一个最大完全子图。
接下来,在步骤S210,计算子图(即,用户群组)之间的距离。如上文所述,两个用户群组之间的距离由这两个群组中的用户之间的距离确定。相应地,两个子图之间的距离由其各自包含的顶点之间的距离确定。此外,还可以优选地将两个子图的交集的大小纳入考虑。
例如,根据本发明的某些实施方式,可以基于以下公式来计算两个子图之间的距离:
其中dij表示两个子图之间的距离(即,用户群组的距离),exp表示指数函数,‖A‖表示集合A的大小,rij表示两个子图中的每对顶点之间的距离。注意,上面的公式仅仅是示例性的,可以基于上文提及或者任何适当的其他方法来确定两个子图之间的距离。
方法200继而进行到步骤S212,在此基于步骤S210计算出的每两个子图(用户群组)之间的距离对子图进行聚集。例如,可以将距离小于预定阈值的子图合并,以生成新的子图(用户群组)。注意,在通过合并生成新的子图时,可以将两个子图各自的顶点集合的并集作为新子图的顶点,而将用户关联关系的交集作为新生成的图的关联关系(即,边)。由此,可以有效地确保聚集的收敛性。
在步骤S212完成之后,方法200在步骤S214判断是否经过聚集之后的子图已经满足预定条件,例如,是否达到预定迭代次数或者获得的子图之间彼此互不相交,等等。如果确定预定条件已得到满足(步骤S214的分支“是”),则此时的子图所对应的用户群组即为方法200的输出。如果尚未满足条件(步骤S214的分支“否”),则方法200返回到步骤S210以继续迭代地聚集子图,直到满足预定的收敛条件。
方法200在步骤S214确定满足预定条件的情况下结束。
现在参考图4,其示出了根据本发明一个示例性实施方式的用于在社交网络服务SNS网站中划分用户群组的设备400的框图。
如图所示,用于在社交网络服务SNS网站中划分用户群组的设备400包括:群组生成装置402,配置用于针对所述多个用户中的每个给定用户,基于所述给定用户与其他用户之间的关联关系生成包含所述给定用户的用户群组,从而得到多个用户群组;群组聚集装置404,配置用于基于所述多个用户群组之间的距离,迭代地对用户群组进行聚集直到满足预定条件,其中用户群组之间的距离由用户群组中的用户之间的所述关联关系的定量值确定。
根据本发明的某些实施方式,群组生成装置402包括以下至少一个:第一群组生成装置,配置用于基于所述给定用户与所述SNS网站的其他用户的好友关系来生成包含所述给定用户的用户群组;以及第二群组生成装置,配置用于基于所述给定用户与所述SNS网站的其他用户发生的交互动作来生成包含所述给定用户的用户群组。
根据本发明的某些实施方式,群组生成装置402包括:第三群组生成装置,配置用于生成包含所述给定用户的最大关联群组,所述最大关联群组中的任意两个用户之间具有关联关系,并且所述最大关联群组之外的用户与所述最大关联群组中的至少一个用户不具有关联关系。
根据本发明的某些实施方式,所述SNS网站的两个用户之间的所述关联关系的定量值与所述两个用户在所述SNS网站中的亲密度有关。
根据本发明的某些实施方式,两个用户在所述SNS网站中的亲密度与以下至少一个有关:所述两个用户在所述SNS网站中的好友级数,所述两个用户对彼此在所述SNS网站中的事件的关注频度,所述两个用户在所述SNS网站中的交互动作的类别,所述两个用户对所述SNS网站中的公共事件的关注频度。
根据本发明的某些实施方式,所述SNS网站的两个用户之间的所述关联关系的定量值与所述两个用户在真实世界中形成的实际关系有关。
根据本发明的某些实施方式,所述预定条件包括:预定的迭代次数;或者由所述聚集产生的用户群组彼此不相交。
根据本发明的某些可选实施方式,设备400还可以包括推荐装置(未示出),配置用于将所述确定的结果用于向所述用户推荐好友。
注意,为清晰起见,在图4中没有示出可选的装置以及各个装置所包含的子装置。然而,应当理解,设备400中记载的各个装置分别对应于上文参考图1和图2描述的方法100和200中的各个步骤。由此,上文针对方法100和200描述的操作和特征同样适用于设备400及其中包含的装置,在此不再赘述。
还应当理解,设备400可以利用各种方式实现。例如,在某些实施方式中,设备400可以利用软件和/或固件来实现。备选地或附加地,设备400可以部分地或者完全地基于硬件来实现。例如,设备400可以实现为集成电路(IC)芯片或专用集成电路(ASIC)。设备400也可以实现为片上***(SOC)。现在已知或者将来开发的其他方式也是可行的,本发明的范围在此方面不受限制。
图5示出了适合用来实践本发明实施方式的计算机***400的框图。如图所示,计算机***500可以包括:CPU(中央处理单元)501、RAM(随机存取存储器)502、ROM(只读存储器)503、***总线504、硬盘控制器505、键盘控制器506、串行接口控制器507、并行接口控制器508、显示控制器509、硬盘510、键盘511、串行外部设备512、并行外部设备513和显示器514。在这些设备中,与***总线504耦合的有CPU 501、RAM 502、ROM 503、硬盘控制器505、键盘控制器506、串行控制器507、并行控制器508和显示控制器509。硬盘510与硬盘控制器505耦合,键盘511与键盘控制器506耦合,串行外部设备512与串行接口控制器507耦合,并行外部设备513与并行接口控制器508耦合,以及显示器514与显示控制器509耦合。应当理解,图5所述的结构框图仅仅为了示例的目的而示出的,而不是对本发明范围的限制。在某些情况下,可以根据具体情况而增加或者减少某些设备。
如上所述,设备400可以实现为纯硬件,例如芯片、ASIC、SOC等。这些硬件可以集成在计算机***400中。此外,本发明的实施方式也可以通过计算机程序产品的形式实现。例如,参考图1和图2描述的方法100和200可以通过计算机程序产品来实现。该计算机程序产品可以存储在例如图5所示的RAM 504、ROM 504、硬盘510和/或任何适当的存储介质中,或者通过网络从适当的位置下载到计算机***500上。计算机程序产品可以包括计算机代码部分,其包括可由适当的处理设备(例如,图5中示出的CPU 501)执行的程序指令。所述程序指令至少可以包括用于实现方法100和200的步骤的指令。
上文已经结合若干具体实施方式阐释了本发明的精神和原理。根据本发明的实施方式,针对每个用户,最初可以基于SNS网站中的用户之间的关联关系来生成初始的用户群组。此后,可以利用不同群组之间的用户关联关系来确定群组之间的距离,并且将足够接近的群组进行聚集。通过迭代地执行这一聚类过程以及适当地设置聚类停止条件,能够更好地实现用户的分组,使得属于相同群组的用户之间具有明显的相似特性或社会关系。以此方式,实现了更为可靠和准确的用户群组划分。
应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行***,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。
说明书中提及的通信网络可以包括各类网络,包括但不限于局域网(“LAN”),广域网(“WAN”),根据IP协议的网络(例如,因特网)以及端对端网络(例如,ad hoc对等网络)。
应当注意,尽管在上文详细描述中提及了设备的若干装置或子装置,但是这种划分仅仅并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多装置的特征和功能可以在一个装置中具体化。反之,上文描述的一个装置的特征和功能可以进一步划分为由多个装置来具体化。
此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变执行顺序。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然已经参考若干具体实施方式描述了本发明,但是应该理解,本发明并不限于所公开的具体实施方式。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。所附权利要求的范围符合最宽泛的解释,从而包含所有这样的修改及等同结构和功能。
Claims (14)
1.一种用于在社交网络服务SNS网站中划分用户群组的方法,所述SNS网站具有多个用户,所述方法包括:
对于所述多个用户中的每个给定用户,基于所述给定用户与其他用户之间的关联关系生成包含所述给定用户的用户群组,从而得到多个用户群组;以及
基于所述多个用户群组之间的距离,迭代地对用户群组进行聚集直到满足预定条件,其中用户群组之间的距离由用户群组中的用户之间的所述关联关系的定量值确定。
2.根据权利要求1所述的方法,其中所述SNS网站的两个用户之间的所述关联关系包括以下至少一个:所述两个用户之间具有好友关系;以及所述两个用户之间存在交互动作。
3.根据权利要求1所述的方法,其中基于所述给定用户与其他用户之间的关联关系生成包含所述给定用户的用户群组包括:
生成包含所述给定用户的最大关联群组,所述最大关联群组中的任意两个用户之间具有所述关联关系,并且所述最大关联群组之外的用户与所述最大关联群组中的至少一个用户不具有所述关联关系。
4.根据权利要求1所述的方法,其中所述SNS网站的两个用户之间的所述关联关系的定量值与所述两个用户在所述SNS网站中的亲密度有关。
5.根据权利要求4所述的方法,其中两个用户在所述SNS网站中的亲密度与以下至少一个有关:所述两个用户在所述SNS网站中的好友级数,所述两个用户对彼此在所述SNS网站中的事件的关注频度,所述两个用户在所述SNS网站中的交互动作的类别,所述两个用户对所述SNS网站中的公共事件的关注频度。
6.根据权利要求1所述的方法,其中所述SNS网站的两个用户之间的所述关联关系的定量值与所述两个用户在真实世界中形成的实际关系有关。
7.根据权利要求1所述的方法,其中所述预定条件包括:
预定的迭代次数;或者
由所述聚集产生的用户群组彼此不相交。
8.一种用于在社交网络服务SNS网站中划分用户群组的设备,所述SNS网站具有多个用户,所述设备包括:
群组生成装置,配置用于针对所述多个用户中的每个给定用户,基于所述给定用户与其他用户之间的关联关系生成包含所述给定用户的用户群组,从而得到多个用户群组;以及
群组聚集装置,配置用于基于所述多个用户群组之间的距离,迭代地对用户群组进行聚集直到满足预定条件,其中用户群组之间的距离由用户群组中的用户之间的所述关联关系的定量值确定。
9.根据权利要求8所述的设备,其中所述群组生成装置包括以下至少一个:
第一群组生成装置,配置用于基于所述给定用户与所述SNS网站的其他用户的好友关系来生成包含所述给定用户的用户群组;以及
第二群组生成装置,配置用于基于所述给定用户与所述SNS网站的其他用户发生的交互动作来生成包含所述给定用户的用户群组。
10.根据权利要求8所述的设备,所述群组生成装置包括:
第三群组生成装置,配置用于生成包含所述给定用户的最大关联群组,所述最大关联群组中的任意两个用户之间具有关联关系,并且所述最大关联群组之外的用户与所述最大关联群组中的至少一个用户不具有关联关系。
11.根据权利要求8所述的设备,其中所述SNS网站的两个用户之间的所述关联关系的定量值与所述两个用户在所述SNS网站中的亲密度有关。
12.根据权利要求11所述的设备,其中两个用户在所述SNS网站中的亲密度与以下至少一个有关:所述两个用户在所述SNS网站中的好友级数,所述两个用户对彼此在所述SNS网站中的事件的关注频度,所述两个用户在所述SNS网站中的交互动作的类别,所述两个用户对所述SNS网站中的公共事件的关注频度。
13.根据权利要求8所述的设备,其中所述SNS网站的两个用户之间的所述关联关系的定量值与所述两个用户在真实世界中形成的实际关系有关。
14.根据权利要求8所述的设备,其中所述预定条件包括:
预定的迭代次数;或者
由所述聚集产生的用户群组彼此不相交。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011104011783A CN103136303A (zh) | 2011-11-24 | 2011-11-24 | 在社交网络服务网站中划分用户群组的方法和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011104011783A CN103136303A (zh) | 2011-11-24 | 2011-11-24 | 在社交网络服务网站中划分用户群组的方法和设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103136303A true CN103136303A (zh) | 2013-06-05 |
Family
ID=48496135
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011104011783A Pending CN103136303A (zh) | 2011-11-24 | 2011-11-24 | 在社交网络服务网站中划分用户群组的方法和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103136303A (zh) |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103995866A (zh) * | 2014-05-19 | 2014-08-20 | 北京邮电大学 | 一种基于链路预测的商品信息推送方法及装置 |
CN104394005A (zh) * | 2014-11-27 | 2015-03-04 | 江苏天智互联科技有限公司 | 一种基于后台服务器的主动式的群组分类*** |
WO2015027854A1 (en) * | 2013-08-28 | 2015-03-05 | Tencent Technology (Shenzhen) Company Limited | Methods and systems for determining and displaying user relationships |
CN104410688A (zh) * | 2014-11-27 | 2015-03-11 | 江苏天智互联科技有限公司 | 一种基于后台服务器的主动式的群组分类方法 |
CN104468326A (zh) * | 2014-11-27 | 2015-03-25 | 江苏天智互联科技有限公司 | 一种基于通信网络的群组的交互方法 |
CN104639426A (zh) * | 2015-01-29 | 2015-05-20 | 小米科技有限责任公司 | 群组成员添加方法及装置 |
CN105637555A (zh) * | 2013-10-15 | 2016-06-01 | 谷歌公司 | 接下来去哪里的社交建议 |
JP2016143425A (ja) * | 2015-02-02 | 2016-08-08 | 三星電子株式会社Samsung Electronics Co.,Ltd. | コンテンツ検索装置、システム及び方法 |
CN106095843A (zh) * | 2016-06-02 | 2016-11-09 | 腾讯科技(深圳)有限公司 | 社交账号挖掘方法及装置 |
CN106302104A (zh) * | 2015-06-26 | 2017-01-04 | 阿里巴巴集团控股有限公司 | 一种用户关系识别方法及装置 |
CN106373013A (zh) * | 2016-08-24 | 2017-02-01 | 重庆大学 | 协作标准调整方法和协作标准调整装置 |
CN107506355A (zh) * | 2016-06-14 | 2017-12-22 | 阿里巴巴集团控股有限公司 | 对象分组方法及装置 |
CN108427956A (zh) * | 2017-02-14 | 2018-08-21 | 腾讯科技(深圳)有限公司 | 一种对象聚类方法和装置 |
CN108470284A (zh) * | 2017-02-23 | 2018-08-31 | 腾讯科技(深圳)有限公司 | 数据分析方法和装置 |
CN108846767A (zh) * | 2017-04-27 | 2018-11-20 | 清华大学 | 社交群组的特征获取方法及装置 |
CN109410082A (zh) * | 2018-10-31 | 2019-03-01 | 北京航空航天大学 | 一种基于用户情绪分布的在线社交距离估计方法 |
CN109492131A (zh) * | 2018-09-18 | 2019-03-19 | 华为技术有限公司 | 一种图数据存储方法及装置 |
CN109560981A (zh) * | 2018-07-04 | 2019-04-02 | 蔚来汽车有限公司 | 确定节点关联度的方法和设备、计算机存储介质 |
CN109712012A (zh) * | 2018-09-28 | 2019-05-03 | 上海达家迎信息科技有限公司 | 社交网络划分方法、装置、设备及存储介质 |
CN109731341A (zh) * | 2018-12-28 | 2019-05-10 | 广州华多网络科技有限公司 | 一种关联账户的拆分方法、装置及设备 |
CN110769457A (zh) * | 2019-10-09 | 2020-02-07 | 深圳市酷开网络科技有限公司 | 家庭关系发现方法、服务器及计算机可读存储介质 |
CN112084422A (zh) * | 2020-08-31 | 2020-12-15 | 腾讯科技(深圳)有限公司 | 一种账号数据智能处理方法和装置 |
CN112182419A (zh) * | 2020-09-11 | 2021-01-05 | 支付宝(杭州)信息技术有限公司 | 基于隐私保护的社群聚类方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101510856A (zh) * | 2009-03-12 | 2009-08-19 | 腾讯科技(深圳)有限公司 | 一种sns网络中成员关系圈的提取方法和装置 |
CN101552946A (zh) * | 2008-03-31 | 2009-10-07 | 索尼株式会社 | 确定用户子组的方法 |
CN102044009A (zh) * | 2009-10-23 | 2011-05-04 | 华为技术有限公司 | 群组推荐方法和*** |
-
2011
- 2011-11-24 CN CN2011104011783A patent/CN103136303A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101552946A (zh) * | 2008-03-31 | 2009-10-07 | 索尼株式会社 | 确定用户子组的方法 |
CN101510856A (zh) * | 2009-03-12 | 2009-08-19 | 腾讯科技(深圳)有限公司 | 一种sns网络中成员关系圈的提取方法和装置 |
CN102044009A (zh) * | 2009-10-23 | 2011-05-04 | 华为技术有限公司 | 群组推荐方法和*** |
Cited By (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015027854A1 (en) * | 2013-08-28 | 2015-03-05 | Tencent Technology (Shenzhen) Company Limited | Methods and systems for determining and displaying user relationships |
CN104423942A (zh) * | 2013-08-28 | 2015-03-18 | 腾讯科技(深圳)有限公司 | 一种社区好友关系展现方法、相关装置和*** |
US10445373B2 (en) | 2013-10-15 | 2019-10-15 | Google Llc | Social where next suggestion |
CN105637555A (zh) * | 2013-10-15 | 2016-06-01 | 谷歌公司 | 接下来去哪里的社交建议 |
CN105637555B (zh) * | 2013-10-15 | 2022-06-21 | 谷歌有限责任公司 | 接下来去哪里的社交建议 |
CN103995866A (zh) * | 2014-05-19 | 2014-08-20 | 北京邮电大学 | 一种基于链路预测的商品信息推送方法及装置 |
CN104410688B (zh) * | 2014-11-27 | 2017-11-07 | 江苏天智互联科技股份有限公司 | 一种基于后台服务器的主动式的群组分类方法 |
CN104394005A (zh) * | 2014-11-27 | 2015-03-04 | 江苏天智互联科技有限公司 | 一种基于后台服务器的主动式的群组分类*** |
CN104410688A (zh) * | 2014-11-27 | 2015-03-11 | 江苏天智互联科技有限公司 | 一种基于后台服务器的主动式的群组分类方法 |
CN104468326A (zh) * | 2014-11-27 | 2015-03-25 | 江苏天智互联科技有限公司 | 一种基于通信网络的群组的交互方法 |
CN104394005B (zh) * | 2014-11-27 | 2018-01-26 | 江苏天智互联科技股份有限公司 | 一种基于后台服务器的主动式的群组分类*** |
CN104468326B (zh) * | 2014-11-27 | 2017-11-07 | 江苏天智互联科技股份有限公司 | 一种基于通信网络的群组的交互方法 |
CN104639426A (zh) * | 2015-01-29 | 2015-05-20 | 小米科技有限责任公司 | 群组成员添加方法及装置 |
JP2016143425A (ja) * | 2015-02-02 | 2016-08-08 | 三星電子株式会社Samsung Electronics Co.,Ltd. | コンテンツ検索装置、システム及び方法 |
CN106302104A (zh) * | 2015-06-26 | 2017-01-04 | 阿里巴巴集团控股有限公司 | 一种用户关系识别方法及装置 |
CN106095843B (zh) * | 2016-06-02 | 2018-06-08 | 腾讯科技(深圳)有限公司 | 社交账号挖掘方法及装置 |
CN106095843A (zh) * | 2016-06-02 | 2016-11-09 | 腾讯科技(深圳)有限公司 | 社交账号挖掘方法及装置 |
CN107506355A (zh) * | 2016-06-14 | 2017-12-22 | 阿里巴巴集团控股有限公司 | 对象分组方法及装置 |
CN107506355B (zh) * | 2016-06-14 | 2020-09-29 | 阿里巴巴集团控股有限公司 | 对象分组方法及装置 |
CN106373013A (zh) * | 2016-08-24 | 2017-02-01 | 重庆大学 | 协作标准调整方法和协作标准调整装置 |
CN108427956A (zh) * | 2017-02-14 | 2018-08-21 | 腾讯科技(深圳)有限公司 | 一种对象聚类方法和装置 |
WO2018149292A1 (zh) * | 2017-02-14 | 2018-08-23 | 腾讯科技(深圳)有限公司 | 一种对象聚类方法和装置 |
US10936669B2 (en) | 2017-02-14 | 2021-03-02 | Tencent Technology (Shenzhen) Company Limited | Object clustering method and system |
CN108427956B (zh) * | 2017-02-14 | 2019-08-06 | 腾讯科技(深圳)有限公司 | 一种对象聚类方法和装置 |
CN108470284A (zh) * | 2017-02-23 | 2018-08-31 | 腾讯科技(深圳)有限公司 | 数据分析方法和装置 |
CN108470284B (zh) * | 2017-02-23 | 2023-04-07 | 腾讯科技(深圳)有限公司 | 数据分析方法和装置 |
CN108846767A (zh) * | 2017-04-27 | 2018-11-20 | 清华大学 | 社交群组的特征获取方法及装置 |
CN108846767B (zh) * | 2017-04-27 | 2022-03-11 | 清华大学 | 社交群组的特征获取方法及装置 |
CN109560981A (zh) * | 2018-07-04 | 2019-04-02 | 蔚来汽车有限公司 | 确定节点关联度的方法和设备、计算机存储介质 |
CN109492131A (zh) * | 2018-09-18 | 2019-03-19 | 华为技术有限公司 | 一种图数据存储方法及装置 |
CN109492131B (zh) * | 2018-09-18 | 2021-01-08 | 华为技术有限公司 | 一种图数据存储方法及装置 |
CN109712012B (zh) * | 2018-09-28 | 2024-01-30 | 上海达家迎信息科技有限公司 | 社交网络划分方法、装置、设备及存储介质 |
CN109712012A (zh) * | 2018-09-28 | 2019-05-03 | 上海达家迎信息科技有限公司 | 社交网络划分方法、装置、设备及存储介质 |
CN109410082A (zh) * | 2018-10-31 | 2019-03-01 | 北京航空航天大学 | 一种基于用户情绪分布的在线社交距离估计方法 |
CN109731341B (zh) * | 2018-12-28 | 2022-07-22 | 广州方硅信息技术有限公司 | 一种关联账户的拆分方法、装置及设备 |
CN109731341A (zh) * | 2018-12-28 | 2019-05-10 | 广州华多网络科技有限公司 | 一种关联账户的拆分方法、装置及设备 |
CN110769457B (zh) * | 2019-10-09 | 2022-10-28 | 深圳市酷开网络科技股份有限公司 | 家庭关系发现方法、服务器及计算机可读存储介质 |
CN110769457A (zh) * | 2019-10-09 | 2020-02-07 | 深圳市酷开网络科技有限公司 | 家庭关系发现方法、服务器及计算机可读存储介质 |
CN112084422A (zh) * | 2020-08-31 | 2020-12-15 | 腾讯科技(深圳)有限公司 | 一种账号数据智能处理方法和装置 |
CN112084422B (zh) * | 2020-08-31 | 2024-05-10 | 腾讯科技(深圳)有限公司 | 一种账号数据智能处理方法和装置 |
CN112182419A (zh) * | 2020-09-11 | 2021-01-05 | 支付宝(杭州)信息技术有限公司 | 基于隐私保护的社群聚类方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103136303A (zh) | 在社交网络服务网站中划分用户群组的方法和设备 | |
Schweitzer | Sociophysics | |
Chen et al. | Social media visual analytics | |
Peng et al. | Influence analysis in social networks: A survey | |
Rauniar et al. | Technology acceptance model (TAM) and social media usage: an empirical study on Facebook | |
Negahban et al. | Agent-based simulation applications in marketing research: an integrated review | |
US9607273B2 (en) | Optimal time to post for maximum social engagement | |
US9483580B2 (en) | Estimation of closeness of topics based on graph analytics | |
Li et al. | Maximizing micro-blog influence in online promotion | |
US20110252121A1 (en) | Recommendation ranking system with distrust | |
Kalampokis et al. | Combining social and government open data for participatory decision-making | |
Jalayer et al. | A hybrid algorithm based on community detection and multi attribute decision making for influence maximization | |
CN111026977B (zh) | 信息推荐方法、装置及存储介质 | |
Andersson et al. | Voluntary leadership and the emergence of institutions for self-governance | |
Liu et al. | Capturing multi-stage fuzzy uncertainties in hybrid system dynamics and agent-based models for enhancing policy implementation in health systems research | |
Nugroho et al. | A Decision Guidance for Solving Success Rate Political Campaign Using Distance Weighted kNN in Nassi-Shneiderman Framework. | |
Kang et al. | Diffusion pattern analysis for social networking sites using small-world network multiple influence model | |
Erbach-Schoenberg et al. | A model of spatially constrained social network dynamics | |
Barbier et al. | Understanding online groups through social media | |
Gabbriellini et al. | A micro study on the evolution of arguments in amazon. com’s reviews | |
Al Atiqi | Echo Chamber and Polarization in Social Media: An Agent-Based Modeling Approach | |
Ye et al. | Visual analysis of micro-blog retweeting using an information diffusion function | |
Liu et al. | Mining Community‐Level Influence in Microblogging Network: A Case Study on Sina Weibo | |
Tang et al. | Nonlinear Dynamic Analysis of New Product Diffusion considering Consumer Heterogeneity | |
Li et al. | A community related influence evaluation model for social networks with a dynamic perspective |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20130605 |
|
WD01 | Invention patent application deemed withdrawn after publication |