CN107908673A - 社交平台用户的现实关系匹配方法、装置及可读存储介质 - Google Patents
社交平台用户的现实关系匹配方法、装置及可读存储介质 Download PDFInfo
- Publication number
- CN107908673A CN107908673A CN201711013931.5A CN201711013931A CN107908673A CN 107908673 A CN107908673 A CN 107908673A CN 201711013931 A CN201711013931 A CN 201711013931A CN 107908673 A CN107908673 A CN 107908673A
- Authority
- CN
- China
- Prior art keywords
- node
- seed user
- ness rating
- tight ness
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 80
- 238000005295 random walk Methods 0.000 claims abstract description 73
- 238000012545 processing Methods 0.000 claims abstract description 17
- 238000004590 computer program Methods 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 abstract description 9
- 230000004044 response Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000000638 solvent extraction Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 2
- 244000097202 Rathbunia alamosensis Species 0.000 description 1
- 235000009776 Rathbunia alamosensis Nutrition 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种社交平台用户的现实关系匹配方法,包括步骤:定义一个种子用户节点,在所述种子用户周围定义一个和所述种子用户节点相互关注、与该种子用户的其他在线朋友无关联伪节点;通过预设的随机行走算法计算所述种子用户节点与其他用户对应的邻居节点之间的紧密度,以及所述种子用户节点与所述伪节点的紧密度;将所述通过随机行走算法计算出的所述种子用户节点的邻居节点中与该种子用户节点的紧密度大于所述种子用户节点与所述伪节点的紧密度的邻居节点确定为与所述目标用户是线下朋友关系。本发明有效地解决了仅仅进行用户的个人信息分析,通常只能分析出线上好友的缺点。本发明还提供一种数据处理装置及计算机可读存储介质。
Description
技术领域
本发明涉及计算机网络技术领域,尤其涉及一种社交平台用户的现实关系匹配方法、数据处理装置及计算机可读存储介质。
背景技术
随着互联网的发展,各类社交平台的流行,如何从上亿的海量用户中准确的挖掘出在线用户的现实关系,例如朋友、熟人和家人等亲密关系成为了一个重要的课题。
传统的社交网络分析中,通常做法是根据网络结构进行节点间距离的衡量,或者用聚类方法找到团簇来划分节点,在社交拓扑网络结构中通过不同的算法来计算用户之间的相似度,从而判断用户之间的关系。但是,由于社交网络特性,不少节点间虽然距离近,但是他们可能只是线上好友,线下或真实生活中根本没有见过面。
而在例如金融产品领域、公共安全监控领域等应用中,正确地计算和识别在线用户在现实生活中的亲密关系才是最迫切需要的。
发明内容
本发明的主要目的在于提供一种在线社交用户的现实关系匹配方法、数据处理装置及计算机可读存储介质,旨在解决如何准确地计算和识别在线用户在现实生活中的线下朋友关系的技术问题。
为实现上述目的,本发明提供的一种社交平台用户的现实关系匹配方法,包括步骤:
提供一社交平台的目标用户,在三维空间模型中将所述目标用户定义为种子用户节点,将该社交平台上的其他用户定义为该种子用户的邻居节点,在所述种子用户周围定义一个伪节点;其中,该伪节点被定义为和所述种子用户节点相互关注,以及被定义为与该种子用户的在所述社交平台上的其他在线朋友无关联;
通过预设的随机行走算法计算所述种子用户节点与该社交平台上其他用户对应的邻居节点之间的紧密度,以及所述种子用户节点与所述伪节点的紧密度;
判断所述通过随机行走算法计算出的所述邻居节点与该种子用户节点的紧密度是否大于所述种子用户节点与所述伪节点的紧密度;
将所述通过随机行走算法计算出的所述种子用户节点的邻居节点中与该种子用户节点的紧密度大于所述种子用户节点与所述伪节点的紧密度的邻居节点确定为与所述目标用户是线下朋友关系。
进一步地,还包括步骤:
将已经确定为线下朋友关系的邻居节点在所述三维空间模型中定义为一个集合,通过所述预设的随机行走算法计算所述集合与该社交平台上其他用户对应的邻居节点之间的紧密度,以及所述集合与所述伪节点的紧密度;
判断所述通过随机行走算法计算出的所述集合的邻居节点与该集合的紧密度是否大于所述集合与所述伪节点的紧密度;
将所述通过随机行走算法计算出的所述集合的邻居节点与该集合的紧密度大于所述集合与所述伪节点的紧密度的邻居节点确定为与所述目标用户是线下朋友关系。
进一步地,还包括步骤:
判断是否存在新的邻居节点确定为与所述目标用户是线下朋友关系;
在存在新的邻居节点确定为与所述目标用户是线下朋友关系时,返回所述将已经确定为线下朋友关系的邻居节点在所述三维空间模型中定义为一个集合,通过所述预设的随机行走算法计算所述集合与该社交平台上其他用户对应的邻居节点之间的紧密度,以及所述集合与所述伪节点的紧密度的步骤;
在不存在新的邻居节点确定为与所述目标用户是线下朋友关系时,则结束。
进一步地,所述随机行走算法包括一下权重参数中的至少一种:信息可传达参数,关系排他性参数以及社交圈粘性参数。
进一步地,所述信息可传达参数的权重小于所述关系排他性参数的权重,所述关系排他性参数的权重小于社交圈粘性参数的权重。
进一步地,所述三维空间模型为三维拓扑模型或者三维球形模型。
进一步地,还包括步骤:
判断存在新的邻居节点与所述种子用户节点存在相互关注关系;
在确定存在新的邻居节点与所述种子用户节点存在相互关注关系时,进入通过预设的随机行走算法计算所述种子用户节点与该社交平台上其他用户对应的邻居节点之间的紧密度,以及所述种子用户节点与所述伪节点的紧密度的步骤。
本发明还提供一种数据处理装置,包括:
模型节点定义模块,提供一社交平台的目标用户,在三维空间模型中将所述目标用户定义为种子用户节点,将该社交平台上的其他用户定义为该种子用户的邻居节点,在所述种子用户周围定义一个伪节点;其中,定义该伪节点和种子用户相互关注,以及与种子用户的其他在线朋友无关联;
紧密度计算模块,通过预设的随机行走算法计算所述种子用户节点与该社交平台上其他用户对应的邻居节点之间的紧密度,以及所述种子用户节点与所述伪节点的紧密度;
紧密度判断模块,判断所述通过随机行走算法计算出的所述种子用户节点的邻居节点中与该种子用户节点的紧密度是否大于所述种子用户节点与所述伪节点的紧密度;
线下关系判断模块,将所述通过随机行走算法计算出的所述种子用户节点的邻居节点中与该种子用户节点的紧密度大于所述种子用户节点与所述伪节点的紧密度的邻居节点确定为与所述目标用户是线下朋友关系。
本发明还提供一种数据处理装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一项所述的社交平台用户的现实关系匹配方法的步骤。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述的社交平台用户的现实关系匹配方法的步骤。
在本发明中,通过提供一社交平台的目标用户,在三维空间模型中将所述目标用户定义为种子用户节点,将该社交平台上的其他用户定义为该种子用户的邻居节点,在所述种子用户周围定义一个伪节点;其中,该伪节点被定义为和所述种子用户节点相互关注,以及被定义为与该种子用户的在所述社交平台上的其他在线朋友无关联;然后通过预设的随机行走算法计算所述种子用户节点与该社交平台上其他用户对应的邻居节点之间的紧密度,以及所述种子用户节点与所述伪节点的紧密度;判断所述通过随机行走算法计算出的所述邻居节点与该种子用户节点的紧密度是否大于所述种子用户节点与所述伪节点的紧密度;将所述通过随机行走算法计算出的所述种子用户节点的邻居节点中与该种子用户节点的紧密度大于所述种子用户节点与所述伪节点的紧密度的邻居节点确定为与所述目标用户是线下朋友关系;有效地解决了仅仅进行用户的个人信息分析,通常只能分析出线上好友的缺点;同时,解决了通常的仅仅根据网络结构进行节点间距离,或者用聚类方法找到团簇来划分节点,在社交拓扑网络结构中通过不同的算法来计算用户之间的相似度,从而判断用户之间的关系的在线社交用户的现实关系匹配方式中,智能反应线上好友关系,而不能真实的反应线下朋友关系的缺点。
附图说明
图1为本发明第一实施方式中的社交平台用户的现实关系匹配方法的流程图;
图2为本发明第二实施方式中的社交平台用户的现实关系匹配方法的流程图;
图3为本发明第三实施方式中的社交平台用户的现实关系匹配方法的流程图;
图4为本发明第四实施方式中的社交平台用户的现实关系匹配方法的流程图;
图5为本发明一实施方式中的数据处理装置的硬件模块结构示意图。
图6为本发明一实施方式中的数据处理装置的功能模块结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参照图1,图1为本发明第一实施方式中的社交平台用户的现实关系匹配方法100的方法流程图,其中,所述社交平台用户的现实关系匹配方法100包括如下步骤:
步骤S10,提供一社交平台的目标用户,在三维空间模型中将所述目标用户定义为种子用户节点,将该社交平台上的其他用户定义为该种子用户的邻居节点,在所述种子用户周围定义一个伪节点;其中,该伪节点被定义为和所述种子用户节点相互关注,以及被定义为与该种子用户的在所述社交平台上的其他在线朋友无关联。
其中,所述社交平台上的目标用户可以是同一个平台上的注册的用户,也可以是跨社交平台上的不同社交平台的用户。所述社交平台可以是,互联网中的各类社交软件或者社交网站等,在此不做具体限制。
步骤S20,通过预设的随机行走算法计算所述种子用户节点与该社交平台上其他用户对应的邻居节点之间的紧密度,以及所述种子用户节点与所述伪节点的紧密度。
所述随机行走算法(random walk)是一个算法,通常用于计算在一个一维/二维/三维网络中,从一个节点随机走到另一个节点的概率,因此可以用于度量各节点之间的紧密度。
所述伪节点是一种假想的与所述种子用户相互关注的一个假想的节点,相当于一个预设的值。在本实施例中,所述伪节点是出来区分线下用户的,该伪节点被定义为和所述种子用户节点相互关注,以及被定义为与该种子用户的在所述社交平台上的其他在线朋友无关联;这里伪节点模拟了一个与种子用户因巧合相互关注的线上朋友,因此,用种子用户与这个伪节点的紧密度可以作为阀值区分线下朋友。
具体的,在本实施例中,所述随机行走算法中,所述三维空间模型中的从一个节点行走到另一个节点的概率可以是随机的也可以是不随机具有一定权重的概率。
在一具体实施例中,所述随机行走算法的目标函数可以设定为:其中,假设所述三维空间模型G(V,E)是一个连通图,有n个节点和m条边,在t=0时刻从种子用户的节点v0出发,在t时刻到达vt点,然后以概率1/k(vt)移动到vt的任一邻居节点上,k(vt)是节点vt的邻居节点的数目;
那么从节点v0移动到vt节点的概率Pt具体为:
Pt(i)=Prob·{vt=i};
其中,prob函数为数值落在指定区间内的对应概率的函数,i∈(1,n)。
步骤S30,判断所述通过随机行走算法计算出的所述邻居节点与该种子用户节点的紧密度是否大于所述种子用户节点与所述伪节点的紧密度;
步骤S40,将所述通过随机行走算法计算出的所述种子用户节点的邻居节点中与该种子用户节点的紧密度大于所述种子用户节点与所述伪节点的紧密度的邻居节点确定为与所述目标用户是线下朋友关系。
在本实施例中,所述伪节点是一个用来区分线下朋友和非线下朋友的假想节点,该伪节点仅与目标用户相互关注,因此基于随机行走算法计算出的所有邻居节点与该种子用户节点的紧密度大于所述伪节点的用户可以被标注为线下朋友。
在所述社交平台用户的现实关系匹配方法100中,通过提供一社交平台的目标用户,在三维空间模型中将所述目标用户定义为种子用户节点,将该社交平台上的其他用户定义为该种子用户的邻居节点,在所述种子用户周围定义一个伪节点;其中,该伪节点被定义为和所述种子用户节点相互关注,以及被定义为与该种子用户的在所述社交平台上的其他在线朋友无关联;然后通过预设的随机行走算法计算所述种子用户节点与该社交平台上其他用户对应的邻居节点之间的紧密度,以及所述种子用户节点与所述伪节点的紧密度;判断所述通过随机行走算法计算出的所述邻居节点与该种子用户节点的紧密度是否大于所述种子用户节点与所述伪节点的紧密度;将所述通过随机行走算法计算出的所述种子用户节点的邻居节点中与该种子用户节点的紧密度大于所述种子用户节点与所述伪节点的紧密度的邻居节点确定为与所述目标用户是线下朋友关系;有效地解决了仅仅进行用户的个人信息分析,通常只能分析出线上好友的缺点;同时,解决了通常的仅仅根据网络结构进行节点间距离,或者用聚类方法找到团簇来划分节点,在社交拓扑网络结构中通过不同的算法来计算用户之间的相似度,从而判断用户之间的关系的在线社交用户的现实关系匹配方式中,智能反应线上好友关系,而不能真实的反应线下朋友关系的缺点。
请一并参考图2,为基于本发明第一实施例中的社交平台用户的现实关系匹配方法100提出本发明第二实施例中的社交平台用户的现实关系匹配方法102的方法流程图。
在本实施例中,所述社交平台用户的现实关系匹配方法102中的所述步骤S10~S40均与第一实施例相同,在此不再赘述;其不同在于,所述社交平台用户的现实关系匹配方法102还可以包括:
步骤S50,将已经确定为线下朋友关系的邻居节点在所述三维空间模型中定义为一个集合,通过所述预设的随机行走算法计算所述集合与该社交平台上其他用户对应的邻居节点之间的紧密度,以及所述集合与所述伪节点的紧密度;
步骤S60,判断所述通过随机行走算法计算出的所述集合的邻居节点与该集合的紧密度是否大于所述集合与所述伪节点的紧密度;
步骤S70,将所述通过随机行走算法计算出的所述集合的邻居节点与该集合的紧密度大于所述集合与所述伪节点的紧密度的邻居节点确定为与所述目标用户是线下朋友关系。
在该第二实施例中,在已经确定有线下朋友关系的邻居节点时,进行迭代标记,将已经确定为线下朋友关系的邻居节点在所述三维空间模型中定义为一个集合,通过所述预设的随机行走算法计算所述集合与该社交平台上其他用户对应的邻居节点之间的紧密度,以及所述集合与所述伪节点的紧密度,来判断所述社交网络中的其他邻居节点与所述目标用户是否是线下朋友关系。采用将已经确定为线下朋友关系的邻居节点在所述三维空间模型中定义为一个集合,迭代计算下一个为线下朋友关系的邻居节点方式,进一步增加了社交平台用户的现实关系匹配方法的准确率和识别率。
请一并参考图3,为基于本发明第二实施例中的社交平台用户的现实关系匹配方法102提出本发明第三实施例中的社交平台用户的现实关系匹配方法103的方法流程图。
在本实施例中,所述社交平台用户的现实关系匹配方法103中的所述步骤S10~S70均与第二实施例相同,在此不再赘述;其不同在于,所述社交平台用户的现实关系匹配方法103还可以包括:
步骤S80,判断是否存在新的邻居节点确定为与所述目标用户是线下朋友关系;
步骤S91,在存在新的邻居节点确定为与所述目标用户是线下朋友关系时,返回所述将已经确定为线下朋友关系的邻居节点在所述三维空间模型中定义为一个集合,通过所述预设的随机行走算法计算所述集合与该社交平台上其他用户对应的邻居节点之间的紧密度,以及所述集合与所述伪节点的紧密度的步骤;
步骤S92,在不存在新的邻居节点确定为与所述目标用户是线下朋友关系时,则结束。
在该第三实施例中,通过主动判断是否存在新的邻居节点确定为与所述目标用户是线下朋友关系,在已经确定有线下朋友关系的邻居节点时,进行迭代标记,将已经确定为线下朋友关系的邻居节点在所述三维空间模型中定义为一个集合,通过所述预设的随机行走算法计算所述集合与该社交平台上其他用户对应的邻居节点之间的紧密度,以及所述集合与所述伪节点的紧密度,来判断所述社交网络中的其他邻居节点与所述目标用户是否是线下朋友关系。采用将已经确定为线下朋友关系的邻居节点在所述三维空间模型中定义为一个集合,迭代计算下一个为线下朋友关系的邻居节点方式,进一步增加了社交平台用户的现实关系匹配方法的准确率和识别率。
优选地,在一实施例中,所述随机行走算法包括一下权重参数中的至少一种:信息可传达参数,关系排他性参数以及社交圈粘性参数。
其中,所述信息可传达参数代表的是信息从一个节点可以传输到另一个节点的概率。
具体的,在真实社会中,朋友的一个特点是经常沟通,而这意味着信息能够在朋友之间传递,我们称这为信息相互可达性。在微博等社交平台中关注关系是单向的,这意味着A的微博能够传递到B,而B的微博不一定能够传递到A。根据相关统计结果,微博中只有大约22\%的关系是双向(相互关注)的。因此,对于识别线下朋友,单向关注关系是很弱的证据,而如果仅考虑双向关注,又会排除太多的用户;因此,信息相互可达性是识别线下朋友的一个明显特征。
其中,所述关系排他性参数代表的是一个用户在在线上和线下于领域用户维持一定社会关系的可能性概率。
具体的,这是基于社会行为学中的观点:由于人类自身大脑处理能力的限制,人们维持稳定社会关系的数量是有上限的;而这一上限通常被称为Dunbar数,大概介于100和230之间。当然,在本实施例中,所提出的关系排他性并非意味着关系的直接排他性;具体说来,A与B维持了一定的社会关系并不直接排斥A与C维持一定的社会关系,只是因为A的精力有限,A与B维持了一定的社会关系会间接降低A与其他人维持一定社会关系的可能性。因此,关系排他性参数可以用来计算一个用户在在线上和线下于领域用户维持一定社会关系的可能性概率。
其中,所述社交圈粘性参数是一种基于共同朋友关系的线下朋友关系的表征概率。
具体的,在人类社会中的个人并非单独地处于社会之中,而是非常自然的以某些方式参与一些社会交际圈,并与这些社会交际圈中的人维持稳定社会关系,而这些社会交际圈中的其他人之间也以同样的方式维持着稳定的社会关系。举例来说,这样的社会交际圈有学校同学关系圈,公司同事关系圈,家族亲戚关系圈等等。两个在相同社会交际圈中的人自然地拥有一些共同的朋友,这些共同朋友越多,这两个人是朋友的概率就越大,这种情形被称之为社交圈粘性。
因此,所述社交圈粘性参数可以用于发现那些与目标用户没有直接双向关注却与目标用户的线下朋友有很强关联的用户,而这样的用户与目标用户很有可能也是线下朋友。
可选地,在一实施例中,所述信息可传达参数的权重小于所述关系排他性参数的权重,所述关系排他性参数的权重小于社交圈粘性参数的权重。
可以理解的是,所述随机行走算法还可以包括其他的权重参数,各个权重参数之间的权重比例可以根据需要进行设置。
进一步地,在一实施例中,所述三维空间模型为三维拓扑模型或者三维球形模型。
请一并参考图4,为基于本发明第一实施例中的社交平台用户的现实关系匹配方法100提出本发明第四实施例中的社交平台用户的现实关系匹配方法104的方法流程图。
在本实施例中,所述社交平台用户的现实关系匹配方法104中的所述步骤S10~S40均与第一实施例相同,在此不再赘述;其不同在于,所述社交平台用户的现实关系匹配方法104还可以包括:
步骤S11,判断存在新的邻居节点与所述种子用户节点存在相互关注关系;
步骤S12,在确定存在新的邻居节点与所述种子用户节点存在相互关注关系时,进入通过预设的随机行走算法计算所述种子用户节点与该社交平台上其他用户对应的邻居节点之间的紧密度,以及所述种子用户节点与所述伪节点的紧密度的步骤。
在该第四实施例中,主动判断在所述社交平台上是否有的用户与所述种子用户节点存在相互关注关系,在确定存在新的邻居节点与所述种子用户节点存在相互关注关系时,触发新的一轮社交平台用户的现实关系匹配的迭代计算,从而实时的挖掘出社交平台用户的现实关系。
上述实施例中的社交平台用户的现实关系匹配方法可以从社交平台里上亿的海量用户中准确的挖掘出在线用户的现实关系,所述社交平台用户的现实关系匹配方法可以应用于金融产品领域、公共安全监控领域等。
例如,金融公司内部数据一般是单个的用户数据,用户与用户之间是没有关联的。然而,在很多金融类产品应用中,人与人之间的关系程度是非常重要的。比方说,在风控模型中,假设某个用户来借款,其本身没有任何不良记录,然而他的家人或者密友曾经有不良信用记录。那么,在其信用评估时,就应该更仔细一些。金融公司根据外部数据用户数据中的社交账号信息,例如新浪微博、微信等,建立用户的亲密好友匹配网络,可以将用户及其家人、熟人、朋友的不良信用记录在该匹配网络上进行扩展,从而更好的进行风险控制,防止潜在损失。
请一并结合图5,为本发明一实施方式中的数据处理装置200的模块结构示意图。
所述数据处理装置200包括存储器201、处理器202及存储在存储器上并可在处理器202上运行的计算机程序,所述处理器202执行所述程序时实现如下的步骤:
步骤S10,提供一社交平台的目标用户,在三维空间模型中将所述目标用户定义为种子用户节点,将该社交平台上的其他用户定义为该种子用户的邻居节点,在所述种子用户周围定义一个伪节点;其中,该伪节点被定义为和所述种子用户节点相互关注,以及被定义为与该种子用户的在所述社交平台上的其他在线朋友无关联;
步骤S20,通过预设的随机行走算法计算所述种子用户节点与该社交平台上其他用户对应的邻居节点之间的紧密度,以及所述种子用户节点与所述伪节点的紧密度;
步骤S30,判断所述通过随机行走算法计算出的所述邻居节点与该种子用户节点的紧密度是否大于所述种子用户节点与所述伪节点的紧密度。
步骤S40,将所述通过随机行走算法计算出的所述种子用户节点的邻居节点中与该种子用户节点的紧密度大于所述种子用户节点与所述伪节点的紧密度的邻居节点确定为与所述目标用户是线下朋友关系。
在本实施方式中,所述数据处理装置,通过提供一社交平台的目标用户,在三维空间模型中将所述目标用户定义为种子用户节点,将该社交平台上的其他用户定义为该种子用户的邻居节点,在所述种子用户周围定义一个伪节点;其中,该伪节点被定义为和所述种子用户节点相互关注,以及被定义为与该种子用户的在所述社交平台上的其他在线朋友无关联;然后通过预设的随机行走算法计算所述种子用户节点与该社交平台上其他用户对应的邻居节点之间的紧密度,以及所述种子用户节点与所述伪节点的紧密度;判断所述通过随机行走算法计算出的所述邻居节点与该种子用户节点的紧密度是否大于所述种子用户节点与所述伪节点的紧密度;将所述通过随机行走算法计算出的所述种子用户节点的邻居节点中与该种子用户节点的紧密度大于所述种子用户节点与所述伪节点的紧密度的邻居节点确定为与所述目标用户是线下朋友关系;有效地解决了仅仅进行用户的个人信息分析,通常只能分析出线上好友的缺点;同时,解决了通常的仅仅根据网络结构进行节点间距离,或者用聚类方法找到团簇来划分节点,在社交拓扑网络结构中通过不同的算法来计算用户之间的相似度,从而判断用户之间的关系的在线社交用户的现实关系匹配方式中,智能反应线上好友关系,而不能真实的反应线下朋友关系的缺点。。
其中,该数据处理装置200可以是服务器,计算机、便携式计算机设备、手机、平板电脑等具备数据处理功能的电子产品。
在一实施方式中,所述处理器202执行所述程序时还可以实现如下的步骤:
步骤S50,将已经确定为线下朋友关系的邻居节点在所述三维空间模型中定义为一个集合,通过所述预设的随机行走算法计算所述集合与该社交平台上其他用户对应的邻居节点之间的紧密度,以及所述集合与所述伪节点的紧密度;
步骤S60,判断所述通过随机行走算法计算出的所述集合的邻居节点与该集合的紧密度是否大于所述集合与所述伪节点的紧密度;
步骤S70,将所述通过随机行走算法计算出的所述集合的邻居节点与该集合的紧密度大于所述集合与所述伪节点的紧密度的邻居节点确定为与所述目标用户是线下朋友关系。
进一步地,所述处理器202执行所述程序时还可以实现如下的步骤:
步骤S80,判断是否存在新的邻居节点确定为与所述目标用户是线下朋友关系;
步骤S91,在存在新的邻居节点确定为与所述目标用户是线下朋友关系时,返回所述将已经确定为线下朋友关系的邻居节点在所述三维空间模型中定义为一个集合,通过所述预设的随机行走算法计算所述集合与该社交平台上其他用户对应的邻居节点之间的紧密度,以及所述集合与所述伪节点的紧密度的步骤;
步骤S92,在不存在新的邻居节点确定为与所述目标用户是线下朋友关系时,则结束。
优选地,在一实施例中,所述随机行走算法包括一下权重参数中的至少一种:信息可传达参数,关系排他性参数以及社交圈粘性参数。
可选地,在一实施例中,所述信息可传达参数的权重小于所述关系排他性参数的权重,所述关系排他性参数的权重小于社交圈粘性参数的权重。
可以理解的是,所述随机行走算法还可以包括其他的权重参数,各个权重参数之间的权重比例可以根据需要进行设置。
进一步地,在一实施例中,所述三维空间模型为三维拓扑模型或者三维球形模型。
进一步地,所述处理器202执行所述程序时还可以实现如下的步骤:
步骤S11,判断存在新的邻居节点与所述种子用户节点存在相互关注关系;
步骤S12,在确定存在新的邻居节点与所述种子用户节点存在相互关注关系时,进入通过预设的随机行走算法计算所述种子用户节点与该社交平台上其他用户对应的邻居节点之间的紧密度,以及所述种子用户节点与所述伪节点的紧密度的步骤。
请一并结合图6,为本发明一实施方式中的数据处理装置200的功能模块结构示意图。
所述数据处理装置200包括:
模型节点定义模块210,提供一社交平台的目标用户,在三维空间模型中将所述目标用户定义为种子用户节点,将该社交平台上的其他用户定义为该种子用户的邻居节点,在所述种子用户周围定义一个伪节点;其中,该伪节点被定义为和所述种子用户节点相互关注,以及被定义为与该种子用户的在所述社交平台上的其他在线朋友无关联;
紧密度计算模块220,通过预设的随机行走算法计算所述种子用户节点与该社交平台上其他用户对应的邻居节点之间的紧密度,以及所述种子用户节点与所述伪节点的紧密度;
紧密度判断模块230,判断所述通过随机行走算法计算出的所述邻居节点与该种子用户节点的紧密度是否大于所述种子用户节点与所述伪节点的紧密度。
线下关系判断模块240,将所述通过随机行走算法计算出的所述种子用户节点的邻居节点中与该种子用户节点的紧密度大于所述种子用户节点与所述伪节点的紧密度的邻居节点确定为与所述目标用户是线下朋友关系。
在本实施方式中,所述数据处理装置200,通过提供一社交平台的目标用户,在三维空间模型中将所述目标用户定义为种子用户节点,将该社交平台上的其他用户定义为该种子用户的邻居节点,在所述种子用户周围定义一个伪节点;其中,该伪节点被定义为和所述种子用户节点相互关注,以及被定义为与该种子用户的在所述社交平台上的其他在线朋友无关联;然后通过预设的随机行走算法计算所述种子用户节点与该社交平台上其他用户对应的邻居节点之间的紧密度,以及所述种子用户节点与所述伪节点的紧密度;判断所述通过随机行走算法计算出的所述邻居节点与该种子用户节点的紧密度是否大于所述种子用户节点与所述伪节点的紧密度;将所述通过随机行走算法计算出的所述种子用户节点的邻居节点中与该种子用户节点的紧密度大于所述种子用户节点与所述伪节点的紧密度的邻居节点确定为与所述目标用户是线下朋友关系;有效地解决了仅仅进行用户的个人信息分析,通常只能分析出线上好友的缺点;同时,解决了通常的仅仅根据网络结构进行节点间距离,或者用聚类方法找到团簇来划分节点,在社交拓扑网络结构中通过不同的算法来计算用户之间的相似度,从而判断用户之间的关系的在线社交用户的现实关系匹配方式中,智能反应线上好友关系,而不能真实的反应线下朋友关系的缺点。
其中,该数据处理装置200可以是服务器,计算机、便携式计算机设备、手机、平板电脑等具备数据处理功能的电子产品。
在一实施方式中,该数据处理装置200还包括:
紧密度迭代计算模块250,将已经确定为线下朋友关系的邻居节点在所述三维空间模型中定义为一个集合,通过所述预设的随机行走算法计算所述集合与该社交平台上其他用户对应的邻居节点之间的紧密度,以及所述集合与所述伪节点的紧密度;
所述紧密度判断模块230,还用于判断所述通过随机行走算法计算出的所述集合的邻居节点与该集合的紧密度是否大于所述集合与所述伪节点的紧密度;
所述线下关系判断模块240,还用于将所述通过随机行走算法计算出的所述集合的邻居节点与该集合的紧密度大于所述集合与所述伪节点的紧密度的邻居节点确定为与所述目标用户是线下朋友关系。
进一步地,该数据处理装置200还包括:
迭代计算触发模块260,判断是否存在新的邻居节点确定为与所述目标用户是线下朋友关系;
在存在新的邻居节点确定为与所述目标用户是线下朋友关系时,所述紧密度迭代计算模块250,还用于将已经确定为线下朋友关系的邻居节点在所述三维空间模型中定义为一个集合,通过所述预设的随机行走算法计算所述集合与该社交平台上其他用户对应的邻居节点之间的紧密度,以及所述集合与所述伪节点的紧密度。
优选地,在一实施例中,所述随机行走算法包括一下权重参数中的至少一种:信息可传达参数,关系排他性参数以及社交圈粘性参数。
可选地,在一实施例中,所述信息可传达参数的权重小于所述关系排他性参数的权重,所述关系排他性参数的权重小于社交圈粘性参数的权重。
可以理解的是,所述随机行走算法还可以包括其他的权重参数,各个权重参数之间的权重比例可以根据需要进行设置。
进一步地,在一实施例中,所述三维空间模型为三维拓扑模型或者三维球形模型。
进一步地,该数据处理装置200还包括:
种子用户关注侦测模块270,判断存在新的邻居节点与所述种子用户节点存在相互关注关系;
在确定存在新的邻居节点与所述种子用户节点存在相互关注关系时,所述紧密度计算模块220通过预设的随机行走算法计算所述种子用户节点与该社交平台上其他用户对应的邻居节点之间的紧密度,以及所述种子用户节点与所述伪节点的紧密度。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时可以实现如上述任一项所述的社交平台用户的现实关系匹配方法的步骤。
可以理解的是,在本说明书的描述中,参考术语“一实施例”、“另一实施例”、“其他实施例”、或“第一实施例~第N实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者***不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者***所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者***中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
可以理解的是,以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种社交平台用户的现实关系匹配方法,其特征在于,包括步骤:
确定社交平台的目标用户,在三维空间模型中将所述目标用户定义为种子用户节点,将该社交平台上的其他用户定义为该种子用户的邻居节点,在所述种子用户周围定义一个伪节点;其中,该伪节点被定义为和所述种子用户节点相互关注,以及被定义为与该种子用户的在所述社交平台上的其他在线朋友无关联;
通过预设的随机行走算法计算所述种子用户节点与该社交平台上其他用户对应的邻居节点之间的紧密度,以及所述种子用户节点与所述伪节点的紧密度;
判断所述通过随机行走算法计算出的所述邻居节点与该种子用户节点的紧密度是否大于所述种子用户节点与所述伪节点的紧密度;
将所述通过随机行走算法计算出的所述种子用户节点的邻居节点中与该种子用户节点的紧密度大于所述种子用户节点与所述伪节点的紧密度的邻居节点确定为与所述目标用户是线下朋友关系。
2.如权利要求1所述的社交平台用户的现实关系匹配方法,其特征在于,还包括步骤:
将已经确定为线下朋友关系的邻居节点在所述三维空间模型中定义为一个集合,通过所述预设的随机行走算法计算所述集合与该社交平台上其他用户对应的邻居节点之间的紧密度,以及所述集合与所述伪节点的紧密度;
判断所述通过随机行走算法计算出的所述集合的邻居节点与该集合的紧密度是否大于所述集合与所述伪节点的紧密度;
将所述通过随机行走算法计算出的所述集合的邻居节点与该集合的紧密度大于所述集合与所述伪节点的紧密度的邻居节点确定为与所述目标用户是线下朋友关系。
3.如权利要求2所述的社交平台用户的现实关系匹配方法,其特征在于,还包括步骤:
判断是否存在新的邻居节点确定为与所述目标用户是线下朋友关系;
在存在新的邻居节点确定为与所述目标用户是线下朋友关系时,返回所述将已经确定为线下朋友关系的邻居节点在所述三维空间模型中定义为一个集合,通过所述预设的随机行走算法计算所述集合与该社交平台上其他用户对应的邻居节点之间的紧密度,以及所述集合与所述伪节点的紧密度的步骤;
在不存在新的邻居节点确定为与所述目标用户是线下朋友关系时,则结束。
4.如权利要求1所述的社交平台用户的现实关系匹配方法,其特征在于,所述随机行走算法包括一下权重参数中的至少一种:信息可传达参数,关系排他性参数以及社交圈粘性参数。
5.如权利要求4所述的社交平台用户的现实关系匹配方法,其特征在于,所述信息可传达参数的权重小于所述关系排他性参数的权重,所述关系排他性参数的权重小于社交圈粘性参数的权重。
6.如权利要求1所述的社交平台用户的现实关系匹配方法,其特征在于,所述三维空间模型为三维拓扑模型或者三维球形模型。
7.如权利要求1~6中任一项所述的社交平台用户的现实关系匹配方法,其特征在于,还包括步骤:
判断存在新的邻居节点与所述种子用户节点存在相互关注关系;
在确定存在新的邻居节点与所述种子用户节点存在相互关注关系时,进入通过预设的随机行走算法计算所述种子用户节点与该社交平台上其他用户对应的邻居节点之间的紧密度,以及所述种子用户节点与所述伪节点的紧密度的步骤。
8.一种数据处理装置,其特征在于,包括:
模型节点定义模块,提供一社交平台的目标用户,在三维空间模型中将所述目标用户定义为种子用户节点,将该社交平台上的其他用户定义为该种子用户的邻居节点,在所述种子用户周围定义一个伪节点;其中,定义该伪节点和种子用户相互关注,以及与种子用户的其他在线朋友无关联;
紧密度计算模块,通过预设的随机行走算法计算所述种子用户节点与该社交平台上其他用户对应的邻居节点之间的紧密度,以及所述种子用户节点与所述伪节点的紧密度;
紧密度判断模块,判断所述通过随机行走算法计算出的所述种子用户节点的邻居节点中与该种子用户节点的紧密度是否大于所述种子用户节点与所述伪节点的紧密度;
线下关系判断模块,将所述通过随机行走算法计算出的所述种子用户节点的邻居节点中与该种子用户节点的紧密度大于所述种子用户节点与所述伪节点的紧密度的邻居节点确定为与所述目标用户是线下朋友关系。
9.一种数据处理装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7中任一项所述的社交平台用户的现实关系匹配方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至7中任一项所述的社交平台用户的现实关系匹配方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711013931.5A CN107908673B (zh) | 2017-10-25 | 2017-10-25 | 社交平台用户的现实关系匹配方法、装置及可读存储介质 |
PCT/CN2018/075204 WO2019080403A1 (zh) | 2017-10-25 | 2018-02-05 | 社交平台用户的现实关系匹配方法、装置及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711013931.5A CN107908673B (zh) | 2017-10-25 | 2017-10-25 | 社交平台用户的现实关系匹配方法、装置及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107908673A true CN107908673A (zh) | 2018-04-13 |
CN107908673B CN107908673B (zh) | 2019-06-25 |
Family
ID=61840893
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711013931.5A Active CN107908673B (zh) | 2017-10-25 | 2017-10-25 | 社交平台用户的现实关系匹配方法、装置及可读存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN107908673B (zh) |
WO (1) | WO2019080403A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110196955A (zh) * | 2018-05-28 | 2019-09-03 | 腾讯科技(深圳)有限公司 | 信息处理方法、装置及存储介质 |
CN114596097A (zh) * | 2022-05-10 | 2022-06-07 | 富算科技(上海)有限公司 | 用户识别方法、装置、电子设备和计算机可读存储介质 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10475062B2 (en) * | 2017-01-03 | 2019-11-12 | International Business Machines Corporation | Rewarding online users as a function of network topology |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103164416A (zh) * | 2011-12-12 | 2013-06-19 | 阿里巴巴集团控股有限公司 | 一种用户关系的识别方法及设备 |
CN103544236A (zh) * | 2013-10-07 | 2014-01-29 | 宁波芝立软件有限公司 | 一种通过确定未知关系人来推导亲缘关系方法 |
US20150074198A1 (en) * | 2012-05-15 | 2015-03-12 | Tencent Technology (Shenzhen) Company Limited | Social network grouping method and system, and computer storage medium |
CN106959953A (zh) * | 2016-01-08 | 2017-07-18 | 中国科学院声学研究所 | 一种基于统计特征的社交网络用户关系的计算方法 |
-
2017
- 2017-10-25 CN CN201711013931.5A patent/CN107908673B/zh active Active
-
2018
- 2018-02-05 WO PCT/CN2018/075204 patent/WO2019080403A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103164416A (zh) * | 2011-12-12 | 2013-06-19 | 阿里巴巴集团控股有限公司 | 一种用户关系的识别方法及设备 |
US20150074198A1 (en) * | 2012-05-15 | 2015-03-12 | Tencent Technology (Shenzhen) Company Limited | Social network grouping method and system, and computer storage medium |
CN103544236A (zh) * | 2013-10-07 | 2014-01-29 | 宁波芝立软件有限公司 | 一种通过确定未知关系人来推导亲缘关系方法 |
CN106959953A (zh) * | 2016-01-08 | 2017-07-18 | 中国科学院声学研究所 | 一种基于统计特征的社交网络用户关系的计算方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110196955A (zh) * | 2018-05-28 | 2019-09-03 | 腾讯科技(深圳)有限公司 | 信息处理方法、装置及存储介质 |
CN110196955B (zh) * | 2018-05-28 | 2023-07-07 | 腾讯科技(深圳)有限公司 | 信息处理方法、装置及存储介质 |
CN114596097A (zh) * | 2022-05-10 | 2022-06-07 | 富算科技(上海)有限公司 | 用户识别方法、装置、电子设备和计算机可读存储介质 |
CN114596097B (zh) * | 2022-05-10 | 2022-08-26 | 富算科技(上海)有限公司 | 用户识别方法、装置、电子设备和计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2019080403A1 (zh) | 2019-05-02 |
CN107908673B (zh) | 2019-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Tsai et al. | Variable selection by association rules for customer churn prediction of multimedia on demand | |
CN107438050B (zh) | 识别网站的潜在恶意用户的方法和装置 | |
CN111435507A (zh) | 广告反作弊方法、装置、电子设备及可读存储介质 | |
CN107895038A (zh) | 一种链路预测关系推荐方法及装置 | |
TW202123118A (zh) | 基於隱私保護的關係網路構建方法及裝置 | |
Klepac | Developing churn models using data mining techniques and social network analysis | |
Zheng et al. | Federated machine learning for privacy preserving, collective supply chain risk prediction | |
CN107908673B (zh) | 社交平台用户的现实关系匹配方法、装置及可读存储介质 | |
Yu et al. | Hybrid attacks on model-based social recommender systems | |
CN108932669A (zh) | 一种基于监督式层次分析法的异常账户检测方法 | |
CN113761359B (zh) | 数据包推荐方法、装置、电子设备和存储介质 | |
Isah et al. | Bipartite network model for inferring hidden ties in crime data | |
Gil et al. | Adversarial risk analysis for urban security resource allocation | |
Olteanu et al. | The (co)-location sharing game | |
Hexmoor | Computational network science: an algorithmic approach | |
Kalantari et al. | Multi-objective optimization model in a heterogeneous weighted network through key nodes identification in overlapping communities | |
CN111461827A (zh) | 产品评价信息的推送方法和装置 | |
CN114841526A (zh) | 一种高风险用户的检测方法、计算设备及可读存储介质 | |
CN112560105B (zh) | 保护多方数据隐私的联合建模方法及装置 | |
CN109829593B (zh) | 目标对象的信用度确定方法、装置、存储介质及电子装置 | |
Siddique et al. | Sustainable collaboration: Federated learning for environmentally conscious forest fire classification in green internet of things (IoT) | |
Martínez-Torres et al. | Identifying the features of reputable users in eWOM communities by using Particle Swarm Optimization | |
CN113569162A (zh) | 数据处理方法、装置、设备及存储介质 | |
Jiang et al. | A negative survey based privacy preservation method for topology of social networks | |
Bidgoly et al. | Robustness evaluation of trust and reputation systems using a deep reinforcement learning approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |