CN108985954B - 一种建立各标识的关联关系的方法以及相关设备 - Google Patents

一种建立各标识的关联关系的方法以及相关设备 Download PDF

Info

Publication number
CN108985954B
CN108985954B CN201810710215.0A CN201810710215A CN108985954B CN 108985954 B CN108985954 B CN 108985954B CN 201810710215 A CN201810710215 A CN 201810710215A CN 108985954 B CN108985954 B CN 108985954B
Authority
CN
China
Prior art keywords
identifier
natural person
account
identification
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810710215.0A
Other languages
English (en)
Other versions
CN108985954A (zh
Inventor
王璐
陈少杰
张文明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Douyu Network Technology Co Ltd
Original Assignee
Wuhan Douyu Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Douyu Network Technology Co Ltd filed Critical Wuhan Douyu Network Technology Co Ltd
Priority to CN201810710215.0A priority Critical patent/CN108985954B/zh
Publication of CN108985954A publication Critical patent/CN108985954A/zh
Application granted granted Critical
Publication of CN108985954B publication Critical patent/CN108985954B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种建立各标识的关联关系的方法及相关设备,用于提高直播平台的推荐精度。本发明实施例方法包括:获取目标平台的第一标识集合;对所述第一标识集合进行计算,以得到所述第一标识集合对应的自然人标识集合;获取所述目标平台的第二标识集合;计算所述第二标识集合中的各标识与所述自然人标识集合中的各自然人标识的相似度;若所述第二标识集合中存在与所述自然人标识集合中的各自然人标识的相似度大于阈值的目标标识,则建立所述目标标识与第一自然人标识的关联关系,所述第一自然人标识为所述自然人标识集合中与所述目标标识的相似度最大的自然人标识。

Description

一种建立各标识的关联关系的方法以及相关设备
技术领域
本发明涉及大数据算法领域,尤其涉及一种建立各标识的关联关系的方法以及相关设备。
背景技术
在直播平台上,会收集各式各样的身份标识(identification,ID),如账户类ID(user ID,uid)、设备标识ID(device id,did)以及浏览器的Cookie信息ID(cookieID)。这些ID之间存在相互之间的联系,而它们的背后对应的是物理上的自然人。
现在如果能够将稀疏的ID信息通过实体之间的关系汇聚起来,精细化到自然人,那么将在诸多场景中发挥巨大的作用。譬如在推荐场景中,它可以提供ID Mapping的服务能力,使得推荐从账号的方式跨屏幕、跨账号,做到自然人的万物互通。即便是没有登录的客户,通过统一的ID体系,可以发现他在其他设备上登录信息中反映出的行为偏好,提高推荐的精度,因此将直播平台上的各种ID进行统一是非常重要的。
发明内容
本发明实施例提供了一种建立各标识的关联关系的方法以及相关设备,用于提高平台推荐的精度。
本发明实施例的第一方面提供了一种建立各标识的关联关系的方法,包括:
获取目标平台的第一标识集合,所述第一标识集合为所述目标平台中的账号标识的集合;
对所述第一标识集合进行计算,以得到所述第一标识集合对应的自然人标识集合,所述自然人标识集合与所述第一标识集合具有关联关系,且所述自然人标识集合中的每个自然人标识至少对应所述第一标识集合中的一个账户标识;
获取所述目标平台的第二标识集合,所述第二标识集合为登录所述目标平台的设备标识以及浏览器标识中的至少一个;
计算所述第二标识集合中的各标识与所述自然人标识集合中的各自然人标识的相似度;
若所述第二标识集合中存在与所述自然人标识集合中的各自然人标识的相似度大于阈值的目标标识,则建立所述目标标识与第一自然人标识的关联关系,所述第一自然人标识为所述自然人标识集合中与所述目标标识的相似度最大的自然人标识。
可选地,所述计算所述第二标识集合中的各标识与所述自然人标识集合中的各自然人标识的相似度包括:
步骤1:确定第一标识对应的第一账户标识集合,所述第一标识为所述第二标识集合中的任一标识,所述第一账户标识集合为与所述第一标识具有关联关系的账户标识的集合,且所述第一账户集合包含于所述第一标识集合;
步骤2:确定第二自然人标识对应的第二账户标识集合,所述第二自然人标识为所述自然人标识集合中的任一标识,所述第二账户标识子集合为与所述第二自然人标识具有关联关系的账户标识的集合,且所述第二账户标识集合包含于所述第一标识集合;
步骤3:计算所述第一账户标识集合与所述第二账户标识集合之间的相似度;
重复执行步骤1至步骤3,直至将所述第二标识集合中的各标识与所述自然人标识集合中的各自然人标识的相似度计算完毕为止,得到所述第二标识集合中的各标识与所述自然人标识集合中的各自然人标识的相似度。
可选地,所述计算所述第一账户标识集合与所述第二账户标识集合之间的相似度包括:
通过如下公式计算所述第一账户表示集合与所述第二账户标识集合之间的相似度:
Figure BDA0001716354940000021
其中,U(Pi)为所述第二账户标识集合,U(Dj)为所述第一账户标识集合。
可选地,所述对所述第一标识集合进行计算,以得到所述第一标识集合对应的自然人标识集合包括:
对所述第一标识集合中的各个标识进行账号相似度度量和图传播算法的处理,以得到所述自然人标识集合。
可选地,所述获取所述目标平台的第二标识集合包括:
发送请求信息至登录所述目标平台的各终端设备;
接收所述各终端设备发送的多个设备标识和/或多个浏览器标识,得到所述第二标识集合,其中,每个终端设备对应一个设备标识或一个浏览器标识。
可选地,若所述第二标识集合中不存在与所述自然人标识集合中的各自然人标识的相似度大于阈值的目标标识,所述方法还包括:
通过预设的聚类算法建立第一标识与目标自然人标识的关联关系,所述第一标识为所述第二标识集合中除所述目标标识之外的标识中的任一个,所述目标自然人标识为所述自然人标识集合中除所述第一自然人标识之外的任一个自然人标识。
可选地,所述通过预设的聚类算法建立第一标识与目标自然人标识的关联关系包括:
根据最大连通子图将所述第二标识集合中除所述目标标识之外的标识生成聚类图集合;
为所述聚类图集合中的每个聚类图分配唯一的自然人标识,以建立所述第一标识与所述目标自然人标识的关联关系。
本发明实施例第二方面提供了一种建立各标识的关联关系的装置,包括:
获取单元,用于获取目标平台的第一标识集合,所述第一标识集合为所述目标平台中的账号标识的集合;
第一计算单元,用于对所述第一标识集合进行计算,以得到所述第一标识集合对应的自然人标识集合,所述自然人标识集合与所述第一标识集合具有关联关系,且所述自然人标识集合中的每个自然人标识至少对应所述第一标识集合中的一个账户标识;
所述获取单元还用于获取所述目标平台的第二标识集合,所述第二标识集合为登录所述目标平台的设备标识以及浏览器标识中的至少一个;
第二计算单元,用于计算所述第二标识集合中的各标识与所述自然人标识集合中的各自然人标识的相似度;
处理单元,用于若所述第二标识集合中存在与所述自然人标识集合中的各自然人标识的相似度大于阈值的目标标识,则建立所述目标标识与第一自然人标识的关联关系,所述第一自然人标识为所述自然人标识集合中与所述目标标识的相似度最大的自然人标识。
可选地,所述第二计算单元具体用于:
步骤1:确定第一标识对应的第一账户标识集合,所述第一标识为所述第二标识集合中的任一标识,所述第一账户标识集合为与所述第一标识具有关联关系的账户标识的集合,且所述第一账户集合包含于所述第一标识集合;
步骤2:确定第二自然人标识对应的第二账户标识集合,所述第二自然人标识为所述自然人标识集合中的任一标识,所述第二账户标识子集合为与所述第二自然人标识具有关联关系的账户标识的集合,且所述第二账户标识集合包含于所述第一标识集合;
步骤3:计算所述第一账户标识集合与所述第二账户标识集合之间的相似度;
重复执行步骤1至步骤3,直至将所述第二标识集合中的各标识与所述自然人标识集合中的各自然人标识的相似度计算完毕为止,得到所述第二标识集合中的各标识与所述自然人标识集合中的各自然人标识的相似度。
可选地,所述第二计算单元还具体用于:
通过如下公式计算所述第一账户表示集合与所述第二账户标识集合之间的相似度:
Figure BDA0001716354940000041
其中,U(Pi)为所述第二账户标识集合,U(Dj)为所述第一账户标识集合。
可选地,所述第一计算单元具体用于:
对所述第一标识集合中的各个标识进行账号相似度度量和图传播算法的处理,以得到所述自然人标识集合。
可选地,所述获取单元具体用于:
发送请求信息至登录所述目标平台的各终端设备;
接收所述各终端设备发送的多个设备标识和/或多个浏览器标识,得到所述第二标识集合,其中,每个终端设备对应一个设备标识或一个浏览器标识。
可选地,所述处理单元还用于:
若所述第二标识集合中不存在与所述自然人标识集合中的各自然人标识的相似度大于阈值的目标标识,通过预设的聚类算法建立第一标识与目标自然人标识的关联关系,所述第一标识为所述第二标识集合中除所述目标标识之外的标识中的任一个,所述目标自然人标识为所述自然人标识集合中除所述第一自然人标识之外的任一个自然人标识。
可选地,所述处理单元具体用于:
根据最大连通子图将所述第二标识集合中除所述目标标识之外的标识生成聚类图集合;
为所述聚类图集合中的每个聚类图分配唯一的自然人标识,以建立所述第一标识与所述目标自然人标识的关联关系。
本发明第三方面提供了一种电子设备,包括存储器、处理器,其特征在于,所述处理器用于执行存储器中存储的计算机管理类程序时实现如上述任意一项所述的建立各标识的关联关系的方法的步骤。
本发明第四方面提供了一种计算机可读存储介质,其上存储有计算机管理类程序,其特征在于:所述计算机管理类程序被处理器执行时实现如上述任意一项所述的建立各标识的关联关系的方法的步骤。
综上所述,可以看出,本发明实施例中,通过上述建立目标标识与自然人标识的关联关系,实现直播平台的推荐从原始的以账号的方式进行推荐,到本发明的通过自然人标识进行跨屏幕、跨账号进行推荐。也就是说,只需要知道自然人的标识,就可以获取与自然人标识具有关联关系的账号标识以及无线设备标识的一些喜好信息,进而可以反映出自然人的行为偏好,提高为直播平台为自然人推荐的精度。
附图说明
图1为本发明实施例提供的一种建立各标识的关联关系的方法的流程示意图;
图2为本发明实施例提供的一种建立各标识的关联关系的装置的实施例示意图;
图3为本发明实施例提供的一种建立各标识的关联关系的装置的硬件结构示意图;
图4为本发明实施例提供的一种电子设备的实施例示意图;
图5为本发明实施例提供的一种计算机可读存储介质的实施例示意图。
具体实施方式
本发明实施例提供了一种建立各标识的关联关系的方法和相关设备,用于提高直播平台的推荐精度。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
下面从建立各标识的关联关系的装置的角度对本发明中建立各标识的关联关系的方法进行说明,该建立各标识的关联关系的装置可以为服务器,也可以为服务器中的功能单元,具体不做限定。
请参阅图1,图1为本发明实施例提供的建立各标识的关联关系的方法的一个实施例示意图,包括:
101、获取目标平台的第一标识集合。
本实施例中,建立各标识的关联关系的装置可以获取目标平台的第一标识集合,其中,第一标识集合为目标平台中账号标识的集合,也就是说,可以获取到在目标平台注册的所有账号标识的集合,例如,可以获取到“斗鱼直播平台”中注册的所有账号,并将注册的所有账号作为第一标识集合。
102、对第一标识集合进行计算,以得到第一标识集合对应的自然人标识集合。
本实施例中,建立各标识的关联关系的装置可以对第一标识集合进行计算,以得到第一标识集合对应的自然人标识集合,其中,自然人标识集合与第一标识集合具有关联关系,且自然人标识集合中的每个自然人标识至少对应第一标识集合中的一个账户标识。具体的,将目标平台中的所有账户类标识uid通过一定的聚合算法得到自然人标识id,此处用person_id来表示。账号同人识别的目的在于找账号标识uid背后所属具有真正意义的自然人。在直播平台上,一般采用账号相似度度量算法和图传播算法,当然也可以采用其他算法进行计算,具体不做限定。
103、获取目标平台的第二标识集合。
本实施例中,可以获取目标平台第二标识集合,其中第二标识集合为登录目标平台的设备标识以及浏览器标识中的至少一个。具体的,用户登录目标平台的设备可以是无线设备,例如手机终端、平板终端等,也可以是计算机终端,当用户使用无线设备登录目标平台时,可以通过无线设备目标平台的客户端在进行数据交互时,获取到登录目标平台的无线设备的标识,此处的标识可以是无线设备的唯一标识,例如可以是手机的手机iemi码,当用户使用计算机终端登录目标平台时,由于使用计算机终端可能属于公共计算机终端,因此此时只能获取用户在通过浏览器浏览目标平台时浏览器标识cookieID。
需要说明的是,步骤103获取第二标识集合还可以通过如下方式得到:
发送请求信息至登录目标平台的各终端设备;
接收各终端设备发送的多个设备标识和/或多个浏览器标识,得到第二标识集合,其中,每个终端设备对应一个设备标识或一个浏览器标识。
需要说明的是,通过步骤101至步骤102可以确定自然人标识集合,通过步骤103可以获取到第二标识集合,然而,这两个步骤之间并没有先后执行顺序的限制,可以先执行步骤101至步骤102,也可以先执行步骤103,或者同时执行,具体不做限定。
需要说明的是,第二标识集合可以包括设备标识或浏览器标识,为了便于理解以及描述简便,下面以设备标识did为例进行说明:
104、计算第二标识集合中的各标识与自然人标识集合中的各自然人的标识的相似度。
本实施例中,在得到了第二标识集合以及自然人标识集合之后,可以分别计算第二标识集合中的每个标识与自然人标识集合中的所有自然人标识的相似度。
具体计算步骤如下:
步骤1:确定第一标识对应的第一账户标识集合,第一标识为第二标识集合中的任一标识,第一账户标识集合为与第一标识具有关联关系的账户标识的集合,且第一账户集合包含于所述第一标识集合;也就是说,步骤1需要确定自然人ID对应的目标平台中的账户ID集合。
步骤2:确定第二自然人标识对应的第二账户标识集合,第二自然人标识为自然人标识集合中的任一标识,第二账户标识子集合为与第二自然人标识具有关联关系的账户标识的集合,且第二账户标识集合包含于所述第一标识集合;也就是说,步骤2中需要确定使用同一无线设备登录目标平台的账户ID集合。
步骤3:计算所述第一账户标识集合与所述第二账户标识集合之间的相似度。一个用户可能通过多个账号登录目标平台,也就是说,一个自然人person_id对应多个uid,可以构成一个集合;而使用同一个无线设备登录目标平台的账号也可以有多个,也即一个did对应的uid也能构成一个集合,通过计算两个集合之间的相似度即可计算任意did和person_id之间的关系,通过如下公式进行计算:
Figure BDA0001716354940000081
其中:sim(Pi,Dj)是person_id集合中的Pi和使用did对应的Dj相似度;
U(Pi)是person_id对应Pi的uid集合;
U(Dj)是did对应Dj的uid集合。
重复执行步骤1至步骤3,直至将第二标识集合中的各标识与自然人标识集合中的各自然人标识的相似度计算完毕为止,得到第二标识集合中的各标识与自然人标识集合中的各自然人标识的相似度。
105、若第二标识集合中存在与自然人标识集合中的各自然人标识的相似度大于阈值的目标标识,则建立目标标识与第一自然人标识的关联关系。
本实施例中,在计算得到第二标识集合中的各标识与自然人标识集合中的各自然人标识的相似度之后,可以判断下,第二标识集合中是否存在与自然人标识集合中的各自然人标识的相似度大于阈值的目标标识,若有,则建立目标标识与第一自然人标识的关联关系,其中,第一自然人标识为自然人标识集合中与目标标识的相似度最大的自然人标识。
需要说明的是,此处并不具体限定阈值的大小,例如可以为0.15,也可以为其他数值,只要符合计算标准即可。
需要说明的是,若第二标识集合中不存在与所述自然人标识集合中的各自然人标识的相似度大于阈值的目标标识,通过预设的聚类算法建立第一标识与目标自然人标识的关联关系,第一标识为第二标识集合中除目标标识之外的标识中的任一个,目标自然人标识为自然人标识集合中除第一自然人标识之外的任一个自然人标识。
也就是说,可以根据最大连通子图将第二标识集合中除目标标识之外的标识生成聚类图集合,之后为聚类图集合中的每个聚类图分配唯一的自然人标识,以建立第一标识与目标自然人标识的关联关系。
具体如下,从上述方法可以知道并不是第二标识集合中的所有无线设备标识did都可以找到与之对应的自然人标识person_id,也就是说,并不是所有的did都可以找到挂靠的person_id,因此对于第二标识集合中剩下的did需要采用一定的聚类方法进行聚类,例如采用了最大连通子图生成聚类图,具体做法是将无法与person_id建立关联关系的did当作图的顶点,如果两个did之间被共同的uid使用过那么就形成该图的一条边,该图在建立完毕后找到各个连通子图,每个子图就是聚类的结果。将子图簇分配唯一的id,这些id被称为设备类person_id,也即建立了person_id与did之间的关联关系。
需要说明的是,上述以无线设备的标识did为例进行说明了,如何建立did与person_id之间的关联关系,计算机终端中的浏览器标识cookieID与person_id建立关联关系的方式与建立did与person_id之间的关联关系类似,上述已经进行了详细说明,具体此处不再赘述。
综上所述,可以看出,本发明实施例中,通过上述建立目标标识与自然人标识的关联关系,实现直播平台的推荐从原始的以账号的方式进行推荐,到本发明的通过自然人标识进行跨屏幕、跨账号进行推荐。也就是说,只需要知道自然人的标识,就可以获取与自然人标识具有关联关系的账号标识以及无线设备标识的一些喜好信息,进而可以反映出自然人的行为偏好,提高为自然人推荐的精度。
上面对本发明实施例中建立各标识的关联关系的方法进行了描述,下面对本发明实施例中的建立各标识的关联关系的装置进行描述。
请参阅图2,本发明实施例中建立各标识的关联关系的装置的一个实施例,包括:
获取单元201,用于获取目标平台的第一标识集合,所述第一标识集合为所述目标平台中的账号标识的集合;
第一计算单元202,用于对所述第一标识集合进行计算,以得到所述第一标识集合对应的自然人标识集合,所述自然人标识集合与所述第一标识集合具有关联关系,且所述自然人标识集合中的每个自然人标识至少对应所述第一标识集合中的一个账户标识;
所述获取单元201还用于获取所述目标平台的第二标识集合,所述第二标识集合为登录所述目标平台的设备标识以及浏览器标识中的至少一个;
第二计算单元203,用于计算所述第二标识集合中的各标识与所述自然人标识集合中的各自然人标识的相似度;
处理单元204,用于若所述第二标识集合中存在与所述自然人标识集合中的各自然人标识的相似度大于阈值的目标标识,则建立所述目标标识与第一自然人标识的关联关系,所述第一自然人标识为所述自然人标识集合中与所述目标标识的相似度最大的自然人标识。
可选地,所述第二计算单元203具体用于:
步骤1:确定第一标识对应的第一账户标识集合,所述第一标识为所述第二标识集合中的任一标识,所述第一账户标识集合为与所述第一标识具有关联关系的账户标识的集合,且所述第一账户集合包含于所述第一标识集合;
步骤2:确定第二自然人标识对应的第二账户标识集合,所述第二自然人标识为所述自然人标识集合中的任一标识,所述第二账户标识子集合为与所述第二自然人标识具有关联关系的账户标识的集合,且所述第二账户标识集合包含于所述第一标识集合;
步骤3:计算所述第一账户标识集合与所述第二账户标识集合之间的相似度;
重复执行步骤1至步骤3,直至将所述第二标识集合中的各标识与所述自然人标识集合中的各自然人标识的相似度计算完毕为止,得到所述第二标识集合中的各标识与所述自然人标识集合中的各自然人标识的相似度。
可选地,所述第二计算单元203还具体用于:
通过如下公式计算所述第一账户表示集合与所述第二账户标识集合之间的相似度:
Figure BDA0001716354940000111
其中,U(Pi)为所述第二账户标识集合,U(Dj)为所述第一账户标识集合。
可选地,所述第一计算单元202具体用于:
对所述第一标识集合中的各个标识进行账号相似度度量和图传播算法的处理,以得到所述自然人标识集合。
可选地,所述获取单元201具体用于:
发送请求信息至登录所述目标平台的各终端设备;
接收所述各终端设备发送的多个设备标识和/或多个浏览器标识,得到所述第二标识集合,其中,每个终端设备对应一个设备标识或一个浏览器标识。
可选地,所述处理单元204还用于:
若所述第二标识集合中不存在与所述自然人标识集合中的各自然人标识的相似度大于阈值的目标标识,通过预设的聚类算法建立第一标识与目标自然人标识的关联关系,所述第一标识为所述第二标识集合中除所述目标标识之外的标识中的任一个,所述目标自然人标识为所述自然人标识集合中除所述第一自然人标识之外的任一个自然人标识。
可选地,所述处理单元204具体用于:
根据最大连通子图将所述第二标识集合中除所述目标标识之外的标识生成聚类图集合;
为所述聚类图集合中的每个聚类图分配唯一的自然人标识,以建立所述第一标识与所述目标自然人标识的关联关系。
综上所述,可以看出,本发明实施例中,通过上述建立目标标识与自然人标识的关联关系,实现直播平台的推荐从原始的以账号的方式进行推荐,到本发明的通过自然人标识进行跨屏幕、跨账号进行推荐。也就是说,只需要知道自然人的标识,就可以获取与自然人标识具有关联关系的账号标识以及无线设备标识的一些喜好信息,进而可以反映出自然人的行为偏好,提高为自然人推荐的精度。
上面图2从模块化功能实体的角度对本发明实施例中的建立各标识的关联关系的装置进行了描述,下面从硬件处理的角度对本发明实施例中的建立各标识的关联关系的装置进行详细描述,请参阅图3,本发明实施例中的建立各标识的关联关系的装置300一个实施例,包括:
输入装置301、输出装置302、处理器303和存储器304(其中处理器303的数量可以一个或多个,图3中以一个处理器303为例)。在本发明的一些实施例中,输入装置301、输出装置302、处理器303和存储器304可通过总线或其它方式连接,其中,图3中以通过总线连接为例。
其中,通过调用存储器304存储的操作指令,处理器303,用于执行如下步骤:
获取目标平台的第一标识集合,所述第一标识集合为所述目标平台中的账号标识的集合;
对所述第一标识集合进行计算,以得到所述第一标识集合对应的自然人标识集合,所述自然人标识集合与所述第一标识集合具有关联关系,且所述自然人标识集合中的每个自然人标识至少对应所述第一标识集合中的一个账户标识;
获取所述目标平台的第二标识集合,所述第二标识集合为登录所述目标平台的设备标识以及浏览器标识中的至少一个;
计算所述第二标识集合中的各标识与所述自然人标识集合中的各自然人标识的相似度;
若所述第二标识集合中存在与所述自然人标识集合中的各自然人标识的相似度大于阈值的目标标识,则建立所述目标标识与第一自然人标识的关联关系,所述第一自然人标识为所述自然人标识集合中与所述目标标识的相似度最大的自然人标识。
可选地,所述计算所述第二标识集合中的各标识与所述自然人标识集合中的各自然人标识的相似度包括:
步骤1:确定第一标识对应的第一账户标识集合,所述第一标识为所述第二标识集合中的任一标识,所述第一账户标识集合为与所述第一标识具有关联关系的账户标识的集合,且所述第一账户集合包含于所述第一标识集合;
步骤2:确定第二自然人标识对应的第二账户标识集合,所述第二自然人标识为所述自然人标识集合中的任一标识,所述第二账户标识子集合为与所述第二自然人标识具有关联关系的账户标识的集合,且所述第二账户标识集合包含于所述第一标识集合;
步骤3:计算所述第一账户标识集合与所述第二账户标识集合之间的相似度;
重复执行步骤1至步骤3,直至将所述第二标识集合中的各标识与所述自然人标识集合中的各自然人标识的相似度计算完毕为止,得到所述第二标识集合中的各标识与所述自然人标识集合中的各自然人标识的相似度。
可选地,所述计算所述第一账户标识集合与所述第二账户标识集合之间的相似度包括:
通过如下公式计算所述第一账户表示集合与所述第二账户标识集合之间的相似度:
Figure BDA0001716354940000131
其中,U(Pi)为所述第二账户标识集合,U(Dj)为所述第一账户标识集合。
可选地,所述对所述第一标识集合进行计算,以得到所述第一标识集合对应的自然人标识集合包括:
对所述第一标识集合中的各个标识进行账号相似度度量和图传播算法的处理,以得到所述自然人标识集合。
可选地,所述获取所述目标平台的第二标识集合包括:
发送请求信息至登录所述目标平台的各终端设备;
接收所述各终端设备发送的多个设备标识和/或多个浏览器标识,得到所述第二标识集合,其中,每个终端设备对应一个设备标识或一个浏览器标识。
可选地,若所述第二标识集合中不存在与所述自然人标识集合中的各自然人标识的相似度大于阈值的目标标识,所述方法还包括:
通过预设的聚类算法建立第一标识与目标自然人标识的关联关系,所述第一标识为所述第二标识集合中除所述目标标识之外的标识中的任一个,所述目标自然人标识为所述自然人标识集合中除所述第一自然人标识之外的任一个自然人标识。
可选地,所述通过预设的聚类算法建立第一标识与目标自然人标识的关联关系包括:
根据最大连通子图将所述第二标识集合中除所述目标标识之外的标识生成聚类图集合;
为所述聚类图集合中的每个聚类图分配唯一的自然人标识,以建立所述第一标识与所述目标自然人标识的关联关系。
请参阅图4,图4为本发明实施例提供的电子设备的实施例示意图。
如图4所示,本发明实施例提供了一种电子设备,包括存储器410、处理器420及存储在存储器420上并可在处理器420上运行的计算机程序411,处理器420执行计算机程序411时实现以下步骤:
获取目标平台的第一标识集合,所述第一标识集合为所述目标平台中的账号标识的集合;
对所述第一标识集合进行计算,以得到所述第一标识集合对应的自然人标识集合,所述自然人标识集合与所述第一标识集合具有关联关系,且所述自然人标识集合中的每个自然人标识至少对应所述第一标识集合中的一个账户标识;
获取所述目标平台的第二标识集合,所述第二标识集合为登录所述目标平台的设备标识以及浏览器标识中的至少一个;
计算所述第二标识集合中的各标识与所述自然人标识集合中的各自然人标识的相似度;
若所述第二标识集合中存在与所述自然人标识集合中的各自然人标识的相似度大于阈值的目标标识,则建立所述目标标识与第一自然人标识的关联关系,所述第一自然人标识为所述自然人标识集合中与所述目标标识的相似度最大的自然人标识。
在具体实施过程中,处理器420执行计算机程序411时,可以实现图1对应的实施例中任一实施方式。
由于本实施例所介绍的电子设备为实施本发明实施例中一种建立各标识的关联关系的装置所采用的设备,故而基于本发明实施例中所介绍的方法,本领域所属技术人员能够了解本实施例的电子设备的具体实施方式以及其各种变化形式,所以在此对于该电子设备如何实现本发明实施例中的方法不再详细介绍,只要本领域所属技术人员实施本发明实施例中的方法所采用的设备,都属于本发明所欲保护的范围。
请参阅图5,图5为本发明实施例提供的一种计算机可读存储介质的实施例示意图。
如图5所示,本实施例提供了一种计算机可读存储介质500,其上存储有计算机程序511,该计算机程序511被处理器执行时实现如下步骤:
获取目标平台的第一标识集合,所述第一标识集合为所述目标平台中的账号标识的集合;
对所述第一标识集合进行计算,以得到所述第一标识集合对应的自然人标识集合,所述自然人标识集合与所述第一标识集合具有关联关系,且所述自然人标识集合中的每个自然人标识至少对应所述第一标识集合中的一个账户标识;
获取所述目标平台的第二标识集合,所述第二标识集合为登录所述目标平台的设备标识以及浏览器标识中的至少一个;
计算所述第二标识集合中的各标识与所述自然人标识集合中的各自然人标识的相似度;
若所述第二标识集合中存在与所述自然人标识集合中的各自然人标识的相似度大于阈值的目标标识,则建立所述目标标识与第一自然人标识的关联关系,所述第一自然人标识为所述自然人标识集合中与所述目标标识的相似度最大的自然人标识。
在具体实施过程中,该计算机程序511被处理器执行时可以实现图1对应的实施例中任一实施方式。
需要说明的是,在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其它实施例的相关描述。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式计算机或者其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明实施例还提供了一种计算机程序产品,该计算机程序产品包括计算机软件指令,当计算机软件指令在处理设备上运行时,使得处理设备执行如图1对应实施例中的风电场数字化平台设计的方法中的流程。
所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的***,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修该,或者对其中部分技术特征进行等同替换;而这些修该或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (9)

1.一种建立各标识的关联关系的方法,其特征在于,包括:
获取目标平台的第一标识集合,所述第一标识集合为所述目标平台中的账号标识的集合;
对所述第一标识集合进行计算,以得到所述第一标识集合对应的自然人标识集合,所述自然人标识集合与所述第一标识集合具有关联关系,且所述自然人标识集合中的每个自然人标识至少对应所述第一标识集合中的一个账户标识;
获取所述目标平台的第二标识集合,所述第二标识集合为登录所述目标平台的设备标识以及浏览器标识中的至少一个;
计算所述第二标识集合中的各标识与所述自然人标识集合中的各自然人标识的相似度;
若所述第二标识集合中存在与所述自然人标识集合中的各自然人标识的相似度大于阈值的目标标识,则建立所述目标标识与第一自然人标识的关联关系,所述第一自然人标识为所述自然人标识集合中与所述目标标识的相似度最大的自然人标识;
所述计算所述第二标识集合中的各标识与所述自然人标识集合中的各自然人标识的相似度包括:
步骤1:确定第一标识对应的第一账户标识集合,所述第一标识为所述第二标识集合中的任一标识,所述第一账户标识集合为与所述第一标识具有关联关系的账户标识的集合,且所述第一账户标识集合包含于所述第一标识集合;
步骤2:确定第二自然人标识对应的第二账户标识集合,所述第二自然人标识为所述自然人标识集合中的任一标识,所述第二账户标识集合为与所述第二自然人标识具有关联关系的账户标识的集合,且所述第二账户标识集合包含于所述第一标识集合;
步骤3:计算所述第一账户标识集合与所述第二账户标识集合之间的相似度;
重复执行步骤1至步骤3,直至将所述第二标识集合中的各标识与所述自然人标识集合中的各自然人标识的相似度计算完毕为止,得到所述第二标识集合中的各标识与所述自然人标识集合中的各自然人标识的相似度。
2.根据权利要求1所述的方法,其特征在于,所述计算所述第一账户标识集合与所述第二账户标识集合之间的相似度包括:
通过如下公式计算所述第一账户标识集合与所述第二账户标识集合之间的相似度:
Figure DEST_PATH_IMAGE002
其中,
Figure DEST_PATH_IMAGE004
为所述第二账户标识集合,
Figure DEST_PATH_IMAGE006
为所述第一账户标识集合。
3.根据权利要求1所述的方法,其特征在于,所述对所述第一标识集合进行计算,以得到所述第一标识集合对应的自然人标识集合包括:
对所述第一标识集合中的各个标识进行账号相似度度量和图传播算法的处理,以得到所述自然人标识集合。
4.根据权利要求1所述的方法,其特征在于,所述获取所述目标平台的第二标识集合包括:
发送请求信息至登录所述目标平台的各终端设备;
接收所述各终端设备发送的多个设备标识和/或多个浏览器标识,得到所述第二标识集合,其中,每个终端设备对应一个设备标识或一个浏览器标识。
5.根据权利要求1至4中任一项所述的方法,其特征在于,若所述第二标识集合中不存在与所述自然人标识集合中的各自然人标识的相似度大于阈值的目标标识,所述方法还包括:
通过预设的聚类算法建立第一标识与目标自然人标识的关联关系,所述第一标识为所述第二标识集合中除所述目标标识之外的标识中的任一个,所述目标自然人标识为所述自然人标识集合中除所述第一自然人标识之外的任一个自然人标识。
6.根据权利要求5所述的方法,其特征在于,所述通过预设的聚类算法建立第一标识与目标自然人标识的关联关系包括:
根据最大连通子图将所述第二标识集合中除所述目标标识之外的标识生成聚类图集合;
为所述聚类图集合中的每个聚类图分配唯一的自然人标识,以建立所述第一标识与所述目标自然人标识的关联关系。
7.一种建立各标识的关联关系的装置,其特征在于,包括:
获取单元,用于获取目标平台的第一标识集合,所述第一标识集合为所述目标平台中的账号标识的集合;
第一计算单元,用于对所述第一标识集合进行计算,以得到所述第一标识集合对应的自然人标识集合,所述自然人标识集合与所述第一标识集合具有关联关系,且所述自然人标识集合中的每个自然人标识至少对应所述第一标识集合中的一个账户标识;
所述获取单元还用于获取所述目标平台的第二标识集合,所述第二标识集合为登录所述目标平台的设备标识以及浏览器标识中的至少一个;
第二计算单元,用于计算所述第二标识集合中的各标识与所述自然人标识集合中的各自然人标识的相似度;
处理单元,用于若所述第二标识集合中存在与所述自然人标识集合中的各自然人标识的相似度大于阈值的目标标识,则建立所述目标标识与第一自然人标识的关联关系,所述第一自然人标识为所述自然人标识集合中与所述目标标识的相似度最大的自然人标识;
所述第二计算单元具体还用于:
步骤1:确定第一标识对应的第一账户标识集合,所述第一标识为所述第二标识集合中的任一标识,所述第一账户标识集合为与所述第一标识具有关联关系的账户标识的集合,且所述第一账户标识集合包含于所述第一标识集合;
步骤2:确定第二自然人标识对应的第二账户标识集合,所述第二自然人标识为所述自然人标识集合中的任一标识,所述第二账户标识集合为与所述第二自然人标识具有关联关系的账户标识的集合,且所述第二账户标识集合包含于所述第一标识集合;
步骤3:计算所述第一账户标识集合与所述第二账户标识集合之间的相似度;
重复执行步骤1至步骤3,直至将所述第二标识集合中的各标识与所述自然人标识集合中的各自然人标识的相似度计算完毕为止,得到所述第二标识集合中的各标识与所述自然人标识集合中的各自然人标识的相似度。
8.一种电子设备,包括存储器、处理器,其特征在于,所述处理器用于执行存储器中存储的计算机管理类程序时实现如权利要求1至6中任意一项所述的建立各标识的关联关系的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机管理类程序,其特征在于:所述计算机管理类程序被处理器执行时实现如权利要求1至6中任意一项所述的建立各标识的关联关系的方法的步骤。
CN201810710215.0A 2018-07-02 2018-07-02 一种建立各标识的关联关系的方法以及相关设备 Active CN108985954B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810710215.0A CN108985954B (zh) 2018-07-02 2018-07-02 一种建立各标识的关联关系的方法以及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810710215.0A CN108985954B (zh) 2018-07-02 2018-07-02 一种建立各标识的关联关系的方法以及相关设备

Publications (2)

Publication Number Publication Date
CN108985954A CN108985954A (zh) 2018-12-11
CN108985954B true CN108985954B (zh) 2022-06-21

Family

ID=64539757

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810710215.0A Active CN108985954B (zh) 2018-07-02 2018-07-02 一种建立各标识的关联关系的方法以及相关设备

Country Status (1)

Country Link
CN (1) CN108985954B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110008999B (zh) * 2019-03-07 2021-07-27 腾讯科技(深圳)有限公司 目标帐号的确定方法、装置、存储介质及电子装置
CN113412608B (zh) * 2019-06-24 2022-11-15 深圳市欢太科技有限公司 内容推送方法、装置、服务端及存储介质
WO2020258102A1 (zh) * 2019-06-26 2020-12-30 深圳市欢太科技有限公司 内容推送方法、装置、移动终端及存储介质
WO2021012186A1 (zh) * 2019-07-23 2021-01-28 深圳市欢太科技有限公司 内容推送方法及相关产品
CN110493368B (zh) * 2019-08-21 2022-02-25 北京明略软件***有限公司 设备标识的匹配方法及装置
CN112148981A (zh) * 2020-09-29 2020-12-29 广州小鹏自动驾驶科技有限公司 同人识别方法、装置、设备和存储介质
CN112988842B (zh) * 2021-03-24 2023-12-22 北京百度网讯科技有限公司 关联用户id的方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102710755A (zh) * 2012-05-18 2012-10-03 华为技术有限公司 终端用户社交网的数据挖掘方法、相关方法、装置和***
CN104239490A (zh) * 2014-09-05 2014-12-24 电子科技大学 一种用于ugc网站平台的多账户检测方法及装置
CN105654321A (zh) * 2016-02-05 2016-06-08 腾讯科技(深圳)有限公司 建立关联关系的方法及装置
CN105991592A (zh) * 2015-02-15 2016-10-05 阿里巴巴集团控股有限公司 同人身份维护方法、装置及服务器
CN107404408A (zh) * 2017-08-30 2017-11-28 北京邮电大学 一种虚拟身份关联识别方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9773272B2 (en) * 2014-11-10 2017-09-26 0934781 B.C. Ltd. Recommendation engine

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102710755A (zh) * 2012-05-18 2012-10-03 华为技术有限公司 终端用户社交网的数据挖掘方法、相关方法、装置和***
CN104239490A (zh) * 2014-09-05 2014-12-24 电子科技大学 一种用于ugc网站平台的多账户检测方法及装置
CN105991592A (zh) * 2015-02-15 2016-10-05 阿里巴巴集团控股有限公司 同人身份维护方法、装置及服务器
CN105654321A (zh) * 2016-02-05 2016-06-08 腾讯科技(深圳)有限公司 建立关联关系的方法及装置
CN107404408A (zh) * 2017-08-30 2017-11-28 北京邮电大学 一种虚拟身份关联识别方法及装置

Also Published As

Publication number Publication date
CN108985954A (zh) 2018-12-11

Similar Documents

Publication Publication Date Title
CN108985954B (zh) 一种建立各标识的关联关系的方法以及相关设备
CN104717124B (zh) 一种好友推荐方法、装置及服务器
CN108170692B (zh) 一种热点事件信息处理方法和装置
CN107305611B (zh) 恶意账号对应的模型建立方法和装置、恶意账号识别的方法和装置
CN109255371B (zh) 一种确定直播平台虚假关注用户的方法以及相关设备
CN105099729B (zh) 一种识别用户身份标识的方法和装置
CN109379608B (zh) 一种直播间的推荐方法以及相关设备
EP3346396A1 (en) Multimedia resource quality assessment method and apparatus
CN114338064B (zh) 识别网络流量类型的方法、装置、***、设备和存储介质
CN115660711A (zh) 用户id生成方法、装置、电子设备及可读存储介质
CN109460930B (zh) 一种确定风险账户的方法以及相关设备
CN109120955B (zh) 一种直播间的推荐方法以及相关设备
CN109413439B (zh) 一种确定嫌疑用户的方法及相关设备
CN110876072B (zh) 一种批量注册用户识别方法、存储介质、电子设备及***
CN108076032A (zh) 一种异常行为用户识别方法及装置
CN110222297B (zh) 一种标签用户的识别方法以及相关设备
CN107277640A (zh) 基于直播平台的互动方法、装置和存储介质
CN110309328B (zh) 数据存储方法、装置、电子设备及存储介质
CN116401708A (zh) 去中心化社交图数据的本地差分隐私保护方法和***
CN115423030A (zh) 一种设备识别的方法和装置
CN109413459B (zh) 一种直播平台中用户的推荐方法以及相关设备
CN106549914B (zh) 一种独立访问者的识别方法及装置
CN105488038B (zh) 通信应用的个性化信息匹配方法及装置
CN108880935B (zh) 网络节点重要度的获得方法和装置、设备、存储介质
CN111382626B (zh) 视频中违规图像的检测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant