CN112131502A - 数据处理方法、数据处理装置、电子设备和介质 - Google Patents
数据处理方法、数据处理装置、电子设备和介质 Download PDFInfo
- Publication number
- CN112131502A CN112131502A CN201910560151.5A CN201910560151A CN112131502A CN 112131502 A CN112131502 A CN 112131502A CN 201910560151 A CN201910560151 A CN 201910560151A CN 112131502 A CN112131502 A CN 112131502A
- Authority
- CN
- China
- Prior art keywords
- account
- devices
- determining
- user
- objects
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title abstract description 14
- 230000006399 behavior Effects 0.000 claims description 98
- 238000000034 method Methods 0.000 claims description 34
- 238000004590 computer program Methods 0.000 claims description 17
- 230000015654 memory Effects 0.000 claims description 12
- 238000010586 diagram Methods 0.000 description 21
- 238000004891 communication Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000003491 array Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 239000002537 cosmetic Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本公开提供了一种数据处理方法,包括获得使用同一账号的多个设备的用户行为数据,基于所述多个设备的用户行为数据,确定所述多个设备之间的用户行为相似度,基于所述多个设备之间的用户行为相似度,确定所述账号是否为多用户共享账号,获得第一账号和使用所述第一账号的第一设备,以及在所述第一账号为多用户共享账号的情况下,基于所述第一账号以及所述第一设备,确定向所述第一设备推荐的内容。本公开还提供了一种数据处理装置、一种电子设备以及一种计算机可读存储介质。
Description
技术领域
本公开涉及一种数据处理方法、数据处理装置、电子设备和介质。
背景技术
电子商务虚拟的网络环境下,由于平台账号和购买身份的非强制限制,经常出现多设备共用账号的问题,即在不同终端设备上使用相同账号登陆但是实际购物身份是可能相同或者不同的。共用账号实际购物身份如果是同一个人,可能情况是这个人有多个使用中的设备,如家里有ipad、或者新换了手机、或者有多个设备轮换使用的***台全部用户至少10%以上,而且有着随电商平台的会员激励***的推广,有着占比越来越高的趋势。
个性化推荐***是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。然而,当前大多数推荐***采用的是基于账号的用户身份识别,即认为账号等于用户唯一身份id。但是如果账号的背后是多个使用中的用户,如同时男性和女性在使用一个账号,或者一个年老的人和一个年轻的人在使用一个账号,那么这种基于账号的推荐方法必然会带来用户兴趣和购买行为分析的混乱,导致用户画像结果的错乱,进而带来推荐结果的不精准。
发明内容
本公开的一个方面提供了一种数据处理方法,包括获得使用同一账号的多个设备的用户行为数据,基于所述多个设备的用户行为数据,确定所述多个设备之间的用户行为相似度,基于所述多个设备之间的用户行为相似度,确定所述账号是否为多用户共享账号,获得第一账号和使用所述第一账号的第一设备,以及在所述第一账号为多用户共享账号的情况下,基于所述第一账号以及所述第一设备,确定向所述第一设备推荐的内容。
可选地,所述确定所述多个设备之间的用户行为相似度包括基于两个设备的用户行为数据,确定与两个设备分别对应的第一对象集合和第二对象集合,确定所述第一对象集合与所述第二对象集合的交集,确定所述交集中的元素数量与指定数量的比值作为所述两个设备的用户行为相似度。
可选地,所述指定数量包括以下任意一种:第一对象集合的元素数量与第二对象集合的元素数量中的较低者;第一对象集合的元素数量与第二对象集合的元素数量中的较高者;或者第一对象集合与第二对象集合的并集的元素数量。
可选地,所述基于所述多个设备之间的用户行为相似度,确定所述账号是否为多用户共享账号包括,在所述多个设备中存在两个设备的用户行为相似度小于第一阈值的情况下,确定所述账号为多用户共享账号;在所述多个设备中的任意两个设备的用户行为相似度大于第二阈值的情况下,确定所述账号不为多用户共享账号。
可选地,所述基于所述多个设备的用户行为数据,确定所述多个设备之间的用户行为相似度,基于所述多个设备之间的用户行为相似度,确定所述账号是否为多用户共享账号包括,基于所述多个设备的用户行为数据,确定与每个设备对应的对象集合,按照所述对象集合中的元素数量对所述多个设备排序,按照顺序将所述多个设备两两比较,如果两个设备的用户行为相似度大于第三阈值,则记录两个设备的对应关系,并删除元素数量较少的设备继续比较,直至比较完成,得到剩余的设备集合,若所述剩余的设备集合中的设备数量为两个以上,则确定所述账号为多用户共享账号,若所述剩余的设备集合中的设备数量为一个,则确定所述账号不为多用户共享账号,并删除所述对应关系。
可选地,所述在所述第一账号为多用户共享账号的情况下,基于所述第一账号以及第一设备,确定向所述第一设备推荐的内容包括,在所述第一账号为多用户共享账号,且存在与所述第一设备具有所述对应关系的至少一个第二设备的情况下,基于所述第一账号、第一设备以及所述至少一个第二设备,确定向所述第一设备推荐的内容。
可选地,所述方法还包括在所述第一账号不为多用户共享账号的情况下,基于所述第一账号以及使用所述第一账号的多个设备,确定向所述第一设备推荐的内容。
本公开的另一个方面提供了一种数据处理装置,包括第一获得单元、第一确定单元、第二确定单元、第二获得单元以及第三确定单元。第一获得单元,用于获得使用同一账号的多个设备的用户行为数据。第一确定单元,用于基于所述多个设备的用户行为数据,确定所述多个设备之间的用户行为相似度。第二确定单元,用于基于所述多个设备之间的用户行为相似度,确定所述账号是否为多用户共享账号。第二获得单元,用于获得第一账号和使用所述第一账号的第一设备。第三确定单元,用于在所述第一账号为多用户共享账号的情况下,基于所述第一账号以及第一设备,确定向所述第一设备推荐的内容。
可选地,所述第一确定单元包括第一确定子单元、第二确定子单元以及第三确定子单元。第一确定子单元,用于基于两个设备的用户行为数据,确定与两个设备分别对应的第一对象集合和第二对象集合。第二确定子单元,用于确定所述第一对象集合与所述第二对象集合的交集。第三确定子单元,用于确定所述交集中的元素数量与指定数量的比值作为所述两个设备的用户行为相似度。
可选地,所述指定数量包括以下任意一种:第一对象集合的元素数量与第二对象集合的元素数量中的较低者;第一对象集合的元素数量与第二对象集合的元素数量中的较高者;或者第一对象集合与第二对象集合的并集的元素数量。
可选地,所述第二确定单元包括第四确定子单元和第五确定子单元。第四确定子单元,用于在所述多个设备中存在两个设备的用户行为相似度小于第一阈值的情况下,确定所述账号为多用户共享账号。第五确定子单元,用于在所述多个设备中的任意两个设备的用户行为相似度大于第二阈值的情况下,确定所述账号不为多用户共享账号。
可选地,所述第一确定单元和第二确定单元合并实现为确定模块,用于基于所述多个设备的用户行为数据,确定与每个设备对应的对象集合,按照所述对象集合中的元素数量对所述多个设备排序,按照顺序将所述多个设备两两比较,如果两个设备的用户行为相似度大于第三阈值,则记录两个设备的对应关系,并删除元素数量较少的设备继续比较,直至比较完成,得到剩余的设备集合,若所述剩余的设备集合中的设备数量为两个以上,则确定所述账号为多用户共享账号,若所述剩余的设备集合中的设备数量为一个,则确定所述账号不为多用户共享账号,并删除所述对应关系。
可选地,所述第三确定单元用于在所述第一账号为多用户共享账号,且存在与所述第一设备具有所述对应关系的至少一个第二设备的情况下,基于所述第一账号、第一设备以及所述至少一个第二设备,确定向所述第一设备推荐的内容。
可选地,所述装置还包括第四确定单元,用于在所述第一账号不为多用户共享账号的情况下,基于所述第一账号以及使用所述第一账号的多个设备,确定向所述第一设备推荐的内容。
本公开的另一个方面提供了一种电子设备,包括处理器以及存储器。所述存储器上存储有计算机程序,所述计算机程序被处理器执行时使得处理器执行如上所述的方法。
本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
附图说明
为了更完整地理解本公开及其优势,现在将参考结合附图的以下描述,其中:
图1A和图1B示意性示出了根据本公开实施例的数据处理方法的应用场景的示意图;
图2示意性示出了根据本公开实施例的数据处理方法的流程图;
图3示意性示出了根据本公开另一实施例的数据处理方法的流程图;
图4示意性示出了根据本公开实施例的确定两个设备之间的用户行为相似度的流程图;
图5示意性示出了根据本公开另一实施例的基于用户行为数据确定所述账号是否为多用户共享账号的流程图;
图6示意性示出了根据本公开实施例的数据处理装置的框图;
图7示意性示出了根据本公开实施例的第一确定单元的框图;
图8示意性示出了根据本公开实施例的第二确定单元的框图;
图9示意性示出了根据本公开另一实施例的数据处理装置的框图;
图10示意性示出了根据本公开另一实施例的数据处理装置的框图;以及
图11示意性示出了根据本公开实施例的电子设备的框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的***”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的***等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的***”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的***等)。
附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读存储介质上的计算机程序产品的形式,该计算机程序产品可供指令执行***使用或者结合指令执行***使用。
本公开的实施例提供了一种数据处理方法,包括获得使用同一账号的多个设备的用户行为数据,基于所述多个设备的用户行为数据,确定所述多个设备之间的用户行为相似度,基于所述多个设备之间的用户行为相似度,确定所述账号是否为多用户共享账号,获得第一账号和使用所述第一账号的第一设备,以及在所述第一账号为多用户共享账号的情况下,基于所述第一账号以及所述第一设备,确定向所述第一设备推荐的内容。
图1A和图1B示意性示出了根据本公开实施例的数据处理方法的应用场景的示意图。需要注意的是,图1A和图1B所示仅为可以应用本公开实施例的场景的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、***、环境或场景。
如图1A所示,根据该实施例的***架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
需要说明的是,本公开实施例所提供的数据处理方法一般可以由服务器105执行。相应地,本公开实施例所提供的数据处理装置一般可以设置于服务器105中。本公开实施例所提供的数据处理方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的数据处理装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
应该理解,图1A中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
图1B示意性地示出了使用同一个账号的多个电子设备。
如图1B所示,本公开实施例的示例中共有5个设备使用了该账号,其中,设备1、设备2、设备3为用户A使用,设备4为用户B使用,设备5为用户C使用。根据本公开实施例,用户A和用户B例如可以是一对夫妻,用户C例如可以是用户A的母亲,设备1、设备4、设备5例如可以分别是用户A、用户B和用户C的手机,设备2可以是用户A的笔记本电脑,设备3可以是用户A的平板电脑。在这种情况下,如果按照传统的模式认为该账号是同一个用户使用,则会造成推荐结果混乱,达不到理想的推荐效果。
本公开实施例的方法首先根据使用同一账号的多个设备的用户行为数据判断该账号是否是多个用户使用,即是否为多用户共享账号。如果是,则根据设备的识别信息向不同设备推送不同的内容,即,根据账号中的不同设备的用户行为数据分别构建用户画像,以向不同设备推送不同的内容。如果不是,则可以直接根据账号进行推荐,而无需关心是该账号正在由哪个设备使用,即,可以基于使用该账号的全部设备的用户行为数据构建一个用户画像,以确定推荐的内容。
图2示意性示出了根据本公开实施例的数据处理方法的流程图。
如图2所示,该方法包括操作S210~S250。大致可以分为两个阶段,第一阶段包括操作S210~S230,用于确定某一账号是否为多用户共享账号;第二阶段包括操作S240和操作S250,用于在需要推荐时,根据该账号是否为多用户共享账号,以不同的方式进行推荐。
在操作S210,获得使用同一账号的多个设备的用户行为数据。例如,可以获得该账号的各个设备浏览、购买对象的用户行为的历史记录。
在操作S220,基于所述多个设备的用户行为数据,确定所述多个设备之间的用户行为相似度。例如可以参照下文图4所描述的实施例确定两两之间的相似度。
在操作S230,基于所述多个设备之间的用户行为相似度,确定所述账号是否为多用户共享账号。
例如,在所述多个设备中存在两个设备的用户行为相似度小于第一阈值的情况下,可以确定所述账号为多用户共享账号;在所述多个设备中的任意两个设备的用户行为相似度大于第二阈值的情况下,可以确定所述账号不为多用户共享账号。其中,第二阈值可以等于或者大于第一阈值。例如,第一阈值可以为0.5,第二阈值可以为0.5或者0.7等等。或者,也可以参照下文图5所示意的方法确定该账号是否为多用户共享账号。
在操作S240,获得第一账号和使用所述第一账号的第一设备。
在操作S250,在所述第一账号为多用户共享账号的情况下,基于所述第一账号以及所述第一设备,确定向所述第一设备推荐的内容。例如,可以通过账号中的不同设备的用户行为数据分别构建用户画像,在需要推送时,根据设备的识别信息向不同设备推送不同的内容。
图3示意性示出了根据本公开另一实施例的数据处理方法的流程图。
如图3所示,在推荐阶段,执行操作S240获得第一账号和使用所述第一账号的第一设备之后,该方法还包括操作S251~S253。
在操作S251,判断第一账号是否为多用户共享账号,若是,则执行操作S252,基于所述第一账号以及所述第一设备,确定向所述第一设备推荐的内容,相当于图2所示意的操作S250。若第一账号不是多用户共享账号,则执行操作S253。
在操作S253,基于所述第一账号以及使用所述第一账号的多个设备,确定向所述第一设备推荐的内容。如果不是多用户账号,可以直接根据账号进行推荐,而无需关心是该账号正在由哪个设备使用,即,可以基于使用该账号的全部设备的用户行为数据构建一个用户画像,以确定推荐的内容。
根据本公开实施例,不同的设备可以通过设备的识别信息进行区分,例如可以通过唯一标识的设备号,或者联网设备的物理地址(MAC)等,对不同的设备加以区分。
该方法通过对使用同一账号的多个设备的用户行为数据进行分析,确定该账号是否为多用户共享账号,并能够据此提供不同的推荐策略。
图4示意性示出了根据本公开实施例的确定两个设备之间的用户行为相似度的流程图。
如图4所示,该方法包括操作S410~S430。
在操作S410,基于两个设备的用户行为数据,确定与两个设备分别对应的第一对象集合和第二对象集合。例如,设备1经常访问智能穿戴、婴儿用品两种品类的对象,设备4经常访问女装、化妆品、婴儿用品三种品类的对象,这些对象形成与设备1、设备4分别对应的对象集合,即设备1对应的对象集合为{“智能穿戴”、“婴儿用品”},设备4对应的对象集合{“女装”、“化妆品”、“婴儿用品”}。
在操作S420,确定所述第一对象集合与所述第二对象集合的交集。例如,在上述实施例中,交集为{“婴儿用品”}。
在操作S430,确定所述交集中的元素数量与指定数量的比值作为所述两个设备的用户行为相似度。其中,所述指定数量包括以下任意一种:第一对象集合的元素数量与第二对象集合的元素数量中的较低者;第一对象集合的元素数量与第二对象集合的元素数量中的较高者;或者第一对象集合与第二对象集合的并集的元素数量。
例如,在上述实施例中,若以较低者作为指定数量,则用户行为相似度为1/2;若以较高者作为指定数量,则用户行为相似度为1/3;若以并集的元素数量为指定数量,则用户行为相似度为1/4。只要统一按照一种方式确定指定数量集合。显然,采用的指定数量的确定方式不同,造成相似度的结果也不同,上文所描述的第一阈值、第二阈值以及下文描述的第三阈值也应当根据指定数量的确定方式来确定。
图5示意性示出了根据本公开另一实施例的基于用户行为数据确定所述账号是否为多用户共享账号的流程图。
如图5所示,该方法包括操作S510~S560。
在操作S510,基于所述多个设备的用户行为数据,确定与每个设备对应的对象集合。
在操作S520,按照所述对象集合中的元素数量对所述多个设备排序。例如,可以按照元素数量递增或递减的顺序将多个设备进行排序。
在操作S530,按照顺序将所述多个设备两两比较,如果两个设备的用户行为相似度大于第三阈值,则记录两个设备的对应关系,并删除元素数量较少的设备继续比较,直至比较完成,得到剩余的设备集合。其中,第三阈值类似于上述第一阈值和第二阈值,例如可以设置为0.5或0.7等。
例如,假设设备4对应的对象集合中的元素最多,之后依次是设备1、设备2、设备5、设备3,可以从元素最多的设备4开始,执行如下比较过程:
设备4与设备1的用户行为相似度不大于第三阈值;
设备1与设备2的用户行为相似度大于第三阈值,记录设备1和设备2的对应关系,将设备2向上折叠为设备1,在继续比较时使用设备1代替设备2进行比较,即删除了元素数量较少的设备2;
设备1与设备5的用户行为相似度不大于第三阈值;
设备5与设备3的用户行为相似度不大于第三阈值。
在本公开的一些实施例中,由于设备2已经向上折叠为设备1,不再将设备2与设备4进行比较;在设备3由于与设备5的用户行为相似度不大于第三阈值,可以继续向上分别与设备1和设备4比较,如果设备3与设备1的用户行为相似度大于第三阈值,将设备3向上折叠为设备1。至此,剩余的设备集合中剩下设备4、设备1和设备5,剩下的每一个设备被认为对应于一个不同的用户。
在操作S540,判断剩余的设备集合中的设备数量:若所述剩余的设备集合中的设备数量为一个,则执行操作S550;若所述剩余的设备集合中的设备数量为两个以上,则执行操作S560。
在操作S550,确定所述账号不为多用户共享账号,并删除所述对应关系。
在操作S560,确定所述账号为多用户共享账号。
在上述实施例中,剩余的设备集合中剩下3个设备,判断出设备1、设备4和设备5分别对应于3个用户,设备1的用户还使用设备2和设备3登录该账号。即使设备1、设备2和设备3不是由同一用户使用,由于其用户行为数据相似,按照同一用户处理也不会降低推荐效果。
根据本公开实施例,所述在所述第一账号为多用户共享账号的情况下,基于所述第一账号以及第一设备,确定向所述第一设备推荐的内容包括,在所述第一账号为多用户共享账号,且存在与所述第一设备具有所述对应关系的至少一个第二设备的情况下,基于所述第一账号、第一设备以及所述至少一个第二设备,确定向所述第一设备推荐的内容。
请继续参考图1B所示的实施例,该账号为多用户共享账号,如果设备1为第一设备,则存在与第一设备具有对应关系的第二设备,即设备2和设备3,在向设备1推荐内容时,可以基于设备1、设备2和设备3确定推荐内容,即,通过设备1、设备2和设备3的用户行为数据构建用户画像,以确定推荐内容。
基于同一发明构思,本公开还提供了一种数据处理装置,下面参照图6对本公开实施例的数据处理装置进行说明。
图6示意性示出了根据本公开实施例的数据处理装置600的框图。
如图6所示,数据处理装置600包括第一获得单元610、第一确定单元620、第二确定单元630、第二获得单元640以及第三确定单元650。该数据处理装置600可以执行上文描述的各种方法。
第一获得单元610,例如执行参考上文图2描述的操作S210,用于获得使用同一账号的多个设备的用户行为数据。
第一确定单元620,例如执行参考上文图2描述的操作S220,用于基于所述多个设备的用户行为数据,确定所述多个设备之间的用户行为相似度。
第二确定单元630,例如执行参考上文图2描述的操作S230,用于基于所述多个设备之间的用户行为相似度,确定所述账号是否为多用户共享账号。
第二获得单元640,例如执行参考上文图2描述的操作S240,用于获得第一账号和使用所述第一账号的第一设备。
第三确定单元650,例如执行参考上文图2描述的操作S250,用于在所述第一账号为多用户共享账号的情况下,基于所述第一账号以及第一设备,确定向所述第一设备推荐的内容。
图7示意性示出了根据本公开实施例的第一确定单元700的框图。
如图7所示,该第一确定单元700包括第一确定子单元710、第二确定子单元720以及第三确定子单元730。
第一确定子单元710,例如执行参考上文图4描述的操作S410,用于基于两个设备的用户行为数据,确定与两个设备分别对应的第一对象集合和第二对象集合。
第二确定子单元720,例如执行参考上文图4描述的操作S420,用于确定所述第一对象集合与所述第二对象集合的交集。
第三确定子单元730,例如执行参考上文图4描述的操作S430,用于确定所述交集中的元素数量与指定数量的比值作为所述两个设备的用户行为相似度。
根据本公开实施例,所述指定数量包括以下任意一种:第一对象集合的元素数量与第二对象集合的元素数量中的较低者;第一对象集合的元素数量与第二对象集合的元素数量中的较高者;或者第一对象集合与第二对象集合的并集的元素数量。
图8示意性示出了根据本公开实施例的第二确定单元800的框图。
如图8所示,该第二确定单元800包括第四确定子单元810和/或第五确定子单元820。
第四确定子单元810,用于在所述多个设备中存在两个设备的用户行为相似度小于第一阈值的情况下,确定所述账号为多用户共享账号。
第五确定子单元820,用于在所述多个设备中的任意两个设备的用户行为相似度大于第二阈值的情况下,确定所述账号不为多用户共享账号。
图9示意性示出了根据本公开另一实施例的数据处理装置900的框图。
如图9所示,前述实施例的第一确定单元620和第二确定单元630可以合并实现为确定模块920,例如执行参考上文图5描述的操作S510~S560,用于基于所述多个设备的用户行为数据,确定与每个设备对应的对象集合,按照所述对象集合中的元素数量对所述多个设备排序,按照顺序将所述多个设备两两比较,如果两个设备的用户行为相似度大于第三阈值,则记录两个设备的对应关系,并删除元素数量较少的设备继续比较,直至比较完成,得到剩余的设备集合,若所述剩余的设备集合中的设备数量为两个以上,则确定所述账号为多用户共享账号,若所述剩余的设备集合中的设备数量为一个,则确定所述账号不为多用户共享账号,并删除所述对应关系。
根据本公开实施例,第三确定单元650用于在所述第一账号为多用户共享账号,且存在与所述第一设备具有所述对应关系的至少一个第二设备的情况下,基于所述第一账号、第一设备以及所述至少一个第二设备,确定向所述第一设备推荐的内容。
图10示意性示出了根据本公开另一实施例的数据处理装置1000的框图。
如图10所示,该装置在前述实施例的基础上,还包括第四确定单元1010,例如执行参考上文图3描述的操作S253,用于在所述第一账号不为多用户共享账号的情况下,基于所述第一账号以及使用所述第一账号的多个设备,确定向所述第一设备推荐的内容。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上***、基板上的***、封装上的***、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,第一获得单元610、第一确定单元620、第二确定单元630、第二获得单元640、第三确定单元650、第一确定子单元710、第二确定子单元720、第三确定子单元730、第四确定子单元810、第五确定子单元820、确定模块920以及第四确定单元1010中的多个模块可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,第一获得单元610、第一确定单元620、第二确定单元630、第二获得单元640、第三确定单元650、第一确定子单元710、第二确定子单元720、第三确定子单元730、第四确定子单元810、第五确定子单元820、确定模块920以及第四确定单元1010中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上***、基板上的***、封装上的***、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,第一获得单元610、第一确定单元620、第二确定单元630、第二获得单元640、第三确定单元650、第一确定子单元710、第二确定子单元720、第三确定子单元730、第四确定子单元810、第五确定子单元820、确定模块920以及第四确定单元1010中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图11示意性示出了根据本公开实施例的适于实现上文描述的方法的计算机***的方框图。图11示出的计算机***仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图11所示,根据本公开实施例的计算机***1100包括处理器1101,其可以根据存储在只读存储器(ROM)1102中的程序或者从存储部分1108加载到随机访问存储器(RAM)1103中的程序而执行各种适当的动作和处理。处理器1101例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器1101还可以包括用于缓存用途的板载存储器。处理器1101可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 1103中,存储有***1100操作所需的各种程序和数据。处理器1101、ROM1102以及RAM 1103通过总线1104彼此相连。处理器1101通过执行ROM 1102和/或RAM 1103中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 1102和RAM 1103以外的一个或多个存储器中。处理器1101也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,***1100还可以包括输入/输出(I/O)接口1105,输入/输出(I/O)接口1105也连接至总线1104。***1100还可以包括连接至I/O接口1105的以下部件中的一项或多项:包括键盘、鼠标等的输入部分1106;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1107;包括硬盘等的存储部分1108;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1109。通信部分1109经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口1105。可拆卸介质1111,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1110上,以便于从其上读出的计算机程序根据需要被安装入存储部分1108。
根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1109从网络上被下载和安装,和/或从可拆卸介质1111被安装。在该计算机程序被处理器1101执行时,执行本公开实施例的***中限定的上述功能。根据本公开的实施例,上文描述的***、设备、装置、模块、单元等可以通过计算机程序模块来实现。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/***中所包含的;也可以是单独存在,而未装配入该设备/装置/***中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 1102和/或RAM 1103和/或ROM 1102和RAM 1103以外的一个或多个存储器。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。
Claims (14)
1.一种数据处理方法,包括:
获得使用同一账号的多个设备的用户行为数据;
基于所述多个设备的用户行为数据,确定所述多个设备之间的用户行为相似度;
基于所述多个设备之间的用户行为相似度,确定所述账号是否为多用户共享账号;
获得第一账号和使用所述第一账号的第一设备;以及
在所述第一账号为多用户共享账号的情况下,基于所述第一账号以及所述第一设备,确定向所述第一设备推荐的内容。
2.根据权利要求1所述的方法,其中,所述确定所述多个设备之间的用户行为相似度包括:
基于两个设备的用户行为数据,确定与两个设备分别对应的第一对象集合和第二对象集合;
确定所述第一对象集合与所述第二对象集合的交集;
确定所述交集中的元素数量与指定数量的比值作为所述两个设备的用户行为相似度,其中,所述指定数量包括以下任意一种:
第一对象集合的元素数量与第二对象集合的元素数量中的较低者;
第一对象集合的元素数量与第二对象集合的元素数量中的较高者;或者
第一对象集合与第二对象集合的并集的元素数量。
3.根据权利要求1所述的方法,其中,所述基于所述多个设备之间的用户行为相似度,确定所述账号是否为多用户共享账号包括:
在所述多个设备中存在两个设备的用户行为相似度小于第一阈值的情况下,确定所述账号为多用户共享账号;
在所述多个设备中的任意两个设备的用户行为相似度大于第二阈值的情况下,确定所述账号不为多用户共享账号。
4.根据权利要求1所述的方法,其中,所述基于所述多个设备的用户行为数据,确定所述多个设备之间的用户行为相似度,基于所述多个设备之间的用户行为相似度,确定所述账号是否为多用户共享账号包括:
基于所述多个设备的用户行为数据,确定与每个设备对应的对象集合;
按照所述对象集合中的元素数量对所述多个设备排序;
按照顺序将所述多个设备两两比较,如果两个设备的用户行为相似度大于第三阈值,则记录两个设备的对应关系,并删除元素数量较少的设备继续比较,直至比较完成,得到剩余的设备集合;
若所述剩余的设备集合中的设备数量为两个以上,则确定所述账号为多用户共享账号;
若所述剩余的设备集合中的设备数量为一个,则确定所述账号不为多用户共享账号,并删除所述对应关系。
5.根据权利要求4所述的方法,其中,所述在所述第一账号为多用户共享账号的情况下,基于所述第一账号以及第一设备,确定向所述第一设备推荐的内容包括:
在所述第一账号为多用户共享账号,且存在与所述第一设备具有所述对应关系的至少一个第二设备的情况下,基于所述第一账号、第一设备以及所述至少一个第二设备,确定向所述第一设备推荐的内容。
6.根据权利要求1所述的方法,还包括:
在所述第一账号不为多用户共享账号的情况下,基于所述第一账号以及使用所述第一账号的多个设备,确定向所述第一设备推荐的内容。
7.一种数据处理装置,包括:
第一获得单元,用于获得使用同一账号的多个设备的用户行为数据;
第一确定单元,用于基于所述多个设备的用户行为数据,确定所述多个设备之间的用户行为相似度;
第二确定单元,用于基于所述多个设备之间的用户行为相似度,确定所述账号是否为多用户共享账号;
第二获得单元,用于获得第一账号和使用所述第一账号的第一设备;
第三确定单元,用于在所述第一账号为多用户共享账号的情况下,基于所述第一账号以及第一设备,确定向所述第一设备推荐的内容。
8.根据权利要求7所述的装置,其中,所述第一确定单元包括:
第一确定子单元,用于基于两个设备的用户行为数据,确定与两个设备分别对应的第一对象集合和第二对象集合;
第二确定子单元,用于确定所述第一对象集合与所述第二对象集合的交集;
第三确定子单元,用于确定所述交集中的元素数量与指定数量的比值作为所述两个设备的用户行为相似度,其中,所述指定数量包括以下任意一种:
第一对象集合的元素数量与第二对象集合的元素数量中的较低者;
第一对象集合的元素数量与第二对象集合的元素数量中的较高者;或者
第一对象集合与第二对象集合的并集的元素数量。
9.根据权利要求7所述的装置,其中,所述第二确定单元包括:
第四确定子单元,用于在所述多个设备中存在两个设备的用户行为相似度小于第一阈值的情况下,确定所述账号为多用户共享账号;
第五确定子单元,用于在所述多个设备中的任意两个设备的用户行为相似度大于第二阈值的情况下,确定所述账号不为多用户共享账号。
10.根据权利要求7所述的装置,其中,所述第一确定单元和第二确定单元合并实现为确定模块,用于:
基于所述多个设备的用户行为数据,确定与每个设备对应的对象集合;
按照所述对象集合中的元素数量对所述多个设备排序;
按照顺序将所述多个设备两两比较,如果两个设备的用户行为相似度大于第三阈值,则记录两个设备的对应关系,并删除元素数量较少的设备继续比较,直至比较完成,得到剩余的设备集合;
若所述剩余的设备集合中的设备数量为两个以上,则确定所述账号为多用户共享账号;
若所述剩余的设备集合中的设备数量为一个,则确定所述账号不为多用户共享账号,并删除所述对应关系。
11.根据权利要求10所述的装置,其中,所述第三确定单元用于:
在所述第一账号为多用户共享账号,且存在与所述第一设备具有所述对应关系的至少一个第二设备的情况下,基于所述第一账号、第一设备以及所述至少一个第二设备,确定向所述第一设备推荐的内容。
12.根据权利要求7所述的装置,还包括:
第四确定单元,用于在所述第一账号不为多用户共享账号的情况下,基于所述第一账号以及使用所述第一账号的多个设备,确定向所述第一设备推荐的内容。
13.一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个计算机程序,
其中,当一个或多个计算机程序被一个或多个处理器执行时,使得一个或多个处理器实现权利要求1至6中任一项的方法。
14.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器实现权利要求1至6中任一项的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910560151.5A CN112131502A (zh) | 2019-06-25 | 2019-06-25 | 数据处理方法、数据处理装置、电子设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910560151.5A CN112131502A (zh) | 2019-06-25 | 2019-06-25 | 数据处理方法、数据处理装置、电子设备和介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112131502A true CN112131502A (zh) | 2020-12-25 |
Family
ID=73849504
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910560151.5A Pending CN112131502A (zh) | 2019-06-25 | 2019-06-25 | 数据处理方法、数据处理装置、电子设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112131502A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113094582A (zh) * | 2021-03-31 | 2021-07-09 | 联想(北京)有限公司 | 处理方法及装置、电子设备 |
CN113111197A (zh) * | 2021-04-16 | 2021-07-13 | 百度在线网络技术(北京)有限公司 | 多媒体内容的推荐方法、装置、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106372043A (zh) * | 2016-09-07 | 2017-02-01 | 福建师范大学 | 一种基于改进的Jaccard系数确定文档相似度的方法 |
CN107066616A (zh) * | 2017-05-09 | 2017-08-18 | 北京京东金融科技控股有限公司 | 用于账号处理的方法、装置及电子设备 |
US20180084080A1 (en) * | 2016-09-22 | 2018-03-22 | Adobe Systems Incorporated | Decomposing Media Content Accounts for Persona-based Experience Individualization |
CN108390788A (zh) * | 2018-03-05 | 2018-08-10 | 北京奇艺世纪科技有限公司 | 用户识别方法、装置及电子设备 |
-
2019
- 2019-06-25 CN CN201910560151.5A patent/CN112131502A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106372043A (zh) * | 2016-09-07 | 2017-02-01 | 福建师范大学 | 一种基于改进的Jaccard系数确定文档相似度的方法 |
US20180084080A1 (en) * | 2016-09-22 | 2018-03-22 | Adobe Systems Incorporated | Decomposing Media Content Accounts for Persona-based Experience Individualization |
CN107066616A (zh) * | 2017-05-09 | 2017-08-18 | 北京京东金融科技控股有限公司 | 用于账号处理的方法、装置及电子设备 |
CN108390788A (zh) * | 2018-03-05 | 2018-08-10 | 北京奇艺世纪科技有限公司 | 用户识别方法、装置及电子设备 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113094582A (zh) * | 2021-03-31 | 2021-07-09 | 联想(北京)有限公司 | 处理方法及装置、电子设备 |
CN113111197A (zh) * | 2021-04-16 | 2021-07-13 | 百度在线网络技术(北京)有限公司 | 多媒体内容的推荐方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7121052B2 (ja) | イメージデータに少なくとも部分的に基づく、アクションを実行するためのエージェントの決定 | |
CN107426328B (zh) | 信息推送方法和装置 | |
US10102195B2 (en) | Attribute fill using text extraction | |
JP5961320B2 (ja) | ソーシャル・メデイアにおけるユーザの分類方法、コンピュータ・プログラム及びコンピュータ | |
CN109190046A (zh) | 内容推荐方法、装置及内容推荐服务器 | |
CN107463675B (zh) | 数据处理方法及其*** | |
US9767417B1 (en) | Category predictions for user behavior | |
CN106681598B (zh) | 信息输入方法和装置 | |
US11972465B2 (en) | Social network-based inventory management | |
US9767204B1 (en) | Category predictions identifying a search frequency | |
CN111768258A (zh) | 识别异常订单的方法、装置、电子设备和介质 | |
CN111242709A (zh) | 一种消息推送方法及其装置、设备、存储介质 | |
US10474670B1 (en) | Category predictions with browse node probabilities | |
CN111967924A (zh) | 商品推荐方法、商品推荐装置、计算机设备和介质 | |
CN110059172B (zh) | 基于自然语言理解的推荐答案的方法和装置 | |
US20190220871A1 (en) | Physical product interaction based session | |
CN112131502A (zh) | 数据处理方法、数据处理装置、电子设备和介质 | |
US10474688B2 (en) | System and method to recommend a bundle of items based on item/user tagging and co-install graph | |
CN112330382B (zh) | 物品推荐方法、装置、计算设备和介质 | |
US10853867B1 (en) | Recommendation engine using action node mapping | |
US10387934B1 (en) | Method medium and system for category prediction for a changed shopping mission | |
WO2018205642A1 (zh) | 视频收益计算建模装置、方法和视频推荐装置、方法和服务器及存储介质 | |
US10691736B2 (en) | Contextualized analytics platform | |
US10628497B2 (en) | Dynamic content suggestion in sparse traffic environment | |
CN107885774B (zh) | 数据处理方法和*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |