CN106202117B - 数据处理方法、装置和服务器 - Google Patents

数据处理方法、装置和服务器 Download PDF

Info

Publication number
CN106202117B
CN106202117B CN201510230290.3A CN201510230290A CN106202117B CN 106202117 B CN106202117 B CN 106202117B CN 201510230290 A CN201510230290 A CN 201510230290A CN 106202117 B CN106202117 B CN 106202117B
Authority
CN
China
Prior art keywords
data
same
user
terminal device
unique identifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510230290.3A
Other languages
English (en)
Other versions
CN106202117A (zh
Inventor
陈树根
曾辉
钱波
席晓鸣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201510230290.3A priority Critical patent/CN106202117B/zh
Publication of CN106202117A publication Critical patent/CN106202117A/zh
Application granted granted Critical
Publication of CN106202117B publication Critical patent/CN106202117B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例提供一种数据处理方法、装置和服务器。本发明数据处理方法,包括:收集至少一个终端设备上报的数据,所述数据包括预先分配给所述终端设备的唯一标识、用户操作所述终端设备所产生的记录数据及所述终端设备的设备属性信息;根据预设数据关联算法对所述记录数据和/或所述设备属性信息进行分析,确定属于同一个用户的终端设备的唯一标识;对所述属于同一个用户的终端设备上报的所述记录数据和所述设备属性信息与预先建立的用户行为模型进行匹配,确定匹配的用户行为模型,以根据所述用户行为模型进行数据推送。本发明实施例提高数据挖掘的效率和用户行为分析的正确率。

Description

数据处理方法、装置和服务器
技术领域
本发明实施例涉及数据挖掘技术,尤其涉及一种数据处理方法、装置和服务器。
背景技术
移动互联网时代,基于终端的多样性,用户可以触达的信息不再单一,其产生的用户数据也随之发生了巨大变革,用传统的记录数据(cookie)识别用户行为开始有局限性。用户从一天开始到结束,用手机看朋友圈,用平板电脑(portable android device,简称:pad)看新闻,用电脑购物与社交,用不同的机器工作,如此看来,用户在不同的时间通过不同的终端设备获取信息并做决策,然而散落在各个终端设备上的用户数据并不能完整的代表一个人,只有将这些用户数据收集拼接才能完整刻画出一个人,这个人几乎能对应现实世界的某个用户,这样就可以对识别出来的用户的行为进行分析,做出有助于产品发展的规划。
同一个用户通常会使用到多个终端设备,想要完整刻画出一个人需要从大量的终端设备中识别出哪些终端设备是属于同一个用户的,这要求对大量的终端设备中的用户数据进行充分的数据挖掘。但是,目前的终端设备不但设备标识不一致,彼此之间是相互独立的,而且还存在山寨机、双卡双待机、刷过ROM的终端等不具备唯一标识而无法别的终端设备,这使得数据挖掘的难度非常大,效率也非常低,导致用户行为分析的偏差甚至是错误。
发明内容
本发明实施例提供一种数据处理方法、装置和服务器,以提高数据挖掘的效率和用户行为分析的正确率。
第一方面,本发明实施例提供一种数据处理方法,包括:
收集至少一个终端设备上报的数据,所述数据包括预先分配给所述终端设备的唯一标识、用户操作所述终端设备所产生的记录数据及所述终端设备的设备属性信息;
根据预设数据关联算法对所述记录数据和/或所述设备属性信息进行分析,确定属于同一个用户的终端设备的唯一标识;
对所述属于同一个用户的终端设备上报的所述记录数据和所述设备属性信息与预先建立的用户行为模型进行匹配,确定匹配的用户行为模型,以根据所述用户行为模型进行数据推送。
进一步的,所述根据预设数据关联算法对所述记录数据和所述设备属性信息进行分析,确定属于同一个用户的终端设备的唯一标识,包括:
根据预设数据关联算法确定至少一个预设条件,根据所述预设条件对所述记录数据和/或所述设备属性信息进行分析,所述预设条件包括位置信息、账号信息、用户属性中的至少一类信息对应的条件;
将满足所述预设条件的所述记录数据和/或所述设备属性信息对应的所述唯一标识确定为所述属于同一个用户的终端设备的唯一标识。
进一步的,所述预设条件包括常驻的位置相同或相近,且登录同一个应用或网页采用相同的账号信息;
所述将满足所述预设条件的所述记录数据和/或所述设备属性信息对应的所述唯一标识确定为所述属于同一个用户的终端设备的唯一标识,包括:
将所述记录数据中满足常驻的位置相同或相近,且登录同一个应用或网页采用相同的账号信息的记录数据所对应的唯一标识确定为所述属于同一个用户的终端设备的唯一标识。
进一步的,所述预设条件包括用户性别相同,且浏览器的历史记录相似,以及终端设备型号和操作***相同;
所述将满足所述预设条件的所述记录数据和/或所述设备属性信息对应的所述唯一标识确定为所述属于同一个用户的终端设备的唯一标识,包括:
将所述记录数据中满足用户性别相同,且浏览器的历史记录相似的记录数据,以及终端设备型号和操作***相同的终端设备的属性信息所对应的唯一标识确定为所述属于同一个用户的终端设备的唯一标识。
进一步的,所述预设条件包括登录同一个云盘采用相同的云盘账号信息;
所述将满足所述预设条件的所述记录数据和/或所述设备属性信息对应的所述唯一标识确定为所述属于同一个用户的终端设备的唯一标识,包括:
将所述记录数据中满足登录同一个云盘采用相同的云盘账号信息的记录数据所对应的唯一标识确定为所述属于同一个用户的终端设备的唯一标识。
进一步的,所述收集至少一个终端设备上报的数据之前,还包括:
接收所述至少一个终端设备发送的账号请求;
根据所述账号请求为所述至少一个终端设备分配所述唯一标识,并将所述唯一标识返回给所述至少一个终端设备。
进一步的,所述根据预设数据关联算法对所述记录数据和/或所述设备属性信息进行分析,确定属于同一个用户的终端设备的唯一标识之前,还包括:
根据所述终端设备中产生所述记录数据的应用,和/或所述设备属性信息对所述数据进行归类整理,滤除错误或不完整的数据。
进一步的,所述方法还包括:
根据预先登记的用户的终端设备的信息验证确定出来的属于所述用户的终端设备的唯一标识是否与登记的信息一致;
根据验证结果对所述预设数据关联算法进行调整,并对所述属于同一个用户的终端设备的唯一标识进行更新和维护。
第二方面,本发明实施例提供一种数据处理装置,包括:
收集模块,用于收集至少一个终端设备上报的数据,所述数据包括预先分配给所述终端设备的唯一标识、用户操作所述终端设备所产生的记录数据及所述终端设备的设备属性信息;
数据分析模块,用于根据预设数据关联算法对所述记录数据和/或所述设备属性信息进行分析,确定属于同一个用户的终端设备的唯一标识;
行为匹配模块,用于对所述属于同一个用户的终端设备上报的所述记录数据和所述设备属性信息与预先建立的用户行为模型进行匹配,确定匹配的用户行为模型,以根据所述用户行为模型进行数据推送。
进一步的,所述数据分析模块,包括:
分析单元,用于根据预设数据关联算法确定至少一个预设条件,根据所述预设条件对所述记录数据和/或所述设备属性信息进行分析,所述预设条件包括位置信息、账号信息、用户属性中的至少一类信息对应的条件;
标识确定单元,用于将满足所述预设条件的所述记录数据和/或所述设备属性信息对应的所述唯一标识确定为所述属于同一个用户的终端设备的唯一标识。
进一步的,所述预设条件包括常驻的位置相同或相近,且登录同一个应用或网页采用相同的账号信息;
所述标识确定单元,具体用于将所述记录数据中满足常驻的位置相同或相近,且登录同一个应用或网页采用相同的账号信息的记录数据所对应的唯一标识确定为所述属于同一个用户的终端设备的唯一标识。
进一步的,所述预设条件包括用户性别相同,且浏览器的历史记录相似,以及终端设备型号和操作***相同;
所述标识确定单元,具体用于将所述记录数据中满足用户性别相同,且浏览器的历史记录相似的记录数据,以及终端设备型号和操作***相同的终端设备的属性信息所对应的唯一标识确定为所述属于同一个用户的终端设备的唯一标识。
进一步的,所述预设条件包括登录同一个云盘采用相同的云盘账号信息;
所述标识确定单元,具体用于将所述记录数据中满足登录同一个云盘采用相同的云盘账号信息的记录数据所对应的唯一标识确定为所述属于同一个用户的终端设备的唯一标识。
进一步的,所述装置还包括:
收发模块,用于接收所述至少一个终端设备发送的账号请求;
标识分配模块,用于根据所述账号请求为所述至少一个终端设备分配所述唯一标识;
所述收发模块,还用于将所述唯一标识返回给所述至少一个终端设备。
进一步的,所述装置还包括:
数据整理模块,用于根据所述终端设备中产生所述记录数据的应用,和/或所述设备属性信息对所述数据进行归类整理,滤除错误或不完整的数据。
进一步的,所述装置还包括:
验证模块,用于根据预先登记的用户的终端设备的信息验证确定出来的属于所述用户的终端设备的唯一标识是否与登记的信息一致;
维护模块,用于根据验证结果对所述预设数据关联算法进行调整,并对所述属于同一个用户的终端设备的唯一标识进行更新和维护。
第三方面,本发明实施例提供一种服务器,包括:通信装置、处理器和存储器;其中,所述通信装置用于与至少一个终端设备进行数据交互;所述处理器用于执行第一方面所述的方法;所述存储器用于存储处理器可执行指令。
本发明实施例数据处理方法、装置和服务器,通过收集终端设备发送的带有唯一标识的数据并对其进行数据关联分析,确定出属于同一个用户的终端设备,再将这些终端设备上报的数据与预先建立的用户行为模型进行匹配,确定匹配的用户行为模型以进行数据推送,提高数据挖掘的效率和用户行为分析的正确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所应用的服务器的结构示意图;
图2为本发明数据处理方法的一个实施例的流程图;
图3为本发明数据处理方法的另一个实施例的流程图;
图4为本发明数据处理方法的一个预设条件设置界面示意图;
图5为本发明数据处理装置的一个实施例的结构示意图;
图6为本发明数据处理装置的另一个实施例的结构示意图;
图7为本发明数据处理装置的第三个实施例的结构示意图;
图8为本发明数据处理装置的第四个实施例的结构示意图
图9示出的是与本发明实施例提供的服务器相关的部分结构的框图。
具体实施方式
为了解决上述问题,本发明提出了一种数据处理方法。为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或模块的过程、方法、产品或设备不必限于清楚地列出的那些步骤或模块,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块。
图1为本发明所应用的服务器的结构示意图,如图1所示,本实施例的服务器可以包括:通信装置11,例如天线、无线网卡等,处理器12,例如中央处理器(CentralProcessing Unit,简称:CPU),存储器13,至少一个总线14以及运行在硬件之上的操作***15。总线14用于实现元件之间的通信连接。存储器13可能包含高速随机存取存储器(RandomAccess Memory,简称:RAM)存储器,也可能还包括非易失性存储器非易失存储器(NonVolatile Memory,简称:NVM),例如至少一个磁盘存储器,存储器中可以存储各种程序,用于完成各种处理功能以及实现本实施例的方法步骤。
本领域技术人员可以理解的是,图1所示服务器还可以包含其余各种可能的元件,例如输入/输出模块、数据库等等,本发明不做限定。而且,本实施例的服务器例如可以是各种应用程序(Application,简称:APP)服务器、运营商服务器等,该APP,既可以是终端设备在出厂时自带的应用程序,也可以是用户从互联网上下载安装到终端设备上的应用程序,本实施例对APP的来源和形式不做限定。服务器的相关程序代码即可存储在图1所示服务器的存储器13中。
服务器可以通过通信装置11从至少一个终端设备收集数据,处理器12获取存储器13中的可执行指令,根据该可执行指令对这些数据进行分析确定出属于同一个用户的终端设备,并且通过对多个终端设备上报的数据分进行用户行为匹配,塑造出完整的用户形象,以实现数据推送。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
下面,图2~图3为本发明图案锁的设置方法对应的不同的实施例。
图2为本发明数据处理方法的一个实施例的流程图,如图2所示,本实施例的执行主体可以是图1所示的服务器,服务器通过本实施例的方法进行数据处理,本实施例的方法可以包括:
步骤101、收集至少一个终端设备上报的数据,所述数据包括预先分配给所述终端设备的唯一标识、用户操作所述终端设备所产生的记录数据及所述终端设备的设备属性信息;
用户在使用终端设备上安装的APP或终端设备自身的功能时,可能会在本地产生记录数据,该记录数据可以是用户的操作记录、APP或功能的后台记录、用户使用APP或功能的账户信息、位置标记等,这些数据都会被记录下来,并发送给服务器,以便于APP或终端设备开发商的后续开发。另外,终端在出厂时存储了设备属性信息,该设备属性信息包括设备型号、移动设备国际身份码(International Mobile Equipment Identity,简称:IMEI)、操作***信息等。而记录数据和设备属性信息在被上报给服务器时,终端设备以预先分配的唯一标识来标记这些数据,这样服务器才能获知收集到的数据是由哪个终端设备发送的。
步骤102、根据预设数据关联算法对所述记录数据和/或所述设备属性信息进行分析,确定属于同一个用户的终端设备的唯一标识;
服务器对收集到的记录数据和/或所述设备属性信息进行分析,可以通过建立数据关联模型,以预设数据关联算法从大量的数据中找出彼此之间的关联关系,确定哪些数据可能是由同一个用户操作产生的,通过大量的数据分析和挖掘,确定出属于同一个用户的终端设备。例如,同一个用户经常出入的地理位置是相对固定的,而用户常用的终端设备,例如手机、平板电脑等也是固定的,那么这样的终端设备上报的数据所显示出来的位置就是相同或相近的;又例如,同一个用户玩的手游使用的同一个账号,那么只要是使用了该账号登陆了该手游的终端设备就很有可能是属于同一个用户的。可见,服务器在收集到终端设备上报的数据后,通过预设数据关联算法对大量的数据进行分析,从多个维度考虑终端设备之间的关联关系,确定出哪些终端设备是属于同一个用户的并获取到其唯一标识。
步骤103、对所述属于同一个用户的终端设备上报的所述记录数据和所述设备属性信息与预先建立的用户行为模型进行匹配,确定匹配的用户行为模型,以根据所述用户行为模型进行数据推送。
单一的终端设备上报的数据可能无法分析出完整的用户行为,例如用户***板电脑只在家中使用,通过平板电脑玩游戏、网上购物、看视频等,这样这两个设备各自承担了用户的部分行为,而且二者承担的用户行为并不是完全重合的,这种情况下,服务器无论是单独分析手机还是平板电脑都无法获取到完整的用户行为信息,只能是部分了解用户的喜好等。因此服务器通过确定出哪些终端设备是属于同一个用户,并对这些终端设备进行分析才能确定出较为完整的用户行为模式,从而可以向该用户的终端设备推送一些用户感兴趣的信息,例如,用户在手机上通过购物APP收藏了一些产品,那么在平板电脑上就可以通过该购物APP向用户推荐一些相似的产品,或提供产品比价信息。
本实施例,通过收集终端设备发送的带有唯一标识的数据并对其进行数据关联分析,确定出属于同一个用户的终端设备,再将这些终端设备上报的数据与预先建立的用户行为模型进行匹配,确定匹配的用户行为模型以进行数据推送,提高数据挖掘的效率和用户行为分析的正确率。
进一步的,服务器在确定哪些终端设备属于同一个用户时,可以采取一些验证方法,具体方法可以是:根据预先登记的用户的终端设备的信息验证确定出来的属于所述用户的终端设备的唯一标识是否与登记的信息一致;根据验证结果对所述预设数据关联算法进行调整,并对所述属于同一个用户的终端设备的唯一标识进行更新和维护。
服务器可以先预先登记一些用户的终端设备的信息,例如先记录手机a、平板电脑b、游戏机c属于第一用户;然后根据预设数据关联算法对多个终端设备上报的数据进行分析,确定出手机a、平板电脑b属于第一用户,将该分析结果与预先登记的信息进行验证可知,确定出来的终端设备确实属于第一用户,但是还缺少了游戏机c,因此对预设数据关联算法进行调整,以期可以经过数据分析确定出手机a、平板电脑b、游戏机c同属于第一用户。预设关联算法在数据分析的过程中可以不断调整,不断训练完善该算法,在该完善过程中伴随的可以对属于同一个用户的终端设备的唯一标识进行更新和维护,以获取更接近真实情况的分析结果。
图3为本发明数据处理方法的另一个实施例的流程图,如图3所示,本实施例的执行主体可以是图1所示的服务器,服务器通过本实施例的方法进行数据处理,本实施例的方法可以包括:
步骤201、接收至少一个终端设备发送的账号请求;
目前存在很多山寨机、双卡双待机、刷过ROM的终端等终端设备,这类设备不具备IMEI,或者其携带的IMEI是一个伪编号,因此这类设备无法被服务器识别出来,也无法正确获取到该类设备的记录数据和设备属性信息。为了实现对终端设备的统一管理,可以由服务器对终端设备分配统一的唯一标识,而终端设备可以通过设置标识管理模块向服务器请求该唯一标识,只要是具备标识管理模块的终端设备都可以请求到唯一标识,而不受其是否是山寨机、双卡双待机、刷过ROM的终端等终端设备的影响。
步骤202、根据所述账号请求为所述至少一个终端设备分配所述唯一标识,并将所述唯一标识返回给所述至少一个终端设备;
步骤203、收集所述至少一个终端设备上报的数据,所述数据包括预先分配给所述终端设备的唯一标识、用户操作所述终端设备所产生的记录数据及所述终端设备的设备属性信息;
步骤203和上述方法实施例的步骤101类似,此处不再赘述。
步骤204、根据所述终端设备中产生所述记录数据的应用,和/或所述设备属性信息对所述数据进行归类整理,滤除错误或不完整的数据;
服务器收集到的数据可以是各个APP或终端功能发送的,而各个发送数据的应用可能会有不同的数据格式,这样服务器在获取到这些记录数据后可以根据该应用对其进行分类,例如微信和QQ的数据,服务器可以分别存储。另外,终端设备本身其设备类型、操作***等也可以作为数据分类的的标准。服务器整理收集到的数据时,还可以将一些有丢包的数据、校验错误的数据都滤除掉,对剩下的数据归类,这样在对数据进行分析时可以快速读取到相应的数据。
进一步的,服务器对数据进行规整的过程中,还可以根据设备属性信息对终端设备进行分类,这里主要分为山寨机和品牌机两类,如果是品牌机服务器根据其设备属性信息就可以直接确定出机型,如果是山寨机可能存在设备数信息伪装、错误等问题,因此服务器可能还需要根据记录数据进行分析,以识别出其不是品牌机类型。
步骤205、根据预设数据关联算法确定至少一个预设条件,根据所述预设条件对所述记录数据和/或所述设备属性信息进行分析,所述预设条件包括位置信息、账号信息、用户属性中的至少一类信息对应的条件;
服务器对数据进行分析是根据至少一个预设条件,同一用户的终端设备上报的数据之间总会有一些关联关系,根据预设数据关联算法确定的预设条件可以将终端设备间彼此重叠的数据筛选出来。通常,预设条件可以包括位置信息(例如全球定位***(GlobalPositioning System,简称:GPS)坐标),账号信息(例如微信账号、淘宝账号、QQ账号等)、用户属性(例如用户性别、年龄、常驻地等)中的至少一类信息对应的条件。
步骤206、将满足所述预设条件的所述记录数据和/或所述设备属性信息对应的所述唯一标识确定为所述属于同一个用户的终端设备的唯一标识;
服务器确定属于同一个用户的终端设备的唯一标识可以有以下几种具体地实现方式,但是却不限于以下方式,只要本领域技术人员易于想到的可以确定出属于同一个用户的终端设备的唯一标识的方法都可以作为本发明的实施例,此处不做具体限定。
第一种:所述预设条件包括常驻的位置相同或相近,且登录同一个应用或网页采用相同的账号信息;将所述记录数据中满足常驻的位置相同或相近,且登录同一个应用或网页采用相同的账号信息的记录数据所对应的唯一标识确定为所述属于同一个用户的终端设备的唯一标识。
服务器预设将常驻的位置相同或相近,且登录同一个应用或网页采用相同的账号信息的终端设备确定为属于同一个用户的终端设备,例如,服务器从大量记录数据中筛选常驻的位置为位置A或位置A附近的记录数据,这表示上报这些记录数据的终端设备经常出现在位置A这个地标周围,其可能是同一个用户的,但也可能是多个用户常聚集在位置A周围,因此进一步的,服务器从这些记录数据中筛选出登录同一个应用或网页采用相同的账号信息的记录数据,那么经常出现在相同或相近的位置,且用同一个账号登陆同一个应用或网页,例如QQ、微信、微博等,发送这类记录数据的终端设备属于同一个用户的概率非常高,服务器可以将这类记录数据所对应的唯一标识确定为属于同一个用户的终端设备的唯一标识。
第二种:所述预设条件包括用户性别相同,且浏览器的历史记录相似,以及终端设备型号和操作***相同;将所述记录数据中满足用户性别相同,且浏览器的历史记录相似的记录数据,以及终端设备型号和操作***相同的终端设备的属性信息所对应的唯一标识确定为所述属于同一个用户的终端设备的唯一标识。
服务器将用户性别相同,且浏览器的历史记录相似,以及终端设备型号和操作***相同的终端设备确定为属于同一个用户的终端设备,例如,服务器根据用户申请客户识别模块(Subscriber Identity Module,简称:SIM)时填写的签约信息获取用户性别,还可以根据用户经常浏览的网页信息、安装的APP等获取用户性别,而且用户有自己的偏好,因此无论是用哪个终端设备经常浏览的网页、收藏夹内容通常是比较相似的,另外用户也对终端型号、操作***等也有一定的偏好,因此这三类信息综合起来也可以作为确定属于同一个用户的终端设备的预设条件。
第三种:所述预设条件包括登录同一个云盘采用相同的云盘账号信息;将所述记录数据中满足登录同一个云盘采用相同的云盘账号信息的记录数据所对应的唯一标识确定为所述属于同一个用户的终端设备的唯一标识。
目前云盘是一种很常见的信息共享技术,用户为了便于信息在多台设备上的共享可以通过云盘实现,那么服务器就可以将使用同一个账号登陆同一个云盘的终端设备确定为属于同一个用户的终端设备。
进一步的,服务器还可以根据用户年龄相同、且登录同一个应用或网页采用相同的账号信息;常驻的位置相同或相近,且终端设备型号和操作***相同等作为预设条件,此处不做具体限定。
步骤207、对所述属于同一个用户的终端设备上报的所述记录数据和所述设备属性信息与预先建立的用户行为模型进行匹配,确定匹配的用户行为模型,以根据所述用户行为模型进行数据推送。
步骤207和上述方法实施例的步骤103类似,此处不再赘述。
本实施例,通过收集终端设备发送的带有唯一标识的数据并对其进行数据关联分析,确定出属于同一个用户的终端设备,再将这些终端设备上报的数据与预先建立的用户行为模型进行匹配,确定匹配的用户行为模型以进行数据推送,提高数据挖掘的效率和用户行为分析的正确率。
图4为本发明数据处理方法的一个预设条件设置界面示意图,如图4所示,服务器可以通过网页的方式向用户展示设置预设条件的页面,具备服务器使用权限的用户登录该网页,在预设条件1中选择常驻的位置相同或相近,在预设条件2中选择登录微信采用相同的账号信息,预设条件1和预设条件2这两个条件需要同时满足,因此两个条件之间是“and”。服务器在用户设置好预设条件之后,就从收集到的数据中开始分析筛选,这里的数据包括服务器一直积累的数据,来自于不同的终端设备。
可选的,在网页上用户可以设置一个或多个预设条件,通过这些预设条件的组合对数据进行分析。另外,网页上还可以给用户提供可以输入字符的区块,例如用户希望预设条件可以更加精确,而在预设选项中没有相应的条件,因此可以通过手动输入的方式增加预设条件。
图5为本发明数据处理装置的一个实施例的结构示意图,如图5所示,本实施例的装置可以包括:收集模块11、数据分析模块12以及行为匹配模块13,其中,收集模块11,用于收集至少一个终端设备上报的数据,所述数据包括预先分配给所述终端设备的唯一标识、用户操作所述终端设备所产生的记录数据及所述终端设备的设备属性信息;数据分析模块12,用于根据预设数据关联算法对所述记录数据和/或所述设备属性信息进行分析,确定属于同一个用户的终端设备的唯一标识;行为匹配模块13,用于对所述属于同一个用户的终端设备上报的所述记录数据和所述设备属性信息与预先建立的用户行为模型进行匹配,确定匹配的用户行为模型,以根据所述用户行为模型进行数据推送。
本实施例的装置,可以用于执行图2所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图6为本发明数据处理装置的另一个实施例的结构示意图,如图6所示,本实施例的装置在图5所示装置结构的基础上,进一步地,数据分析模块12可以包括:分析单元121和标识确定单元122,其中,分析单元121,用于根据预设数据关联算法确定至少一个预设条件,根据所述预设条件对所述记录数据和/或所述设备属性信息进行分析,所述预设条件包括位置信息、账号信息、用户属性中的至少一类信息对应的条件;标识确定单元122,用于将满足所述预设条件的所述记录数据和/或所述设备属性信息对应的所述唯一标识确定为所述属于同一个用户的终端设备的唯一标识。
本实施例的装置,可以用于执行图2所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
进一步的,所述预设条件包括常驻的位置相同或相近,且登录同一个应用或网页采用相同的账号信息;所述标识确定单元122,具体用于将所述记录数据中满足常驻的位置相同或相近,且登录同一个应用或网页采用相同的账号信息的记录数据所对应的唯一标识确定为所述属于同一个用户的终端设备的唯一标识。
进一步的,所述预设条件包括用户性别相同,且浏览器的历史记录相似,以及终端设备型号和操作***相同;所述标识确定单元122,具体用于将所述记录数据中满足用户性别相同,且浏览器的历史记录相似的记录数据,以及终端设备型号和操作***相同的终端设备的属性信息所对应的唯一标识确定为所述属于同一个用户的终端设备的唯一标识。
进一步的,所述预设条件包括登录同一个云盘采用相同的云盘账号信息;所述标识确定单元122,具体用于将所述记录数据中满足登录同一个云盘采用相同的云盘账号信息的记录数据所对应的唯一标识确定为所述属于同一个用户的终端设备的唯一标识。
图7为本发明数据处理装置的第三个实施例的结构示意图,如图7所示,本实施例的装置在图6所示装置结构的基础上,进一步地,还可以包括:收发模块14、标识分配模块15以及数据整理模块16,其中,收发模块14,用于接收所述至少一个终端设备发送的账号请求;标识分配模块15,用于根据所述账号请求为所述至少一个终端设备分配所述唯一标识;所述收发模块14,还用于将所述唯一标识返回给所述至少一个终端设备。数据整理模块16,用于根据所述终端设备中产生所述记录数据的应用,和/或所述设备属性信息对所述数据进行归类整理,滤除错误或不完整的数据。
本实施例的装置,可以用于执行图2或图3所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图8为本发明数据处理装置的第四个实施例的结构示意图,如图8所示,本实施例的装置在图5所示装置结构的基础上,进一步地,还可以包括:验证模块17和维护模块18,其中,验证模块17,用于根据预先登记的用户的终端设备的信息验证确定出来的属于所述用户的终端设备的唯一标识是否与登记的信息一致;维护模块18,用于根据验证结果对所述预设数据关联算法进行调整,并对所述属于同一个用户的终端设备的唯一标识进行更新和维护。
本实施例的装置,可以用于执行图2或图3所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
本发明实施例提供的服务器可以是应用服务器、运营商服务器等,图9示出的是与本发明实施例提供的服务器相关的部分结构的框图,参照图9,服务器包括:射频(RadioFrequency,简称:RF)电路10、存储器20、输入单元30、显示单元40、处理器50、以及电源60等部件。本领域技术人员可以理解,图9中示出的服务器结构并不构成对服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图9对服务器的各个构成部件进行具体的介绍:
RF电路10可用于收发数据或通信过程中,数据的接收和发送,特别地,将终端设备的数据接收后,给处理器50处理;另外,将分配的唯一标识发送给终端设备。通常,RF电路10包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low NoiseAmplifier,简称:LNA)、双工器等。此外,RF电路10还可以通过无线通信与终端设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯***(GlobalSystem of Mobile communication,简称:GSM)、通用分组无线服务(General PacketRadio Service,简称:GPRS)、码分多址(Code Division Multiple Access,简称:CDMA)、宽带码分多址(Wideband Code Division Multiple Access,简称:WCDMA)、长期演进(LongTerm Evolution,简称:LTE))、电子邮件、短消息服务(Short Messaging Service,简称:SMS)等。
存储器20可用于存储可执行指令以及模块,处理器60通过运行存储在存储器20的可执行指令以及模块,从而执行服务器的各种功能、应用以及数据处理。存储器20可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序等;存储数据区可存储根据服务器的使用所创建的数据等。此外,存储器20可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元30可用于接收输入的数字或字符信息。具体地,输入单元30可包括键盘鼠标31以及其他输入设备32。
显示单元40可用于显示由用户输入的信息或提供给用户的信息以及服务器的各种菜单。显示单元40可包括显示面板41,可选的,可以采用液晶显示器(Liquid CrystalDisplay,简称:LCD)、有机发光二极管(Organic Light-Emitting Diode,简称:OLED)等形式来配置显示面板41。
处理器50是服务器的控制中心,利用各种接口和线路连接整个服务器的各个部分,通过运行或执行存储在存储器20内的可执行指令和/或模块,以及调用存储在存储器20内的数据,执行服务器的各种功能和处理数据,从而对服务器进行整体监控。可选的,处理器50可包括一个或多个处理单元;优选的,处理器50可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器50中。
服务器还包括给各个部件供电的电源60,优选的,电源可以通过电源管理***与处理器50逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。
在本发明实施例中,该终端所包括的处理器50还具有以下功能:根据预设数据关联算法对所述记录数据和/或所述设备属性信息进行分析,确定属于同一个用户的终端设备的唯一标识;对所述属于同一个用户的终端设备上报的所述记录数据和所述设备属性信息与预先建立的用户行为模型进行匹配,确定匹配的用户行为模型,以根据所述用户行为模型进行数据推送。
关于本发明的服务器如何确定属于同一个用户的终端设备的唯一标识,以及确定匹配的用户行为模型,可以参见上述数据处理方法实施例的详细描述,此处不再赘述。本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种数据处理方法,其特征在于,包括:
接收至少一个终端设备发送的账号请求;
根据所述账号请求为所述至少一个终端设备分配唯一标识,并将所述唯一标识返回给所述至少一个终端设备;
收集所述至少一个终端设备上报的数据,所述数据包括预先分配给所述终端设备的唯一标识、用户操作所述终端设备所产生的记录数据及所述终端设备的设备属性信息;所述设备属性信息包括:设备型号、移动设备国际身份码、操作***信息;
以预先分配的唯一标识来记录所述至少一个终端设备上报的数据;
根据所述终端设备中产生所述记录数据的应用,和/或所述设备属性信息对所述数据进行归类整理,滤除错误或不完整的数据;
通过网页的方式展示设置预设条件的页面,接收在所述预设条件的页面中选择的至少一个预设条件;
通过预先建立的数据关联模型,以预设数据关联算法,根据所述至少一个预设条件对所述记录数据和所述设备属性信息进行分析,将满足所述预设条件的所述记录数据和所述设备属性信息对应的所述唯一标识确定为属于同一个用户的终端设备并获取所述属于同一个用户的终端设备的唯一标识;
对所述属于同一个用户的终端设备上报的所述记录数据和所述设备属性信息与预先建立的用户行为模型进行匹配,确定匹配的用户行为模型,以根据所述用户行为模型进行数据推送;
其中,所述方法进一步包括:
预先登记多个终端设备属于第一用户,根据预设数据关联算法对所述第一用户的多个终端设备上报的数据进行分析,验证确定出来的属于第一用户的终端设备的唯一标识是否与预先登记的信息一致;
根据验证结果对所述预设数据关联算法进行训练和调整,并对所述属于同一个用户的终端设备的唯一标识进行更新和维护。
2.根据权利要求1所述的方法,其特征在于,所述预设条件包括常驻的位置相同或相近,且登录同一个应用或网页采用相同的账号信息;
所述将满足所述预设条件的所述记录数据和/或所述设备属性信息对应的所述唯一标识确定为所述属于同一个用户的终端设备的唯一标识,包括:
将所述记录数据中满足常驻的位置相同或相近,且登录同一个应用或网页采用相同的账号信息的记录数据所对应的唯一标识确定为所述属于同一个用户的终端设备的唯一标识。
3.根据权利要求1所述的方法,其特征在于,所述预设条件包括用户性别相同,且浏览器的历史记录相似,以及终端设备型号和操作***相同;
所述将满足所述预设条件的所述记录数据和所述设备属性信息对应的所述唯一标识确定为所述属于同一个用户的终端设备的唯一标识,包括:
将所述记录数据中满足用户性别相同,且浏览器的历史记录相似的记录数据,以及终端设备型号和操作***相同的终端设备的属性信息所对应的唯一标识确定为所述属于同一个用户的终端设备的唯一标识。
4.根据权利要求1所述的方法,其特征在于,所述预设条件包括登录同一个云盘采用相同的云盘账号信息;
所述将满足所述预设条件的所述记录数据和所述设备属性信息对应的所述唯一标识确定为所述属于同一个用户的终端设备的唯一标识,包括:
将所述记录数据中满足登录同一个云盘采用相同的云盘账号信息的记录数据所对应的唯一标识确定为所述属于同一个用户的终端设备的唯一标识。
5.一种数据处理装置,其特征在于,包括:
收发模块,用于接收至少一个终端设备发送的账号请求;
标识分配模块,用于根据所述账号请求为所述至少一个终端设备分配唯一标识;
所述收发模块,还用于将所述唯一标识返回给所述至少一个终端设备;
收集模块,用于收集所述至少一个终端设备上报的数据,所述数据包括预先分配给所述终端设备的唯一标识、用户操作所述终端设备所产生的记录数据及所述终端设备的设备属性信息;所述设备属性信息包括:设备型号、移动设备国际身份码、操作***信息;以预先分配的唯一标识来记录所述至少一个终端设备上报的数据;根据所述终端设备中产生所述记录数据的应用,和/或所述设备属性信息对所述数据进行归类整理,滤除错误或不完整的数据;
数据分析模块,用于通过网页的方式展示设置预设条件的页面,接收在所述预设条件的页面中选择的至少一个预设条件;通过预先建立的数据关联模型,以预设数据关联算法,根据所述至少一个预设条件对所述记录数据和所述设备属性信息进行分析,将满足所述预设条件的所述记录数据和所述设备属性信息对应的所述唯一标识确定为属于同一个用户的终端设备并获取所述属于同一个用户的终端设备的唯一标识;
行为匹配模块,用于对所述属于同一个用户的终端设备上报的所述记录数据和所述设备属性信息与预先建立的用户行为模型进行匹配,确定匹配的用户行为模型,以根据所述用户行为模型进行数据推送;
验证模块,用于预先登记多个终端设备属于第一用户,根据预设数据关联算法对所述第一用户的多个终端设备上报的数据进行分析,验证确定出来的属于第一用户的终端设备的唯一标识是否与预先登记的信息一致;
维护模块,用于根据验证结果对所述预设数据关联算法进行训练和调整,并对所述属于同一个用户的终端设备的唯一标识进行更新和维护。
6.根据权利要求5所述的装置,其特征在于,所述预设条件包括常驻的位置相同或相近,且登录同一个应用或网页采用相同的账号信息;
所述标识确定单元,具体用于将所述记录数据中满足常驻的位置相同或相近,且登录同一个应用或网页采用相同的账号信息的记录数据所对应的唯一标识确定为所述属于同一个用户的终端设备的唯一标识。
7.根据权利要求5所述的装置,其特征在于,所述预设条件包括用户性别相同,且浏览器的历史记录相似,以及终端设备型号和操作***相同;
所述标识确定单元,具体用于将所述记录数据中满足用户性别相同,且浏览器的历史记录相似的记录数据,以及终端设备型号和操作***相同的终端设备的属性信息所对应的唯一标识确定为所述属于同一个用户的终端设备的唯一标识。
8.根据权利要求5所述的装置,其特征在于,所述预设条件包括登录同一个云盘采用相同的云盘账号信息;
所述标识确定单元,具体用于将所述记录数据中满足登录同一个云盘采用相同的云盘账号信息的记录数据所对应的唯一标识确定为所述属于同一个用户的终端设备的唯一标识。
9.一种服务器,其特征在于,包括:通信装置、处理器和存储器;其中,所述通信装置用于与至少一个终端设备进行数据交互;所述处理器用于执行权利要求1~4中任一项所述的方法;所述存储器用于存储处理器可执行指令。
10.一种计算机可读存储介质,其特征在于,存储有机器可读指令,可以使至少一个处理器执行如权利要求1-4任一项所述的方法。
CN201510230290.3A 2015-05-07 2015-05-07 数据处理方法、装置和服务器 Active CN106202117B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510230290.3A CN106202117B (zh) 2015-05-07 2015-05-07 数据处理方法、装置和服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510230290.3A CN106202117B (zh) 2015-05-07 2015-05-07 数据处理方法、装置和服务器

Publications (2)

Publication Number Publication Date
CN106202117A CN106202117A (zh) 2016-12-07
CN106202117B true CN106202117B (zh) 2020-07-03

Family

ID=57459620

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510230290.3A Active CN106202117B (zh) 2015-05-07 2015-05-07 数据处理方法、装置和服务器

Country Status (1)

Country Link
CN (1) CN106202117B (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106960143B (zh) * 2017-03-23 2020-03-17 网易(杭州)网络有限公司 用户账号的识别方法及装置、存储介质、电子设备
CN109426826B (zh) * 2017-08-22 2020-12-29 中国电信股份有限公司 用户行为分析方法和装置
CN109587197B (zh) * 2017-09-29 2022-02-22 北京京东尚科信息技术有限公司 关联上报数据的方法、装置和***
CN108287662A (zh) * 2017-12-08 2018-07-17 五八有限公司 获取设备唯一标识的方法、设备及计算机可读存储介质
CN110020166B (zh) * 2017-12-21 2023-02-10 腾讯科技(深圳)有限公司 一种数据分析方法及相关设备
CN108363655B (zh) * 2018-02-11 2021-07-13 百度在线网络技术(北京)有限公司 用户行为特征分析方法及装置
CN110213202B (zh) * 2018-03-01 2021-10-15 腾讯科技(深圳)有限公司 标识加密匹配方法和装置、标识处理方法和装置
CN108965114B (zh) * 2018-09-10 2021-08-10 每日互动股份有限公司 一种向终端设备推送信息的方法
CN109257764B (zh) * 2018-10-24 2022-02-22 北京小米移动软件有限公司 用户画像数据处理方法及装置
CN109543105B (zh) * 2018-11-15 2021-09-07 万惠投资管理有限公司 一种移动设备应用的内容推荐方法及***
CN110866241A (zh) * 2019-10-08 2020-03-06 北京百度网讯科技有限公司 评估模型生成及设备关联方法、装置及存储介质
CN111241502B (zh) * 2020-01-14 2023-01-17 恩亿科(北京)数据科技有限公司 跨设备的用户识别方法及装置、电子设备、存储介质
CN111368184B (zh) * 2020-02-24 2024-03-22 百度在线网络技术(北京)有限公司 智能语音设备的屏保投放方法、设备及存储介质
CN111708948B (zh) * 2020-06-19 2024-04-16 北京达佳互联信息技术有限公司 内容项推荐方法、装置、服务器及计算机可读存储介质
CN111859136B (zh) * 2020-07-23 2024-03-15 深圳前海微众银行股份有限公司 个性化推荐方法、装置、设备及可读存储介质
CN111930995B (zh) * 2020-08-18 2023-12-22 湖南快乐阳光互动娱乐传媒有限公司 数据处理方法及装置
CN112286712B (zh) * 2020-12-25 2021-04-02 成都数联铭品科技有限公司 基于唯一id的容错修复方法
CN113453216B (zh) * 2021-06-16 2023-09-05 中国联合网络通信集团有限公司 用户终端设备的确定方法及装置
CN113515515A (zh) * 2021-07-30 2021-10-19 广东电网有限责任公司 客户数据和电网设备数据融合方法、装置、设备及介质
CN116662639B (zh) * 2022-11-14 2023-11-28 荣耀终端有限公司 一种内容推送方法、电子设备和通信***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103533530A (zh) * 2013-09-26 2014-01-22 林毅 一种跨设备的用户对应及用户追踪方法、***
CN103793420A (zh) * 2012-10-31 2014-05-14 国际商业机器公司 用于跨站点数据分析的方法和***
CN103873698A (zh) * 2014-03-31 2014-06-18 宇龙计算机通信科技(深圳)有限公司 终端关联装置和终端关联方法
CN104104660A (zh) * 2013-04-07 2014-10-15 ***通信集团浙江有限公司 获取用户数据的方法及***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103793420A (zh) * 2012-10-31 2014-05-14 国际商业机器公司 用于跨站点数据分析的方法和***
CN104104660A (zh) * 2013-04-07 2014-10-15 ***通信集团浙江有限公司 获取用户数据的方法及***
CN103533530A (zh) * 2013-09-26 2014-01-22 林毅 一种跨设备的用户对应及用户追踪方法、***
CN103873698A (zh) * 2014-03-31 2014-06-18 宇龙计算机通信科技(深圳)有限公司 终端关联装置和终端关联方法

Also Published As

Publication number Publication date
CN106202117A (zh) 2016-12-07

Similar Documents

Publication Publication Date Title
CN106202117B (zh) 数据处理方法、装置和服务器
WO2017101606A1 (zh) 一种数据采集分析***和方法
CN108696399B (zh) 业务服务的测试方法和装置
CN110609937A (zh) 一种爬虫识别方法及装置
CN104917643A (zh) 异常账号检测方法及装置
CN104541245A (zh) 移动应用管理
CN107872534B (zh) 信息推送方法、装置、服务器及可读存储介质
KR101249059B1 (ko) 정보 교환 장치, 방법 및 이에 적용되는 관리 시스템
US10057302B2 (en) Context-based selection of instruction sets for connecting through captive portals
CN103402177A (zh) 一种WiFi终端信息推送***及其实现方法
CN107995285B (zh) 信息显示方法、装置、服务器及可读存储介质
US11240777B2 (en) Device positioning method and apparatus
CN107404481A (zh) 用户信息识别方法及装置
WO2011147800A1 (en) Method of identifying remote users of websites
CN102317935A (zh) 基于场境的通信服务
CN106067879B (zh) 信息的检测方法及装置
CN112507211A (zh) 消息推送方法、装置、存储介质及电子装置
CN110851339A (zh) 一种埋点数据的上报方法、装置、存储介质和终端设备
CN111767262A (zh) 日志展示方法、装置、设备及存储介质
WO2010131259A2 (en) A monitoring system for capturing information relating to the wireless smart device for behavioral analytics
CN103347029A (zh) 业务数据交互方法、终端、服务器和***
CN109885350A (zh) 用户界面配置方法、***、计算机设备及存储介质
CN106682054B (zh) 一种终端应用推荐方法、装置和***
CN101742438A (zh) 用于在移动终端中运行供应链管理的设备和方法
CN103634348A (zh) 终端设备以及发布信息的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant