CN113383362B - 用户识别方法及相关产品 - Google Patents
用户识别方法及相关产品 Download PDFInfo
- Publication number
- CN113383362B CN113383362B CN201980091203.7A CN201980091203A CN113383362B CN 113383362 B CN113383362 B CN 113383362B CN 201980091203 A CN201980091203 A CN 201980091203A CN 113383362 B CN113383362 B CN 113383362B
- Authority
- CN
- China
- Prior art keywords
- user
- target user
- brushing amount
- brushing
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例公开了一种用户识别方法及相关产品,该方法包括:当需要对目标用户ID进行用户识别时,确定是否存在已识别的N个刷量群体,N个刷量群体是按照群体用户规则分类得到,N个刷量群体中任意一个刷量群体包含的刷量用户ID大于预设数量阈值;若存在,获取目标用户ID的输入特征,输入特征包括用户位置特征、用户APP使用特征、用户设备使用特征和用户点击通过率CTR特征;基于目标用户ID的输入特征识别目标用户ID与N个刷量群体中每个刷量群体的相似度;若N个刷量群体中存在与目标用户ID相似度大于预设相似度阈值的刷量群体,确定目标用户ID为刷量用户ID。本申请实施例可以提高刷量用户的识别准确度。
Description
技术领域
本申请涉及通信技术领域,具体涉及一种用户识别方法及相关产品。
背景技术
在资源展示平台,在重要的位置推给用户有用的资源,才会让用户价值感知越大,资源的效果得到更好。当前,随着展示位资源越来越有限,较好位置的资源展示的指标是随着它的用户点击或者用户行为而越来越好的。为了得到更多的点击率,有些内容制作者就会利用刷量的方式去获取,一方面为自己获取更好的位置资源,一方面能够得到更多真实用户的曝光。但从资源展示平台角度来讲,会造成平台对资源的不公平,用户对平台也会产生不信任。因此,如何识别刷量用户成为亟待解决的问题。
当前的刷量用户识别主要是对用户逐个识别,比如一个账号在多个手机上登录,一个手机上有多个账号进行注册登陆,一个手机对同一个网址进行持续不间断访问或者访问次数超过普通用户等手段的识别。目前的刷量用户识别的准确度较低。
发明内容
本申请实施例提供了一种用户识别方法及相关产品,可以提高刷量用户的识别准确度。
第一方面,本申请实施例提供一种用户识别方法,包括:
当需要对目标用户ID进行用户识别时,确定是否存在已识别的N个刷量群体,所述N个刷量群体是按照群体用户规则分类得到,所述N个刷量群体中任意一个刷量群体包含的刷量用户ID大于预设数量阈值,N为正整数;
若存在,获取所述目标用户ID的输入特征,所述输入特征包括用户位置特征、用户APP使用特征、用户设备使用特征和用户点击通过率CTR特征;
基于所述目标用户ID的输入特征识别所述目标用户ID与所述N个刷量群体中每个刷量群体的相似度;
若所述N个刷量群体中存在与所述目标用户ID相似度大于预设相似度阈值的刷量群体,确定所述目标用户ID为刷量用户ID。
第二方面,本申请实施例提供了一种用户识别装置,所述用户识别装置包括第一确定单元、获取单元、识别单元和第二确定单元,其中:
所述第一确定单元,用于当需要对目标用户ID进行用户识别时,确定是否存在已识别的N个刷量群体,所述N个刷量群体是按照群体用户规则分类得到,所述N个刷量群体中任意一个刷量群体包含的刷量用户ID大于预设数量阈值,N为正整数;
所述获取单元,用于在所述第一确定单元确定存在已识别的N个刷量群体的情况下,获取所述目标用户ID的输入特征,所述输入特征包括用户位置特征、用户APP使用特征、用户设备使用特征和用户点击通过率CTR特征;
所述识别单元,用于基于所述目标用户ID的输入特征识别所述目标用户ID与所述N个刷量群体中每个刷量群体的相似度;
所述第二确定单元,用于在所述识别单元识别到所述N个刷量群体中存在与所述目标用户ID相似度大于预设相似度阈值的刷量群体的情况下,确定所述目标用户ID为刷量用户ID。
第三方面,本申请实施例提供一种服务端,包括处理器、存储器,所述存储器用于存储一个或多个程序,所述一个或多个程序被配置成由所述处理器执行,上述程序包括用于执行本申请实施例第一方面中的步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。
第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
可以看出,本申请实施例中所描述的用户识别方法,具体包括如下步骤:当需要对目标用户ID进行用户识别时,确定是否存在已识别的N个刷量群体,N个刷量群体是按照群体用户规则分类得到,N个刷量群体中任意一个刷量群体包含的刷量用户ID大于预设数量阈值,N为正整数;若存在,获取目标用户ID的输入特征,输入特征包括用户位置特征、用户APP使用特征、用户设备使用特征和用户点击通过率CTR特征;基于目标用户ID的输入特征识别目标用户ID与N个刷量群体中每个刷量群体的相似度;若N个刷量群体中存在与目标用户ID相似度大于预设相似度阈值的刷量群体,确定目标用户ID为刷量用户ID。实施本申请实施例,对目标用户ID进行用户识别时,可以将该目标用户与已识别的刷量群体进行相似度识别,如果相似度大于预设相似度阈值,则可直接认定该目标用户ID为刷量用户ID,由于刷量用户往往具有群体刷量的特性,通过与刷量群体的相似度识别可以快速准确的确定该目标用户是否为刷量用户ID,从而提高了刷量用户的识别准确度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例公开的一种用户识别方法的流程示意图;
图2是本申请实施例公开的另一种用户识别方法的流程示意图;
图3是本申请实施例公开的一种刷量用户识别的算法流程示意图;
图4是本申请实施例公开的另一种用户识别方法的流程示意图;
图5是本申请实施例公开的一种用户识别装置的结构示意图;
图6是本申请实施例公开的一种服务端的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、***、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本申请实施例所涉及到的移动终端可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其他处理设备,以及各种形式的用户设备(User Equipment,UE),移动台(Mobile Station,MS),终端设备(terminaldevice)等等。为方便描述,上面提到的设备统称为移动终端。
下面对本申请实施例进行详细介绍。
请参阅图1,图1是本申请实施例公开的一种用户识别方法的流程示意图,如图1所示,该用户识别方法包括如下步骤。
101,当需要对目标用户ID进行用户识别时,服务端确定是否存在已识别的N个刷量群体,N个刷量群体是按照群体用户规则分类得到,N个刷量群体中任意一个刷量群体包含的刷量用户ID大于预设数量阈值,N为正整数。
本申请实施例中,服务端是为客户端服务的,服务的内容诸如向客户端提供资源,保存客户端数据等。服务端是一种有针对性的服务程序,运行服务端的设备可以称为服务器。服务端可以同时与多个客户端建立连接,可以同时为多个客户端提供服务。本申请实施例中服务端可以用来识别刷量用户ID。
其中,客户端、内容提供端、服务端可以组成内容分发***。客户端为内容分发型客户端,客户端可以提供用于展示各种内容资源的展示界面,不同的内容资源占据展示界面的不同位置,内容分发***会统计各个客户端的各个内容资源的点击量或下载量,根据各个内容资源的点击量或下载量确定在客户端的展示界面的不同位置进行展示。内容提供端可以提供的内容资源,服务端将内容提供端的内容展示在客户端的展示界面。内容提供端的数量可以有多个、客户端的数量可以有多个,服务端的数量也可以有多个。内容资源可以是应用程序APP资源、音视频资源等。下面以APP资源为例进行说明。
内容分发***通常会统计各类APP的点击量或者下载量,并根据统计到的数据在内容分发平台(即,客户端)的不同位置展示APP,向用户推荐下载量高的APP,并且会给专门的资源形成榜单去运营。基于此,APP制作者(即,内容提供端)希望APP能够获得较高的点击量或者下载量,从而使APP能够得到一个较好的展示位置或者能够被内容分发平台推荐给用户。为了能够获得较高的点击量或者下载量,APP发布者可能会利用刷量应用程序对APP的点击量或者下载量进行刷量。APP发布者通过刷量应用程序发送刷量任务请求,安装有刷量应用程序的终端获取该刷量任务请求,进而,终端利用安装的刷量应用程序生成并不真实存在的用户,即刷量用户,对需要刷量的APP进行点击或者观看,从而增加APP的点击量或者下载量。采用这种不真实的APP点击量或者下载量进行某些决策时,往往会给内容分发平台带来很多不利影响,根据不真实的APP点击量或者下载量流量数据推荐的APP可能并非优质APP,从而影响用户对于内容分发平台的信任度。为了减少不真实的APP点击量或者下载量带来的负面影响,内容分发平台需要识别点击或者观看某一APP的用户中哪些用户是刷量用户。
为了识别目标用户ID是否为刷量用户ID,服务端首先确定是否存在已识别的N个刷量群体,N个刷量群体是按照群体用户规则分类得到。群体用户规则可以基于用户ID对应的设备位置、用户ID对应的应用程序使用的时间序列、用户ID对应的应用程序的累计使用时长、用户ID对应的应用程序的使用频次、用户ID对应的应用程序与客户端的所有应用程序的使用时长比例确定。比如,可以将设备位置相同、时间序列相近、累计使用时长均大于一定时长阈值(比如,2小时)、使用频率大于一定频次阈值(比如,100次)、用户ID对应的应用程序与客户端的所有应用程序的使用时长比例大于一定比例阈值(比如,80%)的用户ID归入同一个刷量群体。
其中,刷量群体包含的刷量用户ID大于预设数量阈值,预设数量阈值可以预先进行设定并存储在服务端的存储器(比如,非易失性存储器)中。预设数量阈值可以为大于或等于2的整数,比如,预设数量阈值可以设置为5。
可选的,所述群体用户规则基于用户ID对应的设备位置以及用户ID对应的应用程序使用的时间序列确定。在执行步骤101之前,还可以执行如下步骤:
服务端将已识别的多个刷量用户ID中对应的设备位置之间的距离小于预设距离阈值、并且所述多个刷量用户ID中应用程序使用的时间序列在第一预设时间段内的刷量用户ID归入第一类刷量群体。
本申请实施例中,在服务端确定是否存在已识别的N个刷量群体之前,服务端可以采用群体用户规则对已识别的多个刷量用户ID进行分类,可以将已识别的多个刷量用户ID中对应的设备位置之间的距离小于预设距离阈值、且所述多个刷量用户ID中应用程序使用的时间序列在第一预设时间段内的刷量用户ID归入同一类刷量群体。
应用程序使用的时间序列是代用时间标签的APP使用的数据,即每次APP的操作都会记录一个时间序列标签,用于记录APP的操作时间。由于群体刷量用户会集中在某一个时间段进行刷量,使得同一类群体刷量用户的APP时间训练具有较高的相似度。本申请实施例可以根据刷量用户ID中对应的设备位置之间的距离和刷量用户ID中应用程序使用的时间序列的相似度对刷量用户ID进行分类,提高了刷量用户ID分类的准确度。
102,若存在已识别的N个刷量群体,服务端获取目标用户ID的输入特征,输入特征包括用户位置特征、用户APP使用特征、用户设备使用特征和用户点击通过率CTR特征。
本申请实施例中,服务端获取目标用户ID的输入特征具体可以为:服务端从目标用户ID的历史行为数据中提取该目标用户ID的输入特征。
该目标用户ID的历史行为数据可以包括预设时间段内该目标用户ID登录的设备的位置信息、该目标用户ID的APP使用信息、该目标用户ID登录的设备的使用信息、该目标用户ID的CTR特征。
其中,考虑到刷量用户的位置聚集型以及一些位置的偏好性和较少移动性,本申请实施例加入用户的位置特征作为考虑之一。用户在使用设备进行刷量的时候会模拟跟终端操作类似,但是由于存在刷量任务,那么对刷量任务内容的打开率和使用时长会较长,但是对其他APP的使用就会较短,基于这种情况下,本申请实施例会考察终端对常用APP使用的使用频次和时长以及整个终端使用APP的时间分布进行考察,所以加入用户APP使用特征作为考虑之一。同时用户刷量由于带着特定的目的性,所以在终端的操作行为上也会有不同,比如是否有通话记录,是否插卡,是否有短信接收等终端使用行为,因此加入用户终端使用特征作为其中的考虑之一。由于刷量最后成功的指标是曝光点击率或者下载率或者是某个行为的成功率,那么跟CTR相关的任务的点击量上就会比其他用户更高更显著,所以把用户CTR特征也作为其中的考虑之一。
用户位置特征包括该目标用户ID登录的设备的位置特征(包括该用户ID登录时,设备的位置、设备的位置变化幅度等)。一般而言,该用户ID登录时,设备的位置变化幅度越小,该用户ID为刷量用户的可能性越大。
用户APP使用特征包括该用户ID登录的目标APP的使用时长、目标APP的使用频次、目标APP的使用时间分布等。一般而言,该用户ID登录的目标APP的使用时长越长、目标APP的使用频次越高,目标APP的使用时间分布越集中,该用户ID为刷量用户的可能性越大。
用户设备使用特征包括该目标用户ID登录的设备的使用特征(比如,该目标用户ID登录的过程中,该设备是否有通话记录、是否插卡,是否有短信接收等)。一般而言,如果目标用户ID登录的过程中,该设备没有通话记录、没有插卡、没有短信接收,该用户ID为刷量用户的可能性越大。
CTR指在搜索引擎中输入关键词后进行搜索,然后按竞价等因素把相关的网页按顺序进行排列出来,然后用户会选择自己感兴趣的网站点击进去;把一个网站所有搜索出来的次数作为总次数,把用户点击并进入网站的次数占总次数的比例叫点击率。一般而言,如果目标用户ID的CTR越高,则该用户ID为刷量用户的可能性越大。
103,服务端基于目标用户ID的输入特征识别目标用户ID与N个刷量群体中每个刷量群体的相似度。
本申请实施例中,N个刷量群体中每个刷量群体都会有群体共有特征。群体共有特征包括群***置相似、群体应用程序使用的时间序列相似。
服务端可以计算目标用户ID的用户位置特征与N个刷量群体中每个刷量群体的群***置特征的位置特征相似度,计算目标用户ID的应用程序使用的时间序列与N个刷量群体中每个刷量群体的群体应用程序使用的时间序列的时间相似度;根据N个刷量群体中每个刷量群体的群***置特征的位置特征相似度和N个刷量群体中每个刷量群体的群体应用程序使用的时间序列的时间相似度确定目标用户ID与N个刷量群体中每个刷量群体的相似度。
104,若N个刷量群体中存在与目标用户ID相似度大于预设相似度阈值的刷量群体,服务端确定目标用户ID为刷量用户ID。
本申请实施例中,如果N个刷量群体中存在与目标用户ID相似度大于预设相似度阈值的刷量群体,表明目标用户ID属于N个刷量群体中与目标用户ID相似度最大的目标刷量群体,则将该目标用户ID归入该目标刷量群体,并确定目标用户ID为刷量用户ID。
本申请实施例中,对目标用户ID进行用户识别时,可以将该目标用户与已识别的刷量群体进行相似度识别,如果相似度大于预设相似度阈值,则可直接认定该目标用户ID为刷量用户ID,由于刷量用户往往具有群体刷量的特性,通过与刷量群体的相似度识别可以快速准确的确定该目标用户是否为刷量用户ID,从而提高了刷量用户的识别准确度。
请参阅图2,图2是本申请实施例公开的另一种用户识别方法的流程示意图。图2是在图1的基础上进一步优化得到的,如图2所示,该用户识别方法包括如下步骤。
201,当需要对目标用户ID进行用户识别时,服务端确定是否存在已识别的N个刷量群体,N个刷量群体是按照群体用户规则分类得到,N个刷量群体中任意一个刷量群体包含的刷量用户ID大于预设数量阈值,N为正整数。
202,若存在已识别的N个刷量群体,服务端获取目标用户ID的输入特征,输入特征包括用户位置特征、用户APP使用特征、用户设备使用特征和用户点击通过率CTR特征。
203,服务端基于目标用户ID的输入特征识别目标用户ID与N个刷量群体中每个刷量群体的相似度。
204,若N个刷量群体中存在与目标用户ID相似度大于预设相似度阈值的刷量群体,服务端确定目标用户ID为刷量用户ID。
其中,本申请实施例中的步骤201至步骤204的具体实施可以参见图1所示的步骤101至步骤104的描述,此处不再赘述。
205,若N个刷量群体中不存在与目标用户ID相似度大于预设相似度阈值的刷量群体,服务端将目标用户ID的输入特征输入训练好的二分类模型,得到目标用户ID的输入特征的初步分类结果。
206,服务端将初步分类结果输入训练好的分类器进行计算,得到中间计算结果,将中间计算结果输入训练好的神经网络模型进行训练,得到目标用户ID的识别结果。
本申请实施例中,如果N个刷量群体中不存在与目标用户ID相似度大于预设相似度阈值的刷量群体,表明该目标用户ID不属于N个刷量群体中的任意一个。则需要利用训练好的二分类模型、训练好的分类器和训练好的神经网络模型对该目标用户ID进行识别。
其中,二分类模型可以采用多算法融合的方式,比如,二分类模型具体可以包括k最邻近(k-Nearest Neighbor,KNN)分类算法、逻辑回归(Logistic Regression,LR)算法、支持向量机(Support Vector Machine,SVM)算法的一种或多种组合的二分类模型。
分类器可以包括极端梯度提升(eXtreme Gradient Boosting,XGboost)分类器或者随机森林分类器。
举例来说,请参阅图3,图3是本申请实施例公开的一种刷量用户识别的算法流程示意图。如图3所示,首先将目标用户的输入特征输入二分类器,二分类器中的KNN分类算法、LR算法、SVM算法为单算法,用于对目标用户的输入特征进行分类;然后将二分类器分类的中间结果输入至分类器,分类器中的XGboost、随机森林为融合算法,用于对二分类器输出的中间结果进行初步计算;然后将分类器分类的中间结果输入至神经网络模型进行训练,最后得到目标用户的识别结果。目标用户的识别结果只有两种,即:是刷量用户或不是刷量用户。
本申请实施例的目标用户ID的识别过程先后采用单算法、融合算法和神经网络,单算法可以对输入特征进行初步分类,降低后续融合算法的计算复杂度,融合算法考虑了刷量用户的多种可能,可以保证融合算法的计算结果的准确性,最后采用神经网络模型进行训练,降低误判的可能性,进而提高目标用户ID的刷量识别结果的准确性。
可选的,在执行步骤205之前,还可以执行如下步骤:
(11)服务端提取第一用户ID的输入特征,所述第一用户ID为M个待识别用户ID中的任一个,M为正整数;
(12)服务端采用单用户规则识别所述M个待识别用户ID中的刷量用户ID和非刷量用户ID,P为小于或等于M的正整数;
(13)服务端将所述M个待识别用户ID的输入特征输入初始二分类模型进行训练,得到M个训练结果;
(14)当所述M个训练结果的准确度达到第一预设准确度阈值时,服务端确定训练后的所述初始二分类模型为训练好的二分类模型。
其中,M个待识别用户ID可以通过单用户规则进行识别的用户ID。M个待识别用户ID都可以通过单用户规则识别其是否为刷量用户。单用户规则可以包括如下规则:(1)同一个用户ID短时间内在多个终端(比如,手机)上登录;(2)一个终端上同时有多个用户ID进行注册登录;(3)一个终端对同一个网址进行持续不间断访问或者访问次数远远超过普通用户。
M个待识别用户ID中的每个用户ID,要么同时满足上述三条单用户规则,要么都不满足上述单用户规则。M个待识别用户ID中同时满足上述三条单用户规则的用户ID为刷量用户ID,M个待识别用户ID中不满足上述三条单用户规则中的任意一条的用户ID为非刷量用户ID。也即,M个待识别用户ID中的用户ID都可以通过该单用户规则识别是否为刷量用户。M个待识别用户ID中的刷量用户ID作为二分类模型训练的黑样本,M个待识别用户ID中的非刷量用户ID作为二分类模型训练的白样本,保证二分类模型训练的初始数据的准确性,从而提高二分类模型的训练效果。为了提高二分类模型的训练效果,M的值可以取的尽可能的大。
本申请实施例提供了一种二分类模型的训练方法,首先采用单用户规则识别出刷量用户,根据之前识别出的出一些较准确的刷量用户作为黑样本,其他正常用户作为白样本,作为一个二分类问题进行预测,并统计预测结果的准确性,当训练的结果出现错误时,会对该二分类模型进行相应的调整,以使该二分类模型下次不会出现相同的错误,直到该二分类模型的准确率达到第一预设准确度阈值时,停止进行训练,确定训练后的所述初始二分类模型为训练好的二分类模型。
可选的,在执行步骤206之前,还可以执行如下步骤:
(21)服务端将所述M个训练结果输入初始分类器进行计算,得到M个中间计算结果;
(22)当所述M个中间计算结果的准确度达到第二预设准确度阈值时,服务端确定训练后的所述初始分类器为训练好的分类器。
本申请实施例提供了一种分类器的训练方法,根据之前识别出的出一些较准确的刷量用户作为黑样本,其他正常用户作为白样本进行训练,可以得到准确度较高的分类器。
可选的,在执行步骤206之前,还可以执行如下步骤:
(31)服务端将所述M个中间计算结果输入初始神经网络模型进行训练,得到M个识别结果;
(32)当所述M个识别结果的准确度达到第三预设准确度阈值时,服务端确定训练后的所述初始神经网络模型为训练好的神经网络模型。
本申请实施例提供了一种神经网络模型的训练方法,根据之前识别出的出一些较准确的刷量用户作为黑样本,其他正常用户作为白样本进行训练,可以得到准确度较高的神经网络模型。
请参阅图4,图4是本申请实施例公开的另一种用户识别方法的流程示意图。图4是在图2的基础上进一步优化得到的,如图4所示,该用户识别方法包括如下步骤。
401,当需要对目标用户ID进行用户识别时,服务端确定是否存在已识别的N个刷量群体,N个刷量群体是按照群体用户规则分类得到,N个刷量群体中任意一个刷量群体包含的刷量用户ID大于预设数量阈值,N为正整数。
402,若存在已识别的N个刷量群体,服务端获取目标用户ID的输入特征,输入特征包括用户位置特征、用户APP使用特征、用户设备使用特征和用户点击通过率CTR特征。
403,服务端基于目标用户ID的输入特征识别目标用户ID与N个刷量群体中每个刷量群体的相似度。
404,若N个刷量群体中存在与目标用户ID相似度大于预设相似度阈值的刷量群体,服务端确定目标用户ID为刷量用户ID。
405,若N个刷量群体中不存在与目标用户ID相似度大于预设相似度阈值的刷量群体,服务端将目标用户ID的输入特征输入训练好的二分类模型,得到目标用户ID的输入特征的初步分类结果。
406,服务端将初步分类结果输入训练好的分类器进行计算,得到中间计算结果,将中间计算结果输入训练好的神经网络模型进行训练,得到目标用户ID的识别结果。
其中,步骤401至步骤406的具体实施可以参见图2所示的步骤201至步骤206,此处不再赘述。
407,若不存在已识别的N个刷量群体,服务端确定是否存在已识别的多个刷量用户ID。
408,若存在已识别的多个刷量用户ID,服务端识别目标用户ID与已识别的多个刷量用户ID之间的相似度。
409,若多个刷量用户ID中存在与目标用户ID相似度大于预设相似度阈值的刷量用户ID,服务端在目标用户ID的输入特征中增加刷量用户关联特征;并执行步骤405中服务端将目标用户ID的输入特征输入训练好的二分类模型,得到目标用户ID的输入特征的初步分类结果的步骤。
本申请实施例中,如果不存在已识别的刷量群体,则可以将目标用户ID与单个已识别的刷量用户ID进行相似度计算。当识别到用户和单个刷量用户存在关联,可以利用相似度分析的算法对用户进行判断,求出目标用户ID与刷量用户ID之间的相似度来增加目标用户ID的输入特征,从而提高该目标用户ID识别的准确度,进一步判断该目标用户是否是真正的刷量用户。
可选的,本申请实施例还可以采用非监督算法去完成群体刷量识别,利用到聚类算法或者孤独森林的算法进行识别那些群体中异常的用户。
上述主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是,服务端为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本发明能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
本申请实施例可以根据上述方法示例对服务端进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
请参阅图5,图5是本申请实施例公开的一种用户识别装置的结构示意图。如图5所示,该用户识别装置500包括第一确定单元501、获取单元502、识别单元503和第二确定单元504,其中:
所述第一确定单元501,用于当需要对目标用户ID进行用户识别时,确定是否存在已识别的N个刷量群体,所述N个刷量群体是按照群体用户规则分类得到,所述N个刷量群体中任意一个刷量群体包含的刷量用户ID大于预设数量阈值,N为正整数;
所述获取单元502,用于在所述第一确定单元501确定存在已识别的N个刷量群体的情况下,获取所述目标用户ID的输入特征,所述输入特征包括用户位置特征、用户APP使用特征、用户设备使用特征和用户点击通过率CTR特征;
所述识别单元503,用于基于所述目标用户ID的输入特征识别所述目标用户ID与所述N个刷量群体中每个刷量群体的相似度;
所述第二确定单元504,用于在所述识别单元503识别到所述N个刷量群体中存在与所述目标用户ID相似度大于预设相似度阈值的刷量群体的情况下,确定所述目标用户ID为刷量用户ID。
可选的,该用户识别装置500还可以包括处理单元505505。
所述处理单元505,用于在所述识别单元503识别到所述N个刷量群体中不存在与所述目标用户ID相似度大于预设相似度阈值的刷量群体的情况下,将所述目标用户ID的输入特征输入训练好的二分类模型,得到所述目标用户ID的输入特征的初步分类结果;
所述处理单元505,还用于将所述初步分类结果输入训练好的分类器进行计算,得到中间计算结果,将所述中间计算结果输入训练好的神经网络模型进行训练,得到所述目标用户ID的识别结果。
可选的,所述处理单元505,还用于将所述目标用户ID的输入特征输入训练好的二分类模型,得到所述目标用户ID的输入特征的初步分类结果之前,提取第一用户ID的输入特征,所述第一用户ID为M个待识别用户ID中的任一个,M为正整数;采用单用户规则识别所述M个待识别用户ID中的刷量用户ID和非刷量用户ID;将所述M个待识别用户ID的输入特征输入初始二分类模型进行训练,得到M个训练结果;当所述M个训练结果的准确度达到第一预设准确度阈值时,确定训练后的所述初始二分类模型为训练好的二分类模型。
可选的,所述处理单元505,还用于将所述初步分类结果输入训练好的分类器进行计算,得到中间计算结果之前,将所述M个训练结果输入初始分类器进行计算,得到M个中间计算结果;当所述M个中间计算结果的准确度达到第二预设准确度阈值时,确定训练后的所述初始分类器为训练好的分类器。
可选的,所述处理单元505,还用于将所述中间计算结果输入训练好的神经网络模型进行训练,得到所述目标用户ID的识别结果之前,将所述M个中间计算结果输入初始神经网络模型进行训练,得到M个识别结果;
当所述M个识别结果的准确度达到第三预设准确度阈值时,确定训练后的所述初始神经网络模型为训练好的神经网络模型。
可选的,所述群体用户规则基于用户ID对应的设备位置以及用户ID对应的应用程序使用的时间序列确定,所述处理单元505,还用于在所述第一确定单元501确定是否存在已识别的N个刷量群体之前,将已识别的多个刷量用户ID中对应的设备位置之间的距离小于预设距离阈值、并且所述多个刷量用户ID中应用程序使用的时间序列在第一预设时间段内的刷量用户ID归入第一类刷量群体。
可选的,所述处理单元505,还用于在所述第一确定单元501确定不存在已识别的N个刷量群体的情况下,确定是否存在已识别的多个刷量用户ID;若存在所述已识别的多个刷量用户ID,识别所述目标用户ID与所述已识别的多个刷量用户ID之间的相似度;若所述多个刷量用户ID中存在与所述目标用户ID相似度大于预设相似度阈值的刷量用户ID,在所述目标用户ID的输入特征中增加刷量用户关联特征;将所述目标用户ID的输入特征输入训练好的二分类模型,得到所述目标用户ID的输入特征的初步分类结果。
其中,图5中的第一确定单元501、获取单元502、识别单元503、第二确定单元504和处理单元505可以是处理器。
实施图5所示的用户识别装置,对目标用户ID进行用户识别时,可以将该目标用户与已识别的刷量群体进行相似度识别,如果相似度大于预设相似度阈值,则可直接认定该目标用户ID为刷量用户ID,由于刷量用户往往具有群体刷量的特性,通过与刷量群体的相似度识别可以快速准确的确定该目标用户是否为刷量用户ID,从而提高了刷量用户的识别准确度。
请参阅图6,图6是本申请实施例公开的一种服务端的结构示意图。如图6所示,该服务端600包括处理器601和存储器602,其中,服务端600还可以包括总线603,处理器601和存储器602可以通过总线603相互连接,总线603可以是外设部件互连标准(PeripheralComponent Interconnect,简称PCI)总线或扩展工业标准结构(Extended IndustryStandard Architecture,简称EISA)总线等。总线603可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。其中,服务端600还可以包括输入通信接口604,该通信接口604可以从外部设备(比如,其他服务器或者数据库)从获取数据。存储器602用于存储包含指令的一个或多个程序;处理器601用于调用存储在存储器602中的指令执行上述图1至图4中的部分或全部方法步骤。
实施图6所示的服务端,对目标用户ID进行用户识别时,可以将该目标用户与已识别的刷量群体进行相似度识别,如果相似度大于预设相似度阈值,则可直接认定该目标用户ID为刷量用户ID,由于刷量用户往往具有群体刷量的特性,通过与刷量群体的相似度识别可以快速准确的确定该目标用户是否为刷量用户ID,从而提高了刷量用户的识别准确度。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任何一种用户识别方法的部分或全部步骤。
本申请实施例还提供一种计算机程序产品,该计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,该计算机程序可操作来使计算机执行如上述方法实施例中记载的任何一种用户识别方法的部分或全部步骤。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种用户识别方法,其特征在于,包括:
当需要对目标用户ID进行用户识别时,确定是否存在已识别的N个刷量群体,所述N个刷量群体是按照群体用户规则分类得到,所述N个刷量群体中任意一个刷量群体包含的刷量用户ID大于预设数量阈值,N为正整数;
若存在,获取所述目标用户ID的输入特征,所述输入特征包括用户位置特征、用户APP使用特征、用户设备使用特征和用户点击通过率CTR特征;所述用户位置特征包括所述目标用户ID登录的设备的位置特征,所述用户APP使用特征包括所述目标用户ID登录的目标APP的使用时长、目标APP的使用频次、目标APP的使用时间分布中的至少一种,所述用户设备使用特征包括该目标用户ID登录的设备的使用特征;
基于所述目标用户ID的输入特征识别所述目标用户ID与所述N个刷量群体中每个刷量群体的相似度;
若所述N个刷量群体中存在与所述目标用户ID相似度大于预设相似度阈值的刷量群体,确定所述目标用户ID为刷量用户ID;
若所述N个刷量群体中不存在与所述目标用户ID相似度大于预设相似度阈值的刷量群体,将所述目标用户ID的输入特征输入训练好的二分类模型,得到所述目标用户ID的输入特征的初步分类结果;
将所述初步分类结果输入训练好的分类器进行计算,得到中间计算结果,将所述中间计算结果输入训练好的神经网络模型进行训练,得到所述目标用户ID的识别结果。
2.根据权利要求1所述的方法,其特征在于,所述将所述目标用户ID的输入特征输入训练好的二分类模型,得到所述目标用户ID的输入特征的初步分类结果之前,所述方法还包括:
提取第一用户ID的输入特征,所述第一用户ID为M个待识别用户ID中的任一个,M为正整数;
采用单用户规则识别所述M个待识别用户ID中的刷量用户ID和非刷量用户ID;
将所述M个待识别用户ID的输入特征输入初始二分类模型进行训练,得到M个训练结果;
当所述M个训练结果的准确度达到第一预设准确度阈值时,确定训练后的所述初始二分类模型为训练好的二分类模型。
3.根据权利要求2所述的方法,其特征在于,所述将所述初步分类结果输入训练好的分类器进行计算,得到中间计算结果之前,所述方法还包括:
将所述M个训练结果输入初始分类器进行计算,得到M个中间计算结果;
当所述M个中间计算结果的准确度达到第二预设准确度阈值时,确定训练后的所述初始分类器为训练好的分类器。
4.根据权利要求3所述的方法,其特征在于,所述将所述中间计算结果输入训练好的神经网络模型进行训练,得到所述目标用户ID的识别结果之前,所述方法还包括:
将所述M个中间计算结果输入初始神经网络模型进行训练,得到M个识别结果;
当所述M个识别结果的准确度达到第三预设准确度阈值时,确定训练后的所述初始神经网络模型为训练好的神经网络模型。
5.根据权利要求1~4任一项所述的方法,其特征在于,所述群体用户规则基于用户ID对应的设备位置以及用户ID对应的应用程序使用的时间序列确定,所述确定是否存在已识别的N个刷量群体之前,所述方法还包括:
将已识别的多个刷量用户ID中对应的设备位置之间的距离小于预设距离阈值、并且所述多个刷量用户ID中应用程序使用的时间序列在第一预设时间段内的刷量用户ID归入第一类刷量群体。
6.根据权利要求1~4任一项所述的方法,其特征在于,所述方法还包括:
若不存在已识别的N个刷量群体,确定是否存在已识别的多个刷量用户ID;
若存在所述已识别的多个刷量用户ID,识别所述目标用户ID与所述已识别的多个刷量用户ID之间的相似度;
若所述多个刷量用户ID中存在与所述目标用户ID相似度大于预设相似度阈值的刷量用户ID,在所述目标用户ID的输入特征中增加刷量用户关联特征;
执行所述将所述目标用户ID的输入特征输入训练好的二分类模型,得到所述目标用户ID的输入特征的初步分类结果的步骤。
7.根据权利要求5所述的方法,其特征在于,所述方法还包括:
若不存在已识别的N个刷量群体,确定是否存在已识别的多个刷量用户ID;
若存在所述已识别的多个刷量用户ID,识别所述目标用户ID与所述已识别的多个刷量用户ID之间的相似度;
若所述多个刷量用户ID中存在与所述目标用户ID相似度大于预设相似度阈值的刷量用户ID,在所述目标用户ID的输入特征中增加刷量用户关联特征;
执行所述将所述目标用户ID的输入特征输入训练好的二分类模型,得到所述目标用户ID的输入特征的初步分类结果的步骤。
8.一种用户识别装置,其特征在于,所述用户识别装置包括第一确定单元、获取单元、识别单元、处理单元和第二确定单元,其中:
所述第一确定单元,用于当需要对目标用户ID进行用户识别时,确定是否存在已识别的N个刷量群体,所述N个刷量群体是按照群体用户规则分类得到,所述N个刷量群体中任意一个刷量群体包含的刷量用户ID大于预设数量阈值,N为正整数;
所述获取单元,用于在所述第一确定单元确定存在已识别的N个刷量群体的情况下,获取所述目标用户ID的输入特征,所述输入特征包括用户位置特征、用户APP使用特征、用户设备使用特征和用户点击通过率CTR特征;所述用户位置特征包括所述目标用户ID登录的设备的位置特征,所述用户APP使用特征包括所述目标用户ID登录的目标APP的使用时长、目标APP的使用频次、目标APP的使用时间分布中的至少一种,所述用户设备使用特征包括该目标用户ID登录的设备的使用特征;
所述识别单元,用于基于所述目标用户ID的输入特征识别所述目标用户ID与所述N个刷量群体中每个刷量群体的相似度;
所述第二确定单元,用于在所述识别单元识别到所述N个刷量群体中存在与所述目标用户ID相似度大于预设相似度阈值的刷量群体的情况下,确定所述目标用户ID为刷量用户ID;
所述处理单元,用于在所述识别单元识别到所述N个刷量群体中不存在与所述目标用户ID相似度大于预设相似度阈值的刷量群体的情况下,将所述目标用户ID的输入特征输入训练好的二分类模型,得到所述目标用户ID的输入特征的初步分类结果;
所述处理单元,还用于将所述初步分类结果输入训练好的分类器进行计算,得到中间计算结果,将所述中间计算结果输入训练好的神经网络模型进行训练,得到所述目标用户ID的识别结果。
9.一种服务端,其特征在于,包括处理器以及存储器,所述存储器用于存储一个或多个程序,所述一个或多个程序被配置成由所述处理器执行,所述程序包括用于执行如权利要求1~7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1~7任一项所述的方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2019/092592 WO2020257991A1 (zh) | 2019-06-24 | 2019-06-24 | 用户识别方法及相关产品 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113383362A CN113383362A (zh) | 2021-09-10 |
CN113383362B true CN113383362B (zh) | 2022-05-13 |
Family
ID=74061199
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980091203.7A Active CN113383362B (zh) | 2019-06-24 | 2019-06-24 | 用户识别方法及相关产品 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113383362B (zh) |
WO (1) | WO2020257991A1 (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111930995B (zh) * | 2020-08-18 | 2023-12-22 | 湖南快乐阳光互动娱乐传媒有限公司 | 数据处理方法及装置 |
CN112819527B (zh) * | 2021-01-29 | 2024-05-24 | 百果园技术(新加坡)有限公司 | 一种用户分群处理方法及装置 |
CN113947139A (zh) * | 2021-10-13 | 2022-01-18 | 咪咕视讯科技有限公司 | 一种用户的识别方法、装置及设备 |
CN113704566B (zh) * | 2021-10-29 | 2022-01-18 | 贝壳技术有限公司 | 识别号主体识别方法、存储介质和电子设备 |
CN114466214B (zh) * | 2022-02-09 | 2023-05-02 | 上海哔哩哔哩科技有限公司 | 直播间人数统计方法及装置 |
CN114679600A (zh) * | 2022-03-24 | 2022-06-28 | 上海哔哩哔哩科技有限公司 | 数据处理方法及装置 |
CN114926221A (zh) * | 2022-05-31 | 2022-08-19 | 北京奇艺世纪科技有限公司 | 作弊用户识别方法、装置、电子设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106294508A (zh) * | 2015-06-10 | 2017-01-04 | 深圳市腾讯计算机***有限公司 | 一种刷量工具检测方法及装置 |
CN107634952A (zh) * | 2017-09-22 | 2018-01-26 | 广东欧珀移动通信有限公司 | 刷量资源确定方法及装置 |
CN108921581A (zh) * | 2018-07-18 | 2018-11-30 | 北京三快在线科技有限公司 | 一种刷单操作识别方法、装置及计算机可读存储介质 |
CN109241343A (zh) * | 2018-07-27 | 2019-01-18 | 北京奇艺世纪科技有限公司 | 一种刷量用户识别***、方法及装置 |
CN109525595A (zh) * | 2018-12-25 | 2019-03-26 | 广州华多网络科技有限公司 | 一种基于时间流特征的黑产账号识别方法及设备 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7747535B2 (en) * | 2008-10-17 | 2010-06-29 | At&T Mobility Ii Llc | User terminal and wireless item-based credit card authorization servers, systems, methods and computer program products |
CN104932966B (zh) * | 2015-06-19 | 2017-09-15 | 广东欧珀移动通信有限公司 | 检测应用软件下载刷量的方法及装置 |
CN106612202A (zh) * | 2015-10-27 | 2017-05-03 | 网易(杭州)网络有限公司 | 一种网游渠道刷量的预估判别方法及*** |
CN107169769A (zh) * | 2016-03-08 | 2017-09-15 | 广州市动景计算机科技有限公司 | 应用程序的刷量识别方法、装置 |
CN106022834B (zh) * | 2016-05-24 | 2020-04-07 | 腾讯科技(深圳)有限公司 | 广告反作弊方法及装置 |
CN106651475A (zh) * | 2017-02-22 | 2017-05-10 | 广州万唯邑众信息科技有限公司 | 一种移动视频广告假量识别方法和*** |
-
2019
- 2019-06-24 CN CN201980091203.7A patent/CN113383362B/zh active Active
- 2019-06-24 WO PCT/CN2019/092592 patent/WO2020257991A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106294508A (zh) * | 2015-06-10 | 2017-01-04 | 深圳市腾讯计算机***有限公司 | 一种刷量工具检测方法及装置 |
CN107634952A (zh) * | 2017-09-22 | 2018-01-26 | 广东欧珀移动通信有限公司 | 刷量资源确定方法及装置 |
CN108921581A (zh) * | 2018-07-18 | 2018-11-30 | 北京三快在线科技有限公司 | 一种刷单操作识别方法、装置及计算机可读存储介质 |
CN109241343A (zh) * | 2018-07-27 | 2019-01-18 | 北京奇艺世纪科技有限公司 | 一种刷量用户识别***、方法及装置 |
CN109525595A (zh) * | 2018-12-25 | 2019-03-26 | 广州华多网络科技有限公司 | 一种基于时间流特征的黑产账号识别方法及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN113383362A (zh) | 2021-09-10 |
WO2020257991A1 (zh) | 2020-12-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113383362B (zh) | 用户识别方法及相关产品 | |
CN110198310B (zh) | 一种网络行为反作弊方法、装置及存储介质 | |
US11138381B2 (en) | Method, computer device and readable medium for user's intent mining | |
CN111190939A (zh) | 一种用户画像构建方法及装置 | |
CN106919661B (zh) | 一种情感类型识别方法及相关装置 | |
CN110826006B (zh) | 基于隐私数据保护的异常采集行为识别方法和装置 | |
CN110442712B (zh) | 风险的确定方法、装置、服务器和文本审理*** | |
CN108304426B (zh) | 标识的获取方法及装置 | |
CN113127746B (zh) | 基于用户聊天内容分析的信息推送方法及其相关设备 | |
CN108985048B (zh) | 模拟器识别方法及相关装置 | |
CN113111264B (zh) | 界面内容显示方法、装置、电子设备及存储介质 | |
CN113505272B (zh) | 基于行为习惯的控制方法和装置、电子设备和存储介质 | |
CN109194689B (zh) | 异常行为识别方法、装置、服务器及存储介质 | |
CN111522724A (zh) | 异常账号的确定方法、装置、服务器及存储介质 | |
CN113412607A (zh) | 内容推送方法、装置、移动终端及存储介质 | |
CN111126071A (zh) | 提问文本数据的确定方法、装置和客服群的数据处理方法 | |
CN113010785A (zh) | 用户推荐方法及设备 | |
CN109195154A (zh) | 物联网窜卡用户识别方法和装置 | |
CN110460593B (zh) | 一种移动流量网关的网络地址识别方法、装置及介质 | |
CN109120509B (zh) | 一种信息收集的方法及装置 | |
CN110020035B (zh) | 数据识别方法和装置、存储介质及电子装置 | |
CN113505293A (zh) | 信息推送方法、装置、电子设备及存储介质 | |
CN108711073B (zh) | 用户分析方法、装置及终端 | |
CN107222559B (zh) | 信息调用方法 | |
CN113052632B (zh) | 一种广告流量数据的识别方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |