CN106651458B

CN106651458B - 一种广告反作弊方法和装置

Info

Publication number: CN106651458B
Application number: CN201611245657.XA
Authority: CN
Inventors: 李东豫; 吕超; 孙宇; 俞欢
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2016-12-29
Filing date: 2016-12-29
Publication date: 2020-07-07
Anticipated expiration: 2036-12-29
Also published as: CN106651458A

Abstract

本发明实施例公开了一种广告反作弊方法和装置；本发明实施例采用确定待识别的流量，然后，获取该流量的广告点击对应的实时地理位置、以及该广告点击对应的终端的常驻地理位置，在该流量的广告点击中确定实时地理位置与常驻地理位置一致的广告点击，得到实时地理位置与常驻地理位置一致的广告点击数量，根据该广告点击数量确定该流量为可疑作弊流量；该方案可以识别可疑作弊流量。

Description

一种广告反作弊方法和装置

技术领域

本发明涉及互联网广告技术领域，具体涉及一种广告反作弊方法和装置。

背景技术

目前，广告主存在向用户推送广告以对产品或服务进行宣传的需求，伴随移动互联网用户的快速发展，移动互联网广告称为广告投放的新形式。

在移动互联网广告的***中，流量主可以在用户使用服务的过程中通过广告***向用户投放广告，比如，用户在使用终端应用的过程中向用户投放广告，并且流量主通过用户的点击、曝光、下载安装和激活等行为为广告主带来期望的转化，同时自己获得收益。

因为经济利益的原因，流量方为获得更多的收入，会在其现在流量基础上，采用作弊的方式伪造流量(称为作弊流量)，部分流量方甚至全部流量都是基于作弊方式而来的。这些伪造而来的流量对广告主来说毫无价值，并且会为广告主带来更多的费用。

然而，由于作弊者对伪造流量有很深入的研究，并且作弊技术不断发展更新。作弊流量可以从点击来源，点击行为，点击效果等多方面着手，使得可能是作弊的流量(即可疑作弊流量)无法被传统方法识别。

发明内容

本发明实施例提供一种广告反作弊方法和装置，可以识别可疑作弊流量。

本发明实施例提供一种广告反作弊方法，包括：

确定待识别的流量；

获取所述流量的广告点击对应的实时地理位置、以及所述广告点击对应的终端的常驻地理位置；

在所述流量的广告点击中确定实时地理位置与常驻地理位置一致的广告点击，得到实时地理位置与常驻地理位置一致的广告点击数量；

根据所述广告点击数量确定所述流量为可疑作弊流量。

相应的，本发明实施例还提供一种广告反作弊装置，包括：

第一确定单元，用于确定待识别的流量；

位置获取单元，用于获取所述流量的广告点击对应的实时地理位置、以及所述广告点击对应的终端的常驻地理位置；

点击量获取单元，用于在所述流量的广告点击中确定实时地理位置与常驻地理位置一致的广告点击，得到实时地理位置与常驻地理位置一致的广告点击数量；

第二确定单元，用于根据所述广告点击数量确定所述流量为可疑作弊流量。

本发明实施例采用确定待识别的流量，然后，获取该流量的广告点击对应的实时地理位置、以及该广告点击对应的终端的常驻地理位置，在该流量的广告点击中确定实时地理位置与常驻地理位置一致的广告点击，得到实时地理位置与常驻地理位置一致的广告点击数量，根据该广告点击数量确定该流量为作弊流量；该方案可以基于流量的广告点击的实时地理位置和点击终端的常驻地理位置来识别可疑作弊流量，可以识别可疑作弊流量。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1a是广告作弊方式的示意图；

图1b是本发明实施例提供的广告反作弊方法的流程图；

图1c是本发明实施例提供的常驻实时地理位置一致性占比的分布图；

图2a是本发明实施例提供的广告反作弊方法的另一流程图；

图2b是本发明实施例提供的广告反作弊***的结构示意图；

图3a是本发明实施例提供的广告反作弊装置的结构示意图；

图3b是本发明实施例提供的广告反作弊装置的另一结构示意图；

图3c是本发明实施例提供的广告反作弊装置的又一结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例中涉及的名词适用于如下的解释：

广告主：具有广告投放需求并为广告投放支付相关费用的一方，广告主通过购买流量投放广告达到其商业营销的目的，这种目的类似于商品销售、应用安装等。广告主希望每次付费的广告点击都是真实用户的有效点击，而并非作弊点击。

流量方或者流量主：流量方即提供用户流量的载体，比如，在PC端是一般指网站主体，在移动端，流量方则多指应用(IOS与安卓)，通过用户的点击、曝光和下载安装激活等行为为广告主带来期望的转化，同时自己获得收益。

流量：也称为访问流量，用于产生访问网络的数据流量的载体，比如网络应用、社交网络中的公众号等。

广告作弊：通过作弊手段在广告曝光、点击、效果等环节，出于恶意目的，存在提升广告曝光量、广告点击量、广告点击率、转化率等指标的行为，这种恶意行为成为广告作弊。比如，指某些经过特殊开发的手机应用，它可以通过技术手段伪造曝光、点击等数据，从而为作弊流量主骗取广告费。

机器作弊：在移动端有部分流量方为获取更多的收益，通过***伪造用户，并模拟用户的曝光、点击等行为，绕过以用户维度区分作弊的反作弊手段。

移动联盟：这里移动联盟是指为广大移动流量主提供商业化流量变现的平台。

联盟SDK(Software Development Kit，软件开发工具包)：移动联盟为流量方提供的服务。流量方通过嵌入SDK可以将流量变现，参与广告收入分成。

目前，为经济利益，流量方会对流量进行作弊，然而，随着作弊手段越来越成熟，导致可疑作弊流量很难被发现。参考图1a，具体地的作弊方式如下：

S1、换机服务产业化，有一些专业的服务商为作弊者提供完整的解决方案，作弊者可以通过这些服务将一台手机的机型等所有可以用来标识用户的信息转变为其它另一台真实存在的手机。可以将这个过程理解为“克隆”，专业的服务商可以将一台手机A完美地变成另一台真实的手机B。

S2，网络服务的产业化。网上有很多家不同的VPN提供商，可以提供全国各地的各种IP。通过这种服务，一台手机可以随机地变换IP到全国的任何地方。从而骗过移动联盟平台。

可以看出，目前的作弊手段已经相当成熟，如果单纯从上而的S1或S2中着手，是很难发现异常的。作弊者会将一台有“克隆”能力的手机接入VPN，从而一台手机变成了全国各地的很多台手机，这样消耗了广告主的预算，但不带给广告主任何的收益。

为了克服上述问题，本发明实施例提供一种广告反作弊方法和装置。以下将分别进行详细说明。

实施例一、

本实施例将从广告反作弊装置的角度进行描述，该广告反作弊装置具体可以集成在服务器等网络设备中。

一种广告反作弊方法，包括：确定待识别的流量，然后，获取该流量的广告点击对应的实时地理位置、以及该广告点击对应的终端的常驻地理位置，在该流量的广告点击中确定实时地理位置与常驻地理位置一致的广告点击，得到实时地理位置与常驻地理位置一致的广告点击数量，根据该广告点击数量确定该流量为作弊流量。

如图1b所示，该广告反作弊方法的流程图具体可以如下：

101、确定待识别的流量。

比如，可以从流量日志中确定待识别的流量，该流量日志记录了某个时间段内的所有流量。

102、获取该流量的广告点击对应的实时地理位置、以及该广告点击对应的终端的常驻地理位置。

其中，实时地理位置可以为用户点击广告时用户所处的地理位置。该实时地理位置可以包括用户点击广告时用户所处的区域，如国家、省、市、地区等等。例如，用户在广西省通过终端点击广告时，那么该点击对应的实时地理位置为广西省。

该常驻地理位置可以为用户点击广告所使用的终端长期或者经常所处的地理位置，也即广告请求终端长期或者经常所处的地理位置，比如该常驻地理位置可用包括终端长期所处的区域，如国家、省、市、地区等等。本实施例中，终端的常驻地理位置可以有多个，比如，某个终端的常驻地理可以包括：广东省、安徽省、广西省等。

本实施例中长期或者经常所处的地理位置，可以根据某个时间段终端处于该地理位置的次数确定，比如一个月内在处于广东省的次数大于预设次数，那么可认为常驻地域为广东省。

实际应用中，可以通过网络地址来获取实时地理位置、以及通过终端的终端标识来获取常驻地理位置。也即步骤“获取该流量的广告点击对应的实时地理位置、以及该广告点击对应的终端的常驻地理位置”可以包括：

获取该流量的广告点击对应的网络地址，并根据该网络地址获取该流量的广告点击对应的实时地理位置；

获取该流量的广告点击对应的终端标识，并根据该终端标识获取该广告点击对应的终端的常驻地理位置。

该网络地址可以为IP地址等，该终端标识可以包括：IMEI(International MobileEquipment Identity，国际移动设备身份码)、MAC地址、终端***标识(如Android ID)等。

比如，实时地理位置可以通过网络地址(如IP)与地理位置之间的映射关系得到，即步骤“据该网络地址获取该流量的广告点击对应的实时地理位置”可以包括：

根据网络地址、地址位置映射关系集合获取广告点击对应的实时地理位置，其中，地址位置映射关系集合包括网络地址与地理位置之间的映射关系。

本实施例中，常驻地理位置的获取依赖长久的数据挖掘与分析***，通过对数据的分析，可以得到终端标识与常驻地理位置之间的映射关系，这样便可以基于该映射关系得到终端的常驻地理位置。也即步骤“根据该终端标识获取该广告点击对应的终端的常驻地理位置”可以包括：

根据终端标识、标识位置映射关系集合获取该广告点击对应的终端的常驻地理位置，其中，标识位置映射关系集合包括终端标识与常驻地理位置之间的映射关系。

例如，在流量的广告点击量为n时，可以获取第i个广告点击的实时地理位置，以及第i个广告点击对应的终端的常驻地理位置，i、n为正整数，i小于或等于n。

103、在该流量的广告点击中确定实时地理位置与常驻地理位置一致的广告点击，得到实时地理位置与常驻地理位置一致的广告点击数量。

具体地，对流量的每个广告点击的实时地理位置与常驻地理位置进行比较，确定实时地理位置与常驻地理位置一致的广告点击，并统计实时地理位置与常驻地理位置一致的广告点击数量。比如，可以一边确定一边统计，或者，在确定完所有流量之后再统计。

例如，可以逐个遍历流量的n个广告点击，当遍历到i个广告点击时，获取该广告点击对应的实时地理位置和终端的常驻地理位置，然后，对实时地理位置和常驻地理位置进行比较，确定该广告点击是否为实时地理位置与常驻地理位置一致的广告点击，若是，则实时地理位置与常驻地理位置一致的广告点击数量加1，并对下一个即i+1个广告点击进行确定，若否，则对下一个即i+1个广告点击进行确定，i、n为正整数，i小于或等于n。

104、根据该广告点击数量确定该流量为可疑作弊流量。

其中，可疑作弊流量为：可能为作弊流量的流量，也即是作弊流量的概率比较大的流量。

本实施例中，根据实时常驻地理位置一致的广告点击数量确定流量为可疑作弊流量的方式有多种，比如，当广告点击数量小于预设阈值时，可以确定该流量为可以可疑作弊流量。又比如，根据广告点击数量和中点击数量获取实时常驻地理位置不一致的广告点击数量，当该不一致的广告点击数量大于预设阈值时，确定该流量为可疑作弊流量。

优选地，本实施例可以通过常驻地理位置一致的广告点击数量与总广告点击数量之比(即常驻实时地理位置一致性占比，记为s)来确定流量是否为可疑作弊流量。也即步骤“根据该广告点击数量确定该流量为可疑作弊流量”可以包括：

根据该广告点击数量和该流量的总广告点击数量，获取该流量的常驻实时地理位置一致性占比；

当该常驻实时地理位置一致性占比小于预设阈值时，确定该流量为可疑作弊流量。

其中，常驻实时地理位置一致性占比s＝实时地理位置与常驻地理位置一致的广告点击数量/总广告点击数量。例如，总广告点击数量为n，实时地理位置与常驻地理位置一致的广告点击数量为m，此时，s＝m/n，m为小于或等于n的正整数。

该预设阈值可以根据实际需求设定，比如，一般设置为15％，即如果s小于15％，则该流量有很大概率为作弊流量，此时，可以确定该流量为可疑作弊流量。

本实施例中，常驻实时地理位置一致性占比对于区分真实流量和可疑作弊流量的能力很强，如图1c，为天下联盟某天的整体流量情况图，从图中可以看出真实的流量，一致性占比都在65％以上，而虚假的流量(即作弊流量)，其一致性比例很低，在15％以下。

可选地，为提高作弊流量的识别精确性，本实施例还可以在确定流量为可疑作弊流量之后，获取该流量为作弊流量的概率，即作弊率。本实施例可以通过一部分点击来估计流量整体的作弊率；如可以通过一定数量的点击样本来估计流量整体的作弊率；即本实施例方法在确定该流量为作弊流量该获取该流量的作弊率之后，还可以包括：

从该流量的广告点击中选取样本广告点击，得到样本点击集合；

根据该样本点击集合获取该流量的作弊率，该作弊率是该流量为作弊流量的概率。

比如，从该流量的广告点击中选取预定数量的样本广告点击，该预设数量可以根据实际需求设定，实际应用中，预定数量要足够大，比如，可以大于100等。

其中，为提高作弊率的准确性，该样本广告点击可以为具有实时地理位置和/或常驻地理位置的广告点击，也即能够获取实时地理位置和/或常驻地理位置的广告点击。

优选地，本实施例可以针对样本集合采用中心极限定理来估算作弊率，也即步骤“根据该样本点击集合获取该流量的作弊率”可以包括：

根据大数中心极限定理，将该样本点击集合按照服从正态分布规律进行分析，估计作弊率在预设置信水平的置信区间。

其中，样本点击集合，也即样本点击序列服从(0-1)分布，比如，样本点击序列为X(n)，X(n)＝Xi，X(n)服从参数为p的0-1分布，X(n)的概率密度函数为：

f(x；p)＝p^x(1-p)^(1-x)；

其中，p为作弊率，x＝0，1。由于X(n)服从0-1分布，那么期望E(X)＝p，方差D(X)＝p*(1-p)。

实际应用中可将某一流量(的所有点击)是否作弊看成为一个符合(0-1)分布的总体，某个时间段(如天)的点击(点击量n>100)看成为一个足够大的样本。

本实施例中，当样本点击集合X(n)的点击数足够大时，样本X(n)符合中心极限定理。根据大数中心极限定理可知，当样本足够大时，随机变量的标准化变量Yn近似服从标准正态分布N(0，1)，即：步骤“根据大数中心极限定理，将该样本点击集合按照服从正态分布规律进行分析，估计作弊率在预设置信水平的置信区间”包括：

确定：

服从标准正态分布N(0,1)；

由中心极限定理可知，Yn-N(0,1)，服从标准正态分布，其中X为样本均值，由于样本X(n)服从符合(0-1)分布，因此，X＝p。

确定：

其中，z_α/2是标准正态分布α/2处的上边界值；1-α为置信水平；

根据

和

得到二元方程：

比如，将Yn用

代入，并且在不等式两边取平方，即可得到一个关于p的二元方程；

对该二元方程进行求解得到：

其中，

其中，

根据

得到作弊率在预设置信水平1-α的置信区间[θ1,θ2]。

以上翻译成通俗的语言就是，用n个样本去估计这一流量总体的作弊率，我们有1-α的信心相信，此流量的作弊率会在以下区间[θ1,θ2]。

举例来说，假如有一个流量，取出有地域的样本100个点击，其实时与长期地域不符合的数目共有95个(这里可以认为其作弊的共有95个)，那么求此流量的作弊率p在0.9的置信区间[θ1,θ2](也就是说，我们有90％的信心认为，这个流量的作弊率在以下区间[θ1,θ2]。

这里的参数为n＝100,

1-α＝0.9,z_α/2＝1.645(查表可得)。

计算可得，p1＝0.9008,p2＝0.9755。那么，上面的情况表明，我们有90％的信心认为，如果有100个点击中，长期地域不符合的数目共有95个(也就是作弊的有95个)，那么这个流量的作弊率会在[90.08％,97.55％]之间。

可选地，本实施例在获取流量的作弊率之后，可以基于该作弊率来确定该流量是否为作弊流量，比如，当置信区域的下限作弊率大于某个阈值时，则认为该流量为作弊流量。

可选地，在获取流量的作弊率之后还可以对流量的点击量进行判罚，并进行计费，提高了计费准确性，提高了反作弊效果；也即本实施例方法还包括：

从该置信区间中选取该流量的目标作弊率；

根据该目标作弊率和该流量的总广告点击数量，对该流量进行计费。

其中，目标作弊率的选取方式可以有多种，比如，可以选取置信区间的上限作弊率、下限作弊率或者区间中间的某些作弊率等，具体选取方式可以根据实际需求设定。

实际应用中，可以将目标作弊率与总广告点击数量直接相乘得到需要参与流量计费的广告点击数量，然后，在根据该点击数量进行计费。又比如，还可以根据目标作弊率确定一个广告点击判罚比例，然后，基于该判罚比例和总点击量进行计费；也即步骤“根据该目标作弊率和该流量的总广告点击数量，对该流量进行计费”可以包括：

根据该目标作弊概率和该预设置信水平，获取广告点击判罚比例；

根据该广告点击判罚比例和该总广告点击数量获取需要参与流量计费的有效广告点击数量；

根据该有效广告点击数量对该流量进行计费。

比如，通过置信度按1-α(如90％)信心计算其作弊概率分布区间[θ1,θ2],按其作弊率下限与置信水平(90％)的乘积作为判罚标准，也即某一流量的最终判罚比例为(1-α)*θ1，如0.9*θ1。

假设通过上述计算得到，置信水平为90％时作弊率会在[90.08％,97.55％]之间，此时，广告点击判罚比例可以为90％*90.08％＝81％。如果总点击量为1000，那么需要参与流量计费的目标广告点击量为1000-81％*1000＝190。即对810个点击不进行计费。

由上可知，本发明实施例采用确定待识别的流量，然后，获取该流量的广告点击对应的实时地理位置、以及该广告点击对应的终端的常驻地理位置，在该流量的广告点击中确定实时地理位置与常驻地理位置一致的广告点击，得到实时地理位置与常驻地理位置一致的广告点击数量，根据该广告点击数量确定该流量为作弊流量；该方案可以基于流量的广告点击的实时地理位置和点击终端的常驻地理位置来识别可疑作弊流量，可以识别可疑作弊流量。

此外，本发明实施例还可以获取作弊流量为作弊流量的概率，即作弊率，以便于识别出作弊流量，可以提高作弊流量的识别精确度以及流量计费的精确度和合理性，从而保护广告主的利益。

实施例二、

根据实施例一所描述的方法，以下将举例作进一步详细说明。

在本实施例中，将以该广告反作弊装置具体集成服务器为例进行说明。

如图2a所示，一种广告反作弊方法，具体流程如下：

201、服务器从流量记录中确定待识别的流量。

比如，服务器可以从流量日志中确定待识别的流量等。

202、服务器分别获取该流量的广告点击对应的实时地理位置、以及该广告点击对应的终端的常驻地理位置。

其中，实时地理位置可以为用户点击广告时用户所处的地理位置。该实时地理位置可以包括用户点击广告时用户所处的区域，如国家、省、市、地区等等。

具体地，服务器获取该流量的广告点击对应的网络地址，并根据该网络地址获取该流量的广告点击对应的实时地理位置；获取该流量的广告点击对应的终端标识，并根据该终端标识获取该广告点击对应的终端的常驻地理位置。

203、服务器统计该流量的广告点击中实时地理位置与常驻地理位置一致的广告点击的数量。

204、服务器根据实时地理位置与常驻地理位置一致的广告点击的数量和中广告点击数量，获取该流量的常驻实时地理位置一致性占比。

常驻实时地理位置一致性占比为常驻地理位置一致的广告点击数量与总广告点击数量之比。

205、服务器在常驻实时地理位置一致性占比小于预设阈值时，确定该流量为可疑作弊流量。

比如，一致性占比小于15％时，确定该流量为可疑作弊流量。

206、服务器根据预定数量从该流量的广告点击中选取具有实时地理位置和常驻地理位置的样本广告点击，得到样本点击序列X(n)，并确定X(n)服从(0-1)分布。

其中，预定数量可以选取较大的数量，比如大于100。

假设，服务器从广告点击中选取样本点击，得到样本点击序列X(n)。该样本点击序列服从(0-1)分布，比如，样本点击序列为X(n)，X(n)＝Xi，X(n)服从参数为p的0-1分布。

其中，p为作弊率，X(n)的期望E(X)＝p，方差D(X)＝p*(1-p)。

207、服务器根据大数中心极限定理，将该样本点击集合按照服从正态分布规律进行分析，估计作弊率p在预设置信水平1-α的置信区间[θ1,θ2]。

具体地，根据大数中心极限定理确定：

(公式1)，服从标准正态分布N(0,1)；

确定：

(公式2)，不等式需满足

(公式3)，其中，z_α/2是标准正态分布α/2处的上边界值；1-α为置信水平。

将Yn用公式1代替后，得到二元方程：

(公式4)；

对该二元方程进行求解得到：

其中，

其中，

根据

得到作弊率在预设置信水平1-α的置信区间[θ1,θ2]。

208、服务器根据置信区间[θ1,θ2]的下限作弊率θ1和预设置信水平1-α获取广告点击判罚比例Q。

其中，Q＝θ1*(1-α)。

209、服务器根据该广告点击判罚比例和该总广告点击数量获取需要参与流量计费的有效广告点击数量，根据该有效广告点击数量对该流量进行计费。

本实施例中可以由服务器来进行流量计费，在其他实施例中也可以由其他设备根据广告点击判罚比例和该总广告点击数量进行流量计费。

比如，总点击量为j时，参与计费的目标广告点击量为Q*j。

参考图2b，本发明实施例还提供了一种广告反作弊***，首先通过对流量日志分析，按流量维度找到实时地理位置和常驻地理位置一致性占比低(如低于15％)的流量，即可疑作弊流量。

具体地，可以通过常驻位置收集模块获取广告点击对应的终端的常驻地理位置，比如，常驻位置收集模块获取终端标识(IMEI等)，然后查找与该终端标识对应的常驻地理位置。

通过IP转位置模块获取广告点击的实时地理位置，比如，IP转位置模块获取广告点击的IP，然后，查找与该IP对应的实时地理位置。

在查找待判罚的可疑作弊流量后，可以通过点击样本来估计流量的作弊率，比如，估算置信水平1-α下作弊率的分布区间[θ1,θ2]，即置信区间。然后，通过置信区间的下限值θ1和置信水平1-α下得到最终判罚比例θ1*(1-α)。

在得到判罚比例之后，可以将判罚比例定时更新到线上的存储***中，接着反作弊线上***从线上存储中获取判罚比例，并发送给计费模块，最后计费模块将会根据该判罚比例对流量进行计费，具体地，根据判罚比例和总点击量，确定有效点击量，然后，根据该有效点击量进行计费，其中，被判作弊的点击行为不会对广告主计费，从而保护到广告主的利益。

实施例三、

为了更好地实施以上方法，本发明实施例还提供一种广告反作弊装置如图3a所示，该广告信息发送装置包括第一确定单元301、位置获取单元302、点击量获取单元303和第二确定单元304，如下：

(1)第一确定单元301；

第一确定单元301，用于确定待识别的流量。

(2)位置获取单元302；

位置获取单元302，用于获取该流量的广告点击对应的实时地理位置、以及该广告点击对应的终端的常驻地理位置。

实际应用中，可以通过网络地址来获取实时地理位置、以及通过终端的终端标识来获取常驻地理位置。

比如，该位置获取单元302，具体用于：

(3)点击量获取单元303；

点击量获取单元303，用于在该流量的广告点击中确定实时地理位置与常驻地理位置一致的广告点击，得到实时地理位置与常驻地理位置一致的广告点击数量。

比如，点击量获取单元303可以具体用于对流量的每个广告点击的实时地理位置与常驻地理位置进行比较，确定实时地理位置与常驻地理位置一致的广告点击，并统计实时地理位置与常驻地理位置一致的广告点击数量。

(4)第二确定单元304；

第二确定单元304，用于根据该广告点击数量确定该流量为可疑作弊流量。

其中，可疑作弊流量为可能为作弊流量的流量，也即是作弊流量的概率比较大的流量。

其中，该第二确定单元304可以包括：

占比获取子单元，用于根据该广告点击数量和该流量的总广告点击数量，获取该流量的常驻实时地理位置一致性占比；

确定子单元，用于当该常驻实时地理位置一致性占比小于预设阈值时，确定该流量为可疑作弊流量。

可选地，为提高作弊流量的识别精确性，本实施例还可以在确定流量为可疑作弊流量之后，获取该流量为作弊流量的概率，即作弊率。参考图3b，该广告反作弊装置还可以包括：

样本选取单元305，用于在第二确定单元304确定该流量为可疑作弊流量之后，从该流量的广告点击中选取样本广告点击，得到样本点击集合；

作弊率获取单元306，用于根据该样本点击集合获取该流量的作弊率，该作弊率是该流量为作弊流量的概率。

其中，该作弊率获取单元306，具体用于：根据大数中心极限定理，将该样本点击集合按照服从正态分布规律进行分析，估计作弊率在预设置信水平的置信区间。

为提高作弊率的准确性，该样本广告点击可以为具有实时地理位置和/或常驻地理位置的广告点击，也即能够获取实时地理位置和/或常驻地理位置的广告点击。

f(x；p)＝p^x(1-p)^(1-x)；

具体地，作弊率获取单元306，可以用于：

确定：

服从标准正态分布N(0,1)；

确定：

根据

和

得到二元方程：

比如，将Yn用

对该二元方程进行求解得到：

其中，

其中，

根据

得到作弊率在预设置信水平1-α的置信区间[θ1,θ2]。

可选地，参考图3c，该广告反作弊装置还可以包括：

选取单元307，用于从该置信区间中选取该流量的目标作弊率；

比例获取单元308，用于根据该目标作弊概率和该预设置信水平，获取广告点击判罚比例；

计费单元309，用于根据该目标作弊率和该流量的总广告点击数量，对该流量进行计费。

比如，该计费单元309，可以包括：

比例获取子单元，用于根据该目标作弊概率和该预设置信水平，获取广告点击判罚比例；

有效点击获取子单元，用于根据该广告点击判罚比例和该总广告点击数量获取需要参与流量计费的有效广告点击数量；

计费子单元，用于根据该有效广告点击数量对该流量进行计费。

具体实施时，以上各个单元可以作为独立的实体来实现，也可以进行任意组合，作为同一或若干个实体来实现，以上各个单元的具体实施可参见前面的方法实施例，在此不再赘述。

该广告反作弊装置具体可以集成在服务器等网络设备中，该服务器可以为一个独立的实体，也可以包括多个实体。

由上可知，本发明实施例的广告信息反作弊装置通过第一确定单元301确定待识别的流量，然后，由位置获取单元302获取该流量的广告点击对应的实时地理位置、以及该广告点击对应的终端的常驻地理位置，由点击量获取单元303在该流量的广告点击中确定实时地理位置与常驻地理位置一致的广告点击，得到实时地理位置与常驻地理位置一致的广告点击数量，由第二确定单元304根据该广告点击数量确定该流量为作弊流量；该方案可以基于流量的广告点击的实时地理位置和点击终端的常驻地理位置来识别可疑作弊流量，可以识别可疑作弊流量。

此外，本发明实施例广告信息反作弊装置还可以获取作弊流量为作弊流量的概率，即作弊率，以便于识别出作弊流量，可以提高作弊流量的识别精确度以及流量计费的精确度和合理性，从而保护广告主的利益。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，RandomAccess Memory)、磁盘或光盘等。

以上对本发明实施例所提供的一种广告反作弊方法和装置进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种广告反作弊方法，其特征在于，包括：

确定待识别的流量；

获取所述流量的广告点击对应的实时地理位置、以及所述广告点击对应的终端的常驻地理位置，其中，所述实时地理位置可以为用户点击广告时用户所处的地理位置，所述常驻地理位置为用户点击广告所使用的终端长期或者经常所处的地理位置；所述实时地理位置根据流量的广告点击对应的网络地址获得；

根据所述广告点击数量确定所述流量为可疑作弊流量。

2.如权利要求1所述的广告反作弊方法，其特征在于，根据所述广告点击数量确定所述流量为可疑作弊流量，包括：

根据所述广告点击数量和所述流量的总广告点击数量，获取所述流量的常驻实时地理位置一致性占比；

当所述常驻实时地理位置一致性占比小于预设阈值时，确定所述流量为可疑作弊流量。

3.如权利要求1所述的广告反作弊方法，其特征在于，获取所述流量的广告点击对应的实时地理位置、以及所述广告点击对应的终端的常驻地理位置，包括：

获取所述流量的广告点击对应的网络地址，并根据所述网络地址获取所述流量的广告点击对应的实时地理位置；

获取所述流量的广告点击对应的终端标识，并根据所述终端标识获取所述广告点击对应的终端的常驻地理位置。

4.如权利要求1所述的广告反作弊方法，其特征在于，在确定所述流量为可疑作弊流量之后，所述方法包括：

从所述流量的广告点击中选取样本广告点击，得到样本点击集合；

根据所述样本点击集合获取所述流量的作弊率，所述作弊率是所述流量为作弊流量的概率。

5.如权利要求4所述的广告反作弊方法，其特征在于，根据所述样本点击集合获取所述流量的作弊率，包括：

根据大数中心极限定理，将所述样本点击集合按照服从正态分布规律进行分析，估计作弊率在预设置信水平的置信区间。

6.如权利要求5所述的广告反作弊方法，其特征在于，还包括：

从所述置信区间中选取所述流量的目标作弊率；

根据所述目标作弊率和所述流量的总广告点击数量，对所述流量进行计费。

7.如权利要求6所述的广告反作弊方法，其特征在于，根据所述目标作弊率和所述流量的总广告点击数量，对所述流量进行计费，包括：

根据所述目标作弊概率和所述预设置信水平，获取广告点击判罚比例；

根据所述广告点击判罚比例和所述总广告点击数量获取需要参与流量计费的有效广告点击数量；

根据所述有效广告点击数量对所述流量进行计费。

8.一种广告反作弊装置，其特征在于，包括：

第一确定单元，用于确定待识别的流量；

位置获取单元，用于获取所述流量的广告点击对应的实时地理位置、以及所述广告点击对应的终端的常驻地理位置，其中，所述实时地理位置可以为用户点击广告时用户所处的地理位置，所述常驻地理位置为用户点击广告所使用的终端长期或者经常所处的地理位置；所述实时地理位置根据流量的广告点击对应的网络地址获得；

9.如权利要求8所述的广告反作弊装置，其特征在于，所述第二确定单元包括：

占比获取子单元，用于根据所述广告点击数量和所述流量的总广告点击数量，获取所述流量的常驻实时地理位置一致性占比；

确定子单元，用于当所述常驻实时地理位置一致性占比小于预设阈值时，确定所述流量为可疑作弊流量。

10.如权利要求8所述的广告反作弊装置，其特征在于，还包括：

样本选取单元，用于在第二确定单元确定所述流量为可疑作弊流量之后，从所述流量的广告点击中选取样本广告点击，得到样本点击集合；

作弊率获取单元，用于根据所述样本点击集合获取所述流量的作弊率，所述作弊率是所述流量为作弊流量的概率。

11.如权利要求10所述的广告反作弊装置，其特征在于，所述作弊率获取单元，具体用于：根据大数中心极限定理，将所述样本点击集合按照服从正态分布规律进行分析，估计作弊率在预设置信水平的置信区间。

12.如权利要求11所述的广告反作弊装置，其特征在于，还包括：

选取单元，用于从所述置信区间中选取所述流量的目标作弊率；

比例获取单元，用于根据所述目标作弊概率和所述预设置信水平，获取广告点击判罚比例；

计费单元，用于根据所述目标作弊率和所述流量的总广告点击数量，对所述流量进行计费。

13.如权利要求12所述的广告反作弊装置，其特征在于，所述计费单元，包括：

比例获取子单元，用于根据所述目标作弊概率和所述预设置信水平，获取广告点击判罚比例；

有效点击获取子单元，用于根据所述广告点击判罚比例和所述总广告点击数量获取需要参与流量计费的有效广告点击数量；

计费子单元，用于根据所述有效广告点击数量对所述流量进行计费。

14.一种计算机可读存储介质，其存储有用于广告反作弊的计算机程序，其中，所述计算机程序使得计算机执行如权利要求1-8任一项所述的方法。