CN102576443B - 受众分组估计 - Google Patents

受众分组估计 Download PDF

Info

Publication number
CN102576443B
CN102576443B CN201080045960.XA CN201080045960A CN102576443B CN 102576443 B CN102576443 B CN 102576443B CN 201080045960 A CN201080045960 A CN 201080045960A CN 102576443 B CN102576443 B CN 102576443B
Authority
CN
China
Prior art keywords
page browsing
publisher
grouping
record
key value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201080045960.XA
Other languages
English (en)
Other versions
CN102576443A (zh
Inventor
R·基维里斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Priority to CN201410816262.5A priority Critical patent/CN104680395B/zh
Publication of CN102576443A publication Critical patent/CN102576443A/zh
Application granted granted Critical
Publication of CN102576443B publication Critical patent/CN102576443B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements
    • G06Q30/0246Traffic
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

用于根据广告印象的关键值估计分组的方法、***和装置,包括嵌入在计算机存储介质上的计算机程序。

Description

受众分组估计
背景技术
本说明书涉及在线广告。
互联网提供了对各类资源的访问,例如视频和/或音频文件以及特定主题或特定新闻文章的web页面。访问这些资源提供了随这些资源提供广告的机会。例如,web页面可包括在其中呈现广告的广告位置(slot)。广告位置可以定义在web页面上,或者定义成与web页面一同呈现。
通常,发布商和/或广告商希望得到描述广告或广告活动的受众分组(segment)的信息。获得该信息可有助于进行分组定向和/或行为定向。例如,假定到访某发布商站点的用户分组定义成对i)烹饪和ii)编织这两者感兴趣的用户。如果可以获得描述分组的准确信息,那么发布商和/或广告商可确定广告是仅以符合该分组的页面浏览(pageview)为目标,还是以属于该分组的所有用户为目标,或者完全不以该分组为目标。
然而,获得准确分组信息可能十分耗时,这是由于通常需要处理数百万条日志记录。
发明内容
总的来说,本说明书所述主题的一方面可以体现在包括如下动作的方法中:由数据处理装置访问发布商日志,发布商日志包括描述针对发布商站点的页面浏览所递送的过往印象的数据,针对每个印象,该数据包括:用户标识符,识别发布商的发布商标识符,识别页面浏览的页面浏览值,以及为印象提供的发布商的多个发布商关键值;由数据处理装置根据发布商日志生成每个发布商的发布商页面浏览数据,每个发布商的发布商页面浏览数据包括代表在第一时间段期间出现的页面浏览的页面浏览记录,每个页面浏览记录代表在第一时间段期间出现的第二时间段期间的和用户标识符及发布商标识符对相关联的一个或多个页面浏览,每个页面浏览记录包括:用户标识符,发布商标识符以及提供给由页面浏览记录代表的针对一个或多个页面浏览所出现的印象的发布商关键值;在数据处理装置接收发布商的分组定义,分组定义根据发布商的一个或多个发布商关键值定义分组;由数据处理装置根据包括满足分组定义所定义的分组的发布商关键值的记录,为分组指派用户标识符;由数据处理装置基于指派给分组的用户标识符和指派给分组的用户标识符的页面浏览记录,确定一个或多个分组特征;以及,响应于分组定义,提供描述分组的一个或多个特征的响应数据。该方面的其他实施例包括配置用于执行在计算机存储设备上编码的所述方法的动作的对应***、装置和计算机程序。
本说明书所述主题的另一创新方面可以体现在包括如下动作的方法中:由数据处理装置生成多个发布商的发布商页面浏览数据,每个发布商的发布商页面浏览数据包括代表在第一时间段期间出现的页面浏览的页面浏览记录,每个页面浏览记录代表与用户标识符及发布商标识符对相关联的一个或多个页面浏览,每个页面浏览记录包括:用户标识符、识别发布商的发布商标识符、以及为由页面浏览记录代表的针对一个或多个页面浏览所出现的印象提供的发布商关键值;在数据处理装置接收发布商的分组定义,分组定义根据发布商的一个或多个发布商关键值定义分组;由数据处理装置确定满足分组定义所定义的分组的发布商关键值被提供给印象的页面浏览;由数据处理装置基于被确定满足分组定义的页面浏览确定一个或多个分组特征;以及,响应于分组定义,提供描述分组的一个或多个特征的响应数据。本方面的其他实施例包括配置用于执行在计算机存储设备上编码的所述方法的动作的对应***、装置和计算机程序。
下文的附图和描述阐述了本说明书所述主题的一个或多个实施例的具体内容。根据描述、附图以及权利要求,主题的其他特征、方面和益处变得明显。
附图说明
图1是可以使用分组估计***的环境的框图。
图2是示例页面浏览记录的框图。
图3是确定分组的一个或多个特征的示例过程的流程图。
图4是确定分组质量度量的示例过程的流程图。
图5是确定满足分组定义的页面浏览的示例过程的流程图。
图6是确定分组的一个或多个特征的另一示例过程的流程图。
各附图中的类似参考标号和标记指示类似的元素。
具体实施方式
总体而言,本说明书的主题涉及估计受众分组大小以及填充(populate)受众分组。受众分组代表具有人口统计学特征的预期用户的聚合组,人口统计学特征例如为行为模式特征。此处所述为估计web站点的受众分组大小以及受众分组质量的分组估计***。该分组估计***使用定义web站点分组的分组定义数据并根据页面浏览和印象数据确定属于分组的用户数。比较分组内的页面浏览数和分组内以及分组外的页面浏览数以确定分组质量。根据分组大小和质量,发布商可做出不同的定向决策。例如,如果分组大小大但是质量不高,则发布商可选择仅以分组内的用户为目标,即,以属于分组的且正在浏览属于分组的页面的用户为目标。如果分组大小大而且质量高,则发布商可选择以分组内和组成部分外的用户为目标,即,无论属于分组的用户是否正在浏览属于分组的页面都以该用户为目标。最后,如果分组大小小,则发布商可选择不以分组为目标。
§1.0示例操作环境
图1是可在其中使用分组估计***100的环境50的框图。环境50包括:计算机网络52(如局域网(LAN)、广域网(WAN)、互联网或其组合)、连接的发布商web站点60、发布商客户端设备62、广告商web站点70、广告商客户端设备72、广告商管理***74、用户设备76和分组估计***100。
每个web站点60是和域名关联的一个或多个web页面资源,而且,每个web站点由一个或多个服务器托管。示例web站点是可包括文本、图形图像、多媒体内容和如脚本的编程元素的超文本标记语言(HTML)格式的web页面的集合。每个web站点60由例如管理和/或拥有web站点的实体的发布商维护。简洁起见,术语“发布商”也用于指代由发布商管理和/或拥有的web站点60。类似的web站点70由对应的广告商维护,术语“广告商”也用于指代由广告商管理和/或拥有的web站点70。
发布商客户端设备62、广告商客户端设备72和用户客户端设备76是受用户控制并且可通过网络52请求并接收数据的电子设备。客户端设备通常包括如web浏览器的用户应用,以协助通过网络52发送并接收数据,例如从发布商60或广告商70请求资源(例如页面内容)。示例客户端设备包括个人计算机、移动通信设备和可通过网络52发送和接收数据的其他设备。
广告管理***74可为发布商60的web页面提供广告商70的广告。例如,发布商60可把对一个或多个广告的广告请求提供给广告管理***74。广告管理***74通过把广告发送给请求的发布商60以放在发布商web页面上做出响应,web页面连同广告在用户客户端设备76上呈递时产生广告的印象。广告可包括到登陆(landing)页面的嵌入的链接,登陆页面例如广告商70网站上的页面,用户点击发布商web页面上显示的广告时会被导向到该登陆页面。
发布商日志80存储描述针对特定发布商站点的页面浏览所递送的过往印象的数据记录。页面浏览代表载入互联网站点单个页面的请求。对于每个过往印象,数据包括用户标识符、发布商标识符、页面浏览值,以及为特定印象提供的发布商的发布商关键值(keyvalue)。用户标识符和发布商标识符每一个分别识别用户和发布商。页面浏览值识别出现印象的特定发布商站点的web页面的特定页面浏览实例。关键值通常是包括发布商标识符、键以及和特定印象相关的值的元组。关键值可以由发布商创建或指定,而且可包括关键字、数字、词或者短语以及可由广告管理***74和/或每个对应的发布商60跟踪的如人口统计学或定向数据的描述属性。这类属性数据的示例包括上下文数据,即由发布商的印象标签定义的数据,例如兴趣、关键字和爱好;用户性别、年龄、收入水平和教育水平;请求web页面的用户或客户端设备的位置(例如邮编、城市和/或国家);以及可由广告管理***74和/或发布商60跟踪的其它信息。发布商日志80还可存储另外的信息,如印象的时间和日期。
一些实现方式中,为了保护用户隐私,广告管理***对用户的印象数据进行匿名处理,这样,日志80中存储的数据不能和用户关联起来。例如,用户身份可被模糊处理或者设置成不和用户关联的唯一数字;用户地址(如果知道的话)可以被模糊处理成仅仅是邮政服务区,例如邮编。日志80也可被加密,从而在出现未经授权的***访问时进一步保护用户信息。也可实现保护用户隐私的其它技术。
§2.0分组估计***
分组估计***100可使用日志80中采集的数据估计站点60的受众分组大小。例如,***100生成的估计可通过允许站点60的发布商在实际创建受众分组之前查看分组大小和质量的效果来为发布商提供资讯以做出明智决定。
运行时,分组估计***100协助对消费者的广告定向。例如,***100可向广告管理***74提供描述所选受众分组的一个或多个特征的数据。该数据可用来对与发布商web站点60的所选受众分组内的用户标识符关联的未来页面浏览的广告进行定向。
分组估计***100采用扫描器104来访问并扫描发布商日志80。具体而言,扫描器104取回包括用户标识符、发布商标识符、页面浏览值和每个广告印象的关键值的记录并根据用户标识符和发布商标识符组织发布商记录80。这些经排序的数据存储在发布商记录数据存储116中。一些实现方式中,扫描器每天在采集了特定天的所有发布商日志后扫描发布商日志80。
聚合器106访问发布商记录116并根据用户标识符/发布商标识符对进行聚合记录。这些经聚合的记录作为发布商页面浏览数据存储在发布商页面浏览数据存储114中。一些实现方式中,每个发布商的发布商页面浏览数据包括代表在第一时间段期间(如一个月)出现的页面浏览的页面浏览记录。每个页面浏览记录代表和在第一时间段期间出现的第二时间段(如一个月内的一天)期间与用户标识符和发布商标识符对关联的一个或多个页面浏览。因而,如果一个特定用户在一个月中的二十个不同日子期间到访发布商,那么,页面浏览数据存储114中会存在具有对应的用户标识符和发布商标识符对的二十条记录。此外,每条记录包括为由页面浏览记录代表的针对页面浏览所出现的印象提供的发布商关键值。图2详细描述页面浏览记录。
分组管理引擎102接收发布商的分组定义信息。分组定义根据发布商的一个或多个发布商关键值定义分组。分组定义被提供给分组估计器108,分组估计器108使用页面浏览数据114和分组定义信息来确定一个或多个分组特征,如,分组大小、分组的页面浏览数和/或分组质量。
一些实现方式中,分组估计器108根据包括满足分组定义所定义的分组的发布商关键值的页面浏览数据114记录为分组指派用户标识符。根据这些指派的用户标识符确定一个或多个分组特征。图2详细描述对这些特征的确定。
一些实现方式中,分组估计器108还确定分组质量度量。一些实现方式中,质量度量由下式给定:
Q s = f ( N S + S ′ N S )
其中
Qs是质量度量;
NS是分组内的页面浏览数;并且
NS+S’是分组内和分组外的页面浏览总数。
质量度量使得发布商能够判断特定受众分组的质量。总体而言,质量度量越高,可通过把分组外的页面浏览选择为目标而生成的印象数越大。例如,假定100个用户属于发布商web站点的第一分组。第一分组定义成对体育类感兴趣的用户。这些用户提供1000次分组内的页面浏览,即,包括体育类发布商关键值的页面浏览总共有1000次。对于同样的这100个用户,发布商web站点上总共有5000次页面浏览,即,除了包括体育类发布商关键值的总共1000次页面浏览外,这些用户在发布商web站点还有不包括体育类发布商关键值的额外的4000次页面浏览。而且,假定另外100个用户属于发布商web站点的第二分组。第二分组定义成对钩针编织类感兴趣的用户,并且这些用户提供1000次分组内的页面浏览。然而,对于这100个用户,发布商web站点上总共只有1100次页面浏览。因而,第一分组的质量比第二分组质量高。
可以把所确定的一个或多个分组特征以分组响应数据112的形式提供给发布商,这些特征例如为分组大小、分组的页面浏览数、属于分组的用户和/或分组质量。发布商可使用用户界面审查分组响应数据112以确定是否要进一步分析分组以及/或者以分组为目标。一些实现方式中,如果发布商决定以某分组为目标,分组管理引擎102可生成分组填充数据113,并把分组填充数据提供给广告管理***74以进行定向。一些实现方式中,分组填充数据113是用户标识符和定义分组的数据的关联。该关联被用作定向标准。广告管理***74或进行请求的发布商60可使用分组填充数据113对和指派给分组的用户标识符关联的未来页面浏览的广告进行定向,或者,一些实现方式中,对在被确定属于分组的任何其他用户到访特定发布商站点时和该用户关联的未来页面浏览的广告进行定向。
一些实现方式中,***100接收或者取回不带有上下文值的数据。该数据可占据存储空间并增加***100的处理时间。因而,一些实现方式中,分组管理引擎102提供识别、标记和处置无用数据的机制。例如,分组管理引擎102可删除一次性唯一标识符、广告描述符、顾客错误等。一次性唯一标识符是识别唯一发生的事情的任何标识符,例如一个月内特定用户标识符只有一次页面浏览。广告描述符是描述广告大小、风格和/或位置的描述符。客户不可能使用该数据来构建用户组的行为简档。顾客错误可能与错误地构建的广告统一资源定位符有关。
分组管理引擎102可实现用于管理和处置特定关键值的策略。例如,分组管理引擎102可根据如特定广告描述符的排除关键值类型列表事先处置特定关键值。一些实现方式中,引擎102可识别低值关键值并滤除这些关键值。例如,可用聚合器106识别三十天内仅提供给少数用户(例如少于三个)的页面浏览的关键值并将其滤除。
§3.0示例页面浏览记录
图2是示例页面浏览记录200的框图。页面浏览记录200代表指示哪个发布商关键值被提供给对应的页面浏览印象的页面浏览/关键值映射。所描绘示例中的页面浏览记录200的格式为包括每列一个单元的记录。单元代表单个用户一天的聚合发布商日志数据。提供下面记录200用作示例,也可使用关联页面浏览和关键值或发布商跟踪的其他属性的其他数据结构。
示例页面浏览记录200被配置用于优化存储空间分配和处理效率。下文所述示例实现方式中,页面浏览记录200是存储一天的用户标识符/发布商标识符对的印象数据的简明记录。此外,记录200中仅存储了为该天的用户标识符的印象提供的关键值。这些关键值用记录中存储的位图索引。记录中不包括为印象提供的其他关键值的列。
页面浏览记录200用聚合器106生成,所产生的聚合记录存储在页面浏览数据存储114中。一些实现方式中,每天针对特定web页面为每个用户生成一个记录,持续生成多达30天。例如,对于发布商站点的任何给定web页面,可以存在每个用户标识符/发布商标识符对的30天的页面浏览数据114的多达30条记录。另外,也可使用其他时间段。
然而,其他实现方式中,不跟踪特定web页面,仅跟踪发布商关键值。这些实现方式中,每天为每个用户生成一条记录,持续生成多达30天。例如,可以存在每个用户标识符/发布商标识符对的30天的页面浏览数据114的多达30条记录。
所描绘的页面浏览记录200包括代表用户标识符/发布商标识符对键的列202。一些实现方式中,该键是用户标识符和发布商标识符的元组,例如是用户标识符或者从用户标识符导出的而且和用户标识符唯一关联的数据以及发布商标识符。列204、206、208、210、212、214、216和218对应于发布商跟踪的且为特定一天(或其他最小时间间隔)的用户印象提供的关键值。该示例中,对于和为该天的印象提供的关键值对应的每个关键值存在一列。
例如,假定发布商标识符为“1000”的发布商为和列202所示的用户标识符关联的用户会话供应了三个页面浏览。每个页面浏览还供应了一个或多个广告,而且为每个广告提供了印象关键值。假定所有页面浏览都位于特定发布商站点和特定区域,站点例如为由值“S10”识别的站点,区域例如为由标识符“Z11”识别的web页面。发布商记录中一天的特定发布商和特定用户的示例关键值为:
爱好=编织;页面=烹饪;页面浏览=1
兴趣=烹饪;页面浏览=1
上下文=金融;关键字=再融资;c=n;页面浏览=4
上下文=金融;页面浏览=4
上下文=金融;q=wsj_prime;页面浏览=4
兴趣=电影;爱好=编织;页面浏览=16
上述示例中,本示例中使用关键值“页面浏览=<x>”来把印象聚合到页面浏览中。例如,对于发布商“1000”,六个印象聚合到了三个页面浏览中(例如标号1、4和16)。页面浏览记录200代表使用上述数据为页面浏览1、4和16和六个印象所写的数据。
列204包括关键类型“兴趣”的关键值“编织”。索引值指示位图中的索引,下文将对位图进行描述。类似的,列206、208、210、212和214包括发布商的不同关键值,即,列206包括关键类型“兴趣”的关键值“电影”;列208包括关键类型“兴趣”的关键值“烹饪”;列210包括关键类型“关键字”的关键值“再融资”;列212包括关键类型“上下文”的关键值“金融”;以及,列214包括关键类型“q”(查询参数)的关键值“wsj_prime”。列216包括指示站点S10的关键值“S10”。该站点标识符识别发布商的特定web站点。列218包括指示如特定web页面的广告区域的关键值“Z11”。
对于每个关键值,为其提供了关键值的页面浏览的数目各不相同。例如,关键值“编织”出现在两个页面浏览中(即页面浏览1和16,页面浏览总数为2);关键值“电影”出现在一个页面浏览中(即,页面浏览16,页面浏览总数为1),等等。一些实现方式中,页面浏览数目也可作为元组值的一部分存储在单元中。然而,如下所述,使用位图也可确定页面浏览数量。
页面浏览记录200的每个相应字段包括相应的索引值。这些索引值用于索引存储在列220中的位图。这些索引值用于为页面浏览记录代表的一个或多个页面浏览的每一个生成页面浏览/关键值映射。一些实现方式中,页面浏览/关键值映射是在与提供给页面浏览印象的发布商关键值的相应索引值对应的索引位置具有对应第一值(例如1)、并且在与未提供给页面浏览印象的发布商关键值的相应索引值对应的索引位置具有对应的第二值(例如0)的页面浏览/关键值位图。
如图2所示,从左到右对页面浏览/关键值位图进行索引,最左侧位于索引位置0,最右侧位于索引位置7。例如,第一位图242对应于页面浏览(1);第二位图244对应于页面浏览(4);以及第三位图246对应于页面浏览(16)。对于每个位图,列204对应于索引0,列206对应于索引1,列216对应于索引2,列208对应于索引3,列214对应于索引4,列210对应于索引5,列212对应于索引6,以及列218对应于索引7。如果某位低(即0),页面浏览不包括具有由该位索引的关键值的印象。相反,如果某位高(即1),页面浏览包括具有由该位索引的关键值的印象。虽然图2中的列未按索引值排序,但是,一些实现方式中,列可按位图索引递增顺序排列,即KV0、KV1、KV2...KV7。
注意,所有三个印象都是针对站点标识符S10和区域标识符Z11的,以及注意站点标识符S10和区域标识符Z11分别由索引2和7进行索引。因而,每个位图中在索引2和7处的位等于1。
对于索引0处的位图位置,由于存储在列204中且和索引0关联的关键值“编织”被提供给具有第一页面浏览(页面浏览1)的印象,所以第一位图242包括值1。类似地,由于关键值“编织”也被提供给具有第三页面浏览(页面浏览16)的印象,所以第三位图246在索引位置0处包括值1。相反,由于关键值“编织”未被提供给具有第二页面浏览(页面浏览4)的印象,所以第二位图244在索引位置0处包括值0。
以类似方式确定位图242、244和246的剩余位。一旦生成了位图,对所有位图特定索引位置处的所有相应位求和就生成等于为之提供关键值的页面浏览数。
页面浏览/关键值位图有助于对指派给分组的用户标识符进行有效搜索。一些实现方式中,分组估计器108根据分组定义为每个页面浏览记录生成分组位掩码。该分组位掩码在与分组定义中的发布商关键值相应的索引值对应的索引位置具有对应的第一值(例如1),并且在与不在分组定义中的发布商关键值的相应的索引值对应的索引位置具有相应的第二值(例如0)。分组估计器108比较页面浏览记录的分组定义位掩码和页面浏览记录的每个页面浏览/关键值位图,以确定哪个用户标识符属于分组。
例如,假定分组被定义成从发布商1000接收到具有下述关键值的印象的用户:
原料=鹰嘴豆
兴趣=电影
兴趣=旅行
关键字=再融资
因而,分组定义由下面的布尔等式表示:
原料=鹰嘴豆0R兴趣=电影OR兴趣=旅行OR关键字=再融资
一些实现方式中,分组定义还可指定时间间隔中的最小页面浏览数。缺省定义是每任意给定天1个页面浏览;然而,分组定义也可指定其他页面浏览要求,例如任一周的时间段内100个页面浏览;或者,任意给定天10个页面浏览,等等。
对于记录200,分组估计器108会生成下面的分组定义位掩码:01000100。通过比较关键值和记录200构建该位掩码。由于分组定义中既有关键值“兴趣=电影”又有关键值“关键字=再融资”,所以指派给索引位置1和5的值是1。
分组估计器108执行逐位运算,以确定特定页面浏览是否满足分组定义。例如,匹配分组定义位掩码和页面浏览位图242、244和246,并且确定两个页面浏览满足分组定义。因而,用户标识符被指派给分组。此外,该天计数到两个页面浏览(即,位图244的第二页面浏览,这是由于存在“再融资”;和位图246的第三页面浏览,这是由于存在“电影”)。
分组估计器108实现分组定义所需的必要布尔代数。例如,如果分组定义要求所有关键值都存在(例如原料=鹰嘴豆AND兴趣=电影AND兴趣=旅行AND关键字=再融资),那么不计数任何页面浏览。
分组定义位掩码以逐个记录为基础对分组定义中使用的位进行索引。由于用户标识符/发布商标识符对的每个记录仅对应于一天中(或者一些其他最小处理时间段)特定发布商页面的用户活动,所以每个用户标识符/发布商标识符对记录的对应的页面浏览/关键值位图可能不相同。因而,分组估计器108为每个记录生成分组定义位掩码。例如,假定记录200的同一用户第二天再次来到发布商站点并使得生成了20个页面浏览。有可能第二天的页面浏览记录的页面浏览/关键值位图多于七位,这是由于会提供额外的或者不同的关键值。
例如,假定为第二天的所有页面浏览提供15个关键值,这些关键值包括“鹰嘴豆”、“电影”、“旅行”和“再融资”。因而,第二天的页面浏览/关键值位图会有15位。现在,再假定各个关键值的索引位置为1、3、14和15。考虑到该索引,同一分组定义的分组定义位掩码也有15位,而且包括值“010100000000011”。
上述分组定义是相对简单的分组定义(“OR”运算),仅需要一个位掩码。然而,也可使用更复杂的分组定义。对于这些更复杂的定义(例如使用AND运算符、NAND运算符、NOR运算符等),每一记录可能要求多于一个位掩码。
此外,如果要求某时间段的特定页面浏览计数,那么分组估计器108可响应于比较位掩码和位图确定用户是否属于所定义的分组来执行另外的决策操作(即,某时间段的页面浏览计数检查)。
§4.0示例过程
图3是确定分组的一个或多个特征的示例过程300的流程图。过程300可在图1的分组估计***100中实现。
过程300访问发布商日志(302)。例如,扫描器104访问发布商日志80。发布商日志80存储描述针对特定发布商站点的页面浏览所递送的过往印象的数据。具体而言,发布商日志80可存储印象数据和页面浏览数据。对于日志80中的每个印象,数据可包括用户标识符、发布商标识符、页面浏览值以及为印象提供的发布商的任意数目的发布商关键值。
过程300根据发布商日志生成每个发布商的发布商页面浏览数据(302)。例如,扫描器根据发布商日志生成发布商记录116,聚合器106根据发布商记录116生成每个发布商的页面浏览数据。例如,发布商页面浏览数据可包括代表如一个月的时间段的在第一时间段期间出现的页面浏览的页面浏览记录。一个月时间段内的每个页面浏览记录可代表该月内出现的第二时间段(例如一天)期间和用户标识符及发布商标识符对关联的一个或多个页面浏览。这一天时间段内所代表的每个页面浏览记录包括具体用户标识符、发布商标识符以及为由于一个或多个页面浏览所出现的印象提供的发布商关键值。虽然使用了一个月和一天的示例时间段,但是过程300可生成不同时间段的页面浏览记录。
过程300接收发布商的分组定义(306)。例如,分组管理引擎102接收发布商的分组定义。分组定义根据发布商的一个或多个发布商关键值定义分组。分组定义还可包括定义一些页面浏览的最小(或最大)页面浏览定义以及出现页面浏览的最小(或最大)时间段。分组估计器根据包括满足分组定义所定义的分组的发布商关键值的记录,为分组指派用户标识符。
过程300基于指派给分组的用户标识符和指派给分组的用户标识符的页面浏览记录确定一个或多个分组特征(308)。例如,分组估计器108基于指派给分组的当前用户确定分组特征。确定分组特征可包括根据可用的页面浏览记录确定页面浏览的第一数目。可用的页面浏览记录可包括指派给特定分组的用户标识符的记录。一些实现方式中,确定分组特征包括基于指派给分组的具体用户标识符的页面浏览记录确定定向标准。
过程300响应于分组定义提供描述分组的一个或多个特征的响应数据(310)。例如,分组管理引擎102使用分组定义确定并提供有关分组特征的响应数据。一个示例中,响应数据可被提供给广告管理***,以协助对和指派给分组的具体用户标识符关联的未来页面浏览进行广告定向。
图4是确定分组质量度量的示例过程400的流程图。例如,过程400可在分组估计器108内实现。
过程400根据指派给分组的用户标识符的页面浏览记录确定页面浏览的第一数目(402)。例如,分组估计器108确定页面浏览数据114中的哪些页面浏览/关键值映射指示满足分组定义的发布商关键值。根据该信息,生成分组内的页面浏览的总数,分组内的页面浏览即包括满足分组定义的关键值的页面浏览。
过程400根据指派给分组的用户标识符的页面浏览记录确定页面浏览的第二数目(404)。例如,分组估计器108确定指派给分组的用户标识符的页面浏览记录代表的页面浏览总数,即,该用户的分组内的页面浏览及分组外的页面浏览这两者,一些实现方式中,这是和属于分组的用户标识符关联的所有页面浏览。
过程400确定与页面浏览的第二数目和页面浏览的第一数目之比成比例的分组质量度量(406)。例如,分组估计器108使用页面浏览的第一数目和页面浏览的第二数目来计算分组质量度量。一些实现方式中,质量度量可以是分组内和分组外的页面浏览之和与分组内的页面浏览数目的比例的度量。
图5是确定满足分组定义的页面浏览的示例过程500的流程图。例如,过程500可在聚合器106或分组估计器108中实现。
过程500生成代表由页面浏览记录代表的一个或多个页面浏览中的每一个的页面浏览/关键值位图(502)。例如,聚合器106生成位图来代表页面浏览记录中的页面浏览。运行时,对于每个页面浏览记录,发布商关键值存储在页面浏览记录中的相应字段。每个字段和相应的索引值关联。
如图2所详细描述的,页面浏览/关键值位图在和提供给页面浏览印象的发布商关键值的相应索引值对应的索引位置包括第一值。此外,位图在和未提供给页面浏览印象的发布商关键值的相应索引值对应的索引位置包括第二值。
过程500根据分组定义为每个页面浏览记录生成位掩码(504)。例如,分组估计器108使用分组定义为每个页面浏览记录生成一个或多个位掩码。根据分组定义的复杂度,可能只需要为页面浏览记录生成一个位掩码,或者,对于复杂定义,需要为每个页面浏览记录生成多个位掩码。一个示例中,每个位掩码在与分组定义中的发布商关键值的相应索引值对应的索引位置处包括第一值。此外,位掩码在与不在分组定义内的发布商关键值的相应索引值对应的索引位置处包括第二关键值。
对于发布商的每个页面浏览记录,过程500比较页面浏览记录的分组定义位掩码和页面浏览记录的每个页面浏览/关键值位图(506)。例如,分组估计器108执行比较分组定义位掩码和页面浏览/关键值位图。如果页面浏览记录的分组定义位掩码和记录的页面浏览/关键值位图之一匹配,而且位图和位掩码的对应比较生成布尔真值,那么记录中识别的用户可作为分组成员计数。
图6是确定分组的一个或多个特征的另一示例过程600的流程图。例如,过程600可在分组管理引擎102或者分组估计器108或者二者的组合中实现。
过程600接收发布商的分组定义(602)。例如,分组管理引擎102接收根据一个或多个关键值定义分组的特定发布商的分组定义。关键值涉及每个单独的发布商,因而可由每个发布商定义。
过程600确定具有满足分组定义所定义的分组的发布商关键值的页面浏览(604)。例如,分组估计器108确定具有和包括在分组定义所定义的分组中所需的关键值匹配的的关键值的页面浏览。
过程600基于被确定满足分组定义的页面浏览确定一个或多个分组特征(606)。例如,分组估计器108基于被预定满足分组定义的页面浏览确定页面浏览数据114的分组特征。
过程600响应于分组定义提供描述分组的一个或多个特征的响应数据(608)。例如,分组管理引擎102提供响应数据112。响应数据112描述每个分组的特征。
过程600响应于发布商的输入,创建用于对由分组定义所定义的分组进行定向的分组填充数据(610)。例如,分组管理引擎102可创建用户标识符和定义分组的数据之间的关联。广告管理***74或者进行请求的发布商60可使用分组填充数据113对和指派给分组的用户标识符关联的未来页面浏览的广告进行定向,或者,一些实现方式中,对当被确定属于分组的任何其他用户到访特定发布商站点时和该用户关联的未来页面浏览的广告进行定向。
本说明书所述的主题和操作的实施例,包括本说明书所公开的结构及其结构等价物,可实现在数字电子电路、或计算机软件、固件或硬件或这些的其中一个或多个的组合中。本说明书所述的主题内容的实施例可实现为一种或多种计算机程序,即,在计算机存储介质上编码的一个或多个计算机程序指令模块,用于由数据处理装置执行或者控制数据处理装置的操作。作为替代或附加,程序指令可编码在人工生成的传播信号上,例如,机器生成的电信号、光信号或电磁信号,生成该信号以编码信息来传送到适当的接收器装置用于由数据处理装置执行。计算机存储介质可以是如下设备或者包括在如下设备上:计算机可读存储设备、计算机可读存储衬底、随机访问存储器阵列或设备或者串行访问存储器阵列或设备,或者是一个或多个这些设备的组合。此外,虽然计算机存储介质不是传播信号,但是,计算机存储介质可以是编码在人工生成的传播信号上的计算机程序指令的源或者目的地。计算机存储介质还可以是一个或多个独立的物理部件或介质(例如,多个CD、磁盘或者其他存储设备),或者包括在这些部件上。
本说明书所述操作可以实现成数据处理装置对存储在一个或多个计算机可读存储设备或者从其他源接收的数据执行的操作。
术语“数据处理装置”包括所有类型的用于处理数据的装置、设备和机器,举例来说包括可编程处理器、计算机、片上***或者前述种类中的多个或其组合。装置可包括专用逻辑电路,例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)。除硬件之外,装置还可包括为所涉及的计算机程序创建执行环境的代码,例如构成处理器固件、协议堆栈、数据库管理***、操作***、跨平台运行环境、虚机或一个或多个所述种类的组合的代码。装置和执行环境可实现各种不同的计算模型架构,如web服务、分布式计算和网格计算架构。
计算机程序(也称为程序、软件、软件应用程序、脚本或代码)可用任何形式的编程语言编写,包括编译或解释语言、陈述式语言或过程式语言,而且,计算机程序可部署成任何形式,包括作为独立程序或者作为模块、部件、子例程、对象或者适用于计算环境的其他单元。计算机程序可对应于文件***的文件,但这不是必须的。程序可存储在保持其他程序或数据的文件的一部分中(例如存储在标记语言文档中的一个或多个脚本)、专用于所涉及程序的单个文件中或者在多个协调文件中(例如,存储一个或多个模块、子程序或代码的部分的文件)。计算机程序可部署为在一个计算机或位于一处或分布在多处并由通信网络互联的多个计算机上执行。
本说明书所述过程和逻辑流程可以由执行一个或多个计算机程序以通过操作输入数据并生成输出而执行动作的一个或多个可编程处理器执行。过程和逻辑流程还可由专用逻辑电路执行,并且装置也可实现成专用逻辑电路,例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)。
举例而言,适用于执行计算机程序的处理器包括通用微处理器和专用微处理器,以及任何类型的数字计算机的任何一个或多个处理器。通常,处理器从只读存储或随机访问存储器或者二者接收指令和数据。计算机的主要元件是用于根据指令执行动作的处理器和用于存储指令和数据的一个或多个存储器设备。通常,计算机还包括用于存储数据的一个或多个大型存储设备,或者可操作地耦合到用于存储数据的一个或多个大型存储设备以从中接收数据或向其传输数据或两者兼有,大型存储设备例如为磁盘、磁光盘或光盘。然而,计算机不是必须具有这种设备。
适用于存储计算机程序指令和数据的设备包括所有形式的非易失性存储器、介质和存储器设备,举例而言包括半导体存储器设备,例如EPROM、EEPROM和闪存设备;磁盘,例如内置磁盘或移动磁盘;磁光盘;以及CD-ROM和DVD-ROM磁盘。处理器和存储器可由专用逻辑电路进行补充,或者包括在专用逻辑电路中。
为了提供和用户的交互,本说明书所述主题的实施例可在具有用于向用户显示信息的显示设备(例如CRT(阴极射线管)或LCD(液晶显示器)监视器)以及用户用来给计算机提供输入的键盘和指点设备(例如鼠标或轨迹球)的计算机上实现。也可用其他类型的设备来提供和用户的交互;例如,提供给用户的反馈可以是任何形式的感官反馈(例如视觉反馈、声音反馈或者触觉反馈);而且,可以任何形式接收来自用户的输入,包括声音、语音或者触觉输入。此外,计算机可通过向用户使用的设备发送文档并从该设备接收文档来和用户交互;例如,通过响应于从用户的客户端设备上的web浏览器接收到的请求发送web页面给该web浏览器。
本说明书所述主题的实施例可用包括后端部件(例如数据服务器)或者包括中间件部件(例如应用服务器)或者包括前端部件(例如客户端计算机,其具有用户可用来与本说明书所述主题的实现方式交互的图形用户界面或者Web浏览器)或者这些后端部件、中间件部件或前端部件的任意组合的计算***实现。***的部件可用任何形式或介质的数字数据通信(例如通信网络)互连。通信网络的示例包括局域网(LAN)、广域网(WAN)、互联网(如因特网)以及对等网络(例如自组织对等网络)。
计算***可包括客户端和服务器。客户端和服务器通常彼此远离而且典型通过通信网络交互。客户端和服务器的关系由于各个计算机上运行的而且彼此具有客户端-服务器关系的计算机程序而存在。一些实施例中,服务器传送数据(例如HTML页面)给客户端设备(例如为了显示数据并从和客户端设备交互的用户接收用户输入)。服务器可从客户端设备接收客户端设备生成的数据(例如用户交互的结果)。
虽然本说明书包括许多具体实现细节,但是这些实现细节不应理解成对任何发明或所要求保护范围的限制,相反,这是对特定发明的特定实施例特有的特征的描述。本说明书中在单独的实施例的上下文中描述的某些特征也可在单个实施例中结合实现。相反,单个实施例的上下文中描述的各个特征也可在多个实施例中分开实现或者实现成任何适当子组合。此外,虽然特征在上面被描述为按某个组合动作或者最初声称如此,但一些情况下,所声称组合的一个或多个特征可被排除在组合之外,而且,所声称组合可被导向到自组合或子组合变型。
类似地,虽然操作在附图中描绘为具有特定次序,但是,这不应理解成要求为了实现期望效果要按所示的特定次序或者顺序执行这些操作,或者需要执行所有所示操作。某些情况下,多任务或并行处理是有益的。此外,上述实施例中各个***部件分开不应理解成所有实施例都要求如此分开,并且应该理解,所述程序部件和***通常可集成在单个软件产品中或者封装在多个软件产品中。
因而,已经描述了主题的特定实施例。其它实施例在下述权利要求范围内。一些情况下,权利要求所记载的动作可按不同次序执行而且仍实现期望结果。此外,附图中所示过程不必要求所示的特定顺序或连续顺序来实现期望结果。某些情况下,多任务或并行处理可以是有益的。

Claims (17)

1.一种计算机实现的方法,包括:
由数据处理装置访问发布商日志,所述发布商日志包括描述针对发布商站点的页面浏览所递送的过往印象的数据,针对每个印象,所述数据包括:
用户标识符;
识别发布商的发布商标识符;
识别页面浏览的页面浏览值;以及
为所述印象提供的所述发布商的多个发布商关键值;
由所述数据处理装置根据所述发布商日志生成每个发布商的发布商页面浏览数据,所述每个发布商的发布商页面浏览数据包括代表在第一时间段期间出现的页面浏览的页面浏览记录,每个页面浏览记录代表在第一时间段期间出现的第二时间段期间的和用户标识符及发布商标识符对相关联的一个或多个页面浏览,每个页面浏览记录包括:
用户标识符;
发布商标识符;以及
为由所述页面浏览记录代表的针对所述一个或多个页面浏览所出现的所述印象提供的发布商关键值;
在所述数据处理装置处接收发布商的分组定义,所述分组定义根据所述发布商的一个或多个发布商关键值定义分组;
由所述数据处理装置根据包括满足所述分组定义所定义的所述分组的发布商关键值的记录,为所述分组指派用户标识符;
由所述数据处理装置基于指派给所述分组的所述用户标识符和指派给所述分组的所述用户标识符的所述页面浏览记录确定一个或多个分组特征;以及
响应于所述分组定义,提供描述所述分组的一个或多个特征的响应数据。
2.根据权利要求1所述的计算机实现的方法,其中,对于所述页面浏览记录代表的每个页面浏览,每个页面浏览记录包括指示哪个所述发布商关键值被提供给针对所述页面浏览的印象的页面浏览/关键值映射。
3.根据权利要求2所述的计算机实现的方法,其中确定一个或多个分组特征包括根据指派给所述分组的所述用户标识符的所述页面浏览记录确定页面浏览的第一数目。
4.根据权利要求3所述的计算机实现的方法,其中:
根据指派给所述分组的所述用户标识符的所述页面浏览记录确定所述页面浏览的第一数目包括确定指示满足所述分组定义的发布商关键值的所述页面浏览/关键值映射的数目;以及
还包括:
根据指派给所述分组的所述用户标识符的所述页面浏览记录确定页面浏览的第二数目,所述页面浏览的第二数目等于指派给所述分组的所述用户标识符的所述页面浏览记录所代表的页面浏览总数;以及
确定和所述页面浏览的第二数目与所述页面浏览的第一数目之比成比例的分组质量度量。
5.根据权利要求4所述的计算机实现的方法,还包括:
生成分组填充数据,所述分组填充数据是指派给所述分组定义数据定义的所述分组的用户标识符和定义所述分组的数据的关联;以及
响应于所述分组定义,提供所述分组填充数据给发布商,以协助对和指派给所述分组的所述用户标识符相关联的未来页面浏览的广告进行定向。
6.根据权利要求2所述的计算机实现的方法,其中:
对于每个页面浏览记录,所述发布商关键值存储在所述页面浏览记录的相应字段中,每个相应字段和相应索引值相关联;
所述页面浏览记录代表的所述一个或多个页面浏览中的每一个的页面浏览/关键值映射是页面浏览/关键值位图,所述位图在和提供给所述页面浏览的印象的发布商关键值的相应索引值对应的索引位置具有对应的第一值,并且,在和未提供给所述页面浏览的所述印象的发布商关键值的相应索引值对应的索引位置具有对应的第二值。
7.根据权利要求6所述的计算机实现的方法,其中根据包括满足所述分组定义所定义的所述分组的发布商关键值的记录,为所述分组指派用户标识符包括:
根据所述分组定义为每个页面浏览记录生成位掩码,所述位掩码在与所述页面浏览记录中的发布商关键值的相应索引值对应的索引位置处具有所述对应的第一值,并且,在与不在所述页面浏览记录中的发布商关键值的相应索引值对应的索引位置处具有对应的第二值;以及
对于所述发布商的每个页面浏览记录,比较所述页面浏览记录的所述分组定义位掩码和所述页面浏览记录的页面浏览/关键值位图中的每一个。
8.根据权利要求1所述的计算机实现的方法,其中:
生成分组填充数据,所述分组填充数据是指派给所述分组定义数据定义的所述分组的用户标识符和定义所述分组的数据的关联;以及
响应于所述分组定义,提供所述分组填充数据给发布商,以协助对和指派给所述分组的所述用户标识符相关联的未来页面浏览的广告进行定向。
9.一种用于受众分组估计的***,包括:
用于存储发布商日志的装置,所述发布商日志包括描述针对发布商站点的页面浏览所递送的过往印象的数据,针对每个印象,所述数据包括:
用户标识符;
识别发布商的发布商标识符;
识别页面浏览的页面浏览值;以及
为所述印象提供的所述发布商的多个发布商关键值;
用于根据所述发布商日志生成每个发布商的发布商页面浏览数据并把所述页面浏览数据存储在所述数据存储装置中的装置,所述每个发布商的发布商页面浏览数据包括代表在第一时间段期间出现的页面浏览的页面浏览记录,每个页面浏览记录代表在第一时间段期间出现的第二时间段期间的和用户标识符及发布商标识符对相关联的一个或多个页面浏览,每个页面浏览记录包括:
用户标识符;
发布商标识符;以及
为由所述页面浏览记录代表的针对所述一个或多个页面浏览所出现的所述印象提供的发布商关键值;
用于接收发布商的分组定义的装置,所述分组定义根据所述发布商的一个或多个发布商关键值定义分组;
用于根据包括满足所述分组定义所定义的所述分组的发布商关键值的记录,为所述分组指派用户标识符的装置;
用于基于指派给所述分组的所述用户标识符和指派给所述分组的所述用户标识符的所述页面浏览记录,确定一个或多个分组特征的装置;以及,
用于响应于所述分组定义,提供描述所述分组的一个或多个特征的响应数据的装置。
10.根据权利要求9所述的***,其中,对于所述页面浏览记录代表的每个页面浏览,每个页面浏览记录包括指示哪个所述发布商关键值被提供给针对所述页面浏览的印象的页面浏览/关键值映射。
11.根据权利要求10所述的***,其中用于确定一个或多个分组特征的装置包括用于根据指派给所述分组的所述用户标识符的所述页面浏览记录确定页面浏览的第一数目的装置。
12.根据权利要求11所述的***,其中:
用于根据指派给所述分组的所述用户标识符的所述页面浏览记录确定所述页面浏览的第一数目的装置包括用于确定指示满足所述分组定义的发布商关键值的所述页面浏览/关键值映射的数目的装置;
所述***还包括:
用于根据指派给所述分组的所述用户标识符的所述页面浏览记录确定页面浏览的第二数目的装置,所述页面浏览的第二数目等于指派给所述分组的所述用户标识符的所述页面浏览记录所代表的页面浏览总数;以及
用于确定和所述页面浏览的第二数目与所述页面浏览的第一数目之比成比例的分组质量度量的装置。
13.根据权利要求12所述的***,还包括:
用于生成分组填充数据的装置,所述分组填充数据是指派给所述分组定义数据定义的所述分组的用户标识符和定义所述分组的数据的关联;以及
用于响应于所述分组定义,提供所述分组填充数据给发布商,以协助对和指派给所述分组的所述用户标识符相关联的未来页面浏览的广告进行定向的装置。
14.根据权利要求10所述的***,其中:
对于每个页面浏览记录,所述发布商关键值存储在所述页面浏览记录的相应字段中,每个相应字段和相应索引值相关联;
所述页面浏览记录代表的所述一个或多个页面浏览中的每一个的页面浏览/关键值映射是页面浏览/关键值位图,所述位图在和提供给所述页面浏览的印象的发布商关键值的相应索引值对应的索引位置具有对应的第一值,并且,在和未提供给所述页面浏览的所述印象的发布商关键值的相应索引值对应的索引位置具有对应的第二值。
15.根据权利要求14所述的***,其中用于根据包括满足所述分组定义所定义的所述分组的发布商关键值的记录,为所述分组指派用户标识符的装置包括:
用于根据所述分组定义为每个页面浏览记录生成位掩码的装置,所述位掩码在与所述页面浏览记录中的发布商关键值的相应索引值对应的索引位置处具有所述对应的第一值,并且,在与不在所述页面浏览记录中的发布商关键值的相应索引值对应的索引位置处具有对应的第二值;以及
用于对于所述发布商的每个页面浏览记录,比较所述页面浏览记录的所述分组定义位掩码和所述页面浏览记录的页面浏览/关键值位图中的每一个的装置。
16.一种用于受众分组估计的***,包括:
用于存储多个发布商的发布商页面浏览数据的装置,每个发布商的所述发布商页面浏览数据包括代表在第一时间段期间出现的页面浏览的页面浏览记录,每个页面浏览记录代表与用户标识符及发布商标识符对相关联的一个或多个页面浏览,每个页面浏览记录包括:
用户标识符;
识别发布商的发布商标识符;以及
为针对由所述页面浏览记录代表的针对所述一个或多个页面浏览所出现的印象提供的发布商关键值;
其中,对于每个页面浏览记录,所述发布商关键值存储在所述页面浏览记录的相应字段中,每个相应字段和相应索引值相关联;而且,对于所述页面浏览记录代表的每个页面浏览,每个页面浏览记录包括指示哪个所述发布商关键值被提供给所述页面浏览的印象的页面浏览/关键值映射;所述页面浏览记录代表的所述一个或多个页面浏览中的每一个的所述页面浏览/关键值映射是页面浏览/关键值位图,所述位图在和提供给所述页面浏览的印象的发布商关键值的相应索引值对应的索引位置具有对应的第一值,并且,在和未提供给所述页面浏览的所述印象的发布商关键值的相应索引值对应的索引位置具有对应的第二值;
用于接收发布商的分组定义的装置,所述分组定义根据所述发布商的一个或多个发布商关键值定义分组;
用于根据所述分组定义为每个页面浏览记录生成位掩码的装置,所述位掩码在与所述分组定义中的发布商关键值的相应索引值对应的索引位置处具有所述对应的第一值,并且,在与不在所述页面浏览记录中的发布商关键值的相应索引值对应的索引位置处具有所述对应的第二值;以及
用于对于发布商的每个页面浏览记录,比较所述页面浏览记录的分组定义位掩码和所述页面浏览记录的所述页面浏览/关键值位图中的每一个以确定哪个页面浏览满足所述分组定义的装置;
用于基于被确定满足所述分组定义的所述页面浏览确定一个或多个分组特征的装置;以及,
用于响应于所述分组定义,提供描述所述分组的一个或多个特征的响应数据的装置。
17.一种用于受众分组估计的方法,包括:
由数据处理装置生成多个发布商的发布商页面浏览数据,每个发布商的所述发布商页面浏览数据包括代表在第一时间段期间出现的页面浏览的页面浏览记录,每个页面浏览记录代表与用户标识符及发布商标识符对相关联的一个或多个页面浏览,每个页面浏览记录包括:
用户标识符;
识别发布商的发布商标识符;以及
为由所述页面浏览记录代表的针对所述一个或多个页面浏览所出现的印象提供的发布商关键值;
在所述数据处理装置接收发布商的分组定义,所述分组定义根据所述发布商的一个或多个发布商关键值定义分组;
由所述数据处理装置确定满足所述分组定义所定义的所述分组的发布商关键值被提供给印象的页面浏览;
由所述数据处理装置基于被确定满足所述分组定义的所述页面浏览确定一个或多个分组特征;以及,
响应于所述分组定义,提供描述所述分组的一个或多个特征的响应数据。
CN201080045960.XA 2009-08-28 2010-08-23 受众分组估计 Active CN102576443B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410816262.5A CN104680395B (zh) 2009-08-28 2010-08-23 用于受众分组估计的方法和***

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/549,970 US8370202B2 (en) 2009-08-28 2009-08-28 Audience segment estimation
US12/549,970 2009-08-28
PCT/US2010/046289 WO2011031433A2 (en) 2009-08-28 2010-08-23 Audience segment estimation

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201410816262.5A Division CN104680395B (zh) 2009-08-28 2010-08-23 用于受众分组估计的方法和***

Publications (2)

Publication Number Publication Date
CN102576443A CN102576443A (zh) 2012-07-11
CN102576443B true CN102576443B (zh) 2015-04-15

Family

ID=43626232

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201410816262.5A Active CN104680395B (zh) 2009-08-28 2010-08-23 用于受众分组估计的方法和***
CN201080045960.XA Active CN102576443B (zh) 2009-08-28 2010-08-23 受众分组估计

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201410816262.5A Active CN104680395B (zh) 2009-08-28 2010-08-23 用于受众分组估计的方法和***

Country Status (8)

Country Link
US (3) US8370202B2 (zh)
EP (1) EP2471038A4 (zh)
JP (1) JP5587414B2 (zh)
CN (2) CN104680395B (zh)
AU (1) AU2010292843B2 (zh)
BR (1) BR112012004376B1 (zh)
CA (1) CA2772324A1 (zh)
WO (1) WO2011031433A2 (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10049391B2 (en) 2010-03-31 2018-08-14 Mediamath, Inc. Systems and methods for providing a demand side platform
CA2795128A1 (en) 2010-03-31 2011-10-06 Mediamath, Inc. Systems and methods for integration of a demand side platform
WO2012012342A2 (en) 2010-07-19 2012-01-26 Mediamath, Inc. Systems and methods for determining competitive market values of an ad impression
US20120054043A1 (en) * 2010-09-01 2012-03-01 Anurag Agarwal Access Control for User-Related Data
US8984547B2 (en) 2011-04-11 2015-03-17 Google Inc. Estimating demographic compositions of television audiences
WO2013039594A1 (en) * 2011-09-14 2013-03-21 Collective, Inc. System and method for targeting advertisements
CN103718529A (zh) * 2012-07-31 2014-04-09 华为技术有限公司 广告存储方法、广告***方法、设备和***
US9552590B2 (en) * 2012-10-01 2017-01-24 Dstillery, Inc. Systems, methods, and media for mobile advertising conversion attribution
US10643027B2 (en) * 2013-03-12 2020-05-05 Microsoft Technology Licensing, Llc Customizing a common taxonomy with views and applying it to behavioral targeting
US20160134934A1 (en) * 2014-11-06 2016-05-12 Adobe Systems Incorporated Estimating audience segment size changes over time
CN106997431B (zh) * 2016-01-22 2020-09-25 阿里巴巴集团控股有限公司 一种数据处理方法及装置
US10467659B2 (en) 2016-08-03 2019-11-05 Mediamath, Inc. Methods, systems, and devices for counterfactual-based incrementality measurement in digital ad-bidding platform
WO2018034956A1 (en) * 2016-08-14 2018-02-22 The Ticket Fairy, Inc. Automated system for target identification and management
US10354276B2 (en) 2017-05-17 2019-07-16 Mediamath, Inc. Systems, methods, and devices for decreasing latency and/or preventing data leakage due to advertisement insertion
CN108304505B (zh) * 2018-01-18 2020-09-11 上海达梦数据库有限公司 一种sql语句的处理方法、装置、服务器及存储介质
US11348142B2 (en) 2018-02-08 2022-05-31 Mediamath, Inc. Systems, methods, and devices for componentization, modification, and management of creative assets for diverse advertising platform environments
CN110737854B (zh) * 2018-07-02 2023-02-10 腾讯科技(深圳)有限公司 连续剧式投放信息的展示方法、装置、设备及存储介质
US11182829B2 (en) 2019-09-23 2021-11-23 Mediamath, Inc. Systems, methods, and devices for digital advertising ecosystems implementing content delivery networks utilizing edge computing
CN117978544B (zh) * 2024-03-28 2024-05-31 深圳微子医疗有限公司 一种医疗设备远程信息传输方法及***

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101156442A (zh) * 2004-12-17 2008-04-02 塔科达有限公司 用于将受众与可递送内容相匹配的网络

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6061658A (en) * 1998-05-14 2000-05-09 International Business Machines Corporation Prospective customer selection using customer and market reference data
US6925442B1 (en) 1999-01-29 2005-08-02 Elijahu Shapira Method and apparatus for evaluating vistors to a web server
WO2001045004A1 (en) * 1999-12-17 2001-06-21 Promo Vu Interactive promotional information communicating system
US7661116B2 (en) * 2000-02-25 2010-02-09 Vulcan Patents Llc Auction for targeted content
JP2002132822A (ja) * 2000-10-23 2002-05-10 Nippon Telegr & Teleph Corp <Ntt> インターネット広告配信システム及びインターネット広告配信方法
US20080189408A1 (en) * 2002-10-09 2008-08-07 David Cancel Presenting web site analytics
US9117217B2 (en) * 2003-08-01 2015-08-25 Advertising.Com Llc Audience targeting with universal profile synchronization
US20060149626A1 (en) * 2004-12-30 2006-07-06 Bennett David L Integration of WIC items and transactions into personal shopping devices
US20060224447A1 (en) * 2005-03-31 2006-10-05 Ross Koningstein Automated offer management using audience segment information
US8452832B2 (en) * 2006-07-27 2013-05-28 Yahoo! Inc. System and method for population-targeted advertising
US7822755B2 (en) 2007-03-06 2010-10-26 Yahoo! Inc. Methods of processing and segmenting web usage information
KR20090000627A (ko) 2007-03-09 2009-01-08 황보의 포탈 사이트 광고 방법 및 광고 시스템
US7698422B2 (en) * 2007-09-10 2010-04-13 Specific Media, Inc. System and method of determining user demographic profiles of anonymous users
US7836005B2 (en) * 2007-10-16 2010-11-16 Kuo-Hui Chien System and method for automatic generation of user-oriented homepage
US7996521B2 (en) 2007-11-19 2011-08-09 Experian Marketing Solutions, Inc. Service for mapping IP addresses to user segments
US20090327076A1 (en) * 2008-06-27 2009-12-31 Microsoft Corporation Ad targeting based on user behavior
CN101504671B (zh) * 2009-03-05 2012-10-03 阿里巴巴集团控股有限公司 用户访问网页行为的可视化处理方法、装置及***

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101156442A (zh) * 2004-12-17 2008-04-02 塔科达有限公司 用于将受众与可递送内容相匹配的网络

Also Published As

Publication number Publication date
US8639575B2 (en) 2014-01-28
EP2471038A4 (en) 2014-10-15
US20110055009A1 (en) 2011-03-03
BR112012004376A2 (pt) 2016-03-15
BR112012004376B1 (pt) 2020-12-01
US20140143045A1 (en) 2014-05-22
US8370202B2 (en) 2013-02-05
JP2013503392A (ja) 2013-01-31
CN104680395A (zh) 2015-06-03
WO2011031433A2 (en) 2011-03-17
AU2010292843A1 (en) 2012-03-15
BR112012004376A8 (pt) 2018-01-02
JP5587414B2 (ja) 2014-09-10
WO2011031433A3 (en) 2011-05-19
CN104680395B (zh) 2018-03-16
CA2772324A1 (en) 2011-03-17
EP2471038A2 (en) 2012-07-04
CN102576443A (zh) 2012-07-11
US20130124316A1 (en) 2013-05-16
AU2010292843B2 (en) 2015-05-21

Similar Documents

Publication Publication Date Title
CN102576443B (zh) 受众分组估计
US9514479B2 (en) System and method for estimating prevalence of digital content on the world-wide-web
US10303703B2 (en) Data fusion using behavioral factors
US9858308B2 (en) Real-time content recommendation system
US20240104586A1 (en) Methods and apparatus to perform computer-based monitoring of audiences of network-based media by using information theory to estimate intermediate level unions
US12038898B2 (en) Methods and apparatus to estimate cardinality of users represented across multiple bloom filter arrays
KR20140038405A (ko) 컨버젼 경로에 기반한 세분화
JP2014512613A (ja) ユーザインタラクショングループ分けを用いたコンバージョン経路の集約
US9098857B1 (en) Determining effectiveness of advertising campaigns
US11854030B2 (en) Methods and apparatus to estimate cardinality across multiple datasets represented using bloom filter arrays
Frhan Website clickstream data visualization using improved Markov chain modelling in apache flume
AU2015213416B2 (en) Audience segment estimation
US20220253466A1 (en) Methods and apparatus to estimate a deduplicated audience of a partitioned audience of media presentations
US20220156783A1 (en) Methods and apparatus to estimate unique audience sizes across multiple intersecting platforms
Györödi et al. Web page analysis based on HTML DOM and its usage for forum statistics, alerts and geo targeted data retrieval
AU2016200904A1 (en) Audience segment estimation
ES2371404T3 (es) Sistema y procedimiento para estimar la prevalencia de contenido digital en la world-wide-web.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: American California

Patentee after: Google limited liability company

Address before: American California

Patentee before: Google Inc.

CP01 Change in the name or title of a patent holder