CN114616578A - 改进定向和其他设置的内容提供者建议 - Google Patents

改进定向和其他设置的内容提供者建议 Download PDF

Info

Publication number
CN114616578A
CN114616578A CN201980005050.XA CN201980005050A CN114616578A CN 114616578 A CN114616578 A CN 114616578A CN 201980005050 A CN201980005050 A CN 201980005050A CN 114616578 A CN114616578 A CN 114616578A
Authority
CN
China
Prior art keywords
retrieval
bit string
processing system
data processing
pruned
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980005050.XA
Other languages
English (en)
Inventor
M.克拉拉普拉曼朱纳塔
C.W.苏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN114616578A publication Critical patent/CN114616578A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/11Identifying congestion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/215Flow control; Congestion control using token-bucket
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/29Flow control; Congestion control using a combination of thresholds
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/61Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio
    • H04L65/612Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio for unicast
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/53Network services using third party service providers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/60Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
    • H04L67/63Routing a service request depending on the request content or context

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Multimedia (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Information Transfer Between Computers (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开的至少一个方面针对基于标准从检索令牌集合中修剪检索令牌的***和方法。该***可以接收包括第二检索令牌的多个检索令牌。该***可以检索对第一令牌和多个请求的指示。该***可以基于预测请求和第一检索令牌来构造第一位串。该***可以检索对应于第二检索令牌的第二位串。***可以将第一位串与第二位串进行比较,以确定相似性值。该***可以确定相似性值大于预定阈值。该***可以从多个检索令牌中移除第一检索令牌和第二检索令牌,以创建经修剪的检索令牌集合。***可以向内容提供者提供经修剪的集合。

Description

改进定向和其他设置的内容提供者建议
背景技术
在诸如互联网的计算机联网环境中,第三方内容提供者提供第三方内容项以在终端用户计算设备上显示。这些第三方内容项(例如,广告)可以显示在与相应的发布者相关联的网页上。这些第三方内容项可以包括标识提供内容项的第三方内容提供者的内容。
在一些实施方式中,可以通过使用肯定(positive)检索令牌和否定(negative)检索令牌来选择第三方内容项。肯定检索令牌可以向内容选择平台指示与检索令牌相关联的内容项应该被***到具有与肯定检索令牌的属性相匹配的属性的信息资源中。相反,否定检索令牌可以向内容选择平台指示相关联的内容不应该被***到具有与否定检索令牌的属性相匹配的属性的信息资源中。以这种方式,内容提供者可以使用肯定检索令牌和否定检索令牌两者的列表来调整哪些信息资源可以包括它们的内容项。
然而,确定检索令牌的哪些组合使可定向(targetable)的信息资源最大化,这在计算上是很困难的任务,因为它可能包括估计由内容提供者提供的检索令牌的每个可能排列的影响。许多内容提供者利用数百到数千个检索令牌,使得对每个排列的迭代估计在计算上几乎不可行,并且远远超出任何人的能力。作为结果,不使用本文中讨论的***和方法的内容提供者的实施方式限于猜测或预感检索令牌的哪个组合具有什么效果。这可能导致错误的内容选择、以及不希望的或非最佳内容的传输,浪费带宽和功率资源。
发明内容
本文中讨论的***和方法使得数据处理***能够通过使用基于历史数据的估计技术来识别否定检索令牌集合中的哪些否定检索令牌对被选择***到信息资源中的内容项的数量具有最大影响,来自动改进内容选择过程。数据处理***还可以识别由内容提供者提供的与相似的信息资源集合相关联的其他检索令牌。在识别出哪些检索令牌对内容选择过程具有最大影响之后,数据处理***可以从所提供的检索令牌中移除那些检索令牌,并且执行估计过程以确定能够服务于那些内容项的信息资源的数量是否有所改善。这可以允许减少或消除错误的内容选择,允许数据处理***避免传送这种内容,从而减少***的带宽和功耗。
本公开的至少一个方面针对一种基于文档空间关联从选择标准的集合中修剪选择标准的方法。该方法可以包括由包括一个或多个处理器的数据处理***从内容提供者计算***接收多个检索令牌。所述多个检索令牌中的每一个可以包括第二检索令牌。该方法可以包括由数据处理***检索对第一检索令牌的指示。第一检索令牌可以被包括在所述多个检索令牌中。该方法可以包括由数据处理***基于所述多个检索令牌检索多个预测请求。该方法可以包括由数据处理***构造第一数据结构,该第一数据结构指示对多个检索令牌中的第一检索令牌的相关联的预测请求。这种数据结构可以包括位串,第一位串中的每个位置对应于多个预测请求中相应的一个,并且具有指示相应的预测请求是否对应于第一检索令牌的值。在一些这样的实施方式中,该方法可以包括由数据处理***检索第二位串,第二位串可以与所述多个检索令牌中的第二检索令牌相关联。第二位串中的每个位置可以对应于第一多个预测请求中的相应一个,并且具有指示相应的预测请求是否对应于第二检索令牌的值。该方法可以包括由数据处理***将第一数据结构或位串与第二数据结构(例如,指示对多个检索令牌中的第二检索令牌的相关联的预测请求)或位串进行比较,以计算相似性值。该方法可以包括由数据处理***确定相似性值是否大于预定阈值。该方法可以包括由数据处理***响应于确定相似性值大于预定阈值,从所述多个检索令牌中移除第一检索令牌和第二检索令牌,以创建经修剪的多个检索令牌。该方法可以包括由数据处理***向内容提供者计算设备提供经修剪的多个检索令牌。
在一些实施方式中,第一数据结构和第二数据结构各自包括位串,其中每个位串中的每个位置对应于多个预测请求中的预测请求,并且具有指示相应的预测请求是否对应于相应的检索令牌的值。在一些进一步的实施方式中,该方法可以包括使用位串选择标准选择第一位串中的位置,以创建第一修剪位串。第一修剪位串可以小于第一位串。在一些实施方式中,该方法可以包括使用位串选择标准选择第二位串中的位置,以创建第二修剪位串。第二修剪位串可以小于第二位串。在一些实施方式中,将第一位串和第二位串进行比较包括将第一修剪位串和第二修剪位串进行比较。
在一些实施方式中,创建第一修剪位串的选择标准是基于伪随机选择。在一些实施方式中,检索所述多个预测请求还包括检索多个权重值。所述多个权重值中的每一个可以对应于相应预测请求的估计流量值。在一些实施方式中,该方法可以包括由数据处理***将所述多个权重值中的每一个与预定流量阈值进行比较。在一些实施方式中,该方法可以包括由数据处理***选择经修剪的多个预测请求。响应于相应的权重值大于预定流量阈值,从所述多个预测请求中选择经修剪的多个请求中的每一个。在一些实施方式中,该方法可以包括由数据处理***构造第一位串。第一位串中的每个位置可以对应于经修剪的多个预测请求中的相应一个,并且具有指示相应的经修剪的预测请求是否对应于第一检索令牌的值。
在一些实施方式中,该方法可以包括由数据处理***在第一位串和第二位串之间执行逻辑与(AND)运算,以创建比较位串。在一些实施方式中,该方法可以包括由数据处理***对比较位串中等于预定匹配值的位置的数量进行计数,以计算相似性值。在一些实施方式中,该方法可以包括由数据处理***响应于相似性值小于预定阈值,从所述多个检索令牌中移除第一第一检索令牌,以创建经修剪的多个检索令牌。在一些实施方式中,所述多个检索令牌中的每一个与内容评级值相关联。在一些实施方式中,该方法可以包括基于所述多个检索令牌和与第一检索令牌相关联的内容评级值来检索多个预测请求。在一些实施方式中,该方法可以包括提供对第一检索令牌和第二检索令牌的指示。在一些实施方式中,该方法可以包括由数据处理***基于经修剪的多个检索令牌来检索经修剪的多个检索令牌的相关性值。在一些实施方式中,该方法可以包括由数据处理***向内容提供者计算设备提供基于经修剪的多个检索令牌的相关性值。
本公开的至少一个其他方面针对一种包括数据处理***的***,该数据处理***包括一个或多个处理器。该数据处理***可以从内容提供者计算***接收多个检索令牌。所述多个检索令牌包括第二检索令牌。数据处理***可以检索对第一检索令牌的指示,第一检索令牌被包括在所述多个检索令牌中。数据处理***可以基于所述多个检索令牌来检索多个预测请求。数据处理***可以构造第一数据结构,该第一数据结构指示对所述多个检索令牌中的第一检索令牌的相关联的预测请求。这种数据结构可以包括位串,第一位串中的每个位置对应于多个预测请求中相应的一个,并且具有指示相应的预测请求是否对应于第一检索令牌的值。在一些这样的实施方式中,数据处理***可以检索第二位串,该第二位串与所述多个检索令牌中的第二检索令牌相关联。第二位串中的每个位置可以对应于第一多个预测请求中的相应一个,并且具有指示相应的预测请求是否对应于第二检索令牌的值。数据处理***可以将第一数据结构或位串与第二数据结构(例如,指示对多个检索令牌中的第二检索令牌的相关联的预测请求)或位串进行比较,以计算相似性值。数据处理***可以确定相似性值大于预定阈值。数据处理***可以响应于确定相似性值大于预定阈值,从所述多个检索令牌中移除第一检索令牌和第二检索令牌,以创建经修剪的多个检索令牌。数据处理***可以向内容提供者计算设备提供经修剪的多个检索令牌。
在一些实施方式中,第一数据结构和第二数据结构各自包括位串,其中每个位串中的每个位置对应于多个预测请求中的预测请求,并且具有指示相应的预测请求是否对应于相应的检索令牌的值。在一些进一步的实施方式中,数据处理***可以使用位串选择标准来选择第一位串中的位置,以创建第一修剪位串,第一修剪位串小于第一位串。在一些实施方式中,数据处理***可以使用位串选择标准来选择第二位串中的位置,以创建第二修剪位串,第二修剪位串小于第二位串。在一些实施方式中,数据处理***可以通过比较第一修剪位串和第二修剪位串来比较第一位串和第二位串。在一些实施方式中,创建第一修剪位串的位串选择标准是基于伪随机选择。在一些实施方式中,数据处理***可以检索多个权重值,所述多个权重值中的每一个对应于相应预测请求的估计流量值。在一些实施方式中,数据处理***可以将所述多个权重值中的每一个与预定流量阈值进行比较。
在一些实施方式中,数据处理***可以选择经修剪的多个预测请求,其中经修剪的多个预测请求中的每一个是响应于相应的权重值大于预定流量阈值来从所述多个预测请求中被选择。在一些实施方式中,数据处理***可以构造第一位串,其中第一位串中的每个位置对应于经修剪的多个预测请求中的相应一个,并且具有指示相应的经修剪的预测请求是否对应于第一检索令牌的值。在一些实施方式中,数据处理***可以在第一位串和第二位串之间执行逻辑与运算,以创建比较位串。在一些实施方式中,数据处理***可以计算比较位串中等于预定匹配值的位置的数量,以计算相似性值。
在一些实施方式中,数据处理***可以响应于相似性值小于预定阈值,从所述多个检索令牌中移除第一检索令牌,以创建经修剪的多个检索令牌。在一些实施方式中,所述多个检索令牌中的每一个可以与内容评级值相关联。在一些实施方式中,数据处理***可以基于所述多个检索令牌和与第一检索令牌相关联的内容评级值来检索多个预测请求。在一些实施方式中,数据处理***可以提供对第一检索令牌和第二检索令牌的指示。在一些实施方式中,数据处理***可以基于经修剪的多个检索令牌来检索经修剪的多个检索令牌的相关性值。在一些实施方式中,数据处理***可以向内容提供者计算设备提供相关性值。
将在下面详细讨论这些方面和其他方面以及实施方式。前述信息和以下详细描述包括各种方面和实施方式的说明性示例,并且提供了用于理解所要求保护的方面和实施方式的性质和特征的概述或框架。附图提供了对各个方面和实施方式的说明和进一步理解,并且被结合在本说明书中并构成其一部分。这些方面可以被组合,并且将容易理解,在本发明的一个方面的上下文中描述的特征可以与其他方面组合。这些方面可以以任何方便的形式实现。例如,通过适当的计算机程序来实现,其中该计算机程序可以承载在适当的载体介质(计算机可读介质)上,该载体介质可以是有形的载体介质(例如,磁盘)或无形的载体介质(例如,通信信号)。这些方面也可以使用合适的装置来实现,该装置可以采用运行被布置来实现该方面的计算机程序的可编程计算机的形式。
附图说明
附图不旨在按比例绘制。各种附图中相同的附图标记和名称表示相同的元件。为了清楚起见,不是每个组件都可以在每个图中标注。在附图中:
图1示出了描绘用于修剪内容提供者平台的检索令牌的示例***的框图;
图2示出了基于预测请求为检索令牌构造位串的示意图;
图3示出了从两个位串确定相似性值的示意图;
图4示出了基于预测请求从检索令牌集合中修剪检索令牌的方法的流程图;
图5示出了基于预测请求为检索令牌构造位串的方法的流程图;
图6示出了从检索令牌集合中修剪检索令牌的方法的流程图;以及
图7示出了可以用于实现本文中讨论的任何计算机的说明性计算机***的一般架构。
具体实施方式
以下是与用户标识符集合的交集的隐私保护确定的方法、装置和***相关的各种概念以及这些方法、装置和***的实施方式的详细描述。因为所描述的概念不限于任何特定的实现方式,所以以上介绍的和以下更详细讨论的各种概念可以以许多方式中的任何一种来实现。
内容提供者可以向内容选择***提供用于***到信息资源中的内容项,该信息资源可以是网页、视频片段或移动应用等。内容选择***可以基于信息资源的内容将内容提供者提供的内容项***到信息资源中。例如,如果某些关键词与信息资源相关联,或者如果信息资源被与某些人口统计信息相关联的用户组查看,则内容选择***可以选择与相似属性相关联的内容项。因此,内容提供者***可以将检索令牌与它们的内容项相关联,这可以包括可以引导内容选择***将内容项***到定向信息资源中的定向(targeting)信息。由内容提供者提供的检索令牌可以包括语言信息、用户人口统计信息、用户兴趣垂直信息、内容评级信息和关键词信息等。
检索令牌还可以包括质量,诸如肯定或否定质量。肯定检索令牌可以向内容选择平台指示与检索令牌相关联的内容项应该被***到具有与肯定检索令牌的属性相匹配的属性的信息资源中。相反,否定检索令牌可以向内容选择平台指示相关联的内容不应该被***到具有与否定检索令牌的属性相匹配的属性的信息资源中。以这种方式,内容提供者可以使用肯定检索令牌和否定检索令牌两者的列表来调整哪些信息资源可以包括它们的内容项。此外,某些内容选择平台可以提供估计信息资源的数量和质量的界面,该信息资源可以包括由内容提供者基于与那些内容项相关联的检索令牌提供的内容项。
然而,确定检索令牌的哪些组合使可定向的信息资源最大化,这在计算上是很困难的任务,因为它可能包括估计由内容提供者提供的检索令牌的每个可能排列的影响。许多内容提供者提供数百到数千个检索令牌的列表,使得迭代的对每个排列的估计在计算上几乎不可行。这些问题由于以下事实而变得更为复杂,即许多内容提供者仅仅使用预先准备的肯定检索令牌和否定检索令牌的第三方列表,这可能对包括内容提供者的内容项的信息资源的数量产生意外和非预期的负面影响。此外,基于内容提供者的估计反馈来手动调整检索令牌可能是不切实际地耗时的。
为了解决前述技术问题,数据处理***可以使用基于历史数据的估计技术来自动识别否定检索令牌中的哪些对被选择***信息资源的内容项的数量具有最大影响。数据处理***还可以识别由内容提供者提供的与相似的信息资源集合相关联的其他检索令牌。在识别出哪些检索令牌对内容选择过程具有最大影响之后,数据处理***可以从所提供的检索令牌中移除那些检索令牌,并且执行估计过程以确定能够服务于那些内容项的信息资源的数量是否有所改善。
例如,考虑具有标题“Phone Unboxing Video(手机拆箱视频)”并附带“Go to mychannel to see my other videos(转到我的频道观看其他视频)”的描述的信息资源。因此,信息资源可以与英语相关联。考虑希望定向(target)具有内容项的这个信息资源(也许还有其他相似的信息资源)的内容提供者。然而,内容提供者已经无意地添加了否定定向标准(例如,否定检索令牌)“video”、“videos”和“TV”等。假设否定关键词(negativekeyword)“video”对目标信息资源的数量具有最大的负面影响。在一些实施方式中,因为关键词“videos”和“TV”与来自相似信息资源的相似历史请求相关联,所以数据处理***可以确定关键词“videos”和“TV”也应该从由内容提供者提供的检索令牌的列表中移除。因此,数据处理***可以通过基于相似的历史模式移除所有相似的检索令牌来消除迭代移除和执行每个组合否定关键词的预测请求估计的需要。
因此,本文描述的技术解决方案可以显著降低移除可能对内容项的范围产生负面影响的不必要或无意的检索令牌的计算复杂度。此外,通过应用基于统计分析的位压缩技术,数据处理***可以显著降低为每个检索令牌确定相似的关联的信息资源的存储要求和计算复杂度,这是对其他实施方式的改进。
图1描绘了用于修剪内容提供者平台的检索令牌的***100。***100可以包括至少一个计算机网络110。***100可以包括至少一个内容提供者115。***100可以包括至少一个数据处理***105。数据处理***105可以包括至少一个检索令牌接收器125。数据处理***105可以包括至少一个预测请求检索器130。数据处理***105可以包括至少一个位串构造器135。数据处理***105可以包括至少一个位串比较模块140。数据处理***105可以包括至少一个检索令牌修剪器145。数据处理***105可以包括至少一个修剪令牌提供者150。***100可以包括至少一个数据库120。在一些实施方式中,数据处理***可以包括内容提供者115。在一些实施方式中,数据处理***可以包括数据库120。
***100的组件(例如,网络110、内容提供者115、数据处理***105、检索令牌接收器125、预测请求检索器130、位串构造器135、位串比较模块140、检索令牌修剪器145、修剪令牌提供者150、数据库120)中的每一个可以使用结合图7在本文中详细描述的计算***700的硬件组件、或者软件与该硬件组件的组合来实现。例如,数据处理***105可以包括服务器或其他计算设备。内容提供者115还可以包括服务器或其他计算设备。数据处理***105的组件中的每一个可以执行本文中详细描述的功能。
网络110可以包括计算机网络(诸如互联网、局域网、广域网、城域网或其他区域网、内联网、卫星网络、其他计算机网络)、其它计算机网络(诸如语音或数据移动电话通信网络)、以及它们的组合。***100的数据处理***105可以经由网络110例如与至少一个内容提供者115和至少一个数据库120进行通信。网络110可以是在内容提供者115、数据处理***105和一个或多个内容源(诸如网络服务器等)之间中继信息的任何形式的计算机网络。在一些实施方式中,网络110可以包括互联网和/或其他类型的数据网络,诸如局域网(local area network,LAN)、广域网(wide area network,WAN)、蜂窝网络、卫星网络或其他类型的数据网络。网络110还可以包括被配置为在网络110内接收和/或发送数据的任何数量的计算设备(例如,计算机、服务器、路由器、网络交换机等)。网络110还可以包括任何数量的硬连线的连接和/或无线连接。内容提供者115可以与硬连线(例如,经由光纤电缆、CAT5电缆等)到网络110中的其他计算设备的收发器无线通信(例如,经由WiFi、蜂窝、无线电等)。内容提供者115还可以经由代理设备(例如,路由器、网络交换机或网关)与网络110的计算设备无线通信。
数据处理***105可以包括至少一个处理器和存储器,即处理电路。存储器存储处理器可执行指令,其中该处理器可执行指令在被处理器执行时使得处理器执行本文中描述的操作中的一个或多个。处理器可以包括微处理器、专用集成电路(application-specificintegrated circuit,ASIC)、现场可编程门阵列(field-programmable gate array,FPGA)等、或它们的组合。存储器可以包括但不限于电子存储器、光学存储器、磁性存储器或能够向处理器提供程序指令的任何其他存储或传输设备。存储器还可以包括软盘、CD-ROM、DVD、磁盘、存储器芯片、ASIC、FPGA、只读存储器(read-only memory,ROM)、随机存取存储器(random-access memory,RAM)、电可擦可编程ROM(electrically erasable programmableROM,EEPROM)、可擦可编程ROM(erasable programmable ROM,EPROM)、闪存、光学介质或处理器可以从中读取指令的任何其他合适的存储器。指令可以包括来自任何合适的计算机编程语言的代码。数据处理***105可以包括能够执行各种功能的一个或多个计算设备或服务器。
内容提供者115可以包括由内容提供者实体操作以提供用于在信息资源上显示的内容项的服务器或其他计算设备。由内容提供者115提供的内容可以包括用于在信息资源(诸如包括主要内容(例如,由内容提供者115提供的内容)的信息资源)上显示的第三方内容项。内容项也可以被显示在搜索结果网页上。例如,内容提供者115可以提供或作为用于显示在信息资源(诸如公司的网页,其中该网页的主要内容由公司提供)的内容槽(slot)中的或者用于显示在由搜索引擎提供的搜索结果登录页面上的内容项的源。与内容提供者115相关联的内容项可以显示在除网页之外的信息资源(诸如作为智能电话或其他客户端设备上的应用的执行的一部分而显示的内容)上。下面将解释在***100的环境中内容提供者115的功能。
数据库120可以是被配置为存储和/或维护本文中描述的任何信息的数据库。数据库120可以被存储在任何适当类型和形式的数据结构(诸如数组、平面文件(flat file)、描绘文件(delineated file)或任何其他类型和形式的数据库文件)中。在一些实施方式中,数据库120可以预先填充有预测请求值。预测请求值可以由外部***基于历史数据和相关联的检索令牌来生成。数据库120可以维护一个或多个数据结构,其中所述一个或多个数据结构可以包含和/或索引本文中描述的值、复数(plurality)或阈值中的每一个。在一些实施方式中,可以使用一个或多个存储器地址或索引值来访问数据库。可以由数据处理***105的模块或内容提供者115经由网络110访问数据库120。在一些实施方式中,数据库120在数据处理***105的内部。在一些实施方式中,数据库120可以存在于数据处理***105的外部,并且可以经由网络110来被访问。在一些实施方式中,数据库120可以跨许多不同的计算机***或存储元件分布,并且可以经由网络110和/或合适的计算机总线接口来被访问。数据处理***可以将任何或所有计算、确定、选择、识别或计算的结果存储在索引了适当的值的一个或多个数据结构中,其中数据处理***105或内容提供者115可以访问所述值中的每一个以执行本文中描述的任何功能。
检索令牌接收器125可以包括用于从一个或多个内容提供者接收检索令牌的应用、服务器、服务、守护进程(daemon)、例程或其他可执行逻辑,并且可以由计算***的处理器或协处理器或者其他硬件(例如,ASIC或FPGA等)来执行。检索令牌接收器125可以从内容提供者115接收多个检索令牌。在一些实施方式中,检索令牌接收器125可以接收从所述多个检索令牌中修剪检索令牌的请求。修剪所述多个检索令牌可以改进内容提供者115通过增加与和所述多个检索令牌相关联的内容项的交互数量的内容选择过程。此外,检索令牌可以被***到内容项中,以增加它们被选择和***到信息资源中的可能性。如果检索令牌以某种方式存在于信息资源中(例如,网页上的关键词等),或者直接与信息资源相关(例如,包含相似的语言或用户人口统计信息等),则与检索令牌相关联的内容项可以具有被***到信息资源中的更高可能性。检索令牌可以与特定质量(例如,肯定检索令牌或否定检索令牌)相关联。肯定检索令牌可以增加内容项被***到相关的(例如,匹配的关键字、相似的用户人口统计等)信息资源中的可能性。相反,具有否定质量的检索令牌可以具有相反的效果,并且可以降低相关联的内容项将被***到相关的(例如,匹配的关键字、相似的用户人口统计等)信息资源的可能性。否定检索令牌可以从一个或多个信息资源中排除内容项。
内容提供者115可以指定哪些检索令牌与特定内容项相关联、以及所述多个检索令牌中的每个检索令牌的内容和质量。使用检索令牌,内容提供者115可以为内容项提供特定的定向标准。例如,内容提供者115可以指定内容项不应该被显示在包含某些关键词或短语的信息资源上。在另一示例中,内容提供者115可以提供指示内容项应该以另一种语言(例如,西班牙语)被显示在信息资源上的检索令牌。在一些实施方式中,多个检索令牌可以用于为内容项指定多个定向标准。
在一些实施方式中,检索令牌可以与一个或多个信息资源和/或文档相关联。检索令牌可以包括以下中的一个或多个:人口统计信息、内容评级、语言、内容主题、关键词、短语或其他与信息资源相关的信息。例如,检索令牌包括人口统计信息。信息资源可以具有来自与特定人口统计相关联的用户的更高流量。因此,那些检索令牌可以与由具有相同的人口统计信息(例如,基于用户简档信息等)的用户访问的信息资源相关联。在另一示例中,信息资源可以与特定的内容评级或主题相关联。在这种情况下,包括对相似内容评级和/或内容主题的指示的检索令牌可以与这种信息资源相关联。在另一示例中,信息资源可以包括一个或多个关键词或短语。如果所述一个或多个关键词或短语存在于信息资源中,则检索令牌可以与该信息资源相关联。内容选择平台可以使用检索令牌来选择与可以***它们的信息资源相关的内容项。肯定检索令牌允许内容提供者将内容项引导至与特定关键词、人口统计和其他信息相关联的信息资源,而否定检索令牌允许内容提供者引导内容项远离相关联的信息资源。数据处理***105可以从数据库120访问与检索令牌相关联的信息资源。
预测请求检索器130可以包括用于检索请求预测的应用、服务器、服务、守护进程、例程或其他可执行逻辑。在一些实施方式中,预测请求检索器130可以与检索令牌接收器125组合。预测请求检索器130可以检索对第一检索令牌的指示。第一检索令牌可以被包括在由检索令牌接收器125接收到的多个检索令牌中。第一检索令牌可以是已经被确定对可以请求相关联的内容项的信息资源的数量具有最大负面影响的令牌。例如,第一检索令牌可以是包括关键字“video”的否定检索令牌,这可以防止相关联的内容项被显示在包括关键字“video”的任何信息资源上。在一些实施方式中,可以通过访问数据库120中的数据结构来指示第一检索令牌。在一些实施方式中,对第一检索令牌的指示可以是对所述多个检索令牌中的最高否定(top negative)检索令牌的请求。例如,预测请求检索器130可以检索多个关键词中的每一个的信息资源关联。预测请求检索器130可以确定所述多个检索令牌中的哪一个是否定的并且与最多的信息资源相关联,从而从所述多个检索令牌中检索最高否定检索令牌。在一些实施方式中,预测请求检索器130可以检索多个最高否定检索令牌,并将它们传送给内容提供者115。内容提供者115可以选择所提供的多个否定检索令牌中的至少一个,并将该指示传送给预测请求检索器130。
预测请求检索器130可以从数据库120中检索多个预测请求。在一些实施方式中,预测请求检索器130可以基于所述多个检索令牌中的每一个检索所述多个预测请求。例如,第一检索令牌可以对应于数据库120中存储所述多个预测请求中的一些或全部的位置。在一些实施方式中,预测请求检索器130可以访问数据库120来检索所述多个预测请求,而不使用第一检索令牌。数据库120可以预先填充有与所述多个检索令牌中的每一个相关联的预测请求的列表。预测请求检索器130可以聚合来自检索令牌中的每一个的预测请求,以创建多个预测请求。每个预测请求可以包括信息资源被预测为基于数据库120中的历史内容项信息来请求与特定检索令牌相关联的内容项的指示。例如,每个检索令牌可以与对要***到信息资源中的内容的特定请求相关联。在一些实施方式中,预测请求中的每一个可以包括相关联的内容评级值。该内容评级值可以对应于相关联的信息资源的评级(例如,G、PG、R、ESRB评级等)。基于数据库120中的历史数据,预测请求检索器130可以检索信息资源是否被期望请求与所述多个检索令牌中的每一个相关联的内容。预测请求检索器130可以检索对检索令牌的多个预测请求、以及与该请求相关联的信息资源中的每一个。例如,基于存储在数据库120中的过去的表现数据,可以创建数据结构,其中该数据结构指示哪些信息资源请求与所述多个检索令牌中的每一个相关联的内容。可以基于季节性数据和其他内容项信息推算过去的历史数据,以确定所述多个检索令牌中的每一个的预测请求值和预测请求信息资源(例如,有多少信息资源可以请求与检索令牌相关联的内容等)。
位串构造器135可以包括用于为与所述多个检索令牌中的每一个相关联的多个请求中的每一个来构造位串的应用、服务器、服务、守护进程、例程或其他可执行逻辑。在一些实施方式中,位串构造器135可以包括用于递增(increment)存储设备中的串的位值的硬件计数器电路。位串可以代表与所述多个检索令牌相关联的预测请求中的每一个的文档空间。预测请求中的每一个可以与信息资源相关联。位串构造器135可以对检索令牌接收器125接收到的所述多个检索令牌中的每一个进行操作。在一些实施方式中,位串构造器135可以顺序地(例如,一次一个)为多个检索令牌中的每一个构造位图。在一些实施方式中,位串构造器135可以并行地为所述多个检索令牌中的每一个构造位串(例如,位串中的一些或所有被同时构造等)。为了构造检索令牌的位串,位串构造器135可以分配存储位串的存储器区域。在一些实施方式中,存储器区域可以由数据处理***105的另一组件预先分配。对于检索令牌的位串中的每个位,位串构造器135可以分配索引,其中该索引对应于所述多个预测请求中的相应的一个。位串构造器135可以访问数据库120,以检索相应的检索令牌和由预测请求检索器130检索到的所述多个预测请求之间的关联的集合。所述多个预测请求中的每一个可以包括与该检索令牌的位串中的位置相对应的索引值。
位串构造器135可以分析从数据库120访问的关联中的每一个,以确定预测请求中每一个是否与检索令牌相关联。如果预测请求对应于预测请求,则位串构造器135可以将位串中与该预测请求的索引值相对应的位位置(bit position)设置为匹配值(matchvalue)。在一些实施方式中,该匹配值可以是二进制数(例如,零或一)。例如,如果该预测请求对应于该检索令牌,则匹配值可以被设置为“1”。如果该预测请求不与该检索令牌相关联,则位串构造器135可以将位串中与该预测请求的索引值相对应的位置设置为非匹配值(non-match value)。在一些实施方式中,该非匹配值可以是二进制数(例如,零或一)。例如,如果预测请求不对应于检索令牌,则位串构造器135可以将适当的位串位置设置为“0”。在一些实施方式中,二进制“0”可以是匹配值,二进制“1”可以是非匹配值。
为了可视化为检索令牌构造位串的过程,现在参考图2。所描绘的是示例性图示,以帮助理解每个预测请求210A-N如何能够被用于基于与检索令牌205A的关联来填充位串215A。如图所示,检索令牌205A具有与预测请求210A、预测请求210C和预测请求210N的关联。圆点被添加以说明任何数量的预测请求可以被用于构造任何大小的位串。注意,检索令牌205A不与预测请求210B相关联(或者与预测请求否定关联(negatively associated))。基于关联和非关联中的每一个,位串的每个位置被填充以对应于特定的预测请求。例如,位串中对应于预测请求210A、预测请求210C和预测请求210N的位置都被设置为“1”,其中“1”在该示例中为匹配值。因为预测请求210B不与检索令牌205A相关联,所以它在位串215A中的对应位置被设置为非匹配值,其中该非匹配值在该示例中是二进制“0”。尽管这里示出的仅是从关联到单个检索令牌的位串的转换的一个示例,但是应当理解,位串构造器135可以为由预测请求检索器130检索到的所述多个预测请求中的每一个构造位串。在许多实施方式中,构造的位串可以是基本稀疏的(例如,具有超过2:1、5:1、10:1、100:1、或者任何其他这样的值的0对1的比率;和/或具有被位串内的多个否定数据指示符(例如,0)平均分隔得很开的肯定数据指示符(例如,1)。例如,在一些实施方式中,位串可以具有数千或数万个位置,并且只有散布在位串中的一百个或更少的肯定值。由于数据的稀疏性导致穷举和低效的强力处理,这样的位串可能很难迭代处理。
返回参考图1,应该理解,位串构造器135可以创建具有二进制位串的替代格式的位串。例如,在一些实施方式中,由预测请求检索器130检索到的预测请求中的每一个可以包括相应的权重值。权重值可以对应于预测请求与相应的检索令牌关联得多密切。在一些实施方式中,位串构造器可以用与检索令牌的相应预测请求相对应的权重值来填充位串的每个位置。在一些实施方式中,权重值可以与对应的预测请求的估计流量值相对应。
在一些实施方式中,通过将阈值应用于与预测请求中的每一个相关联的权重值来创建经修剪的多个预测请求,位串构造器135可以构造位串。经修剪的多个预测请求可以用于构造如上所述的位串。例如,某些预测请求可以指示高流量水平(例如,预测请求可以源自具有许多用户的网页)。指示高流量水平的预测请求可以比指示低流量水平的预测请求对内容提供者115更相关。因此,位串构造器可以移除具有小于预定流量阈值的估计流量权重值的某些预测请求。在一些实施方式中,位串构造器135可以访问数据库120来检索预定流量阈值。在一些实施方式中,位串构造器135可以从内容提供者115接收预定流量阈值。位串构造器135可以将被包括在所述多个预测请求的每一个中的估计流量值中的每一个与预定流量阈值进行比较,以确定是否从所述多个预测请求中移除预测请求。在一些实施方式中,如果被包括在预测请求中的估计流量值小于预定流量阈值,则可以从所述多个预测请求中移除该预测请求。如果被包括在预测请求中的估计流量值大于或等于预定流量阈值,则该预测请求可以被包括在所述多个预测请求中。位串构造器135可以迭代地将被包括在所述多个预测请求的每一个中的估计流量值与预定流量阈值进行比较,以创建经修剪的多个预测请求。
为了改进***的计算性能,位串构造器135可以对位串执行压缩操作,以减少存储空间并减少数据处理***105的其他模块所需的计算量,其中这些其它模块在进一步的操作中使用该位串。为了压缩位串,位串构造器135可以基于选择标准选择每个位串的某些位,并且使用所选择的位中的每一个来构造对应于与该位串相关联的检索令牌的修剪位串。例如,位串构造器135可以选择每个位串中特定范围的位置(例如,每个位串的前一百个位置)来创建相应的修剪位串。修剪位串可以比完整的位串具有更少的位置。在一些实施方式中,可以从数据库120中检索选择标准,或者从内容提供者115接收该选择标准。在一些实施方式中,位串构造器135可以使用伪随机选择作为选择标准。位串构造器135可以对与检索令牌接收器125接收到的检索令牌中的每一个相对应的位串中的每一个使用相同的选择标准(例如,相同的伪随机选择位置)。以这种方式,因为修剪位串中的每一个的位置对应于同一组预测请求,所以可以以相同的方式如下文所述比较每个修剪位串。
在一些实施方式中,位串构造器135可以通过为检索令牌中的每一个或检索令牌的组合构造布隆过滤器(bloom filter)来创建修剪位串。例如,位串构造器135可以分配存储器区域来存储对应于检索令牌的位串。基于与预测请求检索器130检索到的检索令牌相关联的预测请求,位串比较模块可以使用一个或多个散列算法(例如,SHA-1、SHA-2、MD5等),其中所述一个或多个散列算法中的每一个可以将预测请求映射到位串中的位置。位串构造器135可以使用散列算法中的每一个来散列(hash)与检索令牌相关联的每个预测请求,以创建一组位位置值。位串构造器135可以将位串中与该组位位置值中的每个位位置值相对应的位置中的每一个设置为匹配值(例如,二进制“1”)。在一些实施方式中,所分配的位串中的位串位置的数量可以小于所有检索令牌的预测请求的总数,从而减少每个检索令牌的位串的存储器占用。在一些实施方式中,位串构造器135可以使用散列算法来构造位串,使得如果相似的预测请求被用于生成布隆过滤器,则得到的位串将具有被设置为匹配值的相似的位位置。
在一些实施方式中,通过使用计数最小草图(count min-sketch)算法来为每个检索令牌生成整数值的向量,位串构造器135可以创建修剪位串。修剪位串可以包括整数值的向量,其中向量的每个位置可以是散列值的概率计数。为了创建修剪位串,位串构造器135可以为向量分配存储器区域,其中该向量被初始化为零。在一些实施方式中,该向量中的位置的数量可以小于所有检索令牌的预测请求的总数。位串构造器135可以散列对检索令牌的预测请求中的每一个,以生成散列预测请求集合。在生成散列预测请求时,位串构造器135可以递增修剪位串向量中的每个位置,其中该位置对应于相应的散列预测请求。例如,如果散列预测请求等于三,则位串构造函数可以将向量的第三个位置递增一。在一些实施方式中,位串构造器135可以为检索令牌创建多个向量,每个向量对应于散列函数。在多个向量的情况下,位串构造器135可以递增对应于散列预测请求的每个向量的每个位置,其中使用该向量的相应散列函数来计算散列预测请求。
位串构造器135可以在数据库120中存储为所述多个检索令牌中的每一个构造的位串。在一些实施方式中,位串构造器135可以将每个位串存储在由对应的检索令牌的标识符索引的数据结构中。在一些实施方式中,所存储的位串可以由数据处理***105的其他模块(例如位串比较模块140)访问。在一些实施方式中,由位串构造器135构造的位串可以被存储在计算机存储器(例如下面结合图7描述的计算机***700的存储器725)中。在一些实施方式中,位串比较模块140可以访问数据库120以检索用于进一步的计算的一个或多个位串。在一些实施方式中,位串构造器135可以存储修剪位串来代替完整的位串,这可以降低***的存储要求,而不会降低本文中描述的计算的准确性。
位串比较模块140可以检索存储在计算机存储器(例如,数据库120)中的位串中的每一个,以用于与和所述多个检索令牌中的第一检索令牌相关联的位串进行比较。如上所述,第一检索令牌可以是最高否定检索令牌。在一些实施方式中,位串比较模块140可以接收对一个或多个指示的检索令牌的指示。例如,位串比较模块140可以从内容提供者115、从数据库120、从数据处理***105的另一模块或者从另一外部计算设备接收该指示。基于该指示,位串比较模块140可以访问数据库120以检索与该指示相关联的位串。允许位串比较模块140检索指示的位串可以提供计算改进,同时仅分析相关的检索令牌。在一些实施方式中,位串构造器135可以将检索到的位串存储在本地存储器计算机存储器中,例如结合图7在本文描述的存储器725。在一些实施方式中,位串比较模块140可以从位串构造器135检索位串。
为了确定所述多个检索令牌中的哪些与第一检索令牌密切相关(例如,与相似的预测请求相关联),位串比较模块140可以将检索到的位串中的每一个与对应于第一检索令牌(例如,最高否定检索令牌等)的位串,通常称为第一位串,进行比较。在一些实施方式中,位串比较模块140可以迭代地将检索到的位串中的每一个与第一位串进行比较,以确定检索到的位串中的每一个的相似性值。该相似性值可以代表检索到的位串中的每一个与第一位串共有的预测请求的数量。相似性值可以是0和1之间的小数值(decimal value),例如,共享相似的预测请求的两个位串可以具有接近或等于1的相似性值,并且不共享相似的预测请求的两个位串可以具有接近或等于0的相似性值。在一些实施方式中,相似性值可以是对应于两个位串共享的预测请求的数量的整数值。在一些实施方式中,位串比较模块140可以确定多于两个位串的组的相似性值。
计算相似性值可以基于一个或多个逻辑运算或计算。例如,位串比较模块140可以使用逻辑与(AND)运算对两个位串进行操作,以确定在两个位串之间共享哪些预测请求。对两个位串执行逻辑与运算可以屏蔽两个位串不共有的位。因为位串的每个位置可以对应于预测请求,所以在得到的与(AND)位串中剩余的匹配值可以指示预测请求与对应于比较位串的检索令牌相关联。在一些实施方式中,位串比较模块可以对多于两个的位串执行逻辑逐位运算,以计算共享的相似性值。位串比较模块140可以从两个或更多个位串之间的逐位逻辑运算中计算结果位串。该结果位串中的每个位置可以指示对应的预测请求在两个或更多个检索令牌之间共享。为了确定在两个或更多个位串之间共享的预测请求的数量,位串比较模块140可以计算结果位串中匹配值的总数。位串比较模块140可以迭代地比较结果位图中的每个位置,并且每当结果位串中的位置等于匹配值时递增计数器寄存器。一旦位串比较模块迭代了结果位串中的每个位置,计数器寄存器的值就可以等于用于计算结果位串的检索令牌之间的共享预测请求的总数。
为了可视化由位串比较模块140执行的过程中的至少一些,现在参考图3。图3中示出了第一位串215A和第二位串215B。第一位串和第二位串中的每一个分别对应于第一检索令牌和第二检索令牌。在此示例性图示中,匹配值等于二进制一。因此,在每个二进制值为“1”的位串中的每个位置指示对应的预测请求与其相应的检索令牌相关联(例如,可能请求与该检索令牌相关联的内容的信息资源等)。因为匹配值是二进制“1”,并且非匹配值是二进制“0”,所以位串比较模块140可以在第一位串215A和第二位串215B之间执行逐位逻辑与,以确定结果位串305。如图所示,执行逐位逻辑与运算可以仅保留与在第一位串215A和第二位串215B之间共享的预测请求相对应的位。在计算结果位串305之后,位串比较模块140可以确定相似性值310。在一些实施方式中,位串比较模块可以迭代地确定结果位串305中等于匹配值的位置的数量。结果位串305中的位置总数可以等于相似性值310。在一些实施方式中,位串比较模块可以将结果位串305中匹配位置的数量除以位置总数。
返回参考图1,位串比较模块140可以使用其他方法来确定两个位串之间的相似性值。在一些实施方式中,第一位串和第二位串中的每个位置可以等于权重值,其中该权重值可以与对应于位串中相应位置的对应的检索令牌和预测请求之间的相关性值相对应。在这种情况下,位串可以是权重值的向量,其中该权重值可以是整数值或浮点值。为了确定两个这样的位串之间的相似性值,位串比较模块140可以确定在容差值(例如,10%、15%等)内第一位串的每个位置中的相关性值是否等于第二位串的每个相应位置。在一些实施方式中,可以从数据库120中检索该容差值,从内容提供者115接收该容差值,从数据处理***105的另一模块接收该容差值,或者经由网络110从另一外部计算设备接收该容差值。如果两个值在预定容差值内相等,则位串比较模块可以将结果位串(例如,结果位串305)的对应位置设置为匹配值。位串比较模块140可以迭代地比较第一位串和第二位串中的每个位置,以确定完整的结果位串。然后,位串比较模块140可以迭代地对存在于结果位串中的匹配值的数量进行计数,以如上所述确定相似性值,从而确定相似性值。位串比较模块140可以将相似性值与第一位串或第二位串中的至少一个相关联。在一些实施方式中,位串比较模块140可以将相似性值存储在例如数据库120或另一计算机存储器(例如,下面结合图7描述的存储器725)中的数据结构中,其中该数据结构具有第一位串、第二位串、第一检索令牌或第二检索令牌中的至少一个。
检索令牌修剪器145可以将位串比较模块140计算的相似性值中的每一个与预定的相似性阈值进行比较,以确定是否应该从所述多个检索令牌中移除对应的检索令牌。在一些实施方式中,检索令牌修剪器145可以通过访问数据库120来检索预定的相似性阈值。在一些实施方式中,检索令牌修剪器145可以从内容提供者115接收预定的相似性阈值。检索令牌修剪器145可以迭代地比较由位串比较模块140计算的与检索令牌接收器125接收到的检索令牌中的每一个相关联的相似性值中每一个,以确定修剪值(prune value)。修剪值可以是布尔(Boolean)寄存器值,可以取二进制“0”或二进制“1”的值。在一些实施方式中,检索令牌修剪器145可以确定相应的检索令牌的相似性值是否大于预定的相似性阈值。如果该相似性值大于预定的阈值,则检索令牌修剪器145可以将修剪值(例如,二进制值“1”)与相应的检索令牌相关联。例如,检索令牌修剪器145可以将修剪值存储在数据结构(例如,在下面结合图7描述的数据库120或计算机存储器725中的)中,其中该数据结构包括对应的检索令牌或该检索令牌的标识符。如果相似性值小于预定的相似性阈值,则通过将非修剪值(non-prune value)存储在数据结构(例如,在下面结合图7描述的数据库120或计算机存储器725中的)中,检索令牌修剪器145可以将非修剪值(例如,二进制值“0”等)与相应的检索令牌相关联,其中该数据结构包括对应的检索令牌或对应的检索令牌的标识符。在一些实施方式中,检索令牌修剪器145可以自动将第一检索令牌(例如,最高否定检索令牌)与修剪值“1”相关联。
基于该修剪值,检索令牌修剪器145可以从所述多个检索令牌中移除指定的检索令牌中的每一个。在一些实施方式中,即使所述多个检索令牌中没有一个与该修剪值相关联,检索令牌修剪器145也可以从所述多个检索令牌中移除第一检索令牌(例如,最高否定检索令牌)。检索令牌修剪器可以访问包含修剪值或非修剪值以及对应的检索令牌或对应的检索令牌的标识符的数据结构。如果数据结构包括该修剪值,则检索令牌修剪器可以从包括所述多个检索令牌中的每一个的数据结构中移除相应的检索令牌,从而创建经修剪的检索令牌的数据结构。在一些实施方式中,检索令牌修剪器145可以创建数据结构来包含经修剪的检索令牌。检索令牌修剪器145可以迭代地确定每个检索令牌是否与非修剪值相关联。如果检索令牌与非修剪值相关联,则检索令牌修剪器145可以将对应的检索令牌添加到被创建以包含经修剪的检索令牌的数据结构中。如果检索令牌相反与修剪值相关联,则检索令牌修剪器145可以忽略对应的检索令牌,并且不将其添加到被创建以包含经修剪的检索令牌的数据结构中。在一些实施方式中,检索令牌修剪器145可以创建指示哪些检索令牌不存在于经修剪的检索令牌的数据结构中的值的列表,以维护从所述多个检索令牌中移除了哪些检索令牌的记录。
修剪令牌提供者150可以经由网络110向内容提供者115提供包括经修剪的多个检索令牌的数据结构。在一些实施方式中,修剪令牌提供者150可以访问数据库120来检索经修剪的多个检索令牌中的每一个的相关性值。在一些实施方式中,该相关性值可以是与对应的检索令牌相关联的预测请求中的每一个的估计流量值的总和。在一些实施方式中,修剪令牌提供者150可以将包括经修剪的多个检索令牌的数据结构存储在数据库120中,其中数据库120由与检索令牌接收器125从内容提供者115接收到的请求相对应的值来索引。内容提供者115可以从修剪令牌提供者150请求包含经修剪的检索令牌的数据结构。响应于该请求,修剪令牌提供者150可以经由网络访问数据库120并将所请求的数据结构传送给内容提供者115。在一些实施方式中,当包括经修剪的检索令牌的数据结构被创建时(例如,在由检索令牌修剪器145创建和填充之后),修剪令牌提供者150可以将包括经修剪的检索令牌的数据结构传送给内容提供者115。除了提供经修剪的检索令牌之外,修剪令牌提供者150还可以提供被从由检索令牌接收器125接收到的多个检索令牌中移除的检索令牌中的每一个的指示。
现在参考图4,示出了基于选择标准从检索令牌集合中修剪检索令牌的示例方法400的流程图。方法400可以由数据处理***105、结合图7在本文描述的计算机***700或本文中描述的任何其他计算设备来执行或以其他方式执行。数据处理***可以接收多个检索令牌(402)。数据处理***可以检索对第一检索令牌的指示(404)。数据处理***可以检索多个预测请求(406)。数据处理***可以选择第i个检索令牌(407)。数据处理***可以构造对应于第i个检索令牌的位串(408)。数据处理***可以确定计数器寄存器是否等于检索令牌的数量n(410)。数据处理***可以将计数器寄存器递增i(412)。数据处理***可以从所述多个检索令牌中选择和修剪检索令牌(416)。数据处理***可以提供经修剪的检索令牌(416)。
数据处理***(例如,数据处理***105)可以接收多个检索令牌(402)。在一些实施方式中,数据处理***可以经由网络(例如,网络110)从内容提供者(例如,内容提供者115)接收多个检索令牌。检索令牌可以包括以下中的一个或多个:人口统计信息、内容评级、内容主题、关键词、短语、或与信息资源相关的其他信息。接收所述多个检索令牌可以包括移除与可能影响由内容提供者提供的内容项的性能的预测请求相关联的检索令牌的请求。在一些实施方式中,接收所述多个检索令牌可以包括接收检索令牌的总数n。在一些实施方式中,数据处理***可以在接收到所述多个检索令牌之后确定检索令牌的总数n。在一些实施方式中,数据处理***可以从计算机存储器(例如,数据库120、结合图7在下文中描述的存储器725等)中检索多个检索令牌。数据处理***还可以从内容提供者接收附加的配置信息(诸如每个检索令牌的内容评级信息、估计的流量阈值、相似性阈值以及本文中描述的其他值)以及所述多个检索令牌。
数据处理***可以检索对所述多个检索令牌中的第一检索令牌的指示(404)。该指示可以包括关于检索令牌的信息,诸如标识符或可以允许数据处理***从所述多个检索令牌中访问第一检索令牌的其他数据。例如,所述多个检索令牌可以存储在计算机存储器(例如,数据库120或结合图7在下文中描述的存储器725等)中的数据结构中。该指示可以是允许数据处理***访问包括第一检索令牌的数据结构的位置的索引值。在一些实施方式中,该指示可以包括检索令牌质量信息。例如,第一检索令牌可以是最高否定检索令牌,如上所述,这意味着它与最大数量的预测请求否定关联。在一些实施方式中,该指示可以从内容提供者计算设备接收,或者经由网络(例如,网络110)从另一外部计算设备接收。在一些实施方式中,检索该指示可以包括检索多于检索令牌的指示。在这样的实施方式中,本文中描述的方法400的每个步骤可以使用所指示的检索令牌中的每一个来执行。
数据处理***可以检索多个预测请求(406)。从内容提供者接收到的检索令牌中的每一个可以与一个或多个预测请求相关联。预测请求可以是基于从计算机存储器检索到的历史数据,其中该历史数据可以指示信息资源已经请求了与对应的检索令牌相关联的内容。每个预测请求可以是基于季节性数据(例如,时间段、人口统计信息等)。在一些实施方式中,例如,如果信息资源包含一个或多个关键词或短语、相关图像、相关视频或相关元数据等,则预测请求可以是基于信息资源。包含被包括在检索令牌中的信息的信息资源可以指示该信息资源可以请求与该检索令牌相关联的内容,使其成为基于其他因素的预测请求的候选。在一些实施方式中,例如,如果信息资源从与被包括在检索令牌中的人口统计信息相关联的用户接收到常规(例如,基于历史数据)查看,则预测请求可以是基于人口统计信息。
数据处理***可以选择第i个检索令牌(407)。为了确定所述多个检索令牌中的检索令牌将被移除,可以为检索令牌中的每一个构造位串。位串可以表示所述多个预测请求中的每一个与该检索令牌相关联,并且所述多个预测请求中的哪些不与检索令牌相关联。在一些实施方式中,数据处理***可以基于计数器寄存器i迭代地循环通过检索令牌中的每一个。检索令牌中的每一个可以在数据结构中通过索引值(例如,索引0、索引1、索引2等)来被索引。为了处理检索令牌,数据处理***可以选择包括等于计数器寄存器i的索引值的检索令牌。如果这是循环的第一次迭代,在选择第i个检索令牌之前,计数器寄存器i可以被初始化为初始化值(例如,i=0)。选择检索令牌可以包括将与检索令牌相关联的数据复制到计算机存储器的不同区域,例如存储器的工作区域。
数据处理***可以构造对应于第i个检索令牌的位串(408)。构造位串可以包括执行结合图5在下文中描述的方法408的操作。在一些实施方式中,数据处理***可以从计算机存储器(例如,数据库120、结合图7在下文中描述的存储器725等)中检索位串。在一些实施方式中,数据处理***可以经由网络110从内容提供者或另一外部计算设备接收位串。
数据处理***可以确定计数器寄存器是否等于检索令牌的数量n(410)。为了确定数据处理***是否已经为从内容提供者接收到的检索令牌中的每一个生成了位串,数据处理***可以将用于选择每个检索令牌的计数器寄存器与检索令牌的总数n进行比较。如果计数器寄存器i不等于(例如,小于)检索令牌的总数n,则数据处理***可以执行步骤(412)。如果计数器寄存器i等于(例如,等于或大于)检索令牌的总数n,则数据处理***可以执行步骤(414)。
数据处理***可以递增计数器寄存器i(412)。在一些实施方式中,数据处理***可以向寄存器i加一,以指示所述多个检索令牌中的下一个未处理的检索令牌。在一些实施方式中,数据处理***可以将计数器寄存器i设置为下一个未处理的检索令牌的存储器地址值(例如,在计算机存储器中的位置)。在一些实施方式中,下一个未处理的检索令牌的存储器地址值可以被包括在当前(例如,所选择的)检索令牌的位置处的数据结构中。在递增计数器寄存器i的值之后,数据处理***可以执行方法400的步骤(407)。
数据处理***可以从所述多个检索令牌中选择和修剪检索令牌(416)。从所述多个检索令牌中选择和修剪令牌可以包括执行结合图6在下文中描述的方法414的操作。在一些实施方式中,数据处理***可以接收对要从所述多个检索令牌中选择和修剪的每个检索令牌的指示。在一些实施方式中,数据处理***可以通过访问数据库或计算机存储器(例如,数据库120或结合图7在本文描述的存储器725)并从数据结构中检索对选择和移除检索令牌的指示来接收该指示。在一些实施方式中,数据处理***可以经由网络(例如,网络110)从内容提供者或另一外部计算设备接收选择和修剪检索令牌的指示。
数据处理***可以提供经修剪的检索令牌(416)。在一些实施方式中,经修剪的检索令牌可以被聚合到存储在计算机存储器中的数据结构中。该数据结构可以访问存储在计算机存储器中的经修剪的检索令牌,并经由网络将该数据结构发送到内容提供者。在一些实施方式中,数据处理***可以发送对从步骤(402)中接收到的所述多个检索令牌中移除的检索令牌中的每一个的指示。在一些实施方式中,基于与和相应的多个检索令牌相关联的每个预测请求相对应的估计流量值,数据处理***可以提供所述多个检索令牌中的每个检索令牌的估计流量值(例如,基于过去的表现的预期查看、信息资源的访问者数量等)。
现在参考图5,示出了为检索令牌生成位串的示例方法408。方法408可以作为以上结合图4在本文中描述的方法400的步骤(408)的一部分来执行。方法408可以例如由数据处理***105、结合图7在本文描述的计算机***700或本文描述的任何其他计算设备来执行。数据处理***可以选择第k个预测请求(502)。数据处理***可以确定该预测请求是否对应于该检索令牌(504)。数据处理***可以将第k个位串位置设置为非匹配值(506)。数据处理***可以将第k个位串位置设置为匹配值(508)。数据处理***可以确定计数器寄存器k是否等于预测请求的数量m(510)。数据处理***可以递增计数器寄存器k(512)。数据处理***可以对位串应用压缩(514)。
数据处理***可以选择第k个预测请求(502)。为了为相应的检索令牌构造位串,数据处理***必须迭代结合图4在本文描述的步骤(406)中检索到的所述多个预测请求中的每一个。位串可以表示所述多个预测请求中的哪些与检索令牌相关联、以及所述多个预测请求中的哪些不与检索令牌相关联。在一些实施方式中,数据处理***可以基于计数器寄存器k迭代地循环通过所述多个预测请求中的每一个。所述多个预测请求中的每一个可以在数据结构中通过索引值(例如,索引0、索引1、索引2等)来索引。为了处理预测请求,数据处理***可以选择包括等于计数器寄存器k的索引值的预测请求。如果是循环的第一次迭代,则在选择第k个预测请求之前,计数器寄存器k可以被初始化为初始化值(例如k=0)。选择预测请求可以包括将与预测请求相关联的数据复制到计算机存储器的不同区域,例如存储器的工作区域。
数据处理***可以确定预测请求是否对应于检索令牌(504)。为了确定预测请求的关联,数据处理***可以访问计算机存储器的包括关于所述多个预测请求的每一个的关联的信息的区域。数据处理***可以从数据库(例如,数据库120)中检索预测请求的关联中的每一个。在一些实施方式中,数据库可以包括由每个检索令牌索引的查找表。数据处理***可以使用检索令牌作为键值来访问数据库,并且检索对应于检索令牌的相关联的预测请求的列表。如果所选择的预测请求被包括在相关联的预测请求的列表中,则数据处理***可以执行步骤(508)。如果所选择的预测请求不被包括在相关联的预测请求的列表中,则数据处理***可以执行步骤(506)。
数据处理***可以将第k个位串位置设置为非匹配值(506)。在一些实施方式中,数据处理***可以访问表示与检索令牌相关联的位串的存储器区域。该位串可以驻留在计算机存储器(例如,数据库120或结合图7在本文描述的存储器725)中的数据结构中。在一些实施方式中,设置非匹配值可以包括将对应于计数器寄存器k的位位置设置为二进制值(例如“,0”或“1”)。例如,如果非匹配值被确定为“1”,则数据处理***可以将对应于检索令牌的位串的第k个位位置设置为“1”。如果非匹配值被确定为“0”,则数据处理***可以将对应于检索令牌的位串的第k个位位置设置为“0”。在一些实施方式中,非匹配值可以是指示预测请求不与检索令牌相关联的另一种类型的值。
数据处理***可以将第k个位串位置设置为匹配值(508)。在一些实施方式中,数据处理***可以访问表示与检索令牌相关联的位串的存储器区域。该位串可以驻留在计算机存储器(例如,数据库120或结合图7在本文描述的存储器725)中的数据结构中。在一些实施方式中,设置匹配值可以包括将对应于计数器寄存器k的位位置设置为二进制值(例如,“0”或“1”)。例如,如果匹配值被确定为“1”,则数据处理***可以将对应于检索令牌的位串的第k个位位置设置为“1”。如果匹配值被确定为“0”,则数据处理***可以将对应于检索令牌的位串的第k个位位置设置为“0”。在一些实施方式中,匹配值可以是大于1的值,例如与预测请求相关联的估计流量值。
数据处理***可以确定计数器寄存器k是否等于预测请求的数量m(510)。为了确定数据处理***是否已经在每个预测请求的位串中设置了匹配值或非匹配值,数据处理***可以将用于选择每个预测请求的计数器寄存器k与预测请求的总数m进行比较。如果计数器寄存器k不等于(例如,小于)预测请求的总数m,则数据处理***可以执行步骤(512)。如果计数器寄存器k等于(例如,等于或大于)预测请求的总数m,则数据处理***可以执行步骤(514)。
数据处理***可以递增计数器寄存器k(512)。在一些实施方式中,数据处理***可以向寄存器k添加一,以指示所述多个预测请求中的下一个未处理的预测请求。在一些实施方式中,数据处理***可以将计数器寄存器k设置为下一个未处理的预测请求的存储器地址值(例如,在计算机存储器中的位置)。在一些实施方式中,下一个未处理的预测请求的存储器地址值可以被包括在当前(例如,所选择的)预测请求的位置处的数据结构中。在递增计数器寄存器k的值之后,数据处理***可以执行方法406的步骤(502)。
数据处理***可以对位串应用压缩(514)。在一些实施方式中,为了减少处理每个检索令牌的每个位串的存储要求和计算负担,数据处理***可以基于选择标准来选择位串的某些部分,以创建修剪位串。在一些实施方式中,修剪位串可以小于未压缩的位串。在一些实施方式中,选择标准可以基于伪随机选择。例如,数据处理***可以基于所述多个预测请求伪随机地确定要从为检索令牌创建的位串中选择的多个位位置。在一些实施方式中,数据处理***可以将所选择的位置从位串***修剪位串中。例如,数据处理***可以选择位串的前一百个(例如,位置0到位置99)来创建修剪位串。在一些实施方式中,通过以上结合图4在本文描述的方法400的步骤、以及结合图6在下文描述的方法414的步骤,修剪位串可以代替位串用于进一步处理。
现在参考图6,示出了基于位串修剪检索令牌的示例方法414。方法414可以作为以上结合图4在本文描述的方法400的步骤(414)的一部分来执行。方法414可以例如由数据处理***105、结合图7在本文描述的计算机***700或本文描述的任何其他计算设备来执行。数据处理***可以选择指示的位串(602)。数据处理***可以选择第j个位串(604)。数据处理***可以计算指示的位串和选择的位串之间的相似性值(606)。数据处理***可以确定相似性值是否大于阈值(608)。数据处理***可以移除对应于第j个位串的检索令牌(610)。数据处理***可以确定计数器寄存器j是否等于位串的数量p(612)。数据处理***可以递增计数器寄存器j(614)。数据处理***可以聚合经修剪的令牌(616)。
数据处理***可以选择指示的位串(602)。指示的位串可以与以上结合图4在本文描述的方法400的步骤(404)中指示的第一检索令牌(例如,最高否定检索令牌)相关联。在一些实施方式中,数据处理***可以访问包含位串的数据结构,并且基于被包括在第一检索令牌中的索引值来选择指示的位串。在一些实施方式中,包括位串的数据结构可以由每个相关联的检索令牌来索引,因此可以使用第一检索令牌作为索引值来选择指示的位串。选择指示的位串可以包括将指示的位串复制到存储器的不同区域(例如,数据处理***上的工作存储器)。在一些实施方式中,数据处理***可以访问数据库(例如,数据库120)来选择指示的位串。
数据处理***可以选择第j个位串(604)。为了确定是否可以从多个检索令牌中移除检索令牌,数据处理***必须迭代与以上结合图4描述的步骤(402)中接收到的每个检索令牌相关联的所述多个位串中的每一个。位串可以表示所述多个预测请求中的哪些与检索令牌相关联、以及所述多个预测请求中的哪些不与检索令牌相关联。在一些实施方式中,数据处理***可以基于计数器寄存器j迭代地循环通过位串中的每一个。位串中的每一个可以在数据结构中通过索引值(例如,索引0、索引1、索引2等)来索引。为了处理位串,数据处理***可以选择包括等于计数器寄存器j的索引值的位串。如果是循环的第一次迭代,在选择第j个预测请求之前,计数器寄存器j可以被初始化为初始化值(例如,k=0)。选择预测请求可以包括将与预测请求相关联的数据复制到计算机存储器的不同区域,例如存储器的工作区域。在一些实施方式中,如果第j个位串与指示的位串相同,则数据处理***可以如下面结合步骤(614)所述递增计数器寄存器j。如果递增计数器寄存器导致j的值等于或大于位串的总数p,则数据处理***可以执行下面描述的步骤(616)。
数据处理***可以计算指示的位串和选择的位串之间的相似性值(606)。计算相似性值可以包括对指示的位串和选择的位串执行逐位逻辑运算。例如,数据处理***可以使用选择的位串和指示的位串作为操作数来执行逻辑与运算,以生成结果位串。结果位串可以包括对与第一检索令牌和对应于所选择的位串的检索令牌相关联的预测请求中的每一个的指示。数据处理***可以通过计算结果位串中包含匹配值的位置的数量来计算指示的位串和选择的位串之间的相似性值。在一些实施方式中,第一位串和第二位串中的每个位置可以等于权重值,其中该权重值可以等于相关性值。相关性值可以指示对应的检索令牌和与位串中相应位置的预测请求相关联的信息资源之间的相关性度量。在这种情况下,位串可以是权重值的向量,其中该权重值可以是整数值或浮点值。为了确定两个这样的位串之间的相似性值,位串比较模块140可以确定在容差值(例如,10%、15%等)内第一位串的每个位置中的相关性值是否等于的第二位串的每个相应位置。在一些实施方式中,容差值可以从数据库(例如,数据库120)检索,从内容提供者接收,或者从另一外部计算设备接收。如果两个值在预定容差值内相等,则位串比较模块可以将结果位串(例如,结果位串305)的对应位置设置为匹配值。位串比较模块140可以如上面详细描述的迭代地比较第一位串和第二位串中的位置中的每一个以确定完整的结果位串,并且使用该结果位串计算相似性值。
数据处理***可以确定相似性值是否大于相似性阈值(608)。数据处理***可以从内容提供者(例如,内容提供者115)接收相似性阈值。在一些实施方式中,数据处理***可以访问数据库(例如,数据库120)来检索相似性阈值。如果数据处理***确定与所选择的位串相关联的相似性值大于或等于相似性阈值,则数据处理***可以执行方法414的步骤(610)。如果数据处理***确定与所选择的位串相关联的相似性值小于相似性阈值,则数据处理***可以执行方法414的步骤(612)。
数据处理***可以移除对应于第j个位串的检索令牌(610)。基于与指示的位串的相似性,数据处理***可以通过访问包括p个位串中的每一个的数据结构来移除对应于第j个位串的检索令牌。数据处理***可以从包括所述多个检索令牌的数据结构中删除对应于第j个位串的条目。例如,如果数据结构被配置为链表,则数据处理***可以将前一个节点(例如,j-1)的指针从第j个节点的地址改变为第j个节点所指向的节点的地址。数据处理***可以使用其他数据结构来存储所述多个检索令牌。在一些实施方式中,数据处理***可以在包括第j个位串的数据结构的条目中存储移除标识符。移除标识符可以指示该令牌不应该被聚合到经修剪的检索令牌集合中。
数据处理***可以确定计数器寄存器j是否等于位串的数量p(612)。为了确定数据处理***是否已经将每个位串与指示的位串进行了比较,数据处理***可以将用于选择每个位串的计数器寄存器j与位串的总数p进行比较。如果计数器寄存器j不等于(例如,小于)位串的总数p,则数据处理***可以执行步骤(614)。如果计数器寄存器j等于(例如,等于或大于)位串的总数p,则数据处理***可以执行步骤(616)。
数据处理***可以递增计数器寄存器j(614)。在一些实施方式中,数据处理***可以向寄存器j添加一,以指示所述多个位串中的下一个未处理的位串。在一些实施方式中,数据处理***可以将计数器寄存器j设置为下一个未处理的位串的存储器地址值(例如,在计算机存储器中的位置)。在一些实施方式中,下一个未处理的位串的存储器地址值可以被包括在当前(例如,所选择的)预测请求的位置处的数据结构中。在递增计数器寄存器j的值之后,数据处理***可以执行方法414的步骤(604)。
数据处理***可以聚合修剪令牌(616)。数据处理***可以分配存储器区域来存储在步骤(610)中在所述多个检索令牌中未被移除的检索令牌中的每一个。例如,如果原始的多个检索令牌包括五个检索令牌,并且在方法414的先前步骤中移除了两个,则数据处理***可以为包含三个检索令牌的数据结构分配存储区域。在一些实施方式中,数据处理***可以迭代地确定多个检索令牌中的哪些没有与移除标识符一起存储。数据处理***可以选择这些检索令牌中的每一个,并且将它们存储在为被创建以聚合经修剪的检索令牌的数据结构中。因此,数据处理***可以通过仅***所述多个检索令牌中没有用移除标识符标记的那些检索令牌来生成经修剪的检索令牌的数据结构。
图7示出了根据一些实施方式的说明性计算机***700的一般架构,该计算机***700可以用于实现本文中讨论的任何计算机***。计算机***700可以用于经由网络110提供信息以用于显示。图8的计算机***700包括通信耦合到存储器725的一个或多个处理器820、一个或多个通信接口805、一个或多个输出设备710(例如,一个或多个显示单元)和一个或多个输入设备815。处理器720可以被包括在数据处理***105或***700(诸如数据处理***105)的其他组件中。
在图7的计算机***700中,存储器725可以包括任何计算机可读存储介质,并且可以存储计算机指令(诸如用于实现本文中针对各个***描述的各种功能的处理器可执行指令)、以及由此生成的或经由通信接口或输入设备(如果存在)接收到的任何相关数据。再次参考图7的***700,数据处理***可以包括存储器725,以存储与用户标识符集合、生成的向量等相关的信息。图7中所示的处理器720可以用于执行存储在存储器725中的指令,并且在这样做时,还可以从存储器读取或向存储器写入根据指令的执行而处理和/或生成的各种信息。
图7所示的计算机***700的处理器720还可以通信地耦合到或控制通信接口705,以根据指令的执行来发送或接收各种信息。例如,通信接口705可以耦合到有线或无线网络、总线或其他通信装置,并且因此可以允许计算机***700向其他设备(例如,其他计算机***)发送信息或从其他设备接收信息。虽然在图7的***中没有明确示出,但是一个或多个通信接口有助于***700的组件之间的信息流。在一些实施方式中,通信接口可以被配置(例如,经由各种硬件组件或软件组件)以提供网站作为对计算机***700的至少一些方面的访问门户。通信接口805的示例包括用户接口(例如,网页),其中用户可以通过该用户接口与计算机***800通信。
例如,可以提供图7所示的计算机***700的输出设备710,以允许结合指令的执行来查看或感知各种信息。例如,可以提供(多个)输入设备715,以允许用户在指令执行期间进行手动调整、进行选择、输入数据或者以各种方式中的任何一种与处理器交互。本文中还提供了与可以用于本文中讨论的各种***的通用计算机***架构相关的附加信息。
本说明书中描述的主题和操作的实现可以在数字电子电路中实现,或者在体现在有形介质、固件或硬件上的计算机软件(包括本说明书中公开的结构及其结构等价物)中实现,或者在它们中的一个或多个的组合中实现。本说明书中描述的主题的实施方式可以被实现为一个或多个计算机程序(即,计算机程序指令的一个或多个组件),其中所述一个或多个计算机程序被编码在计算机存储介质上,以用于由数据处理设备执行,或者以控制数据处理设备的操作。该程序指令可以被编码在人工生成的传播信号(例如,机器生成的电、光或电磁信号)上,其中该人工生成的传播信号被生成来编码信息以传输到合适的接收器装置,以由数据处理装置执行。计算机存储介质可以作为或被包括在计算机可读存储设备、计算机可读存储基底、随机或串行存取存储器阵列或设备、或它们中的一个或多个的组合中。此外,虽然计算机存储介质不是传播信号,但是计算机存储介质可以包括编码在人工生成的传播信号中的计算机程序指令的源或目的地。计算机存储介质也可以作为或被包括在一个或多个单独的物理组件或介质(例如,多个CD、磁盘或其他存储设备)中。
本文中公开的特征可以在智能电视模块(或连接的电视模块、混合电视模块等)上实现,其中智能电视模块可以包括被配置为将互联网连接与更传统的电视节目源(例如,经由电缆、卫星、空中或其他信号接收的)相结合的处理模块。智能电视模块可以物理地结合到电视机中,或者可以包括单独的设备,诸如机顶盒、蓝光或其他数字媒体播放器、游戏控制台、酒店电视***和其他配套设备。智能电视模块可以被配置为允许观众搜索和查找网络上、本地有线TV(电视)频道上、卫星TV频道上或者存储在本地硬盘驱动器上的视频、电影、照片和其他内容。机顶盒(set-top box,STB)或机顶盒单元(set-top unit,STU)可以包括信息装置设备,该信息装置设备可以包含调谐器并连接到电视机和外部信号源,将信号转换成内容,其中该内容然后被显示在电视屏幕或其他显示设备上。智能电视模块可以被配置为提供主屏幕或顶层屏幕,其中该主屏幕或顶层屏幕包括多个不同应用的图标,诸如网络浏览器和多个流媒体服务、连接的电缆或卫星媒体源、其他网络“频道”等。智能电视模块还可以被配置为向用户提供电子节目指南。智能电视模块的配套应用可以在移动计算设备上操作来向用户提供关于可用节目的附加信息,以允许用户控制智能电视模块等。在替代实施方式中,该特征可以在膝上型计算机或其他个人计算机、智能电话、其他移动电话、手持计算机、平板电脑或其他计算设备上实现。
本说明书中描述的操作可以实现为由数据处理设备对存储在一个或多个计算机可读存储设备上或从其他源接收到的数据执行的操作。
术语“数据处理装置”、“数据处理***”、“用户设备”或“计算设备”包括用于处理数据的所有种类的装置、设备和机器,包括例如可编程处理器、计算机、片上***或前述的多个或组合。该装置可以包括专用逻辑电路,例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)。除了硬件之外,该装置还可以包括为所讨论的计算机程序创建执行环境的代码,例如,构成处理器固件、协议栈、数据库管理***、操作***、跨平台运行时环境、虚拟机或它们中的一个或多个的组合的代码。该装置和执行环境可以实现各种不同的计算模型基础设施,诸如网络服务、分布式计算和网格计算基础设施。
计算机程序(也称为程序、软件、软件应用、脚本或代码)可以以任何形式的编程语言(包括编译或解释语言、声明性或过程性语言,)编写,并且它可以以任何形式(包括作为独立程序或作为模块、组件、子例程、对象或适于在计算环境中使用的其他单元)部署。计算机程序可以(但不是必须)对应于文件***中的文件。程序可以存储在保存其他程序或数据的文件的一部分(例如,存储在标记语言文档中的一个或多个脚本)中,存储在专用于所讨论的程序的单个文件中,或者存储在多个协调文件(例如,存储一个或多个模块、子程序或部分代码的文件)中。计算机程序可以被部署为在一个计算机或位于一个站点或分布在多个站点并通过通信网络互连的多台计算机上执行。
本说明书中描述的过程和逻辑流程可以由执行一个或多个计算机程序的一个或多个可编程处理器来执行,以通过对输入数据进行操作并生成输出来执行动作。过程和逻辑流程也可以由专用逻辑电路来执行,并且设备也可以被实现为专用逻辑电路,例如,FPGA(现场可编程门阵列)或ASIC(专用集成电路)。
举例来说,适于执行计算机程序的处理器包括通用和专用微处理器、以及任何类型的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的元件包括用于根据指令执行动作的处理器和用于存储指令和数据的一个或多个存储设备。一般地,计算机还将包括用于存储数据的一个或多个大容量存储设备(例如,磁盘、磁光盘或光盘)或者可操作地耦合到所述一个或多个大容量存储设备,以从所述一个或多个大容量存储设备接收数据或向所述一个或多个大容量存储设备传送数据或者两者都包括。然而,计算机不必具有这样的设备。此外,计算机可以嵌入到另一设备(例如,移动电话、个人数字助理(personal digital assistant,PDA)、移动音频或视频播放器、游戏控制台、全球定位***(Global Positioning System,GPS)接收器或便携式存储设备(例如通用串行总线(universal serial bus,USB)闪存驱动器))中。适合于存储计算机程序指令和数据的设备包括所有形式的非易失性存储器、介质和存储器设备,例如包括半导体存储设备(例如,EPROM、EEPROM和闪存设备);磁盘(例如,内部硬盘或可移动磁盘);磁光盘;以及CD-ROM和DVD-ROM盘。处理器和存储器可以由专用逻辑电路补充或并入专用逻辑电路。
为了提供与用户的交互,本说明书中描述的主题的实施方式可以在计算机上实现,该计算机具有用于向用户显示信息的显示设备(例如,CRT(cathode ray tube,阴极射线管)、等离子体或LCD(liquid crystal display,液晶显示器)、以及用户可以通过其向计算机提供输入的键盘和定点设备(例如,鼠标或轨迹球)。也可以使用其他类型的设备来提供与用户的交互;例如,提供给用户的反馈可以包括任何形式的感觉反馈,例如,视觉反馈、听觉反馈或触觉反馈;并且来自用户的输入可以以任何形式接收,包括声音、语音或触觉输入。此外,计算机可以通过向用户使用的设备发送文档和从用户使用的设备接收文档来与用户交互;例如,通过响应于从网络浏览器接收到的请求,将网页发送到用户的客户端设备上的网络浏览器。
本说明书中描述的主题的实施方式可以在计算***中实现,该计算***包括后端组件(例如作为数据服务器),或者包括中间件组件(例如应用服务器),或者包括前端组件(例如,具有图形用户界面或网络浏览器的客户端计算机,其中用户可以通过该图形用户界面或网络浏览器与本说明书中描述的主题的实施方式进行交互),或者包括一个或多个这样的后端、中间件或前端组件的任何组合。***的组件可以通过任何形式或介质的数字数据通信(例如,通信网络)来互连。通信网络的示例包括局域网(“LAN”)和广域网(“WAN”)、互连网络(例如,互联网)和对等网络(例如,ad hoc对等网络)。
诸如数据处理***105的计算***可以包括客户端和服务器。例如,数据处理***105可以包括一个或多个数据中心或服务器群中的一个或多个服务器。客户端和服务器通常彼此远离,并且典型地通过通信网络进行交互。客户机和服务器的关系是由运行在各自计算机上的计算机程序产生的,并且彼此之间具有客户机-服务器关系。在一些实施方式中,服务器将数据(例如,HTML(超文本标记语言)页面)发送到客户端设备(例如,出于向与客户端设备交互的用户显示数据和从用户接收用户输入的目的)。可以在服务器处从客户端设备接收在客户端设备处生成的数据(例如,用户交互的结果)。
尽管本说明书包含许多具体的实现细节,但这些不应被解释为对任何发明的范围或可能要求保护的内容的限制,而是特定于本文中描述的***和方法的特定实施方式的特征的描述。本说明书中在单独实现的上下文中描述的某些特征也可以在单个实施方式中组合实现。相反,在单个实施方式的上下文中描述的各种特征也可以分别在多个实施方式中或者在任何合适的子组合中实现。此外,尽管特征可以在上面被描述为在某些组合中起作用,甚至最初也是这样要求保护的,但是在某些情况下,来自所要求保护的组合的一个或多个特征可以从该组合中删除,并且所要求保护的组合可以针对子组合或子组合的变体。
类似地,尽管在附图中以特定次序描述了操作,但是这不应该被理解为要求以所示的特定次序或顺序次序执行这些操作或者执行所有示出的操作,以获得期望的结果。在一些情况下,权利要求中列举的动作可以以不同的次序执行,并且仍然获得期望的结果。此外,附图中描述的过程不一定需要所示的特定次序或顺序次序来获得期望的结果。
在某些情况下,多任务和并行处理可能是有利的。此外,上述实施方式中的各种***组件的分离不应该被理解为在所有实施方式中需要这样的分离,并且应该理解,所描述的程序组件和***通常可以一起集成在单个软件产品中或者封装到多个软件产品中。例如,数据处理***105可以是单个模块、具有一个或多个处理模块的逻辑设备、一个或多个服务器、或搜索引擎的一部分。
现在已经描述了一些说明性的实施方式和实施方式,显然,前面是说明性的而非限制性的,已经通过示例的方式给出。特别地,尽管本文中呈现的许多示例涉及方法动作或***元素的特定组合,但是这些动作和那些元素可以以其他方式组合以实现相同的目的。仅结合一个实施方式讨论的动作、元素和特征不旨在被排除在其他实施方式或实施方式中的类似角色之外。
本文中使用的措辞和术语是为了描述的目的,并且不应该被认为是限制性的。本文中使用的“包括”、“含有”、“具有”、“包含”、“涉及”、“特征在于”及其变体意味着包括其后列出的项目、其等同物和附加项、以及由其后专门列出的项目组成的替代实施方式。在一个实施方式中,本文描述的***和方法由一个、多于一个或所有所描述的元件、动作或组件的每个组合组成。
本文中以单数形式提及的对***和方法的实施方式或元件或动作的任何引用也可以包括包含多个这些元件的实施方式,并且本文中以复数形式提及的任何实施方式或元件或动作也可以包括仅包含单个元件的实施方式。单数或复数形式的引用不旨在将当前公开的***或方法、它们的组件、动作或元件限制为单个或多个配置。对基于任何信息、动作或元素的任何动作或元素的引用可以包括动作或元素至少部分基于任何信息、动作或元素的实施方式。
本文中公开的任何实施方式可以与任何其他实施方式相结合,并且对“实施方式”、“一些实施方式”、“替代实施方式”、“各种实施方式”、“一个实施方式”等的引用不一定相互排斥,并且旨在指示结合该实施方式描述的特定特征、结构或特性可以被包括在至少一个实施方式中。本文中使用的这些术语不一定都指相同的实施方式。任何实施方式都可以以与本文公开的方面和实施方式一致的任何方式包括或排他地与任何其他实施方式相结合。
对“或”的引用可以被解释为包含性的,使得使用“或”描述的任何术语可以表示单个、多于一个以及所有描述的术语中的任何一个。
在附图、详细描述或任何权利要求中的技术特征之后跟随有附图标记的情况下,包括附图标记的唯一目的是增加附图、详细描述和权利要求的可理解性。因此,附图标记及其不存在对任何权利要求元素的范围都没有任何限制作用。
在不脱离本文中描述的***和方法的特征的情况下,本文中描述的***和方法可以以其他特定形式实施。尽管本文中提供的示例涉及控制信息资源内容的显示,但是本文中描述的***和方法可以包括应用于其他环境。前述实施方式是说明性的,而不是对所描述的***和方法的限制。因此,本文中描述的***和方法的范围由所附权利要求来指示,而不是由前面的描述来指示,并且在权利要求的等同物的含义和范围内的变化包含在该范围中。

Claims (20)

1.一种基于文档空间关联从选择标准的集合中修剪选择标准的方法,包括:
由包括一个或多个处理器的数据处理***从内容提供者计算***构造第一数据结构,所述第一数据结构指示对多个检索令牌中的第一检索令牌的相关联的预测请求;
由所述数据处理***将所述第一数据结构与第二数据结构进行比较,以计算相似性值,所述第二数据结构指示对所述多个检索令牌中的第二检索令牌的相关联的预测请求;
由所述数据处理***确定所述相似性值大于预定阈值;
响应于确定所述相似性值大于预定阈值,由所述数据处理***从所述多个检索令牌中移除所述第一检索令牌和所述第二检索令牌,以创建经修剪的多个检索令牌;以及
由所述数据处理***向所述内容提供者计算设备提供所述经修剪的多个检索令牌。
2.根据权利要求1所述的方法,其中,所述第一数据结构和所述第二数据结构各自包括位串,其中每个位串中的每个位置对应于多个预测请求中的预测请求,并且具有指示相应的预测请求是否对应于相应的检索令牌的值。
3.根据权利要求2所述的方法,还包括:
使用位串选择标准选择第一位串中的位置,以创建第一修剪位串,所述第一修剪位串小于所述第一位串;
使用所述位串选择标准选择第二位串中的位置,以创建第二修剪位串,所述第二修剪位串小于所述第二位串;并且
其中,将所述第一位串和所述第二位串进行比较包括将所述第一修剪位串和所述第二修剪位串进行比较。
4.根据权利要求3所述的方法,其中,创建所述第一修剪位串的选择标准是基于伪随机选择。
5.根据权利要求1所述的方法,其中,每个预测请求与基于所述预测请求的估计流量值的权重值相关联;并且
其中,构造所述第一数据结构还包括:
由所述数据处理***将多个权重值中的每一个与预定流量阈值进行比较;
由所述数据处理***选择经修剪的多个预测请求,所述经修剪的多个中的每一个是响应于相应的权重值大于预定流量阈值而从所述多个预测请求中选择的;
由所述数据处理***构造第一位串,其中,所述第一位串中的每个位置对应于所述经修剪的多个预测请求中的相应的经修剪的预测请求,并且具有指示所述相应的经修剪的预测请求是否对应于所述第一检索令牌的值。
6.根据权利要求1所述的方法,其中,将所述第一数据结构和所述第二数据结构进行比较包括:
由所述数据处理***在所述第一数据结构的位和所述第二数据结构的位之间执行逻辑与运算,以创建比较位串;
由所述数据处理***对所述比较位串中等于预定匹配值的位置的数量进行计数,以计算所述相似性值。
7.根据权利要求1所述的方法,还包括响应于所述相似性值小于所述预定阈值,由所述数据处理***从所述多个检索令牌中移除所述第一检索令牌,以创建所述经修剪的多个检索令牌。
8.根据权利要求1所述的方法,其中所述多个检索令牌中的每一个与内容评级值相关联,并且
其中,基于所述第一检索令牌和与所述第一检索令牌相关联的内容评级值来检索所述多个预测请求。
9.根据权利要求1所述的方法,其中,向所述内容提供者计算设备提供所述经修剪的多个检索令牌还包括提供对所述第一检索令牌和所述第二检索令牌的指示。
10.根据权利要求1所述的方法,其中,向所述内容提供者计算设备提供所述经修剪的多个检索令牌还包括:
由所述数据处理***基于所述经修剪的多个检索令牌来检索所述经修剪的多个检索令牌的相关性值;以及
由所述数据处理***向所述内容提供者计算设备提供基于所述经修剪的多个检索令牌的相关性值。
11.一种包括数据处理***的***,所述数据处理***包括一个或多个处理器,所述数据处理***被配置为:
构造第一数据结构,所述第一数据结构指示对多个检索令牌中的第一检索令牌的相关联的预测请求;
将所述第一数据结构与第二数据结构进行比较,以计算相似性值,所述第二数据结构指示对所述多个检索令牌中的第二检索令牌的相关联的预测请求;
确定所述相似性值大于预定阈值;
响应于确定所述相似性值大于预定阈值,从所述多个检索令牌中移除所述第一检索令牌和所述第二检索令牌,以创建经修剪的多个检索令牌;以及
向所述内容提供者计算设备提供所述经修剪的多个检索令牌。
12.根据权利要求11所述的***,其中所述第一数据结构和所述第二数据结构各自包括位串,其中,每个位串中的每个位置对应于多个预测请求中的预测请求,并且具有指示相应的预测请求是否对应于相应的检索令牌的值。
13.根据权利要求12所述的***,其中,所述数据处理***还被配置为:
使用位串选择标准选择第一位串中的位置,以创建第一修剪位串,所述第一修剪位串小于所述第一位串;
使用所述位串选择标准选择第二位串中的位置,以创建第二修剪位串,所述第二修剪位串小于所述第二位串;并且
其中,将所述第一位串和所述第二位串进行比较包括将所述第一修剪位串和所述第二修剪位串进行比较。
14.根据权利要求13所述的***,其中,创建所述第一修剪位串的位串选择标准是基于伪随机选择。
15.根据权利要求11所述的***,其中,每个预测请求与基于所述预测请求的估计流量值的权重值相关联;并且其中,数据处理***还被配置为:
将多个权重值中的每一个与预定流量阈值进行比较;
选择经修剪的多个预测请求,所述经修剪的多个中的每一个是响应于相应的权重值大于预定流量阈值而从所述多个预测请求中选择的;
构造第一位串,其中所述第一位串中的每个位置对应于所述经修剪的多个预测请求中的相应的经修剪的预测请求,并且具有指示所述相应的经修剪的预测请求是否对应于所述第一检索令牌的值。
16.根据权利要求11所述的***,其中,所述数据处理***还被配置为:
在所述第一数据结构和所述第二数据结构之间执行逻辑与运算,以创建比较位串;
对所述比较位串中等于预定匹配值的位置的数量进行计数,以计算所述相似性值。
17.根据权利要求11所述的***,其中,所述数据处理***还被配置为:
响应于所述相似性值小于所述预定阈值,从所述多个检索令牌中移除所述第一检索令牌,以创建所述经修剪的多个检索令牌。
18.根据权利要求11所述的***,其中,所述多个检索令牌中的每一个与内容评级值相关联,并且
其中,所述数据处理***还被配置为基于所述多个检索令牌和与所述第一检索令牌相关联的内容评级值来检索所述多个预测请求。
19.根据权利要求11所述的***,其中,所述数据处理***还被配置为:
提供对所述第一检索令牌和所述第二检索令牌的指示。
20.根据权利要求11所述的***,其中,所述数据处理***还被配置为:
基于所述经修剪的多个检索令牌来检索所述经修剪的多个检索令牌的相关性值;以及
向所述内容提供者计算设备提供所述相关性值。
CN201980005050.XA 2019-12-11 2019-12-11 改进定向和其他设置的内容提供者建议 Pending CN114616578A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2019/065733 WO2021118559A1 (en) 2019-12-11 2019-12-11 Content provider recommendations to improve targetting and other settings

Publications (1)

Publication Number Publication Date
CN114616578A true CN114616578A (zh) 2022-06-10

Family

ID=69165580

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980005050.XA Pending CN114616578A (zh) 2019-12-11 2019-12-11 改进定向和其他设置的内容提供者建议

Country Status (7)

Country Link
US (1) US11669784B2 (zh)
EP (1) EP3853786A1 (zh)
JP (2) JP7177152B2 (zh)
KR (2) KR102605598B1 (zh)
CN (1) CN114616578A (zh)
CA (1) CA3160683A1 (zh)
WO (1) WO2021118559A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116821279A (zh) * 2023-06-06 2023-09-29 哈尔滨理工大学 一种带排斥关键字的空间关键字查询方法和***

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3897017B1 (en) * 2020-04-17 2023-11-01 Secure Thingz Limited A provisioning control apparatus, system and method
US20230325598A1 (en) * 2022-04-07 2023-10-12 Klarna Bank Ab Dynamically generating feature vectors for document object model elements

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9802836D0 (en) 1998-02-10 1998-04-08 Canon Kk Pattern matching method and apparatus
US7814104B2 (en) * 2005-05-04 2010-10-12 Oracle International Corporation Techniques for partition pruning
KR100835291B1 (ko) 2007-03-14 2008-06-10 엔에이치엔(주) 쿼리 타게팅 방법 및 시스템
JP4999796B2 (ja) 2008-07-18 2012-08-15 ヤフー株式会社 配信された広告に関する情報を蓄積するサーバ、方法及びプログラム
US20110264507A1 (en) 2010-04-27 2011-10-27 Microsoft Corporation Facilitating keyword extraction for advertisement selection
JP5480058B2 (ja) 2010-08-03 2014-04-23 ヤフー株式会社 広告マッチング装置、方法及びプログラム
US9197872B2 (en) * 2013-02-21 2015-11-24 Comcast Cable Communications, LLC. Managing stored content
US9600503B2 (en) 2013-07-25 2017-03-21 Facebook, Inc. Systems and methods for pruning data by sampling
US10628418B2 (en) * 2014-11-13 2020-04-21 Sap Se Data driven multi-provider pruning for query execution plan
JP6019156B2 (ja) 2015-03-20 2016-11-02 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム
US10929360B2 (en) * 2015-10-19 2021-02-23 Oracle International Corporation Filtered partition maintenance operations
KR101638127B1 (ko) * 2016-01-29 2016-07-11 박요섭 지속적 콘텐츠 생성 및 맞춤형 콘텐츠 라이브러리 서비스 제공 방법
US10432722B2 (en) * 2016-05-06 2019-10-01 Microsoft Technology Licensing, Llc Cloud storage platform providing performance-based service level agreements
US11106712B2 (en) * 2016-10-24 2021-08-31 Google Llc Systems and methods for measuring the semantic relevance of keywords
JP6867482B2 (ja) * 2016-12-30 2021-04-28 グーグル エルエルシーGoogle LLC 情報リソース上のコンテンツのハッシュベースの動的制限
US10353863B1 (en) * 2018-04-11 2019-07-16 Capital One Services, Llc Utilizing machine learning to determine data storage pruning parameters
US11580170B2 (en) 2018-11-01 2023-02-14 Google Llc Machine learning based automatic audience segment in ad targeting

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116821279A (zh) * 2023-06-06 2023-09-29 哈尔滨理工大学 一种带排斥关键字的空间关键字查询方法和***
CN116821279B (zh) * 2023-06-06 2024-06-07 哈尔滨理工大学 一种带排斥关键字的空间关键字查询方法和***

Also Published As

Publication number Publication date
EP3853786A1 (en) 2021-07-28
KR20210075904A (ko) 2021-06-23
CA3160683A1 (en) 2021-06-17
KR102381330B1 (ko) 2022-04-01
US20210184976A1 (en) 2021-06-17
JP2023021113A (ja) 2023-02-09
US11669784B2 (en) 2023-06-06
JP7512351B2 (ja) 2024-07-08
JP2022517882A (ja) 2022-03-11
KR102605598B1 (ko) 2023-11-23
KR20220102133A (ko) 2022-07-19
WO2021118559A1 (en) 2021-06-17
JP7177152B2 (ja) 2022-11-22

Similar Documents

Publication Publication Date Title
JP7512351B2 (ja) ターゲティングおよびその他の設定を改善するためのコンテンツプロバイダの推薦
KR102262481B1 (ko) 비디오 컨텐츠 요약
CN108776676B (zh) 信息推荐方法、装置、计算机可读介质及电子设备
US10853362B2 (en) Optimized full-spectrum loglog-based cardinality estimation
CN109509010B (zh) 一种多媒体信息处理方法、终端及存储介质
CN108307207A (zh) 一种视频推送方法及装置
US11989755B1 (en) Expansion of high performing placement criteria
US11620547B2 (en) Estimating number of distinct values in a data set using machine learning
US20220091873A1 (en) Systems and methods for cross media reporting by fast merging of data sources
CN113039805B (zh) 一种基于指纹匹配的媒体片段提取方法及***
US11068481B2 (en) Optimized full-spectrum order statistics-based cardinality estimation
US20230259837A1 (en) Content provider recommendations to improve targetting and other settings
CN112218114A (zh) 视频缓存控制方法、装置和计算机可读存储介质
US20150170035A1 (en) Real time personalization and categorization of entities
US11275749B2 (en) Enhanced query performance prediction for information retrieval systems
CN113692585A (zh) 用于生成和选择本地内容以改善网络资源的安全性和利用的***和方法
CN113760484A (zh) 数据处理的方法和装置
JP7479501B2 (ja) カウントのベクトルによるブルームフィルタのメタ推定
CN111488941B (zh) 一种基于改进Kmeans算法的视频用户分组方法和装置
CN114170035A (zh) 一种数据处理方法、装置、电子设备以及存储介质
CN117472266A (zh) 用于处理图像的方法、设备和计算机程序产品
CN115062214A (zh) 内容推荐方法、装置、可读存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination