CN105453122A - 上下文移动应用广告 - Google Patents

上下文移动应用广告 Download PDF

Info

Publication number
CN105453122A
CN105453122A CN201480033914.6A CN201480033914A CN105453122A CN 105453122 A CN105453122 A CN 105453122A CN 201480033914 A CN201480033914 A CN 201480033914A CN 105453122 A CN105453122 A CN 105453122A
Authority
CN
China
Prior art keywords
key word
advertisement
keywords
server
hash
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201480033914.6A
Other languages
English (en)
Inventor
S·K·纳斯
X·林
L·R·西瓦林甘姆
J·帕德耶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Technology Licensing LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Technology Licensing LLC filed Critical Microsoft Technology Licensing LLC
Publication of CN105453122A publication Critical patent/CN105453122A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • G06Q30/0256User search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开的各方面涉及基于从应用内容中提取的关键字来检索与应用内容相关的广告。在一方面,客户机侧组件抓取应用页面内容以获取关键字以及这些关键字的基于特征的权重。关键字被发送到广告服务器,广告服务器基于一个或多个关键字来返回广告。还描述了在发送到广告服务器之前对关键字进行散列化以保护客户机隐私,并且使用布隆过滤器来避免向广告服务器发送不对应于(例如,流行)广告关键字的关键字。

Description

上下文移动应用广告
背景
移动设备应用已经变成许多用户接收内容的主要方式。的确,研究显示消费者在移动应用上花费比在传统网站上更多的时间。
尽管如此,广告商在移动应用广告上花费比在传统网站广告上少得多的资金。一个可能的原因是不像大多数web应用提供者,当前移动广告往往与用户兴趣高度不相关并由此对于广告商是不值得的。例如,在涉及提供宗教内容的应用中显示赌博广告并非是不常见到的。该不相关性导致低点进率,由此广告商往往避免或看低移动平台。
概述
提供本概述以便以简化形式介绍将在以下的详细描述中进一步描述的一些代表性概念的选集。本概述不旨在标识出所要求保护的主题的关键特征或必要特征,也不旨在以限制所要求保护的主题的范围的任何方式来使用。
简而言之,本文描述的主题的各方面涉及基于内容页面内容来接收广告(或其它相关内容)。从应用页面内容中提取包括一个或多个关键字的关键字集并将其发送到广告服务器以接收广告。接收到的广告与应用页面内容协同呈现。
在一方面,辅助内容服务器配置有存储器以及用于执行代码的处理器,包括从客户机接收包括关键字集,该关键字集包括至少一个数据项,该至少一个数据项具有在客户机处针对该数据项计算出的局部权重。全局权重(例如,由辅助内容服务器访问)与关键字集中的至少一个数据项的局部权重组合成该项目的最终分数。检索基于该数据项和分数的辅助内容(例如,广告)并将其返回给客户机。
在一方面,处理应用页面内容,包括从页面内容中提取纯文本关键字。基于局部特征来为关键字计算局部权重,并且将纯文本关键字散列化成散列化的关键字。在确定散列化的关键字在维护表示广告关键字的压缩数据的数据结构(例如,布隆(Bloom)过滤器或任何其它合适的结构)中表示后,向广告服务器发送广告请求;该请求包括包含散列化的关键字和局部权重的关键字集。响应于该请求接收来自广告服务器的广告。
结合附图阅读以下详细描述,本发明的其他优点会变得显而易见。
附图简述
作为示例而非限制,在附图中示出了本发明,附图中相同的附图标记指示相同或相似的元素,附图中:
图1是表示根据示例实现的用于检索与应用页面内容相关的广告以供与页面内容协同呈现的组件的框图。
图2是表示根据一个示例实现的关键字集从客户机到广告服务器的流动以及使用该关键字集来从广告网络接收一个或多个广告的框图。
图3是表示根据一个示例实现的可由客户机设备采取以便向广告服务器提供来自应用内容的关键字以接收并呈现与该内容相关的广告的示例步骤的流程图。
图4是表示根据一个示例实现的可由服务器采取以便处理从客户机设备接收到的关键字集以基于关键字集来从广告网络获取一个或多个广告的示例步骤的流程图。
图5是表示其中可实现本文所描述各实施例的一个或多个方面的被例示为移动设备的示例非限制性计算***或操作环境的框图。
详细描述
本文描述的技术的各方面一般涉及通过计及其上显示广告的页面的内容来提供更相关的广告(或其它辅助内容),例如以便提供上下文移动应用广告。就此,移动应用的内容在运行时被处理以提取关键字(以及可能的其它代表性内容),且所提取的关键字被用来取得上下文相关广告。注意,不像可被离线爬寻并索引以用于上下文广告的网页,移动应用上所显示的内容经常是动态生成的或者被嵌入应用本身中,并因此无法提前爬寻。
在一方面,内容的运行时提取可以在没有过多开销的情况下执行。此外,被用来从服务器取得其它内容的内容的运行时提取可以在不侵犯用户隐私的情况下执行。
应当理解,本文中的任何示例均是非限制的。例如,广告是可基于应用呈现的内容来取得的重要类型的辅助内容,然而可以按类似方式取得其它类型的辅助内容。此外,此处使用的许多示例指的是使用文本来确定从页面中提取的代表性内容,然而可使用页面上的关于其它内容的任何已知事物(例如,关于所显示的图像的信息)来检索相关广告/辅助内容。另外,可以理解本文描述的技术涉及可用于检索相关辅助内容的一种类型的“信号”,然而该信号可以与一种或多种其它类型的信号(例如,位置、用户历史、用户偏好、应用元数据等)相组合以做出最终的辅助内容(例如,广告)选择判定。此外,虽然将由于大多数移动应用内容是动态的且无法提前爬寻而将在运行时处理这样的内容的移动应用用作示例,但其它技术可以受益于本文描述的技术,而不一定是在移动设备上和/或由移动应用呈现的内容。因此,本发明不限制于本文所述的任何具体的实施例、方面、概念、结构、功能或示例。相反,此处所描述的实施例、方面、概念、结构、功能或示例中的任一个都是非限制性的,并且本发明一般能够以在计算和/或提供内容(例如,广告)方面提供好处和优点的各种方式来使用。
图1是示出本文描述的技术的示例概念的一般框图。一般而言,诸如在移动设备104上运行的应用102包括客户机侧广告(ad)组件106。客户机侧组件106可被实现为可执行控件等,并且一般用于从应用页面中提取关键字相关数据,如本文描述的。组件106可以是库(例如,动态链接库(DLL)),开发者可以诸如通过编程或通过从控件工具箱中拖放或经由可以用二进制重写技术将广告客户端***现有应用的工具而将这种库包括在应用页面中。
当运行组件106的应用呈现内容的页面108时,客户机侧广告组件106“抓取”内容(如本文描述的)以从页面108中提取关键字相关数据。例如,在应用页面108被加载后,客户机组件106处理当前页面内容以生成候选关键字的列表;(可执行诸如停止字过滤等其它处理以消除不是有用的关键字的单词)。典型的应用页面被组织为UI控件(例如,文本框、图像、列表框)的分层结构,并由此抓取可通过遍历该分层结构并提取处在此类UI控件中的文本来完成。注意,提取可以周期性地和/或以其它方式(诸如当所呈现的内容改变时)进行。一般而言,从当前应用页面108中提取突出关键字,并且将这些关键字用作向广告服务器110请求广告的基础。
更具体而言,广告组件106例如经由云连接来耦合到广告服务器110;即,广告服务器110可以作为服务等来在云中运行。服务器110还可参与关键字提取和选择,如本文描述的。
如对于任何内容都是已知的,一些单词很有可能比其它单词与页面要点更相关。如本文描述的,客户机侧广告组件106提取的每一个关键字可以基于与该关键字相关的局部(客户机侧)特征来与局部权重相关联。关键字的权重确定其相对于其它关键字的分数。注意,虽然向服务器发送页面108以提取关键字或者将所有(或大多数)关键字及其元数据(用于基于特征来进行权重计算)发送到服务器以用于权重计算是可行的,但这已是非常低效的。此外,如本文描述的,发送页面(该页面包含例如银行账户信息)有隐私问题。效率和隐私由此是客户机执行某些计算(以及如本文描述的基于散列的混淆)的理由。
关于实现良好的实用性,为了从应用页面中提取突出关键字,客户机侧组件106的一个实现通常基于公知的关键字提取器。然而,此类关键字提取器针对因网页而异的特征,而本文描述的提取基于应用特征;此外,组件106被配置成解决效率和隐私问题。
给定当前页面108,客户机侧广告组件106产生根据习得的特征权重而具有零和一之间的分数的关键字的经排名列表,分数指示每一关键字在选择相关广告方面可能有多有用。如此处所使用的,相对于客户机侧的术语“关键字”被用来表示从页面108中提取的信息,无论是页面上的实际文本(包括单个单词或多单词词组)还是任何其它上下文信息(诸如关于页面上的图像的信息)。
客户机侧广告组件106包括经训练的分类器。给定文档D中的单词W的特征向量,分类器确定W是广告关键字的似然分数。更正式地,分类器在给定与单词W相关联的输入特征集合X的情况下预测输出变量Y。Y在W是相关关键字的情况下为一(1),否则为零(0)。分类器返回估计出的概率
P ( Y = 1 | X ‾ = x ‾ ) = exp ( x ‾ · w ‾ ) 1 + exp ( x ‾ · w ‾ )
其中权重的向量是而Wi是输入特征xi的权重。
不像传统的关键字提取器,本文描述的客户机侧提取组件106排除不适用于应用页面的特征。作为一个示例,传统的关键字提取器向出现在不适用于应用页面的HTML头部中的单词分配更高的权重。然而,一些局部特征适用于应用内容和网页两者,并由此客户机侧提取组件106可使用也适用于应用页面的关键字提取器类型的特征:
AnywhereCount:单词出现在页面中的总次数。
NearBeginningCount:单词出现在页面开头的总次数,其中在一个实现中开头被定义为屏幕上面三分之一。
SentenceBeginningCount:单词开始句子的次数。
PhraseLengthInWord:词组中的单词数。
PhraseLengthInChar:词组中的字符数。
MessageLength:包含单词的行的以字符计的长度。
Capitalization:单词在页面中被大写的次数,这指示该单词是否是专有名词或重要单词。
Fontsize:单词的字体大小。
此外,应用页面具有在HTML页面中找不到的特征。例如,包含用户输入的富UI元素(例如,文本框)是单词重要性的良好指示符。由此,UI元素中存在关键字可被包括在提取机制在其排名函数中考虑的文档特征的列表中;UI元素的类型可被给予单独权重;例如,单词可取决于该单词是否出现在文本框或列表框中而具有不同权重。
组件106中的分类器可以基于带标记的页面数据的相对较大的语料库用机器学习模型来训练,以确定包括UI元素在内的各种特征的相对权重。一旦此类权重从训练数据中习得,这些权重就可被容易地结合到组件106中。来自实际使用的反馈可被用来进一步调节权重,例如分类器可以不时地更新。
在一个实现中,发送到广告服务器的广告请求包括关键字(或其散列化表示)的列表以及每一关键字的局部权重。该列表可被缩减为只包含很有可能匹配广告关键字的那些关键字,如下所述。此外,注意,可出于隐私原因而发送列出的每一关键字的散列,而不是纯文本关键字处于列表上,也如本文描述的。
在一个实现中,广告服务器110分析客户机发送的关键字和局部权重并对关键字进行排名。作为分析的一部分,广告服务器110可以向局部权重添加全局权重(例如,基于关键字流行度)以确定每一关键字的最终排名分数。关于提取/全局知识包括的服务器操作在下文中描述。
广告服务器110向广告网络112发送对匹配关键字集(例如,排名第一的关键字或前N个关键字)的一个或多个广告的请求。广告服务器110可使用可返回对应于给定关键字集的广告的任何广告网络112。例如,广告网络112可以是从各种源接受出价和广告的(第三方)实体。注意,广告网络112可使用任何内部/专有过程来基于一个或多个关键字选择一个或多个广告,并且这一内部/专有选择过程不在此处描述。
取决于广告服务器110与广告网络112之间的协议,广告网络112可返回它可具有的对应于广告服务器110发送的一个或多个关键字的任何数量的广告。如果从广告网络112返回多个广告,则广告服务器110选择一个广告(例如,匹配排名最高的关键字的一个广告)并将该广告返回到客户机以供显示。
转向关于客户机(例如,移动设备104)以及广告服务器110操作的附加细节,如本文描述的,总***的部分功能基于关键字提取。给定应用的页面数据,广告组件106提取描述应用页面108的主题或要点并且可以与可用广告匹配的突出关键字。现有关键字提取器被设计成从网页中提取广告关键字。此类提取器提供相当好的实用性,但取决于提取在何处完成而在效率和隐私之间进行折衷。
确定哪一个或哪些关键字将被发送到广告网络112的过程可以完全在客户机上执行,但这具有有限的成就,因为良好的关键字提取器使用太大以至于无法适合在客户机的存储器中的某些全局知识。例如,关键字提取器的对于广告高度有用的组件是出价关键字及其在广告之间的全局流行度的词典。
然而,广告商对其进行出价的关键字的数据库的大小可以是数百兆字节。出于实际原因,此类数据库需要在RAM中以便进行快速查找,然而大多数移动平台限制应用可消耗的RAM量以避免存储器压力。例如,当前手机将应用限于在运行时仅消耗90M的RAM,且其它平台施加类似的限制。
由此,客户机实际上无法使用这一全局知识数据库来调整权重,由此服务器110需要在将要利用全局知识的益处的情况下这样做。然而,在一个实现中,客户机需要提供局部权重,因为只在服务器处运行提取也是有问题的。的确,如上所述,只由服务器进行提取意味着客户机需要上传页面的所有内容和布局信息以允许服务器提取有用特征。这不仅浪费通信带宽(包括其布局信息在内的平均页面大小是数千字节的数量级),而且可能损害用户隐私,因为诸如用户姓名或银行账户信息等敏感信息很有可能在某一时点被发送到服务器。
为了解决这些问题,本文描述的客户机和服务器***在一个实现中使用混合关键字提取体系结构,其中客户机处理本地关键字提取,而服务器基于全局知识来处理附加关键字处理。注意,在以上等式中示出的评分函数基于特征向量x与权重向量w的点积。因为点积是可分割的,所以点积可以部分地在客户机处计算(例如,对于局部特征/权重)且部分地在服务器处计算(例如,对于全局特征/权重),并且被简单地合计成最终分数。由此,在客户机处,可以只使用局部信息来计算关键字的局部权重。这些单词连同其各自的局部权重一起被上传到服务器110,服务器110进而使用全局知识权重来改进分数。这一***的各个组件实现了良好的实用性、效率和隐私。
由此,如本文描述的,客户机侧提取组件106只处理局部特征,因为基于全局知识的特征对应于对于当前客户机设备太大的数据。在处理广告时,什么是相关的是关于广告关键字的全局知识,例如广告商对一关键字的出价频率。在一时间段内从广告网络收集到的轨迹可被用来收集该知识。
在具有这一轨迹的情况下,每一个单词可基于频率被分配全局权重(例如,等于log(1+频率)的权重,其中频率是单词出现在出价关键字轨迹中的次数。这反映了广告商最感兴趣的关键字的分布。使用以上局部特征和全局知识,混合客户机-服务器提取机制从应用页面中确定良好的广告关键字集。
转向涉及实现相对于存储器开销的效率的各方面,关键字提取中的存储器开销中的大部分源自关于关键字的大量全局知识。为了避免客户机侧的这一开销,提取功能在客户机和服务器之间拆分以使得全局知识(及相关联的计算)在服务器处维护。客户机在没有全局知识的情况下做它能做的。
因为将页面上的所有单词上传到服务器相对于在通信开销方面是浪费的并且可能潜在地侵犯隐私,所以在一个实现中,如果任何给定单词没有机会(或有极少机会)在服务器处被选为所提取的关键字之一,则客户机不将该单词发送到服务器。由此,广告客户端106可以本地地去除不必要/很有可能不相关的关键字。
为了实现这一去除,可使用关于广告商对哪些关键字出价的知识。客户机保存此类出价关键字的“列表”,并且只在一单词是出价关键字之一的情况下才向服务器110发送该单词。然而,实际上存在太多出价关键字(通常是数亿个)以至于无法适合在客户机的存储器中。此外,只检查出价关键字并不如还考虑与出价关键字有关的单词(进一步增加存储器开销)那样有利;(相关单词在以下描述)。
在一个实现中,向客户机提供出价单词的压缩列表(在需要时还提供相关关键字),而不是出价关键字的实际列表,例如在一个实现中该列表被压缩成布隆过滤器222(图2)形式的数据结构;(可使用其它类似的结构,然而出于简明目的本文例示布隆过滤器)。如已知的,布隆过滤器是节省空间的概率数据结构,该数据结构可用于测试元素是否一集合的成员。假肯定检索结果是可能的,但假否定是不可能的。
布隆过滤器222或其它结构由服务器110从其出价关键字和相关关键字的数据库224中构造并发送到广告客户端106(图1)。广告106客户机使用布隆过滤器222来检查候选单词是否被包括在出价关键字的列表中。客户机设备104只在一单词通过布隆过滤器检查的情况下才将该单词发送到广告服务器110。
然而,在广告网络中可能存在数千万个出价关键字,并由此如果包括所有或绝大部分出价关键字,则布隆过滤器可能非常大。更具体而言,布隆过滤器的大小取决于项数以及***愿意容忍的查找的假肯定率。简单的数学分析显示对于n个项目以及假肯定率p,布隆过滤器的最优大小是位。使用所有出价关键字产生具有对于智能电话中的存储和使用是不切实际的大小的布隆过滤器。
因此,可使用另一优化,即只包括涵盖广告网络中的大多数广告的相对较小数量的出价关键字。就此,存在许多流行的出价关键字,这些流行的出价关键字中的每一个都出现在大量广告标签中。具体而言,出价关键字的频率遵循幂律分布,这意味着较小数量的出价关键字出现在大多数广告中。例如,接近百分之二的最频繁出价关键字可以适合在智能电话的存储器中并且仍涵盖接近百分之九十的广告。该***因此可使用出价单词的总数中的较小一部分,但仍实现了广告的高覆盖。
为了确保剩余(例如接近百分之十)的广告实际上被供应给客户机,广告服务器可以在应用页面不包含足够的关键字时优选这些广告。其它技术是可行的,例如,诸如通过偶尔将未在布隆过滤器中表示的关键字发送到广告网络112来不时地进行随机或循环***,以确保广告被公平地提供。
注意,布隆过滤器不可增量式地更新,因为即使可动态地添加新项目,也无法删除项目;(删除在计数布隆过滤器中被支持,但计数布隆过滤器具有较大的存储器专用量并由此不在一个实现中使用)。因此,当用于本地去除的出价关键字集显著地改变时,客户机需要从服务器重新下载整个新的布隆过滤器。出于实际原因,这往往很少发生,并且的确实际数据支持该观点。相当不频繁的更新率以及相对较小的布隆过滤器(当只由较小百分比的关键字在布隆过滤器中表示时)使得在智能电话或较小设备中使用布隆过滤器是实际的。
转向涉及隐私的各方面,隐私和上下文广告是相互冲突的,因为广告服务器110需要知道页面内容来选择相关广告。以上解决方案提供了某种形式的隐私,这表现在因为假定只由广告关键字被发送,所以广告服务器只知道页面中的广告关键字而不知道任何其它事物。因为广告关键字基本上是广告商对其出价的流行关键字,所以广告关键字很有可能是非敏感关键字。这还使得对手广告商难以利用该***,因为通过只选择流行的出价关键字,对手不太可能在未对相同关键字做出大量出价的情况下将敏感单词置入流行关键字列表。注意,广告服务器还可使得流行关键字列表公开以使得第三方可审计该列表以确定该列表是否包含任何敏感关键字。然而,本文描述的技术不保证绝对隐私;事实上,在不牺牲广告质量或相同效率的情况下在客户机-服务器上下文广告***中保证绝对隐私基本上是不可能的。
因为布隆过滤器可具有假肯定,所以广告客户端可能偶尔向广告服务器发送出现在应用页面中但不是广告关键字的敏感单词(诸如社会保险号或疾病名称)。这可能侵犯用户隐私。
为了避免这一潜在隐私侵犯,在一个实现中,广告客户端和广告服务器各自使用单向散列函数并对关键字的散列值而不是其纯文本进行操作。服务器基于流行广告关键字的散列值来构建布隆过滤器。客户机对当前页面上的候选关键字进行散列化并且在散列值也在布隆过滤器中表示的情况下只发送单词的散列值。
广告服务器110维护广告关键字及其散列值的词典,由此广告服务器能够只在散列值是广告关键字的情况下将该散列值映射回到其纯文本。服务器110忽略未出现在其词典中的任何散列值,从而永远不知道(或由于单向散列)解密其纯文本。以此方式,该***实现了隐私,因为广告服务器只知道作为流行广告关键字的单词的纯文本。
图2示出了该***的示例端对端工作流/总操作。广告服务器110维护包含广告关键字的数据库224。对于每一关键字k,数据库维护k、k的散列值H(k)以及k的全局特征值Gk。值Gk由服务器的关键字提取算法用来计算在对关键字进行排名时使用的总分。在关键字提取器的一个实现中,Gk被计算为log(1+freqk),其中freqk是k被用来标记广告库存中的任何广告的次数。数据库224在更新广告库存时被更新。周期性地(例如,每三个月一次)或按某一其它时间表(诸如检测到足够改变时),在一个实现中服务器从关键字数据库中的H(k)值中计算布隆过滤器或者其它类似机制/数据结构,并且将计算出的布隆过滤器(例如,222)的副本发送到其客户机,例如移动电话客户机设备104。布隆过滤器的大小基于关键字数据库中的关键字数量以及可接受的目标假肯定率来最优地选择。
如上所述且在图2中详细示出的,在应用页面被加载后,客户机组件106(图1)“抓取”当前页面内容以生成候选关键字的列表以及每一关键字的局部权重{W1,L1...Wn,Ln}。典型的应用页面被组织为UI控件(例如,文本框、图像、列表框)的分层结构;抓取可通过遍历该分层结构并提取此类UI控件中的文本来完成。对于所抓取的每一单词W,客户机模块计算其散列H(W)(使用与服务器用来生成关键字数据库的散列函数相同的散列函数)及其局部特征向量Lw,被示为{H(W1),L1...H(Wn),Ln}。如果H(W)通过布隆过滤器,则对(H(W),Lw)被发送到服务器,例如{H(W1),L1...H(Wk),Lk}(其中k小于或等于n)。
广告服务器110接收到该散列值以及每一散列值的相应权重的集合。如果散列单词H(W)值未出现在服务器的关键字数据库224中(因为散列化的单词是由于出现在客户机的布隆过滤器中的假肯定而被发送的),则服务器110丢弃该值,从而不知道或无法确定(由于单向散列函数)对应的单词W。
否则,服务器从关键字数据库中检索全局权重Gw并将其与Lw相组合以计算单词W(例如,被重新转换成纯文本)的总分,如在图2中由分数计算组件226表示的。分数被排名和/或用于做出选择(框228)。例如,具有高于阈值的分数的关键字可被选为例如所提取的关键字。这些所提取的关键字被发送到广告网络112。
从应用页面中提取广告关键字的一个问题是一些页面不包含足够的文本并因此关键字提取不产生任何广告关键字。为了显示用于这些页面的相关广告,可使用多级关键字机制。例如,在一个实现中,1级关键字是从当前页面中动态地习得的关键字,而2级关键字是从用户在当前会话中已经查看过的页面中动态地习得的关键字。另外,广告服务器110维护用于每一应用的3级关键字,例如从该应用的元数据中在线习得。如果1级关键字的集合为空,则使用2级关键字。如果1级和2级关键字集合两者都为空,则使用3级关键字来选择相关广告。由此给出对当前页面显示广告的偏好。如果当前页面不包含任何广告关键字,则接下来考虑用户已经在当前会话中访问过的页面,并且如果没有,则使用应用元数据(应用页面的描述和内容,包括用户尚未在该会话中访问的内容)来提取关键字。
转向如上所述的处理相关关键字,可通过添加与所提取的关键字相关的关键字来提高相关性。作为示例,考虑当前应用页面包含单词“LEDTVsarecool”,但布隆过滤器中所表示的出价关键字集只包含与该应用页面相关的一个关键字{HDTV}。在基于出价关键字来过滤后,广告客户端将不提取任何关键字,即使LEDTV与HDTV是相关的。典型的关键字提取工具忽略了此类相关单词。然而,此类相关可被捕捉到并使用,因为典型的应用页面可能只包含少量文本,由此捕捉相关单词给予显示更多相关广告的机会。原始出价关键字集可以用相关单词(例如,{HDTV;LEDTV;LCDTV})来扩展。
该出价关键字及其相关单词的扩展集合可被称为广告关键字。可使用各种数据源来查找相关单词,例如包括通过分析搜索引擎web查询和点击日志来自动提取的相关关键字的数据库。两个关键字之间的相关程度可基于正在搜索这两个关键字的搜索引擎用户点击同一URL的频率来计算。另一源可以是web服务(诸如由http://veryrelated.com提供),在被给予一关键字时该服务返回相关关键字的列表。两个关键字之间的相关程度可基于这两个关键字出现在同一网页中的频率以及这两个关键字在因特网上有多流行来计算。
注意,应用开发者可以在运行时向广告控件等提供关键字,例如应用开发者可以对针对应用的每一页面的静态广告关键字进行硬编码,或者可能实现某种逻辑来动态地在运行时生成关键字。然而,此类硬编码和/或逻辑实际上是难以实现的,因为对于许多页面而言,开发者无法知晓什么内容可以在运行时显示,并且还因为广告关键字的质量取决于外部信息(例如,关键字在广告商之间有多流行)。
尽管如此,特定页面可以是静态的或基本上静态的,并由此应用开发者或其它服务可请求针对这一页面的特定广告。例如,在执行提取之前,本文描述的组件106可处理应用元数据并确定特定页面标识符对应于对涉及鲜花递送服务的广告的请求。对于该页面,预定关键字(或服务器可从中查找关键字的{应用ID,页面ID}对)可被发送到服务器110以使得返回针对该特定页面的相关广告。
图3概述了可由客户机侧广告组件106执行的一些示例步骤,而图4概述了可由广告服务器110执行的一些示例步骤。出于简明目的,图3和4的流程图描述其中页面上存在通过布隆过滤器的至少一个所提取的关键字的示例以及来自客户机的至少一个关键字处在服务器数据库中并且评分/排名足够高以被发送到广告网络的示例。其中没有关键字通过布隆过滤器和/或其中没有所提取的关键字可被发送到广告网络(所提取的任一个或多个单词是布隆过滤器假肯定或评分太低以至于无法达到阈值)的情形可以按如上所述的那样处理,例如通过发送2级或3级单词或经由某种其它方案。
在图3的步骤302,客户机侧广告组件106处理当前页面以获取关键字和基于特征的局部权重,如本文描述的。步骤304出于隐私目的散列化这些关键字。
步骤306表示经由布隆过滤器来过滤关键字(其散列化的值),以使得通常只有作为广告关键字的单词才被发送到服务器(但对应于布隆过滤器假肯定的单词的散列值也可被发送)。步骤308表示发送一个或多个散列化的单词以及每一单词的权重的集合。步骤310转变至图4中表示的服务器步骤。
图4的步骤402表示服务器从客户机接收散列化的关键字和局部权重。对于每一散列化的单词(步骤404和412),步骤406检查该散列化的单词是否在服务器数据库224中。如果是,则步骤408将与该散列值相关联的全局权重添加到由客户机与散列值一起提供的局部权重,以提供与该散列值相关联的单词(纯文本)的最终分数。如果散列化的值不在数据库中,则步骤410丢弃该散列化的单词。
步骤414表示按照单词的最终分数来对单词进行排名(例如,在替换回纯文本后),且步骤416选择前N个单词以供发送到广告网络。如上所述,取代通过步骤414和416来进行排名和选择,可通过对照阈值基于单词的最终分数进行过滤来确定单词集。在任何情况下,在该示例中,至少一个单词可供发送到广告网络(如果在过滤后集合中未剩下单词,则可如上所述地使用另一关键字选择方案等,例如2级或3级选择)。对关键字集的附加过滤和/或排名或扩充可基于其它信息(例如,位置、用户偏好、用户历史等)来完成。
步骤418向广告网络发送纯文本关键字集以便作为回报获取一个或多个相关广告(步骤420)。注意,如上所述,所提取的关键字只是可以在选择时使用的一个信号,并由此也可发送其它数据(例如,客户机设备的当前位置)以供广告网络使用。以此方式,例如当客户机设备在西雅图区域时,广告网络可以知道不返回纽约的匹萨餐馆的广告。的确,广告服务器和/或广告网络可以与诸如位置、过往浏览历史等任何其它信号协同使用关键字来选择广告。
步骤420和422表示从广告网络112接收一个或多个广告,该一个或多个广告可以是对辅助内容的引用(例如,URL)而不是内容本身。如果返回不止一个广告,则广告服务器110选择一个广告。步骤422将广告(或其URL)返回给客户机以供显示;步骤424表示转变回到图3的步骤310。
返回到图3,步骤312表示在客户机处接收广告,在步骤314将该广告呈现为例如该广告的可见(和/或可能可听)表示。步骤316表示等待直到下一更新,诸如在页面变化或者计时器指示将要显示新广告的情况下。如果计时器期满并且页面内容未改变,则步骤302或306处的提取无需重复,但可以在客户机处采取某一动作以降低接收到相同广告的几率,该动作为例如标识当前广告并请求服务器返回另一广告。
示例操作环境
图5示出可在其上实现此处所描述的主题的各方面的合适的移动设备500的示例。移动设备500仅为设备的一个示例,并非旨在对此处所描述的主题的各方面的使用范围或功能提出任何限制。移动设备500也不应被解释成对于在示例性移动设备500中所示出的任一组件或其组合有任何依赖或要求。
参考图5,用于实现此处所述的主题的各方面的示例性设备包括移动设备500。在某些实施例中,移动设备500包括蜂窝电话、允许与其他手持设备的语音通信的手持设备、某一其他语音通信设备等。在这些实施例中,移动设备500可配备用于拍摄照片的照相机,虽然这在其他实施例中可能不是必需的。在其他实施例中,移动设备500包括个人数字助理(PDA),手持式游戏设备,笔记本计算机,打印机,包括机顶盒、媒体中心或其他电器等的电器,其他移动设备等。在又一些实施例中,移动设备500可包括通常被认作非移动的设备,如个人计算机、服务器等。
移动设备可包括电器或玩具的手持式遥控器,具有用于提供控制逻辑以及向遥控器输入数据的方式的附加电路***。例如,输入插孔或其它数据接收传感器可允许设备被重用于非控制代码数据传输。这可以在无需存储要传送的大部分数据的情况下实现,例如设备可担当诸如智能电话等另一设备(可能具有某一缓冲)的中继器。
移动设备500的组件可以包括但不限于,处理单元505、***存储器510和将包括***存储器510在内的各种***组件耦合至处理单元505的总线515。总线515可包括几种类型的总线结构中的任何一种,包括存储器总线、存储控制器、***总线、以及使用各种总线体系结构中的任一种的局部总线等。总线515允许数据在移动设备500的各组件之间传送。
移动设备500可以包括各种计算机可读介质。计算机可读介质可以是能由移动设备500访问的任何可用介质,并包含易失性和非易失性介质以及可移动和不可移动介质两者。作为示例而非限制,计算机可读介质可包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其它数据这样的信息的任意方法或技术来实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括但不限于,RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁带盒、磁带、磁盘存储或其他磁存储设备、或者可用于存储所需信息并且可由移动设备500访问的任何其他介质。
通信介质通常以诸如载波或其他传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其他数据,并包括任何信息传送介质。术语“已调制数据信号”是指使得以在信号中编码信息的方式来设置或改变其一个或多个特性的信号。作为示例而非限制,通信介质包括有线介质,诸如有线网络或直接线连接,以及无线介质,诸如声学、RF、无线USB、红外、Wi-Fi、WiMAX、和其它无线介质。上述的任意组合也应包含在计算机可读介质的范围内。
***存储器510包括易失性和/或非易失性存储器形式的计算机存储介质,且可包括只读存储器(ROM)和随机存取存储器(RAM)。在诸如蜂窝电话等移动设备上,操作***代码520有时被包括ROM中,虽然在其他实施例中,这不是必需的。类似地,应用程序525通常位于RAM中,虽然同样在其他实施例中,应用程序可位于ROM中或其他计算机可读存储器中。堆530提供用于与操作***520和应用程序525相关联的状态的存储器。例如,操作***520和应用程序525可在它们的操作期间将变量和数据结构存储在堆530中。
移动设备500还可包括其他可移动/不可移动、易失性/非易失性存储器。作为示例,图5示出闪存卡535、硬盘驱动器536和记忆棒537。硬盘驱动器536可被小型化以适合在例如存储器槽中。移动设备500可经由可移动存储器接口531与这些类型的非易失性可移动存储器接口,或可经由通用串行总线(USB)、IEEE5394、一个或多个有线端口540、或天线565连接。在这些实施例中,可移动存储器设备535-437可经由通信模块532与移动设备接口。在某些实施例中,并非所有这些类型的存储器都可被包括在单个移动设备上。在其他实施例中,可将这些和其他类型的可移动存储器中的一个或多个包括在单个移动设备上。
在某些实施例中,可按更永久地附连到移动设备500的方式连接硬盘驱动器536。例如,硬盘驱动器536可连接到诸如并行高级技术附件(PATA)、串行高级技术附件(SATA)或其他可连接到总线515的附件等接口。在此类实施例中,移除硬盘驱动器可涉及移除移动设备500的外壳并移除将硬盘驱动器536连接到移动设备500内的支承结构的螺丝钉或其他紧固件。
以上描述和在图5中示出的可移动存储设备535-437及其相关联的计算机存储介质提供对用于移动设备500的计算机可读指令、程序模块、数据结构、和其他数据的存储。例如,可移动存储器设备535-437可存储由移动设备500拍摄的图像、语音录音、联系人信息、程序、用于程序的数据等。
用户可通过诸如键区541和话筒542等输入设备向移动设备500中输入命令和信息。在某些实施例中,显示器543可以是触敏屏幕并可允许用户在其上输入命令和信息。键区541和显示器543可通过耦合到总线515的用户输入接口550连接到处理单元505,但也可由其他接口和总线结构连接,如通信模块532和有线端口540。运动检测552可被用于确定关于设备500做出的姿势。
例如,用户可经由对话筒542讲话并经由在键区541或触敏显示器543上输入的文本消息来与其他用户通信。音频单元555可提供电信号以驱动扬声器544以及接收并数字化接收自话筒542的音频信号。
移动设备500可包括提供信号以驱动相机561的视频单元560。视频单元560还可接收由相机561获得的图像并将这些图像提供给包括在移动设备500上的处理单元505和/或存储器。由相机561获得的图像可包括视频、不形成视频的一个或多个图像、或其某一组合。
通信模块532可向一根或多根天线565提供信号并从其接收信号。天线565之一可发射并接收用于蜂窝电话网络的消息。另一天线可发射并接收 消息。又一天线(或共享天线)可经由无线以太网网络标准发射并接收网络消息。
更进一步,天线将例如GPS信号等基于位置的信息提供给GPS接口和机构572。进而,GPS机构572使得对应的GPS数据(例如,时间和坐标)可用于处理。
在某些实施例中,可使用单根天线来发射和/或接收用于超过一种类型的网络的消息。例如,单根天线可发射并接收语音和分组消息。
当在网络化环境中操作时,移动设备500可连接到一个或多个远程设备。远程设备可包括个人计算机、服务器、路由器、网络PC、蜂窝电话、媒体回放设备、对等设备或其他常见的网络节点,并且一般包括上面相对于移动设备500所述的许多或全部元件。
本文所描述的主题的各方面可与众多其他通用或专用计算***环境或配置一起操作。适用于此处所描述的主题的各方面的公知的计算***、环境和/或配置的示例包括,但不限于,个人计算机、服务器计算机、手持式或膝上型设备、多处理器***、基于微处理器的***、机顶盒、可编程消费电子产品、网络PC、小型计算机、大型计算机、包括上述***或设备中的任一个的分布式计算环境等。
此处所描述的主题的各方面可在由移动设备执行的诸如程序模块等计算机可执行指令的一般上下文中描述。一般而言,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等。本文所述的主题的各方面也可以在其中任务由通过通信网络链接的远程处理设备执行的分布式计算环境中实现。在分布式计算环境中,程序模块可以位于包括存储器存储设备的本地和远程计算机存储介质中。
此外,虽然此处频繁使用术语服务器,但可以认识到,该术语也可涵盖客户机、分布在一个或多个计算机上的一个或多个进程的集合、一个或多个独立的存储设备、一个或多个其他设备的集合、以上的一个或多个的组合,等等。
结语
尽管本发明易于作出各种修改和替换构造,但其某些说明性实施例在附图中示出并在上面被详细地描述。然而应当了解,这不旨在将本发明限于所公开的具体形式,而是相反地,旨在覆盖落入本发明的精神和范围之内的所有修改、替换构造和等效方案。

Claims (10)

1.一种方法,包括从应用页面内容中提取包括一个或多个关键字的关键字集,将所述关键字集发送到广告服务器,从所述广告服务器接收广告,以及提供所述广告以供与所述应用页面内容协同呈现。
2.如权利要求1所述的方法,其特征在于,还包括基于关键字的特征来计算局部权重,并将所述局部权重与所述关键字相关联。
3.如权利要求1所述的方法,其特征在于,提取所述关键字集包括确定候选关键字集,并将所述候选关键字集过滤成所述关键字集。
4.如权利要求1所述的方法,其特征在于,还包括将所述应用页面内容中的纯文本关键字散列化成所述关键字集中的至少某些关键字。
5.一种包括辅助内容服务器的***,所述辅助内容服务器配置有存储器和执行代码以执行包括以下的操作的处理器:
(a)从客户机接收关键字集,所述关键字集包括至少一个数据项,所述至少一个数据项具有在所述客户机处为所述数据项计算的局部权重,
(b)将全局权重与所述关键字集中的至少一个数据项的局部权重一起组合成该项目的最终分数,
(c)基于所述数据项和分数来检索辅助内容,以及
(d)将辅助内容返回到所述客户机。
6.如权利要求5所述的***,其特征在于,每一数据项包括纯文本关键字的散列化的关键字值。
7.如权利要求5所述的***,其特征在于,所述辅助内容服务器被进一步配置成构造包括表示所述数据库中的至少某些广告关键字的压缩数据的结构,并且将所述结构提供给所述客户机。
8.一种或多种具有可执行指令的计算机可读存储介质,所述可执行指令在被执行时执行以下步骤,包括:
处理应用页面内容,包括从所述页面内容中提取纯文本关键字;
基于局部特征来计算所述关键字的局部权重;
将所述纯文本关键字散列化成散列化的关键字;
确定所述散列化的关键字在维护表示广告关键字的压缩数据的数据结构中表示;
向广告服务器发送广告请求,所述请求包括包含所述散列化的关键字和所述局部权重的关键字集;以及
响应于所述请求接收来自所述广告服务器的广告。
9.如权利要求8所述的一种或多种计算机可读存储介质,其特征在于,还具有以下计算机可执行指令,包括:在所述广告服务器处接收所述广告请求,访问数据库以获取为所述散列化的关键字维护的全局权重,将所述全局权重与所述局部权重一起组合成分数,并基于所述分数向广告网络发送对应于所述散列化的关键字的纯文本关键字以获取所述广告。
10.如权利要求8所述的一种或多种计算机可读存储介质,其特征在于,还具有以下计算机可执行指令,包括:使用所述分数来对照另一散列化的关键字或与其对应的纯文本关键字的另一分数对所述散列化的关键字或与其对应的纯文本关键字进行排名,或者至少部分地基于所述分数来选择发送所述纯文本关键字,或两者。
CN201480033914.6A 2013-06-13 2014-06-11 上下文移动应用广告 Pending CN105453122A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/916,996 2013-06-13
US13/916,996 US20140372216A1 (en) 2013-06-13 2013-06-13 Contextual mobile application advertisements
PCT/US2014/041991 WO2014201166A2 (en) 2013-06-13 2014-06-11 Contextual mobile application advertisements

Publications (1)

Publication Number Publication Date
CN105453122A true CN105453122A (zh) 2016-03-30

Family

ID=51168390

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480033914.6A Pending CN105453122A (zh) 2013-06-13 2014-06-11 上下文移动应用广告

Country Status (5)

Country Link
US (1) US20140372216A1 (zh)
EP (1) EP3008681A4 (zh)
KR (1) KR20160020429A (zh)
CN (1) CN105453122A (zh)
WO (1) WO2014201166A2 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107734397A (zh) * 2017-10-25 2018-02-23 深圳市雷鸟信息科技有限公司 电视广告获取、显示方法、广告服务器、电视机及***
CN108494837A (zh) * 2018-03-09 2018-09-04 福建滴咚共享科技股份有限公司 一种基于应用程序状态信息推送共享服务的方法和存储介质
CN113657971A (zh) * 2021-08-31 2021-11-16 卓尔智联(武汉)研究院有限公司 物品推荐方法、装置及电子设备
CN113905045A (zh) * 2017-01-11 2022-01-07 谷歌有限责任公司 用于提供第三方内容的***、方法和介质

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10373711B2 (en) 2014-06-04 2019-08-06 Nuance Communications, Inc. Medical coding system with CDI clarification request notification
US10754925B2 (en) 2014-06-04 2020-08-25 Nuance Communications, Inc. NLU training with user corrections to engine annotations
US11265385B2 (en) 2014-06-11 2022-03-01 Apple Inc. Dynamic bloom filter operation for service discovery
US10003659B2 (en) * 2014-10-31 2018-06-19 Qualcomm Incorporated Efficient group communications leveraging LTE-D discovery for application layer contextual communication
US9634992B1 (en) * 2015-02-28 2017-04-25 Palo Alto Networks, Inc. Probabilistic duplicate detection
US10366687B2 (en) 2015-12-10 2019-07-30 Nuance Communications, Inc. System and methods for adapting neural network acoustic models
KR101694727B1 (ko) * 2015-12-28 2017-01-10 주식회사 파수닷컴 인공 지능 기반 연관도 계산을 이용한 노트 제공 방법 및 장치
US10580064B2 (en) * 2015-12-31 2020-03-03 Ebay Inc. User interface for identifying top attributes
KR101808161B1 (ko) * 2016-06-27 2017-12-12 주식회사지앤지커머스 모바일 광고 제공 시스템 및 방법
WO2018057639A1 (en) 2016-09-20 2018-03-29 Nuance Communications, Inc. Method and system for sequencing medical billing codes
WO2018179224A1 (ja) * 2017-03-30 2018-10-04 株式会社オプティム 電子書籍表示システム、電子書籍表示方法、およびプログラム
GB201710013D0 (en) * 2017-06-22 2017-08-09 Scentrics Information Security Tech Ltd Control Access to data
US11133091B2 (en) 2017-07-21 2021-09-28 Nuance Communications, Inc. Automated analysis system and method
US11652776B2 (en) * 2017-09-25 2023-05-16 Microsoft Technology Licensing, Llc System of mobile notification delivery utilizing bloom filters
US11024424B2 (en) * 2017-10-27 2021-06-01 Nuance Communications, Inc. Computer assisted coding systems and methods
US20200027125A1 (en) * 2018-07-18 2020-01-23 Triapodi Ltd. Real-time selection of targeted advertisements by target devices while maintaining data privacy
US11366892B2 (en) * 2019-02-05 2022-06-21 Shape Security, Inc. Detecting compromised credentials by improved private set intersection
KR20210088985A (ko) * 2020-01-07 2021-07-15 삼성전자주식회사 전자 장치 및 그 동작 방법
US11580246B2 (en) * 2020-05-11 2023-02-14 Amazon Technologies, Inc. Cryptographic data encoding method with enhanced data security
US11379511B1 (en) * 2021-05-26 2022-07-05 Cbs Interactive, Inc. Systems, methods, and storage media for providing a secured content recommendation service based on user viewed content
US11809378B2 (en) 2021-10-15 2023-11-07 Morgan Stanley Services Group Inc. Network file deduplication using decaying bloom filters
WO2023150122A1 (en) * 2022-02-03 2023-08-10 Liveramp, Inc. On-device identity resolution software development kit

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101030283A (zh) * 2006-03-03 2007-09-05 腾讯科技(深圳)有限公司 一种发布广告的方法和***
CN101043348A (zh) * 2007-03-15 2007-09-26 华为技术有限公司 实现广告业务的方法、***及设备
CN101183396A (zh) * 2007-12-27 2008-05-21 深圳市迅雷网络技术有限公司 一种广告显示方法、***和装置
CN101496002A (zh) * 2005-05-13 2009-07-29 微软公司 利用在线会话的内容选择广告内容和/或其他相关信息以供显示的***和方法
CN101951441A (zh) * 2010-09-16 2011-01-19 中国联合网络通信集团有限公司 手机广告投放的方法和设备
CN102119513A (zh) * 2007-11-14 2011-07-06 高通股份有限公司 移动环境中使用关键词向量和相关联度量来学习和预测有目标的内容消息的用户相关的方法和***
CN102474524A (zh) * 2009-08-19 2012-05-23 汤姆森特许公司 对等网络中的针对性广告

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6085229A (en) * 1998-05-14 2000-07-04 Belarc, Inc. System and method for providing client side personalization of content of web pages and the like
US6691108B2 (en) * 1999-12-14 2004-02-10 Nec Corporation Focused search engine and method
US20020161739A1 (en) * 2000-02-24 2002-10-31 Byeong-Seok Oh Multimedia contents providing system and a method thereof
JPWO2001090980A1 (ja) * 2000-05-22 2004-01-08 日本オプロ株式会社 広告印刷システム
US6978275B2 (en) * 2001-08-31 2005-12-20 Hewlett-Packard Development Company, L.P. Method and system for mining a document containing dirty text
US6801904B2 (en) * 2001-10-19 2004-10-05 Microsoft Corporation System for keyword based searching over relational databases
US7028026B1 (en) * 2002-05-28 2006-04-11 Ask Jeeves, Inc. Relevancy-based database retrieval and display techniques
US20050137939A1 (en) * 2003-12-19 2005-06-23 Palo Alto Research Center Incorporated Server-based keyword advertisement management
US9009153B2 (en) * 2004-03-31 2015-04-14 Google Inc. Systems and methods for identifying a named entity
US7975020B1 (en) * 2005-07-15 2011-07-05 Amazon Technologies, Inc. Dynamic updating of rendered web pages with supplemental content
US20070208751A1 (en) * 2005-11-22 2007-09-06 David Cowan Personalized content control
US20070192293A1 (en) * 2006-02-13 2007-08-16 Bing Swen Method for presenting search results
US20080109285A1 (en) * 2006-10-26 2008-05-08 Mobile Content Networks, Inc. Techniques for determining relevant advertisements in response to queries
US8983923B2 (en) * 2007-01-25 2015-03-17 Yahoo! Inc. System and method for the retrieval and display of supplemental content
US20090024467A1 (en) * 2007-07-20 2009-01-22 Marcus Felipe Fontoura Serving Advertisements with a Webpage Based on a Referrer Address of the Webpage
KR100944769B1 (ko) * 2007-11-06 2010-03-03 한국전자통신연구원 프라이버시를 보장하는 암호화와 복호화를 이용한 파일공유 방법 및 시스템
US8943164B2 (en) * 2007-12-24 2015-01-27 Qualcomm Incorporated Apparatus and methods for retrieving/ downloading content on a communication device
US8768922B2 (en) * 2008-02-08 2014-07-01 Microsoft Corporation Ad retrieval for user search on social network sites
CN101414307A (zh) * 2008-11-26 2009-04-22 阿里巴巴集团控股有限公司 提供图片搜索的方法和服务器
JP5228936B2 (ja) * 2009-01-20 2013-07-03 沖電気工業株式会社 オーバレイトラヒック検出システム及びトラヒック監視・制御システム
US8756229B2 (en) * 2009-06-26 2014-06-17 Quantifind, Inc. System and methods for units-based numeric information retrieval
US8756224B2 (en) * 2010-06-16 2014-06-17 Rallyverse, Inc. Methods, systems, and media for content ranking using real-time data
US20120221571A1 (en) * 2011-02-28 2012-08-30 Hilarie Orman Efficient presentation of comupter object names based on attribute clustering
US8843477B1 (en) * 2011-10-31 2014-09-23 Google Inc. Onsite and offsite search ranking results
US20130275547A1 (en) * 2012-04-16 2013-10-17 Kindsight Inc. System and method for providing supplemental electronic content to a networked device
US20130347018A1 (en) * 2012-06-21 2013-12-26 Amazon Technologies, Inc. Providing supplemental content with active media
US11144563B2 (en) * 2012-11-06 2021-10-12 Matthew E. Peterson Recurring search automation with search event detection
US20140278796A1 (en) * 2013-03-14 2014-09-18 Nick Salvatore ARINI Identifying Target Audience for a Product or Service

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101496002A (zh) * 2005-05-13 2009-07-29 微软公司 利用在线会话的内容选择广告内容和/或其他相关信息以供显示的***和方法
CN101030283A (zh) * 2006-03-03 2007-09-05 腾讯科技(深圳)有限公司 一种发布广告的方法和***
CN101043348A (zh) * 2007-03-15 2007-09-26 华为技术有限公司 实现广告业务的方法、***及设备
CN102119513A (zh) * 2007-11-14 2011-07-06 高通股份有限公司 移动环境中使用关键词向量和相关联度量来学习和预测有目标的内容消息的用户相关的方法和***
CN101183396A (zh) * 2007-12-27 2008-05-21 深圳市迅雷网络技术有限公司 一种广告显示方法、***和装置
CN102474524A (zh) * 2009-08-19 2012-05-23 汤姆森特许公司 对等网络中的针对性广告
CN101951441A (zh) * 2010-09-16 2011-01-19 中国联合网络通信集团有限公司 手机广告投放的方法和设备

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113905045A (zh) * 2017-01-11 2022-01-07 谷歌有限责任公司 用于提供第三方内容的***、方法和介质
CN113905045B (zh) * 2017-01-11 2024-05-24 谷歌有限责任公司 用于提供第三方内容的***、方法和介质
CN107734397A (zh) * 2017-10-25 2018-02-23 深圳市雷鸟信息科技有限公司 电视广告获取、显示方法、广告服务器、电视机及***
CN108494837A (zh) * 2018-03-09 2018-09-04 福建滴咚共享科技股份有限公司 一种基于应用程序状态信息推送共享服务的方法和存储介质
CN108494837B (zh) * 2018-03-09 2021-04-23 福建滴咚共享科技股份有限公司 一种基于应用程序状态信息推送共享服务的方法和存储介质
CN113657971A (zh) * 2021-08-31 2021-11-16 卓尔智联(武汉)研究院有限公司 物品推荐方法、装置及电子设备
CN113657971B (zh) * 2021-08-31 2023-12-01 卓尔智联(武汉)研究院有限公司 物品推荐方法、装置及电子设备

Also Published As

Publication number Publication date
EP3008681A2 (en) 2016-04-20
US20140372216A1 (en) 2014-12-18
WO2014201166A2 (en) 2014-12-18
EP3008681A4 (en) 2016-06-08
KR20160020429A (ko) 2016-02-23
WO2014201166A3 (en) 2015-02-26

Similar Documents

Publication Publication Date Title
CN105453122A (zh) 上下文移动应用广告
CN110162621B (zh) 分类模型训练方法、异常评论检测方法、装置及设备
US11995112B2 (en) System and method for information recommendation
US10789620B2 (en) User segment identification based on similarity in content consumption
CN110139162B (zh) 媒体内容的共享方法和装置、存储介质、电子装置
CN106326391B (zh) 多媒体资源推荐方法及装置
US20140075428A1 (en) Application detection system
CN106557480B (zh) 查询改写的实现方法及装置
CN102160079A (zh) 用于内容项目的关联内容的选择
CN110061908A (zh) 应用程序推荐、装置、电子设备及介质
CN103339623A (zh) 涉及因特网搜索的方法和设备
US20210390152A1 (en) Method, system, and non-transitory computer-readable record medium for providing multiple models of federated learning using personalization
CN112801719A (zh) 用户行为预测方法、用户行为预测装置、存储介质及设备
CN110069769B (zh) 应用标签生成方法、装置及存储设备
CN111241850B (zh) 提供业务模型的方法及装置
CN102077168A (zh) 联合搜索结果的用户界面的库描述
CN106570020A (zh) 用于提供推荐信息的方法和装置
CN113420166A (zh) 商品挂载、检索、推荐、训练处理方法、装置及电子设备
KR101752474B1 (ko) 지식 공유 서비스 제공 장치, 방법 및 컴퓨터 프로그램
CN111767457B (zh) 推荐方法及装置
CN114707075B (zh) 一种冷启动推荐方法和设备
US20150170035A1 (en) Real time personalization and categorization of entities
JP6193799B2 (ja) ウェブ要素マッチング装置とマッチング確率分布生成装置と、それらの方法とプログラム
CN110020252B (zh) 基于片尾内容的识别有害视频的方法及其***
KR20220076765A (ko) 커뮤니티의 카테고리를 설정하기 위한 방법, 시스템, 및 컴퓨터 프로그램

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160330

WD01 Invention patent application deemed withdrawn after publication