CN105247516A - 基于搜索数据的查询建议 - Google Patents

基于搜索数据的查询建议 Download PDF

Info

Publication number
CN105247516A
CN105247516A CN201480031285.3A CN201480031285A CN105247516A CN 105247516 A CN105247516 A CN 105247516A CN 201480031285 A CN201480031285 A CN 201480031285A CN 105247516 A CN105247516 A CN 105247516A
Authority
CN
China
Prior art keywords
cluster
refining
inquiry
topic
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201480031285.3A
Other languages
English (en)
Other versions
CN105247516B (zh
Inventor
贝沙德·贝扎迪
叶夫根尼·A·切列帕诺夫
尼尔斯·格里姆斯莫
奥雷利安·博菲
亚历山德罗·阿戈斯蒂尼
卡罗伊·乔洛加尼
弗雷德里克·贝延立德
马蒂亚斯·海勒尔
马尔钦·M·诺瓦克-普日戈兹基
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN105247516A publication Critical patent/CN105247516A/zh
Application granted granted Critical
Publication of CN105247516B publication Critical patent/CN105247516B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

用于基于搜索数据生成查询建议的方法、***和设备,包括在计算机存储介质中编码的计算机程序。在一个方面,一种方法包括:由一个或多个计算机接收第一查询;基于第一查询确定查询精化;从查询精化生成精化集群,每个精化集群与特定话题对应并且每个精化集群包括被确定为属于精化集群所对应于的特定话题的查询精化;对精化集群进行排名;选择在排名中相对于其它精化集群排名最高的精化集群作为第一查询的第一搜索精化集群。

Description

基于搜索数据的查询建议
背景技术
本说明书涉及接收查询并且基于该查询确定话题提示的***。
互联网提供对于例如视频文件、图像文件、音频文件或者网页的各种资源的访问,包括关于特定主题、书籍文章或者新闻文章的内容。响应于接收到搜索查询,搜索***可选择一个或多个资源。搜索查询是用户提交给搜索引擎以满足用户的信息需求的数据。搜索查询通常为文本的形式,例如,一个或多个查询项,并且也可包括口述搜索查询的转录。搜索***基于其与搜索查询的相关度以及相对于其它资源的重要性来选择资源并评分,以提供搜索结果。搜索结果通常根据得分来排序,并且根据该顺序来呈现。
发明内容
通常,本说明书中所描述的主题的一个创新方面可在方法中具体实现,该方法包括以下动作:由一个或多个计算机接收第一查询;基于第一查询确定查询精化;从查询精化生成精化集群,每个精化集群与特定话题对应并且每个精化集群包括被确定为属于精化集群所对应于的特定话题的查询精化;对精化集群进行排名;选择在排名中相对于其它精化集群排名最高的精化集群作为第一查询的第一搜索精化集群;以及基于与第一搜索精化集群关联的话题来生成第一话题提示数据,第一话题提示数据描述了对属于与第一搜索精化集群关联的话题的n元(n-gram)的第一用户输入的请求。这一方面的其它实施例包括被配置为执行该方法的动作的对应***、设备以及在计算机存储装置上编码的计算机程序。
可实现本说明书中所描述的主题的特定实施例,以实现以下优点中的一个或多个。在一些实现方式中,搜索引擎访问查询日志并且基于满足与所接收的查询的阈值水平的相似度的之前查询或者查询序列来为该查询确定话题提示,从而减少用户装置上的用户输入量。在一些实现方式中,搜索引擎限制话题提示以降低话题偏离的可能性,从而提供更有可能满足用户的信息需求的建议。该建议可在与话题有关的对话情境中呈现,而非具体查询建议。在一些实现方式中,此对话可包含用于选择的图片或表意文字或者用于不同查询精化选择的搜索结果组。利用这样的对话情境中的话题提示精化查询的能力使得用户能够以更流畅的谈话的方式来输入查询,这继而导致用户易于使用搜索引擎,并且可更快速地将用户指引至用户所需的搜索结果。这在对查询的键入校正无法进行或者不切实际的情况下或者在这样的装置上允许搜索引擎的完全解放双手的操作。
本说明书中所描述的主题的一个或多个实施例的细节在附图和以下描述中阐述。主题的其它特征、方面和优点将从描述、附图和权利要求书变得显而易见。
附图说明
图1A-B是基于查询确定话题提示的示例环境的框图。
图2是响应于接收到查询,提供话题提示的过程的流程图。
图3是基于与话题提示关联的得分选择话题提示的过程的流程图。
各种图中的相似标号和名称指示相似的元件。
具体实施方式
§1.0概述
有时当用户录入搜索查询时,呈现给用户的搜索结果不是用户所要寻找的,用户必须修正搜索查询。例如,用户可查询“旧金山的餐馆”,查看搜索结果,然后查询“旧金山的意式餐馆”。当用户在移动平台上利用口述查询或者文本查询交互时,后者的查询修正可能特别难以输入,因为在这些装置上输入方法常常受到限制。
下面所述的***和方法有利于以流畅和直观的方式精化查询。当搜索***从用户装置接收第一查询时,搜索***从日志检索其它查询,其中其它查询满足与第一查询的阈值水平的相似度,针对第一查询确定查询精化,其中查询精化来自其它查询,使查询精化群集,其中每个精化集群与精化话题关联,并且基于精化集群选择一个或多个精化集群话题。搜索***可基于所选择的精化集群话题来提供精化集群话题作为对用户的话题提示,以允许用户精化提供给用户装置的搜索结果。
例如,当用户请求“旧金山的餐馆”时,搜索***可确定对餐馆的先前查询常常包括风味类型(例如,基于集群),向用户提供搜索结果,并且提示用户“你要寻找哪种风味类型?”。当用户以“我要寻找法式”响应***提示时,***向用户提供响应于“旧金山的法式餐馆”的搜索结果,并且可包括附加查询精化,例如提示用户在旧金山的具***置。
§1.1示例操作环境
图1是基于查询来确定话题提示的示例环境100的框图。对话题提示的用户响应允许用户精化查询,而无需录入新的查询,并且响应于查询和话题提示响应二者来向用户提供搜索结果。
诸如局域网(LAN)、广域网(WAN)、互联网或其组合的计算机网络102连接发布者网站104、用户装置106和搜索引擎110。在线环境100可包括成千上万的发布者网站104和用户装置106。
发布者网站104包括与域关联的一个或多个资源105并且通过一个或多个位置中的一个或多个服务器来托管。通常,网站是超文本标记语言(HTML)格式的网页的集合,其可包含文本、图像、多媒体内容和编程元素,例如,脚本。各个发布者网站104由内容发布者来维护,内容发布者是控制、管理和/或拥有发布者网站104的实体。
资源是可由发布者网站104经网络102提供并且具有资源地址(例如,统一资源定位符(URL))的任何数据。资源105可以是HTML页面、电子文档、图像文件、视频文件、音频文件和原料来源等等。资源可包括嵌入式信息,例如,元信息和超链接,和/或嵌入式指令,例如,客户端脚本。
用户装置106是在用户的控制下的电子装置并且能够经网络102来请求和接收资源。示例用户装置106包括个人计算机、移动通信装置以及可经网络102发送和接收数据的其它装置。用户装置106通常包括用户应用,例如,web浏览器,以方便经网络102的数据的发送和接收。web浏览器可使得用户能够显示通常在万维网或局域网上的网站处的网页上的文本、图像、视频、音乐以及其它信息并与其交互。
为了方便这些资源105的搜索,搜索引擎110通过抓取发布者网站104并且索引发布者网站104所提供的资源105来识别资源。资源105被索引,并且索引数据被存储在索引112中。
用户装置106向搜索引擎110提交搜索查询109。搜索查询109以搜索请求的形式提交,其包括搜索请求,以及可选地,标识提交请求的用户装置106的唯一标识符。唯一标识符可以是来自存储在用户装置处的cookie的数据,或者如果用户有搜索引擎110的账户的话,用户账户标识符,或者标识用户装置106或者使用用户装置的用户的一些其它标识符。
响应于搜索请求,搜索引擎110使用索引112来识别与查询相关的资源。搜索引擎110以搜索结果的形式识别资源,并且在搜索结果页面资源111中将搜索结果返回给用户装置106。搜索结果是由搜索引擎110生成的数据,其识别资源或者提供满足特定搜索查询的信息。对资源的搜索结果可包括网页标题、从网页提取的文本片段以及该资源的资源定位符,例如,网页的URL。
基于与搜索结果所标识的资源有关的得分,诸如,信息检索(“IR”)得分以及可选地各个资源相对于其它资源的单独排名(例如,权威得分),来排名搜索结果。搜索结果根据这些得分来排序并且根据该顺序提供给用户装置。
用户装置106接收搜索结果页面111并且渲染该页面以便于呈现给用户。响应于用户在用户装置106处选择搜索结果,用户装置106请求由包括在所选择的搜索结果中的资源定位符标识的资源105。托管资源105的发布者网站104的发布者从用户装置106接收对资源的请求,并且将资源105提供给请求方用户装置106。
在一些实现方式中,从用户装置106提交的搜索查询109被存储在查询日志114中。针对被搜索结果引用并且被用户选择的查询和网页的选择数据被存储在选择日志116中。查询日志114和选择日志116限定搜索历史数据117,其包括来自与唯一标识符关联的先前搜索请求并与之有关的数据。选择日志表示响应于搜索引擎110所提供的搜索结果采取的动作。查询日志114和选择日志116可用于将用户装置所提交的查询映射至在搜索结果中标识的资源以及在响应于查询呈现搜索结果时用户所采取的动作。在一些实现方式中,数据与来自搜索请求的标识符关联,以使得可访问各个标识符的搜索历史。搜索引擎因此可使用选择日志116和查询日志114来确定用户装置106所提交的相应查询序列、响应于查询所采取的动作以及多久提交查询一次。
搜索引擎110在搜索会话期间使用查询日志和查询序列来确定对搜索查询所作的查询精化。例如,搜索引擎110确定用户可利用风味类型,诸如法式或意式,或者利用价格范围等等来修改初始搜索查询。
§1.2话题提示
搜索引擎110使用这些查询精化来确定话题提示以用于稍后的搜索会话。例如,在时间T1,用户录入搜索查询“旧金山的餐馆”并且用户的装置106将搜索查询提供给搜索引擎110。
精化生成器118利用搜索历史数据117,例如,查询日志114,来针对查询选择查询精化,其中查询精化满足与查询的阈值水平的相似度。例如,精化生成器118选择查询精化“旧金山的意式餐馆”、“旧金山的法式餐馆”、“旧金山的日式餐馆”、“旧金山联合广场附近的餐馆”和“旧金山码头附近的日式餐馆”。
在时间T2,精化生成器118为查询精化确定精化集群,其中各个精化集群与来自查询精化的话题关联。例如,精化生成器118按照类型来使查询精化群集,并且基于查询精化中的n元“意式”、“法式”和“日式”选择“风味”精化集群,并且基于n元“联合广场附近”和“码头附近”选择“位置”精化集群。这里,风味精化集群包括查询精化“旧金山的意式餐馆”、“旧金山的法式餐馆”、“旧金山的日式餐馆”和“旧金山码头附近的的日式餐馆”,并且位置精化集群包括查询精化“旧金山联合广场附近的餐馆”和“旧金山码头附近的日式餐馆”。
n元可以是来自给定文本序列的n个项的连续序列。n个项中的每一个可以是音素、音节、字母、单词、数字或者基础对等等。n的值可变化,例如对于一元为一,对于二元为二,依此类推。
精化生成器118将精化集群提供给集群评分***120,其对各个精化集群进行评分。例如,基于n元在与相应集群话题关联的查询精化中出现的数量,集群评分***120将风味精化集群与最高得分关联,并且将位置精化集群与较低得分关联。
集群选择器122选择具有最高得分的精化集群,并且基于该精化集群生成话题提示。例如,集群选择器122选择风味精化集群并且生成话题提示“你喜欢哪种风味?”。另选地,可选择n最高评分集群的集合,并且可生成各个集群的话题提示。
搜索引擎110从集群选择器122接收话题提示,并且在时间T3,将该话题提示提供给用户的装置106。例如,用户的装置106向用户提供言语提示“你喜欢哪种风味?”。
在一些实现方式中,在时间T3,搜索引擎向用户的装置提供响应于查询的搜索结果。例如,搜索引擎110选择响应于查询“旧金山的餐馆”的搜索结果,并且将搜索结果随话题提示“你喜欢哪种风味?”一起提供给用户的装置106。
在时间T4,搜索引擎110从用户的装置106接收与话题提示关联的话题选择。例如,用户以“我喜欢法式餐馆”来响应话题提示,并且搜索引擎110接收用户响应“我喜欢法式餐馆”。在一些实现方式中,当口述输入用户输入时,搜索引擎110从转录器接收用户输入的转录。另选地或者另外,子话题的选择可被显示给用户。例如,在图1的示例中,可显示“法式”、“日式”等选择。
搜索引擎110确定响应于查询和用户响应的搜索结果,并且在时间T5,将搜索结果提供给用户的装置106。例如,搜索引擎110选择响应于修正的查询“旧金山的法式餐馆”的搜索结果,包括搜索结果“CaféBastille”、“LaFolie”和“AmazingFrenchRestaurant”,并且将搜索结果提供给用户的装置106。
§2.0示例***过程流程
图1B是话题提示流程的更详细的例示。尽管下面所述的一些操作被描述为在从用户装置106a接收查询之前发生,但是在一些实现方式中,所有操作可在从用户装置106a接收查询之后响应于该查询来执行。例如,搜索引擎110可从用户装置106a接收查询,基于该查询选择查询精化,针对该查询确定一个或多个话题提示,并且将话题提示提供给用户装置106a。然而,出于例示目的,下面的大多数过程被描述为发生于从用户装置106a接收查询之前。例如,对于满足频率阈值的特定查询(例如,热门查询),可提前生成精化集群等等。
在图1B中,在时间t1,精化生成器118选择第一查询Q1。例如,精化生成器118从查询日志114选择经常出现的查询Q1。在一个示例中,精化生成器118选择“旧金山的餐馆”作为第一查询Q1
另选地,精化生成器118从查询日志114选择用户在搜索会话期间常常精化(例如,满足精化频率阈值)的查询。例如,基于在同一搜索会话期间具有初始查询“旧金山的餐馆”以及查询精化“旧金山的意式餐馆”、“旧金山的法式餐馆”、“旧金山的日式餐馆”、“旧金山联合广场附近的餐馆”和“旧金山码头附近的日式餐馆”的之前的搜索会话,精化生成器118选择“旧金山的餐馆”作为第一查询Q1
在时间t2,精化生成器118从查询日志114检索第二查询Qm,其中第二查询Qm中的各个查询满足与第一查询的阈值水平的相似度。可使用各种适当的过程来确定第二查询Qm是否与第一查询Q1相似。例如,精化生成器118可基于第一查询Q1和具有相似分类的第二查询Qm,诸如技术相关查询或者对特定类型的商店(诸如,餐馆或零售店)的查询,来确定相似度。相似度可基于搜索引擎110在与第一查询Q1相同的搜索会话期间接收第二查询Qm,或者搜索引擎110在不同的搜索会话期间从相同的用户装置接收查询,等等。
例如,精化生成器118从查询日志114选择查询“纽约的餐馆”、“旧金山的餐馆”、“纽约的墨西哥式餐馆”、“旧金山的意式餐馆”、“旧金山的法式餐馆”、“旧金山的日式餐馆”、“旧金山联合广场附近的餐馆”和“旧金山码头附近的日式餐馆”作为第二查询Qm,其中所有查询与对餐馆的相似分类的查询关联。另外,第一查询“旧金山的餐馆”包括在第二查询Qm中。
在时间t3,精化生成器118针对各个第二查询Qm确定查询精化Rm。例如,基于上述第二查询Qm,精化生成器选择“旧金山的意式餐馆”、“旧金山的法式餐馆”、“旧金山的日式餐馆”、“旧金山联合广场附近的餐馆”和“旧金山码头附近的日式餐馆”作为查询精化Rm,其中基于n元“纽约”,对“纽约的餐馆”的查询未包括在查询精化Rm中。如下面更详细讨论的,另选方法可包括查询“纽约的墨西哥式餐馆”作为查询精化。
在时间t4,精化生成器118基于与查询精化Rm关联的话题将查询精化Rm群集,以创建精化集群RCm。精化集群RCm中的各个查询精化R来自查询精化Rm,并且对于特定一个精化集群中的每一个查询精化R,查询精化R的话题之一与该特定精化集群的话题相同。可使用各种适当的群集算法来创建集群。
例如,精化生成器118基于n元“意式”、“法式”和“日式”创建具有话题“风味”以及查询精化“旧金山的意式餐馆”、“旧金山的法式餐馆”、“旧金山的日式餐馆”和“旧金山码头附近的日式餐馆”的“风味”精化集群,其中该风味精化集群中的所有查询精化具有与“旧金山的$cuisine_type餐馆”相似的模式。精化生成器118还基于n元“联合广场附近”和“码头附近”创建具有话题“位置”以及查询精化“旧金山联合广场附近的餐馆”和“旧金山码头附近的日式餐馆”的“位置”精化集群,其中该位置精化集群中的所有查询精化具有与“旧金山$location附近的餐馆”相似的模式。在一些实现方式中,集群类型可以是突现的,例如,可不预定义集群。基于集群名称来选择集群类型变量,例如,对于风味,该变量是$cuisine_type,等等。查询精化可基于变量类型和适当的自然语言过程来生成。例如,“$cuisine_type”的值是修饰“餐馆”的形容词,因此,自然语言过程生成精化“旧金山的$cuisine_type餐馆”。
在时间t5,集群评分***120对各个精化集群RCm进行评分,使得得分Sm的集合包括精化集群RCm中的各个精化集群R的得分。例如,集群评分***120基于在与特定集群话题关联的查询精化中n元出现的数量来对精化集群RCm进行评分。在此示例中,集群评分***120基于“意式”和“法式”均出现一次,“日式”出现两次而将风味精化集群与得分四关联,基于“联合广场附近”和“码头附近”均出现一次而将位置精化集群与得分二关联。
另选地,集群评分***120可基于n元的唯一出现来对精化集群RCm进行评分。例如,集群评分***120基于n元“意式”、“法式”和“日式”而将风味精化集群与得分三关联,基于n元“联合广场附近”和“码头附近”而将位置精化集群与得分二关联。在其它实现方式中,集群评分***120使用不同的方法来对精化集群RCm进行评分。
集群选择器122基于与精化集群RCm关联的得分Sm来对精化集群RCm进行排名,在时间t6从精化集群RCm确定得分大于精化集群RCm中的其它精化集群R的得分的精化集群RCn,并且在时间t7,选择精化集群RCn作为第一查询Q1的第一搜索精化SRn。例如,集群选择器122确定风味精化集群具有得分四,位置精化集群具有得分二,并且选择“风味类型”作为第一搜索精化SRn。搜索引擎110然后可基于第一查询Q1利用第一搜索精化SRn执行搜索操作。
在一些实现方式中,搜索操作包括向用户装置提供话题提示,例如,在时间t8,搜索引擎110从用户装置106a接收第三查询Q3。在时间t9,搜索引擎110确定第三查询Q3与第一查询Q1相同,并且在时间t10将搜索建议SSn作为话题提示提供给用户装置106a,其中搜索建议SSn基于第一搜索精化SRn。例如,搜索引擎110从用户装置106a接收查询Q2“旧金山的餐馆”,基于Q2与Q1相同来确定风味类型的第一搜索精化SRn与查询Q2关联,并且将搜索建议“你喜欢哪种风味?”提供给用户装置106a。
在某些实现方式中,搜索引擎110对与精化集群话题关联的子话题进行排名,并且将排名最高的子话题提供给用户装置106a作为话题提示的可能的搜索精化。例如,集群选择器122确定在风味精化集群中与风味话题关联的被包括在查询精化中的n元,基于相似的子话题(例如,日式、意式、法式等)使相似的n元群集,对子话题进行排名,并且选择排名最高的子话题作为搜索引擎110可提供给用户装置106a的选择类别。
在一个示例中,对于风味精化集群,集群选择器122选择日式、意式和法式的子话题,基于与出现在风味精化集群中的特定子话题关联的n元的出现来对子话题进行排名,并且将排名最高的一个或多个子话题提供给搜索引擎110。当集群选择器122确定日式、法式和意式是风味精化集群的排名最高的子话题时,搜索引擎110可向用户装置106a提供话题提示“你喜欢哪种风味——日式、法式、意式还是一些其它类型的风味?”。用户装置106a可将该话题提示在图形用户界面中(例如,其中各个子话题与子话题选择选项关联)或者作为言语提示呈现给用户。可使用各种适当的群集算法来创建子话题集群,并且可使用各种适当的排名算法来对子话题进行排名。
§3.0示例查询服务器过程流程
图2是响应于接收到查询,提供话题提示数据的过程200的流程图。图1A-B的搜索引擎110可使用过程200来向用户装置106a提供话题提示数据。
过程200接收第一查询(202)。例如,搜索引擎确定在查询日志中最常出现的查询,并且从在查询日志中最常出现的查询选择第一查询。例如,搜索引擎从查询日志选择查询“旧金山的餐馆”,其中独立于搜索引擎从用户接收第一查询来进行该选择。
过程200基于第一查询确定第二查询(204)。各个第二查询是满足与第一查询的阈值水平的相似度的查询。例如,相似度可以基于包括第一查询的所有n元的查询,或者具有与第一查询相同的一般话题的查询(例如,餐馆查询、对特定类型的技术的查询等),等等。
过程200基于第二查询中的查询来确定查询精化(206)。对于各个第二查询,精化生成器基于第二查询来确定查询精化。例如,精化生成器从第二查询Qm选择作为第一查询Q1的精化的查询精化Rm。查询精化Rm中的各个查询可以是在之前的用户会话中作为第一查询Q1的精化输入的查询,或者包括来自第一查询Q1的所有n元或者相似的n元的查询,等等。在一些实现方式中,查询精化Rm中的各个查询是在第一查询Q1之后输入的查询并且在用户会话期间没有介于其间的查询。
另选地,当过程不包括步骤204时,精化生成器基于第一查询Q1选择查询精化Rm。例如,当精化生成器确定查询日志包括针对第一查询Q1的阈值量以上的查询精化时,精化生成器使用第一查询的查询精化作为查询精化Rm,代替第二查询的查询精化。
过程200生成精化集群(208)。精化集群从查询精化生成,各个精化集群对应于特定话题,并且各个精化集群包括被确定为属于精化集群所对应于的特定话题的查询精化。例如,精化生成器基于与查询精化Rm中的查询关联的不同话题来创建精化集群RCm,使得各个查询精化可被包括在不止一个精化集群RCm中。
在一些实现方式中,精化生成器为其中不存在与也被包括在第一查询Q1中的任何话题关联的n元的精化集群RCm选择话题。例如,精化生成器选择查询精化“旧金山的法式餐馆”,确定话题“风味”不与第一查询“旧金山的餐馆”中的n元关联,而话题“城市”(例如,旧金山)和“服务类型”(例如,餐馆)被包括在第一查询Q1中,并且创建风味精化集群。
过程200对精化集群进行排名(210)。例如,集群评分***基于包括在相应精化集群中的查询精化将得分与各个精化集群RCm关联。例如,集群评分***将最高得分与风味精化集群关联。
过程200选择在排名中相对于其它精化集群排名最高的精化集群作为查询的第一搜索精化集群(212)。例如,集群选择器确定第一搜索精化集群SRn与精化集群RCm中的集群的最高得分关联,并且搜索引擎通过继续过程200利用第一搜索精化集群SRn并基于第一查询Q1来执行搜索操作。例如,集群选择器确定风味精化集群与最高得分关联并且选择风味精化集群作为第一搜索精化集群SRn
集群选择器将与第一查询Q1和第一搜索精化集群SRn关联的数据存储在存储器中以便于稍后使用。例如,在搜索会话期间从用户装置接收第一查询Q1以及在同一搜索会话期间将第一搜索精化集群SRn提供给用户装置之前,搜索引擎利用查询日志执行步骤202至212。搜索引擎可执行步骤202至212并且将第一搜索精化集群SRn存储在存储器中以减少对搜索引擎常常接收的查询的计算。另选地,搜索引擎可响应于从用户装置接收到第一查询Q1而执行步骤202至212。
过程200接收与第一查询匹配的第三查询(214)。例如,精化集群在查询时间之前被生成并被存储在存储器中,并且在查询时间,搜索引擎从用户装置接收第三查询Q3,确定第三查询Q3与第一查询Q1相同,并且从存储器检索精化集群。
另选地,搜索引擎可确定第三查询Q3与第一查询Q1基本上相同或者相似。例如,搜索引擎确定响应于第三查询Q3的搜索结果也按照相同的顺序响应于第一查询Q1。在一个示例中,搜索引擎确定查询“旧金山餐馆”与查询“旧金山的餐馆”基本上相同。
过程200基于第一搜索精化集群生成话题提示数据(216)。话题提示数据可以基于与第一搜索精化集群关联的话题,并且可描述对属于与第一搜索精化集群关联的话题的n元的第一用户输入的请求。例如,搜索引擎利用第一搜索精化集群SRn并且基于第一查询Q1创建搜索建议SSn作为话题提示数据。这里,由搜索引擎执行的搜索操作是生成话题提示数据。例如,当第一搜索精化集群SRn是风味精化集群时,搜索引擎生成话题提示数据“你喜欢哪种风味?”。
过程200基于话题提示数据接收话语的数字表示(218)。例如,搜索引擎将话题提示数据提供给话语生成***,该***创建话题提示数据的话语的数字表示并且将该话语的数字表示提供给搜索引擎。
过程200响应于第三查询提供话语的数字表示(220)。例如,搜索引擎将话语的数字表示提供给用户装置,用户装置将话语的数字表示播放给用户,以向用户呈现话题提示数据。
以上描述的过程200中的步骤的顺序仅是例示性的,并且话题提示数据的选择和传送可按照不同的顺序来进行。例如,过程200可在基于第一查询确定第二查询之前接收第三查询。在另一示例中,过程可在接收第三查询Q3之前基于第一精化集群生成话题提示数据。
在一些实现方式中,过程200可包括另外的步骤、更少步骤,或者一些步骤可被分成多个步骤。例如,搜索引擎可执行步骤202至212,而不执行步骤214至220中的一个或多个。另选地,搜索引擎可执行步骤202以及206至212。例如,搜索引擎基于第一查询,代替第二查询中的查询,来确定查询精化。
在一个示例中,搜索引擎可在接收话语的数字表示之前向话语生成***请求话语的数字表示。
在另一示例中,由搜索引擎执行的搜索操作包括向用户装置提供话题提示数据,其中第三查询和用户装置与同一用户会话关联。例如,搜索引擎将搜索建议“你喜欢哪种风味?”提供给用户装置。
搜索引擎接收属于与第一搜索精化集群关联的话题的n元的选择,其中该选择与第三查询的相同用户会话关联,并且该选择紧接第三查询之后,对于用户会话没有介于其间的其它用户输入。例如,选择指示用户装置的用户想要法式餐馆的搜索结果。
然后,搜索引擎将响应于第一查询的搜索结果和选择提供给用户装置。例如,搜索引擎将响应于“旧金山的法式餐馆”的搜索结果提供给用户装置。
在一些实现方式中,当精化生成器确定在步骤206中没有确定最小量的查询精化时,精化生成器重复步骤206。例如,如果精化生成器首先基于第一查询确定查询精化,其中查询精化的量不大于查询精化的最小量,则精化生成器可基于第二查询或者与第二查询相似的其它查询来确定查询精化。精化生成器可重复步骤206,在用于识别查询精化的查询上扩展,直至确定了最小量的查询精化。
在某些实现方式中,最小量的查询精化基于生成精化集群所需的最小数量的查询精化来确定。
图3是基于与话题提示数据关联的得分选择话题提示数据的过程300的流程图。图1A-B的搜索引擎110可使用过程300来对查询精化集群进行评分并且选择评分最高的精化集群。例如,当搜索引擎110执行过程200时,搜索引擎110可执行过程300,代替步骤210和212。
过程300基于与精化集群的特定话题关联的n元出现在精化集群中所包括的查询中的次数来对各个精化集群进行评分(302)。例如,对于特定一个精化集群RCm中的各个查询精化,集群评分***分析查询精化中的n元以确定n元是否对应于特定精化集群的话题。当集群评分***在查询精化中定位出与特定精化集群的话题对应的n元时,集群评分***增加该特定精化集群的得分。
过程300基于与精化集群关联的得分来对精化集群进行排名(304)。相对于其它精化集群排名最高的精化集群具有精化集群的最高得分。例如,集群选择器选择具有精化集群RCm的最高得分的评分最高的精化集群。
过程300确定精化集群的最高得分是否大于阈值(306)。例如,集群选择器将评分最高的精化集群的最高得分与阈值得分值进行比较,并且确定该最高得分是否大于阈值得分值。
如果最高得分大于阈值,则过程300选择与该最高得分关联的精化集群作为第一查询的第一搜索精化集群(308)。例如,集群选择器确定最高得分大于阈值得分值并且选择评分最高的精化集群RCn
在一些实现方式中,过程300可包括另外的步骤、更少步骤,或者一些步骤可被分成多个步骤。例如,搜索引擎可在对精化集群进行评分之后向用户装置提供多个话题提示。
具体地讲,在选择评分最高的精化集群作为第一搜索精化集群之后,搜索引擎接收第三查询,该第三查询与第一查询匹配并且针对与用户装置关联的用户会话。例如,搜索引擎从用户装置接收查询“旧金山的餐馆”。
搜索引擎向用户装置提供用户会话的第一话题提示数据,其中搜索引擎基于与第一搜索精化集群关联的话题来生成第一话题提示数据,并且第一话题提示数据描述对属于与第一搜索精化集群关联的话题的n元的第一用户输入的请求。例如,搜索引擎向用户装置提供第一搜索建议“你喜欢哪种风味?”,其中该第一搜索精化集群是风味精化集群。
搜索引擎接收对用户会话的第一选择,其中第一选择是针对属于与第一搜索精化集群关联的话题的n元。例如,搜索引擎从用户装置接收选择“我喜欢法式餐馆”。
搜索引擎对于用户装置并且针对用户会话提供第二话题提示数据,其中搜索引擎基于与具有精化集群RCm的第二最高得分的第二搜索精化集群关联的话题来生成第二搜索建议,第二话题提示数据描述对属于与第二搜索精化集群关联的话题的n元的第二用户输入的请求。例如,搜索引擎确定精化集群RCm中的评分第二高的精化集群的第二高得分。搜索引擎将第二高得分与阈值得分值进行比较,确定第二高得分大于阈值,基于评分第二高的精化集群生成第二话题提示数据,并且将第二话题提示数据提供给用户装置。这里,搜索引擎可基于与第二最高得分关联的位置精化集群来向用户装置提供第二搜索建议“你正在寻找特定位置?”。
另选地,搜索引擎基于从第一查询和第一选择的组合确定的查询精化来选择第二话题提示数据。例如,当第一查询是“旧金山的餐馆”并且第一选择是“我喜欢法式餐馆”时,搜索引擎基于查询“旧金山的法式餐馆”的排名最高的查询精化来选择第二话题提示数据。
搜索引擎接收属于与第二搜索精化集群关联的话题的n元的第二选择,其中第二选择在没有任何介于其间的用户输入的情况下在第一选择之后连续地接收并且与该用户会话关联。例如,搜索引擎接收“联合广场附近”的第二选择。
搜索引擎确定响应于第一查询、第一选择和第二选择的搜索结果,并且将搜索结果提供给与用户会话关联的用户装置。例如,搜索引擎确定响应于查询“旧金山联合广场附近的法式餐馆”的搜索结果,并且将搜索结果提供给用户装置。
搜索引擎可通过向用户装置提供附加话题提示数据来重复精化过程,直至搜索引擎确定不存在满足对第一查询或者第一查询与从用户装置接收的选择的组合的阈值水平的相关性的附加话题提示。
§3.1附加评分和选择细节
在一些实现方式中,精化生成器基于与第一查询相似但是不包含第一查询的所有n元的查询来确定查询的精化集群。例如,当第一查询是“旧金山的餐馆”时,精化生成器将“纽约的墨西哥式餐馆”和“洛杉矶的法式餐馆”包括在查询精化Rm中。这里,精化生成器识别“$city的餐馆”的基本查询模式,其中“$city”是表示包括在来自查询日志的查询中的任何城市名称的变量。当精化生成器确定查询匹配基本查询模式时,精化生成器将该查询包括在查询精化Rm和精化集群RCm中用于确定搜索精化SRn
这允许搜索引擎接收“$city的餐馆”形式的任何第一查询并且利用查询精化Rm来选择话题提示。例如,搜索引擎可接收查询“旧金山的餐馆”和“纽约的餐馆”并且针对两个查询使用相同的话题提示(例如,搜索建议SSn)。另外,当特定查询不具有任何查询精化时,搜索引擎使用用于该特定查询的模式来定位相似查询的查询精化,其也可用于该特定查询。
在一些实现方式中,当精化生成器使用基本查询模式时,精化生成器基于查询精化中的变量的值是否与来自第一查询的值相似来对精化集群RCm进行评分。例如,当第一查询是“旧金山的餐馆”时,在对精化集群RCm进行排名时与查询精化“洛杉矶的法式餐馆”和“纽约联合广场附近的餐馆”相比,查询精化“旧金山的法式餐馆”将与更大的权重值关联。
在一些实现方式中,搜索引擎基于查询精化中的n元与第一查询Q1之间的相似度水平来对各个精化集群RCm进行评分。例如,当第一查询是“旧金山的餐馆”时,与风味精化集群的查询精化“旧金山的法式咖啡馆”相比,查询精化“旧金山的法式餐馆”与更高的权重值关联。
在一些实现方式中,集群评分***在对精化集群RCm进行评分时使用用户装置的位置。例如,从与提供第一和第二查询的用户装置相同的区域中的用户装置接收的查询精化可与更高的权重值关联。
在一些实现方式中,集群评分***在对精化集群RCm进行评分时使用与用户装置和/或用户装置的用户关联的搜索历史。例如,与其它查询精化相比,搜索引擎先前从用户装置接收的或者与从用户装置接收的查询精化相似的查询精化与更高的权重值关联。
在一些实现方式中,当搜索引擎选择多个话题提示以提供给用户装置时,如果搜索引擎接收到对响应于第二话题提示的第一话题提示的响应,则搜索引擎不向用户装置提供第二话题提示。例如,搜索引擎选择搜索建议“你喜欢哪种风味?”和“你正在寻找特定位置?”并且向用户装置提供搜索建议“你喜欢哪种风味?”。当搜索引擎从用户装置接收到诸如“码头附近的法式餐馆”或者“码头附近的餐馆”的响应,其中用户分别指定响应中的附加搜索限制或者不与搜索建议关联的搜索限制时,搜索引擎将搜索限制与第二搜索建议“你正在寻找特定位置?”进行比较,确定接收到响应于该搜索建议的数据,并且不向用户装置提供第二搜索建议。然后,搜索引擎可根据附加话题提示是否满足与第一查询或者第一查询和接收自用户装置的响应的组合的阈值水平的相关性(例如,基于阈值得分值)来向用户装置提供附加话题提示(例如,搜索建议)。
在一些实现方式中,由搜索引擎利用第一搜索精化集群执行的搜索操作包括生成话题特定问题。例如,当第一搜索精化集群是风味精化集群时,搜索引擎可生成问题“你想要旧金山的法式餐馆?”作为话题提示,并且将该问题提供给用户装置。搜索引擎可基于与向搜索引擎提供第一查询的用户或者用户装置关联的先前查询来选择问题。例如,搜索引擎使用搜索历史数据来确定用户通常搜索法式餐馆。
由搜索引擎接收的响应于问题的选择可以是简短的是或否响应,或者可更详细。例如,搜索引擎接收诸如“是,码头附近”的响应,并且使用附加位置信息来识别响应于“旧金山码头附近的法式餐馆”的搜索结果。在另一示例中,当搜索引擎接收到响应“不,正在找中式餐馆”时,搜索引擎识别响应于“旧金山的中式餐馆”的搜索结果。
§4.0附加实现细节
本说明书中所描述的主题和操作的实施例可被实现于数字电子电路中、或者计算机软件、固件或硬件中(包括本说明书中所公开的结构及其结构上的等同物)、或者它们中的一个或多个的组合中。本说明书中所描述的主题的实施例可被实现为一个或多个计算机程序,即,计算机程序指令的一个或多个模块,其被编码于计算机存储介质上以便于由数据处理设备执行或者控制数据处理设备的操作。另选地或者另外,程序指令可被编码于人为生成的传播信号上,例如机器生成的电、光学或者电磁信号,其被生成以对信息进行编码以用于传输给合适的接收机设备以便于数据处理设备执行。计算机存储介质可以是或者可被包括在计算机可读存储装置、计算机可读存储基底、随机或串行存取存储器阵列或装置、或者它们中的一个或多个的组合中。此外,尽管计算机存储介质不是传播信号,但是计算机存储介质可以是被编码于人为生成的传播信号中的计算机程序指令的源或目的地。计算机存储介质还可以是或者被包括在一个或多个单独的物理组件或介质(例如,多张CD、盘或者其它存储装置)中。
本说明书中所描述的操作可被实现为由数据处理设备对存储在一个或多个计算机可读存储介质上的或者从其它源接收的数据执行的操作。
术语“数据处理设备”涵盖了用于处理数据的所有类型的设备、装置和机器,包括例如可编程处理器、计算机、芯片上***或者上述中的多个或组合。设备可包括专用逻辑电路,例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)。除了硬件以外,设备还可包括为所涉及的计算机程序创建执行环境的代码,例如构成处理器固件、协议栈、数据库管理***、操作***、跨平台运行环境、虚拟机或者它们中的一个或多个的组合的代码。设备和执行环境可实现各种不同的计算模型基础结构,例如web服务、分布式计算和网格计算基础结构。
计算机程序(也称作程序、软件、软件应用、脚本或代码)可按照包括编译或解释语言、声明或过程语言的任何形式的编程语言来编写,并且它可按照任何形式来部署,包括作为独立程序或者作为模块、组件、子例程、对象或者适合用在计算环境中的其它单元。计算机程序可以,但无需,对应于文件***中的文件。程序可被存储在保存其它程序或数据的文件的一部分(例如,存储在标记语言文档中的一个或多个脚本)中、专用于所涉及的程序的单个文件中、或者多个协同的文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。计算机程序可被部署为在一个计算机上或者在位于一个地点或分布在多个地点并通过通信网络互连的多个计算机上执行。
本说明书中所描述的过程和逻辑流程可由一个或多个可编程处理器来执行,其执行一个或多个计算机程序以通过对输入数据操作并生成输出来执行动作。过程和逻辑流程还可由专用逻辑电路执行并且设备也可被实现为专用逻辑电路,例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)。
适合于执行计算机程序的处理器包括例如通用和专用微处理器以及任何类型的数字计算机的任一个或多个处理器。通常,处理器将从只读存储器或者随机存取存储器或者这二者接收指令和数据。计算机的基本元件是用于依据指令执行动作的处理器以及用于存储指令和数据的一个或多个存储器装置。通常,计算机还将包括用于存储数据的一个或多个大容量存储装置(例如,磁盘、磁光盘或光盘),或者在操作上耦合以从其接收数据或向其传送数据,或者这二者。然而,计算机无需具有此类装置。此外,计算机可被嵌入另一装置中,例如移动电话、个人数字助理(PDA)、移动音频或视频播放器、游戏机、全球定位***(GPS)接收器、或者便携式存储装置(例如,通用串行总线(USB)闪速驱动器)等等。适合于存储计算机程序指令和数据的装置包括所有形式的非易失性存储器、介质和存储器装置,包括例如半导体存储器装置,例如EPROM、EEPROM和闪速存储器装置;磁盘,例如内部硬盘或可移除盘;磁光盘;以及CDROM和DVD-ROM盘。处理器和存储器可通过专用逻辑电路来补充或者被并入其中。
为了提供与用户的交互,本说明书中所描述的主题的实施例可被实现于具有用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或LCD(液晶显示器)监视器)以及用户可通过其向计算机提供输入的键盘和指点装置(例如,鼠标或者轨迹球)的计算机上。也可使用其它类型的装置来提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈,例如视觉反馈、听觉反馈或者触觉反馈;并且来自用户的输入可按照任何形式来接收,包括声音、话语或触觉输入。另外,计算机可通过向用户所使用的装置发送文档以及从其接收文档(例如,通过响应于从用户的用户装置上的web浏览器接收的请求向该web浏览器发送网页)来与用户交互。
本说明书中所描述的主题的实施例可被实现于包括后端组件(例如数据服务器)或者包括中间件组件(例如应用服务器)或者包括前端组件(例如具有图形用户界面或者Web浏览器的用户计算机,用户可通过其来与本说明书中所描述的主题的实现方式交互)或者一个或多个此类后端、中间件或前端组件的任何组合的计算***中。***的组件可通过任何形式或介质的数字数据通信(例如,通信网络)来互连。通信网络的示例包括局域网(“LAN”)和广域网(“WAN”)、网际网(例如,互联网)和端对端网络(例如,adhoc端对端网络)。
计算***可包括用户和服务器。用户和服务器通常彼此远离,并且通常通过通信网络来交互。用户和服务器的关系通过在相应计算机上运行并且彼此具有用户-服务器关系的计算机程序来建立。在一些实施例中,服务器将数据(例如,HTML页面)发送给用户装置(例如,为了将数据显示给与用户装置交互的用户以及从该用户接收用户输入)。在服务器处可从用户装置接收在用户装置处生成的数据(例如,用户交互的结果)。
尽管本说明书包含许多具体实现方式细节,但是这些细节不应被解释为对任何发明或者要求保护的内容的范围的限制,而应当被解释为针对特定发明的特定实施例的特征的描述。在本说明书中在单独的实施例的背景下描述的某些特征也可被组合地实现于单个实施例中。相反地,在单个实施例的背景下描述的各种特征也可单独地或者按照任何合适的子组合被实现于多个实施例中。此外,尽管上面可能将特征描述为按照某些组合起作用并且甚至初始如此要求保护,但是来自要求保护的组合的一个或多个特征在一些情况下可从组合中删去,并且要求保护的组合可涉及子组合或者子组合的变体。
类似地,尽管在附图中按照特定顺序描绘了操作,但是这不应被理解为要求这些操作以所示的特定顺序或者以连续顺序来执行,或者要求全部图示的操作均被执行才能实现所期望的结果。在某些环境中,多任务和并行处理可以是有利的。此外,在上述实施例中的各种***组件的分离不应被理解为在所有实施例中均要求这样的分离,应当理解,所描述的程序组件和***通常可被一起集成到单个软件产品中或者被封装到多个软件产品中。
因此,已描述了主题的特定实施例。其它实施例在以下权利要求的范围内。在一些情况下,权利要求中记载的动作可按照不同的顺序来执行并且仍然实现所期望的结果。另外,在附图中描绘的过程未必要求所示的特定顺序或者连续顺序才能实现所期望的结果。在某些环境中,多任务和并行处理可为有利的。

Claims (24)

1.一种方法,包括:
由一个或多个计算机接收第一查询;
基于所述第一查询确定查询精化;
从所述查询精化生成精化集群,每个精化集群与特定话题对应并且每个精化集群包括被确定为属于该精化集群所对应的所述特定话题的查询精化;
对所述精化集群进行排名;
选择在排名中相对于其它精化集群排名最高的精化集群作为所述第一查询的第一搜索精化集群;以及
基于与所述第一搜索精化集群关联的话题来生成第一话题提示数据,所述第一话题提示数据描述了对属于与所述第一搜索精化集群关联的话题的n元的第一用户输入的请求。
2.根据权利要求1所述的方法,进一步包括:
由所述一个或多个计算机基于所述第一查询确定第二查询,所述第二查询的每一个是满足与所述第一查询的阈值水平的相似度的查询,所述第一查询是所述第二查询中的一个;以及
对于所述第二查询中的每一个,基于该第二查询确定所述查询精化。
3.根据权利要求1所述的方法,进一步包括利用所述第一搜索精化集群并且基于所述第一查询来执行搜索操作。
4.根据权利要求3所述的方法,其中,执行所述搜索操作的步骤包括:
针对用户会话接收与所述第一查询匹配的第三查询;
针对所述用户会话提供所述第一话题提示数据;
针对所述用户会话接收对属于与所述第一搜索精化集群关联的话题的n元的选择,所述选择紧接所述第三查询之后而不存在其它介于其间的针对所述用户会话的用户输入;以及
针对所述用户会话提供响应于所述第一查询和所述选择的搜索结果。
5.根据权利要求3所述的方法,其中,执行所述搜索操作的步骤包括:
针对用户会话接收与所述第一查询匹配的第三查询;
基于所述第一话题提示数据接收话语的数字表示;以及
响应所述第三查询针对所述用户会话提供所述话语的所述数字表示。
6.根据权利要求1所述的方法,其中,与精化集群关联的特定话题是包括在所述精化集群中的查询中并且未包括在所述第一查询中的话题。
7.根据权利要求1所述的方法,其中,所述排名包括:
基于与所述精化集群的每一个的所述特定话题关联的n元出现在包括在该精化集群中的查询中的次数来对该精化集群进行评分;以及
基于与所述精化集群关联的得分来对所述精化集群进行排名,相对于其它精化集群排名最高的精化集群具有精化集群的最高得分。
8.根据权利要求7所述的方法,其中,所述选择包括:
确定所述最高得分是否大于阈值;以及
基于确定所述最高得分大于所述阈值,选择相对于其它精化集群排名最高的精化集群作为所述第一查询的所述第一搜索精化集群。
9.根据权利要求7所述的方法,该方法还包括:
针对用户会话接收与所述第一查询匹配的第三查询;
针对所述用户会话提供所述第一话题提示数据;
针对所述用户会话接收属于与所述第一搜索精化集群关联的话题的n元的第一选择;
针对所述用户会话基于与具有所述精化集群的第二高得分的第二搜索精化集群或者所述第一查询和所述第一选择的组合的最高评分组合精化集群关联的话题来提供第二话题提示数据,所述第二话题提示数据描述对属于与所述第二搜索精化集群关联的话题的n元的第二用户输入的请求;
针对所述用户会话接收属于与所述第二搜索精化集群关联的话题的n元的第二选择;以及
针对所述用户会话提供响应于所述第一查询、所述第一选择和所述第二选择的搜索结果。
10.根据权利要求9所述的方法,其中,所述最高得分和所述第二高得分高于阈值。
11.一种存储有指令的非暂时性计算机可读存储介质,所述指令能够由数据处理设备执行,并且在这样执行时使得所述数据处理执行操作,所述操作包括:
接收第一查询;
基于所述第一查询确定查询精化;
从所述查询精化生成精化集群,每个精化集群与特定话题对应并且每个精化集群包括被确定为属于该精化集群所对应的所述特定话题的查询精化;
对所述精化集群进行排名;
选择在排名中相对于其它精化集群排名最高的精化集群作为所述第一查询的第一搜索精化集群;以及
基于与所述第一搜索精化集群关联的话题来生成第一话题提示数据,所述第一话题提示数据描述了对属于与所述第一搜索精化集群关联的话题的n元的第一用户输入的请求。
12.根据权利要求11所述的非暂时性计算机可读存储介质,所述操作进一步包括:
基于所述第一查询确定第二查询,所述第二查询的每一个是满足与所述第一查询的阈值水平的相似度的查询,所述第一查询是所述第二查询中的一个;以及
对于所述第二查询的每一个,基于该第二查询确定所述查询精化。
13.根据权利要求11所述的非暂时性计算机可读存储介质,所述操作进一步包括利用所述第一搜索精化集群并且基于所述第一查询来执行搜索操作。
14.根据权利要求13所述的非暂时性计算机可读存储介质,其中,执行所述搜索操作包括:
针对用户会话接收与所述第一查询匹配的第三查询;
针对所述用户会话提供所述第一话题提示数据;
针对所述用户会话接收属于与所述第一搜索精化集群关联的话题的n元的选择,所述选择紧接所述第三查询之后而不存在其它介于其间的针对所述用户会话的用户输入;以及
针对所述用户会话提供响应于所述第一查询和所述选择的搜索结果。
15.根据权利要求11所述的非暂时性计算机可读存储介质,其中,与精化集群关联的特定话题是包括在所述精化集群中的查询中并且未包括在所述第一查询中的话题。
16.根据权利要求11所述的非暂时性计算机可读存储介质,其中,所述排名包括:
基于与所述精化集群的每一个的所述特定话题关联的n元出现在包括在该精化集群中的查询中的次数来对该精化集群进行评分;以及
基于与所述精化集群关联的得分来对所述精化集群进行排名,相对于其它精化集群排名最高的精化集群具有精化集群的最高得分。
17.根据权利要求16所述的非暂时性计算机可读存储介质,所述操作还包括:
针对用户会话接收与所述第一查询匹配的第三查询;
针对所述用户会话提供所述第一话题提示数据;
针对所述用户会话接收属于与所述第一搜索精化集群关联的话题的n元的第一选择;
针对所述用户会话基于与具有所述精化集群的第二高得分的第二搜索精化集群或者所述第一查询和所述第一选择的组合的最高评分组合精化集群关联的话题来提供第二话题提示数据,所述第二话题提示数据描述对属于与所述第二搜索精化集群关联的话题的n元的第二用户输入的请求;
针对所述用户会话接收属于与所述第二搜索精化集群关联的话题的n元的第二选择;以及
针对所述用户会话提供响应于所述第一查询、所述第一选择和所述第二选择的搜索结果。
18.一种***,包括:
数据处理设备;以及
与所述数据处理设备数据通信并且存储有指令的非暂时性计算机可读存储介质,所述指令能够由数据处理设备执行,并且在这样执行时使得所述数据处理执行操作,所述操作包括:
接收第一查询;
基于所述第一查询确定查询精化;
从所述查询精化生成精化集群,每个精化集群与特定话题对应并且每个精化集群包括被确定为属于该精化集群所对应的所述特定话题的查询精化;
对所述精化集群进行排名;
选择在排名中相对于其它精化集群排名最高的精化集群作为所述第一查询的第一搜索精化集群;以及
基于与所述第一搜索精化集群关联的话题来生成第一话题提示数据,所述第一话题提示数据描述了对属于与所述第一搜索精化集群关联的话题的n元的第一用户输入的请求。
19.根据权利要求18所述的***,所述操作进一步包括:
基于所述第一查询确定第二查询,所述第二查询的每一个是满足与所述第一查询的阈值水平的相似度的查询,所述第一查询是所述第二查询中的一个;以及
对于所述第二查询的每一个,基于该第二查询确定所述查询精化。
20.根据权利要求18所述的***,所述操作进一步包括利用所述第一搜索精化集群并且基于所述第一查询来执行搜索操作。
21.根据权利要求20所述的***,其中,执行所述搜索操作包括:
针对用户会话接收与所述第一查询匹配的第三查询;
针对所述用户会话提供所述第一话题提示数据;
针对所述用户会话接收属于与所述第一搜索精化集群关联的话题的n元的选择,所述选择紧接所述第三查询之后而不存在其它介于其间的针对所述用户会话的用户输入;以及
针对所述用户会话提供响应于所述第一查询和所述选择的搜索结果。
22.根据权利要求18所述的***,其中,与精化集群关联的特定话题是包括在所述精化集群中的查询中并且未包括在所述第一查询中的话题。
23.根据权利要求18所述的***,其中,所述排名包括:
基于与所述精化集群的每一个的所述特定话题关联的n元出现在包括在该精化集群中的查询中的次数来对该精化集群进行评分;以及
基于与所述精化集群关联的得分来对所述精化集群进行排名,相对于其它精化集群排名最高的精化集群具有精化集群的最高得分。
24.根据权利要求23所述的***,所述操作进一步包括:
针对用户会话接收与所述第一查询匹配的第三查询;
针对所述用户会话提供所述第一话题提示数据;
针对所述用户会话接收属于与所述第一搜索精化集群关联的话题的n元的第一选择;
针对所述用户会话基于与具有所述精化集群的第二高得分的第二搜索精化集群或者所述第一查询和所述第一选择的组合的最高评分组合精化集群关联的话题来提供第二话题提示数据,所述第二话题提示数据描述对属于与所述第二搜索精化集群关联的话题的n元的第二用户输入的请求;
针对所述用户会话接收属于与所述第二搜索精化集群关联的话题的n元的第二选择;以及
针对所述用户会话提供响应于所述第一查询、所述第一选择和所述第二选择的搜索结果。
CN201480031285.3A 2013-05-31 2014-05-20 一种基于搜索数据的查询建议的方法及*** Active CN105247516B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/906,669 2013-05-31
US13/906,669 US9336277B2 (en) 2013-05-31 2013-05-31 Query suggestions based on search data
PCT/US2014/038743 WO2014193698A1 (en) 2013-05-31 2014-05-20 Query suggestions based on search data

Publications (2)

Publication Number Publication Date
CN105247516A true CN105247516A (zh) 2016-01-13
CN105247516B CN105247516B (zh) 2019-08-27

Family

ID=51059549

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480031285.3A Active CN105247516B (zh) 2013-05-31 2014-05-20 一种基于搜索数据的查询建议的方法及***

Country Status (5)

Country Link
US (1) US9336277B2 (zh)
EP (1) EP3005167A1 (zh)
CN (1) CN105247516B (zh)
RU (1) RU2638728C2 (zh)
WO (1) WO2014193698A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021161202A1 (en) * 2020-02-15 2021-08-19 International Business Machines Corporation Graph convolutional networks for video grounding

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9116952B1 (en) 2013-05-31 2015-08-25 Google Inc. Query refinements using search data
US9864781B1 (en) * 2013-11-05 2018-01-09 Western Digital Technologies, Inc. Search of NAS data through association of errors
US9721024B2 (en) * 2014-12-19 2017-08-01 Facebook, Inc. Searching for ideograms in an online social network
US9792335B2 (en) * 2014-12-19 2017-10-17 International Business Machines Corporation Creating and discovering learning content in a social learning system
US10817519B2 (en) * 2016-06-06 2020-10-27 Baidu Usa Llc Automatic conversion stage discovery
US20180052885A1 (en) * 2016-08-16 2018-02-22 Ebay Inc. Generating next user prompts in an intelligent online personal assistant multi-turn dialog
US10803245B2 (en) * 2016-09-06 2020-10-13 Microsoft Technology Licensing, Llc Compiling documents into a timeline per event
US10860898B2 (en) 2016-10-16 2020-12-08 Ebay Inc. Image analysis and prediction based visual search
US11748978B2 (en) 2016-10-16 2023-09-05 Ebay Inc. Intelligent online personal assistant with offline visual search database
US11004131B2 (en) 2016-10-16 2021-05-11 Ebay Inc. Intelligent online personal assistant with multi-turn dialog based on visual search
US10970768B2 (en) 2016-11-11 2021-04-06 Ebay Inc. Method, medium, and system for image text localization and comparison
CN106528813B (zh) * 2016-11-18 2018-12-11 腾讯科技(深圳)有限公司 一种多媒体推荐方法和装置
US10878479B2 (en) 2017-01-05 2020-12-29 Microsoft Technology Licensing, Llc Recommendation through conversational AI
RU2711103C2 (ru) * 2017-12-27 2020-01-15 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер для прогнозирования предлагаемого варианта расширения частично введенного пользователем запроса
US11854040B1 (en) 2018-03-23 2023-12-26 Amazon Technologies, Inc. Responding with unresponsive content
US11544303B1 (en) * 2018-03-23 2023-01-03 Amazon Technologies, Inc. Responding with unresponsive content
US11315552B1 (en) 2018-03-23 2022-04-26 Amazon Technologies, Inc. Responding with unresponsive content
US11580127B1 (en) 2018-12-21 2023-02-14 Wells Fargo Bank, N.A. User interfaces for database visualizations
CN112989153B (zh) * 2019-12-13 2024-05-24 阿里巴巴集团控股有限公司 数据处理方法、装置及计算机设备
US11768837B1 (en) * 2021-12-28 2023-09-26 Wells Fargo Bank, N.A. Semantic entity search using vector space
US11880379B1 (en) 2022-04-28 2024-01-23 Wells Fargo Bank, N.A. Identity resolution in knowledge graph databases

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090089251A1 (en) * 2007-10-02 2009-04-02 Michael James Johnston Multimodal interface for searching multimedia content
US20100030769A1 (en) * 2008-08-04 2010-02-04 Microsoft Corporation Clustering question search results based on topic and focus
US20100299343A1 (en) * 2009-05-22 2010-11-25 Microsoft Corporation Identifying Task Groups for Organizing Search Results
US20110202533A1 (en) * 2010-02-17 2011-08-18 Ye-Yi Wang Dynamic Search Interaction
US8065316B1 (en) * 2004-09-30 2011-11-22 Google Inc. Systems and methods for providing search query refinements
US8135729B2 (en) * 2003-12-30 2012-03-13 Microsoft Corporation Incremental query refinement
CN102968480A (zh) * 2011-11-17 2013-03-13 微软公司 浏览器工具栏中的查询精化

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6163782A (en) 1997-11-19 2000-12-19 At&T Corp. Efficient and effective distributed information management
US6144958A (en) 1998-07-15 2000-11-07 Amazon.Com, Inc. System and method for correcting spelling errors in search queries
US7577643B2 (en) * 2006-09-29 2009-08-18 Microsoft Corporation Key phrase extraction from query logs
US8108416B2 (en) 2007-10-31 2012-01-31 Yahoo! Inc. System and method for updating a search results page in response to a user map interaction
US9978365B2 (en) * 2008-10-31 2018-05-22 Nokia Technologies Oy Method and system for providing a voice interface
US20100146012A1 (en) * 2008-12-04 2010-06-10 Microsoft Corporation Previewing search results for suggested refinement terms and vertical searches
US8145623B1 (en) 2009-05-01 2012-03-27 Google Inc. Query ranking based on query clustering and categorization
US8423538B1 (en) * 2009-11-02 2013-04-16 Google Inc. Clustering query refinements by inferred user intent
US20120259829A1 (en) 2009-12-30 2012-10-11 Xin Zhou Generating related input suggestions
US8392435B1 (en) 2010-04-14 2013-03-05 Google Inc. Query suggestions for a document based on user history
US8688727B1 (en) * 2010-04-26 2014-04-01 Google Inc. Generating query refinements
US9244984B2 (en) 2011-03-31 2016-01-26 Microsoft Technology Licensing, Llc Location based conversational understanding
US9767144B2 (en) * 2012-04-20 2017-09-19 Microsoft Technology Licensing, Llc Search system with query refinement
US9684395B2 (en) * 2012-06-02 2017-06-20 Tara Chand Singhal System and method for context driven voice interface in handheld wireless mobile devices
US9547647B2 (en) * 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8135729B2 (en) * 2003-12-30 2012-03-13 Microsoft Corporation Incremental query refinement
US8065316B1 (en) * 2004-09-30 2011-11-22 Google Inc. Systems and methods for providing search query refinements
US20090089251A1 (en) * 2007-10-02 2009-04-02 Michael James Johnston Multimodal interface for searching multimedia content
US20100030769A1 (en) * 2008-08-04 2010-02-04 Microsoft Corporation Clustering question search results based on topic and focus
US20100299343A1 (en) * 2009-05-22 2010-11-25 Microsoft Corporation Identifying Task Groups for Organizing Search Results
US20110202533A1 (en) * 2010-02-17 2011-08-18 Ye-Yi Wang Dynamic Search Interaction
CN102968480A (zh) * 2011-11-17 2013-03-13 微软公司 浏览器工具栏中的查询精化

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021161202A1 (en) * 2020-02-15 2021-08-19 International Business Machines Corporation Graph convolutional networks for video grounding
US11442986B2 (en) 2020-02-15 2022-09-13 International Business Machines Corporation Graph convolutional networks for video grounding
GB2608529A (en) * 2020-02-15 2023-01-04 Ibm Graph convolutional networks for video grounding

Also Published As

Publication number Publication date
RU2638728C2 (ru) 2017-12-15
US20140358906A1 (en) 2014-12-04
US9336277B2 (en) 2016-05-10
RU2015156488A (ru) 2017-07-05
WO2014193698A1 (en) 2014-12-04
EP3005167A1 (en) 2016-04-13
CN105247516B (zh) 2019-08-27

Similar Documents

Publication Publication Date Title
CN105247516A (zh) 基于搜索数据的查询建议
US11514035B1 (en) Query refinements using search data
US11797626B2 (en) Search result filters from resource content
JP6864107B2 (ja) 検索結果を提供する方法及び装置
US9183277B1 (en) Providing intent sensitive search results
CN104111972B (zh) 用于查询扩展的音译
JP5497022B2 (ja) 入力文字列からのリソースロケータの提案
CN105051732B (zh) 本地应用内容的排名
KR101708448B1 (ko) 예측 쿼리 제안 캐싱
KR100806862B1 (ko) 웹 사이트에서의 1차 키워드 검색에 대해 관련성 있는 2차키워드의 리스트를 제공하는 방법 및 장치
CN106446005B (zh) 因子分解模型
CN105224586A (zh) 从先前会话检索情境
CN101884042B (zh) 使用声誉度量来提高搜索相关度
US20230281664A1 (en) Serving advertisements based on partial queries
US9679027B1 (en) Generating related questions for search queries
CN105027121A (zh) 对本机应用的应用页面建索引
WO2015191688A1 (en) Ranking search results
CN107567620A (zh) 基于上下文的即时搜索建议
US20170177706A1 (en) Category-Based Search System and Method for Providing Application Related Search Results
US9251202B1 (en) Corpus specific queries for corpora from search query
US11341141B2 (en) Search system using multiple search streams
US20170103073A1 (en) Identifying Expert Reviewers
US10909112B2 (en) Method of and a system for determining linked objects

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: American California

Applicant after: Google limited liability company

Address before: American California

Applicant before: Google Inc.

GR01 Patent grant
GR01 Patent grant