CN107992514B - 结构化信息卡的搜索和检索 - Google Patents

结构化信息卡的搜索和检索 Download PDF

Info

Publication number
CN107992514B
CN107992514B CN201711019617.8A CN201711019617A CN107992514B CN 107992514 B CN107992514 B CN 107992514B CN 201711019617 A CN201711019617 A CN 201711019617A CN 107992514 B CN107992514 B CN 107992514B
Authority
CN
China
Prior art keywords
terms
structured information
information card
search query
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711019617.8A
Other languages
English (en)
Other versions
CN107992514A (zh
Inventor
马克·亚历山大·纳约尔克
苏吉特·拉维
迈克尔·本德斯基
彼得·绍-森·杨
蒂莫西·永珍·孙
张明阳
托马斯·尼尔森
王选会
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Priority to CN202210288188.9A priority Critical patent/CN114706882A/zh
Publication of CN107992514A publication Critical patent/CN107992514A/zh
Application granted granted Critical
Publication of CN107992514B publication Critical patent/CN107992514B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24534Query rewriting; Transformation
    • G06F16/24547Optimisations to support specific applications; Extensibility of optimisers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24564Applying rules; Deductive queries
    • G06F16/24565Triggers; Constraints
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请涉及结构化信息卡的搜索和检索。一种方法、***、装置,包括编码在计算机存储介质上的计算机程序,以便于识别用于结构化信息卡的附加触发词项。在一方面,该方法包括访问与用于呈现结构化信息的模板相关联的数据的动作,其中,所访问的数据引用(i)标签词项和(ii)值。其他动作可以包括获得候选标签词项,识别与标签词项相关联的一个或多个实体,识别与候选标签词项相关联的一个或多个实体,并且对于与候选标签词项相关联的一个或多个实体的每个特定实体,将下述与候选标签词项相关联:(i)与特定实体相关联的标签词项,以及(ii)与标签词项相关联的值。

Description

结构化信息卡的搜索和检索
技术领域
本说明书与搜索引擎有关。
背景技术
搜索查询可用于识别与用户的需要相关的资源(例如,web页面、图像、文本文档、电子邮件文档、多媒体内容等)并且用于以对用户最有用的方式呈现与资源有关的信息。计算机***可以接收搜索查询,对该搜索查询进行处理,识别与该搜索查询相关的结果,并且响应于用户提交的查询返回搜索结果集。
发明内容
在一些实施方式中,提供了可识别结构化信息卡的附加触发词项的卡触发词项识别单元。该卡触发词项识别单元允许通过评估潜在地包括在结构化信息卡的语法中的候选词项来随着时间的推移而调谐一个或多个结构化信息卡的语法。例如,假定“Movie(电影)”结构化信息卡的语法包括词项“movie time(电影时间)”、“movie ticket confirmation(电影票确认)”和“ticket confirmation number(票确认号码)”。该卡触发词项识别单元可以分析与“Movie”结构化信息卡的语法相关联的词项和一个或多个候选查询,并且识别“Movie”结构化信息卡的诸如触发词项“movie ticket(电影票)”的附加触发词项。因此,被接收到的包括诸如“movie time”、“movie ticket”或两者的词项的后续查询将响应于这样的查询而触发“Movie”结构化信息卡的显示。
根据一个实施方式,可以在促进识别结构化信息卡的附加触发词项的方法中具体实现本说明书的主题。所述方法可以包括响应于搜索查询而访问与用于呈现结构化信息的模板相关联的数据的动作,其中所访问的数据引用(i)一个或多个标签词项,所述一个或多个标签词项在被包括在所述搜索查询中时触发根据所述模板呈现所述结构化信息,以及(ii)用于所述一个或多个标签词项中的每一个标签词项的值,从而获取尚未与用于呈现所述结构化信息的所述模板相关联的候选标签词项。针对所述一个或多个标签词项中的每一个标签词项,识别与该标签词项相关联的一个或多个实体,识别与所述候选标签词项相关联的一个或多个实体。针对与所述候选标签词项相关联的所述一个或多个实体中的每一个实体,使以下两者与所述候选标签词项相关联:(i)和该实体相关联的所述一个或多个标签词项中的一个或多个,以及(ii)对于与该实体相关联的所述一个或多个标签词项中的所述一个或多个中的每一个标签词项,和该标签词项相关联的值;以及在随后接收到包括所述候选标签词项的搜索查询时,使用与所述候选标签词项相关联的一个或多个值来确定是否触发根据所述模板呈现所述结构化信息。
其它版本包括用于执行在计算机存储设备上编码的方法的动作的对应***、装置和计算机程序。
这些和其它版本可以可选地包括以下特征中的一个或多个。例如,在一些实施方式中,所述一个或多个标签词项与搜索查询的一个或多个参数相对应。
在一些实施方式中,所述值指示所述搜索查询已用于触发呈现所述结构化信息的次数。
在一些实施方式中,获取尚未与用于呈现所述结构化信息的所述模板相关联的候选标签词项可以包括从查询日志识别一个或多个查询词项。
在一些实施方式中,使用与所述候选标签词项相关联的所述一个或多个值来确定是否触发根据所述模板呈现所述结构化信息可以包括:合计与所述候选标签词项相关联的所述一个或多个值;确定所合计的值是否满足预定阈值;以及响应于确定所合计的值满足所述预定阈值,确定包括所述候选标签词项的所述搜索查询将触发呈现所述结构化信息。
在一些实施方式中,使用与所述候选标签词项相关联的所述一个或多个值来确定是否触发根据所述模板呈现所述结构化信息可以包括:合计与所述候选标签词项相关联的所述一个或多个值;确定所合计的值是否满足预定阈值;以及响应于确定所合计的值超过所述预定阈值,确定包括所述候选标签词项的所述搜索查询将不触发呈现所述结构化信息。
在一些实施方式中,所述方法可以进一步包括基于候选标签与所述一个或多个标签词项的相似性来调整与候选标签相关联的所述一个或多个值。
这些和其它版本各自可以可选地包括以下特征中的一个或多个。
附图说明
图1是用于识别结构化信息卡的附加触发词项的***的示例的场境图。
图2A是卡触发词项识别单元的方面的示例的场境图。
图2B是卡触发词项识别单元的附加方面的示例的场境图。
图3是用于识别结构化信息卡的附加触发词项的过程的示例的流程图。
图4是卡触发词项识别单元的示例的场境图。
在附图和以下描述中阐述了这些和其它实施方式的细节。其它特征和优点根据说明书和附图并根据权利要求书将是显而易见的。
具体实施方式
图1是用于识别结构化信息卡170的附加触发词项的***100的示例的场境图。***100包括用户设备110、服务器120和网络130。
在图1的示例中,在阶段A处,假定用户设备110的用户正站在用户到科罗拉多州丹佛的航班#437前面的机场售票柜台处。为了检查用户的行李并获取登机牌,用户需要为用户的即将到来的航班提供航班确认号码。响应于来自航空公司雇员对用户的航班确认号码的请求,用户设备110的用户可以设法从航空公司获取包括了用户的航班确认号码的确认电子邮件。为了获取该确认电子邮件,用户将包括词项“Flight Ticket(机票)”的搜索查询112A输入到用户界面111A的搜索框113A中。
在接收到搜索查询112A之后,用户设备110可以经由网络130将搜索查询112A传送到服务器120,所述网络130包括LAN、WAN、蜂窝网络、互联网等中的一个或多个。服务器120可以对搜索查询112A进行处理,识别响应于搜索查询112A词项“Flight Ticket”的一个或多个搜索结果,然后将搜索结果返回134给用户设备110。搜索结果可以由用户设备110接收,并且被提供用于使用用户设备110的界面111A来显示。在此示例中,搜索结果可以包括对电子邮件文档的引用,诸如引用114A、115A、116A、117A、118A、119A。引用可以包括链接,所述链接当被选择时,提供与该链接相关联的电子邮件文档以用于在用户设备110上显示。每个相应的引用可以包括诸如电子邮件发件人的名字、电子邮件的主题行、电子邮件被接收到的时间以及电子邮件被接收到的日期的文本。
基于搜索查询词项“Flight Ticket”而识别的搜索结果可以包括来自各种不同的发件人的电子邮件。例如,搜索结果可以包括对来自与用户购买电影票以看“Pilot’sFirst Flight(飞行员的第一次飞行)”有关的电影院“ABC Theatre(ABC电影院)”的电子邮件的引用114A。搜索结果也可以包括对来自用于预订“Wine Flight Bar(飞行酒吧)”的餐厅预订服务“Closed Table(闭式餐桌)”的电子邮件的引用115A。搜索结果也可以包括对包括来自“DC Outfitters(DC旅行用品店)”的针对购买“Flight Jacket(飞行夹克)”的订单确认的电子邮件的引用117A。搜索结果也可以包括对来自诸如“NE Airlines(NE航空公司)”、“SE Airlines(SE航空公司)”等的航空公司的与机票购买确认相关联的电子邮件的多个引用116A、118A、119A。例如,一个特定引用116A引用用户在从“NE Airlines”购买“Flight 437(航班437)”的机票之后接收到的确认电子邮件。
然而,给定响应于搜索查询112A而提供的搜索结果的集合,获取用户的航班确认号码可以是相当费时的。这是因为用户必须读取对响应于用户的搜索的每个相应的电子邮件的每个引用的发件人和主题行。例如,甚至直到用户读取引用114A、115A和116A的发件人和主题用户才能识别包括航班确认号码的正确的电子邮件。然后,用户设备110的用户必须选择引用116A以请求与引用116A相关联的电子邮件文档。最后,在与引用116A相对应的电子邮件文档被选择之后,具有用户的即将到来的航班#437的航班确认号码的电子邮件文档被返回。尽管用户能够获取用户的确认号码,然而该过程效率低。此外,该过程由于诸如因为售票柜台处位于用户后面的一长排不守规矩的乘客对用户造成的压力、由于机场候机楼里的不良接收而导致的慢蜂窝数据信号等的许多原因而可能不太顺利。
***100提供用于改进用户从用户的电子邮件收件箱中检索信息的解决方案。例如,在阶段A处,***100提供被存储在结构化信息卡存储单元140A中的多个结构化信息卡142A、144A、146A。每个结构化信息卡包括模板152A和语法154A。结构化信息卡的模板152A包括可响应于特定搜索查询的用来自电子邮件文档的信息填充的一个或多个预定字段。例如,结构化信息存储单元140A可以包括“Flight(航班)”信息的结构化信息卡142A。“Flight”信息的结构化信息卡142A可以包括“To”字段、“From”字段、“Departs”字段、“Conf.#”字段和“Flight#”字段。
语法154A可以包括与卡142A相关联的一个或多个触发词项。触发词项可以包括一个或多个词项,所述词项当由服务器120检测到为被包括在搜索查询中时,触发与该触发词项相关联的结构化信息卡的检索、填充和显示。例如,响应于包括词项“flightreservation(航班预订)”的查询,“Flight”结构化信息卡142A可以被获取,用来自与即将到来的航班相关联的最近的电子邮件的数据填充,并且被提供用于经由诸如用户界面111A的用户界面显示。然而,因为在阶段A处搜索词项“Flight Ticket”未被包括在“Flight”结构化信息卡142A的语法154A中,所以响应于具有搜索词项“Flight Ticket”的搜索查询112A而未触发“Flight”结构化信息卡142A。
服务器120可使用卡触发词项识别单元160来识别可用于触发“Flight”结构化信息卡142A的一个或多个附加词项。附加词项可以基于例如从与由用户设备显示的用户界面相关联的搜索框(诸如用户界面111A的搜索框112A)接收到的一个或多个查询。在一些实施方式中,卡触发词项识别单元160可从接收到的查询词项的日志获取查询词项,确定该查询词项是否与结构化信息卡的语法中的一个或多个其它词项有关,并且在一些情况下,将该查询词项添加到结构化信息卡的语法。例如,卡触发词项识别单元160可以确定应该将词项“Flight Ticket”添加到“Flight”结构化信息卡的语法154A。将词项“Flight Ticket”添加到“Flight”结构化信息卡的语法在阶段B处导致更新的结构化信息存储单元140B。
在阶段B处,相同用户设备110的用户可在稍后的时间点访问用户界面111B。用户界面111B可以是与用户界面111A相同的用户界面。用户可以将包括词项“Flight Ticket”的搜索查询112B输入到搜索框113B中。以与相对于阶段A所描述的方式类似的方式,用户设备110可以经由网络130将搜索查询112B传送132到服务器120,所述网络130包括LAN、WAN、蜂窝网络、互联网等中的一个或多个。服务器120可以对搜索查询112B进行处理,识别响应于搜索查询112B“Flight Ticket”的一个或多个搜索结果,然后将搜索结果返回134给用户设备110。搜索结果可以由用户设备110接收,并且被提供用于使用用户设备110的界面112B来显示。在此示例中,搜索结果可以包括对电子邮件文档的引用,诸如引用114B、115B、116B、117B、118B、119B。在此示例中,返回给用户设备110并在用户界面111B上显示的搜索结果是与被提供用于经由用户界面111A显示的引用114A、115A、116A、117A、118A、119A对相同的电子邮件文档的相同引用。
然而,在阶段B处,用户界面111B也包括结构化信息卡170。结构化信息卡170可以包括例如包括已经用从响应于搜索查询112B的资源中提取的数据填充的一个或多个字段的显示。结构化信息卡170可以被获取、填充并提供用于经由用户界面111B显示,因为存储在结构化信息卡存储单元140B中的结构化信息卡142B的语法现在包括词项“FlightTicket”。词项“Flight Ticket”基于卡触发词项识别单元160对包括在一个或多个结构化信息卡142A的语法内的现有词项的分析、包括在结构化信息卡142A的语法内的现有词项之间的一个或多个识别的关系以及前述语法词项与经由搜索框113A先前提交的一个或多个查询之间的一个或多个识别的关系被添加到“Flight”结构化信息卡142B的语法。
所获取并显示的特定结构化信息卡170可以基于通过搜索框113B提交的查询词项。例如,服务器120可以基于诸如“Flight Ticket”的搜索查询词项与和特定结构化信息卡170相关联的一个或多个语法词项匹配的确定来选择用于经由用户界面111B显示的特定结构化信息卡170。服务器120可以用包括通过结构化信息卡模板152B的字段所请求的信息的排名最高的搜索结果的内容填充所获取的结构化信息卡。在一些实施方式中,排名最高的搜索结果可以是包括通过结构化信息卡模板152B的字段所请求的信息的最近的电子邮件文档。
结构化信息卡170提供了在无需用户读取与作为搜索结果由服务器120返回的每个引用114B、115B、116B、117B、118B、119B相关联的数据的情况下显示与用户的即将到来的航班有关的相关信息的优点。此外,结构化信息卡170显示用户的航班目的地(例如,科罗拉多州丹佛)、用户的航班起点(例如,华盛顿特区)、用户的航班起飞时间(例如,东部标准时间上午11:45)、用户的航班确认号码(例如,KP4EG)和用户的航班号码(例如,437)。因此,用户不需要打开包括关于用户的即将到来的航班的信息的电子邮件,因为与用户的即将到来的航班相关联的必要信息被包括在结构化信息卡170内。因此,正站在售票柜台处的用户设备110的用户可快速地搜索用户的电子邮件,从结构化信息卡获取用户的航班确认号码,并且以高效的方式将该航班确认号码提供给航空公司代表。
使用卡触发词项识别单元160来识别可被添加到结构化信息卡的语法的附加词项的***100的示例是针对“Flight”结构化信息卡142B的。然而,本公开不应该受此限制。替代地,卡触发词项识别单元160可用于识别诸如“Movie Ticket”结构化信息卡144B、“Dinner Reservation(晚餐预订)”结构化信息卡146B等的任何类型的结构化信息卡的附加语法词项。结构化信息卡的其它示例可以包括例如旅馆预订结构化信息卡、车辆租赁结构化信息卡、设备租赁结构化信息卡等。此外,可以使用任何类型的结构化信息卡,其中可使用一个或多个语法词项的集合来唯一地识别该结构化信息卡。
图2A是参考卡触发词项识别单元210A的卡触发词项识别单元的各方面的示例的场境图。术语“单元”由本说明书广泛地使用来指代可执行一个或多个特定功能的基于软件的***或子***。通常,单元将作为安装在一个或多个位置中的一个或多个计算机上的一个或多个软件模块或组件被实现。然而,在其它情况下,可在相同的一个或多个计算机上安装多个单元。
卡触发词项识别单元210A用于分析与一个或多个结构化信息卡的语法相关联的现有词项。与一个或多个结构信息卡的语法相关联的词项包括当在搜索查询中接收到时触发特定结构化信息卡的显示的一个或多个词项。
在一些实施方式中,分析与一个或多个信息卡的语法相关联的现有词项可以包括生成图形结构212A。图形结构212A可以包括各自与触发特定结构化信息卡的选择、填充和显示的特定语法词项相关联的一个或多个查询节点220A、222A。每个查询节点220A、222A可以与相应的标签词项相关联。例如,查询节点220A与标签词项“flight reservation”相关联并且查询节点222A与标签词项“ticket(票)”相关联。可以从结构化信息卡存储单元、查询日志等获取用于构建图形的标签词项。
查询节点220A、222A中的每一个可以与特定值相关联。例如,查询节点220A与值232A“800”相关联并且查询节点222A与值234A“500”相关联。相应的值232A、234A可以包括与每个相应的查询节点的标签词项相关联的特定权重。在一些实施方式中,该值可以包括特定标签词项用于触发特定结构化信息卡的选择、填充和显示的次数的计数。例如,值232A“800”可以指示标签词项“flight reservation”用于触发“Flight”结构化信息卡124A的选择、填充和显示800次。尽管该值可以指示特定标签词项用于触发特定结构化信息卡的选择、填充和显示的次数,然而本公开未必受此限制。例如,在一些实施方式中,可以基于标签词项的重要性来缩放值232A、234A。
图形结构212A也可以包括一个或多个实体节点250A、252A、254A。实体节点250A、252A、254A可以包括指示一个或多个节点220A、222A的相应的标签词项之间的关系的数据项。在一些实施方式中,关系可以包括与标签词项相关联的语义关系。例如,每个实体节点250A、252A、254A可以各自包括从与查询节点220A、222A相关联的所有标签词项的共享集合中选择的一个或多个词项。例如,共享单词的集合可以包括从查询节点标签词项“flightreservation”和“Ticket(票)”的集合得到的“Flight”、“Reservation(预订)”和“Ticket”。因此,在一个实施方式中,可以将来自共享词项的集合的每个特定词项指派给特定实体节点。例如,实体节点250A可以被指派单词“Flight”,实体节点252A可以被指派单词“Reservation”,而实体节点254A可以被指派单词“Ticket”。尽管此示例描述了基于共享单词的集合而生成的实体节点,然而本公开未必受此限制。例如,实体节点可以包括表示节点220A、222A的标签词项之间的另一关系的其它数据项。例如,每个相应的实体节点可以指示响应于对包括一个或多个标签词项的查询的执行而检索到的特定电子邮件。可替选地或此外,相应的实体节点可以指示响应于包括一个或多个标签词项的查询而返回的特定web地址、网页、URL等。
卡触发词项识别单元210A使对应于每个查询节点220A、222A的值232A、234A与和每个相应的查询节点220A、222A相关联的每个实体节点250A、252A、254A相关联。如果实体节点250A、252A、254A包括从与特定查询节点220A、222A相关联的标签词项得到的数据项,则查询节点220A、222A与实体节点250A、252A,254A相关联。例如,查询节点220A与包括词项“Flight”的实体节点250A相关联,因为词项“Flight”是从与查询节点220A相关联的标签词项“flight reservation”得到的。类似地,查询节点220A也与包括词项“Reservation”的实体节点252A相关联,因为词项“Reservation”是从与查询节点220A相关联的标签词项“flight reservation”得到的。类似地,查询节点222A与包括词项“Ticket”的实体节点254A相关联,因为词项“Ticket”是从与查询节点222A相关联的标签词项“Ticket”得到的。可以在图形结构212A中通过创建从特定查询节点指向相关联的实体节点的图形边260A、262A、264A来表示查询节点-实体节点关联。例如,可以在图形结构212A中通过创建从查询节点220A到实体节点250A的图形边260A来表示查询节点220A与实体节点250A之间的关联。必要时,可以以相同的方式创建其它图形边,诸如图形边262A、264A。
使值232A,234A与一个或多个实体节点250A、252A、254A相关联可以包括基于通过所生成的查询图形212A所建立的预定查询节点-实体节点关联将值232A、234A传播到一个或多个实体节点250A、252A、254。例如,可以使用边260A来将值232“800”从查询节点220A传播到实体节点250A。在基于通过图形边260A所建立的关系将值232“800”从查询节点220A传播到实体节点250A之后,值“800”像通过元素270A所示出的那样变得与实体节点250A相关联。可以基于建立的图形结构边262A、264A通过图形结构212A以相同的方式传播值232A、234A。元素270A、272A、274A在图2A中灰显(gray out),因为直到在基于所建立的图形边260A通过图形结构212A传播值232A、234A之后元素270A、272A、274A才与相应的实体节点270A、272A、274A相关联。在一些实施方式中,值232A“800”和243A“500”未必被主动地传播或者指派给相应的实体节点250A、252A、254A。例如,在一些实施方式中,图形边260A、262A、264A的生成可能足以使值232A“800”和242A“500”与它们相应的实体节点相关联。
以类似的方式,与每个相应的查询节点220A、222A相关联的标签词项也可以与和每个相应的查询节点相关联的实体节点250A、252A、254A相关联。例如,标签词项“flightreservation”可以基于查询节点220A与实体节点250A之间的指示查询节点220A和实体节点250A是相关的图形边而变得与相关实体节点250A相关联。也可以通过图形结构212A以与上述的标签词项“flight reservation”类似的方式向前传播与查询节点222A相关联的标签词项“Ticket”。
卡触发词项识别单元210A也可以访问与诸如电子邮件应用的一个或多个应用相关联的查询日志。可以执行查询日志的访问来识别可被评估以用于在扩展与特定结构化信息卡的语法相关联的触发词项时使用的一个或多个候选查询词项。作为示例,卡触发词项识别单元210A可以获取候选查询词项“Flight Ticket”240A,以便评估潜在地包括在与诸如“Flight”结构化信息卡142A的结构化信息卡相关联的语法中的候选查询词项“FlightTicket”。查询词项“Flight Ticket”在诸如用户设备110的用户设备的用户在将词项“Flight Ticket”包括在“Flight”结构化信息卡的语法中之前提交了查询“FlightTicket”以使用电子邮箱的诸如界面111A的界面来搜索一个或多个电子邮件之后可能已被存储在查询日志中。
可以基于候选查询词项“Flight Ticket”在图形结构212A中生成查询节点240A。候选查询节点240A在图2A中用灰色示出,因为直到在从查询日志中检索到候选查询词项“Flight Ticket”之后候选查询节点240A才被添加到图形结构212A。候选查询节点240A与候选标签词项“Flight Ticket”相关联。
图2B是参照卡触发词项识别单元210B的卡触发词项识别单元的附加方面的示例的场境图。
卡触发词项识别单元210B可以继续分析由图2A中的卡触发词项识别单元210A生成的图形结构。卡触发词项识别单元210B是图2A中所示出的相同卡触发词项识别单元210A。卡触发词项识别单元210B被单独地描述来示出在从图2A的描述结束的地方开始的卡触发词项识别单元对与一个或多个结构化信息卡的语法相关联的词项的分析的后续阶段处执行的附加操作。
卡触发词项识别单元210B可以分析图形结构212A以检测在每个相应的实体节点250A、252A、254A与每个相应的候选查询节点240A之间可能存在的关系。例如,卡触发词项识别单元210B可以确定每个相应的实体节点250A、252A、254A是否与特定候选查询节点240A相关联。在一个实施方式中,如果与实体节点相关联的词项被包括在候选查询节点的标签词项中,则实体节点可以与特定候选查询节点240A相关联。例如,实体节点250A与候选查询节点240A相关联,因为候选标签词项“Flight Ticket”包括与实体节点250A相关联的单词“Flight”。类似地,例如,实体节点254A与候选查询节点240A相关联,因为候选标签词项“Flight Ticket”包括与实体节点254A相关联的词项“Ticket”。同样地,实体节点252A不与候选查询节点240A相关联,因为候选标签词项“Flight Ticket”不包括与实体节点252A相关联的词项“Reservation”。然而,在实体节点与候选查询节点之间可以存在其它类型的关联。例如,在实体节点包括电子邮件文档、网络地址、URL等的情况下,如果与候选查询节点相关联的候选标签词项将响应于包括候选标签词项的查询而返回电子邮件文档、网络地址等,则实体节点可以与候选查询节点相关联。
卡触发词项识别单元210B可以修改图形结构212A以创建图形结构212B。卡触发词项识别单元210B可以通过生成表示实体节点与候选查询节点之间的每个关系的图形边来修改图形结构212A。实体节点-候选查询节点关系可以例如通过从特定实体节点指向特定候选查询节点的图形边来表示。例如,卡触发词项识别单元210B可以创建从实体节点250A指向候选查询节点240A的图形边280B。图形边280B因此可以表示实体节点250A与候选查询节点240A之间的前述关系。类似地,例如,卡触发词项识别单元210B可以创建从实体节点254A指向候选查询节点240A的图形边282B。必要时,卡触发词项识别单元210B可以生成表示实体节点与候选查询词项之间的其它关系的其它图形边。
卡触发词项识别单元210B可以使用所生成的基于实体节点与候选查询节点之间的关系的图形边来使实体节点250A、252A、254A值270A、272A、274A与一个或多个候选查询节点240相关联。使实体节点值与候选查询节点相关联可以包括例如基于所建立的图形边将实体节点值传播到候选查询节点。作为示例,实体节点值270A“800”变得与候选查询节点240A相关联,如通过元素290B所表示的。类似地,例如,实体节点值274A“500”变得与候选查询节点240A相关联,如通过元素292B所表示的。元素290B和292B灰显,因为在值“800”和“500”基于所生成的图形边280B、282B与候选查询节点240A相关联之前元素290B和292B不存在。在一些实施方式中,值270A“800”和274“500”未必被主动地传播或者指派给候选查询节点240A。例如,在一些实施方式中,图形边280B、282B的生成可能足以使值270A和274A与候选查询节点240A相关联。
以类似的方式,像参考图2A所描述的那样与每个相应的实体节点250A、252A、254A相关联的标签词项也可以与和每个相应的实体节点相关联的一个或多个候选查询节点240A相关联。例如,基于图形边260A与实体节点250A相关联的标签词项“flightreservation”可以基于在实体节点250A与候选查询节点240A之间生成的指示实体节点250A和候选查询节点240A是相关的图形边280B而变得与候选查询节点240A相关联。诸如标签词项“Ticket”的其它标签词项也可以基于图形结构212B的其它生成的边而变得与候选查询节点240A相关联。
在值290B“800”和292B“500”与候选查询节点240A相关联之后,卡触发词项识别单元210B可以基于值290B“800”和292B“500”来确定是否应该将与候选查询节点240A相关联的标签词项“Flight Ticket”添加到诸如“Flight”结构化信息卡的结构化信息卡的语法。确定标签词项“Flight Ticket”是否应该与结构化信息卡的语法相关联可以包括合计值290B“800”和292B“500”,并且对照预定阈值来评估合计值。如果确定了诸如“1300”(例如,800+500=1300)的合计值满足预定阈值,则可以将标签词项“Flight Ticket”添加到诸如“Flight”结构化信息卡的结构化信息卡的语法。然而,如果诸如“1300”的合计值不满足预定阈值,则不将标签词项“Flight Ticket”添加到结构化信息卡的语法。
在一些实施方式中,所生成的图形结构212B可以用于在无需更新结构化信息卡的语法的情况下触发结构化信息卡的生成。例如,在更新“Flight”结构化信息卡的语法154A之前,服务器120可以接收包括原先未与结构化信息卡的语法154A相关联的诸如“FlightTicket”的查询词项的查询。然后,可以执行关于图2A和图2B所描述的过程,以便使值290B“800”和292B“500”与和候选标签词项“Flight Ticket”相关联的候选查询节点相关联。接下来,可以合计值290B“800”和292B“500”以获取“1300”的合计值。最后,如上所述,可以确定“1300”的合计值是否满足预定阈值。如果合计值满足预定阈值,则可以重写所接收到的包括词项“Flight Ticket”的查询,使得包括在“Flight”结构化信息卡142A的语法154A中未找到的词项“Flight Ticket”的查询在无需更新“Flight”结构化信息卡的语法154A的情况下触发“Flight”结构化信息卡142A的选择、填充和显示。重写查询可以包括例如将标签词项中的一个或多个添加到经由图形结构212B的构建而变得与候选标签词项“FlightTicket”相关联的查询。例如,重写查询可以包括将标签词项“Flight预订”添加到查询。然后,执行现在包括在“Flight”结构化信息卡的语法154A中找到的词项(例如,“flightreservation”)的重写查询将导致“Flight”结构化信息卡被选择、填充并提供用于显示。如果基于值290B“800”和292B“500”计算出的合计值不满足预定阈值,则所接收到的具有词项“Flight Ticket”的查询将不会被重写,并且将不触发“Flight”结构化信息卡的选择、填充和显示。
尽管上面提供的示例描述了语法将被更新或者可以重写接收到的查询的场景,然而本公开未必受此限制。例如,也设想了可以存在落入本公开的范围内的可以更新语法以包括附加触发单词并且所接收到的查询在对接收到的查询的处理期间被重写的场景。
已经在简单加法运算的场境中描述了值290B“800”和292B“500”的前述合计。可以采用其它类型的合计方法。例如,可以使值290B“800”和292B“500”相乘。可替选地,可以计算值290B“800”和292B“500”的某种形式的加权和,并且将结果用作合计值。
图3是用于识别结构化信息卡的附加触发词项的过程300的示例的流程图。通常,过程300可以包括访问与用于呈现结构化信息310的模板相关联的数据,识别一个或多个实体320的第一集合,将一个或多个标签以及一个或多个值与所识别的实体330的第一集合中的一个或多个实体相关联,获得候选标签词项340,从第一实体集350识别一个或多个实体的子集,将一个或多个标签以及一个或多个值与一个或多个候选标签词项360相关联,接收搜索查询370,并且使用与每个候选标签词项相关联的值来确定是否触发结构化信息380的显示。在下文中,将描述由诸如***100的***执行的过程300。***可以包括一个或多个计算机。
更详细地,过程300在阶段310开始,其中,***访问与用于呈现结构化信息的模板相关联的数据。访问阶段310可以包括例如***访问以包括一个或多个查询节点以及一个或多个实体节点的图结构维护的数据。所访问的数据可以包括诸如分别与至少一个查询节点相关联的一个或多个标签词项的数据。一个或多个标签词项可以引用当被包括在搜索查询中时触发呈现包括结构化信息的结构化信息卡的数据。结构化信息可以基于例如与结构化信息卡相关联的模板。
一个或多个标签词项中的每一个可以与值相关联。该值可以包括例如表示一个或多个标签词项已被用于触发结构化信息卡的显示的次数的访问计数。在一些实施方式中,可以使用缩放因子来缩放值,该缩放因子可以基于与该值相关联的一个或多个标签词项的重要性来增加与该值相关联的权重或减小与该值相关联的权重。
过程300可以通过***识别与一个或多个标签词项相关联的第一实体集在阶段320继续。第一实体集中的所识别的实体可以包括一个或多个实体,每个实体包括与一个或多个标签词项相关的数据项。例如,一个或多个实体的集合可以包括与一个或多个标签词项具有语义关系的数据项。例如,由每个识别的实体表示的词项组合集可以包括所有一个或多个标签词项的集合。虽然该示例描述了基于共享字集生成的实体节点,但是本公开不需要如此限制。例如,第一实体集中的特定实体可以包括表示与查询节点相关联的一个或多个标签词项的其他关系的其他数据项。例如,每个相应的实体可以表示响应于执行包括一个或多个标签词项的查询来检索的特定电子邮件。替选或附加地,各个实体可以表示响应于包括一个或多个标签词项的查询返回的特定web地址、网站、URL等。
在阶段330,***可以将与一个或多个相应的查询节点相关联的一个或多个标签与一个或多个实体相关联。将一个或多个标签与一个或多个实体相关联可以包括将查询节点的标签词项分配给查询节点所关联的每个实体。例如,假设查询节点与标签“FlightReservation(航班预订)”相关联。在这样的示例中,标签“Flight Reservation”可以被分配给实体“Flight”,以及标签“Flight Reservation”也可以被分配给实体“Reservation”。替选或附加地,***还可以将与查询节点相关联的一个或多个值与查询节点相关的一个或多个实体相关联。将与查询节点相关联的一个或多个值与一个或多个实体相关联可以包括将值从查询节点传播到查询节点相关的每个实体。将一个或多个标签词项、一个或多个值或两者从查询节点传播到实体可以被称为标签词项的向前传播、值的向前传播或两者。标签词项、值等的传播不需要将诸如标签词项或值的信息从第一数据结构物理复制到另一数据结构。相反,可以将诸如标签词项或值的信息的传播暗含为生成图形结构的两个或以上节点之间的图形边缘的结果。
在阶段340,***可以获得候选标签词项。候选标签词项可以包括由应用接收的查询的一个或多个词项。候选标签词项可以是***评估以用于潜在包含在结构化信息卡的语法中的词项。替选或附加地,候选标签词项可以是***评估以确定是否应重写查询以触发结构化信息卡的词项。
***可以分析存在于一个或多个实体与所获得的候选标签词项之间的关系。***执行该分析以在阶段350从与候选标签词项相关的第一实体集识别一个或多个实体的子集。如果与实体相关联的词项被包括在候选标签词项中,则实体可以与获得的候选标签词项相关。然而,在实体节点和候选标签词项之间可能存在其他类型的关联。例如,在实体包括电子邮件文档、网络地址、URL等的情况下,如果当执行包括候选标签词项的查询时候选标签词项将返回电子邮件文档、网络地址、URL等,那么实体可以与候选标签词项相关联。
在阶段360,***可以将一个或多个标签以及一个或多个值与每个候选标签词项相关联。例如,在阶段330与特定实体相关联的任何标签词项可以与实体相关的候选标签词项相关联。因此,在一些实施方式中,从查询节点传播到特定实体的标签词项可以进一步从实体传播到与特定实体相关的候选标签词项。与实体相关联的一个或多个值可以类似地与实体相关的一个或多个候选标签词项相关联。因此,在一些实施方式中,从查询节点传播到特定实体的值可以进一步传播到候选标签词项。将一个或多个标签以及一个或多个值从实体传播到候选标签词项可以被称为标签的向后传播、值的向后传播或两者。标签词项、值等的传播不需要将诸如标签词项或值的信息从第一数据结构物理复制到另一数据结构。相反,可以将诸如标签词项或值的信息的传播暗含为生成图形结构的两个或以上节点之间的图形边缘的结果。
在一些实施方式中,***可以分析与候选标签词项相关联的一个或多个值中的每一个,以确定是否应该将候选标签词项添加到与结构化信息卡相关联的语法。确定标签词项是否应该与结构化信息卡相关联可以包括合计与候选标签词项相关联的值,以及相对于预定阈值评估合计值。如果确定合计值满足预定阈值,则可以将标签词项添加到结构化信息卡的语法中。然而,如果合计值不满足预定阈值,则标签词项不会被添加到结构化信息卡的语法中。
在其他实施方式中,在阶段370,***可以接收包括候选标签词项的搜索查询。在阶段380,***可以处理接收的搜索查询,并且使用与每个识别的候选标签词项相关联的值来确定是否触发结构化信息卡的显示。使用与每个候选标签词项相关联的值可以包括例如合计与候选标签词项相关联的一个或多个值,并相对于预定阈值评估合计值。如果确定与候选标签词项相关联的合计值满足预定阈值,则***可以确定包括候选标签词项的搜索查询将触发相关结构化信息卡的呈现。替选地,如果确定合计值不满足预定阈值,则***可以确定包括候选标签词项的搜索查询将不会触发相关结构化信息卡的呈现。
更详细地,可以在接收到搜索查询之后执行阶段380的过程,并且包括为了触发结构化信息卡的生成重写所接收的搜索查询而不更新结构化信息卡的语法。例如,可以接收包括未包括在结构化信息卡的语法中的候选查询词语的查询。然后,可以执行参考图2A和图2B所述的过程以便将一个或多个值与候选查询词项相关联。接着,可以计算一个或多个值的合计值。最后,可以确定合计值是否满足预定阈值。如果合计值满足预定阈值,则可以重写包括在结构化信息卡的语法中未找到的候选查询词项的所接收的查询以包括与查询相关的结构化信息卡的语法中找到的词项。当实现图2A和2B所述的过程时,添加到查询中的词项可以基于从一个或多个查询节点传播到候选标签词项的一个或多个标签词项。可以执行重写的查询,然后触发与包括重写期间添加到查询中的词项的语法相关联的相关结构化信息卡的选择、填充和显示。如果合计值不满足预定阈值,则具有未被包括在结构化信息卡的语法中的词项的接收的查询将不被重写,并且不会触发结构化信息卡的选择、填充和显示。
图4是卡触发词项识别单元的示例的场境图。
卡触发词项识别单元可以生成图形结构405。图形结构405可以包括多个查询节点,例如查询节点410、411、412、413、414。查询节点410、411、412、413、414每个与相应的标签词项相关联。例如,查询节点410与标签词项“Flight Reservation”相关联,查询节点411与标签词“Flight Ticket(飞机票)”相关联,查询节点412与标签词“Las Vegas FlightReservation”相关联,查询节点413与标签词项“Journey(旅程)”相关联,并且查询节点414与标签词项“Jacket”相关联。查询节点410、411、412、413、414可以与诸如实体节点440、441、442、443、444、445、446、447的一个或多个实体节点相关。一个或多个实体节点可以对应于来自于在一个或多个词项节点410、411、412、413、414的标签词项之中共享的多个词项集中的一个或多个词项。例如,其他实体节点可以对应于除一个或多个共享词项外的实体。例如,实体440可以对应于响应于执行诸如“Flight Reservation”的查询而生成的网站。
图形结构405还可以包括一个或多个候选查询节点420、422。候选查询节点420、422可以基于从查询日志获得的查询词项。例如,候选查询节点420可以基于从查询日志获得的候选标签词项“Journey Ticket(旅程票)”。类似地,候选查询节点422可以基于从查询日志获得的候选标签词项“Flight Jacket”。
可以使用参考图2A、2B和3所述的过程,生成从查询节点到实体节点的图形边缘以及从实体节点到候选查询节点的图形边缘。类似地,可以基于图形边缘,向前传播值430“675”、值432“1125”、值434“150”、值436“680”和值438“150”,然后使用参考图2A、2B和3所述的过程,将其与参考实体值450、451、452、453、454、455、465、457、458、459、460所述的一个或多个实体节点相关联。类似地,可以使用诸如470、472、474、476的生成的图形边缘,将实体值450、451、452、453、454、455、465、458、458、459、460从实体节点向后传播到一个或多个候选查询节点。也可以使用生成的图形边缘,将与每个相应的查询节点相关联的标签词项从相应的查询节点通过图形结构传播到候选标签词项。
标签词项和值的向前和向后传播导致生成的图形结构405。候选查询节点420可以与一个或多个值480“1125”和481“680”相关联。此外,候选查询节点420还经由通过一个或多个相应的实体节点,从查询节点411、413延伸到候选查询节点420的一个或多个图形边缘,与来自查询节点411和查询节点413的标签词项相关联。因此,候选查询节点420也与标签词项“Flight Ticket”和“Journey”相关联。以与候选查询节点420相同的方式,诸如候选查询节点422的其他候选查询节点也可以与一个或多个值以及一个或多个标签词项相关联。
可以分析图形结构405中的数据,以确定候选查询节点420、422中的一个或多个是否与当被包括在查询中时应该触发结构化信息卡的选择、填充和显示的标签词项相关联。参考图4,例如,可以分析图形结构中的数据,以确定候选查询节点420、422中的一个或多个是否与当在搜索查询中被接收时会导致选择、填充和显示“Flight”结构化信息卡的候选标签词项相关联。
卡触发词项识别单元可以合计与候选查询词项420相关联的值480“1125”和481“680”,以实现合计值“1,805”。类似地,卡触发词项识别单元可以合计与候选查询词项422相关联的值482“675”、483“725”、484“150”和485“150”,以实现合计值“1700”。
进一步参考图4的示例,可以确立能被用来确定与候选查询节点420、422相关联的标签词项是否应被用于触发“Flight”结构化信息卡的显示的预定阈值。例如,如果合计值满足预定阈值,则与查询节点相关联的标签词项将被用于触发显示“Flight”结构化信息卡。替选地,例如,如果合计值不满足预定阈值,则与查询节点相关联的标签词项将不被用来触发显示“Flight”结构化信息卡。
作为示例,假设设置为“1750”的预定阈值。与候选标签词项“Flight Ticket”相关联的候选查询节点420与超出预定阈值“1750”的合计值“1805”相关联。但是,另一方面,具有候选标签词项“Flight Jacket”的查询与低于预定阈值“1750”的累计值“1700”相关联。因此,由于与“Flight Ticket”相关联的合计值满足预定阈值,包括标签词项“FlightTicket”的所接收的查询将触发“Flight”结构化信息卡的选择、填充和显示。然而,由于与“Flight Jacket”相关联的合计值不满足预定阈值,包含词项“Flight Jacket”的所接收的查询将不会触发“Flight”结构化信息卡的选择、填充和显示。
对于本文论述的***收集关于用户的个人信息或可能利用个人信息的情况,可以为用户提供控制程序或功能组件是否收集个人信息(例如,关于用户的社交网络的信息、社交动作或活动、电子邮件、职业、用户偏好或用户的当前位置)、或者控制是否和/或如何从内容服务器接收可能与用户更相关的内容的机会。此外,某些数据可以在被存储或使用之前,以一种或多种方式进行匿名化,从而移除个人可识别信息。例如,用户的身份可以被匿名化,使得不能确定用户的个人可识别信息,或者可以获得位置信息的情况下对用户的地理位置进行一般化(诸如到市、邮政编码或州级),使得不能确定用户的特定位置。因此,用户可以控制如何收集和由内容服务器使用的关于他或她的信息。
本说明书中所述的图形结构可以由各种适当的物理数据结构中的任何一种来表示。例如,该图可以由三元组表示,每个三元组依次表示两个实体和从第一个实体到第二个实体的关系;例如,[α,β,是父亲],或者[α,是父亲,β],是表示相同事实的替代方式。每个实体和每个关系可以并且通常将被包括在多个三元组中。作为对本公开所述的主题的示例,可以使用三元组来描述查询节点、实体节点和与查询节点和实体节点之间的边缘相关联的值之间的关系。
替选地,每个实体可以被存储为一次节点、为记录或对象,例如,并且通过链接列表数据结构链接到实体具有的所有关系以及实体相关的所有其他实体。更具体地,该图可以被存储为邻接列表,其中,邻接信息包括关系信息。
能在数字电子电路中、在有形地体现的计算机软件或固件中、在计算机硬件中包括在本说明书中公开的结构及其结构等效物、或者在它们中的一个或多个的组合中实施在本说明书中描述的主题、功能操作和过程的实施例。能将在本说明书中描述的主题的实施例实施为一个或者多个计算机程序,即编码在有形非易失性程序载体上的用于由数据处理装置执行或者控制数据处理装置的操作的一个或者多个计算机程序指令模块。替选地或者附加地,能在人为生成的传播信号,例如,机器生成的电、光或者电磁信号上对程序指令编码,该信号被生成用于对信息编码以用于向适当接收器设备发送以供数据处理装置执行。计算机存储介质能是机器可读存储设备、机器可读存储衬底、随机或者串行存取存储器设备或者它们中的一个或多个的组合。
术语“数据处理装置”涵盖各种用于处理数据的装置、设备和机器,举例而言包括可编程处理器、计算机、或多个处理器或计算机。该设备能包括专用逻辑电路,例如,FPGA(现场可编程门阵列)或者ASIC(专用集成电路)。该装置除了硬件之外,还能包括为所述计算机程序创建执行环境的代码,例如,构成处理器固件、协议栈、数据库管理***、操作***的代码或者它们中的一个或多个的组合。
计算机程序(也可以被称为或描述为程序、软件、软件应用、模块、软件模块、脚本或者代码)能用任何形式的编程语言编写,包括编译或者解译语言、或说明或者过程语言,并且计算机程序能用任何形式部署,包括部署为独立程序或者部署为适合于在计算环境中使用的模块、组件、子例程或者其他单元。计算机程序可以但是无需对应于文件***中的文件。程序能被存储于保持其他程序或者数据的文件(例如,存储于标记语言文档中的一个或者多个脚本)的一部分中、在专用于讨论的程序的单个文件中,或者在多个协同文件(例如,存储一个或者多个模块、子程序或者代码部分的文件)中。计算机程序能被部署用于在一个计算机上或者在位于一个地点或者跨多个地点分布并且由数据通信网络互连的多个计算机上执行。
在本说明书中描述的过程和逻辑流能由一个或者多个可编程处理器执行,该一个或者多个可编程计算机执行一个或者多个计算机程序以通过对输入数据操作并且生成输出来执行功能。该过程和逻辑流也能由专用逻辑电路例如FPGA(现场可编程门阵列)或者ASIC(专用集成电路)执行,或装置能实现为专用逻辑电路例如FPGA(现场可编程门阵列)或者ASIC(专用集成电路)。
适合于执行计算机程序的计算机包括例如能基于通用微处理器或者专用微处理器、或者其两者、或者任何其他种类的中央处理器。通常,中央处理器将从只读存储器或者随机存取存储器或者二者接收指令和数据。计算机的必要元件是用于执行指令的中央处理器单元以及用于存储指令和数据的一个或者多个存储器设备。通常,计算机还将包括例如磁盘、磁光盘或者光盘的用于存储数据的一个或者多个海量存储装置,或者***作地耦合用于从该一个或者多个海量存储设备接收数据或者向该一个或者多个海量存储设备发送数据或者接收和发送二者。然而,计算机无需具有这样的设备。另外,计算机能被嵌入于另一设备中,聊举数例,例如,移动电话、个人数字助理(PDA)、移动音频或者视频播放器、游戏控制台、全球定位***(GPS)接收机、或者便携存储设备(例如,通用串行总线(USB)闪存驱动)。
适合于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,举例而言包括半导体存储器设备,例如,EPROM、EEPROM和闪速存储器设备;磁盘,例如,内部硬盘或者可移动盘;磁光盘;以及CD-ROM和DVD-ROM盘。处理器和存储器能由专用逻辑电路补充或并入专用逻辑电路中。
为了提供与用户的交互,能在计算机上实施在本说明书中描述的主题的实施例,该计算机具有用于向用户显示信息的显示设备(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器),以及用户能用来向计算机提供输入的键盘和指向设备,例如,鼠标或者轨迹球。其他种类的设备也能用来提供与用户的交互;例如,向用户提供的反馈能是任何形式的感官反馈,例如,视觉反馈、听觉反馈或者触觉反馈;并且能用包括声音、语音或者触觉输入的任何形式接收来自用户的输入。此外,计算机能通过向用户使用的设备发送文档和从该设备接收文档来与用户交互,例如,通过响应于从用户的客户端设备上的web浏览器接收的请求向web浏览器发送web页面。
在本说明书中描述的主题的实施例能在计算***中实施,该计算***包括例如作为数据服务器的后端组件,或者包括中间件组件,例如应用服务器,或者包括前端组件,例如具有用户能通过它与在本说明书中描述的主题的实施方式交互的图形用户界面或者Web浏览器的客户端计算机,或者一个或者多个这样的后端、中间件或者前端组件的任何组合。***的组件能通过任何数字数据通信形式或者介质(例如,通信网络)互连。通信网络的示例包括局域网(“LAN“)和广域网(”WAN“)例如因特网。
计算***能包括客户端和服务器。客户端和服务器一般相互远离并且通常通过通信网络交互。客户端和服务器的关系借助在相应计算机上运行并且相互具有客户端-服务器关系的计算机程序而产生。
尽管本说明书包含许多具体实施方式细节,但是不应将这些解释为限制要求保护的内容的范围,而是解释为对具体实施例特定的特征的描述。在本说明书中在分开的实施例的中描述的某些特征也能在单个实施例中被组合实施。相反地,在单个实施例的上下文中描述的各种特征也能在多个实施例中分开地或者在任何适当子组合中被实施。另外,虽然上文可能将特征描述为在某些组合中动作并且甚至起初这样要求保护,但是来自要求保护的组合的一个或者多个特征能在一些情况下从该组合中被删除,并且要求保护的组合能涉及子组合或者子组合的变型。
类似地,尽管在附图中以特定顺序描绘操作,但是这不应被理解为要求以所示特定次序或者以顺序次序执行这样的操作或者执行所有所示操作以实现希望的结果。在某些境况中,多任务和并行处理可能是有利的。另外,在上文描述的实施例中的各种***组件的分离不应被理解为在所有实施例中要求这样的分离,并且应当理解描述的程序组件和***一般能一起集成于单个软件产品中或者被封装到多个软件产品中。
已经描述了本主题的具体实施例。其他实施例在所附权利要求的范围内。例如,在权利要求中记载的动作能按不同顺序被执行而仍然实现希望的结果。作为一个示例,在附图中描绘的过程未必需要所示特定次序或者顺序次序以实现希望的结果。在某些实施方式中,多任务和并行处理可能是有利的。可以提供其他步骤,或可以从所述的过程删除步骤。因此,其他实施方式在下述权利要求的范围内。

Claims (18)

1.一种计算机实现的方法,包括:
获得不包括在结构化信息卡的词项的语法中的候选词项;
识别在实体关系图中被指示为与所述语法的所述词项中的一个或多个词项相关联的一个或多个实体;
识别在所述实体关系图中被指示为与所述候选词项相关联的一个或多个实体;
确定值,所述值反映在所述实体关系图中被指示为与所述候选词项相关联的所述一个或多个实体也在所述实体关系图中被指示为与所述语法的所述词项中的所述一个或多个词项相关联的程度;
基于所述值,将所述候选词项与所述结构化信息卡的词项的所述语法相关联;以及
在将所述候选词项与所述结构化信息卡的词项的所述语法相关联之后,并且响应于从客户端设备的用户接收到包括所述候选词项的搜索查询:
生成所述结构化信息卡,其中,生成所述结构化信息卡包括:
基于包括所述候选词项的所述搜索查询来确定所述结构化信息卡是响应于所述搜索查询的;
响应于确定所述结构化信息卡是响应于所述搜索查询的,识别与所述结构化信息卡相关联的一个或多个字段;和
基于所识别的一个或多个字段,利用来自发送给所述用户的识别的电子通信的信息来填充所述结构化信息卡,其中,被用于所述填充的所述电子通信是基于所述电子通信是响应于所述搜索查询并且是响应于所识别的一个或多个字段来识别的;以及
提供搜索结果页面以用于经由所述客户端设备的用户界面呈现给所述用户,所述搜索结果页面包括:
(i)由搜索引擎响应于所述搜索查询而识别的一个或多个搜索结果,以及
(ii)所述结构化信息卡,其中,所述结构化信息卡与所述一个或多个搜索结果相邻呈现。
2.如权利要求1所述的方法,其中,所述语法的所述词项对应于所述搜索查询的一个或多个参数。
3.如权利要求1所述的方法,其中,在所述实体关系图中被指示为与所述候选词项相关联的所述一个或多个实体也在所述实体关系图中被指示为与所述语法的所述词项相关联的所述程度至少是基于给定搜索查询已被其他用户用于触发呈现所述结构化信息卡的次数来确定的。
4.如权利要求1所述的方法,还包括:
在将所述候选词项与所述结构化信息卡的词项的所述语法相关联之后,并且响应于接收到所述搜索查询:
重写包括所述候选词项的所述搜索查询以还包括一个或多个附加词项,所述一个或多个附加词项是所述语法的所述词项中的一个或多个。
5.如权利要求1所述的方法,其中,在填充中使用的来自发送给所述用户的识别的电子通信的所述信息是从响应于所述搜索查询并且响应于所识别的一个或多个字段的排名最高的电子通信中取得的。
6.如权利要求1所述的方法,其中,所述结构化信息卡被显示在所述搜索结果页面上除了显示所述搜索结果的位置之外的位置处以及在除了接收搜索查询的字段之外的位置处。
7.如权利要求1所述的方法,其中,在所述填充中使用的所述识别的电子通信进一步是基于所述识别的电子通信是包括响应于所述搜索查询并响应于所识别的一个或多个字段的最近的发送给所述用户的电子通信。
8.一种***,包括:
一个或多个数据处理装置,以及
一个或多个计算机可读存储设备,其上存储有指令,所述指令当被所述一个或多个数据处理装置执行时,使所述一个或多个数据处理装置执行操作,所述操作包括:
获得不包括在结构化信息卡的词项的语法中的候选词项;
识别在实体关系图中被指示为与所述语法的所述词项中的一个或多个词项相关联的一个或多个实体;
识别在所述实体关系图中被指示为与所述候选词项相关联的一个或多个实体;
确定值,所述值反映在所述实体关系图中被指示为与所述候选词项相关联的所述一个或多个实体也在所述实体关系图中被指示为与所述语法的所述词项中的所述一个或多个词项相关联的程度;
基于所述值,将所述候选词项与所述结构化信息卡的词项的所述语法相关联;以及
在将所述候选词项与所述结构化信息卡的词项的所述语法相关联之后,并且响应于从客户端设备的用户接收到包括所述候选词项的搜索查询:
生成所述结构化信息卡,其中,生成所述结构化信息卡包括:
基于包括所述候选词项的所述搜索查询来确定所述结构化信息卡是响应于所述搜索查询的;
响应于确定所述结构化信息卡是响应于所述搜索查询的,识别与所述结构化信息卡相关联的一个或多个字段;和
基于所识别的一个或多个字段,利用来自发送给所述用户的识别的电子通信的信息来填充所述结构化信息卡,其中,被用于所述填充的所述电子通信是基于所述电子通信是响应于所述搜索查询并且是响应于所识别的一个或多个字段来识别的;以及
提供搜索结果页面以用于经由所述客户端设备的用户界面呈现给所述用户,所述搜索结果页面包括:
(i)由搜索引擎响应于所述搜索查询而识别的一个或多个搜索结果,以及
(ii)所述结构化信息卡,其中,所述结构化信息卡与所述一个或多个搜索结果相邻呈现。
9.如权利要求8所述的***,其中,所述语法的所述词项对应于所述搜索查询的一个或多个参数。
10.如权利要求8所述的***,其中,在所述实体关系图中被指示为与所述候选词项相关联的所述一个或多个实体也在所述实体关系图中被指示为与所述语法的所述词项相关联的所述程度至少是基于给定搜索查询已被其他用户用于触发呈现所述结构化信息卡的次数来确定的。
11.如权利要求8所述的***,其中,所述操作还包括:
在将所述候选词项与所述结构化信息卡的词项的所述语法相关联之后,并且响应于接收到所述搜索查询:
重写包括所述候选词项的所述搜索查询以还包括一个或多个附加词项,所述一个或多个附加词项是所述语法的所述词项中的一个或多个。
12.如权利要求8所述的***,其中,在填充中使用的来自发送给所述用户的识别的电子通信的所述信息是从响应于所述搜索查询并且响应于所识别的一个或多个字段的排名最高的电子通信中取得的。
13.一种非暂时性计算机可读存储设备,其上存储有指令,所述指令当被数据处理装置执行时,使所述数据处理装置执行操作,所述操作包括:
获得不包括在结构化信息卡的词项的语法中的候选词项;
识别在实体关系图中被指示为与所述语法的所述词项中的一个或多个词项相关联的一个或多个实体;
识别在所述实体关系图中被指示为与所述候选词项相关联的一个或多个实体;
确定值,所述值反映在所述实体关系图中被指示为与所述候选词项相关联的所述一个或多个实体也在所述实体关系图中被指示为与所述语法的所述词项中的所述一个或多个词项相关联的程度;
基于所述值,将所述候选词项与所述结构化信息卡的词项的所述语法相关联;以及
在将所述候选词项与所述结构化信息卡的词项的所述语法相关联之后,并且响应于从客户端设备的用户接收到包括所述候选词项的搜索查询:
生成所述结构化信息卡,其中,生成所述结构化信息卡包括:
基于包括所述候选词项的所述搜索查询来确定所述结构化信息卡是响应于所述搜索查询的;
响应于确定所述结构化信息卡是响应于所述搜索查询的,识别与所述结构化信息卡相关联的一个或多个字段;和
基于所识别的一个或多个字段,利用来自发送给所述用户的识别的电子通信的信息来填充所述结构化信息卡,其中,被用于所述填充的所述电子通信是基于所述电子通信是响应于所述搜索查询并且是响应于所识别的一个或多个字段来识别的;以及
提供搜索结果页面以用于经由所述客户端设备的用户界面呈现给所述用户,所述搜索结果页面包括:
(i)由搜索引擎响应于所述搜索查询而识别的一个或多个搜索结果,以及
(ii)所述结构化信息卡,其中,所述结构化信息卡与所述一个或多个搜索结果相邻呈现。
14.如权利要求13所述的非暂时性计算机可读存储设备,其中,所述语法的所述词项对应于所述搜索查询的一个或多个参数。
15.如权利要求13所述的非暂时性计算机可读存储设备,其中,在所述实体关系图中被指示为与所述候选词项相关联的所述一个或多个实体也在所述实体关系图中被指示为与所述语法的所述词项相关联的所述程度至少是基于给定搜索查询已被其他用户用于触发呈现所述结构化信息卡的次数来确定的。
16.如权利要求13所述的非暂时性计算机可读存储设备,其中,所述操作还包括:
在将所述候选词项与所述结构化信息卡的词项的所述语法相关联之后,并且响应于接收到所述搜索查询:
重写包括所述候选词项的所述搜索查询以还包括一个或多个附加词项,所述一个或多个附加词项是所述语法的所述词项中的一个或多个。
17.如权利要求13所述的非暂时性计算机可读存储设备,其中,在填充中使用的来自发送给所述用户的识别的电子通信的所述信息是从响应于所述搜索查询并且响应于所识别的一个或多个字段的排名最高的电子通信中取得的。
18.如权利要求13所述的非暂时性计算机可读存储设备,其中,所述结构化信息卡被显示在所述搜索结果页面上除了显示所述搜索结果的位置之外的位置处以及在除了接收搜索查询的字段之外的位置处。
CN201711019617.8A 2016-10-26 2017-10-26 结构化信息卡的搜索和检索 Active CN107992514B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210288188.9A CN114706882A (zh) 2016-10-26 2017-10-26 结构化信息卡的搜索和检索

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/334,608 2016-10-26
US15/334,608 US10824630B2 (en) 2016-10-26 2016-10-26 Search and retrieval of structured information cards

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202210288188.9A Division CN114706882A (zh) 2016-10-26 2017-10-26 结构化信息卡的搜索和检索

Publications (2)

Publication Number Publication Date
CN107992514A CN107992514A (zh) 2018-05-04
CN107992514B true CN107992514B (zh) 2022-04-05

Family

ID=60269929

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201711019617.8A Active CN107992514B (zh) 2016-10-26 2017-10-26 结构化信息卡的搜索和检索
CN202210288188.9A Pending CN114706882A (zh) 2016-10-26 2017-10-26 结构化信息卡的搜索和检索

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202210288188.9A Pending CN114706882A (zh) 2016-10-26 2017-10-26 结构化信息卡的搜索和检索

Country Status (5)

Country Link
US (2) US10824630B2 (zh)
EP (1) EP3532952A1 (zh)
CN (2) CN107992514B (zh)
DE (1) DE212017000237U1 (zh)
WO (1) WO2018080920A1 (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10956510B2 (en) 2017-10-05 2021-03-23 International Business Machines Corporation Generate a knowledge graph using a search index
US11714955B2 (en) 2018-08-22 2023-08-01 Microstrategy Incorporated Dynamic document annotations
US11815936B2 (en) 2018-08-22 2023-11-14 Microstrategy Incorporated Providing contextually-relevant database content based on calendar data
US11238210B2 (en) 2018-08-22 2022-02-01 Microstrategy Incorporated Generating and presenting customized information cards
US10572522B1 (en) * 2018-12-21 2020-02-25 Impira Inc. Database for unstructured data
US11682390B2 (en) 2019-02-06 2023-06-20 Microstrategy Incorporated Interactive interface for analytics
US11455361B2 (en) * 2019-08-09 2022-09-27 Microsoft Technology Licensing, Llc Query entity-experience classification
US11769509B2 (en) 2019-12-31 2023-09-26 Microstrategy Incorporated Speech-based contextual delivery of content
CN111475722B (zh) * 2020-03-31 2023-04-18 百度在线网络技术(北京)有限公司 用于发送信息的方法和装置
AU2021261394A1 (en) * 2020-04-23 2022-10-27 Vigeo Technologies, Inc. Systems, devices and methods for the dynamic generation of dialog-based interactive content
CN112905612A (zh) * 2021-02-07 2021-06-04 北京机电工程研究所 知识卡片的构建方法及装置
US12007870B1 (en) 2022-11-03 2024-06-11 Vignet Incorporated Monitoring and adjusting data collection from remote participants for health research
US11790107B1 (en) 2022-11-03 2023-10-17 Vignet Incorporated Data sharing platform for researchers conducting clinical trials

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102163217A (zh) * 2010-03-15 2011-08-24 微软公司 构造搜索结果说明
CN102625936A (zh) * 2009-08-04 2012-08-01 谷歌公司 来自文档的查询建议
CN103823857A (zh) * 2014-02-21 2014-05-28 浙江大学 基于自然语言处理的空间信息检索方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7603350B1 (en) * 2006-05-09 2009-10-13 Google Inc. Search result ranking based on trust
US8433705B1 (en) * 2009-09-30 2013-04-30 Google Inc. Facet suggestion for search query augmentation
US9158846B2 (en) * 2010-06-10 2015-10-13 Microsoft Technology Licensing, Llc Entity detection and extraction for entity cards
US20110314011A1 (en) * 2010-06-18 2011-12-22 Microsoft Corporation Automatically generating training data
CN108874931B (zh) 2011-08-04 2020-12-29 谷歌有限责任公司 与搜索结果一起提供知识面板
JP5932035B2 (ja) 2011-08-04 2016-06-08 グーグル インコーポレイテッド 検索結果を伴う知識パネルを提供すること
US10223730B2 (en) * 2011-09-23 2019-03-05 Visa International Service Association E-wallet store injection search apparatuses, methods and systems
WO2013060015A1 (en) * 2011-10-28 2013-05-02 Google Inc. Advertisement determination system and method for clustered search results
US20150039467A1 (en) 2012-04-13 2015-02-05 Sunil Kothari Print Service Matching
US9934283B2 (en) * 2013-03-08 2018-04-03 Google Llc Social annotations for enhanced search results
US20160224621A1 (en) 2013-03-13 2016-08-04 Google Inc. Associating A Search Query With An Entity
US20140344249A1 (en) * 2013-05-15 2014-11-20 Vince Magistrado Simple action record search
US9715548B2 (en) 2013-08-02 2017-07-25 Google Inc. Surfacing user-specific data records in search
AU2014314317A1 (en) 2013-08-26 2016-03-03 Continuum Consulting Nv Methods for semantic text analysis
US9454621B2 (en) * 2013-12-31 2016-09-27 Google Inc. Surfacing navigational search results
US8819006B1 (en) * 2013-12-31 2014-08-26 Google Inc. Rich content for query answers
US20150293977A1 (en) * 2014-04-15 2015-10-15 Yahoo! Inc. Interactive search results
US20160048875A1 (en) * 2014-08-12 2016-02-18 Yahoo! Inc. Entity based search advertising within a modular search object framework
CN104699841A (zh) * 2015-03-31 2015-06-10 北京奇虎科技有限公司 提供搜索结果的列表摘要信息的方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102625936A (zh) * 2009-08-04 2012-08-01 谷歌公司 来自文档的查询建议
CN102163217A (zh) * 2010-03-15 2011-08-24 微软公司 构造搜索结果说明
CN103823857A (zh) * 2014-02-21 2014-05-28 浙江大学 基于自然语言处理的空间信息检索方法

Also Published As

Publication number Publication date
US20210049165A1 (en) 2021-02-18
EP3532952A1 (en) 2019-09-04
US20180113865A1 (en) 2018-04-26
CN114706882A (zh) 2022-07-05
DE212017000237U1 (de) 2019-05-28
US10824630B2 (en) 2020-11-03
CN107992514A (zh) 2018-05-04
US11238058B2 (en) 2022-02-01
WO2018080920A1 (en) 2018-05-03

Similar Documents

Publication Publication Date Title
CN107992514B (zh) 结构化信息卡的搜索和检索
US11392896B2 (en) Event extraction systems and methods
US9514405B2 (en) Scoring concept terms using a deep network
US10095683B2 (en) Contextual speller models on online social networks
US9064212B2 (en) Automatic event categorization for event ticket network systems
US20150161529A1 (en) Identifying Related Events for Event Ticket Network Systems
US20160299883A1 (en) Spell correction with hidden markov models on online social networks
US9218568B2 (en) Disambiguating data using contextual and historical information
US20140279864A1 (en) Generating data records based on parsing
CN107958014B (zh) 搜索引擎
US10127304B1 (en) Analysis and visualization tool with combined processing of structured and unstructured service event data
US20180039610A1 (en) Suggestions for digital forms
US9251168B1 (en) Determining information about a location based on travel related to the location
US20130346405A1 (en) Systems and methods for managing data items using structured tags
US11030409B2 (en) Identifying attributes associated with an entity using natural language processing
US11062333B2 (en) Determining indices based on area-assigned data elements
US10133814B2 (en) Generating explanatory electronic documents using semantic evaluation
CN113177116A (zh) 信息展示方法及装置、电子设备、存储介质及程序产品
CN113763117A (zh) 推送方法、推送装置、电子设备、存储介质和程序产品
WO2021050082A1 (en) Text entry recommendations based on stored search results
WO2018222254A1 (en) Event extraction systems and methods

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant