CN108701161A

CN108701161A - 为搜索查询提供图像

Info

Publication number: CN108701161A
Application number: CN201780015007.2A
Authority: CN
Inventors: N·特里法诺维克
Original assignee: Microsoft Technology Licensing LLC
Current assignee: Microsoft Technology Licensing LLC
Priority date: 2016-03-04
Filing date: 2017-02-27
Publication date: 2018-10-23
Anticipated expiration: 2037-02-27
Also published as: US10437868B2; EP3423961A1; US20170255693A1; WO2017151457A1; CN108701161B

Abstract

描述了用于为搜索查询提供图像的技术和方法。在至少一些实施例中，一种***包括刮取查询组件、搜索组件以及搜索结果分析组件。刮取查询组件基于与感兴趣实体相关联的文本信息来提供刮取查询。搜索组件经由一个或多个网络进行电子搜索以至少部分地基于刮取查询来获得搜索结果，搜索结果至少包括搜索结果图像以及与搜索结果图像相关联的图像元数据。搜索结果分析组件确定图像元数据中关联于搜索结果图像的至少一部分与文本信息中关联于感兴趣实体的至少一部分之间的相似性，并且至少部分地基于所确定的相似性来确定是否要存储、提供或丢弃搜索结果图像。

Description

为搜索查询提供图像

背景技术

电子设备的大多数用户熟悉使得用户能够经由网络搜索信息的搜索引擎。有时，用户在寻求与商业或其他感兴趣的位置(例如，公园、纪念碑等)相关的信息时使用搜索引擎。例如，用户可能希望了解特定区域中(例如，在用户的当前位置附近)的商店或餐馆。用户可以向搜索引擎录入一般查询以寻求关于所有这样的机构的信息，或者备选地，用户可以录入更具体的查询以寻找关于特定机构的信息。在由搜索引擎返回的信息中，用户经常发现视觉图像对于做出选择和实际访问机构非常有益且有用。

随着时间的推移，一些企业可能会移动或停止运营，而其他企业可能会成立。同样，企业和其他感兴趣的位置的外观可能会发生变化。诸如店面、标牌、灯光和自然风景等物品可能会发生变化和演化，从而需要更新的最新的图像。由于企业和其他感兴趣的位置的不断变化的风景，搜索结果的提供者面临与提供以高效且有效的方式满足搜索查询的需要的当前的图像相关联的实质性挑战。

发明内容

在至少一些实施例中，一种用于为搜索查询提供图像的***包括：被配置为基于与感兴趣实体相关联的文本信息来提供刮取(scrape)查询的刮取查询组件；被配置为经由一个或多个网络进行电子搜索以至少部分地基于刮取查询来获得搜索结果的搜索组件，搜索结果至少包括搜索结果图像以及与搜索结果图像相关联的图像元数据；以及搜索结果分析组件，其被配置为：确定图像元数据中与搜索结果图像相关联的至少一部分与文本信息中与感兴趣实体相关联的至少一部分之间的相似性；以及至少部分地基于所确定的相似性来确定是否要存储搜索结果图像。

类似地，在至少一些实现中，一种用于为搜索查询提供图像的方法，包括：经由一个或多个网络进行图像搜索以获得图像搜索结果，图像搜索结果至少包括搜索结果图像以及与搜索结果图像相关联的图像元数据；确定搜索结果图像与感兴趣实体之间的相似性，至少包括使用字符串距离函数将图像元数据的至少一部分的一个或多个属性与关联于感兴趣实体的文本信息相比较以确定总体相似性得分；以及至少部分地基于总体相似性得分来确定是否要存储搜索结果图像。

类似地，在至少一些实现中，承载一个或多个指令的一个或多个计算机可读介质在由一个或多个处理组件执行时执行用于为搜索查询提供图像的操作，这些操作包括：获得一个或多个搜索结果，这些搜索结果至少包括搜索结果图像以及与搜索结果图像相关联的图像元数据；确定图像元数据中与搜索结果图像相关联的至少一部分与文本信息中与感兴趣实体相关联的至少一部分之间的相似性，至少包括使用字符串距离函数将图像元数据的至少一部分的一个或多个属性与文本信息与感兴趣实体相关联的至少一部分的一个或多个属性相比较以确定总体相似性得分；以及至少部分地基于总体相似性得分来确定是否要存储搜索结果图像。

在至少一些实现中，使用字符串距离函数将图像元数据的至少一部分的一个或多个属性与文本信息中与感兴趣实体相关联的至少一部分的一个或多个属性相比较以确定总体相似性得分包括：将图像元数据中与搜索结果图像相关联的至少一部分分离成一个或多个第一标记；将文本信息中与感兴趣实体相关联的至少一部分分离成一个或多个第二标记；向一个或多个第一标记应用一个或多个第一标记权重；向一个或多个第二标记应用一个或多个第二标记权重；将一个或多个第一标记中的至少一些第一标记与一个或多个第二标记中的至少一些第二标记相比较；计算与一个或多个第一标记与一个或多个第二标记的每次比较相关联的连接相似性得分；以及至少部分地基于一个或多个连接相似性得分、一个或多个第一标记权重以及一个或多个第二标记权重来计算总体相似性得分。

在其他实现中，操作可以进一步包括基于指定编辑距离函数来确定是否要将一个或多个第一标记中的至少一些第一标记与一个或多个第二标记中的至少一些第二标记相比较。

提供本“发明内容”是为了以简化的形式介绍一些概念，这些概念将在下面的“具体实施方式”中被进一步描述。本“发明内容”不旨在标识所要求保护的主题的关键特征或必要特征，也不旨在用于帮助确定所要求保护的主题的范围。

附图说明

参考附图描述详细说明书。在附图中，在不同附图中使用相同的附图标记表示相似或相同的组件。

图1示出了用于为搜索查询提供图像的环境的实施例。

图2示出了用于为搜索查询提供图像的搜索***的实施例。

图3示出了用于为搜索查询提供图像的过程的实施例。

图4示出了用于生成刮取查询的刮取查询模板的实施例。

图5示出了用于执行刮取图像搜索的代表性刮取查询集的实施例。

图6示出了代表性感兴趣实体的代表性刮取搜索结果集的实施例。

图7示出了两个文本实体的机器学习(ML)模型比较的实施例。

图8示出了用于为搜索查询提供图像的计算机***的实施例。

图9示出了用于为搜索查询提供图像的环境的另一实施例。

具体实施方式

本公开描述了用于为搜索查询提供图像的技术和方法。如下面更全面地描述的，根据本公开的用于为搜索查询提供图像的技术和方法可以有利地以有效且高效的方式为搜索查询提供最新图像。

图1示出了根据本公开的用于为搜索查询提供图像的环境100的实施例。在这个实施例中，环境100包括经由一个或多个网络106与用户设备102可操作地通信的搜索***110。用户设备102可以是使得用户能够向搜索***110提供搜索查询104并且接收和查看包括一个或多个显示图像152的搜索结果150的任何合适的设备。

在至少一些实现中，搜索***110还可以经由一个或多个网络106与其他组件或实体通信。例如，如图1所示，在至少一些实施例中，搜索***110可以经由一个或多个网络106与图像提供服务140(例如，纽约州的纽约市的Foursquare Labs公司、马萨诸塞州的尼德姆的Trip Advisor等)、网站主机142、一个或多个数据存储库144、或信息源146(例如，台式计算机、服务器或大型计算机、膝上型计算机、笔记本、手机、相机、成像***等)进行通信。

一个或多个网络106可以包括服务器、客户端、因特网服务提供商或其他合适的通信介质(例如，LAN、WAN、本地通信***、全球通信***、因特网、蜂窝通信***、电话通信***等)。在各种实现中，一个或多个网络106可以具有静态或动态拓扑，并且可以包括安全网络(例如，企业网络)、不安全网络(例如，无线开放网络、因特网等)，并且还可以协调通过其他网络(例如，PSTN、蜂窝网络等)的通信。作为示例而非限制，一个或多个网络106可以通过任何合适的通信技术进行耦合，包括例如电磁信号、声信号、RF信号、红外信号和任何其他合适的通信技术或信号。

应当理解，图1所示的搜索***110可以表示各种可能的***类型，包括但不限于服务器、大型机、工作站、分布式计算***、基于云的计算***或任何其他合适类型的***。类似地，尽管图1中用户设备102在图1中被描绘为手持设备，诸如蜂窝电话，但是应当理解，在备选实施例中，用户设备102可以是使得用户能够向搜索***110提供搜索查询104并且接收和查看包括一个或多个显示图像152的搜索结果150的任何合适的设备。例如，在备选实施例中，用户设备102可以是个人数据助理(PDA)、笔记本计算机、平板计算机、膝上型计算机、台式计算机、服务器或大型计算机、电视、车辆、电器或任何其他合适的设备。

在图1所示的实现中，搜索***110包括具有图像刮取组件122和图像返回组件124的图像搜索引擎120。图像搜索引擎120与存储一个或多个刮取图像132和相关联的刮取图像元数据134的图像数据库(或图像高速缓存)130通信。通常，在至少一些实现中，图像刮取组件122可以通过经由一个或多个网络106定位候选图像并且将刮取图像132存储在图像数据库130内来执行图像提取(或刮取)，并且图像返回组件124可以将来自图像数据库130的相关的刮取的图像与传入的搜索查询(例如，搜索查询104)相匹配，以在用户设备102处显示的搜索结果150内提供一个或多个搜索结果图像152。

图2示出了用于为图1的搜索查询提供图像的搜索***110的实施例的附加细节。在这个实施例中，搜索***110包括通过总线218耦合到存储器216的一个或多个处理组件212和一个或多个输入/输出(I/O)组件214。存储器216包括提供有助于在***110内的元件之间传送信息的基本例程的基本输入/输出***(BIOS)220、以及管理和向***110的各种元件提供公共服务的操作***222。还存储在存储器216中的是包括刮取的图像132和刮取的图像元数据134的图像数据库130。在至少一些实现中，实体索引224也被存储在存储器216内。

如图2中进一步所示，搜索***110的图像搜索引擎120被至少部分设置在存储器216中。更具体地，图像搜索引擎120可以包括当由一个或多个处理组件212执行时执行根据本公开的用于为搜索查询提供图像的一个或多个操作的指令。

在至少一些实现中，图像搜索引擎120的图像刮取组件122包括刮取查询组件226、搜索组件228以及搜索结果组件230。刮取查询组件226从实体索引224获得关于感兴趣实体的信息，并且提供可以由搜索组件228用来搜索与感兴趣实体相关联的图像的一个或多个刮取搜索查询。在一些实现中，一个或多个刮取搜索查询可以从刮取查询高速缓存227被获得，或者可以由刮取查询组件226使用填充有单词、术语、短语、部分单词、单词部分、音节、数字、数字序列或与从实体索引224获得的感兴趣实体相关联的其他数据的一个或多个标准模板而被生成。

在至少一些实现中，搜索组件228接收由刮取查询组件226提供的一个或多个刮取搜索查询，并且从实体索引224执行与感兴趣实体相关联的图像的在线搜索。应当理解，搜索组件228可以使用各种合适的技术和方法来搜索图像，包括各种已知的公开可用的搜索引擎(例如，等)所采用的技术和方法。更具体地，搜索组件228可以经由一个或多个网络106与其他组件或实体通信，包括但不限于图像提供服务140、网站主机142、一个或多个数据存储库144、信息源146、或者经由一个或多个网络106进行通信的任何其他合适的组件或实体，以基于由刮取查询组件226提供的一个或多个刮取搜索查询来定位和获得一个或多个搜索结果图像。

在至少一些实现中，搜索结果分析组件230分析由搜索组件228获得的一个或多个搜索结果图像，以确定一个或多个搜索结果图像(以及相关联的元数据)中的哪些(如果有的话)要作为刮取的图像132(以及刮取的图像元数据134)而被存储在图像数据库130中。例如，搜索结果分析组件230可以合并一个或多个搜索结果图像(例如，以消除重复)，并且可以单独地比较一个或多个搜索结果图像的每个和相关联的图像元数据中与关联于感兴趣实体的数据，以便过滤和在图像数据库130内存储最相关的候选刮取的图像132和刮取的图像元数据134。在至少一些实现中，搜索结果分析组件230可以使用机器学习(ML)方法来评估刮取搜索结果与来自实体索引224的感兴趣实体之间的内容相似性，以适当地选择要存储在图像数据库130内的一个或多个候选图像。类似地，搜索结果分析组件230可以确定要丢弃而不是并存储一个或多个搜索结果图像中的哪些。

继续参考图2，在至少一些实现中，图像返回组件124包括查询分析组件232和图像选择组件234。查询分析组件232被配置为从用户设备102接收搜索查询104并且分析搜索查询104以将搜索查询104与来自实体索引的一个或多个感兴趣实体相匹配。反过来，图像选择组件234从查询分析组件232接收信息，并且从图像数据库130中选择一个或多个刮取的图像132以返回到用户设备102，以在搜索结果150内显示为与搜索查询104相对应的显示的图像152。在至少一些实现中，查询分析组件232或图像选择组件234(或两者)可以使用机器学习(ML)方法来评估搜索查询104与刮取的图像元数据134之间的内容相似性，以适当地选择一个或多个刮取图像132以返回到与搜索查询104相对应的用户设备102。

图3示出了用于为搜索查询提供图像的过程300的实施例。在这个实施例中，过程300包括刮取流水线部分310和图像返回部分350。在至少一些实现中，刮取流水线部分310包括在312处确定感兴趣实体以用于获得一个或多个图像。例如，在一些实现中，312处的操作可以包括确定新实体已经被添加到实体索引224，或者备选地，312处的操作可以包括确定存储在图像数据库130内的一个或多个刮取图像已经达到年龄限制(或过期)使得期望搜索可能的新的或更新的图像。

刮取流水线部分310还包括在314处确定一个或多个刮取查询。如上所述，在至少一些实现中，在314处确定一个或多个刮取查询可以包括检索被存储在刮取查询高速缓存227内的一个或多个在先刮取查询，或者生成一个或多个新的刮取查询(例如，使用一个或多个刮取查询模板)。

如图3中进一步所示，刮取流水线部分310还包括在316处使用一个或多个刮取查询执行一个或多个图像搜索。例如，在至少一些实现中，在316处执行的一个或多个图像搜索可以包括使用已知的公开可用的图像搜索引擎进行一个或多个搜索。在318处，刮取流水线部分310包括分析使用一个或多个刮取查询从一个或多个图像搜索获得的结果。在至少一些实现中，318处的操作可以包括搜索结果分析组件230合并一个或多个搜索结果图像(例如，以消除重复)，并且将一个或多个搜索结果图像中的每个以及相关联的图像元数据与关联于感兴趣实体的数据相比较，以便过滤和在图像数据库130内存储最相关的候选刮取的图像132和刮取的图像元数据134。如上所述，在至少一些实现中，搜索结果分析组件230可以使用机器学习(ML)方法来评估刮取搜索结果和来自实体索引224的感兴趣实体之间的内容相似性，以适当地选择要存储在图像数据库130内的一个或多个候选图像。在至少一些实现中，搜索结果分析组件230丢弃刮取搜索结果与感兴趣实体之间的内容相似性不足够的一个或多个刮取搜索结果(例如，内容相似性未满足或超过相似性阈值，不具有足够高的相似性得分，等等)。

刮取流水线部分310还包括在320处将一个或多个所选择的刮取的图像(和相关联的刮取的图像元数据)存储在图像数据库中。可选地，刮取流水线部分310还可以包括更新刮取查询的刮取高速缓存322，诸如通过存储由刮取查询组件在314处生成的任何新的刮取查询。在至少一些实现中，刮取流水线部分310然后可以返回到312处的操作，并且可以重复上述操作312到322(例如，周期性地、非周期性地、有条件地、自组织地等)以建立图像数据库130以包括一组相对当前的刮取的图像132和相关联的刮取的图像元数据134。

如图3中进一步所示，图像返回部分350包括在352处接收搜索查询。例如，在至少一些实现中，搜索***110可以经由一个或多个网络106从用户设备102接收搜索查询104。图像返回部分350还包括在354处分析搜索查询。在至少一些实现中，354处的分析包括采用机器学习(ML)匹配功能来确定被包含在搜索查询内的所请求的实体与被存储在图像数据库130中的一个或多个刮取图像元数据134之间的相似性并且指派相应的相似性得分。下面更全面地描述分析搜索查询(在354处)的各种可能方面。

图像返回部分350还包括在356处确定所请求的实体的一个或多个刮取的图像是否存在于图像数据库中。例如，在至少一些实现中，356处的确定可以基于表示在搜索查询中所包含的所请求的实体与在354处所确定的一个或多个刮取图像元数据之间的相似性的一个或多个相似性得分。如果确定所请求的实体的一个或多个刮取图像确实存在于图像数据库内(在356处)，则图像返回部分350包括在358处从图像数据库获得一个或多个图像以响应于搜索查询来进行提供，并且在362处响应于搜索查询而提供一个或多个图像(来自图像数据库)。

备选地，如果确定(在356处)所请求的实体的一个或多个刮取的图像不存在于图像数据库内，则图像返回部分350包括在360处通过使用接收到的搜索查询进行新的图像搜索来获得一个或多个图像(例如，使用等)，在361分析使用接收到的搜索查询从一个或多个图像搜索获得的结果，并且在362处响应于搜索查询而提供一个或多个图像(来自新的图像搜索)。在至少一些实现中，361处的分析可以包括上面关于在过程300的刮取流水线部分310中在318处的分析结果所描述的一个或多个操作，包括使用机器学习(ML)方法来评估搜索结果与来自在352处接收的搜索查询的感兴趣实体之间的内容相似性，以适当地选择一个或多个图像，如下面更全面地描述的。

应当理解，与传统技术相比，用于为搜索查询提供图像的技术和方法可以提供实质性的操作改进。例如，可以以如下方式管理用于为包括刮取流水线部分(例如，图3的部分310)的搜索查询提供图像的过程：该方式使得可以控制与刮取操作相关联的计算工作量以提供与可用***处理和带宽要求的改进匹配。更具体地，与传统技术和方法相比，这种技术可以有利地以自动化的计算有效的方式构建和维护可以包括丰富的图像和复杂的文本结构的图像数据库。

通过允许更新实体索引，并且通过自动生成刮取查询，刮取流水线部分通过使用刮取的图像和相关联的刮取的图像元数据***地构建图像数据库来实现自动化和迭代的图像候选存储库丰富，而不会使刮取平台的带宽过载。可以使用后台处理将一个或多个图像定位并且存储在图像数据库中以用于整个实体索引。此外，包括刮取流水线部分的技术和方法可以有利地支持期望市场和数据段(例如，酒店和餐馆)的优先化，并且可以在允许进程调度(例如，非高峰调度等)的各种工作流环境中被实现。

除了效率优势之外，根据本公开的用于为搜索查询提供图像的技术和方法还可以提供优于传统技术的改进的可扩展性、改进的鲁棒性和改进的质量。更具体地，可以通过提供用于针对基本上所有市场和市场细分分析和比较图像刮取结果与刮取查询(在318处)的通用匹配模型来改进技术和方法的可扩展性。因为根据本公开的搜索***和过程可以是组件化的，所以替换或修改组件以提供新的或改进的特征可以提供优于传统技术的改进的鲁棒性。另外，与传统技术相比，根据本公开的技术和方法可以提供改进的精度，从而提供改进的全面的图像数据库，该数据库提供用于为搜索结果提供图像的改进的覆盖范围。

根据本公开的用于为搜索查询提供图像的技术和方法不必限于上面参考图1-3描述的特定实施例。在以下描述中，将描述用于为搜索查询提供图像的技术和方法的附加实施例。应当理解，本文中描述的实施例并非旨在穷举根据本公开的所有可能的实施例，并且可以基于本文中公开的主题来构思附加的实施例。例如，应当理解，可以去除所描述的实施例的各种组件和方面中的至少一些以创建附加实施例，或者可以进行各种组合或重新排序以创建另外的实施例。在以下对附加实施例的讨论中，可以使用共同的附图标记来指代上面引入的元件，并且为了简洁起见，可以省略先前引入的元件的描述，使得可以将重点放在这些另外的实施例的新的或变化的方面。

如上所述，在用于为搜索查询提供图像的过程300的刮取流水线部分310期间，刮取查询组件226从实体索引224获得关于感兴趣实体的信息，并且提供搜索组件228可以用来搜索与感兴趣实体相关联的图像的一个或多个刮取搜索查询。在至少一些实现中，一个或多个刮取查询可以从被存储在刮取查询高速缓存227内的一个或多个先前刮取查询来获得，或者可以由刮取查询组件226使用一个或多个标准模板使用从实体索引224获得的与感兴趣实体相关联的信息来生成。

例如，图4示出了用于生成刮取查询的刮取查询模板400的实施例。在这种实现中，刮取查询模板400包括填充有与包含在实体索引224中的感兴趣实体相关联的信息的多个字段410(例如，“姓名”、“城市”、“地址”、“网站”、“电话”)。刮取查询模板400还包括标识要被应用于被包含在多个字段410内的信息的标准化协议的标准化标识符420(例如，移除大写字母、不必要的空格、不必要的字符、编码等。)。刮取查询模板400还包括定义将从刮取查询模板400产生的一个或多个刮取查询的格式的一组查询标识符430。

图5示出了可以由图4的刮取查询模板400产生的一组代表性的刮取查询500的实施例。图5所示的这组刮取查询500表示由刮取查询组件226确定(在314处)并且用于使用搜索组件228执行一个或多个图像搜索(在316处)的一个或多个刮取查询。在图5所示的实施例中，刮取查询500对应于在内华达州拉斯维加斯被称为“Bellagio”的感兴趣实体。在这个示例中，这组代表性的刮取查询500包括：包括感兴趣实体的名称和街道地址的第一刮取查询502(“Bellagio”)、包括感兴趣实体的名称和城市的第二刮取查询504、包括感兴趣实体的名称并且备选地包括感兴趣实体的街道地址或电话号码的第三刮取查询506、以及包括与感兴趣实体相关联的网站的第四刮取查询508。图5所示的刮取查询502-508对应于图4的刮取查询模板400的查询标识符430。当然，图4和5所示的实施例仅仅是代表性的，并且在备选实施例中，可以使用提供各种备选刮取查询配置的其他刮取查询模板。

如上所述，搜索结果分析组件230分析由搜索组件228使用来自刮取查询组件226的刮取查询而获得的搜索结果，以确定一个或多个搜索结果图像(以及相关联的元数据)中的哪些(如果有的话)要作为刮取的图像132(和刮取的图像元数据134)而被存储在图像数据库130中以及一个或多个搜索结果图像中的哪些要被丢弃。搜索组件228获得的搜索结果可以包括复杂文本结构形式的富图像响应。不同的搜索引擎可以具有不同的搜索模式和格式(例如，可扩展标记语言(XML)、JavaScript对象表示法(JSON)等)。通常，搜索组件228提供的搜索结果包括图像、以及可以用于与实体索引224内的感兴趣实体相匹配的一组富元数据信息和文本内容。

例如，图6示出了代表性的感兴趣实体610(即，位于魁北克省蒙特利尔的“Hotelde Paris”)的一组代表性刮取搜索结果600的实施例。在至少一些实现中，感兴趣实体610可以由从实体索引224获得的实体元数据614来表征。在图6所示的实施例中，这组代表性的刮取搜索结果600包括具有第一候选图像622及其相关联的第一图像元数据624的第一搜索结果620。类似地，第二搜索结果630包括第二候选图像632及其相关联的第二图像元数据634，并且第三搜索结果640包括第三候选图像642及其相关联的第三图像元数据644。

在操作中，搜索结果分析组件230分析刮取搜索结果600(在318处)以确定是否要存储候选图像622、632、642中的一个或多个。在至少一些实现中，搜索结果分析组件230评估实体元数据614与关联于刮取搜索结果600中所包含的候选图像622、632、642的图像元数据624、634、644之间的相似性。如上所述，在至少一些实现中，搜索结果分析组件230可以使用机器学习(ML)方法来评估刮取搜索结果600与感兴趣实体610之间的内容相似性。如果存在足够的相似性，则将候选图像(以及相关联的图像元数据)作为刮取图像132(以及相关联的刮取图像元数据134)而被存储在图像数据库130内。

例如，在至少一些实现中，刮取搜索结果600的分析(在318处)可以包括一个或多个文本匹配操作，其可以包括确定与感兴趣实体610相关联的一个或多个“实体名”数据613(例如，“Hotel de Paris”、“hotel de paris”)，并且确定第一搜索结果620中的一个或多个相应的第一名称数据623的呈现或存在、以及第二搜索结果630中的第二名称数据633的呈现或存在。在图6所示的实施例中，第三搜索结果640不包括第三图像元数据644中类似于与感兴趣实体610相关联的一个或多个“实体名”数据613的任何数据。类似地，在至少一些实现中，刮取搜索结果600的分析(在318处)可以包括一个或多个文本匹配操作，其可以包括确定与感兴趣实体610相关联的一个或多个“地址”数据615(例如，“901Rue SherbrookeE”)，并且确定第二搜索结果630中的一个或多个相应的第二地址数据635的呈现或存在。在如图6所示的实施例中，第一和第三搜索结果620、640不包括第一和第三图像元数据624、644中类似于与感兴趣实体610相关联的一个或多个“地址”数据615的任何数据。此外，在至少一些实现中，刮取搜索结果600的分析(在318处)可以包括一个或多个文本匹配操作，其可以包括确定与感兴趣实体610相关联的一个或多个“城市”数据617(例如，“蒙特利尔”)，并且确定第二搜索结果630中的一个或多个相应的第二城市数据637的呈现或存在、以及第三搜索结果640中的一个或多个相应的第三城市数据647的呈现或存在。在如图6所示的实施例中，第一搜索结果620不包括第一图像元数据624中类似于与感兴趣实体610相关联的一个或多个“城市”数据617的任何数据。基于刮取搜索结果600的分析结果(在318处)，搜索结果分析组件230可以确定要将第一、第二和第三候选图像622、632、642(以及相关联的第一、第二和第三图像元数据624、634、644)中的一个或多个存储到图像数据库130中。

如上所述，在至少一些实现中，搜索结果分析组件230可以使用机器学习(ML)模型，ML模型被配置为学习和确定两个文本实体是否相似并且提供指示两个文本实体之间的相似性的程度的相似性得分。相似性得分可以由搜索结果分析组件230用来确定是否要存储、提供或丢弃被包含在刮取搜索结果600中或由刮取搜索结果600标识的图像。在至少一些实现中，ML模型可以已经使用一种或多种技术被训练和被评估，包括分类学习模型、逻辑回归、支持向量机(SVM)、神经网络或者任何其他合适的训练和评估技术中的一个或多个。ML模型可以被配置为达到期望的精度(例如，90％)，并且在一些实现中，ML模型可以对包含实体和图像响应数据的训练集进行训练。

应当理解，ML模型可以使用相似性模型中的各种特征来确定两个文本实体是否相似，包括例如字符串相似性、搜索引擎响应得分(例如，图像静态等级、图像最终等级等)、搜索引擎过滤器属性(例如，人员得分、成人得分、颜色熵等)、实体类别(例如，酒店、餐馆等)、或任何其他合适的特征。更具体地，在至少一些实现中，由ML模型考虑或确定的字符串相似性可以包括实体属性与图像文本元数据之间的文本相似性、以及实体属性与与搜索结果相关联的日志或记录之间的文本相似性(例如，单击日志，其指示导致用户访问搜索结果的用户选择或查询)。在各种实现中，ML模型可以使用各种字符串距离函数中的一个或多个(例如，模糊、余弦、Levenshtein、简单包含二进制特征等)，并且在至少一些实现中，ML模型可以使用不同的字符串距离函数，这取决于所比较的属性。在至少一些实现中，ML模型可以使用字符串之间的“Word2Vec”距离，其中Word2Vec是用于提供单词的向量表示的公开可用的工具，其将文本语料库作为输入并且产生单词向量作为输出。类似地，在至少一些实现中，ML模型可以使用Levenshtein字符串距离作为ML模型的特征。因此，在至少一些实现中，机器学习模型可以被配置为通过在比较图像元数据中与搜索结果图像相关联的至少一部分的第一属性与文本信息中与感兴趣实体相关联的至少一部分时应用第一字符串距离函数并且当比较图像元数据中与搜索结果图像相关联的至少一部分的第二属性与文本信息中与感兴趣实体相关联的至少一部分时应用第二字符串距离函数来确定相似性。

更具体地，在至少一些实现中，搜索结果分析组件230可以使用基于距离的机器学习(ML)模型，其计算编辑第一术语以获得第二术语需要单个字母的多少添加和删除(即，“编辑计数”)。在这种字符串距离计算中，较少数目的计数表示更好的相似性。这种字符串距离计算可以用于比较单个单词，其中可以针对错误拼写和复数获得更好的相似性得分。例如，基于距离的ML模型可以将术语“tree”与术语“trees”相比较，并且指派编辑得分“1”，因为需要在术语“tree”的末尾的“s”的一次添加来获得匹配。类似地，基于距离的ML模型可以将术语“tree”与术语“three”相比较，并且指派编辑得分“1”，因为需要“h”的一次添加来获得匹配。这表明，对于完全不同的单词，可以获得相对较低的编辑得分，这表示良好的相似性。在又一示例中，基于距离的ML模型可以将短语“new york city”与术语“city of newyork”相比较，并且指派通过首先删除“new york”并且然后添加“new york”而确定编辑得分“15”，其表明，这样的基于距离的ML模型可能导致单词顺序发生改变的短语的得分相对较差。因此，在至少一些实现中，基于距离的ML模型可能遭受单词排序问题，并且可以通过进一步包括基于标记的建模方面来得到改进，如下面更全面地描述的。

例如，图7示出了两个文本实体(第一文本实体710和第二文本实体720)的机器学习(ML)模型比较700的实施例。图7所示的实施例表示“模糊”方法，其结合了“编辑距离”方法和“标记距离”方法的优点。第一文本实体710可以表示搜索图像元数据，第二文本实体720可以表示感兴趣实体元数据。如图7所示，在至少一些实现中，第一和第二文本实体710、720可以被标记化，并且一个文本实体的每个标记与另一文本实体的每个标记相比较。更具体地，ML模型可以使用模糊字符串相似性方法来使用指定的编辑距离函数(例如，Levenshtein)将一个文本实体的每个标记与另一文本实体的每个标记相比较，从而形成二分图(例如，图7)，其中连接利用连接相似性得分730被加权。在至少一些实现中，可以断开(或丢弃或忽略)连接相似性得分730低于指定阈值的连接，并且可以减少二分图，仅保留具有满足或超过指定阈值的连接相似性得分730的1-1连接。

更具体地，在至少一些实现中，ML模型可以包括改善了上面提到的单词排序问题的一个或多个基于标记的(或标记化)方面。例如，在至少一些实现中，可以将得分确定为(公共单词的数目)函数f(短语1中的单词的数目，短语2中的单词的数目)的比率。回到上面的涉及短语“New York city”与术语“city of New York”的比较的示例，公共单词的数目是“3”，短语1中的单词的数目是“3”，并且短语2中的单词的数目是“4”。然后，可以基于函数“f”确定所得到的得分，例如，如下：(1)如果“f＝min()”，则相似性得分等于“1”，或者(2)如果“f＝max()”，则相似性得分等于“0.75”，等等。

可以理解，完全依赖于标记化方面的ML模型可能无法为涉及错误拼写或多个差异的示例(例如，“tree”与“trees”或“three”相比)提供期望的准确度。因此，在至少一些实现中，搜索结果分析组件230可以使用组合编辑距离和基于标记的方面的所谓的“模糊的”基于距离的ML模型，以提供可以通过获得编辑评分方面和基于标记的方面的优势来实现改进的评分的相似性得分。

更具体地，在先前的示例中，每个标记基本上被指派标记权重“1”。然而，在至少一些实现中，ML模型可以向第一文本实体和第二文本实体710、720的各种标记指派标记权重732(即，非“1”标记权重)(例如，对于更长的更复杂的标记，权重更高)，并且然后可以应用标记加权的余弦相似性函数来确定第一文本实体710与第二文本实体720之间的相似性的总体相似性得分740。

应当理解，“标记权重”可以由字符串相似性函数用来计算更好的相似性得分。在至少一些实现中，可以使用逆文档频率(IDF)得分。在计算相似性得分之后，它们可以用作ML模型中的特征。例如，在训练ML模型的过程中，每个特征获得其“特征权重”。

应当理解，如上所述的ML模型的实现可以有利地匹配具有不同倾斜度的文本实体，与备选ML模型相比，这可以改善ML模型对于各种不同语言的鲁棒性。在各种实现中，可以基于各种相似性来确定标记权重。例如，在一些实现中，可以基于逆文档频率(IDF)标记得分来确定标记权重，这可以帮助确保非常常见的标记上的匹配不会对总体相似性得分740产生大的影响。在至少一些实现中，可以采用包含特征，其中可以在各种文本数据(例如，图像名称、图像源页面、图像元数据、图像页面索引内容和查询等)中检查通常存在的各种位置属性(例如，城市)。

例如，如果短语1是“the apple corporation”并且短语2是“the Microsoftcorporation”，则纯粹基于标记的相似性得分可以是2/3，这可以表示不期望的高得分。然而，在至少一些实现中，ML模型可以改为向每个标记指派权重。在至少一些实现中，可以认为非常频繁地使用的术语不提供非常有用的信息，而可以认为罕见的单词提供很多有用的信息。在至少一些实现中，可以采用逆文档频率(IDF)来指派标记权重，并且可以将IDF计算为log(1/n)。因此，可以在索引中频繁出现的诸如“the”等单词可以被指派相对较低的IDF标记权重“2”，而诸如“corporation”等相对较不常见的单词可以被指派IDF标记权重“5”。类似地，诸如“microsoft”和“apple”等相对罕见的术语可以分别被指派相对较高的IDF标记权重“9”和“8”。因此，在这个示例中，相似性得分可以被确定为(2+5)/(2+5+8)＝7/15。

在先前的示例中，使用标记权重的简单数学组合来确定相似性得分，然而，在至少一些实现中，ML模型可以使用更复杂的数学公式(诸如余弦公式)来组合标记权重。更具体地，在至少一些实现中，可以利用其相关联的上下文(例如，在网页、***等上围绕它的文本)来获得每个单词或术语，并且使用向量化算法，可以将其转换为双值向量。所得到的向量的一个特性是，类似的单词在它们之间可以具有相对较高的余弦相似性。此外，在至少一些示例中，可以对短语中的所有单词的向量求和以获得可以对短语执行的全局上下文，并且可以在它们之间进行比较以评估短语之间的相似性。

应当理解，ML模型可以在确定相似性得分时使用附加信息。例如，在至少一些实现中，***可以将关于网站的信息存储在数据库(或“追溯索引(retroindex)”)中，数据库存储诸如标题、关键字、内容或与网站相关联的其他合适信息等信息。因此，在从网站获得图像的源页面时，ML模型可以使用追溯索引中的信息，并且可以利用来自与网站相关联的追溯索引的信息来丰富图像实体响应。在至少一些实现中，ML模型可以使用被包含在追溯索引中的信息来提供改进的相似性得分(例如，用于商业实体)。

在至少一些备选实现中，数据库可以包括一个或多个先前用户在他们点击网页之前已经键入的查询列表(例如，使用搜索引擎或其他合适的工具创建的)。在这样的实现中，ML模型可以使用来自数据库中的一个或多个公共查询的信息来丰富图像响应(例如，用于与商业实体相匹配)。

在至少一些另外的实现中，可以使用ML训练来进一步改进ML模型。例如，在至少一些实现中，ML模型可以基于一个或多个训练集来学习要指派给单词或短语特征的代表性的或适当的标记权重。基于用于训练ML模型的一个或多个训练集，可以确定相对改进的或最优的数学公式以提供适当地标识匹配并且区分在一个或多个训练集中提供的配对(例如，通过试验和错误、人为干预等)的相似性得分。

应当理解，与传统技术相比，使用机器学习模型为搜索查询提供图像的技术和方法可以提供实质性的操作改进。例如，与传统技术相比，根据本公开的使用ML模型的技术和方法可以提供针对各种不同语言的改进的鲁棒性。另外，具有可以用于多个市场的标准ML模型可以有利地使得改进迭代更快并且部署和维护工作得到简化。如果特定语言需要特殊处理，则在至少一些实现中，可以经由可以以应用于ML模型的静态规则的形式实现的语言特定的规范化定义来处理这种语言。以这种方式，与传统技术相比，本文中公开的用于使用机器学习模型来为搜索查询提供图像的技术和方法可以有利地需要更少的计算资源、更少的功率和资源消耗，并且可以提供改进的操作效率。

本文中公开的用于为搜索查询提供图像的技术和方法可以在计算机代码或机器可用指令的一般上下文中被描述，包括计算机或其他设备执行的计算机可执行指令，诸如程序模块。通常，包括例程、程序、对象、组件、数据结构等的程序模块指代执行特定任务或实现特定抽象数据类型的代码。本发明的各种实施例可以在各种***配置中被实践，各种***配置包括手持设备、消费电子产品、通用计算机、更专业的计算设备等。此外，本发明的各种实施例也可以在其中任务由通过通信网络链接的远程处理设备执行的分布式计算环境(例如，基于云的计算***)中被实践。

此外，本文中公开的用于为搜索查询提供图像的技术和方法可以在各种设备和平台上被实现。例如，图8示出了可用以于为搜索查询提供图像的计算机***800的实施例。如图8所示，示例计算机***环境800包括一个或多个处理器(或处理单元)802、专用电路882、存储器804、以及将各种***组件(包括存储器804)可操作地耦合到一个或多个处理器802和专用电路882(例如，专用集成电路(ASIC)、现场可编程门阵列(FPGA)等)的总线806。

总线806可以表示若干类型的总线结构中的任何一种或多种，包括存储器总线或存储器控制器、***总线、加速图形端口、以及使用各种总线架构中的任何一种的处理器或本地总线。在至少一些实现中，存储器804包括只读存储器(ROM)808和随机存取存储器(RAM)810。基本输入/输出***(BIOS)812(包含有助于诸如在启动期间在***800内的元件之间传输信息的基本例程)被存储在ROM 808中。

示例***环境800还包括用于从硬盘(未示出)读取和向硬盘写入的硬盘驱动器814，并且硬盘驱动器814经由硬盘驱动器接口816(例如，SCSI、ATA或其他类型的接口)连接到总线806。用于从可移动磁盘820读取和向可移动磁盘820写入的磁盘驱动器818经由磁盘驱动器接口822连接到***总线806。类似地，用于从可移动光盘826(诸如CD ROM、DVD或其他光学介质)读取或向可移动光盘826写入的光盘驱动器824经由光学驱动器接口828连接到总线806。驱动器及其相关联的计算机可读介质可以提供计算机可读指令、数据结构、程序模块和***环境800其他数据的非易失性存储装置。尽管本文中描述的***环境800采用硬盘、可移动磁盘820和可移动光盘826，但是本领域技术人员应当理解，也可以使用可以存储由计算机可访问的数据的其他类型的计算机可读介质，诸如磁带盒、闪存卡、数字视频盘、随机存取存储器(RAM)、只读存储器(ROM)等。

被包括在***存储器800中的计算机可读介质可以是任何可用或合适的介质，包括易失性和非易失性介质、以及可移动和不可移动介质，并且可以以适合于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术来实现。更具体地，合适的计算机可读介质可以包括随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程ROM(EEPROM)、闪存或其他存储器技术、光盘ROM(CD-ROM)、数字通用磁盘(DVD)或其他光盘存储器、磁带盒、磁带、磁盘存储器或其他磁存储设备、或任何其他介质，包括纸张、穿孔卡等，它们可以用于存储所需信息。如本文中使用的，术语“计算机可读介质”不旨在包括暂态信号。

如图8中进一步所示，多个程序模块可以被存储在存储器804(例如，ROM 808或RAM810)上，包括操作***830、一个或多个应用程序832、其他程序模块834和程序数据836(例如，数据存储库820、图像数据、音频数据、三维对象模型等)。备选地，这些程序模块可以被存储在其他计算机可读介质上，包括硬盘、磁盘820或光盘826。出于说明的目的，诸如操作***830等程序和其他可执行程序组件在图8中示出为离散块，但是应当认识到，这样的程序和组件在不同时间驻留在***环境800的不同存储组件中，并且可以由***环境800的一个或多个处理器802或专用电路882执行。

用户可以通过诸如键盘838和指示设备840等输入设备向***环境800中输入命令和信息。其他输入设备(未示出)可以包括麦克风、操纵杆、游戏手柄、卫星天线、扫描仪等。诸如自然用户界面(NUI)设备869或用户界面825等其他输入设备包括或涉及使得用户能够以“自然”方式与***环境800进行交互而没有由诸如鼠标、键盘、遥控器等传统输入设备施加的人为约束的自然用户界面(NUI)的一个或多个方面。例如，在至少一些实施例中，NUI设备869可以依赖于语音识别、触摸和手写笔识别、一个或多个生物识别输入、屏幕上和屏幕附近的姿态识别、空中姿态、头部和眼睛(或注视)跟踪、声音和语音、视觉、触摸、悬停、姿态、机器智能、以及使用电场感应电极(EEG和相关方法)接收输入来感测大脑活动的技术。另外，在至少一些实施例中，NUI可以涉及或并入触敏显示器、声音和语音识别、意图和目标理解、使用深度相机的运动姿态检测(诸如立体或飞行时间相机***、红外相机***、RGB相机***及其组合)、使用加速度计/陀螺仪的运动姿态检测、面部识别、3D显示、头部、眼睛和注视跟踪、沉浸式增强现实和虚拟现实***的一个或多个方面，所有这些都提供更自然的界面。

这些和其他输入设备通过耦合到***总线806的接口842或通信接口846(例如，视频适配器)连接到处理单元802和专用电路882。用户界面825(例如，显示器、监视器或任何其他用户界面设备)可以经由诸如视频适配器846等接口连接到总线806。此外，***环境800还可以包括其他***输出设备(未示出)，诸如扬声器和打印机。

***环境800可以使用到一个或多个远程计算机(或服务器)858的逻辑连接在网络化环境中操作。这样的远程计算机(或服务器)858可以是个人计算机、服务器、路由器、网络PC、对等设备或其他常见网络节点。图8中描绘的逻辑连接包括局域网(LAN)848和广域网(WAN)850中的一个或多个。这种网络环境在办公室、企业范围的计算机网络、内联网和因特网中是常见的。在这个实施例中，***环境800还包括一个或多个广播调谐器856。广播调谐器856可以直接(例如，直接馈送到调谐器856中的模拟或数字有线传输)或经由接收设备(例如，经由天线857、卫星天线等)接收广播信号。

当在LAN网络环境中使用时，***环境800可以通过网络接口(或适配器)852连接到局域网848。当在WAN网络环境中使用时，***环境800通常包括调制解调器854或用于通过诸如因特网等广域网850建立通信的其他装置(例如，路由器)。可以是内部或外部的调制解调器854可以经由串行端口接口842连接到总线806。类似地，***环境800可以使用耦合到无线通信器857(例如，天线、卫星天线、发送器、接收器、收发器、感光器、光电二极管、发射器、接受器等)的无线接口855与一个或多个远程设备交换(发送或接收)无线信号853。

在网络化环境中，相对于***环境800描述的程序模块或其部分可以被存储在存储器804中，或者被存储在远程存储器存储设备中。更具体地，如图8中进一步所示，专用组件880可以被存储在***环境800的存储器804中。可以使用软件、硬件、固件或其任何合适的组合来实现专用组件880。与***环境800的其他组件(诸如处理单元802或专用电路882)合作，专用组件880可以可操作以执行如上所述的用于为搜索查询提供图像的技术的一个或多个实现(例如，图3的示例过程300等)。

通常，在***环境800上执行的应用程序和程序模块可以包括用于执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等。这些程序模块等可以作为本机代码来执行，或者可以被下载和被执行，诸如在虚拟机或其他即时编译执行环境中。通常，程序模块的功能可以在各种实现中根据需要进行组合或分布。

应当理解，本文中公开的用于为搜索查询提供图像的技术和方法不限于上述特定实施例，并且可以根据本公开来构思另外的实现。例如，图9示出了用于为搜索查询提供图像的环境900的另一实施例。在这个实施例中，环境900包括与客户端部分910交互的用户，客户端部分910又与服务器部分920交互。

更具体地，在所描绘的实施例中，客户端部分910包括具有显示器916的客户端机器912。客户端机器912从用户接收查询914并且将查询914提供给设置在服务器部分920上的查询处理组件922。查询处理组件922处理来自客户端部分910的查询914，并且将所得到的已处理的查询提供给结果检索组件924。结果检索组件924可以取决于查询914从环境900的服务器部分920的一个或多个其他各种组件中提取一个或多个结果。在至少一些实现中，查询处理组件922具有确定原始用户查询914的意图的任务。取决于所得到的意图，一个或多个检索组件被调用。例如，查询“images of cats”可以仅触发图像检索组件930，或者查询“michael jordan”可以触发网页检索组件926和人员检索组件940，或者查询“restaurant”可以触发网页检索组件926和本地业务检索组件933。或者，查询可以包含请求类型，使得以“bing.com/images”写入的查询可以仅触发图像检索组件930。

例如，如果查询914包括网页，则结果检索组件924可以从网页检索组件926接收一个或多个结果。类似地，如果查询914包括图像请求，则结果检索组件924可以从图像检索组件930接收一个或多个结果。如果查询914包括本地业务请求，则结果检索组件924可以从本地业务检索组件933接收一个或多个结果。此外，如果查询914包括位置请求，然后结果检索组件924可以从位置检索组件936接收一个或多个结果。类似地，如果查询914包括人员请求，则结果检索组件924可以从人员检索组件940接收一个或多个结果。此外，如果查询914包括新闻请求，则结果检索组件924可以从新闻检索组件944接收一个或多个结果。另外，如果查询914包括对其他信息的请求，则结果检索组件924可以从“其他”检索组件948接收一个或多个结果。

如图9中进一步所示，服务器部分920可以包括各种信息存储库，各种检索组件可以从各种信息存储库中获得信息以响应于查询914而提供给结果检索组件924。例如，在图9所示的实施例中，网页检索组件926可以从网页存储库928获得一个或多个结果，图像检索组件930可以从图像储存库932获得一个或多个结果，本地业务检索组件933可以从本地业务储存库934获得一个或多个结果，位置检索组件936可以从位置储存库938获得一个或多个结果，人员检索组件940可以从人员储存库942获得一个或多个结果，并且新闻检索组件944可以从新闻储存库946获得一个或多个结果。

如图9中进一步所示，服务器部分920还包括后端部分950，后端部分950可以使用上述(例如，关于图1-8)的一种或多种技术和方法来向本地业务储存库934提供图像(其中图像的来源可以是图像检索组件930或外部图像检索组件954(或两者))，以响应于查询914而被返回以在客户端机器912的显示器916上显示给用户。更具体地，后端部分950包括刮取组件952、外部图像检索组件954、图像高速缓存956和实体到图像匹配组件958。在至少一些实现中，图像检索组件930可以向图像刮取组件952提供查询914(或查询914的已处理版本)。图像刮取组件952可以从外部图像检索组件954(例如，等)接收一个或多个图像，或者可以访问先前存储在图像高速缓存956中的一个或多个图像。在至少一些实现中，实体到图像组件958可以执行上面关于分析搜索结果而描述的一个或多个操作，包括使用机器学习(ML)方法评估搜索结果与来自搜索查询的感兴趣实体之间的内容相似性以便适当地选择一个或多个图像，如上面更全面地描述的。因此，实体到图像组件958确定要返回到本地业务储存库934的一个或多个图像，本地业务储存库934又响应于查询914而将一个或多个图像提供给结果检索组件924。在另外的实现中，后端部分950的实体到图像组件958可以将一个或多个图像提供给服务器部分930的任何其他组件(例如，图像储存库932、本地业务储存库934、位置储存库938、人员储存库942、新闻储存库946等)。最后，如图9所示，结果检索组件924将包括由图像检索组件930提供的一个或多个图像的一个或多个结果返回到客户端机器912的显示器916。

鉴于如本文中公开的用于为搜索查询提供图像的技术和方法的公开内容，下面概述一些代表性实施例。应当理解，代表性实施例的以下概述并非旨在穷举所有可能的实施例，并且可以从用于在本文中提供的不同设备生态***之间映射用户标识符的技术和方法的公开中容易地想到另外的实施例。

例如，在至少一些实施例中，一种用于为搜索查询提供图像的***可以包括：刮取查询组件，被配置为基于与感兴趣实体相关联的文本信息来提供刮取查询；搜索组件，被配置为经由一个或多个网络进行电子搜索以至少部分地基于刮取查询来获得搜索结果，搜索结果至少包括搜索结果图像和与搜索结果图像相关联的图像元数据；以及搜索结果分析组件，被配置为：确定所述图像元数据中与所述搜索结果图像相关联的至少一部分与文本信息中与所述感兴趣实体相关联的至少一部分之间的相似性；以及至少部分地基于所确定的相似性来确定是否要进行以下中的至少一项：存储、提供或丢弃搜索结果图像。

在至少一些实现中，被配置为基于与感兴趣实体相关联的文本信息来提供刮取查询的刮取查询组件可以包括被配置为进行以下操作的刮取查询组件：从实体索引获得与感兴趣实体相关联的文本信息，以及使用一个或多个刮取查询模板和与所述感兴趣实体相关联的文本信息生成一个或多个刮取查询。

在另外的实现中，被配置为确定图像元数据中与搜索结果图像相关联的至少一部分与文本信息中与所述感兴趣实体相关联的至少一部分之间的相似性的搜索结果分析组件可以包括：被配置为应用机器学习模型以基于图像元数据中与搜索结果图像相关联的至少一部分与文本信息中与感兴趣实体相关联的至少一部分之间的相似性来确定相似性的搜索结果分析组件。

在另外的实现中，机器学习模型可以被配置为通过应用模糊字符串距离函数、余弦字符串距离函数、Levenshtein字符串距离函数或包含二进制特征距离函数中的至少一项来确定相似性。

在另外的实现中，机器学习模型可以被配置为通过在比较图像元数据中与搜索结果图像相关联的至少一部分的第一属性与文本信息中与感兴趣实体相关联的至少一部分时应用第一字符串距离函数并且在比较图像元数据中与搜索结果图像相关联的至少一部分的第二属性与文本信息中与感兴趣实体相关联的至少一部分时应用第二字符串距离函数来确定相似性。

在其他实现中，被配置为确定图像元数据中与搜索结果图像相关联的至少一部分与文本信息中与感兴趣实体相关联的至少一部分之间的相似性的搜索结果分析组件可以包括：被配置为基于图像元数据中与搜索结果图像相关联的至少一部分与文本信息中与感兴趣实体相关联的至少一部分之间的相似性来确定相似性得分的搜索结果分析组件。

在其他实现中，被配置为确定图像元数据中与搜索结果图像相关联的至少一部分与所述文本信息中与感兴趣实体相关联的至少一部分之间的相似性的搜索结果分析组件包括被配置为进行以下操作的搜索结果分析组件：将图像元数据中与搜索结果图像相关联的至少一部分标记化为一个或多个第一标记；将文本信息中与感兴趣实体相关联的至少一部分标记化为一个或多个第二标记；将所述一个或多个第一标记中的至少一些第一标记与所述一个或多个第二标记中的至少一些第二标记相比较；确定与一个或多个第一标记与一个或多个第二标记的每次比较相关联的连接相似性得分；以及至少部分地基于一个或多个连接相似性得分来确定总体相似性得分。

在至少一些实现中，被配置为将一个或多个第一标记中的至少一些第一标记与一个或多个第二标记中的至少一些第二标记相比较的搜索结果分析组件可以包括：被配置为基于一个或多个第一标记中的至少一些第一标记与一个或多个第二标记中的至少一些第二标记之间的指定的编辑距离函数关系来将一个或多个第一标记中的至少一些第一标记与一个或多个第二标记中的至少一些第二标记相比较的搜索结果分析组件。

在另外的实现中，被配置为至少部分地基于一个或多个连接相似性得分来确定总体相似性得分的搜索结果分析组件包括：被配置为通过向一个或多个连接相似性得分应用标记加权的余弦相似性函数来确定总体相似性得分的搜索结果分析组件。

在至少一些实现中，搜索结果分析组件还被配置为忽略未满足或超过指定阈值的一个或多个连接相似性得分。并且在其他实现中，搜索结果分析组件还被配置为：向一个或多个第一标记指派第一标记权重，并且向一个或多个第二标记指派第二标记权重；以及其中总体相似性得分至少部分地基于一个或多个连接相似性得分并且至少部分地基于一个或多个第一标记权重和一个或多个第二标记权重而被确定。

在另外的实现中，被配置为至少部分地基于一个或多个连接相似性得分并且至少部分地基于标记权重来确定总体相似性得分的搜索结果分析组件包括：被配置为通过向一个或多个连接相似性得分以及一个或多个第一标记权重和一个或多个第二标记权重应用标记加权的余弦相似性函数来确定总体相似性得分的搜索结果分析组件。

类似地，在至少一些实现中，一种用于为搜索查询提供图像的方法，包括：经由一个或多个网络进行图像搜索以获得图像搜索结果，图像搜索结果至少包括搜索结果图像以及与搜索结果图像相关联的图像元数据；确定搜索结果图像与感兴趣实体之间的相似性，至少包括使用字符串距离函数将图像元数据的至少一部分的一个或多个属性与关联于感兴趣实体相关联的文本信息相比较以确定总体相似性得分；以及至少部分地基于所述总体相似性得分来确定是否要进行以下中的至少一项：存储、提供或丢搜索结果图像。

在至少一些实现中，使用字符串距离函数将所述图像元数据的至少一部分的一个或多个属性与关联于感兴趣实体的文本信息相比较以确定总体相似性得分包括：应用第一字符串距离函数以将图像元数据的至少一部分的第一属性与关联于感兴趣实体的文本信息相比较；以及应用第二字符串距离函数以将图像元数据的至少一部分的第二属性与关联于感兴趣实体的文本信息相比较。

在其他实现中，使用字符串距离函数将所述图像元数据的至少一部分的一个或多个属性与关联于感兴趣实体的文本信息相比较以确定总体相似性得分包括：将图像元数据中与搜索结果图像相关联的至少一部分标记化为一个或多个第一标记；将文本信息中与感兴趣实体相关联的至少一部分标记化为一个或多个第二标记；向所述一个或多个第一标记指派一个或多个第一标记权重；向所述一个或多个第二标记指派一个或多个第二标记权重；将一个或多个第一标记中的至少一些第一标记与一个或多个第二标记中的至少一些第二标记相比较；确定与一个或多个第一标记与一个或多个第二标记的每次比较相关联的连接相似性得分；以及至少部分地基于所述一个或多个连接相似性得分、一个或多个第一标记权重和一个或多个第二标记权重来确定总体相似性得分。

在其他实现中，使用字符串距离函数将所述图像元数据的至少一部分的一个或多个属性与关联于所述感兴趣实体的文本信息相比较以确定总体相似性得分还包括：忽略未满足或超过指定阈值的一个或多个连接相似性得分。

并且，在另外的实现中，将一个或多个第一标记中的至少一些第一标记与一个或多个第二标记中的至少一些第二标记相比较包括：基于指定的编辑距离函数来确定是否要将一个或多个第一标记中的至少一些第一标记与一个或多个第二标记中的至少一些第二标记相比较。

此外，在至少一些实现中，一种用于为搜索查询提供图像的***包括：查询组件，被配置为接收搜索查询，搜索查询包括与感兴趣实体相关联的文本信息；外部图像检索组件，被配置为经由一个或多个网络进行针对与搜索查询相关联的一个或多个图像的搜索；接收组件，被配置为从外部图像检索组件接收搜索结果，搜索结果至少包括搜索结果图像以及与搜索结果图像相关联的图像元数据；以及搜索结果分析组件。在至少一些实现中，所述搜索结果分析组件被配置为：确定图像元数据中与搜索结果图像相关联的至少一部分与文本信息中与所述感兴趣实体相关联的至少一部分之间的相似性；以及至少部分地基于所确定的相似性来确定是否要进行以下中的至少一项：存储、提供或丢弃搜索结果图像。

在另外的实现中，被配置为确定图像元数据中与所述搜索结果图像相关联的至少一部分与所述文本信息中与感兴趣实体相关联的至少一部分之间的相似性的搜索结果分析组件可以包括：被配置为使用字符串距离函数将图像元数据的至少一部分的一个或多个属性与文本信息中与感兴趣实体相关联的至少一部分的一个或多个属性相比较以确定总体相似性得分的搜索结果分析组件。

在其他实现中，被配置为使用字符串距离函数将图像元数据的至少一部分的一个或多个属性与文本信息中与所述感兴趣实体相关联的至少一部分的一个或多个属性相比较以确定总体相似性得分的搜索结果分析组件包括：被配置为进行以下操作的搜索结果分析组件：将图像元数据中与搜索结果图像相关联的至少一部分分离成一个或多个第一标记；将文本信息中与感兴趣实体相关联的至少一部分分离成一个或多个第二标记；向一个或多个第一标记应用一个或多个第一标记权重；向一个或多个第二标记应用一个或多个第二标记权重；将一个或多个第一标记中的至少一些第一标记与一个或多个第二标记中的至少一些第二标记相比较；计算与一个或多个第一标记与一个或多个第二标记的每次比较相关联的连接相似性得分；以及至少部分地基于一个或多个连接相似性得分、一个或多个第一标记权重和一个或多个第二标记权重来计算总体相似性得分。

类似地，在至少一些实现中，承载一个或多个指令的一个或多个计算机可读介质在由一个或多个处理组件执行时执行用于为搜索查询提供图像的操作，操作包括：获得一个或多个搜索结果，搜索结果至少包括搜索结果图像以及与搜索结果图像相关联的图像元数据；确定图像元数据中与搜索结果图像相关联的至少一部分与文本信息中与感兴趣实体相关联的至少一部分之间的相似性，至少包括：使用字符串距离函数将所述图像元数据的至少一部分的一个或多个属性与文本信息中与所述感兴趣实体相关联的至少一部分的一个或多个属性相比较以确定总体相似性得分；以及至少部分地基于总体相似性得分来确定是否要进行以下中的至少一项：存储、提供或丢弃搜索结果图像。

在至少一些实现中，使用字符串距离函数将图像元数据的至少一部分的一个或多个属性与文本信息中与所述感兴趣实体相关联的至少一部分的一个或多个属性相比较以确定总体相似性得分包括：将图像元数据中与搜索结果图像相关联的至少一部分分离成一个或多个第一标记；将文本信息中与感兴趣实体相关联的至少一部分分离成一个或多个第二标记；向一个或多个第一标记应用一个或多个第一标记权重；向一个或多个第二标记应用一个或多个第二标记权重；将一个或多个第一标记中的至少一些第一标记与一个或多个第二标记中的至少一些第二标记相比较；计算与一个或多个第一标记与一个或多个第二标记的每次比较相关联的连接相似性得分；以及至少部分地基于一个或多个连接相似性得分、一个或多个第一标记权重和一个或多个第二标记权重来计算总体相似性得分。

此外，在其他实现中，操作可以进一步包括基于指定的编辑距离函数来确定是否要将一个或多个第一标记中的至少一些第一标记与一个或多个第二标记中的至少一些第二标记相比较。

结论

本领域技术人员将认识到，本文中公开的实施例的一些方面可以在标准集成电路中被实现，并且也可以被实现为在一个或多个计算机上运行的一个或多个计算机程序，并且也可以被实现为在一个或多个处理器上运行的一个或多个软件程序，并且也可以被实现为固件、以及其几乎任何组合。将进一步理解，本领域技术人员可以根据本公开的教导和解释来设计电路和/或编写软件和/或固件的代码。

前面的详细描述通过使用框图、流程图和/或示例阐述了设备和/或过程的各种实施例。在这样的框图、流程图和/或示例包含一个或多个功能和/或操作的情况下，本领域技术人员将理解，这样的框图、流程图或示例内的每个功能和/或操作可以单独地和/或共同地通过各种硬件、软件、固件或其几乎任何组合来实现。应当理解，上述技术和方法的实施例并非穷举被认为在本公开的范围内的所有可能实施例，并且可以基于本文中公开的主题构思另外的实施例。例如，在备选实施例中，可以重新布置、重新排序、修改或甚至省略上述技术和方法的一个或多个元件或组件，以提供仍然被认为在本公开的范围内的另外的实施例。

备选地或另外地，本文中描述的技术和方法可以至少部分由一个或多个硬件逻辑组件来执行。例如但是非限制，可以使用的说明性类型的硬件逻辑组件包括现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、***级芯片***(SOC)、复杂可编程逻辑器件(CPLD)等。然而，本领域技术人员将认识到，本文中公开的实施例的一些方面全部或部分可以在标准集成电路中等效地实现，实现为在一个或多个计算机上运行的一个或多个计算机程序(例如，实现为在一个或多个计算机***上运行的一个或多个程序)，实现为在一个或多个处理器上运行的一个或多个程序(例如，实现为在一个或多个微处理器上运行的一个或多个程序)，实现为固件、或其几乎任何组合，并且设计电路和/或编写软件和/或固件的代码将在本领域技术人员鉴于本公开内容的技术范围内。

虽然用对结构特征和/或动作特定的语言描述了本主题，但是应当理解，所附权利要求书中定义的主题不必限于所描述的具体特征或动作。相反，上面描述的具体特征和动作被公开作为实现权利要求的示例，并且其他等同特征和动作旨在落入权利要求的范围内。上面描述的各种实施例和实现被提供仅作为说明，并且在不脱离本公开的精神和范围的情况下不应当被解释为限制可以对上述实施例和实现进行的各种修改和改变。

Claims

1.一种用于为搜索查询提供图像的***，包括：

刮取查询组件，其被配置为基于与感兴趣实体相关联的文本信息来提供刮取查询；

搜索组件，其被配置为经由一个或多个网络进行电子搜索以至少部分地基于所述刮取查询来获得搜索结果，所述搜索结果至少包括搜索结果图像以及与所述搜索结果图像相关联的图像元数据；以及

搜索结果分析组件，其被配置为：

确定所述图像元数据的、与所述搜索结果图像相关联的至少一部分与所述文本信息的、与所述感兴趣实体相关联的至少一部分之间的相似性；以及

至少部分地基于所确定的所述相似性来确定是否要进行以下各项中的至少一项：存储所述搜索结果图像、提供所述搜索结果图像或者丢弃所述搜索结果图像。

2.根据权利要求1所述的***，其中被配置为基于与感兴趣实体相关联的文本信息来提供刮取查询的所述刮取查询组件包括：

被配置为进行以下各项的刮取查询组件：

从实体索引获得与感兴趣实体相关联的文本信息，以及

使用一个或多个刮取查询模板以及与所述感兴趣实体相关联的所述文本信息生成一个或多个刮取查询。

3.根据权利要求1至2所述的***，其中被配置为确定所述图像元数据的、与所述搜索结果图像相关联的至少一部分与所述文本信息的、与所述感兴趣实体相关联的至少一部分之间的相似性的所述搜索结果分析组件包括：

被配置为应用机器学习模型以基于所述图像元数据的、与所述搜索结果图像相关联的至少一部分与所述文本信息的、与所述感兴趣实体相关联的至少一部分之间的相似性来确定相似性的搜索结果分析组件。

4.根据权利要求3所述的***，其中所述机器学习模型被配置为通过应用模糊字符串距离函数、余弦字符串距离函数、Levenshtein字符串距离函数或包含二进制特征距离函数中的至少一项来确定所述相似性。

5.根据权利要求3所述的***，其中所述机器学习模型被配置为通过以下各项来确定所述相似性：在比较所述图像元数据的、与所述搜索结果图像相关联的所述至少一部分的第一属性与所述文本信息的、与所述感兴趣实体相关联的至少一部分时应用第一字符串距离函数，以及在比较所述图像元数据的、与所述搜索结果图像相关联的所述至少一部分的第二属性与所述文本信息的、与所述感兴趣实体相关联的至少一部分时应用第二字符串距离函数。

6.根据权利要求1至5所述的***，其中被配置为确定所述图像元数据的、与所述搜索结果图像相关联的至少一部分与所述文本信息的、与所述感兴趣实体相关联的至少一部分之间的相似性的所述搜索结果分析组件包括：

被配置为基于所述图像元数据的、与所述搜索结果图像相关联的至少一部分与所述文本信息的、与所述感兴趣实体相关联的至少一部分之间的相似性来确定相似性得分的搜索结果分析组件。

7.根据权利要求1至6所述的***，其中被配置为确定所述图像元数据的、与所述搜索结果图像相关联的至少一部分与所述文本信息的、与所述感兴趣实体相关联的至少一部分之间的相似性的所述搜索结果分析组件包括：

被配置为进行以下各项的搜索结果分析组件：

将所述图像元数据的、与所述搜索结果图像相关联的所述至少一部分标记化成一个或多个第一标记；

将所述文本信息的、与所述感兴趣实体相关联的所述至少一部分标记化成一个或多个第二标记；

将所述一个或多个第一标记中的至少一些第一标记与所述一个或多个第二标记中的至少一些第二标记相比较；

确定与所述一个或多个第一标记与所述一个或多个第二标记的每次比较相关联的连接相似性得分；以及

至少部分地基于所述一个或多个连接相似性得分来确定总体相似性得分。

8.根据权利要求7所述的***，其中被配置为将所述一个或多个第一标记中的至少一些第一标记与所述一个或多个第二标记中的至少一些第二标记相比较的所述搜索结果分析组件包括：

被配置为基于所述一个或多个第一标记中的至少一些第一标记与所述一个或多个第二标记中的至少一些第二标记之间的指定编辑距离函数关系来将所述一个或多个第一标记中的所述至少一些第一标记与所述一个或多个第二标记中的所述至少一些第二标记相比较的搜索结果分析组件。

9.根据权利要求7所述的***，其中被配置为至少部分地基于所述一个或多个连接相似性得分来确定总体相似性得分的所述搜索结果分析组件包括：

被配置为通过向所述一个或多个连接相似性得分应用标记加权的余弦相似性函数来确定总体相似性得分的搜索结果分析组件。

10.根据权利要求7所述的***，其中所述搜索结果分析组件还被配置为：

忽略未满足或超过指定阈值的一个或多个连接相似性得分。

11.根据权利要求7所述的***，其中所述搜索结果分析组件还被配置为：

向所述一个或多个第一标记指派第一标记权重，以及向所述一个或多个第二标记指派第二标记权重；以及

其中所述总体相似性得分至少部分地基于所述一个或多个连接相似性得分以及至少部分地基于所述一个或多个第一标记权重和所述一个或多个第二标记权重而被确定。

12.根据权利要求7所述的***，其中被配置为至少部分地基于所述一个或多个连接相似性得分以及至少部分地基于所述标记权重来确定总体相似性得分的所述搜索结果分析组件包括：

被配置为通过向所述一个或多个连接相似性得分以及所述一个或多个第一标记权重和所述一个或多个第二标记权重应用标记加权的余弦相似性函数来确定总体相似性得分的搜索结果分析组件。

13.一种用于为搜索查询提供图像的***，包括：

查询组件，其被配置为接收搜索查询，所述搜索查询包括与感兴趣实体相关联的文本信息；

外部图像检索组件，其被配置为经由一个或多个网络进行针对与所述搜索查询相关联的一个或多个图像的搜索；

接收组件，其被配置为从所述外部图像检索组件接收搜索结果，所述搜索结果至少包括搜索结果图像以及与所述搜索结果图像相关联的图像元数据；以及

搜索结果分析组件，其被配置为：

14.根据权利要求13所述的***，其中被配置为确定所述图像元数据的、与所述搜索结果图像相关联的至少一部分与所述文本信息的、与所述感兴趣实体相关联的至少一部分之间的相似性的所述搜索结果分析组件包括：

被配置为使用字符串距离函数将所述图像元数据的至少一部分的一个或多个属性与所述文本信息的、与所述感兴趣实体相关联的至少一部分的一个或多个属性相比较以确定总体相似性得分的搜索结果分析组件。

15.根据权利要求14所述的***，其中被配置为使用字符串距离函数将所述图像元数据的至少一部分的一个或多个属性与所述文本信息的、与所述感兴趣实体相关联的至少一部分的一个或多个属性相比较以确定总体相似性得分的所述搜索结果分析组件包括：

被配置为进行以下各项的搜索结果分析组件：

将所述图像元数据的、与所述搜索结果图像相关联的至少一部分分离成一个或多个第一标记；

将所述文本信息的、与所述感兴趣实体相关联的至少一部分分离成一个或多个第二标记；

向所述一个或多个第一标记应用一个或多个第一标记权重；

向所述一个或多个第二标记应用一个或多个第二标记权重；

计算与所述一个或多个第一标记与所述一个或多个第二标记的每次比较相关联的连接相似性得分；以及

至少部分地基于所述一个或多个连接相似性得分、所述一个或多个第一标记权重以及所述一个或多个第二标记权重来计算所述总体相似性得分。