CN107784059A - 用于搜索和选择图像的方法和***以及机器可读媒体 - Google Patents

用于搜索和选择图像的方法和***以及机器可读媒体 Download PDF

Info

Publication number
CN107784059A
CN107784059A CN201710285686.7A CN201710285686A CN107784059A CN 107784059 A CN107784059 A CN 107784059A CN 201710285686 A CN201710285686 A CN 201710285686A CN 107784059 A CN107784059 A CN 107784059A
Authority
CN
China
Prior art keywords
image
user
context
keyword
terminal device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710285686.7A
Other languages
English (en)
Other versions
CN107784059B (zh
Inventor
蒋飞
蒋一飞
庄立
李栋
朱帆
孔旗
杨光
王京傲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu USA LLC
Original Assignee
Baidu USA LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu USA LLC filed Critical Baidu USA LLC
Publication of CN107784059A publication Critical patent/CN107784059A/zh
Application granted granted Critical
Publication of CN107784059B publication Critical patent/CN107784059B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/44Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • G06F16/434Query formulation using image data, e.g. images, photos, pictures taken by a user
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

根据一个实施方案,接收基于第一组关键字所搜索和识别的内容项目,所述第一组关键字包括一个或多个关键字,并基于通过网络从客户端装置接收到的搜索查询来确定。在图像存储器中执行搜索以基于第一组关键字和与内容项目相关联的、包括一个或多个关键字的第二组关键字来识别多个图像。基于在接收到搜索查询的时候所获得的用户上下文,对图像排序。通过将从已排序图像选择出的图像与内容项目合并来生成复合内容项目,其中所选图像的排序高于预定阈值。通过网络将复合内容项目传输到客户端装置。

Description

用于搜索和选择图像的方法和***以及机器可读媒体
技术领域
本发明的实施方案总体涉及搜索内容。更具体地,本发明的实施方案涉及响应于搜索查询基于用户上下文信息来排序和选择图像。
背景技术
大多数搜索引擎通常在客户端装置运行浏览器的操作期间执行搜索网页的操作。搜索引擎接收由用户输入的搜索词,并检索与所述搜索词相关联的网页搜索结果列表。搜索引擎基于某些标准将搜索结果显示为搜索列表的一系列子集。在搜索操作期间使用的一般标准是搜索词是完整地还是部分地出现在给定网页上、搜索字串出现在搜索结果中的次数、字母次序等。此外,用户可以通过点击鼠标按钮来决定打开链接以打开并浏览。可由搜索引擎监控和收集用户与搜索结果的一些互动和/或用户信息,以随后提供更好的搜索。
通常,响应于搜索查询,执行搜索以识别和检索内容项目列表。然后,将内容项目传回到搜索请求器。常规搜索引擎将照原样传回大多数内容项目而不作修改。搜索结果中的一些内容项目仅仅可能是无吸引力的或令人厌烦的纯文本或描述。有时候,如果内容项目准备有与所述内容项目有关的某些图像,那么搜索结果中的内容将更得体或更具吸引力。然而,使适当图像与内容项目匹配是相当有挑战性的。缺乏有效的方式来对用于匹配内容项目的图像排序。
发明内容
本申请的目的在于提供一种用于搜索和选择图像的计算机实施方法、非暂时性机器可读媒体和数据处理***。
根据本申请的一个方面,提供了一种用于搜索和选择图像的计算机实施方法,该方法可包括:接收基于第一组关键字所搜索和识别的内容项目,所述第一组关键字包括一个或多个关键字,并基于通过网络从客户端装置接收到的搜索查询来确定;在图像存储器中进行搜索以基于所述第一组关键字和与所述内容项目相关联的第二组关键字来识别多个图像,其中所述第二组关键字包括一个或多个关键字;基于在接收到所述搜索查询的时候所获得的用户上下文,对所述多个图像排序;将从经过排序的图像中选择出的图像与所述内容项目进行合并,以生成复合内容项目,其中所选图像的排序高于预定阈值;以及通过所述网络将所述复合内容项目传输到所述客户端装置。
根据本申请的另一个方面,提供了一种具有存储在其中的指令的非暂时性机器可读媒体,所述指令在由处理器执行时,致使所述处理器可执行搜索和选择图像的操作,所述操作包括:接收基于第一组关键字所搜索和识别的内容项目,所述第一组关键字包括一个或多个关键字,并基于通过网络从客户端装置接收到的搜索查询来确定;在图像存储器中进行搜索以基于所述第一组关键字和与所述内容项目相关联的第二组关键字来识别多个图像,其中所述第二组关键字包括一个或多个关键字;基于在接收到所述搜索查询的时候所获得的用户上下文,对所述多个图像排序;将从经过排序的图像中选择出的图像与所述内容项目进行合并,以生成复合内容项目,其中所选图像的排序高于预定阈值;以及通过所述网络将所述复合内容项目传输到所述客户端装置。
根据本申请的又一个方面,提供了一种数据处理***,其包括:处理器;以及存储器,所述存储器联接到所述处理器、用于存储指令,所述指令在由所述处理器执行时,致使所述处理器执行搜索和选择图像的操作,所述操作包括:接收基于第一组关键字所搜索和识别的内容项目,所述第一组关键字包括一个或多个关键字,并基于通过网络从客户端装置接收到的搜索查询来确定;在图像存储器中进行搜索以基于所述第一组关键字和与所述内容项目相关联的第二组关键字来识别多个图像,其中所述第二组关键字包括一个或多个关键字;基于在接收到所述搜索查询的时候所获得的用户上下文,对所述多个图像排序;将从经过排序的图像中选择出的图像与所述内容项目进行合并,以生成复合内容项目,其中所选图像的排序高于预定阈值;以及通过所述网络将所述复合内容项目传输到所述客户端装置。
附图说明
本发明的实施方案在附图中以举例而非限制的方式示出,附图中的相同附图标号指示类似元件。
图1A和图1B是示出根据本发明的一些实施方案的用于使图像与内容项目匹配的***配置的示例的框图。
图2是示出根据本发明的一个实施方案的图像选择***的示例的框图。
图3是根据本发明的一个实施方案的关键字-图像匹配表的示例。
图4是示出根据本发明的一个实施方案的图像映射***的框图。
图5是示出根据本发明的一个实施方案的图像匹配***的示例的框图。
图6是根据本发明的一个实施方案的选择图像的处理流程。
图7是示出根据本发明的一个实施方案的基于用户上下文信息来对图像排序的过程的流程图。
图8是示出根据本发明的一个实施方案的确定图像排序算法的过程的流程图。
图9是示出根据一个实施方案的数据处理***的框图。
具体实施方式
以下将参考所讨论的细节来描述本发明的各种实施方案和各个方面,附图将示出各种实施方案。以下描述和附图是对本发明的说明,而不应当解释为限制本发明。描述了许多特定细节以便提供对本发明的各种实施方案的全面理解。然而,在某些实例中,并未描述公知的或常规的细节,以使得对本发明实施方案的讨论简洁。
本说明书中对“一个实施方案”或“一实施方案”的提及意味着结合该实施方案所描述的特定特征、结构或特性可以包括在本发明的至少一个实施方案中。短语“在一个实施方案中”在本说明书中各个地方的出现不必全部是指同一实施方案。
根据一些实施方案,当排序和选择待与内容项目匹配的图像(例如,作为背景图像或补充图像)时,可利用发起原始搜索查询的用户的用户上下文信息来选择其中一个图像。用户上下文信息是在接收到搜索查询的时候被确定的或接收到的。用户上下文信息可包括用户的用户装置的地理位置、在某个时间点的用户活动和在发出搜索查询时的日期和时间。用户上下文可影响用户的偏好或图像对用户的吸引力。通过在选择图像时考虑用户上下文,图像以及匹配的内容项目对用户更具吸引力。
在一个实施方案中,响应于通过网络从用户的客户端装置接收到的搜索查询,基于与所述搜索查询相关联的、包括一个或多个关键字的第一组关键字在内容数据库中执行搜索。从内容数据库识别和检索内容项目。在图像存储器中执行搜索以基于第一组关键字和与内容项目相关联的第二组关键字将图像列表识别为候选图像。基于在接收到搜索查询的时候所获得的用户上下文,对图像分类和排序。可由客户端装置收集用户上下文,并从客户端装置连同搜索查询一起传输所述用户上下文。选择排序高于预定阈值的图像。通过将所选图像与内容项目合并来生成复合内容项目。然后,通过网络将复合内容项目传输到客户端装置以在其中呈现给用户。
图1A和图1B是示出根据本发明的一些实施方案的用于使图像与内容项目匹配的***配置的示例的框图。参考图1A,***100包括但不限于通过网络103通信地联接到服务器104的一个或多个客户端装置101-102。客户端装置101-102可以是任何类型的客户端装置,诸如,个人计算机(例如,台式计算机、膝上型计算机和平板计算机)、“薄”客户端、个人数字助理(PDA)、支持网络的器具、智能手表或移动电话(例如,智能手机)等。网络103可以是任何类型的网络,诸如有线或无线的局域网(LAN)、诸如互联网的广域网(WAN)或其组合。
服务器104可以是任何种类的服务器或服务器集群,诸如网络或云服务器、应用服务器、后端服务器或其组合。在一个实施方案中,服务器104包括但不限于搜索引擎120、图像选择模块110和关键字/图像匹配规则115。服务器104进一步包括允许客户端(诸如,客户端装置101-102)存取由服务器104提供的资源或服务的接口(未示出)。所述接口可包括网络接口、应用编程接口(API)和/或命令行接口(CLI)。
例如,客户端(在这个示例中为客户端装置101的客户端应用程序(例如,网络浏览器、移动应用程序))可向服务器104发送搜索查询,且由搜索引擎120通过网络103经由接口来接收所述搜索查询。可经由多种通信协议(诸如,传输控制协议和互联网协议(TCP/IP)协议)来接收所述搜索查询。响应于搜索查询,搜索引擎120从所述搜索查询提取一个或多个关键字(也称为搜索词)。搜索引擎120在内容数据库133中执行搜索以识别与关键字有关的内容项目列表,所述内容数据库可包括主要内容数据库130和/或辅助内容数据库131。
主要内容数据库130(也称为主内容数据库)可以是一般内容数据库,而辅助内容数据库131(也称为二级或附属内容数据库)可以是特殊或赞助内容数据库。搜索引擎120向客户端装置101传回具有列表中的至少一些内容项目的搜索结果页面,以在其中呈现。搜索引擎120可以是获自百度公司的搜索引擎,或可替代地,搜索引擎120可表示搜索引擎、Microsoft BingTM搜索引擎、搜索引擎或一些其他搜索引擎。
搜索引擎(诸如,网络搜索引擎)是被设计成在万维网上搜索信息的软件***。搜索结果通常被呈现在一系列结果(常称为搜索引擎结果页面)中。信息可以是网页、图像和其他类型的文件的混合。一些搜索引擎还挖掘数据库或开放式目录中可用的数据。不同于仅通过人工编辑器来维持的网络目录,搜索引擎还通过在网络爬虫上运行算法来维持实时信息。
网络搜索引擎通过存储关于许多网页的信息来运行,它们从页面的超文本标记语言(HTML)标记来检索所述网页。通过网络爬虫来检索这些页面,所述网络爬虫是遵循网站上的每个链接的自动化网络爬虫。然后,搜索引擎分析每个页面的内容以确定其应如何被索引(例如,可以从标题、页面内容、标头或称为元标签的特殊字段来提取字)。将关于网页的数据存储在索引数据库中,以供在稍后的查询中使用。索引帮助尽可能快地找到与查询有关的信息。
当用户将查询输入到搜索引擎中时(通常是通过使用关键字),引擎检查其索引并根据其标准提供最匹配网页的列表,通常具有包含文档标题及有时是部分文本的简短概述。索引是由与数据一起存储的信息及信息的索引方法构成。搜索引擎查找与输入时完全一致的字或短语。一些搜索引擎提供高级的(advanced)特征(称为接近搜索),其允许用户定义关键字之间的距离。还存在基于概念的搜索,其中所述研究涉及在包含你所搜索的字或短语的页面上使用统计分析。此外,自然语言查询允许用户以与将向人询问问题的形式相同的形式来键入问题。
搜索引擎的有用性取决于其所回馈的结果集的适切性。虽然包括特定字或短语的网页可能有数百万个,但一些页面可能比其他页面更贴切、更风行或更有权威。大多数搜索引擎采用多种方法来对结果排序以首先提供“最好”结果。搜索引擎如何决定哪些页面是最好匹配者以及应按什么次序来示出结果随引擎的不同而广泛变化。
返回参考图1A,根据一个实施方案,响应于在服务器104处从客户端装置(在这个示例中为客户端装置101)接收到的搜索查询,搜索引擎120在内容数据库133(诸如,主要内容数据库130和/或辅助内容数据库131)中执行搜索,以生成内容项目列表。可经由统一资源链接(URL)和/或统一资源标识符(URI)使每一个内容项目与特定内容提供者的特定网站的特定网页相关联。可替代地,一些内容项目可以是由作为赞助商的多种内容提供者提供和赞助的赞助内容项目。在一个实施方案中,主要内容数据库130存储已由网络爬虫收集的一般内容项目(例如,非赞助内容)。
辅助内容数据库131存储与特定、已知或预定的内容提供者(例如,广告商)相关联的特定、特殊或赞助内容项目(例如,广告或Ad)。在一个实施方案中,响应于搜索查询,基于所述搜索查询来确定关键字的第一集合,其中所述关键字包括搜索查询中所指定的搜索词和与所述搜索词语义上有关的关键字。然后,将关键字的第一集合与关键字(例如,投标字)的一个或多个另外的集合匹配,所述另外的集合与一个或多个内容提供者相关联。如果存在匹配,那么从辅助内容数据库131识别并检索一个或多个对应的内容项目。出于匹配的目的,可存在查询关键字-内容提供者关键字匹配数据结构或表(未示出)。
关键字/图像匹配规则/表115(也称为图像索引)包括许多映射条目,每个映射条目将一个或多个关键字映射到识别一个或多个图像的一个或多个图像ID。关键字/图像匹配规则/表115可以多种数据结构(诸如,表或数据库)来实施。基于图像ID,可以从存储在图像存储器125中的图像122来识别和检索候选图像列表,其中图像存储器125还可存储描述图像122的图像元数据(未示出)。在一个实施方案中,可通过一个或多个图像或网络爬虫来获得图像122及其各自的元数据,所述网络爬虫被设计成爬取网络以收集图像以及其周围的元数据。图像122可以是无特权的、无著作权保护的、适当许可的图像,或可以是任何其他授权的图像。
根据一个实施方案,可在先前于接收搜索查询之前(例如,离线)编译和生成关键字/图像映射规则115。一组关键字/图像匹配规则115被配置成将一个或多个关键字映射到识别一个或多个图像的一个或多个图像ID。关键字可被识别为在搜索查询中更有可能用到的关键字、与某些内容项目相关联的关键字和/或与某些内容提供者相关联的关键字。可基于对用户搜索活动或搜索历史的分析或跟踪来识别此类关键字,可在一段时间内对所述用户搜索活动或搜索历史进行编译并将其编译为用户简档135的一部分。
随后,当搜索引擎120从客户端装置在线接收到搜索内容的搜索查询时,在内容数据库133中执行搜索以检索内容项目列表。另外,对于至少一个内容项目来说,例如由图像选择模块110对搜索查询、所述内容项目和/或提供所述内容项目的内容提供者执行分析,以确定一组关键字。所述关键字可包括与搜索查询相关联的一个或多个关键字(例如,搜索词)、与内容项目相关联的一个或多个关键字(例如,获自标题和/或内容项目的描述)和/或与提供内容项目的内容提供者相关联的一个或多个关键字(例如,投标字)。所述关键字可进一步包括语义上类似或原始关键字具有相同含义的某些关键字(例如,同义字或短语)。基于关键字,使用一组关键字/图像匹配规则115从图像存储器125识别一个或多个图像的列表。
根据一个实施方案,图像选择模块110可使用多种排序算法或排序模型对已识别的图像排序,所述排序算法或排序模型已由图像映射***150生成和配置。针对在内容数据库133中找到的至少一个内容项目,从候选图像列表选择图像以与所述内容项目相关联。所选图像可与内容项目合并,以生成合并的或复合内容项目。例如,所选图像可充当内容项目的背景图像,或可替代地,所选图像可定位成补充内容项目或位于内容项目旁边。将经合并的内容项目和图像的列表作为部分搜索结果传回到客户端装置101。
根据一个实施方案,当排序和选择待与内容项目匹配的图像(例如,作为背景图像或补充图像)时,可利用发起原始搜索查询的用户的用户上下文信息138来选择其中一个图像。可在接收到搜索查询的时候(例如,在当前通信会话期间)确定或接收用户上下文信息138(简单地称为用户上下文)。例如,可由运行在客户端装置内的客户端应用程序(例如,移动装置的移动应用程序)来收集用户上下文138。也可基于用户的用户互动历史来确定用户上下文138,可由作为数据分析***的图像映射***/服务器将所述用户互动历史编译为用户简档135的一部分。可基于当前用户上下文138来更新用户的用户简档135。用户简档135包含与用户相关联的更稳定的性质(例如,用户的兴趣),而用户上下文138对用户来说是独立的和客观的信息,并且可不时地变化(例如,位置)。
在一个实施方案中,用户上下文138可包括用户的用户装置的地理位置、在某个时间点的用户活动和在发出搜索查询时的日期和时间。用户上下文138可影响用户的偏好或图像对用户的吸引力。例如,当用户待在家时,用户可发现宁静的图像比起其他杂乱的图像来更吸引人。当用户购物时,用户可对具有某些特征(诸如,特价销售或促销内容)的图像更敏感。在特定的日子(诸如,假期)期间,用户可偏好某些色彩(诸如,红色和白色等)。因此,通过在选择图像时考虑用户上下文,图像以及匹配的内容项目对用户更具吸引力或更吸引用户。
应注意,仅出于示出的目的描述了服务器104的配置。服务器104可以是向多种最终用户装置提供前端搜索服务的网络服务器。可替代地,服务器104可以是应用服务器或后端服务器,其向前端服务器(例如,网络服务器或一般内容服务器)提供特定或特殊的内容搜索服务以及使图像与内容数据库或服务器的内容项目匹配和/或整合。图像映射***150也可实施为单独的服务器,其负责基于内容数据库或服务器133的内容项目及其各自关联的关键字来创建关键字/图像映射规则或表115。
其它架构或配置也可能是可适用的。例如,如图1B中所示,内容数据库133可通过网络被维持和托管在作为内容服务器的单独的服务器中。类似地,图像存储器125可被维持和托管在作为其中具有图像搜索引擎的图像服务器的单独的服务器中。服务器133和125可以是网络服务器、应用服务器或后端服务器。可由与服务器104的实体或组织相同的实体或组织来组织和提供内容服务器133和/或图像服务器125。可替代地,可由单独的实体或组织(例如,第三方提供者)来维持或托管内容服务器133和/或图像服务器125,所述实体或组织负责收集内容数据库130-131中的内容和图像122及其元数据。
还应注意,内容数据库/服务器133可包括主要内容数据库130和辅助内容数据库131。主要内容数据库130也可实施或维持在单独的内容服务器(称为主要内容服务器)中。类似地,辅助内容数据库131可实施或维持在单独的内容服务器(称为辅助或附属内容服务器)中。可使用多种匹配公式(matching formulas)使获自两个内容数据库130-131的内容项目与获自图像存储器/服务器125的图像匹配。可替代地,将使仅获自主要内容数据库130和辅助内容数据库131中的一者的内容项目与获自图像存储器/服务器125的图像匹配。例如,可使获自辅助内容数据库131的内容项目(例如,赞助内容)与获自图像存储器/服务器125的图像匹配,而获自主要内容数据库130的内容项目(例如,一般内容)可作为部分搜索结果被传回到客户端装置而不作修改。
图2是示出根据本发明的一个实施方案的用于使图像与内容项目匹配的***的框图。***200可实施为图1A到图1B的***100的一部分。参考图2,当从客户端装置(例如,图1的客户端装置101)接收到搜索查询201时,搜索引擎120在内容数据库或内容服务器133中执行第一搜索,以基于与搜索查询201相关联的一个或多个关键字或搜索词来识别和检索内容项目的第一列表。另外,对于至少一个内容项目来说,搜索引擎120与图像选择模块110通信,以使用一组关键字/图像匹配规则115基于与搜索查询201和/或内容项目及其内容提供者相关联的关键字来识别来自于图像存储器或图像服务器125的图像列表。搜索引擎120和/或图像选择模块110可对搜索查询和内容项目/内容提供者执行分析,以导出关键字的列表。可对扩展关键字的列表执行在内容数据库/服务器133和/或图像存储器/服务器125中所执行的搜索,所述扩展关键字是基于分析(例如,潜在语义分析)从原始关键字扩展的。
在一个实施方案中,图像选择模块110和/或关键字/图像匹配规则115可与搜索引擎120整合。可在先前(例如)由作为数据分析***的图像映射***150来配置或编译关键字/图像匹配规则115。图像映射***150可被托管在经由API或通过网络通信地联接到***200的单独的***或服务器中。图像映射***200可包括允许用户或管理员配置一组关键字/图像匹配规则的用户接口,然后可由处理逻辑使用预定算法来扩展和排序该组图像匹配规则。
类似地,可由图像收集***230来收集存储在图像存储器/服务器125中的图像,所述图像收集***可以是通过网络通信地联接到***200的单独的***或服务器。可由与***200的实体或组织相同或不同的实体或组织来操作图像映射***150和/或图像收集***230。在这个示例中,可将图像缓存和存储在相对于***200而言为本地(例如,针对服务器104而言为本地)的图像存储器中。可替代地,可由与图像收集***230相关联的指定服务器来维持图像,图像选择模块110经由API与所述服务器通信以识别和检索图像列表。
基于从图像存储器/服务器125检索的图像列表,图像选择模块110根据排序算法对图像排序。然后,使一些图像与从内容数据库/服务器133识别和检索的一些内容项目匹配。然后,将匹配的内容项目与图像整合到已整合的内容项目中。在一个实施方案中,可将图像选择为内容项目的背景图像或补充图像。例如,内容项目211可以是描述或文本,且图像212可被选择为内容项目211的背景图像。以适当的方式,基于贯穿本说明书描述的匹配技术来选择图像212以补充或描述内容项目211,或反之亦然。例如,内容项目211的内容与如图像212中所示的内容有关,或反之亦然。可将已整合的图像212与内容项目211作为部分搜索结果215传回到客户端装置。应注意,如图2中所示的部件或模块中的一些或全部可以软件、硬件或其组合来实施。
根据一个实施方案,当选择图像以与内容项目相关联时,图像选择模块110考虑用户上下文信息(在这个示例中,用户的用户简档135)。响应于通过网络从用户的客户端装置接收到的搜索查询201,由搜索引擎120基于与搜索查询201相关联的第一组关键字(包括一个或多个关键字)在内容数据库133中执行搜索。从内容数据库识别和检索内容项目。由图像选择模块110在图像存储器125中执行搜索以基于与搜索查询201相关联的第一组关键字和与内容项目相关联的第二组关键字将图像列表识别为候选图像。基于在接收到搜索查询的时候所获得的用户上下文138和/或用户简档135以及先前用户互动,对图像分类和排序。可由客户端装置收集用户上下文138,并从客户端装置传输所述用户上下文连同搜索查询。选择排序高于预定阈值的图像。通过将所选图像与内容项目合并来生成复合内容项目。然后,通过网络将复合内容项目传输到客户端装置以在其中呈现给用户。
图3是根据本发明的一个实施方案的关键字-图像匹配表的示例。参考图3,关键字/图像匹配表300可表示如上文所描述的图1A到图1B和图2的关键字/图像匹配规则115。在一个实施方案中,关键字/图像匹配表300包括多个匹配条目。每个匹配条目将一个或多个关键字301映射到一个或多个图像ID 302,其中图像ID 302识别图像存储器或图像服务器(诸如,图像存储器/服务器125)中的对应图像。基于关键字对匹配表300进行索引。在这个示例中,第一条目将词“鲜花”映射到图像1-5。第二条目将词“北京鲜花”仅映射到图像1。第三条目将词“上海鲜花”映射到图像2。第四条目将词“鲜花递送”映射到图像1-2和4。因此,如果搜索查询包含“北京鲜花”,那么可识别图像1-5。然而,图像1可具有更高排序。
图4是示出根据本发明的一个实施方案的图像映射***的框图。***400可实施为图1A到图1B的***或服务器150的一部分。参考图4,***400包括但不限于关键字/图像映射***150、图像存储器125和关键字/图像匹配规则115。在一个实施方案中,***400被用来配置并生成一组关键字/图像匹配规则115以将某些关键字映射到存储在图像存储器125中的图像。
图像存储器125可通过网络以本地或远程的方式被维持在指定的服务器中。被用来在关键字/图像匹配规则115中进行映射的关键字可以是在搜索查询中更有可能用到的关键字。图像存储器125存储图像122及其各自的元数据124。关键字/图像匹配规则115包括关键字/图像映射表421和图像排序算法或模型422。可将关键字/图像映射表421实施为如图3中所示的任一映射表。
在一个实施方案中,图像映射***150包括匹配规则配置模块431、数据收集模块432、分析模块433、匹配模块434和机器学习引擎或训练模块435。模块431-435可以软件、硬件或其组合来实施。在一个实施方案中,可利用配置模块431以(例如)响应于用户请求经由用户接口来配置关键字/图像映射表421。关键字/图像映射表421包括许多映射条目。每个映射条目将关键字映射到一个或多个图像ID,所述图像ID识别存储在图像存储器125中的图像122中的一个或多个。可由数据收集模块432周期性地收集并更新图像122和元数据124。数据收集模块432可采用一些网络爬虫来爬取和收集图像及其周围的信息或元数据124。
在一个实施方案中,元数据124包括描述图像122的多种信息或数据,其中可由指定的数据收集模块或***(诸如,数据收集模块432)来获得或收集元数据。例如,可在获得对应图像的时候收集图像元数据。图像元数据可包括从中收集到图像的来源和收集时间。从中获得图像的来源可以是其中附有图像的网页或文档。可收集地址,诸如源页面的统一资源***(URL)。另外,可对源页面的内容执行分析,以确定可能由图像表示的内容。
还可对图像执行图像辨识,以确定图像的内容(例如,图像是不是关于人、物体、风景、文本或其组合)。另外,还可收集图像的属性,诸如纵横比、像素计数、亮度、对比度、拍摄图像的时间和风格(例如,风景对肖像、图像大小)。此外,用户与图像和/或关键字在过去的的先前互动(例如,点击率)还可基于与图像相关联的历史互动来确定。这些信息可被编译为图像124的元数据的一部分(出于计分的目的,也称为图像的特征)。
基于元数据,过滤和匹配模块434执行过滤操作,以通过匹配关键字与特定图像的元数据之间的语义意义来确定特定关键字是否充分描述图像。例如,如果关键字出现在从中收集到图像的源页面中,那么所述关键字与所述图像有关。类似地,如果关键字响应于图像辨识而描述图像的至少一部分内容,那么所述关键字可以是有关的。
如果基于对元数据的分析确定关键字并未充分描述特定图像或反之亦然,那么可移除所述特定图像。如果确定用户与特定图像的先前互动低于预定阈值(例如,较少的用户互动、较小的用户兴趣或不受欢迎),那么可从关键字/图像映射表421移除所述特定图像。应注意,贯穿本申请,出于示出的目的,术语“匹配规则”、“映射规则”、“匹配表”和“映射表”是可互换术语。然而,其可以多种数据结构或格式来实施。
在一个实施方案中,分析模块433对图像122的至少元数据124执行分析,以提取或获得与图像122及其元数据124相关联的各种图像特征。以所述分析为基础,基于图像特征(诸如,上文列出的图像特征)来确定一组特征计分公式或算法。针对每一个特征,可生成计分公式或算法。另外,还确定匹配质量计分公式或算法。可替代地,可由机器学习引擎435来训练或学习特征和/或特征得分,以创建用于确定特定图像的排序得分的排序模型。然后,可以将这些算法和/或模型存储为图像排序算法/模型422的一部分,其可以被在线用来响应于搜索查询将待与内容项目匹配的候选图像排序。可响应于搜索查询使用关键字/图像映射表421来识别候选图像。
根据一个实施方案,图像映射***150(操作为数据分析***)进一步包括用户简档编译程序410,所述用户简档编译程序用于在各种情况下基于用户的先前用户互动或用户行为来编译多种用户的用户简档135。可由数据收集模块432来收集用户的用户互动。用户的用户互动可被收集为在由服务器104进行在线搜索期间接收到的用户上下文的一部分。用户互动可包括用户已存取什么内容项目、链接和/或网站。用户互动可进一步记录用户已存取诸如日期和时间、一周或一月中的日子、特定假期等那些资源所处的情况。
基于先前用户互动,用户简档编译程序410编译每个已识别用户的用户简档。用户简档可包括对应用户的识别信息,诸如识别用户装置的装置ID(例如,IP地址、媒体存取控制或MAC地址、国际移动用户标识或IMSI、序列号)。用户简档可进一步包括用户特定行为、习惯、存取资源的倾向,其可由简档编译程序410基于对先前用户互动的分析来确定。然后,可将用户简档135上传到服务器104并出于在线搜索目的周期性地更新所述用户简档,其中用户简档135可用来在运行时间选择内容项目和图像。
图5是示出根据本发明的一个实施方案的图像匹配***的示例的框图。***500可实施为图2的***200的一部分。参考图5,***500可与图2的***200合并。可替代地,可将***500实施为(例如)通过网络或连接经由API或通信协议通信地联接到图2的***200的独立式***或服务器。在一个实施方案中,***500负责响应于搜索内容的搜索查询在运行时间来识别、排序和选择待与响应于搜索查询找到的内容项目匹配的图像。
在一个实施方案中,图像选择模块110包括分析模块501、图像匹配模块502和图像排序模块503,其中这些模块中的一些或全部可以软件、硬件或其组合来实施。在一个实施方案中,响应于从客户端装置接收到的搜索内容的搜索查询,由分析模块501分析搜索查询以确定一个或多个关键字。针对待与图像匹配的给定的内容项目,分析模块501还分析内容和关联的内容提供者以生成额外关键字。分析模块501可从内容项目提取概述或描述所述内容项目的一个或多个关键字。分析模块501可确定表示或描述内容提供者的一个或多个关键字(例如,商标)。分析模块501可进一步对关键字执行潜在语义分析,以将所述关键字扩展为包括语义上有关的一个或多个关键字。
由图像匹配模块502在关键字/图像映射表421中基于关键字来执行搜索或查找操作。关键字/图像映射表421包括多个条目且每个条目将识别图像的图像ID映射到一个或多个关键字,或反之亦然(例如,如图3中所示的匹配表)。针对被识别为候选图像的每个图像,由图像排序模块503执行排序过程以确定所述图像的排序得分。可基于图像排序算法或模型422将图像排序或分类,所述图像排序算法或模型可由如上所述的图4的***400来配置。
根据一个实施方案,当搜索和/或排序图像时,考虑在运行时间捕获的用户的用户上下文505和用户的用户简档135以选择对用户最具吸引力的图像。可将用户上下文505实施为用户上下文138的一部分。用户上下文是指与在某个时间点发起搜索查询的用户有关的任何用户信息,其中所述用户信息是在发出搜索查询的时候被捕获的。可从发出搜索查询的用户/客户端装置来捕获和接收用户上下文的至少一部分。用户上下文包括用户装置的装置ID(例如,IP地址、MAC地址、IMSI、序列号)、发出搜索查询时的日期和时间、用户装置的品牌、操作***(OS)和运行在用户装置内的OS的版本、cookie信息、浏览器信息、用户装置在某个时间点的地理位置(例如,经度和纬度)、由用户在当时所执行的特定活动等。装置ID可用来搜索、识别和更新与用户相关联的用户简档。
用户简档是指已基于在过去一段时间中捕获的用户信息或用户互动所编译的用户信息。用户简档可包括由分析模块或简档编译程序基于先前用户信息和用户互动所执行的分析结果。用户简档可包括在某些情况下的用户倾向(例如,浏览倾向)、习惯、对未来用户活动的预测、对用户爱好(例如,最喜爱的色彩、形状、图像、内容、链接、品牌)的预测。用户简档可进一步包括唯一地识别用户的识别信息,诸如用户装置的装置ID(例如,IP地址、MAC地址、IMSI、序列号)等。
图6是根据本发明的一个实施方案的选择图像的处理流程。可由图5的***500来执行过程600。参考图5和图6,当从客户端装置101接收到搜索查询601时,搜索引擎120在内容数据库133中执行搜索以识别内容项目602(例如,诸如Ad的赞助内容)。搜索引擎120可比较搜索查询601的一个或多个关键字与一个或多个预定关键字(例如,投标字),所述预定关键字与内容提供者(例如,广告商)相关联。如果与搜索查询相关联的关键字匹配内容提供者的预定关键字,那么可将由内容提供者所提供的内容项目选择为内容项目602(作为示例)。
在一个实施方案中,基于内容项目602、搜索查询601和/或提供内容项目602的内容提供者,图像匹配模块502在图像存储器或服务器125中执行搜索。图像匹配模块502可从搜索查询601、内容项目602(例如,基于图像辨识的标题、描述、字)获得关键字图表和/或与内容提供者相关联的关键字(例如,投标字)。可将关键字扩展为包括一个或多个语义上类似的关键字,所述关键字可基于对关键字的分析(诸如,潜在语义分析)来确定。基于关键字来执行图像搜索以将图像列表识别为候选图像603。
在一个实施方案中,图像排序模块503使用排序算法或排序模型422来排序和分类候选图像603,所述排序算法或排序模型可由操作为数据分析***的图像映射***150来确定和配置。在对候选图像603排序的过程中,图像排序模块503进一步考虑用户上下文505和用户简档135。用户上下文505可由客户端装置101捕获,并与搜索查询601一同被接收。
例如,从用户上下文505确定日期,且具有与所述日期相关联的图像内容的图像可具有更高的排序。类似地,如果日期是特殊日子(例如,圣诞节、新年或国家独立日),那么具有与所述特殊日子有关的图像内容或属性的图像可具有更高的排序。例如,如果用户上下文的日子是关于圣诞节的,那么具有圣诞节内容的图像或具有红色的色彩主题的图像可具有更高的排序。
根据另一个实施方案,针对每个候选图像,提取图像特征。图像特征可以是边缘特征(例如,表示清晰度、对比度)、色彩特征或斑点(blob)特征。图像排序模块503依据用户上下文505和用户简档135来检查被提取特征,以确定具有所述被提取特征的候选图像是否适合于用户。具有与用户上下文505和用户简档135相抵触的图像特征的任何图像可从列表中移除或可在列表中具有更低的排序。可例如由图像映射***150来离线训练和配置用于过滤掉无关图像的规则。可对多种用户的大量用户互动执行所述训练。
例如,基于用户装置的地理位置(其可基于用户上下文505来确定),图像排序模块503可确定用户是否位于预定类型的位置(例如,家、购物中心)处。如果确定用户在家中,那么例如具有更低或更小边缘特征的图像可具有更高的排序,因为用户倾向于在家中喜欢更宁静的图像。如果确定在发出搜索查询的时候用户是在购物中心,那么展示特价销售或其他促销的图像可具有更高的排序。可替代地,如果特定用户可能喜欢某些色彩(其可基于用户简档135来确定),那么具有相同或类似的色彩主题的图像可具有更高的排序。如果确定用户上下文的当前日子是特殊日子(诸如,圣诞节),那么具有假期色彩主题的图像可具有更高的排序。其后,生成作为结果的已排序图像604的列表,且可将其中一个排在前列的候选图像选择为最终图像以与内容项目602相关联。
图7是示出根据本发明的一个实施方案的基于用户上下文信息来对图像排序的过程的流程图。可由处理逻辑来执行过程700,所述处理逻辑可包括软件、硬件或其组合。例如,可由图5的***500来执行过程700。参考图7,在框701处,处理逻辑接收基于从用户的用户装置接收到的搜索查询所识别的内容项目(例如,赞助内容项目)的内容信息。在框702处,处理逻辑在图像存储器中进行搜索以基于搜索查询和内容信息来识别候选图像列表。内容信息可包括从内容项目自身提取的信息和提供内容项目的内容提供者(例如,广告商)的内容提供者信息(例如,投标字)。在一个实施方案中,也可基于用户上下文和/或与用户相关联的用户简档来识别图像列表。可从用户装置实时接收用户上下文连同搜索查询。
针对每个候选图像,在框703处,从所述图像提取一个或多个图像特征。在框704处,使用预定图像排序算法或模型基于用户上下文和关联的图像特征对候选图像排序。在框705处,基于图像排序来选择其中一个排在前列的候选图像。在框706处,将所选图像与内容项目整合,以生成复合内容项目。然后,将复合项目传回到用户装置以向用户呈现。
图8是示出根据本发明的一个实施方案的确定图像排序算法的过程的流程图。可由处理逻辑来执行过程800,所述处理逻辑可包括软件、硬件或其组合。例如,可由图4的***400来执行过程800。参考图8,在框801处,处理逻辑从存取图像的大量用户互动性会话收集用户上下文信息。用户上下文信息可以是在过去的一段时间期间所收集的先前用户上下文的一部分。在框802处,处理逻辑对用户上下文信息和对应的图像执行分析。在框803处,处理逻辑基于分析来确定或训练图像排序算法或模型。在框804处,响应于搜索查询将图像排序算法或模型提供到图像选择***以对图像实时排序。
可以将上述技术应用于匹配图像与赞助内容。一种类型的赞助内容是广告(Ad)。例如,返回参考图1A到图1B,内容数据库(DB)或服务器133可以是Ad数据库或Ad***或服务器的一部分。每一个内容项目(例如,Ad)与预定义的关键字、词、短语或句子的列表相关联。这些预定义的关键字、词、短语或句子可以是由广告商所购买、定义或指定的投标字。在另一个实施方案中,主要内容DB 130可存储通常在公共网络中可用的一般内容。辅助内容DB131可以是Ad DB,而图像选择模块/***110可以是通信地联接到搜索引擎120的Ad***。响应于搜索查询,搜索引擎120搜索主要内容DB 130以识别一般内容项目(例如,URL)的列表。然后,搜索引擎120与Ad***通信,以识别和检索具有匹配图像的一个或多个Ad,如上文所描述。然后,由搜索引擎120将一般内容项目和具有匹配图像的Ad作为部分搜索结果传回到客户端。一些Ad可仅仅是纯文本。通过使图像与Ad匹配和整合(例如,作为背景图像),Ad可更吸引人或对用户更具吸引力。服务器104可以是用于搜索内容的网络服务器,或可替代地,服务器104可以是Ad服务器。
图9是示出可与本发明的一个实施方案一起使用的数据处理***的示例的框图。例如,***1500可表示以上所述的执行上述过程或方法中的任一个的任一数据处理***,例如上述客户端装置或服务器,例如如上所述的客户端装置101-102中的任一者、服务器104、内容服务器133或图像映射***/服务器150。
***1500可包括许多不同的组件。这些组件可以实施为集成电路(IC)、集成电路的部分、离散电子装置或被适配用于电路板的其他模块(诸如计算机***的主板或***卡),或者实施为以其他方式并入计算机***的底盘内的组件。
还应注意,***1500旨在示出计算机***的许多组件的高级视图。然而,应当理解的是,某些实施方式中可存在附加的组件,此外,其他实施方式中可出现所示组件的不同布置。***1500可表示台式计算机、膝上型计算机、平板计算机、服务器、移动电话、媒体播放器、个人数字助理(PDA)、智能手表、个人通信器、游戏装置、网络路由器或集线器、无线接入点(AP)或中继器、机顶盒或其组合。此外,虽然仅示出了单个机器或***,但是术语“机器”或“***”还应当被理解为包括单独地或共同地执行一个(或多个)指令集以执行本文所讨论的任何一种或多种方法的机器或***的任何集合。
在一个实施方案中,***1500包括经由总线或互连件1510连接的处理器1501、存储器1503以及装置1505-1508。处理器1501可表示其中包括单个处理器内核或多个处理器内核的单个处理器或多个处理器。处理器1501可表示一个或多个通用处理器,诸如微处理器、中央处理单元(CPU)等。更具体地,处理器1501可以是复杂指令集计算(CISC)微处理器、精简指令集计算(RISC)微处理器、超长指令字(VLIW)微处理器、或实施其他指令集的处理器、或实施指令集组合的处理器。处理器1501还可以是一个或多个专用处理器,诸如专用集成电路(ASIC)、蜂窝或基带处理器、现场可编程门阵列(FPGA)、数字信号处理器(DSP)、网络处理器、图形处理器、通信处理器、加密处理器、协同处理器、嵌入式处理器或能够处理指令的任何其他类型的逻辑。
处理器1501(其可以是低功率多核处理器插座,诸如超低电压处理器)可充当用于与所述***的各种组件通信的主处理单元和中央集线器。这种处理器可以实施为片上***(SoC)。处理器1501被配置成执行指令以执行本文所讨论的操作和步骤。***1500还可包括与可选的图形子***1504通信的图形接口,所述图形子***可包括显示控制器、图形处理器和/或显示装置。
处理器1501可以与存储器1503通信,存储器1503在一个实施方案中可以经由多个存储器装置实施以提供给定量的***存储器。存储器1503可包括一个或多个易失性存储(或存储器)装置,诸如随机存取存储器(RAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、静态RAM(SRAM)或其他类型的存储装置。存储器1503可存储包括由处理器1501或任何其他装置执行的指令序列的信息。例如,多种操作***、装置驱动程序、固件(例如,输入输出基本***或BIOS)和/或应用程序的可执行代码和/或数据可以加载在存储器1503中并由处理器1501执行。操作***可以是任何种类型的操作***,例如像来自公司的操作***、来自苹果公司的Mac来自公司的或其他实时或嵌入式操作***(诸如VxWorks)。
***1500还可包括I/O装置,诸如装置1505-1508,包括网络接口装置1505、可选的输入装置1506以及其他可选的I/O装置1507。网络接口装置1505可包括无线收发器和/或网络接口卡(NIC)。所述无线收发器可以是WiFi收发器、红外收发器、蓝牙收发器、WiMax收发器、无线蜂窝电话收发器、卫星收发器(例如,全球定位***(GPS)收发器)或其他射频(RF)收发器或其组合。NIC可以是以太网卡。
输入装置1506可包括鼠标、触摸板、触敏屏幕(其可以与显示装置1504整合在一起)、指示装置(诸如指示笔)和/或键盘(例如,物理键盘或作为触敏屏幕的一部分显示的虚拟键盘)。例如,输入装置1506可包括联接到触摸屏的触摸屏控制器。触摸屏和触摸屏控制器例如可以使用多种触摸灵敏度技术(包括但不限于电容、电阻、红外和表面声波技术)中的任一种,以及用于确定与触摸屏的一个或多个接触点的其他接近传感器阵列或其他元件来检测其触点和移动或间断。
I/O装置1507可包括音频装置。音频装置可包括扬声器和/或麦克风,以促进支持语音的功能,诸如语音辨识、语音复制、数字记录和/或电话功能。其他I/O装置1507还可包括通用串行总线(USB)端口、并行端口、串行端口、打印机、网络接口、总线桥(例如,PCI-PCI桥)、传感器(例如,运动传感器,诸如加速度计、陀螺仪、磁强计、光传感器、罗盘、接近传感器等)或其组合。装置1507还可包括成像处理子***(例如,摄像机),所述成像处理子***可包括用来促进摄像机功能(诸如记录照片和视频片段)的光学传感器,诸如电荷耦合装置(CCD)或互补金属氧化物半导体(CMOS)光学传感器。某些传感器可经由传感器集线器(未示出)联接到互连件1510,而其他装置(诸如,键盘或热传感器)可由嵌入式控制器(未示出)控制,这取决于***1500的特定配置或设计。
为了提供信息(诸如,数据、应用程序、一个或多个操作***等)的永久性存储,大容量存储装置(未示出)也可联接到处理器1501。在各种实施方案中,为了实施更薄且更轻的***设计并且改进***响应能力,这种大容量存储装置可经由固态装置(SSD)实施。然而,在其他实施方案中,大容量存储装置可主要使用硬盘驱动器(HDD)来实施,其中较小量的SSD存储装置充当SSD高速缓存以在断电事件期间实施上下文状态以及其他此类信息的非易失性存储,从而使得在***活动重新启动时能够实施快速通电。又,闪存装置可以例如经由串行***接口(SPI)联接到处理器1501。这种闪存装置可提供***软件的非易失性存储,所述***软件包括所述***的基本输入/输出软件(BIOS)以及其他固件。
存储装置1508可包括计算机可存取的存储媒体1509(也被称为机器可读存储媒体或计算机可读媒体),其上存储有体现任何一种或多种本文所述方法或功能的一个或多个指令集或软件(例如,模块、单元和/或逻辑1528)。处理模块/单元/逻辑1528可表示任一上述组件,例如如上所述的搜索引擎、图像选择模块/***。处理模块/单元/逻辑1528还可在其由数据处理***1500、存储器1503和处理器1501执行期间完全地或至少部分地驻留在存储器1503内和/或处理器1501内,另外构成机器可存取的存储媒体。处理模块/单元/逻辑1528还可通过网络经由网络接口装置1505被发射或接收。
计算机可读存储媒体1509也可用来永久性地存储以上描述的至少一些软件功能。虽然计算机可读存储媒体1509在示例性实施方案中被示为单个媒体,但是术语“计算机可读存储媒体”应当被认为包括存储所述一个或多个指令集的单个媒体或多个媒体(例如,集中式或分布式数据库和/或相关联的高速缓存和服务器)。术语“计算机可读存储媒体”还应当被认为包括能够存储或编码指令集的任何媒体,所述指令集用于由机器执行并且致使所述机器执行本发明的任何一种或多种方法。因此,术语“计算机可读存储媒体”应当被认为包括但不限于固态存储器以及光学媒体和磁性媒体或者任何其他非暂时性机器可读媒体。
本文所述的处理模块/单元/逻辑1528、组件以及其他特征可以实施为离散硬件组件或整合在硬件组件(诸如ASICS、FPGA、DSP或类似装置)的功能中。另外,处理模块/单元/逻辑1528可以实施为硬件装置内的固件或功能电路。此外,处理模块/单元/逻辑1528可以以硬件装置和软件组件的任何组合实施。
应注意,虽然***1500被示出为具有数据处理***的各种组件,但是其不旨在表示任何特定的架构或互连组件的方式;因为此类细节和本发明的实施方案没有密切关系。还应当认识到,具有更少组件或可能具有更多组件的网络计算机、手持计算机、移动电话、服务器和/或其他数据处理***也可与本发明的实施方案一起使用。
前述详细描述中的一些部分已经依据在计算机存储器内对数据位的运算的算法和符号表示而呈现。这些算法描述和表示是数据处理领域中的技术人员所使用的方法,以便最有效地将它们的工作实质传达给本领域中的其他技术人员。这里,算法通常被认为是导致所期望结果的前后一致的操作序列。这些操作是需要对物理量进行物理操控的操作。
然而,应当牢记,所有这些和类似的术语均意图与适当的物理量相关联,并且仅仅是应用于这些量的适宜标记。除非在以上讨论中另外明确地说明清楚,否则应当了解,贯穿本说明书利用术语(诸如以下权利要求书中所阐述的术语)的讨论是指计算机***或类似电子计算装置的动作和处理,所述计算机***或电子计算装置操控计算机***的寄存器和存储器内的表示为物理(例如,电子)量的数据,并将所述数据变换成计算机***存储器或寄存器或其他此类信息存储器、传输或显示装置内类似地表示为物理量的其他数据。
各图中所示的技术可以使用存储和执行于一个或多个电子装置上的代码及数据来实施。此类电子装置使用计算机可读媒体来存储和传达(在内部和/或通过网络与其他电子装置)代码及数据,所述计算机可读媒体是诸如非暂时性计算机可读存储媒体(例如,磁盘、光盘、随机存取存储器;只读存储器、闪存存储器装置、相变存储器)和暂时性计算机可读传输媒体(例如,电子、光学、声学或其他形式的传播信号—诸如载波、红外信号、数字信号)。
前述附图中所描绘的过程或方法可由处理逻辑来执行,所述处理逻辑包括硬件(例如,电路、专用逻辑等)、固件、软件(例如,体现在非暂时性计算机可读媒体上)或两者的组合。尽管所述过程或方法在上文是依据一些顺序操作来描述的,但是应当了解,所描述的操作中的一些可按不同的次序执行。此外,一些操作可并行地而不是顺序地执行。
在以上的说明书中,已经参考本发明的特定例示性实施方案对其实施方案进行了描述。将显而易见的是:在不脱离如以下权利要求书中阐述的本发明的更宽泛精神和范围的情况下,可对其做出各种修改。因此,应当在说明性意义而不是限制性意义上来理解本说明书和附图。

Claims (24)

1.一种用于搜索和选择图像的计算机实施方法,所述方法包括:
接收基于第一组关键字所搜索和识别的内容项目,所述第一组关键字包括一个或多个关键字,并基于通过网络从客户端装置接收到的搜索查询来确定;
在图像存储器中进行搜索以基于所述第一组关键字和与所述内容项目相关联的第二组关键字来识别多个图像,其中所述第二组关键字包括一个或多个关键字;
基于在接收到所述搜索查询的时候所获得的用户上下文,对所述多个图像排序;
将从经过排序的图像中选择出的图像与所述内容项目进行合并,以生成复合内容项目,其中所选图像的排序高于预定阈值;以及
通过所述网络将所述复合内容项目传输到所述客户端装置。
2.根据权利要求1所述的方法,其中,连同所述搜索查询从所述客户端装置一起接收所述用户上下文。
3.根据权利要求2所述的方法,其中所述用户上下文包括:
在接收到所述搜索查询时的日期和时间;以及
在接收到所述搜索查询的时候与所述客户端装置相关联的地理位置。
4.根据权利要求3所述的方法,进一步包括:
基于所述用户上下文来确定出在接收到所述搜索查询时的日期与预定日子相匹配;以及
选择具有与所述预定日子相匹配的色彩特征的图像。
5.根据权利要求1所述的方法,其中基于用户上下文对所述多个图像排序包括:
针对所述多个图像中的每个,从所述图像提取一个或多个图像特征;
给定所述用户上下文表示的环境,确定所提取的图像特征是否适合于呈现;以及
如果所提取的图像特征与由所述用户上下文提供的用户上下文信息相抵触,则移除所述图像而不予考虑。
6.根据权利要求5所述的方法,进一步包括:
对所述图像执行图像辨识以确定由所述图像表示的图像内容,其中具有与由所述用户上下文表示的环境有关的图像内容的图像具有更高的排序。
7.根据权利要求5所述的方法,其中所述图像特征包括边缘特征、色彩特征和斑点特征中的一者或多者。
8.根据权利要求5所述的方法,进一步包括:
基于地理位置来确定所述客户端装置的用户位于预定类型的位置处,所述地理位置是基于所述用户上下文来确定的;以及
响应于确定出所述客户端装置的用户位于所述预定类型的位置处,选择具有更小边缘特征的图像。
9.一种具有存储在其中的指令的非暂时性机器可读媒体,所述指令在由处理器执行时,致使所述处理器执行搜索和选择图像的操作,所述操作包括:
接收基于第一组关键字所搜索和识别的内容项目,所述第一组关键字包括一个或多个关键字,并基于通过网络从客户端装置接收到的搜索查询来确定;
在图像存储器中进行搜索以基于所述第一组关键字和与所述内容项目相关联的第二组关键字来识别多个图像,其中所述第二组关键字包括一个或多个关键字;
基于在接收到所述搜索查询的时候所获得的用户上下文,对所述多个图像排序;
将从经过排序的图像中选择出的图像与所述内容项目进行合并,以生成复合内容项目,其中所选图像的排序高于预定阈值;以及
通过所述网络将所述复合内容项目传输到所述客户端装置。
10.根据权利要求9所述的机器可读媒体,其中,连同所述搜索查询从所述客户端装置一起接收所述用户上下文。
11.根据权利要求10所述的机器可读媒体,其中所述用户上下文包括:
在接收到所述搜索查询时的日期和时间;以及
在接收到所述搜索查询的时候与所述客户端装置相关联的地理位置。
12.根据权利要求11所述的机器可读媒体,其中所述操作进一步包括:
基于所述用户上下文来确定出在接收到与所述搜索查询时的日期相匹配的预定日子;以及
选择具有与所述预定日子相匹配的色彩特征的所述图像。
13.根据权利要求9所述的机器可读媒体,其中基于用户上下文对所述多个图像排序包括:
针对所述多个图像中的每个,从所述图像提取一个或多个图像特征;
给定由所述用户上下文表示的环境,确定所述所提取的图像特征是否适合于呈现;以及
如果所提取的图像特征与由所述用户上下文提供的用户上下文信息相抵触,则移除所述图像而不予考虑。
14.根据权利要求13所述的机器可读媒体,其中所述操作进一步包括:对所述图像执行图像辨识以确定由所述图像表示的图像内容,其中具有与由所述用户上下文表示的环境有关的图像内容的图像具有更高的排序。
15.根据权利要求13所述的机器可读媒体,其中所述图像特征包括边缘特征、色彩特征和斑点特征中的一者或多者。
16.根据权利要求13所述的机器可读媒体,其中所述操作进一步包括:
基于地理位置来确定所述客户端装置的用户位于预定类型的位置处,所述地理位置是基于所述用户上下文来确定的;以及
响应于确定出所述客户端装置的用户位于所述预定类型的位置处,选择具有更小边缘特征的图像。
17.一种数据处理***,其包括:
处理器;以及
存储器,所述存储器联接到所述处理器、用于存储指令,所述指令在由所述处理器执行时,致使所述处理器执行搜索和选择图像的操作,所述操作包括:
接收基于第一组关键字所搜索和识别的内容项目,所述第一组关键字包括一个或多个关键字,并基于通过网络从客户端装置接收到的搜索查询来确定;
在图像存储器中进行搜索以基于所述第一组关键字和与所述内容项目相关联的第二组关键字来识别多个图像,其中所述第二组关键字包括一个或多个关键字;
基于在接收到所述搜索查询的时候所获得的用户上下文,对所述多个图像排序;
将从经过排序的图像中选择出的图像与所述内容项目进行合并,以生成复合内容项目,其中所选图像的排序高于预定阈值;以及
通过所述网络将所述复合内容项目传输到所述客户端装置。
18.根据权利要求17所述的***,其中,连同所述搜索查询从所述客户端装置一起接收所述用户上下文。
19.根据权利要求18所述的***,其中所述用户上下文包括:
在接收到所述搜索查询时的日期和时间;以及
在接收到所述搜索查询的时候与所述客户端装置相关联的地理位置。
20.根据权利要求19所述的***,其中所述操作进一步包括:
基于所述用户上下文来确定出在接收到与所述搜索查询时的日期相匹配的预定日子;以及
选择具有与所述预定日子相匹配的色彩特征的所述图像。
21.根据权利要求17所述的***,其中基于用户上下文对所述多个图像排序包括:
针对所述多个图像中的每个,从所述图像提取一个或多个图像特征;
给定由所述用户上下文表示的环境,确定所提取的图像特征是否适合于呈现;以及
如果所提取的图像特征与由所述用户上下文提供的用户上下文信息相抵触,则移除所述图像而不予考虑。
22.根据权利要求21所述的***,其中所述操作进一步包括:对所述图像执行图像辨识以确定由所述图像表示的图像内容,其中具有与由所述用户上下文表示的所述情况有关的图像内容的图像具有更高的排序。
23.根据权利要求21所述的***,其中所述图像特征包括边缘特征、色彩特征和斑点特征中的一者或多者。
24.根据权利要求21所述的***,其中所述操作进一步包括:
基于地理位置来确定所述客户端装置的用户位于预定类型的位置处,所述地理位置是基于所述用户上下文来确定的;以及
响应于确定出所述客户端装置的用户位于所述预定类型的位置处,选择具有更小边缘特征的图像。
CN201710285686.7A 2016-08-24 2017-04-27 用于搜索和选择图像的方法和***以及机器可读媒体 Active CN107784059B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/246,383 US10565255B2 (en) 2016-08-24 2016-08-24 Method and system for selecting images based on user contextual information in response to search queries
US15/246,383 2016-08-24

Publications (2)

Publication Number Publication Date
CN107784059A true CN107784059A (zh) 2018-03-09
CN107784059B CN107784059B (zh) 2022-02-22

Family

ID=61242772

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710285686.7A Active CN107784059B (zh) 2016-08-24 2017-04-27 用于搜索和选择图像的方法和***以及机器可读媒体

Country Status (2)

Country Link
US (1) US10565255B2 (zh)
CN (1) CN107784059B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109344265A (zh) * 2018-09-10 2019-02-15 新华三大数据技术有限公司 一种资源管理方法及装置
CN111241387A (zh) * 2018-11-28 2020-06-05 Sap欧洲公司 提高搜索结果的相关性
CN111801703A (zh) * 2018-04-17 2020-10-20 赫尔实验室有限公司 用于图像处理管线的边界框生成的硬件和***
CN112639759A (zh) * 2018-05-16 2021-04-09 索尼互动娱乐有限责任公司 上下文数字媒体处理***和方法
CN112740228A (zh) * 2018-09-24 2021-04-30 易享信息技术有限公司 视觉搜索引擎
CN113795834A (zh) * 2019-05-09 2021-12-14 微软技术许可有限责任公司 用于修改查询图像的技术

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102312999B1 (ko) * 2017-05-31 2021-10-13 삼성에스디에스 주식회사 광고 편성 장치 및 방법
US11328322B2 (en) * 2017-09-11 2022-05-10 [24]7.ai, Inc. Method and apparatus for provisioning optimized content to customers
WO2019235946A1 (en) * 2018-06-07 2019-12-12 Motorola Solutions, Inc System and method for sending and rendering an image by a device based on receiver's context
US20200334317A1 (en) * 2019-04-16 2020-10-22 Citrix Systems, Inc. Methods and systems for caching and searching for search results
US11636438B1 (en) 2019-10-18 2023-04-25 Meta Platforms Technologies, Llc Generating smart reminders by assistant systems
CN112069348A (zh) * 2020-09-09 2020-12-11 北京沃东天骏信息技术有限公司 对象匹配方法、装置和服务平台
CN112632277B (zh) * 2020-12-15 2023-04-07 五八同城信息技术有限公司 一种目标内容对象的资源处理方法和装置

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080133505A1 (en) * 2006-12-05 2008-06-05 Yahoo! Inc. Search results presented as visually illustrative concepts
CN101802824A (zh) * 2007-09-20 2010-08-11 诺基亚公司 用于提供视觉搜索接口的方法、装置和计算机程序产品
US20110071977A1 (en) * 2009-09-18 2011-03-24 Apple Inc. Segmented graphical representations for recommending elements
US20110264641A1 (en) * 2010-04-21 2011-10-27 Microsoft Corporation Image search result summarization with informative priors
CN102298612A (zh) * 2010-06-25 2011-12-28 微软公司 基于用户社交简档调整搜索结果
CN102799635A (zh) * 2012-06-27 2012-11-28 天津大学 一种用户驱动的图像集合排序方法
CN103164539A (zh) * 2013-04-15 2013-06-19 中国传媒大学 一种结合用户评价与标注的交互式图像检索方法
US20140181096A1 (en) * 2012-12-21 2014-06-26 Microsoft Corporation Entity name disambiguation
US20150066919A1 (en) * 2013-08-27 2015-03-05 Objectvideo, Inc. Systems and methods for processing crowd-sourced multimedia items
CN104598585A (zh) * 2015-01-15 2015-05-06 百度在线网络技术(北京)有限公司 信息搜索方法及装置
US20150287080A1 (en) * 2014-04-04 2015-10-08 Gayathri Ravichandran Geetha Contextual promotions
US20150324392A1 (en) * 2014-05-06 2015-11-12 Shutterstock, Inc. Systems and methods for color palette suggestions

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8429205B2 (en) * 1995-07-27 2013-04-23 Digimarc Corporation Associating data with media signals in media signal systems through auxiliary data steganographically embedded in the media signals
US6834371B1 (en) * 2000-08-31 2004-12-21 Interactive Video Technologies, Inc. System and method for controlling synchronization of a time-based presentation and its associated assets
US7715586B2 (en) * 2005-08-11 2010-05-11 Qurio Holdings, Inc Real-time recommendation of album templates for online photosharing
US8695031B2 (en) * 2006-08-02 2014-04-08 Concurrent Computer Corporation System, device, and method for delivering multimedia
JP5276838B2 (ja) * 2007-12-20 2013-08-28 三星電子株式会社 情報処理装置、情報処理方法、およびコンピュータプログラム
US10210179B2 (en) * 2008-11-18 2019-02-19 Excalibur Ip, Llc Dynamic feature weighting
US8392430B2 (en) * 2009-09-23 2013-03-05 Microsoft Corp. Concept-structured image search
JP5647916B2 (ja) * 2010-02-26 2015-01-07 楽天株式会社 情報処理装置、情報処理方法及び情報処理プログラム
US20110270828A1 (en) * 2010-04-29 2011-11-03 Microsoft Corporation Providing search results in response to a search query
US9043205B2 (en) * 2012-06-21 2015-05-26 Google Inc. Dynamic language model
US8706872B2 (en) * 2012-07-09 2014-04-22 Parentsware, Llc Agreement compliance controlled information throttle
US20150070516A1 (en) * 2012-12-14 2015-03-12 Biscotti Inc. Automatic Content Filtering
US20160035055A1 (en) * 2013-03-15 2016-02-04 Canva Pty Ltd. System for single-use stock image design
US9652543B2 (en) * 2014-12-22 2017-05-16 Microsoft Technology Licensing, Llc Task-oriented presentation of auxiliary content to increase user interaction performance
US9986019B2 (en) * 2015-06-24 2018-05-29 At&T Intellectual Property I, L.P. Intelligent route management for diverse ecosystems
US20170185670A1 (en) * 2015-12-28 2017-06-29 Google Inc. Generating labels for images associated with a user
US20180011854A1 (en) * 2016-07-07 2018-01-11 Yahoo Holdings, Inc. Method and system for ranking content items based on user engagement signals
US10496698B2 (en) * 2016-08-24 2019-12-03 Baidu Usa Llc Method and system for determining image-based content styles

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080133505A1 (en) * 2006-12-05 2008-06-05 Yahoo! Inc. Search results presented as visually illustrative concepts
CN101802824A (zh) * 2007-09-20 2010-08-11 诺基亚公司 用于提供视觉搜索接口的方法、装置和计算机程序产品
US20110071977A1 (en) * 2009-09-18 2011-03-24 Apple Inc. Segmented graphical representations for recommending elements
US20110264641A1 (en) * 2010-04-21 2011-10-27 Microsoft Corporation Image search result summarization with informative priors
CN102298612A (zh) * 2010-06-25 2011-12-28 微软公司 基于用户社交简档调整搜索结果
CN102799635A (zh) * 2012-06-27 2012-11-28 天津大学 一种用户驱动的图像集合排序方法
US20140181096A1 (en) * 2012-12-21 2014-06-26 Microsoft Corporation Entity name disambiguation
CN103164539A (zh) * 2013-04-15 2013-06-19 中国传媒大学 一种结合用户评价与标注的交互式图像检索方法
US20150066919A1 (en) * 2013-08-27 2015-03-05 Objectvideo, Inc. Systems and methods for processing crowd-sourced multimedia items
US20150287080A1 (en) * 2014-04-04 2015-10-08 Gayathri Ravichandran Geetha Contextual promotions
US20150324392A1 (en) * 2014-05-06 2015-11-12 Shutterstock, Inc. Systems and methods for color palette suggestions
CN104598585A (zh) * 2015-01-15 2015-05-06 百度在线网络技术(北京)有限公司 信息搜索方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
汪维华、汪维清: ""基于内容的多媒体检索技术"", 《计算机工程与设计》 *
高鹏飞、郭丹、刘学亮: ""结合语义与视觉信息的长查询图像重排序"", 《小型微型计算机***》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111801703A (zh) * 2018-04-17 2020-10-20 赫尔实验室有限公司 用于图像处理管线的边界框生成的硬件和***
CN112639759A (zh) * 2018-05-16 2021-04-09 索尼互动娱乐有限责任公司 上下文数字媒体处理***和方法
CN109344265A (zh) * 2018-09-10 2019-02-15 新华三大数据技术有限公司 一种资源管理方法及装置
CN112740228A (zh) * 2018-09-24 2021-04-30 易享信息技术有限公司 视觉搜索引擎
CN111241387A (zh) * 2018-11-28 2020-06-05 Sap欧洲公司 提高搜索结果的相关性
CN113795834A (zh) * 2019-05-09 2021-12-14 微软技术许可有限责任公司 用于修改查询图像的技术

Also Published As

Publication number Publication date
US10565255B2 (en) 2020-02-18
CN107784059B (zh) 2022-02-22
US20180060358A1 (en) 2018-03-01

Similar Documents

Publication Publication Date Title
CN107784059A (zh) 用于搜索和选择图像的方法和***以及机器可读媒体
JP6423845B2 (ja) 検索クエリに応答してコンテンツとマッチングしようとする画像を動的にランキングする方法及びシステム
CN107145496B (zh) 基于关键词将图像与内容项目匹配的方法
CN107480158B (zh) 基于相似性得分评估内容项目与图像的匹配的方法和***
CN110199276B (zh) 用于搜索的方法、***和介质
CN108563750B (zh) 基于浏览活动识别匹配应用
CN107103016A (zh) 基于关键词表示使图像与内容匹配的方法
RU2544771C2 (ru) Выведение специфичной для пользователя семантики местоположения из пользовательских данных
CN107766399B (zh) 用于使图像与内容项目匹配的方法和***及机器可读介质
US8682881B1 (en) System and method for extracting structured data from classified websites
JP6165955B1 (ja) 検索クエリに応答してホワイトリストとブラックリストを使用し画像とコンテンツをマッチングする方法及びシステム
CN107491465A (zh) 用于搜索内容的方法和装置以及数据处理***
CN107145497B (zh) 基于图像和内容的元数据选择与内容匹配的图像的方法
CN107273392A (zh) 用于搜索图像的计算机实现方法、装置及数据处理***
CN108027820A (zh) 用于产生短语黑名单以响应于搜索查询来防止某些内容出现在搜索结果中的方法和***
CN107273393A (zh) 用于移动设备的图像搜索方法、装置及数据处理***
CN107766398A (zh) 用于使图像与内容项目匹配的方法、装置和数据处理***
KR101556743B1 (ko) 웹 수집에 기반한 관심 정보 생성 장치 및 그 방법
CN107784061B (zh) 确定基于图像的内容样式的方法和***及机器可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant