CN101952826A - 基于文档关联的搜索 - Google Patents

基于文档关联的搜索 Download PDF

Info

Publication number
CN101952826A
CN101952826A CN2009801061372A CN200980106137A CN101952826A CN 101952826 A CN101952826 A CN 101952826A CN 2009801061372 A CN2009801061372 A CN 2009801061372A CN 200980106137 A CN200980106137 A CN 200980106137A CN 101952826 A CN101952826 A CN 101952826A
Authority
CN
China
Prior art keywords
document
search results
association
documents
realization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2009801061372A
Other languages
English (en)
Inventor
S·阿加杨
C·A·奥斯本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN101952826A publication Critical patent/CN101952826A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

提供一种方法和处理设备。可从搜索结果的多个文档中选择一组文档。可以确定并指示所选择的该组文档之间的关联。可接收各关联中感兴趣的一些关联和/或各关联中不感兴趣的其他关联的指示。可以呈现新的搜索结果,包括满足一些或全部感兴趣的关联且不满足任何不感兴趣的关联的一个或多个文档。在一些实施例中,可从搜索结果中选择一个文档并确定该文档的特征。可呈现包括不具有或具有一些所选择文档的特征的一个或多个文档的搜索结果。可提供文档的关联强度的视觉指示。

Description

基于文档关联的搜索
背景
电子存储的文档可以是数码相片、文本、一个或多个数码相片和文本的组合、或者其它信息。当搜索一所需文档时,典型情况下用户可提供一个或多个可被包含在所需文档中或相关联的元数据中的关键字。为了找到所需文档,该一个或多个用户提供的关键字可以是与包含在所需文档中或相关联的元数据中的关键字的完全匹配。但是,如果用户不能想起该用哪些关键字,或者用户错误地拼写了该关键字,则搜索所需文档可能变得困难及受挫。
概述
提供本概述是为了以简化的形式介绍将在以下详细描述中进一步描述的一些概念。本概述并不旨在标识出所要求保护的主题的关键特征或必要特征,也不旨在用于限定所要求保护的主题的范围。
在根据本发明的主题的各实施例中,可提供一种基于文件关联在多个文档中搜索所需文档的方法和处理设备。在一个实施例中,可基于一个或多个用户提供的关键字执行初始搜索。结果,可包括多个文档的搜索结果可被显示给用户。用户可以从这多个文档中选择一组文档,从而形成在所选的一组文档中共同的一个或多个关联的指示。用户可以指示这些关联中感兴趣的关联和/或这些关联中不感兴趣的其他关联。可以执行新的搜索,并且可呈现具有满足一些或全部感兴趣的关联且不满足所有不感兴趣的关联的一个或多个文档的新搜索结果。
在一些实施例中,用户可以从搜索结果中选择一个种子文档并且可以请求对相似或不相似文档的搜索。可以分析该种子文档的特征,并且可呈现包含拥有该种子文档的至少一个特征的一个或多个文档的搜索结果(当执行对相似文档的搜索时),或者可呈现包含缺少该种子文档的一个或多个特征的一个或多个文档的搜索结果(当执行对不相似文档的搜索时)。在所呈现的搜索结果中,该一个或多个文档可被呈现为岛,从而使各文档中与该种子文档具有强关联的文档在视觉上表现为不同于各文档中与所选种子文档具有弱关联的其他文档。
附图
为了描述能够获得上述和其他优点和特征的方式,以下将描述并通过参考附图中示出的各具体实施例来呈现更为具体的描述。可以理解,这些附图仅描述各典型实施例,从而不被认为是对其范围的限制,将通过使用附图用附加特征和细节来描述和说明各个实现。
图1示出了用于根据本发明的主题的一些实施例的示例性操作环境。
图2示出了可以实现根据本发明的主题的各实施例的示例性处理设备的功能框图。
图3示出了根据本发明的主题的各实施例中进行搜索的示例性文档模型。
图4是基于文档关联来执行搜索的示例性过程的流程图。
图5是基于文档关联来执行搜索的另一示例性过程的流程图。
图6示出了搜索结果的示例性显示,其中可以在视觉上指示关联强度。
图7示出了显示不同组文档之间关系的示例性显示。
详细描述
以下详细讨论各实施例。尽管讨论各个具体实现,但应当理解,这仅是出于说明的目的。相关领域的技术人员将认识到,可以使用其他组件和配置而不背离本发明的主题的精神和范围。
概览
根据本发明的主题的各实施例可提供一种用于基于文档关联来执行对所需文档的文档搜索的方法和处理设备。可例如基于一个或多个用户提供的关键字来执行初始搜索。然后可将搜索结果呈现给用户。该搜索结果可包括可包含该一个或多个用户提供的关键字的多个文档。
用户可以查看该搜索结果的一个或多个文档,并且可以决定一组文档与所需文档相似。用户可以选择该组文档,并且可呈现所选该组文档中共同的一个或多个关联的指示。用户可以选择这些关联中感兴趣的关联和/或这些关联中不感兴趣的其他关联。可以执行新的搜索,并且可向用户呈现包含一个或多个文档的新的搜索结果。该一个或多个文档可满足这些关联中所选的感兴趣的关联中的部分或全部,并且不满足这些关联中不感兴趣的任何其他关联。
用户可以选择该新的搜索结果中的一个或多个文档中的一些文档,以重复发现关联以及找到满足所选的感兴趣关联且不满足所选的不感兴趣的关联的文档的过程,直到找到所需文档。
在一些实施例中,用户可以选择搜索结果中的一个文档作为种子文档,并可以指示找到相似或者不相似文档的期望。该处理设备可分析该种子文档的特征,并且可显示包括一个或多个找到的相似或不相似文档的搜索结果。可提供一种视觉显示以指示找到的文档所具有的与该种子文档的关联强度。该关联强度可基于所找到的文档与该种子文档共享的特征的数目。
示例性操作环境
图1示出了根据本发明的主题的一些实施例可在其中操作的示例性操作环境100。示例性操作环境100可包括多个可通过网络102彼此通信的处理设备104、106。
网络102可以是单个网络或网络的组合,诸如例如,因特网或其他网络。网络102可包括无线网络、有线网络、分组交换网络、公共交换电信网络、光纤网络、其他类型的网络或以上网络的任何组合。
在一个实施例中,处理设备106可以是用户的处理设备,而处理设备104可以是提供网络服务的服务器或服务器农场。处理设备106可包括用于允许用户与处理设备104进行通信的浏览器或者其它应用程序。
用户可以通过处理设备106请求对所需文档的搜索。处理设备104可以接收该请求,执行搜索,并把搜索结果返回给处理设备106,处理设备106可以将搜索结果显示在显示屏上。
可选地,处理设备106可以是根据本发明的主题的独立实施例。即,用户可以向处理设备106输入搜索请求,处理设备106可以执行搜索并通过处理设备106的显示器来显示包括一个或多个文档的搜索结果。
示例性处理设备
图2示出可用于实现根据本发明的主题的各实施例的处理设备104和/或处理设备106的示例性处理设备200的功能框图。处理设备200可以是台式个人计算机(PC)、膝上型PC、手持式处理设备、服务器、服务器农场、或其它处理设备。处理设备200可包括总线210、输入设备220、存储器230、只读存储器(ROM)240、输出设备250、处理器260、存储设备270、以及通信接口280。总线210可以准许处理设备200的各组件之间的通信。
处理器260可以包括解释和执行指令的至少一个常规处理器或微处理器。存储器230可以是随机存取存储器(RAM)或存储供处理器260执行的信息和指令的另一种类型的动态存储设备。存储器230还可以存储在处理器260执行指令期间使用的临时变量或其他中间信息。ROM 240可以包括常规ROM设备或为处理器260存储静态信息和指令的另一种类型的静态存储设备。存储设备270可包括紧致盘(CD)、数字视频盘(DVD)、磁性介质、或用于为处理器260存储数据和/或指令的其他类型的存储设备。
输入设备220可包括键盘、定点设备、或其他输入设备。输出设备250可包括输出信息的一个或多个常规机制,包括一个或多个显示监视器或其他输出设备。通信接口280可包括用于通过一个或多个网络经由有线、无线、光纤、或其他连接通信的收发机。
处理设备200可响应于处理器260执行诸如例如存储器230、ROM 240、存储设备270或其他介质等有形机器可读介质中所包含的指令序列来执行这些功能。这些指令可从另一机器可读介质或经由通信接口280从单独的设备读入存储器230中。
示例性文档模型
图3示出了根据本发明的主题的各实施例的用于进行搜索的示例性文档模型。文档302可包括数码相片304、文字306、和/或其它项308。文档302可以通过关联310与一个或多个其它文件相关。关联310可以基于事件312、地点314、或其它项316。
举例说明,假定文档302是数码相片。第一数码相片可包括指示事件(诸如例如,“乔的生日”)的元数据。其它数码相片可包括指示该数码相片包括海滩的元数据。由于第一数码相片可以是在海滩上乔的生日派对所拍摄的,所以该第一数码相片可与包括海滩的其它数码相片相关联。此外,第一数码相片也可与在其它位置拍摄的乔的生日的其他数码照片相关联。
示例性过程
图4是示出可在根据本发明的主题的各实施例中执行的用于基于文档关联来执行搜索的示例性过程的流程图。该过程可开始于处理设备响应于接收搜索查询而执行搜索(动作402)。该搜索可基于包括在所接收的搜索查询中的一个或多个关键字。搜索设备可提供可以显示给用户的搜索结果(动作404)。该搜索结果可包括一个或多个文档的表示。
在一个独立的实施例中,处理设备可从用户接收搜索查询作为输入,并且可通过处理设备的输出设备,诸如例如,显示屏或其它输出设备,来呈现搜索结果。在于诸如例如示例性操作环境100等操作环境中执行的实施例中,处理设备可通过网络从第二处理设备接收搜索查询,可执行搜索,并可通过网络向第二处理设备提供搜索结果。第二处理设备可通过诸如例如显示屏或其它输出设备等输出设备来呈现所述搜索结果。
处理设备可接收对搜索结果中的至少一个文档的选择(动作406)。然后,处理设备可建立并呈现关于至少一个所选文档的至少一个关联(动作408)。例如,如果用户选择一组文档,则处理设备可确定所选的该组文档中共同的一个或多个关联,并可呈现或显示共同的一个或多个关联的指示。因而,如果所选的该组文档是海滩的数码相片,如可通过每一相应的数码相片的元数据或经由其他手段来确定的,则处理设备可呈现所选的该组数码相片与海滩相关联的指示。也可以指示其它关联。例如,如果所选的该组数码相片是在同一时期,诸如例如在2006年7月拍摄的,则处理设备可呈现所选的该组数码相片与2006年7月相关联的指示。
如果在动作406期间,处理设备接收到对搜索结果中的仅仅一个文档的选择,则在动作408期间,处理设备可通过与该文档相关联的元数据或经由其它手段来确定关于该文档的多个特征。例如,如果选择单个数码相片文档,则在动作408期间,处理设备可显示可被当作关联的各特征,诸如例如,“海滩照片”,“2006年7月拍摄”,和/或其它特征。
处理设备然后可以接收输入(动作410)。处理设备可以确定所接收的输入是否是关于一个或多个所显示的关联的感兴趣的指示(动作412)。如果所接收的输入是感兴趣的指示,则处理设备可保存感兴趣的关联(动作414),并且可以重复动作410。关于一个或多个关联的感兴趣的指示可以向所述处理设备指示要找到具有该一个或多个关联的期望。
如果在动作412期间处理设备确定所接收的输入不是感兴趣的指示,则处理设备可以确定所接收的输入是否是关于一个或多个所显示的关联的不感兴趣的指示(动作416)。如果所接收的输入是不感兴趣的指示,则处理设备可保存不感兴趣的关联(动作418),并且可以重复动作410。关于一个或多个关联的不感兴趣的指示可以向处理设备指示要找到不具有该一个或多个关联的期望。
作为可如何使用感兴趣的指示和不感兴趣的指示的一个示例,在根据本发明的主题的一个实施例中,假定搜索结果中表示的文档是与“乔的生日”相关联的数码相片。对一组数码相片的选择可使处理设备显示所选的该组数码相片中共同的关联,诸如例如,“海滩相片”、“乔的生日”和“2006年7月的相片”。处理设备可以接收关于“乔的生日”和“2006年7月的相片”的感兴趣的指示以及关于“海滩相片”的不感兴趣的指示。处理设备然后可以执行搜索,并呈现满足关联“乔的生日”和“2006年7月的相片”且不满足关联“海滩相片”的数码相片。
如果在动作416期间,处理设备确定所接收的输入不是不感兴趣的指示,则处理设备可以假定所接收的输入是执行搜索的命令。因此,处理设备可以在确定所接收的输入不是不感兴趣的指示之后执行搜索(动作420)。处理设备然后可以重复动作404并呈现新的搜索结果。
可以重复图4的示例性过程,直至找到一个或多个所需文档。在搜索过程期间的任何时间,用户可以中止并重新启动搜索过程。
图5是示出可在根据本发明的主题的各实施例中执行的用于基于文档关联来执行搜索的另一示例性过程的流程图。该过程可开始于处理设备响应于接收搜索查询来执行搜索(动作502)。搜索可基于包括在所接收到的搜索查询中的一个或多个关键字。处理设备可呈现可显示给用户的搜索结果(动作504)。该搜索结果可包括一个或多个文档的表示。
接着,处理设备可接收对搜索结果的一个或多个文档中的要用作种子文档的文档的选择,以及找出相似文档或不相似文档的请求(动作506)。处理设备然后可以通过与种子文档相关联的元数据或通过其它手段来确定关于种子文档的多个特征(动作508)。
处理设备然后可以确定所接收的请求是否是要搜索与种子文档相似的文档(动作510)。如果处理设备确定所接收的请求是要搜索与种子文档相似的文档,则处理设备可以执行找出具有至少一些所确定的特征的一个或多个文档的搜索(动作512)。否则,处理设备可以假定所接收的请求是要搜索与种子文档不相似的文档,并且处理设备可以执行找出缺少一个或多个所确定的特征的一个或多个文档的搜索(动作514)。处理设备可以呈现包括具有至少一些所确定的特征的至少一个文档的表示的搜索结果(如果搜索是针对相似文档执行的),或者处理设备可呈现包括缺少一个或多个所确定的特征的至少一个文档的表示的搜索结果(如果搜索是针对不相似文档执行的)(动作516)。处理设备然后可以重复动作506-514,直到找到所需文档。
相似性或不相似性可以分别是对于属于或不属于某一组的一般性度量。在一些实施例中,相似性或不相似性可以概率性地或通过模糊逻辑来确定。
图4和图5所示的过程是示例性的,并且可在不同实施例中实现,或者可以在一个实施例中相组合,诸如例如,用户可以通过选择所呈现的搜索结果中的一个或多个文档,查看关于所选的一个或多个文档的关联,并选择感兴趣的关联和/或不感兴趣的关联来请求对文档的搜索,或者用户可以从所呈现的搜索结果中选择一个文档并可请求对相似文档或不相似文档的搜索。
在文档之间建立关联
在根据本发明的主题的各实施例中,文档之间的一些关联可被自动建立,而文档之间的其它关联可被手动建立。处理设备可以自动检查一组文档的多个特征以试图自动建立一个或多个关联。同样,使用其中文档是数码相片的示例,处理设备可试图找到一组数码相片中共同的关联,这可通过例如以下动作来完成:在与数码相片相关联的元数据中寻找共同的文字,确定该组数码相片是否在一特定时期(诸如例如,一天、一个星期、一个月、或其它时期)拍摄,确定该组数码相片是否在同一位置拍摄(通过分析与数码相片相关联的元数据,分析随数码相片一起存储的全球定位***(GPS)数据,或经由其它手段),确定数码相片的特征,诸如例如一特定的人或一组人是否包括在数码相片中(通过使用面部识别***,或其它手段),或者通过检查与一组数码相片相关联的其它数据来确定其它关联。
在一个实施例中,可以手动在一组文档之间建立关联。参考其中一组文档可以是数码相片的示例,可定义具有诸如例如“2006年夏天假期”的名字的集合。集合可以是对一个或多个文档的用户定义的引用。用户可在名为“2006年夏天假期”的集合中包括多个文档,如数码相片。各文档可被包含在多个集合中。当处理设备试图建立一组文档中共同的关联时,处理设备可检查任何定义的集合来确定该组文档是否被包含在同一集合中。如果确定该组文档是在同一集合中,诸如例如,名为“2006年夏天假期”的集合,则处理设备可以显示“2006年夏天假期”是该组文档中共同的关联的指示。
示例性显示
在根据本发明的主题的一些实施例中,可以按指示关联强度或者其它关系的强度的方式来呈现搜索结果。例如,如对图5所示的示例性过程所讨论的,用户可以从搜索结果中选择一个文档作为种子文档,并提供该用户希望找到相似文档或不相似文档的指示。处理设备然后可以显示包括种子文档的位于中心的表示和所找到的各文档的表示的搜索结果,以便所显示的表示可提供关于与所选文档的关联强度的视觉指示。与所选文档的强关联可基于与种子文档共同的多个特征或通过其它准则来确定。例如,如果搜索是旨在找到相似文档,则当一个文档具有大量与种子文档共同的特征时可以确定强关联。如果搜索是旨在找到不相似文档,则当一个文档缺少大量与种子文档共同的特征时可以确定强关联。
图6示出了一个示例性显示,其中与种子文档具有较强关联的文档的表示以较大尺寸来显示。图6显示位于显示器中心的种子文档600的表示,该表示具有用于向用户通知种子文档的视觉指示。在图6的示例性显示中,种子文档600在视觉上用黑色边框和阴影来指示。在其它实施例中,任何数目和类型的视觉指示可向用户通知种子文档。
在图6中,文档604可与种子文档600具有最强关联,接下来是文档606。文档602和608可与所选文档具有相同强度的关联。在图6中,所显示的各文档的表示可被称为岛。在其它实施例中,文档可用其它手段来表示。
当然,可提供其它视觉指示,诸如例如,使用不同颜色来显示各文档的表示。例如,一种颜色可以指示与所选文档的很强的关联,另一种颜色可指示与所选文档的弱关联,第三种颜色可指示与所选文档的非常弱的关联或者无关联。在其它实施例中,其它视觉指示,诸如例如,尺寸、亮度、距离、顺序、以及其它视觉指示,可指示与所选文档的关联的相关性和强度。其它视觉指示,诸如例如,颜色、分组/聚类、和不透明度可指示某些关系。上述视觉指示的示例仅仅是示例性的,并不旨在限定视觉指示的类型或者视觉指示所表示的关系的类型。
在一些实施例中,处理设备可以响应于接收到呈现包括在一个组或集合中的文档的请求而显示包括在该组或集合中的文档的表示。用户可请求查看一个组或集合与一个或多个其它组或集合之间的关系。例如,假定文档是数字图像,可在处理设备的显示屏上呈现一组属于称为“海滩相片”的集合的数字图像。用户可请求查看有关称为“海滩相片”的集合如何与其它集合相关的信息。作为接收该请求的结果,处理设备可显示包括在名为“海滩相片”的集合中的数码相片的表示,和包括在一个或多个与名为“海滩相片”的集合有某种关系的其它集合中的数码相片的表示。
图7示出了显示属于名为“海滩相片”的集合700的文档702、704、706、708的示例性显示。该示例性显示还显示属于名为“在法国的相片”的集合720的文档702、704、710、712。如图7所示,可提供关于哪些文档被包括在哪些组中的指示。在图7中,该指示包括环绕包括在相应组中的文档的线。如可通过查看图7的示例性显示来容易地确定的,文档702、704既被包括在集合700中又被包括在集合720中。在各实施例中,可以显示多于两个集合和与其它集合的关系。例如,参考图7,还可以显示与集合720或集合700相关的其它集合。
杂项
在上述各示例中,假定文档为数码相片。这仅仅是为了示出简单的示例。因而,在根据本发明的主题的各实施例中,文档不仅限于是数码相片。例如,文档可包括文本、音频、演示文稿、视频、或其它信息。此外,在其它实施例中可建立不同类型的关联。例如,在执行对文本文档的搜索的一个实施例中,可基于出现在文本文档中的某些文字、词组、或其它信息来建立关联。
结论
尽管用对结构特征和/或方法动作专用的语言描述了本主题,但可以理解,所附权利要求书中的主题不必限于上述具体特征或动作。相反,上述具体特征和动作是作为实现权利要求的示例形式公开的。
虽然以上描述可包含具体细节,但决不应将其解释为是对权利要求的限制。所述各实施例的其他配置也是本发明的范围的一部分。此外,根据本发明的主题的各个实现可以具有比所描述的更多或更少动作,或者可以按与所示出的顺序不同的顺序来实现各个动作。因此,所附权利要求书及其合法的等效技术方案定义本发明,而非任何给出的具体示例。

Claims (20)

1.一种用于搜索文档的机器实现的方法,所述机器实现的方法包括:
接收对一呈现的搜索结果中的至少一个第一文档的选择(406);
建立并呈现关于所述至少一个第一所选文档的至少一个关联(408);
接收与所述至少一个关联中的至少一个有关的感兴趣的指示,或接收与所述至少一个关联中的至少一个有关的不感兴趣的指示(410、412、416);以及
当接收到所述感兴趣的指示时,呈现包括具有所述至少一个关联中对应于所述感兴趣的指示的至少一个的至少一个第二文档的下一搜索结果(414、420、404),或者当接收到所述不感兴趣的指示时,呈现包括不具有所述至少一个关联中对应于所述不感兴趣的指示的至少一个的至少一个第二文档的下一搜索结果(418、420、404)。
2.如权利要求1所述的机器实现的方法,其特征在于,关联基于文档元数据。
3.如权利要求1所述的机器实现的方法,其特征在于,呈现在所述搜索结果中的文档是数码相片。
4.如权利要求1所述的机器实现的方法,其特征在于,还包括:
允许建立多个文档之间的手动关联。
5.如权利要求1所述的机器实现的方法,其特征在于,还包括:
自动建立多个文档之间的关联。
6.如权利要求1所述的机器实现的方法,其特征在于,还包括:
接收寻找与选自最近呈现的搜索结果的种子文档相似或者不相似的文档的请求;以及
将一新的下一搜索结果呈现为多个岛,所述多个岛中的每个岛代表多个文档中的相应的一个文档,所述多个岛中的相应的各个岛的尺寸对应于所述多个文档中的相应的一个文档与所述种子文档的关联强度。
7.如权利要求1所述的机器实现的方法,其特征在于,还包括:
图形地指示至少两组文档之间的关联。
8.一种处理设备,包括:
至少一个处理器(260);以及
连接到所述至少一个处理器的存储器(230),所述存储器包括用于所述至少一个处理器的指令,所述指令包括:
用于提供包括第一多个文档的第一搜索结果的指令,所述第一搜索结果是响应于接收第一搜索查询来提供的(404),
用于接收对所述第一多个文档中的至少一个文档的选择的指令(406),
用于提供所选的至少一个文档中共同的至少一个关联的指令(408),
用于接收对所述共同的至少一个关联中的至少一个的选择的指令(410、412、416),
用于接收关于所述共同的至少一个关联中所选的至少一个的感兴趣的指示或者接收关于所述共同的至少一个关联中所选的至少一个的不感兴趣的指示的指令(412、416),
用于在接收到感兴趣的指示时提供包括具有所述共同的至少一个关联中所选的至少一个的第二文档的第二搜索结果的指令(414、420、404),以及
用于在接收到不感兴趣的指示时提供包括不具有所述共同的至少一个关联中所选的至少一个的第二文档的第二搜索结果的指令(418、420、404)。
9.如权利要求8所述的处理设备,其特征在于,搜索结果中提供的文档是数码相片。
10.如权利要求8所述的处理设备,其特征在于,所述指令还包括:
用于接收寻找与选自最近呈现的搜索结果的种子文档相似或者不相似的文档的请求的指令;以及
用于将新的搜索结果呈现为多个岛的指令,所述多个岛中的每个岛代表多个文档中的相应的一个文档,所述多个岛中的相应的各个岛的颜色对应于所述多个文档中的相应的一个文档与选自最近呈现的搜索结果的所述种子文档的关联强度。
11.如权利要求8所述的处理设备,其特征在于,多个文档之间的某些关联是自动建立的,而所述多个文档之间的其他关联是手动建立的。
12.如权利要求8所述的处理设备,其特征在于,所述指令还包括:
用于基于相应文档元数据并基于相应的各个文档所属的一个或多个集合来建立文档之间的关联的指令。
13.如权利要求8所述的处理设备,其特征在于,:
搜索结果中包括的文档是数码相片,并且
所述指令还包括:
用于基于所述数码相片的一个或多个特征来建立多个文档之间的关联的指令。
14.一种用于搜索文档的机器实现的方法,所述机器实现的方法包括:
基于至少一个所提供的关键字来提供第一搜索结果,所述第一搜索结果包括多个文档(502、504);
接收对所述第一搜索结果的多个文档中的一个文档的选择以及寻找相似文档的请求(506);
确定所述多个文档中所选的一个文档的特征(508);
执行搜索以寻找具有所述多个文档中所选的一个文档的至少一些所确定的特征的至少一个文档(512);以及
呈现包括具有所述多个文档中所选的一个文档的至少一些所确定的特征的至少一个文档的第二搜索结果(516)。
15.如权利要求14所述的机器实现的方法,其特征在于,还包括:
接收对第三搜索结果的多个文档中的至少一个文档的选择;
确定并呈现对所接收到的对所述第三搜索结果的多个文档中的至少一个文档的选择共同的所有关联;
接收关于各关联中感兴趣的关联和各关联中不感兴趣的其他关联的至少一个指示;以及
提供包括多个文档的第四搜索结果,所述第四搜索结果的多个文档的每个文档具有各关联中感兴趣的至少一个关联且不具有各关联中不感兴趣的任何关联。
16.如权利要求15所述的机器实现的方法,其特征在于,还包括:
自动建立至少一些所述关联。
17.如权利要求15所述的机器实现的方法,其特征在于,还包括:
手动建立至少一些所述关联。
18.如权利要求15所述的机器实现的方法,其特征在于,还包括:
通过将各个文档建立为一个或多个集合的一部分来手动建立至少一些所述关联。
19.如权利要求15所述的机器实现的方法,其特征在于,还包括:
图形地呈现所述第二搜索结果,在视觉上指示所述第二搜索结果的各个文档与所述第一结果的所述多个文档中所选的一个文档之间的关联强度。
20.如权利要求15所述的机器实现的方法,其特征在于,所述多个文档中的每个文档是数码相片。
CN2009801061372A 2008-02-21 2009-01-23 基于文档关联的搜索 Pending CN101952826A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/035,408 US20090216734A1 (en) 2008-02-21 2008-02-21 Search based on document associations
US12/035,408 2008-02-21
PCT/US2009/031881 WO2009105307A1 (en) 2008-02-21 2009-01-23 Search based on document associations

Publications (1)

Publication Number Publication Date
CN101952826A true CN101952826A (zh) 2011-01-19

Family

ID=40985865

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009801061372A Pending CN101952826A (zh) 2008-02-21 2009-01-23 基于文档关联的搜索

Country Status (6)

Country Link
US (1) US20090216734A1 (zh)
EP (1) EP2245557A1 (zh)
JP (1) JP2011513815A (zh)
KR (1) KR20100114082A (zh)
CN (1) CN101952826A (zh)
WO (1) WO2009105307A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102737027A (zh) * 2011-04-01 2012-10-17 腾讯科技(深圳)有限公司 个性化搜索方法及***
WO2018121153A1 (zh) * 2016-12-29 2018-07-05 北京国双科技有限公司 一种裁判文书的检索方法及装置

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9536221B2 (en) * 2008-06-19 2017-01-03 Plentyoffish Media Ulc System and method for adaptive matching of user profiles based on viewing and contact activity for social relationship services
US9537706B2 (en) 2012-08-20 2017-01-03 Plentyoffish Media Ulc Apparatus, method and article to facilitate matching of clients in a networked environment
US9679259B1 (en) 2013-01-25 2017-06-13 Plentyoffish Media Ulc Systems and methods for training and employing a machine learning system in evaluating entity pairs
US11568008B2 (en) 2013-03-13 2023-01-31 Plentyoffish Media Ulc Apparatus, method and article to identify discrepancies between clients and in response prompt clients in a networked environment
US9672289B1 (en) 2013-07-23 2017-06-06 Plentyoffish Media Ulc Apparatus, method and article to facilitate matching of clients in a networked environment
US9542477B2 (en) 2013-12-02 2017-01-10 Qbase, LLC Method of automated discovery of topics relatedness
US9355152B2 (en) 2013-12-02 2016-05-31 Qbase, LLC Non-exclusionary search within in-memory databases
US9336280B2 (en) * 2013-12-02 2016-05-10 Qbase, LLC Method for entity-driven alerts based on disambiguated features
US9201744B2 (en) 2013-12-02 2015-12-01 Qbase, LLC Fault tolerant architecture for distributed computing systems
US9430547B2 (en) 2013-12-02 2016-08-30 Qbase, LLC Implementation of clustered in-memory database
US9177262B2 (en) 2013-12-02 2015-11-03 Qbase, LLC Method of automated discovery of new topics
US9424294B2 (en) 2013-12-02 2016-08-23 Qbase, LLC Method for facet searching and search suggestions
US9025892B1 (en) 2013-12-02 2015-05-05 Qbase, LLC Data record compression with progressive and/or selective decomposition
US9317565B2 (en) 2013-12-02 2016-04-19 Qbase, LLC Alerting system based on newly disambiguated features
US9547701B2 (en) 2013-12-02 2017-01-17 Qbase, LLC Method of discovering and exploring feature knowledge
US9659108B2 (en) 2013-12-02 2017-05-23 Qbase, LLC Pluggable architecture for embedding analytics in clustered in-memory databases
US9348573B2 (en) 2013-12-02 2016-05-24 Qbase, LLC Installation and fault handling in a distributed system utilizing supervisor and dependency manager nodes
US9870465B1 (en) 2013-12-04 2018-01-16 Plentyoffish Media Ulc Apparatus, method and article to facilitate automatic detection and removal of fraudulent user information in a network environment
US10540607B1 (en) 2013-12-10 2020-01-21 Plentyoffish Media Ulc Apparatus, method and article to effect electronic message reply rate matching in a network environment
US10108968B1 (en) 2014-03-05 2018-10-23 Plentyoffish Media Ulc Apparatus, method and article to facilitate automatic detection and removal of fraudulent advertising accounts in a network environment
US10387795B1 (en) 2014-04-02 2019-08-20 Plentyoffish Media Inc. Systems and methods for training and employing a machine learning system in providing service level upgrade offers
US9836533B1 (en) 2014-04-07 2017-12-05 Plentyoffish Media Ulc Apparatus, method and article to effect user interest-based matching in a network environment
US20210165829A1 (en) * 2018-07-23 2021-06-03 Google Llc Intelligent serendipitous document discovery notifications
US20220253470A1 (en) * 2021-02-05 2022-08-11 SparkCognition, Inc. Model-based document search

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07146871A (ja) * 1993-11-24 1995-06-06 Hitachi Ltd 静止画検索装置および静止画検索方法
US6208988B1 (en) * 1998-06-01 2001-03-27 Bigchalk.Com, Inc. Method for identifying themes associated with a search query using metadata and for organizing documents responsive to the search query in accordance with the themes
US6292796B1 (en) * 1999-02-23 2001-09-18 Clinical Focus, Inc. Method and apparatus for improving access to literature
AU2000233265A1 (en) * 2000-03-23 2001-10-03 Mitsubishi Denki Kabushiki Kaisha Image retrieval/distribution system and image retrieval/distribution method
DE10032225A1 (de) * 2000-07-03 2002-01-17 Pixfind Com Gmbh Verfahren und Vorrichtung zur automatischen Suche relevanter Bilddatensätze
US20020184196A1 (en) * 2001-06-04 2002-12-05 Lehmeier Michelle R. System and method for combining voice annotation and recognition search criteria with traditional search criteria into metadata
US6865568B2 (en) * 2001-07-16 2005-03-08 Microsoft Corporation Method, apparatus, and computer-readable medium for searching and navigating a document database
US20030130993A1 (en) * 2001-08-08 2003-07-10 Quiver, Inc. Document categorization engine
US7260773B2 (en) * 2002-03-28 2007-08-21 Uri Zernik Device system and method for determining document similarities and differences
US7054859B2 (en) * 2002-06-13 2006-05-30 Hewlett-Packard Development Company, L.P. Apparatus and method for responding to search requests for stored documents
US7085755B2 (en) * 2002-11-07 2006-08-01 Thomson Global Resources Ag Electronic document repository management and access system
US7283997B1 (en) * 2003-05-14 2007-10-16 Apple Inc. System and method for ranking the relevance of documents retrieved by a query
US7228301B2 (en) * 2003-06-27 2007-06-05 Microsoft Corporation Method for normalizing document metadata to improve search results using an alias relationship directory service
US7181445B2 (en) * 2003-09-05 2007-02-20 Bellsouth Intellectual Property Corporation Aggregating, retrieving, and providing access to document visuals
US7158966B2 (en) * 2004-03-09 2007-01-02 Microsoft Corporation User intent discovery
KR101222294B1 (ko) * 2004-03-15 2013-01-15 야후! 인크. 사용자 주석이 통합된 검색 시스템 및 방법
US7539669B2 (en) * 2005-02-07 2009-05-26 Sap Ag Methods and systems for providing guided navigation
CA2545237A1 (en) * 2005-07-29 2007-01-29 Cognos Incorporated Method and system for managing exemplar terms database for business-oriented metadata content
US20070078832A1 (en) * 2005-09-30 2007-04-05 Yahoo! Inc. Method and system for using smart tags and a recommendation engine using smart tags
US7412534B2 (en) * 2005-09-30 2008-08-12 Yahoo! Inc. Subscription control panel
US8977603B2 (en) * 2005-11-22 2015-03-10 Ebay Inc. System and method for managing shared collections
US7644072B2 (en) * 2006-01-31 2010-01-05 Perfect Market, Inc. Generating a ranked list of search results via result modeling
US8842818B2 (en) * 2006-06-30 2014-09-23 Avaya Inc. IP telephony architecture including information storage and retrieval system to track fluency
US8065601B2 (en) * 2006-08-03 2011-11-22 Apple Inc. System and method for tagging data
US20080070697A1 (en) * 2006-09-15 2008-03-20 Icebreaker, Inc. Social interaction games and activities
US7953736B2 (en) * 2007-01-04 2011-05-31 Intersect Ptp, Inc. Relevancy rating of tags
US20100088726A1 (en) * 2008-10-08 2010-04-08 Concert Technology Corporation Automatic one-click bookmarks and bookmark headings for user-generated videos

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102737027A (zh) * 2011-04-01 2012-10-17 腾讯科技(深圳)有限公司 个性化搜索方法及***
CN102737027B (zh) * 2011-04-01 2016-08-31 深圳市世纪光速信息技术有限公司 个性化搜索方法及***
WO2018121153A1 (zh) * 2016-12-29 2018-07-05 北京国双科技有限公司 一种裁判文书的检索方法及装置
US11288326B2 (en) 2016-12-29 2022-03-29 Beijing Gridsum Technology Co., Ltd. Retrieval method and device for judgment documents

Also Published As

Publication number Publication date
KR20100114082A (ko) 2010-10-22
US20090216734A1 (en) 2009-08-27
EP2245557A1 (en) 2010-11-03
JP2011513815A (ja) 2011-04-28
WO2009105307A1 (en) 2009-08-27

Similar Documents

Publication Publication Date Title
CN101952826A (zh) 基于文档关联的搜索
US12032518B2 (en) Context-based file selection
US7668838B2 (en) Providing event information to third party event applications
US7565175B2 (en) Mobile information services
US8412794B2 (en) Mobile integration of user-specific institutional content
US7676449B2 (en) Creating and viewing private events in an events repository
US20080222097A1 (en) Apparatus, system, and method for an inline display of related blog postings
CN1991842B (zh) 用于管理移动终端的图像的装置和方法
US20120150845A1 (en) System and Method for Collapsing Search Results
US11651039B1 (en) System, method, and user interface for a search engine based on multi-document summarization
CN102147665A (zh) 一种在输入过程中展现信息的方法、装置和输入法***
US20130226999A1 (en) Method, system and program product for interaction between users
JP5615779B2 (ja) ファイル共有システム、分析サーバ及びファイル共有方法
CN103399886A (zh) 数字图书馆的实现方法
US11216894B2 (en) Image-based semantic accommodation search
Dunlop et al. Design and development of Taeneb city guide-from paper maps and guidebooks to electronic guides
US20150079575A1 (en) Method and System for Facilitating Discussion of Issues Pertaining to Subject Matter Taught By A Course
Xue et al. Review of research on knowledge domains in university governance: Mapping literature in English and Chinese
Yoon et al. Context-aware photo selection for promoting photo consumption on a mobile phone
Martin et al. User centric design and implementation of a digital historic costume collection
US20230315685A1 (en) System and method for digital information management
Johnson et al. Improving Diversity in Journalistic Sources with Computer Vision
Su Deep learning based approach to image deblurring and super-resolution
US20150319129A1 (en) Method of Providing a Location-Based Social Media and Networking Application by Executing Computer-Executable Instructions Stored On a Non-Transitory Computer-Readable Medium
Morgan Correlation and Causation: Income Inequality and Entrepreneurship

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110119