CN1979484A - 基于文档的信息和统一资源定位符管理方法和设备 - Google Patents

基于文档的信息和统一资源定位符管理方法和设备 Download PDF

Info

Publication number
CN1979484A
CN1979484A CNA2006101432760A CN200610143276A CN1979484A CN 1979484 A CN1979484 A CN 1979484A CN A2006101432760 A CNA2006101432760 A CN A2006101432760A CN 200610143276 A CN200610143276 A CN 200610143276A CN 1979484 A CN1979484 A CN 1979484A
Authority
CN
China
Prior art keywords
document
source document
links
documents
link
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006101432760A
Other languages
English (en)
Other versions
CN100462972C (zh
Inventor
布莱恩·P·沃伦菲尔特
理查德·M·泰斯
扎卡里·A·加鲍
蒂莫西·P·克拉克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1979484A publication Critical patent/CN1979484A/zh
Application granted granted Critical
Publication of CN100462972C publication Critical patent/CN100462972C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明允许用户动态地管理在承载一个或者多个链接的文档内的历史数据,并且保持由这些链接定义的关系。本发明不仅跟踪从源文档到目的文档的链接,而且还跟踪从目的文档回到源文档的链接,基于这些链接的内容/命名以分级方式组织这些链接,并且以实时和有意义的方式向用户显示该链接信息。

Description

基于文档的信息和统一资源定位符管理方法和设备
技术领域
本发明一般涉及文档管理,尤其涉及跟踪和组织在历史文档之间的链接。
背景技术
1948年EDVAC计算机的研制经常被引证为计算机时代的开始。从那以来,计算机***已经发展成非常复杂的设备,而且可以在许多不同的装置中找到计算机***。计算机***一般包括诸如半导体和电路板之类的硬件和也称为计算机程序的软件的组合。
每天,计算机用户面临着管理几十封电子邮件消息、在他们个人计算机和服务器上的数以千计的文件、以及数十亿个网页并从中检索信息的令人畏惧的任务。管理这些来自大量来源的数不胜数的信息是困难和费时的任务。
利用我们今天工作的互连本性,这些信息源中的许多经由链接彼此相连并且连接到其它参考。这样的链接的主要示例是统一资源定位符(URL)。统一资源定位符提供了在万维网上的文档和其它资源的全局地址。该地址的第一部分指示使用什么协议,第二部分指定该资源所位于的IP地址或者域名。因此,URL暗示了在源文档和目的文档之间的重要关系。
当前,管理这些关系的唯一方法是通过诸如GoogleTM Desktop Search或者GoogleTM Pagerank之类的搜索算法/产品。然而,这样的解决方案具有重大的欠缺,其中它们仅仅有助于在输入一个或多个关键字之后识别文件。当从这样的工具接收了结果时,仍难以跟踪哪些文档包含哪些链接(URL)。另外,记住每个链接(URL)的引用位置并且找到其相关文档是个难题。以相关的呈现形式人工地组织和保存全部链接(URL)在当前几乎是不可能的。
需要有一种较好的技术来帮助用户动态地管理在承载一个或多个链接的文档之内或者之间的历史数据、以及保持由这些链接所定义的关系。该技术需要不仅跟踪从源文档到目的文档的链接,还跟踪从目的文档回到源文档的链接,基于这些链接的内容/命名以分级方式组织这些链接,并且以实时和有意义的方式向用户显示该链接信息。
发明内容
本发明提供了用于管理在承载一个或多个链接的文档之内或者之间的历史数据、并且保持由这些链接定义的关系的方法、设备和程序产品。本发明不仅从源文档到目的文档跟踪这个信息,而且从目的文档回到源文档跟踪这个信息。
更具体而言,本发明提供了一种用于管理在多个文档内的链接的方法。该方法从打开从多个文档中选择的源文档开始,扫描该源文档以便获得文档链接,并且对于每个找到的文档链接、将指示该源文档名称和文档链接的项目添加到链接数据库中。在一个实施例中,该方法然后对于任何相关的关键字扫描由该文档链接所指向的文档,然后如果找到任何文档,则经由关键字项目将该相关关键字包含到该链接数据库中。关键字项目包含关键字本身、源文档名称、文档中的包含相关关键字的文档链接。在一个实施例中,本发明然后分析该源文档以便获得相关关键字,在该链接数据库内的关键字项目中搜索从该源文档中分析出的相关关键字的任何出现,并且创建包含与从该源文档中分析出的相关关键字相匹配的关键字的文档列表。然后向用户呈现包含与从源文档中分析出的相关关键字相匹配的关键字的文档列表(例如,经由临时书签文件夹或者分屏视图)。
在另一个实施例中,本发明在链接数据库内的文档链接项目中搜索当前源文档的任何出现,然后为每个找到的项目创建反向引用链接,并且然后向用户呈现(例如,经由临时书签文件夹或者分屏视图)。
由本发明使用的源文档可以采用许多形式,包括但不限于字处理器文档、可移植文档格式(PDF)文件、电子邮件、网站、即时消息和电子笔记。
本发明还可以基于源文档的结构、以分级方式组织源文档内的文档链接。在一个实施例中,本发明通过以下步骤来实现这个目的:创建基础书签文件夹;分析源文档的结构以便确定文档链接的逻辑分组;基于文档链接的逻辑分组创建链接类别;分析源文档和链接内容以便获得相关关键字;以及基于链接子类别向基础书签文件夹创建书签子文件夹,其中每个书签子文件夹的名称基于相关的关键字。
附图说明
在下文中结合附图描述本发明的各种实施例:
图1描述了用于实现本发明实施例的示例***的高级框图。
图2说明了根据本发明、用于创建和保持历史文档之间的链接的方法的流程图。
图3说明了根据本发明、用于从链接数据库中提取有用信息并且向用户呈现该有用信息的流程图。
图4说明了本发明对其进行操作的文档示例。
图5说明了根据本发明的链接数据库的一个实施例。
图6说明了本发明对其进行操作的示范网站。
图7是根据本发明、用于组织和分级地书签标记给定文档内到各个网站的多个链接(URL)的方法的流程图。
图8说明了根据本发明、在图4中的源文档,其中在该源文档内的链接被分级地书签标记和组织了。
然而应当注意到,附图仅仅说明了本发明的示例实施例,而且因此其不被认为对本发明范围的限制,因为本发明可以允许其它同样有效的实施例。
具体实施方式
参见附图,其中类似的数字在几个附图中都表示类似的部分。图1描述了根据本发明的实施例、经由网络130连接到客户端132的计算机***100的高级框图表示。计算机***100的主要部件包括一个或多个处理器101、主存储器102、终端接口111、存储设备接口112、I/O(输入/输出)设备接口113、和通信/网络接口114,所有这些经由存储器总线103、I/O总线104、和I/O总线接口单元105相连接以用于部件间通信。
计算机***100包含一个或多个可编程中央处理单元(CPU)101A、101B、101C、和101D,此处将它们总称为处理器101。在实施例中,计算机***100包含相对大的***特有的多个处理器;然而在另一个实施例中,做为选择,计算机***100可以是单个CPU***。每个处理器101执行存储在主存储器102中的指令并且可以包括一或多级芯片内高速缓存。
主存储器102是用于储存数据和程序的存储器。主存储器102在概念上是单个单一体,但是在其它实施例中,主存储器102为更复杂的配置,诸如高速缓存和其它存储设备的分级结构。例如,存储器102可以以多极高速缓存的形式存在,而且这些高速缓存可以进一步由功能划分,以便一个高速缓存保持指令同时另一个保持由一个或者多个处理器使用的非指令数据。如在任意各种所谓的不均匀存储器存取(NUMA)计算机体系结构中所知的那样,存储器可以进一步分布并且与不同的CPU或者CPU组相关联。
存储器102包含链接管理器150、链接数据库152、和用户接口页面154。虽然将链接管理器150、链接数据库152、和用户接口页面154图示说明为包含在计算机***100中的存储器102内,但是在其它实施例中,它们中的一些或者全部可以在不同的计算机***上(例如,在客户端132上),而且可以例如经由网络130远程访问。计算机***100可以使用虚拟寻址机制,其允许计算机***100中的程序好象它们仅仅访问了大的、单一的存储设备实体而不是访问多个、较小的存储设备实体那样运转。因此,虽然将链接管理器150、链接数据库152、和用户接口页面154图示说明为包含在主存储器102内,但是这些单元不必全部完全同时包含在同一存储设备中。
在一个实施例中,链接管理器150包括能够在处理器101上执行的指令或者能够由在处理器101上执行的指令解释的语句,以便执行如下参考图2-8进一步描述的功能。在另一个实施例中,链接管理器150可以以微码的形式实现。在另一实施例中,链接管理器150可以经由逻辑门和/或其它恰当的硬件技术、以硬件形式实现。
存储器总线103提供了数据通信通路,以便在处理器101、主存储器102、和I/O总线接口单元105之间传输数据。I/O总线接口单元105还连接到***I/O总线104,以便向和从各种I/O单元传输数据。I/O总线接口单元105通过***I/O总线104与又称为I/O处理器(IOP)或者I/O适配器(IOA)的多个I/O接口单元111、112、113、和114进行通信。***I/O总线104可以是,例如工业标准PCI总线,或者任何其它适当的总线技术。
I/O接口单元支持与各种存储器和I/O设备的通信。例如,终端接口单元111支持一或多个用户终端121、122、123、和124的附着。存储器接口单元112支持一个或多个直接存取存储设备(DASD)125、126、和127的附着(它们一般为旋转磁盘驱动存储设备,但是做为选择它们可以是其它设备,包括被配置成表现为作为到主机的单个大容量存储设备的盘驱动器阵列)。主存储器102的内容可以存储到直接存取存储设备125、126、和127中,以及从中检索得到。
I/O及其它设备接口113提供了到任何各种其它输入/输出设备或者其它类型设备的接口。在图1的示范实施例中示出了两个这样的设备,打印机128和传真机129,但是在其它的实施例中,可以存在不同类型的许多其它这样的设备。网络接口114提供了从计算机***100到其它数字设备和计算机***的一条或多条通信路径;这样的路径可以包括,例如一个或多个网络130。
虽然存储器总线103在图1中显示为相对简单的单条总线结构,其提供了在处理器101、主存储器102、和I/O总线接口105之间的直接通信路径,但是事实上,存储器总线103可以包含多种不同的总线或者通信路径,其可以以诸如分级的点对点链接、星形或者网形配置、多分级总线、平行以及冗余通路等各种形式中的任意方式来布置。此外,虽然I/O总线接口105和I/O总线104被示为单个相应的单元,但是计算机***100实际上可以包含多个I/O总线接口单元105和/或多条I/O总线104。虽然示出了多个I/O接口单元,其把***I/O总线104与到各个I/O设备的各种通信路径分离,但是在其它实施例中,一些或者全部I/O设备直接连接到一条或者多条***I/O总线。
图1所述的计算机***100具有多个附接的终端121、122、123、和124,例如通常可以是多用户“大型机”计算机***特有的。通常,在这种情况下,虽然本发明不局限于任何特定大小的***,但是所附接的设备的实际数目大于图1所示的那些。做为选择,计算机***100可以是通常仅仅包含单个用户显示器和键盘输入的单用户***,或者可以是几乎没有直接用户接口、但是从其它计算机***(客户端)接收请求的服务器或者类似设备。在其它实施例中,计算机***100可以实现为个人计算机、便携式计算机、膝上或者笔记本计算机、PDA(个人数字助理)、写字板式计算机、袖珍计算机、电话、传呼机、汽车、远程会议***、器具、或者任何其它适当类型的电子设备。
网络130可以是任何适当的网络或者网络的组合,并且可以支持任何适于向/从计算机***100发送数据和/或代码的适当协议。在各种实施例中,网络130可以表示直接或者间接地连接到计算机***100的存储设备或者存储设备的组合。在一实施例中,网络130可以支持Infiniband。在另一实施例中,网络130可以支持无线通信。在另一实施例中,网络130可以支持诸如电话线或者电缆之类的硬接线通信。在另一实施例中,网络130可以支持以太网IEEE(电气与电子工程师协会)802.3x规范。在另一实施例中,网络130可以是Intemet并且可以支持IP(网际协议)。在另一实施例中,网络130可以是局域网(LAN)或者广域网(WAN)。在另一实施例中,网络130可以是热点服务提供者网络。在另一实施例中,网络130可以是内部网。在另一实施例中,网络130可以是GPRS(通用分组无线业务)网络。在另一实施例中,网络130可以是FRS(家庭无线业务)网络。在另一实施例中,网络130可以是任何适当的蜂窝式数据网络或者基于小区的无线电网络技术。在另一实施例中,网络130可以是IEEE 802.11B无线网络。在还有的另一实施例中,网络130可以是任何适当的网络或者网络组合。虽然示出了一个网络130,但是在其它实施例中,可以存在任何数量(包括零个)(相同或者不同类型)的网络。
客户端132包括浏览器134。浏览器134下载用户接口页面154,解释该用户接口页面154中的控制标记和数据,并且执行或者解释驻留在该用户接口页面154内的脚本156。浏览器134和脚本156可以包括下述的指令和语句,这些指令和语句在客户端132能够在未说明的、类似于处理器101的处理器上执行,或者由在该未说明的处理器上执行的指令解释,以便执行如下面参考图2-8进一步描述的功能。在一实施例中,脚本156经由JavaScript实现,但是在其它实施例中,脚本156可以经由小程序(applet)、XML(可扩展标记语言)文档、或者任何其它适当的语言或者协议实现。用户接口页面154可以经由HTML(超级文本标记语言)、XML、或者任何其它适当的标记语言实现。客户端132还可以包括任何或者全部先前在上面对于计算机***100所描述的硬件和/或软件单元。
尽管将浏览器134、链接管理器150、链接数据库152、用户接口页面154、和脚本156说明为是分离的单元,但是在其它实施例中,可以组合它们中的一些或者全部功能。例如,在一实施例中,没有给出或者使用浏览器134、用户接口页面154、和脚本156的一些或者全部,而且它们的功能由链接管理器150执行。链接管理器150还可以直接与浏览器134、或者由浏览器使用的文件(例如,书签文件,或者其它类型用户定义的菜单项)进行交互。
应当理解:图1意图在较高层次描述计算机***100、网络130、和客户端132的代表性主要部件,其中的单个部件可以具有比图1所示更大的复杂度,而且可以存在不同于图1所示的那些或者除图1所示的那些之外的部件,而且这样的部件的数目、类型、和配置可以改变。此处公开了这样的附加复杂度或者附加变化的几个具体示例;应当理解:这些仅仅是示例的方式而且不是必须仅仅有这样的变化。
图1所示并且实现了本发明的各种实施例的各种软件部件可以多种方式实现,包括使用在下文中被称为“计算机程序”或者简单地称为“程序”的各种计算机软件应用、例程、部件、程序、对象、模块、数据结构等。计算机程序一般包含在各个时间驻留在计算机***100的各个存储器和存储设备中的一条或多条指令,而且当由计算机***100和/或客户端132中的一个或多个处理器101读取和执行这些指令时,导致计算机***100和/或客户端132执行在执行组成本发明的实施例的各个方面的步骤或者单元时所必需的步骤。
此外,本发明的实施例已经并且将在下文中在完全起作用的计算机***的环境中描述,但是本发明的各个实施例能够以各种形式作为程序产品来分配,而且可以同样地应用本发明而与用于实际执行该分配的信号承载介质的具体类型无关。可以经由各种信号承载介质将定义这个实施例功能的程序递送给计算机***100和/或客户端132,该信号承载介质包括但不局限于:
(1)永久地存储在不可重写存储介质中的信息,该不可重写存储介质例如为诸如CD-ROM、DVD-R、或者DVD+R之类、附加到计算机***或者在计算机***内的只读存储设备;
(2)存储在如硬盘驱动器(例如,DASD 125、126、或者127)、CD-RW、DVD-RW、DVD+RW、DVD-RAM、或者磁盘之类的可重写存储介质上的可变信息;或者
(3)由通信介质传送的信息,诸如通过计算机或者例如网络130之类的电话网络,包括无线通信。
这样的信号承载介质,当携带指示本发明功能的机器可读指令时,代表本发明的实施例。
此外,此处描述的各种程序可以基于这些程序在本发明的特定实施例中所实现的应用进行标识。但是,下述的任何特定程序术语仅仅为了方便而使用,而且因此,本发明的实施例将不应局限于在由这样的术语标识和/或暗示的特定应用中使用。
图1所述的示范环境不是用于限制本发明。实际上,可以使用其它可选的硬件和/或软件环境而不会背离本发明的范围。
图2说明了根据本发明、用于创建和保持历史文档之间的链接的方法的流程图。预期下述方法在打开源文档(例如,通过经由浏览器导航到一网页)时自动执行。然而,在替换实施例中,该方法可以由用户经由用户控制选项手动启动。该方法从块200开始。在块202处,打开源文档。接下来,在块204处,扫描该源文档以便获得文档链接。在块206处,对于在该源文档中找到的每个文档链接,将指示源文档名称和文档链接的项目添加到链接数据库152中。如块207所示,如果先前已经打开过同一个源文档,则更新现有的链接数据库项目,以反映从该源文档上次打开以来在链接结构和组织方面的任何改变。
在块208处,确定是否应当在由该文档链接所指向的文档上执行对相关关键字的搜索。在一个实施例中,这是网络浏览器内的用户可选选项。如果不执行,则控制转向块214。如果要执行,则控制转向块210,其中在由该文档链接所指向的文档(即目的文档)中标识相关的关键字。如块212所示,然后对于每个相关的关键字项将一项目添加到链接数据库152中,该项目包含关键字、源文档名称和包含该相关关键字的目的文档的文档链接。如块213所示,如果先前已经打开过同一个目的文档,则更新现有的链接数据库项目,以反映从该文档上次打开以来的任何改变。该方法在块214结束。
图3说明了用于从链接数据库152中提取有用信息的流程图。预期下述方法在打开源文档(例如,通过经由浏览器导航到一网页)时自动执行。然而,在替换实施例中,该方法可以由用户经由用户控制选项手动启动。该方法从块300开始。在块302处,该方法在链接数据库内的文档链接项目中搜索当前源文档的任何出现。在块304处,确定是否在文档链接项目中找到任何来自当前源文档的链接。如果没有,则控制转向块310。如果找到了一个或者多个链接,则如块306所示,创建包括每个找到的项目的反向引用列表。在块308处,通常经由临时书签文件夹或者经由分屏视图向用户呈现反向引用列表。可以考虑向用户呈现反向引用列表的其它方法,而且这些方法落入本发明的范围和精神之内。
在块310处,确定用户是否希望创建包含与从源文档中分析出的相关关键字相匹配的关键字的文档列表。在一个实施例中,这是网络浏览器内的用户可选选项。如果不创建,则控制转向块320。如果要创建,则如块312所示,分析当前源文档以便确定相关的关键字。在块314处,在链接数据库152的关键字项目中搜索从该源文档中分析出的相关关键字的任何出现。在块316处,从源文档中分析出包含与相关关键字相匹配的关键字的文档列表。在块318处,通常经由临时书签文件夹或者经由分屏视图,向用户呈现包含与从源文档中分析出的相关关键字相匹配的关键字的文档列表。可以考虑呈现包含与从源文档中分析出的相关关键字相匹配的关键字的文档列表的其它方法,而且这些方法落入本发明的范围和精神之内。该方法在块320结束。
图3中的方法与图2中的方法完全兼容,而且这两种方法可以同时或者不同时实践。例如,当用户导航到新的源文档时,图2中的方法分析该文档以便将任何文档链接添加到链接数据库中。图3中的方法分析在该源文档上的文档链接,以查看是否应当建立反向引用列表和/或包含与从源文档中分析出的相关关键字相匹配的关键字的文档列表、并且向用户显示这些列表。
图4是总体在400显示的、本发明在其上进行操作的源文档的示范示例。在本发明的上下文中的文档包括但不限于字处理器文档、可移植文档格式(PDF)文件、电子邮件、网站、即时消息和电子笔记。示例文档400是在浏览器134内显示的、波士顿Red Sox大联赛棒球队的网站。这个文档400由几个标题402A-402D所组织,每个标题包括一个或者多个到其它网站(即,目的文档)的统一资源定位符(URL)404A-404H。标题402将源文档400组织为球迷感兴趣的各个区域(例如,排名、日程表、文章、名册等)。
在本发明的一个实施例中,当由浏览器134打开源文档400时,首先由链接管理器150扫描该源文档以便获得适当的文档链接。在这种情况下,在源文档400内存在几个文档链接(URL)404A-404H。对于在源文档400中找到的每个文档链接(URL)404A-404H,链接管理器150将指示源文档的名称(例如,当前源文档的URL)和目的文档的URL的项目添加到链接数据库152中。图5中更详细地描述了链接数据库152。在替换实施例中,该扫描操作可以由用户手动启动,而不是由链接管理器150自动启动。
在本发明的一个实施例中,可以扫描由文档链接(URL)所指向的目的文档以便获得相关关键字。一种自动地确定目的文档内的相关关键字的可能方法是在目的地文档内检查重复使用的词或者术语。如果一个词或者短语在目的文档内重复地使用,则可将其标识为相关关键字。另一种确定相关关键字的技术是检查在目的文档内的文本的字体大小和/或粗体。也可以将以相对大字样或者字体大小出现、或者在粗体文本内存在的词标识为相关关键字。可以实践用于标识目的文档内的相关关键字集的几种其它方法,这些方法仍然在本发明的精神和范围之内。一旦已经确定了相关关键字,则将包含该关键字、目的文档和关联的源文档的项目添加到链接数据库152中。图5中对此进行了更充分的描述。
图5说明了根据本发明的链接数据库152的一个实施例。在链接数据库内的每个项目500(例如,项目500A、500B等)包括源文档标识符502、目的文档标识符504、以及可选的关键字标识符506。如先前在图2中所述,当由链接管理器150分析源文档时,将项目500写入到链接数据库152中。如果对一个已分析的源文档,项目已存在于链接数据库152内,则链接管理器150在后续访问源文档时更新这些项目500。
举例来说,返回参见图4,来自源文档(例如,波士顿Red Sox网站,www.redsox.com)的URL 404A指向另一网站 www.yankees.com,其包含有关纽约Yankees的文章。当链接管理器150分析波士顿Red Sox网站(即,源文档)时,如图3所示,它将项目500A添加到链接数据库152中,其把www.redsox.com列为源文档标识符502,并且将 www.yankees.com列为目的文档标识符504。
如先前所述,链接管理器150还可以分析该目的文档以便获得要包括在链接数据库152中的相关关键字。图6说明了由来自源文档(例如,先前在图4中说明的波士顿Red Sox网站)的URL 404E指向的、标题为“纽约Yankees与Red Sox进行交易以得到史密斯”的目的文档602。如先前所述,一种标识在文档内的相关关键字的方法是确定词在目的文档中的出现频率。在所述示例中,链接管理器1 50确定词“Yankees”在目的文档602内重复出现(由粗体文本所示),因此如图5所示,将项目500B添加到链接数据库152中,该项目将 www.redsox.com列为源文档标识符502,将 www.sports.com列为目的文档标识符504,并且将“Yankees”列为关键字标识符506。
一旦链接数据库152具有项目,则当打开新源文档时,链接管理器150在链接数据库152内的目的文档标识符504字段中搜索当前源文档的存在。这样做以便查找任何引用当前打开的源文档的文档。换句话说,标识对当前文档的反向引用(即,源文档标识符502字段),其仅仅包括用户先前已经访问过的文档。链接管理器150创建这样的反向引用列表,并且向用户呈现这个反向引用列表。可以采用各种机制用于向用户呈现反向引用列表,这些机制包括但不限于使用浏览器134内的临时书签文件夹、以及用户激活的分屏视图。
举例来说,假定用户已经访问了先前图4所图示的波士顿Red Sox网站,而且如图5所示,已经根据这个网站在链接数据库152中创建了一些项目500。假定用户大约一周以后访问 www.yankees.com网站。  当用户导航到www.yankees.com网站时,链接管理器150在链接数据库152的目的文档标识符504字段中搜索 www.yankees.com(即当前源文档)的存在。在这种情况下,项目500A在目的文档标识符504字段中具有 www.yankees.com,因此将源文档标识符502字段值(即, www.redsox.com)添加到反向引用文档列表中,然后向用户呈现该列表。
在本发明的一个实施例中,当链接数据库152具有关键字项目时,当打开新的源文档时,链接管理器150分析当前源文档以便获得相关关键字(使用先前对于目的文档中的关键字搜索而描述的方法)。链接管理器150然后在链接数据库152的目的地文档关键字506字段中搜索从当前源文档分析出的相关关键字的任何出现。如果找到任何这样的关键字,则创建包含与从该源文档中分析出的相关关键字相匹配的关键字的文档列表。从链接数据库的源文档标识符502字段中收集这个文档列表。然后向用户呈现这个文档列表。可以采用各种机制用于向用户呈现反向引用列表,这些机制包括但不限于使用浏览器134内的临时书签文件夹、以及用户激活的分屏视图。
假定用户访问图6中通过说明性示例示出的sports.com网站,www.sports.com。分析 www.sports.com网站的主页以获得相关关键字。确定词“Yankees”是在当前网页上的相关关键字,这是因为该词具有比较高的出现频率。链接管理器150然后在链接数据库152的目的文档关键字506字段中搜索相关关键字“Yankees”以获得关键字“Yankees”的任何出现。项目500B在其目的地文档关键字506字段中具有关键字Yankees,因此将相应的源文档标识符502字段值(即, www.redsox.com)添加给匹配关键字引用列表中,然后将该列表呈现给用户。
在本发明的另一方面中,通过图7所述的示例方法,当打开包含到各种网站的多个链接(URL)的源文档时,可以分级地组织和书签标记源文档内的这些链接。这个方法从块702开始。
在决704处,用户打开包含到各种网站的多个链接(URL)的文档。这个处理可以由用户明确地启动(例如,如块706所示,通过回答诸如“将URL保存为分级书签”之内的提示),或者作为选择,由***自动地启动(未示出)。如果用户选择不将这些链接(URL)保存为分级书签,则该处理在块720处结束。否则,在块708处,创建基础书签文件夹,该文件夹的命名基于起始的文档名称,或者作为选择,来自文档中最相关的关键字。
接下来,在块710处,分析该文档的结构以便确定将该源文档内呈现的链接(URL)分组为子类的逻辑分组。这个分析可以检查该源文档的各个结构特征,包括但不限于:标题、目录、列表、节、段落和/或引用,以便分组这些链接(URL)。为了增强链接(URL)的组织和分组(或者如果基于页面结构不能找到逻辑分组),如块712所示,分析链接的内容和周围上下文以分析出与每个资源相关联的主关键字,并且基于类似的关键字组织这些链接。然后可以可选地向用户呈现多个子类别方案(即,分组),由此允许用户选择最好地满足他们的要求的子类别方案。分析来自链接组周围的文档上下文、以及来自链接本身内的内容的关键字,以确定每个逻辑分组的文件夹名。
在块714处,基于来自块712的关键字创建子文件夹,并且在每个子文件夹内放置适当的链接。在本发明的一个实施例中,如块716所示,存在允许用户指定链接的组织和分组是否随着链接周围上下文(以及链接本身的内容)的更新而改变的选项。如果用户不希望动态更新,则该方法在块720结束。如果用户肯定地选择动态更新选项,则如块718所示,定期更新该链接组织。在一个实施例中,可以经由“虚象链接”或者作为选择通过淡化的位置标记、在书签文件夹中向用户显示改变的链接,该淡化的位置标记是链接过去驻留的位置,并且将用户带向该链接的新位置。
图8说明了总体以800所示的图4中的源文档,其中在该源文档内的链接被分级组织和书签标记了。在所述示例中,用户经由网络浏览器导航到“波士顿Red Sox”网站。所示出的网站包含多个指向各种其它网站的链接(URL)404A-404H。然后向用户询问他们是否希望将来自该页面的URL保存为分级书签。做为选择,可以经由浏览器控制选项、自动地保存或者不保存这些书签。
如果用户希望将来自当前文档的URL保存为历史书签,则创建用于当前文档的基础书签文件夹。可以以多种方式得到用于当前文档的基础书签文件夹的名称。在所述实施例中,基于起始文档名称“redsox.com”命名该基础书签文件夹。在替换实施例中,可以从该文档内的相关关键字得到该基础书签文件夹的名称。
接下来,分析当前文档(例如,波士顿Red Sox网页)的结构以便确定在当前文档内呈现的链接(URL)的逻辑分组。在所述实施例中,该网站被分成几个标题(例如,“排名”402A、“日程表”402B、“文章”402C和“名册”402D)。这些标题提供了对页面内的链接(URL)进行分类的优良方式。通过分析该网页的超文本标记语言(HTML),可以确定在URL和它们的相应标题之间的关系。例如,在“排名”标题下分组为URL: www.yankees.com404A、 www.redsox.com 404B、 www.orioles.com 404C和 www.blueiays.com404D。在“文章”标题下分组为指向在波士顿Red Sox网页上的文章的URL,即 www.sports.com 404E和 www.bostonqlobe.com 404F。最后,在“名册”标题下分组为指向在“名册”标题下的选手网站的URL,即 www.curtshillinq.com404G和 www.davidortiz.com 404H。
在本发明的其它实施例中,可以分析源文档的其它结构特征(例如,标题、目录、列表、节、段落)以便分组该文档内的URL。在一个这样的实施例中,基于不同的结构分组类型,向用户呈现多个潜在的关键字分组方案,而且用户可以选择最好地反映他们的要求的方案。
接下来,如802所示,在基础书签文件夹下为每个标题创建子文件夹,并且将与每个标题相对应的链接移入相应的子文件夹中,然后作为浏览器选项向用户显示。以这种方法,以分级方式组织在这个文档(例如,网页)中存在的URL,以可用于将来参考。在该说明性示例中,对应于在该源文档内的标题,仅仅创建了一级子文件夹。应当注意到,可以创建子文件夹的进一步分级层次,并且其仍然在本发明的范围和精神之内。例如,在标题“排名”下,可以有子标题“美国棒球联盟(American League)”和“国家联盟(NationalLeague)”。这些子标题可以用来创建在“排名”子文件夹下的相应子文件夹。
在本发明的示例实施例的先前详细说明中,对形成本发明的一部分、并且以说明方式示出其中可以实践本发明的特定示例实施例的附图(其中,相似的数字表示相似的单元)进行了引用。对这些实施例进行了足够详细的描述以允许本领域的那些技术人员实践本发明,但是可以使用其它实施例而且可以进行逻辑、机械、电、及其他改变而不会背离本发明的范围。在这个说明书中使用的单词“实施例”的不同实例不是必需引用相同的实施例,但是它们也可以引用相同的实施例。因此,先前的详细说明不是以限制的意义使用,而且本发明的范围仅仅由附加权利要求所定义。
在先前的描述中,为了提供对本发明实施例的彻底理解而阐述了许多细节。但是,可以实践本发明而不用这些细节。在其它实例中,没有详细地示出众所周知的电路、结构、和技术以便不使本发明模糊。

Claims (18)

1、一种用于管理多个文档内的链接的方法,该方法包含步骤:
打开从多个文档中选择的源文档;
扫描该源文档以便获得文档链接;
对于在该源文档中找到的每个文档链接,将指示该源文档的名称和文档链接的项目添加到链接数据库中;
扫描由该文档链接指向的目的文档以便获得任何相关的关键字;以及
经由关键字项目将该相关关键字包含在链接数据库中,该关键字项目包括该关键字、源文档名称、以及包含该相关关键字的目的文档的文档链接。
2、一种用于管理多个文档内的链接的方法,该方法包含步骤:
打开从多个文档中选择的源文档;
扫描该源文档以便获得文档链接;
对于在该源文档中找到的每个文档链接,将指示该源文档的名称和文档链接的项目添加到链接数据库中;
在该链接数据库内的文档链接项目中搜索当前源文档的任何出现;以及
为每个找到的项目创建反向引用列表。
3、如权利要求2所述的方法,其中该方法还包含步骤:
向用户呈现反向引用列表。
4、如权利要求3所述的方法,其中,经由临时书签文件夹向用户呈现反向引用列表。
5、如权利要求3所述的方法,其中,经由分屏视图向用户呈现反向引用列表。
6、如权利要求1所述的方法,其中该方法还包括步骤:
分析该源文档以获得相关关键字;
在该链接数据库内的关键字项目中搜索从该源文档中分析出的相关关键字的任何出现;以及
创建包含与从源文档中分析出的相关关键字相匹配的关键字的目的文档列表。
7、如权利要求6所述的方法,其中该方法还包含步骤:
向用户呈现包含与从源文档中分析出的相关关键字相匹配的关键字的文档列表。
8、如权利要求7所述的方法,其中,经由临时书签文件夹向用户呈现该文档列表。
9、如权利要求7所述的方法,其中,经由分屏视图向用户呈现该文档列表。
10、如权利要求1所述的方法,其中,源文档从下面的组中选出,该组包含:字处理器文档、可移植文档格式(PDF)文件、电子邮件、网站、以及电子笔记。
11、如权利要求1所述的方法,其中,该文档链接是统一资源定位符(URL)。
12、如权利要求1所述的方法,其中该方法还包含步骤:
基于源文档的结构、以分级方式组织该文档链接。
13、如权利要求12所述的方法,其中所述基于文档结构、以分级方式组织文档的步骤包含步骤:
创建基础书签文件夹;
分析源文档的结构以便确定文档链接的逻辑分组;
基于文档链接的逻辑分组创建多个链接子类;
分析该源文档内容和链接内容以获得相关关键字;以及
基于多个链接子类将书签子文件夹创建到基础书签文件夹中,其中每个书签子文件夹的名称基于相关关键字。
14、一种用于管理多个文档内的链接的方法,该方法包含步骤:
打开从多个文档中选择的源文档;
扫描该源文档以便获得文档链接;
对于在该源文档中找到的每个文档链接,将指示该源文档的名称和文档链接的项目添加到链接数据库中;
扫描由该文档链接指向的目的文档以便获得任何相关关键字;
经由关键字项目将该相关关键字包含在链接数据库中,该关键字项目包括关键字、源文档名称、以及包含该相关关键字的目的文档的文档链接;
在该链接数据库内的文档链接项目中搜索当前源文档的任何出现;
对于在该链接数据库中找到的当前源文档的每个项目,在相关文档列表中创建项目;
分析该源文档以获得相关关键字;
在该链接数据库内的关键字项目中搜索从源文档中分析出的相关关键字的任何出现;
对于该链接数据库中、包含从该源文档分析出的关键字的每个文档,在相关文档列表中创建项目;以及
向用户呈现相关文档列表。
15、如权利要求14所述的方法,其中,源文档从下面的组中选出,该组包含:字处理器文档、可移植文档格式(PDF)文件、电子邮件、网站、即时消息以及电子笔记。
16、如权利要求14所述的方法,其中,该文档链接是统一资源定位符(URL)。
17、一种存储在有形的计算机可读介质上的计算机可读程序,该计算机可读程序提供了一种用于管理多个文档内的链接的方法,该计算机可读程序包含在权利要求1-16任一个所述的方法中的步骤。
18、一种用于管理多个文档内的链接的设备,包含适于执行根据权利要求1-16任一个所述的方法中的每个步骤的装置。
CNB2006101432760A 2005-12-08 2006-11-01 基于文档的信息和统一资源定位符管理方法和设备 Expired - Fee Related CN100462972C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/297,310 2005-12-08
US11/297,310 US8307275B2 (en) 2005-12-08 2005-12-08 Document-based information and uniform resource locator (URL) management

Publications (2)

Publication Number Publication Date
CN1979484A true CN1979484A (zh) 2007-06-13
CN100462972C CN100462972C (zh) 2009-02-18

Family

ID=38130652

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006101432760A Expired - Fee Related CN100462972C (zh) 2005-12-08 2006-11-01 基于文档的信息和统一资源定位符管理方法和设备

Country Status (4)

Country Link
US (1) US8307275B2 (zh)
JP (1) JP5186099B2 (zh)
CN (1) CN100462972C (zh)
TW (1) TW200805092A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110869924A (zh) * 2017-10-06 2020-03-06 萨哈德凡·巴拉钱德兰 用于生成具有变量数据的定制数字文件的方法和装置
CN112104734A (zh) * 2020-09-15 2020-12-18 北京百度网讯科技有限公司 用于推送信息的方法、装置、设备以及存储介质

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9195756B1 (en) 1999-08-16 2015-11-24 Dise Technologies, Llc Building a master topical index of information
US9977831B1 (en) 1999-08-16 2018-05-22 Dise Technologies, Llc Targeting users' interests with a dynamic index and search engine server
US8504554B2 (en) * 1999-08-16 2013-08-06 Raichur Revocable Trust, Arvind A. and Becky D. Raichur Dynamic index and search engine server
FR2906382B1 (fr) * 2006-09-25 2008-11-14 Canon Kk Procedes et dispositifs pour optimiser le traitement xml
US8086608B2 (en) * 2007-10-12 2011-12-27 International Business Machines Corporation Management of resource identifiers
US8095975B2 (en) * 2008-03-18 2012-01-10 International Business Machines Corporation Dynamic document merging method and system
JP4879930B2 (ja) * 2008-03-27 2012-02-22 ブラザー工業株式会社 コンテンツ管理装置、コンテンツ管理システム及びコンテンツ管理方法
US8443278B2 (en) 2009-01-02 2013-05-14 Apple Inc. Identification of tables in an unstructured document
JP5396872B2 (ja) * 2009-01-20 2014-01-22 日本電気株式会社 端末装置およびWebページデータ取得方法
CN102129428B (zh) * 2010-01-20 2015-11-25 腾讯科技(深圳)有限公司 一种实现从网页中订阅信息的方法及装置
KR20120035041A (ko) * 2010-10-04 2012-04-13 삼성전자주식회사 하이퍼링크의 주소를 북마크에 등록하는 방법 및 그 장치
US8380753B2 (en) * 2011-01-18 2013-02-19 Apple Inc. Reconstruction of lists in a document
US20120215757A1 (en) * 2011-02-22 2012-08-23 International Business Machines Corporation Web crawling using static analysis
JP5760564B2 (ja) * 2011-03-22 2015-08-12 カシオ計算機株式会社 情報表示装置およびプログラム
KR101344910B1 (ko) * 2011-07-04 2013-12-26 네이버 주식회사 클라우드를 기반으로 서비스 간의 문서를 연결하는 시스템 및 방법
JP5780182B2 (ja) * 2012-03-08 2015-09-16 富士通株式会社 情報管理装置、情報管理方法、および情報管理用プログラム
US8875009B1 (en) * 2012-03-23 2014-10-28 Amazon Technologies, Inc. Analyzing links for NCX navigation
US8606783B2 (en) * 2012-04-03 2013-12-10 Python4Fun, Inc. Identifying video files of a video file storage system having relevance to a first file
US9626340B2 (en) * 2012-08-28 2017-04-18 Dropbox, Inc. Bookmarking shared file and folder links
US8656265B1 (en) * 2012-09-11 2014-02-18 Google Inc. Low-latency transition into embedded web view
CN105808076A (zh) * 2012-12-14 2016-07-27 中兴通讯股份有限公司 一种浏览器书签的设置方法、装置及终端
US9390177B2 (en) 2014-03-27 2016-07-12 International Business Machines Corporation Optimizing web crawling through web page pruning
US10289730B2 (en) * 2015-02-16 2019-05-14 Microsoft Technology Licensing, Llc Cross-system data aggregation
US10832000B2 (en) * 2016-11-14 2020-11-10 International Business Machines Corporation Identification of textual similarity with references
US10970314B2 (en) 2018-12-21 2021-04-06 Atlassian Pty Ltd. Content discovery systems and methods
US11403315B2 (en) * 2019-11-21 2022-08-02 Bank Of America Corporation Reporting and knowledge discovery for databases
KR102378161B1 (ko) * 2021-07-16 2022-03-28 주식회사 비즈니스캔버스 백링크 버튼을 이용하여 문서와 연계된 리소스 정보를 제공하는 문서 편집 인터페이스 제공 방법 및 장치

Family Cites Families (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2925042B2 (ja) * 1991-08-30 1999-07-26 日本電信電話株式会社 情報リンク生成方法
JP3255264B2 (ja) * 1995-11-16 2002-02-12 日本電信電話株式会社 情報空間アクセス支援方法および装置
AUPO525497A0 (en) * 1997-02-21 1997-03-20 Mills, Dudley John Network-based classified information systems
US5973692A (en) * 1997-03-10 1999-10-26 Knowlton; Kenneth Charles System for the capture and indexing of graphical representations of files, information sources and the like
US6049799A (en) * 1997-05-12 2000-04-11 Novell, Inc. Document link management using directory services
WO1999014690A1 (fr) * 1997-09-17 1999-03-25 Hitachi, Ltd. Procede d'addition d'un mot cle au moyen d'informations de liaison
US6037934A (en) * 1997-11-21 2000-03-14 International Business Machines Corporation Named bookmark sets
US6122647A (en) * 1998-05-19 2000-09-19 Perspecta, Inc. Dynamic generation of contextual links in hypertext documents
US6772139B1 (en) * 1998-10-05 2004-08-03 Smith, Iii Julius O. Method and apparatus for facilitating use of hypertext links on the world wide web
US7275206B1 (en) * 1999-04-15 2007-09-25 International Business Machines Corporation Method and computer program product for identifying hypertext links in document printouts
US7213198B1 (en) * 1999-08-12 2007-05-01 Google Inc. Link based clustering of hyperlinked documents
AUPQ475799A0 (en) * 1999-12-20 2000-01-20 Youramigo Pty Ltd An internet indexing system and method
US7225181B2 (en) * 2000-02-04 2007-05-29 Fujitsu Limited Document searching apparatus, method thereof, and record medium thereof
US6819339B1 (en) * 2000-02-24 2004-11-16 Eric Morgan Dowling Web browser with multilevel functions
US20050021862A1 (en) * 2000-03-31 2005-01-27 Dickens Coal Llc Automatic selection of content-delivery provider using link mapping database
US6883001B2 (en) * 2000-05-26 2005-04-19 Fujitsu Limited Document information search apparatus and method and recording medium storing document information search program therein
JP2002049638A (ja) * 2000-05-26 2002-02-15 Fujitsu Ltd 文書情報検索装置、方法、文書情報検索プログラム及び文書情報検索プログラムを格納したコンピュータ可読の記録媒体
US20010049700A1 (en) * 2000-05-26 2001-12-06 Shinobu Ichikura Information processing apparatus, information processing method and storage medium
US7155489B1 (en) * 2000-06-28 2006-12-26 Microsoft Corporation Acquiring web page information without commitment to downloading the web page
JP2002117073A (ja) * 2000-10-04 2002-04-19 Sharp Corp 新着情報提示方法およびその方法を実行させるプログラムを記録した記録媒体ならびにそのプログラムを実行するコンピュータ
KR20050004274A (ko) * 2000-11-29 2005-01-12 가부시끼가이샤 도시바 검색엔진과, 검색시스템, 검색시스템에서의 데이터베이스작성방법 및, 기억매체
US7356530B2 (en) * 2001-01-10 2008-04-08 Looksmart, Ltd. Systems and methods of retrieving relevant information
US6981210B2 (en) * 2001-02-16 2005-12-27 International Business Machines Corporation Self-maintaining web browser bookmarks
JP2002245089A (ja) * 2001-02-19 2002-08-30 Hitachi Eng Co Ltd ウェブページ検索システム、二次情報収集装置、インターフェース装置
US6925594B2 (en) * 2001-02-28 2005-08-02 International Business Machines Corporation Saving selected hyperlinks for retrieval of the hyperlinked documents upon selection of a finished reading button in a web browser
JP2002259450A (ja) * 2001-03-01 2002-09-13 Ricoh Co Ltd キーワードをフォルダ名とした関連文書の書き出し方法および同方法の手順を記録した記録媒体
JP4399127B2 (ja) * 2001-05-14 2010-01-13 株式会社日立製作所 文書管理方法及び装置並びにその処理プログラム及びそれを格納した記憶媒体
JP3571312B2 (ja) * 2001-06-29 2004-09-29 株式会社ジャストシステム リンク集作成装置、リンク集作成方法、及びリンク集作成プログラム
CA2353682A1 (en) * 2001-07-23 2003-01-23 Ibm Canada Limited-Ibm Canada Limitee Link management of document structures
US20040205496A1 (en) * 2001-10-11 2004-10-14 International Business Machines Corporation Displaying subheadings and hyperlinks in a scrollable long document
US20030101183A1 (en) * 2001-11-26 2003-05-29 Navin Kabra Information retrieval index allowing updating while in use
US7406659B2 (en) * 2001-11-26 2008-07-29 Microsoft Corporation Smart links
US7133860B2 (en) * 2002-01-23 2006-11-07 Matsushita Electric Industrial Co., Ltd. Device and method for automatically classifying documents using vector analysis
US20040205569A1 (en) * 2002-02-06 2004-10-14 Mccarty Jon S. Method and system to manage outdated web page links in a computing system
JP2003288342A (ja) * 2002-03-28 2003-10-10 Ricoh Co Ltd 情報処理装置
US7275063B2 (en) * 2002-07-16 2007-09-25 Horn Bruce L Computer system for automatic organization, indexing and viewing of information from multiple sources
US20040034635A1 (en) * 2002-08-15 2004-02-19 Czarnecki David Anthony Method and system for identifying and matching companies to business event information
US7194469B1 (en) * 2002-09-24 2007-03-20 Adobe Systems Incorporated Managing links in a collection of documents
JP4093012B2 (ja) * 2002-10-17 2008-05-28 日本電気株式会社 ハイパーテキスト検査装置および方法並びにプログラム
JP2004280203A (ja) * 2003-03-12 2004-10-07 Sony Corp Web対応電子機器装置、ページ閲覧表示方法およびプログラム
US7523403B2 (en) * 2003-03-31 2009-04-21 Microsoft Corporation Placeholder control object for creating and viewing content in connection with a content management server system
CN1536483A (zh) * 2003-04-04 2004-10-13 陈文中 网络信息抽取及处理的方法及***
US7188308B2 (en) * 2003-04-08 2007-03-06 Thomas Weise Interface and method for exploring a collection of data
US7308643B1 (en) * 2003-07-03 2007-12-11 Google Inc. Anchor tag indexing in a web crawler system
KR100565289B1 (ko) * 2003-08-30 2006-03-30 엘지전자 주식회사 이동 통신 단말기의 하이퍼링크를 이용한 정보 관리 방법
US7552109B2 (en) * 2003-10-15 2009-06-23 International Business Machines Corporation System, method, and service for collaborative focused crawling of documents on a network
US20050114756A1 (en) * 2003-11-26 2005-05-26 Nokia Corporation Dynamic Internet linking system and method
JP4396242B2 (ja) * 2003-11-28 2010-01-13 富士ゼロックス株式会社 文書リンク構造情報作成装置及び方法
US20050198567A1 (en) * 2004-01-29 2005-09-08 Vermeulen Bert M. Web navigation method and system
US7487190B2 (en) * 2004-08-27 2009-02-03 Microsoft Corporation Automated identification and marking of new and changed content in a structured document
US20070022098A1 (en) * 2005-07-25 2007-01-25 Dale Malik Systems and methods for automatically updating annotations and marked content of an information search
US8849821B2 (en) * 2005-11-04 2014-09-30 Nokia Corporation Scalable visual search system simplifying access to network and device functionality

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110869924A (zh) * 2017-10-06 2020-03-06 萨哈德凡·巴拉钱德兰 用于生成具有变量数据的定制数字文件的方法和装置
CN112104734A (zh) * 2020-09-15 2020-12-18 北京百度网讯科技有限公司 用于推送信息的方法、装置、设备以及存储介质

Also Published As

Publication number Publication date
TW200805092A (en) 2008-01-16
JP5186099B2 (ja) 2013-04-17
US20070136318A1 (en) 2007-06-14
CN100462972C (zh) 2009-02-18
JP2007157132A (ja) 2007-06-21
US8307275B2 (en) 2012-11-06

Similar Documents

Publication Publication Date Title
CN100462972C (zh) 基于文档的信息和统一资源定位符管理方法和设备
CN100530180C (zh) 推荐搜索引擎关键词的方法和***
US9348872B2 (en) Method and system for assessing relevant properties of work contexts for use by information services
US7421426B2 (en) Systems, methods, and media for utilizing electronic document usage information with search engines
JP5727512B2 (ja) 検索提案のクラスタ化及び提示
CN1934569B (zh) 集成有用户注释的搜索***和方法
CN101263493B (zh) 用于提供搜索结果的***和方法
US7895595B2 (en) Automatic method and system for formulating and transforming representations of context used by information services
CN101124609B (zh) 使用内联上下文查询的搜索***及方法
US8005823B1 (en) Community search optimization
CN103235776A (zh) 呈现搜索结果信息
US9864768B2 (en) Surfacing actions from social data
US8359307B2 (en) Method and apparatus for building sales tools by mining data from websites
EP2062169A2 (en) Search document generation and use to provide recommendations
US20200081926A1 (en) Using historical information to improve search across heterogeneous indices
CN113544689A (zh) 为文档的来源观点生成并提供附加内容
KR20070089898A (ko) 사용자 피드백을 이용하여 검색된 컨텐츠를 평가하고 평가결과를 이용하여 검색 결과를 제공하는 방법 및 장치
US20150169501A1 (en) Highlighting of document elements
US20130031075A1 (en) Action-based deeplinks for search results
US20100082594A1 (en) Building a topic based webpage based on algorithmic and community interactions
WO2001027712A2 (en) A method and system for automatically structuring content from universal marked-up documents
US7730062B2 (en) Cap-sensitive text search for documents
KR100672278B1 (ko) 웹 브라우저의 즐겨찾기 리스트를 이용한 개인화 검색 방법및 검색 서버
KR20030051577A (ko) 검색사이트의 검색결과 표시방법
US20160283605A1 (en) Information extraction device, information extraction method, and display control system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090218

Termination date: 20181101

CF01 Termination of patent right due to non-payment of annual fee