CN1127031C - 以电子方式创建个性化文档的***和方法 - Google Patents

以电子方式创建个性化文档的***和方法 Download PDF

Info

Publication number
CN1127031C
CN1127031C CN01112120A CN01112120A CN1127031C CN 1127031 C CN1127031 C CN 1127031C CN 01112120 A CN01112120 A CN 01112120A CN 01112120 A CN01112120 A CN 01112120A CN 1127031 C CN1127031 C CN 1127031C
Authority
CN
China
Prior art keywords
document
user
individualized
search
electronic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN01112120A
Other languages
English (en)
Other versions
CN1319817A (zh
Inventor
安·纽曼-科林斯
唐·鲁特勒支·戴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1319817A publication Critical patent/CN1319817A/zh
Application granted granted Critical
Publication of CN1127031C publication Critical patent/CN1127031C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供一种以电子方式创建个性化文档的方法和***,其能够把多个电子参考材料分解并组合为一个个性化的电子文档。所述方法包含如下步骤:响应使用者的输入,选择所述至少一个电子参考文档;把所述至少一个电子参考文档解析成若干子成分;响应所述解析步骤的完成,从所述子成分中聚集类似项,以创建所述个性化文档;以及根据使用者在创建文档前所作的选择,输出带有一组产生的导航能力的所述个性化文档。由于通过本发明的方法和***可以自动地生成相关信息的合成文档,因此大大减少人的手动操作,提高效率。

Description

以电子方式创建个性化文档的***和方法
技术领域
一般而言,本发明涉及创建电子文档,特别是作为参考文档的组合来产生电子文档。更具体地说,本发明涉及一种方法、***,
用于分析参考材料或参考材料的一些片断,并把这些片断按某种排序方式聚集起来,以创建具有导航能力的个性化文档。本发明还涉及一种方法、***,用于根据使用者建议的关键词对个性化电子文档编索引和安排格式。
背景技术
利用一个或多个其他信息源作为参考材料合成个性化文档是当今学术或商务环境中的一个普通功能。学生或专业人员等往往希望由已经发表的信息源编辑信息(或数据)以创建他们个人的作品。例如,一个在写关于美国革命的综合性文章的学历史的学生可以利用电子数据库(如因特网)中找到的历史书藉、报纸或杂志文章以及新近写的报道作为参考。在典型的文档综合过程中,在所创建的文档中只包括参考材料中的相关部分。所创建的文档通常是把标题、索引、参考段落、以及作者的个人评注以一种粘聚的形式链接在一起而完成的。
因特网的迅速发展,部分地由于在它上面有当前可得到的大量信息,使得因特网已成为最被广泛利用的数据检索资源之一。当今使用因特网允许使用者打入一个搜索查询,并作为对该查询的响应收到至因特网上一些站点的超文本链接,在那些站点上存在与搜索请求有关的信息。在当前的因特网环境中,这种信息大多在使用超文本链接标识语言(HTML)创建的万维网(Web)站点上找到。该信息在万维网文档中找到,它们倾向于展示出一篇文章或页面级分块,也就是说,在进行编辑或与其他文档组合时这整个文档保持为单个块。在由HTML创建的站点上进行搜索通常会造成命中,其中一些命中只是根据在与该超文本链接相关联的万维网站内出现了一个单个词。含有单个词命中的文档通常不是要搜索的材料,尽管如此却被送回来了。还有,如果一使用者希望访问包含搜索查询项的一段HTML文档,该使用者不得不下载(即在他的计算机***中打开)整个文档并通篇搜索。再有,如果一使用者希望由含有该搜索查询的两个文档创建一个合成文档,使用者不得不把这两个文档整个地链接起来,或者在文字处理应用程序中人工剪切和粘贴这些文档的一些部分。
在人工文档合成过程中,文档起草人通读整个参考材料,选择或加亮感兴趣的部分,把那些部分复制到他的笔记本中或他的计算机上。然后,起草人对下一个参考材料重复这一过程。在一些情况中,在起草人创建他的文档时,首先要阅读所有参考材料,然后从每个参考材料中仔细地选出各单个部分。
在电子介质中进行的是类似的过程,只是可以以电子方式得到参考材料。起草人通读若干在线信息源并选择有关的部分以包括在他的个性化文档中。然后,这些有关部分可被剪切和粘贴或以某种其他方式复制到文字处理应用程序中,在那里由起草人对它们进行人工链接。
上述两种个性化文档合成方法都特别费时间和效率低,特别是当使用者只希望把相关信息组合以供日后能通过访问单一文档容易地进行参考的时候更是如此。
在因特网上信息发布站点的一般种类已大量增长,然而在这些站点并不完成资源的相关、聚集和再使用。一些先有工作已讨论过把万维网上的多个文档聚集成一单个文档的构想。例如,美国专利5,924,090披露一种分类***,利用该***根据其内容使用元数据属性把各项放到各类别或子类别中。该分类***利用一种装置,它搜索一数据库并把搜索结果放到一组最相关的类别中,从而使使用者能够只得到相关的那些记录。
在“如我们可以想到的”(The Atlantic Monthly(大西洋月刊),1945年7月,第101-108页,它已用http协议重印在Sloan.stanford.edu/mousesite/Secondary/Bush.html中),该作者描述了memex装置的构想。memex装置有助于信息发现和信息合成以供再使用。该文章还讨论了关联索引,用它可把两个或更多个信息项按用户确定的关联词连接起来,并创建一尾标代表相应信息项的一部分。
上述参考文献中没有一个讲到允许从相关参考材料合成一个个性化文档的导航能力(即一种具有可感知特性的物理指示器,它指示应如何利用或完成某种东西)。
本发明认识到,如果有一种方法、***和程序产品用于把电子参考材料分解成组成部分并由该电子参考材料的各组成部分有效地合成一个个性化电子文档,那将是有好处的。一种方法、***和程序产品,它允许使用者搜索参考材料,然后根据使用者送入一文档生成实用程序中的指导路线由所选的参考材料自动产生一个只包含相关信息的合成文档,这样的方法、***和程序产品将是一个受欢迎的改进。如果这样的方法、***和程序产品允许自动对一文档(例如所产生的个性化文档)进行格式编排和编索引,也将是有好处的。在本发明中实现了这些和其他好处。
发明内容
本发明披露了一种方法和***,用于由至少一个电子参考材料以电子方式创建一个个性化文档。该方法首先选择电子参考材料。然后,该电子参考材料被解析成子成分。然后该方法在所述子成分当中聚集相似项,以创建个性化文档,它被输出时自动带有一组导航能力,这组导航能力是根据使用者在产生文档之前所作的选择形成的。
在一个最佳实施例中,该方法、***还以文档产生前使用者送入的评注来注释该个性化文档,并根据使用者选择的索引选项和索引深度为该个性化文档创建一个索引。该索引是利用取自子成分当中的关键词创建的。
一种以电子方式创建个性化文档的方法,包含下列步骤:创建包括关键词的个性化文档注释概要,用于包括到所述个性化文档中;将所述注释概要提交给搜索引擎,使能搜索和提取具有关于所述关键词的组成部分的参考材料;接收一组所述参考材料;以及利用所述注释概要和所述一组参考材料的所述组成部分,合成所述个性化文档。
由于通过本发明的方法和***可以自动地生成相关信息的合成文档,因此大大减少人的手动操作,提高效率。
附图说明
图1A是为实现本发明的最佳实施例所使用的数据处理***的方框图;
图1B是为实现本发明的最佳实施例所使用的客户机-服务器-数据库网络的方框图;
图2是一个信息中心应用程序的图形用户界面(GUI)图,根据本发明的一个实施例,在该应用程序中,使用者可以选择产生电子文档和编索引的选项;
图3A是根据本发明的一个实施例用于检索参考材料的搜索GUI;
图3B是根据本发明的一个实施例用于注释新创建的个性化文档的注释GUI;
图4是根据本发明的一个实施例产生个性化电子文档过程的逻辑流程图;
图5是根据本发明的一个实施例对一文档进行电子编辑索引过程的逻辑流程图;以及
图6是根据本发明的一个实施例产生个性化电子文档过程的方框流程图。
具体实施方式
现在参考附图,特别是参考图1A,图中描绘了用于本发明最佳实施例的数据处理***20的基本结构。数据处理***20有至少一个中央处理单元(CPU)或处理器装在***单元22中。***单元22与若干***装置相连,包括输入/输出装置如显示监视器96、键盘82、图形指示装置84、以及打印机94,供用户界面使用。装在***单元22中的还有永久存储器装置(如硬盘)用于存储数据处理***的操作***和使用者程序/应用程序,以及暂时存储器装置(如随机存取存储器或RAM),它由CPU用于实现程序指令。***单元22通过各种装置与***装置通信,包括通过总线或直接通道(利用总线桥可以提供不只一个总线)。
数据处理***20可以有许多附加的部件,这些在图中未画出,如用于和调制解调器92或CD ROM78等连接的串行端口、并行端口和USB端口。在本发明的这个实施例中,可以经由连到地上线或无线蜂窝电话***上的调制解调器92进行与数据处理***20的通信,反过来,调制解调器92又与本地网络提供者(如因特网服务提供者(ISP))相连。此外,数据处理***20还可经由网络适配器90连到一个网络。被传送的数据到达调制解调器或网络卡,并被处理,以便由数据处理***的CPU或其他软件应用来接收。在该最佳实施例中,因特网服务提供者提供参考数据,这些参考数据可经由调制解调器92下载到数据处理***20中。调制解调器92还可提供与其他参考数据源的连接,如服务器、电子公告板(BBS)或因特网(包括万维网)。
本领域技术人员会进一步理解,可能与图1A中所示那些部件结合使用的还会有其他部件,例如,与处理器相连的显示适配器可以被用于控制一视频显示监视器30,一个存储器控制器可用作为暂时存储装置和CPU之间的接口。数据处理***20还包括一个固件,它的主要目的是在数据处理***20首次接通时用于从***装置之一(通常是一永久性存储器装置)中找出并加载操作***。在该最佳实施例中,数据处理***含有一个相对快的CPU以及足够大的暂时存储装置和在永久存储装置上的空间,以及所需要的其他硬件部件。
传统的数据处理***往往利用一个图形用户界面(GUI)向使用者展现信息。GUI是由加载到数据处理***上的软件创建的,具体地说,是该数据处理***的与应用程序联合动作的操作***。本发明的最佳实施例是由基于GUI的应用程序实现的,该应用程序有若干个用户界面,并支持作为程序代码存储在一介质上的功能部件,该介质与处理器相连并可由该处理器读出。
本发明的实现是在如上所述数据处理***上发生的。然而,应该理解,其他类型的数据处理***是可能的,它们可以有一些或更多些上述基本部件。例如,可以利用单用途文档合成***来取代通用数据处理***。
本发明可在如图1B中所示网络环境中实现。网络环境包含一个客户机和一个服务器153,在客户机上本发明作为一个信息中心应用151来实现,而服务器153作为个性化文档合成所用参考数据155的源或管道。网络环境可以是一个局域网(LAN)或广域网(WAN),如因特网。本发明最佳实施例是在与广域网相连的数据处理***上实现的,它有因特网浏览器能力用于搜索因特网以得到有关的参考材料。这里将参考一个广域网(WAN)和所连接的数据处理***来描述本发明。
万维网(web)是用于因特网的一个图形交互界面,在这整个说明书中名词因特网与Web可相互变换使用。在与Web相连的数据处理***上有不同的计算机程序应用(即Web浏览器客户机,下文中称作Web浏览器)用于访问与Web相连的服务器。信息是作为网页存储在一Web服务器上。一个网页包含一个或多个图形和/或文本显示,它们可以链接在一起并可利用Web浏览器下载到客户机数据处理***。在Web内的每个网页有一个唯一地址,或统一资源***(URL),它可利用传输控制协议/网际协议(TCP/IP)访问。在客户机浏览器内网页往往由一相应的超文本链接来表示,该链接还可提供关于页面内容的信息。
当今的网页设计已从使用展现页面级分块的HTML格式过波到扩展标识语言(XML)格式,它展现描述文档内容的动态可扩展机制、更精细的分块以及在HTML中不能得到的其他功能元素。XML是在1996年由万维网咨询委员会开发的。它是一个文件说明,用于把有结构的数据放到一个文本文件中,然后它允许访问该文本文件/数据的单个成分。使用XML格式准备的文本文件在其后能被观看,无需使用用以产生该文件的程序。XML文件的文本格式易于由一计算机以一种不混淆的方式产生和阅读,而且是独立于平台的。XML利用标记(即由‘<’和‘>’括起来的词)及属性分割数据块。XML包括用于指向一XML文档各部分(数据块)的句法。XML允许万维网作者向万维网文档增添标记,以指定搜索查询的含义,从而使查询更精确。XML还通过操纵相应数据来提供定制的观看信息。本发明在实现图4和图5的流程图中所示若干步骤时以XML功能作为一种手段。
本发明利用XML语言的功能,以允许由数据库中找到的多个XML文档创建或合成个性化文档。为了本发明的目的,数据库一词是指创建个性化文档过程中由使用者选择的一个或多个参考材料的任何集合。本发明提供了一个发现和重新使用信息的***,它产生一个被相关观看的、被充分理解的个性化文档。本发明依靠XML文档类型定义(DTD)来强制对数据的语义组织,并利用XSL(扩充左移)作为数据过滤技术,它为合成结果的共享提供变换编码服务。
本发明主要是在图3A所示信息中心GUI内实现的。为了本发明的目的,信息中心GUI是指面向产品或域的一个入口。信息中心GUI还可称作资源中心或文档产生中心。在信息中心GUI中存在的元素是利用Widget(专用接口工具集)创建的,它们添加到用户界面并向使用者提供更多的设施供选择。在本最佳实施例中,信息中心GUI300有浏览器功能,使它能根据使用者送入的查询在因特网上搜索。信息中心GUI300使用图2所示搜索GUI201访问万维网。在图2中,一个搜索查询被送入查询字段207,并可以补充送入上下文字段205和类别字段203中的上下文搜索项。后两个字段是用于通过进一步确定被参考的一般区域来准确定位该搜索。由于XML格式文档的精细分块搜索能力,使这一特性利用了增强的搜索实用程序并使能发生更精确的命中。使用者选择提交查询按钮209把搜索请求发送到因特网。当发生命中时,一个通告窗口211提醒使用者他的搜索已然成功。
现在转到图3A,当使用者将一搜索项送入搜索字段321中时,信息中心GUI300的万维网浏览器功能被启动,它打开图2的搜索GUI201。相关的命中作为超文本链接回送到信息中心GUI的第一框323中。然后,使用者可以从这里完成对若干文章的“售货车”选择。使用者选择那里他相信包含为产生个性化文档所需的好参考材料的文章,并把它们复制到参考段303(通过拖放操作或双击选择等)。到选定参考的链接在参考段303中生成镜象。当选定链接时,这些文档的实际文本(即不仅是超文本链接)被下载到信息中心GUI300的参考存储区,并在分析和合成步骤发生时暂时存储在那里。为便于演示,显示出3个参考文档作为已选定用于文档合成的文档。一旦选定了所希望的参考文档,使用者能送入他希望在要产生的个性化文档中反映出来的格式、索引和注释信息。
在信息中心GUI300的格式、索引和注释区中,使用者能为新的个性化文档输入订制信息,例如导航能力和注释。为了本发明的目的,导航能力被定义为是指该个性化文档中包括的标题、索引、参考段、题头和/或副题头、到参考源的超文本链接等。这样,订制信息包括送入标题字段305中的新个性化文档标题,在索引深度选择区311中送入的为个性化文档编索引所希望的索引级别,以及从格式下拉菜单307中的可选格式列表中选出的个性化文档展现格式。应该理解,其他类型的订制信息是可以得到的,上述列表不意味着对本发明的限定。格式风格包括例如Lotus风格和IBM风格等。
使用者可在评注区309中送入要在个性化文档中包括的个人评注。当然,进一步的评注可在日后加到该个性化文档中,而本发明仅仅提供一个短的描述性概要或对合成材料的介绍。在另一实施例中,使用者被允许根据编索引判据对整个个性化文档分段进行注释。这样,使用者可注释所完成的个性化文档内的每个主要检索题头的开始和结尾。例如,使用者可在该个性化文档的开始处写入一引言段,在每个主要部分的开始处写入一个概要向子或段落,在个性化文档的结尾加上结论。在图3B中描绘的评注GUI中进行不只一个使用者评注的输入和选择,这将在下文中描述。
最后,使用者在输出选择区313中选择输出方法。使用者选择多种输出方法之一,这包括浏览器、PDF、下载新的XML源、提交打印、作为文档文件保存等。在一个实施例中,个性化文档是作为一个新的XML文档输出的,它可在因特网上向外发出。
在另一实施例中,使用者还可选择在个性化文档末尾创建一个要包括的参考材料的目录。在目录中包括的参考材料是以超文本链接来展现的,以允许后来的使用者拖出参考材料的整个文本或相关部分。一但所有这些区域都已填完,则使用者选择提交按钮315,以开始产生文档。
图3B显示用于输入使用者评论的图形用户界面350,这些评论作为即将建成的个性化电子文档选定部分的注释。GUI350包括两框,片断框351和注释框353。片断框包括所希望的个性化文档布局的内容列表。在内容列表中的每一项是一可选择项,当它被选定时,它把注释框353中写入的评注与该特性项耦合起来。这样,例如,使用者选择引言-概要项,然后在注释框353中送入被写的评注。当他已完成他的评注时,他再选择另一项并送入相应的评注。对另一项的选择导致打开注释框353中的另一页,或者,如果该项在先前已被选择过,则打开与此项对应的先前框。在该框的下方是用于确定在该个性化文档片断内该评注位置的位置(或安排)图标357。图中显示出3个可能的位置,它们有相应的按钮。这些按钮是之前按钮359A、之后按钮359B和选择按钮359C。对这一安排功能的各种修改是可能的。这些按钮可以在每个项选择之后被单个选择,或者应用于整个个性化文档。一旦完成评注,使用者选择返回按钮361,它关闭GUI350。
在另一最佳实施例中,GUI350被用作创建个性化文档的框架。为内容列表中每一项写入的评注被用于搜索相关的参考信息。这样,当选择返回按钮361时,在每个评注中的关键词被选作搜索词或短语送入图3A的搜索查询区。这些搜索词在因特网上传送出去,并返回针对特定片断的特定搜索词的命中。然后使用者为每个片断选择相关的命中并把这些命中提交给产生文档实用程序。在一个实施例中,由关键词和从各相关参考材料中提取的信息创建索引词或索引头。
图4显示使用者进行搜索数据库和其后向产生文档实用程序提交相关参考材料的交互过程。该过程在块401开始,然后进入块403,在那里使用者送入搜索查询。一旦返回搜索结果,则在块405中选择适当的匹配以用作参考。然后,使用者在块407中送入标题、索引、注释、格式以及输出信息。一旦使用者已送入了所有的必要信息,则在块409由使用者提交产生个性化文档请求,于是过程在块411结束。如参考图3B讨论的那样,可以以不同的过程顺序完成本发明的其他实现。这里展现的顺序只是为了举例说明。
现在参考图6,图中显示本发明主要功能的方框流程图。如图中所示,3个参考文档DOC.A601、D0C.B603和DOC.C605用作创建个性化文档DOC.D615的输入。每个参考文档有多个基于其XML格式的子部分。对参考文档中类似项的选择是基于它们的XML格式的语义标记。该信息有元数据,它们可以根据主题、标题和作者来分开。所以可能进行按上下文的搜索。语法分析实用程序607分别分离出参考材料的各单个组成部分,并把这些分离开的部分送到编辑器实用程序609。编辑器实用程序609把各参考文档中的相似片断(例如DOC.A601中的W与DOC.B603中的W等)组合起来。可以按使用者确定的顺序或按缺省顺序进行这种组合。然后,利用XML格式、索引头以及参考文档中的其他底层组成部分,由参考文档编辑出个性化文档,这里将来自全部3个源的相似区域组合到一特定的索引头之下。然后将编辑过的片断送到编索引实用程序,它创建所编辑的片断的索引,如下文中参考图6描述的那样。然后格式器实用程序613对个性化文档编排格式,包括***索引、个人评注、标题、参考片断等。然后根据使用者选择的输出方法输出个性化文档DOC.D615。虽然各实用程序是按一特定顺序描述的和以连接链来显示的,但描述这些实用程序的顺序对本发明的各种实施例而言是不重要的。在一些应用中,特定的实用程序,如编索引实用程序611,可以作为独立实用程序。再有,用其他功能部件实现这里描述的本发明各特定功能是可能的。
图5显示根据本发明对文档编索引的过程。编索引过程在块501开始,然后进入块503。在块503,使用者被提示送入所希望的索引深度。一旦收到索引深度信息,则在块505加载题头和子题头类别列表,这些题头可以由使用者提供,或根据相关主题从索引数据库中提取。然后,在块507,利用题头和深度信息搜索该文档。取决于该文档的复杂程度,这种搜索可在段落级或片断级完成。接下来,在块509基于搜索产生主要点分布图。然后,在块511,与每个主要点相关的小点被映射到它们各自的主要点。然后在块513确定是否已达到所需要的深度。如果尚未达到所需要的深度,则继续在块511进行在下一个深度/级别寻找下一个小点的步骤,每次重复便产生更细小点的更深度索引。一旦达到了所希望的深度,则在块515向使用者输出该索引。然后在块517,该索引被加在该文档的开始处。然后该过程在块519结束。
应该理解,在本发明范围内,为完成编索引功能,其他过程决可能是必要的,或者这些过程块可以以不同的顺序排列。例如,可以在文档内从文档起始到结尾顺序地评估每类题头和子题头。再有,编索引可在原来的文档上完成,也可在新建的合成文档(即一个性化文档)上完成。信息中心GUI300的索引选择区还可扩展到允许使用者送入所希望的个性化文档内信息展现序列,它也直接影响索引的布局。
这样,本发明操作格式化为语义XML单元的信息,这有助于它本身进行面向对象的发现。本发明实现一个查询界面,它把使用者的意图映射成信息数据库的语义。本发明还实现了一个交互界面,它使使用者能添加注释、选择导航能力(内容表、一般索引或受主题限制的索引、到其他源或来自其他源的链接集)。该界面还使能选择展现风格(通常,企业业务规则影响重发表的信息的外表和感觉),以及选择所希望的结果格式(作为一个新的信息单元重新引入到该文献中或输出到其他数据库中,作为可读的在线格式供个人使用,作为分页格式结果以适于打印等)。
本发明实现文档内或文档数据库内的搜索,并过滤出与搜索查询对应的相关项,然后返回一个已做好的、高度链接的合成文档,它干净地注释和关联那些突出点。然后这合成文档或者可作为对已有的研究信息集合的补充,或者可以作为一个再生文档传输出到其他数据库,从而实现该合成文档的共享。
最后,重要的是,尽管本发明的实施示例是在全功能数据处理***的环境中描述的,但本领域技术人员将会理解,本发明实施例的软件方面能作为各种形式的程序产品发布,而且不论实际进行这种发布所用的信号承载介质的具体类型如何,本发明的实施示例同样地适用。信号承载介质的实例包括可记录型介质,如软盘、硬盘驱动器、CDROM,以及传输型介质,如数字的和模拟的通信链路。
尽管已经参考最佳实施例具体显示和描述了本发明,但本领域技术人员将会理解,这里可进行形式和细节上的各种改变,而不离开本发明的精神和范围。

Claims (15)

1.一种在数据处理***内由至少一个电子参考文档以电子方式创建个性化文档的方法,所述方法包含如下步骤:
响应使用者的输入,选择所述至少一个电子参考文档;
把所述至少一个电子参考文档解析成若干子成分;
响应所述解析步骤的完成,从所述子成分中聚集类似项,以创建所述个性化文档;以及
根据使用者在创建文档前所作的选择,输出带有一组产生的导航能力的所述个性化文档。
2.权利要求1的方法,进一步包含如下步骤:
以文档产生前由所述使用者送入的评注来注释所述个性化文档;以及
根据使用者选择的索引选项和索引深度,对所述个性化文档编索引,其中所述编索引步骤利用从所述子成分中提取的关键词。
3.权利要求1的方法,其中所述选择步骤包括把所述至少一个电子参考文档的内容复制到与所述数据处理***相连的暂时存储单元之中的步骤。
4.权利要求1的方法,进一步包含对所述至少一个电子参考文档进行上下文搜索的步骤,其中所述搜索是根据使用者送入的查询和上下文信息进行的。
5.权利要求4的方法,其中在所述进行搜索步骤中的至少一个电子文档是以扩展标识语言建立的,有元标记用于区分所述至少一个电子文档的相关片断,而且其中所述进行搜索步骤搜索一个材料数据库以得到所述至少一个具有所述元标记的电子文档。
6.权利要求5的方法,其中所述搜索是在因特网上进行的,所述材料数据库包括至少一个由相关超文本链接代表的网页,其中所述至少一个电子文档位于所述至少一个网页上,所述选择步骤包括选择所述至少一个电子文档的超文本链接。
7.权利要求5的方法,其中所述解析步骤利用所述元标记和产生文档前由使用者送入的判据集合来描述所述至少一个电子文档的所述子成分。
8.权利要求7的方法,其中所述聚集步骤包括下列步骤:
使所述子成分彼此匹配;
对所述具有类似元素的子成分进行组合,以创建子集组;以及
链接所述子集组,以产生所述个性化文档。
9.权利要求8的方法,其中所述输出步骤包括下列步骤:
把使用者在产生文档之前选择的格式偏好应用于所述个性化文档;
在所述个性化文档中预先确定标题和概要;以及
把所述个性化文档中的所述索引放在预先确定的位置处。
10.一种以电子方式创建个性化文档的方法,包含下列步骤:
创建包括关键词的个性化文档注释概要,用于包括到所述个性化文档中;
将所述注释概要提交给搜索引擎,使能搜索和提取具有关于所述关键词的组成部分的参考材料;
接收一组所述参考材料;以及
利用所述注释概要和所述一组参考材料的所述组成部分,合成所述个性化文档。
11.权利要求10的方法,其中在所述创建步骤中的所述注释概要包括标题、引言和对一个或多个所述关键词的评注。
12.权利要求10的方法,其中所述合成步骤包括下列步骤:
为所述个性化文档选择格式编排风格;
为所述个性化文档选择输出方法;以及
在所述个性化文档已被合成之后创建所述个性化文档索引。
13.权利要求12的方法,其中所述创建步骤包括选择所述索引深度的步骤。
14.一种以电子方式创建个性化文档的***,包含:
注释装置,用于送入关于所述个性化文档的使用者评注;
搜索装置,用于在一电子文档数据库中搜索与所述使用者评注中的那些关键词相关的参考材料;
用户界面提供装置,用于允许使用者选择要包括在所述个性化文档之中的相关参考材料和导航能力;
文档产生装置,用于利用所述相关参考材料、所述用户评注和所述导航能力,产生所述文档;以及
输出装置,用于输出所述个性化文档。
15.权利要求14的***,进一步包含一个编索引装置,用于创建所述个性化文档的索引。
CN01112120A 2000-03-31 2001-03-29 以电子方式创建个性化文档的***和方法 Expired - Fee Related CN1127031C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US54043500A 2000-03-31 2000-03-31
US09/540,435 2000-03-31

Publications (2)

Publication Number Publication Date
CN1319817A CN1319817A (zh) 2001-10-31
CN1127031C true CN1127031C (zh) 2003-11-05

Family

ID=24155457

Family Applications (1)

Application Number Title Priority Date Filing Date
CN01112120A Expired - Fee Related CN1127031C (zh) 2000-03-31 2001-03-29 以电子方式创建个性化文档的***和方法

Country Status (5)

Country Link
JP (1) JP2001306552A (zh)
KR (1) KR100403947B1 (zh)
CN (1) CN1127031C (zh)
AU (1) AU781901B2 (zh)
SG (1) SG96607A1 (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7356537B2 (en) * 2002-06-06 2008-04-08 Microsoft Corporation Providing contextually sensitive tools and help content in computer-generated documents
US7551187B2 (en) * 2004-02-10 2009-06-23 Microsoft Corporation Systems and methods that utilize a dynamic digital zooming interface in connection with digital inking
CN101408876B (zh) * 2007-10-09 2011-03-16 中兴通讯股份有限公司 一种电子文档全文检索的方法及***
KR100980575B1 (ko) * 2008-04-07 2010-09-06 송영주 다중 연속안내 연관 정보블럭 시스템에 부가된 사용자화방법
US8352514B2 (en) * 2008-12-10 2013-01-08 Ck12 Foundation Association and extraction of content artifacts from a graphical representation of electronic content
CN101539905B (zh) * 2009-04-27 2012-05-09 浙江大学 一种嵌入式多格式电子文档标注方法
US9015166B2 (en) 2009-05-30 2015-04-21 Edmond Kwok-Keung Chow Methods and systems for annotation of digital information
WO2010139127A1 (en) 2009-05-30 2010-12-09 Edmond Kwok-Keung Chow Methods and systems for annotation of digital information
US9645986B2 (en) * 2011-02-24 2017-05-09 Google Inc. Method, medium, and system for creating an electronic book with an umbrella policy
EP2620748A3 (en) * 2012-01-26 2016-04-20 Hyundai Motor Company Device for providing or generating intertwined information related to a space of interest.
CN104021131B (zh) * 2013-03-01 2017-08-08 ***通信集团浙江有限公司 一种多维度页面的发布方法、装置及***
CN105608227B (zh) * 2016-01-26 2019-02-19 唐山新质点科技有限公司 文档数据检索方法及装置
KR102183815B1 (ko) * 2019-02-15 2020-11-27 리걸테크 주식회사 데이터 관리 시스템 및 데이터 관리 방법
CN113157996B (zh) * 2020-01-23 2022-09-16 久瓴(上海)智能科技有限公司 文档信息处理方法、装置、计算机设备及可读存储介质
KR102633515B1 (ko) * 2020-12-23 2024-02-06 정신호 모바일 콘텐츠 자동생성 시스템
CN114995690A (zh) * 2021-03-01 2022-09-02 北京字跳网络技术有限公司 一种文档创建方法、装置、设备及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0926970A (ja) * 1994-12-20 1997-01-28 Sun Microsyst Inc 情報を検索するコンピュータによる実行方法及び装置
US5708825A (en) * 1995-05-26 1998-01-13 Iconovex Corporation Automatic summary page creation and hyperlink generation
US6029182A (en) * 1996-10-04 2000-02-22 Canon Information Systems, Inc. System for generating a custom formatted hypertext document by using a personal profile to retrieve hierarchical documents

Also Published As

Publication number Publication date
CN1319817A (zh) 2001-10-31
KR20010094955A (ko) 2001-11-03
SG96607A1 (en) 2003-06-16
KR100403947B1 (ko) 2003-10-30
JP2001306552A (ja) 2001-11-02
AU781901B2 (en) 2005-06-23
AU7186600A (en) 2001-10-04

Similar Documents

Publication Publication Date Title
Ovsiannikov et al. Annotation technology
Denoue et al. An annotation tool for Web browsers and its applications to information retrieval.
US6968332B1 (en) Facility for highlighting documents accessed through search or browsing
Hammer et al. Semistructured data: The TSIMMIS experience
US6654737B1 (en) Hypertext-based database architecture
US8812945B2 (en) Method of dynamically creating real time presentations responsive to search expression
CN1127031C (zh) 以电子方式创建个性化文档的***和方法
US20030050927A1 (en) System and method for location, understanding and assimilation of digital documents through abstract indicia
GB2401215A (en) Digital Library System
JP4469432B2 (ja) インターネット情報処理装置、インターネット情報処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
Harper et al. Middleware to expand context and preview in hypertext
Nagao et al. Semantic Transcoding: Making the WWW More Understandable and Usable with External Annotations
WO2001029709A1 (en) System and method for location, understanding and assimilation of digital documents through abstract indicia
Ahonen et al. Design and implementation of a document assembly workbench
Deb TERI integrated digital library initiative
Chang An electronic finding aid using extensible markup language (XML) and encoded archival description (EAD)
Passin Browser bookmark management with Topic Maps.
Dunlop et al. Hypermedia & probabilistic retrieval
Dave et al. Dynamically growing hypertext collections
Ford et al. Interactive multimedia publishing systems
Makedon et al. Enabling Technologies and Authoring Issues
Broady et al. Internet and the humanities: the promises of Integrated Open Hypermedia
Makedon et al. Electronic multimedia publishing: enabling technologies and authoring issues
Scott et al. Creating a massive master index for HTML and print
Clavaud et al. Controlling the production of EAD encoded documents, extracting metadata and publishing them on the web: methods and tools, France

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee