CN1471679A - 采用元标志信息的可扩展格式底稿设计 - Google Patents

采用元标志信息的可扩展格式底稿设计 Download PDF

Info

Publication number
CN1471679A
CN1471679A CNA028011198A CN02801119A CN1471679A CN 1471679 A CN1471679 A CN 1471679A CN A028011198 A CNA028011198 A CN A028011198A CN 02801119 A CN02801119 A CN 02801119A CN 1471679 A CN1471679 A CN 1471679A
Authority
CN
China
Prior art keywords
file
sgml
markup language
dynamic object
sign
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA028011198A
Other languages
English (en)
Inventor
Es
E·S·黄
H·J·金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
XMLCities Inc
Original Assignee
XMLCities Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by XMLCities Inc filed Critical XMLCities Inc
Publication of CN1471679A publication Critical patent/CN1471679A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • G06F40/154Tree transformation for tree-structured or markup documents, e.g. XSLT, XSL-FO or stylesheets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)
  • Devices For Executing Special Programs (AREA)

Abstract

本发明公开了采用元标志信息的可扩展格式底稿设计的方法和装置。一已设计格式底稿用于将面向内容的标记语言文件转换为目标文件以支持各种演示文稿和信息交换。依据一方面,一数据处理机制以在目标文件中***元标志说明开始,其中元标志信息属于在目标文件的动态对象和一源文件之间的信息。此带有元标志信息的目标文件然后被转换为一个或更多可扩展格式底稿。

Description

采用元标志信息的可扩展格式底稿设计
相关申请的相互参考
本申请要求了以下美国临时申请的权益:
美国临时申请NO.60/282609,申请日2001年4月9日,名称为“用于采用元标志信息的可扩展格式底稿设计的方法和装置”;
美国临时申请NO.60/306095,申请日2001年7月17日,名称为“用于采用元标志信息和/或相关元标志信息的可扩展格式底稿设计的方法和装置”;
美国临时申请NO.60/314592,申请日2001年8月23日,名称为“用于可扩展标记语言转换和采用元标志信息和/或相关元标志信息的可扩展格式底稿设计的方法和装置”;以及
美国临时申请NO.60/349957,申请日2002年1月17日,名称为“可扩展标记语言转换和采用元标记信息和/或相关元标记信息的格式底稿设计”;
以上申请作为参考包括在本申请之中。本申请也与美国未决专利申请NO.09/754969,名称为“用于利用文件类型定义产生结构文件的方法和装置”相关,仅供参考。
发明背景
技术领域
本发明涉及文件处理和电子出版***领域,而且尤其是,涉及用于设计可扩展格式底稿的技术。
背景技术
Internet是急剧增长的遍及全球的计算机互连通信网络。数以百万计连接的计算机共同形成了一个易于被任何互连的计算机在任何时间任何地点访问的巨大的超链接信息存储库。随着每天或每年数以百万计网页被建立并加入此巨大存储库,非常需要能迅速并容易地将诸如演示文稿、数据底稿或小册子的文档转换为一种能供Internet上其他应用或设备显示和访问的格式。
众所周知,可供万维网浏览应用(即浏览器)显示的较优格式是诸如超文本标记语言(HTML),可扩展标记语言(XML),标准通用标记语言(SGML)或无线标记语言(WML)。由万维网浏览应用撰写、编辑或管理的文件或文档通常是指结构化文件或文档。在结构化文档中,一诸如XML或SGML的面向内容的结构化文档能支持任何来自文档类型定义(DTD)或模式的标识标志,而HTML或WML的演示文稿文档只能支持一套固定的标识标志。
采用适用于特殊要求媒体的格式变换来动态转换面向内容结构化文档的命令开创了信息交换和存储的新范例。例如,网站内容以XML格式进行存储。如果台式电脑中的万维网浏览器(即Nescape或IE)请求来自网站的信息,网站优先将XML内容转换为HTML已转换内容并随后将已转换文件发回浏览器。如果一便携设备(即PDA或可访问Internet单元电话)通过一微浏览器向相同网站请求信息,网站优先将XML内容转换为WML已转换内容并将已转换文件发回微浏览器。而且,网站也能将内部XML转换为另一类型的XML以在网站间交换信息。
前述用于各种出版和信息交换的例子需要从XML适当转换为各种格式。
发明内容
本单元概述本发明一些方面并简要介绍最佳实施例。简化或省略可避免使本单元目的不明确。此简化或省略并不限制本发明的范围。
本发明属于利用元标志(meta-tag)信息来设计用于将源XML文件转换为目标文件的可扩展格式底稿(XSL)。根据本发明的一个方面,当显示目标文件时(即在浏览器或授权工具上),输出演示文稿包括许多对象,例如图画或文句或一组单词。一些对象在某种意义上是动态的,这些对象分别与源文件中的源元素或对象链接,使得源对象的任何改变将动态地映射到目标文件中。每个***元标志(meta-tag)规定了与源文件中相应源对象的关系。作为本发明的特征之一,放置源标志的独特方法有赖于申请和实现来提供。
一旦在目标文件中创建了元标志,一转换模块自动产生关于目标文件的结果XSL文件。转换模块搜索元标志并随后产生用于目标文件的XSL。
本发明可以方法、***、软件产品或其他形式实现。根据一种实现方式,本发明是一种方法。此方法接收用于源XML的包括文档类型定义(DTD)的定义文件并通过剪贴板、拖放机制或OLE数据传送机制从定义文件中输出元标志信息至用于目标文件的授权工具。嵌入源元标志信息的目标文件进一步转换为XSL文件。在一种实现中,元标志信息从模式文件(schema file)或源XML文件输出。在另一实现中,源标志信息通过在目标文件的授权工具直接输入来创建。然而,XSL文件从包括至少一表示与源文件结合关系的元标志的目标文件中创建。
前述所产生的目的、利益和优点可由本发明以下参照附图描述的实施例而获得。
附图说明
本发明的这些以及其它特征、方面以及优点将在以下说明书、所附权利要求和附图中更为清楚:
图1A表示依据本发明最佳实施例实现的基本***配置;
图1B描述了本发明实现并达到预期结果的***内部结构块;
图2A是用于接收类型文档的文档类型定义(DTD)的例子;
图2B表示基于图2A的文档类型定义(DTD)的可扩展标记语言(XML)文件;
图3A表示可扩展格式底稿语言(XSL)文件,用来将如图2B的XML文件转换为HTML文件;
图3B表示图3A的已被转换的HTML文件的屏幕抓图;
图3C表示一XSL文件,将图2B的XML文件转换为一WML文件;
图3D表示一XSL文件,将图2B的XML文件转换为另一XML文件;
图4A表示一带有***元标志信息的目标HTML的屏幕抓图;
图4B表示一带有***元标志信息的目标XML的屏幕抓图;
图5A表示通过一拖放机制输出元标志信息的XML/DTD/模式编辑器(XDTD)产生的目标文件的输出表示;
图5B表示利用XDTD编辑器创建用于HTML文件的XML文件的DTD以及包括所创建DTD的扩展视图的例子,基于所创建DTD而创建的XML元素以及带有元素数据结点和元素属性结点的XML树的扩展视图;
图5C表示相应XML文件;
图5D表示用于XML文件树结构的数据结点(用于相应元标志);
图6A表示在FrontPage中带有***元标志信息的目标HTML文件,尤其是,此HTML文件是静态文本,例如“Title”、“From”、“Ingredient”……,和来自源XML文件的动态信息或对象的组合;
图6B表示在FrontPage中带有***元标志和相关元标志信息的目标HTML文件的一个例子;
图6C表示一元标志相关文件,包括分别由元标志来表示的动态对象,其中每个元标志均以{xc_xsl for-each}开始,以规定相关XSL动作和/或源XML标志;
图7A描述了数据处理装置方框图,在此装置中带有元标志信息的目标文件由授权工具创建并通过转换器转换为XSL文件;
图7B描述了依据本发明一实施例产生一可扩展格式底稿的流程图;
图8A描述了带有作为根元素的<root/>的XML文件;
图8B描述了参照图8A中文件相应的HTML文档;
图8C表示包括带有分XML文本数据的元素的HTML文档的一个例子;
图9表示处理动态对象流程图,此对象涉及源文件中相同元素并可结合附图8A-8C理解。
具体实施方式
在本发明以下的详细描述中,为全面理解本发明,对大量特定细节进行了阐述。然而,很明显对于本领域普通技术人员即使不参照这些特定细节也可实现本发明。另一方面,公知的方法、过程、组件和电路未详细描述以避免本发明不必要的不清楚的方面。详细描述大多按照过程、逻辑块、处理和其他直接或间接类似于耦合到网络的数据处理设备操作的符号表示来给出。这些处理描述和表达是本领域普通技术人员用来将他们的工作材料最有效传送给本领域其他普通技术人员的方法。
在此参照“一个实施例”或“一实施例”方法,其中结合此实施例所描述的一特殊特征、结构或特性可被包括在本发明的至少一个实施例中。出现在说明书各处的词组“在一个实施例中”并非都指相同实施例,也不是与除其他实施例之外独立或可选的实施例。而且,在描述本发明一个或更多实施例的处理流程图或图中的块命令并不固定表示任何特殊命令也不对本发明做任何限制。
参照附图,其中几个视图中相同部分采用相同附图标记。图1A表示依据一最佳实施例本发明实现的基本***配置。包括诸如产品描述、功能列表和价格表信息的面向内容的文档可利用运行在计算机100上的授权工具来创建。更可取地,这些文档为XML(可扩展标记语言)格式。XML(可扩展标记语言)是一种创建普通信息格式以及共享万维网、Intranet和其他网络上格式和数据的灵活方法。因为标识符不定且自定义,所以不像HTML,XML是“可扩展的”。在如何创建文档结构的标准上,XML实际上是标准通用标记语言的更简单和更易用的子集。
可在计算机设备102中创建用于将这些文档转换成各种表示的可扩展格式底稿(或XSL),这些计算机设备可为下载有本发明实现的一个实施例的可运行版本的服务器或台式计算机。
在一种设置中,计算机100和计算机设备102是不分离的且执行文档转换处理最终以诸如WML和HTML的标记语言格式表示内容。在一种应用中,XML表示并经XSL变换的面向对象文档可通过一专用网络110传送至其主机通常作为WWW(万维网)站点的服务服务器104。
在一种情况下,一用户利用一操作浏览应用并与数据网络108耦合的台式计算机106来访问服务服务器104上的文件。在另一情况下,一用户利用一操作WAP浏览应用并(也许经由一无线网络)与数据网络108耦合的PDA110访问服务服务器104的文件。这些被请求的XML文件将通过适当的XSL文件被转换成WML文件并发回给PDA
正如以下所要描述的,本发明并不局限于Internet应用。本发明可应用于用户经常脱机创建XSL文件以将XML文件转换为HTML或WML文件的单机。由于内容和演示文稿分开,用户可方便地创建另一套用于不同视觉和感觉的XSL文件。
图1B表示可实现并运行本发明的***118的内部结构块。***118对应于一客户设备(即计算机100、102或106)或一服务器设备(即服务器104)。如图1B所示,***108包括与数据总线120相连的中央处理单元(CPU)122和设备接口124。CPU122运行一定指令以管理所有与用于同步操作的数据总线120相连的设备和接口而且设备接口124可与诸如计算机102的外部设备相连,因此其中的文档被接收并通过数据总线120存入内存或存储器。与数据总线120的接口包括一显示接口126、一网络接口128、一打印接口130和一软盘驱动接口138。通常,本发明一个实施例的可运行版本通过软盘驱动接口138、网络接口128、设备接口124或其他与数据总线相连的接口被下载并存入内存(即132、134或136)。
诸如随机存储器(RAM)的主存132也与数据总线120相连以提供给CPU122指令和可访问存储数据和其他指令的内存存储器136的CPU122。尤其是,当运行所存储的应用程序指令时,例如本发明中已编译和链接的版本,CPU122通过操作数据得到本发明预期结果。假如存在任何恒定指令序列,ROM(只读存储器)134用来存储诸如用于键盘140、显示器126和浮点设备142操作的基本输入/输出操作***的恒定指令序列。
依据一个实施例,一诸如XML的面向内容文档以文档类型定义(DTD)或模式开始来定义文档元素。图2A描述了一个用于“接收类型”文档的DTD200的例子,其中一文档被分成文档元素结构。一特殊文档元素202可包含其他文档元素和属性。文档元素204的另一例子只包括语法分析字符数据。图2B表示XML文件的一个例子,其中信息用如图2A的文档类型定义(DTD)定义的语法分析数据元素表示。
一XML文件可采用可扩展格式底稿(XSL)转换成各种表示。将XML文件206转换成HTML文件的XSL文件的一个例子如图3A所示。尤其,块302表示当XSL文件匹配标志“document”时创建顶级<html>标志以及块304表示如何将值从源XML文件值分配到目标HTML文件中。从一浏览器应用(即Microsoft Internet Explorer)所得到的HTML对应的屏幕抓图如图3B所示。
将XML文件206转换成WML文件的XSL文件的另一例子如图3C所示。尤其,块314表示当XSL文件匹配根元素时创建顶级<wml>标志,块312表示如何将“title”值从源XML文件值分配到目标WML文件中,以及块316表示如何将“originate”元素的“name”属性从源XML文件值分配到目标WML文件中。
除了将XML文件转换成各种表示,一XSL文件也能将XML文件转换成带有不同DTD或模式的另一XML文件。此种转换的首要原因是不同***间的信息交换。图3D表示将XML文件206转换成另一带有一列接收标题的XML文件的XSL文件的例子。尤其,块320表示当XSL文件匹配“document”元素时创建顶级<recipe_title_list>标志以及块322表示如何将源XML文件的每个“title”值分配到目标XML文件的<recipe_title>标志中去。
从以上XSL的例子可知XSL文件是一目标文件(即以HTML、WML或XML格式)和<xsl:>标志的组合,它将来自源XML文件的信息和/或通过源XML的DTD或模式文件的信息建立联系。本发明属于设计XSL文件的技术。依据一个实施例,使用了一授权工具。此授权工具可为用于HTML的FrontPage、用于WML的Intava GravityProfessional以及用于XML的XML编辑器。具有这些WYSIWYG授权工具之一,用户可设计目标文件的视觉-和-感觉或一带有XML编辑器的输出演示文稿并且用户可设计表示源对象(即文件元素)间继承关系的目标XML树,以上均在未决美国专利申请:NO.09/754969中详细描述。然后,用户可利用对应于目标文件的授权工具***规定相应源信息的元标志信息。带有元标志信息的目标文件可被下载到自动产生关于目标文件或演示文稿的结果XSL文件的XSL转换模块。
图4A表示在FrontPage中带有***元标志信息的目标HTML文件的一个例子。例如,一原始对象“Green Chili Salsa”被一元标志“xc_xslt value-of document/recipe/title”替换。尤其,此HTML文件是诸如“Title:”、“From:”、“Ingredient:”的静态文本和来自源XML文件的动态信息(即各对象)的组合,其中动态对象用元标志表示,在此例中,包括在一说明{xc_xslt…}中。依据一个实施例,在一说明中,存在至少两项,一项用于用户规定操作,例如“value-of”,其他项用于路径信息,例如“document/recipe/title”,这样可规定相关XSL动作和/或源XML文件中的源对象。而且,元标志说明中的诸如字体大小、颜色、样式的文本也将在转换过程中被传入动态信息。图4B表示在转换后产生用于接收标题列表的XSL文件318的XML编辑器中带有***元标志信息的目标XML文件的另一例子。为更易于对本发明进行详细描述,此处提供基于HTML的一个例子并不应作为对本发明的限制。本领域普通技术人员应能理解此处例子以及描述可很容易地应用到其他标记语言。对于一所给将被转换为XML的HTML目标文件,可通过诸如Microsoft Internet Explorer或文本编辑器的浏览器打开HTML目标文件。所示HTML文件不仅包括HTML文件内容还包括HTML定义用来描述当用浏览器(即Internet Explorer)浏览时HTML文件视觉和感觉的配套标志。
一旦HTML文件被浏览器打开,用户可打开一诸如商业地址为1617A S.Main Street,Milpitas,CA95035的XMLCities公司的XDTD编辑器的XML实用程序并创建如图5A所示的DTD元素441。在DTD池440中,用户能创建新元素、新实体、新符号、新PI以及新注释,它们中的一些直接与浏览器所显示的对象相关。图5B表示利用XDTD编辑器创建用于HTML文件的XML文件的DTD的一个例子,且包括所创建的DTD的扩展视图451、基于所创建的DTD创建XML元素的一个例子452以及带有用于元素的数据结点和属性结点的XML树453的扩展视图。
一旦XML树被创建,用户可复制诸如图5A的一对象461的HTML数据内容的一部分并可将它作为XML树中标题元素的数据通过剪贴板、拖放机制或OLE数据转换机制***到XDTD实用程序。HTML数据的其他部分可以相同方式被***到XML树中。
在HTML文件中必要的相应内容或对象被***到XDTD编辑器的XML树后,用户可创建如图5C所示的XML文件。基于所给的XML文件和/或相应DTD文件,依据本发明的一个方面,创建XSL文件以反映当XML文件为源文件时HTML文件所表达的视觉和感觉。不像HTML的情况,XML的元素名称无固有演示文稿语义。缺少格式底稿,处理器(即Microsoft Internet Explorer)除了一串一致的字符以外也许不知如何提供文档内容。从输出演示文稿并利用DTD和XML树产生XML源更详细的介绍可参看美国专利申请:NO.09/754,969。
在某个方面,XSL提供了一综合模型和采用XML语法写此格式底稿的词汇。为创建一XSL文件,一自动XSL产生模块也是本发明要实现的。依据一个实施例,元标志用于将源文件(即一XML文件)中各元素或源对象与目标文件(即一HTML文件)中某些动态对象建立联系。此处的元标志或元标志信息指任何来自源文件(即XML文档)的信息,它包含与源文件中特殊元素相关的信息以及它的元素与源文件中其他元素之间的关系。例如,如图5D所示的数据结点476的元标志是{xc_xslt:document/recipe/title},其中document/recipe/title表示数据结点的位置和与其父结点即title结点及XML文件中其他元素的关系。相关元标志信息指任何来自诸如包含或能用于显示有关XML文档的元标志信息的信息的HTML或XML文件的数据。例如,如图5D中471是一相关元标志信息,因为它能用于搜索元标志信息476,就像XML文件中{xc_xslt:document/recipe/title}的document/recipe/title。可选地,元标志信息包括至少一个用户规定的操作,例如<xsl:value-of\>。
在本发明的一个实施例中,XML文件可存储在计算机内存中并可利用诸如万维网共同体(W3)的文档对象模块(DOM)核的XML语法分析程序搜索元标志,还可使用其API,例如parentNode( )、nextSibling()、childNodes()、getNodeName()、nodeName()和nodeValue()。
由于XML文件结点为对象分级体系,图5D的476可作为用于获得元标志信息的相关元标志信息,将DOM语法分析程序指针定位在DOM树的根元素上、利用nodeName()来确认并将根元素的名称以{xc_xslt:document}存储至单独的存储器中、利用NodeValue()来比较它的结点值和元标志信息476。假如它们不相等,利用firstChild()移动到它第一个子元素即接收元素,利用nodeName()来确认并通过将存储器位置内容与作为{xc_xslt:document/recipe}接收的新结点名称并置而将结点名称存储至与{xc_xslt:document}相同的存储器位置,并将它的nodeValue()与元标志信息476进行比较。递归以上方法可得到元标志信息476,例如{xc_xslt:document/recipe/title},直到当nodeValue()等于图5D中的471时,利用相关元标志信息471停止递归。
同样,用户可利用反向递归方法得到用于图5D中的475、472和473的元标志信息。因此,用户可发现所有包含相关元标志信息的数据结点并随后利用DOM语法分析程序的parentNode()API在反相并置元标志信息,如{xc_xslt:title}至{xc_xslt:recipe/title}和{xc_xslt:recipe/title}至{xc_xslt:document/recipe/title}时来建立元标志信息。在本发明的另一实施例中,用户也可利用带有附加条件的相同递归方法得到元标志信息476、472和473,此附加条件例如为假如nodeValue()等于相关元标志信息,则DOM语法分析程序指针将利用来自建立元标志信息的并置名称的nextSibling()跳过元素结点。因此,由于用于元标志信息通过关联来建立,图5D的475、472、473是相关元标志信息。
用户还可利用带有***元标志信息和/或相关元标志信息的WYSIWYG授权工具来设计目标演示文稿的视觉-和-感觉。带有元标志信息和/或相关元标志信息的目标文件将下载到可自动产生与WYSIWYG授权工具中目标演示文稿的视觉-和-感觉相匹配的XSL文件的XSL转换器。在一个实施例中,假如目标文件包含相关元标志信息,此相关元标志信息可用于发现包含相应于目标文件相关元标志信息的XML文档中的元标志信息,并在XSL文件创建处理中用XML文档中的元标志信息替换目标文件的相关元标志信息。
依据本发明的一个实施例,一简单自动XSL转换可以以下方式实现。当需要保持往浏览器所看到的HTML文件的视觉-和-感觉,首先依据XML标准检测并编辑带有元标志信息和相关元标志信息的HTML文件的演示文稿格式。对HTML文件进行改变,例如所有标志具有开始和结束构件、空元素正确格式化,引用所有属性值以及正确嵌套所有标志。一旦对HTML文件依据XML标准作必要改变并确认其格式,HTML文件可通过诸如被万维网共同体(W3)定义为DOM核的XML语法分析程序被下载到计算机存储器。
一旦HTML文件被DOM语法分析程序作为一级结点对象下载到用户计算机存储器,DOM语法分析程序的API首先分离HTML文档数据结点值核属性结点值。假如HTML文件包含相关元标志信息,带有/不带有相关DTD文件并包含匹配相关元标志信息的XML文件可用于确定元标志信息。一旦从XML文件中确认元标志信息,相关元标志信息将被所发现的元标志信息替换。
所有下载到计算机存储器的HTML文档的元标志信息进一步进行处理,所以假如元标志信息为{xc_xslt:document/recipe/title},则将被替换为{xsl:value-of select=″document/recipe/title″}。假如元标志信息是HTML文档属性结点值,元标志信息可被替换为{xsl:value-ofselect=″document/recipe/image/@img″}。在XML语法分析程序中的HTML的元标志信息和结构可进一步改变使得它能支持任何用户选择的XSL元素。
当<?xml version=′1.0′encoding=′ISO-8859-1′standalone=′yes′><xsl:stylesheet verrsion=″1.0″xmlns:xsl=″http://www.w3.org/1999/XSL/Transform″><xsl:template match=″/″>可加到XSL说明之后时,XSL的说明将通过XML语法分析程序API(DOM核)而被加到语法分析HTML文档的开始处,而且</xsl:template></xsl:stylesheet>将通过XML语法分析程序被加到语法分析HTML文档的结尾以将语法分析HTML文档变换为一有效XSLT文档并将XSLT文档作为有效XSL文件输出。
在本发明创建简单XSL/XSLT文件的另一实施例中,用户开始通过XML Citites的XDTD编辑器的输入实用程序输入一XML文件,并通过WYSIWYG授权工具的剪贴板、拖放机制或OLE数据转换机制***XML文件的元标志信息或相关元标志信息来动态创建新HTML文件。
图6A表示在FrontPage中带有***元标志信息的目标HTML文件的一个例子。尤其,此HTML文件是静态文本,例如“Title”、“From”、“Ingredient”……,和来自源XML文件的动态信息或对象的组合。而且动态信息在元标志中表示,在此例中此元标志包含说明{xc_xslt...}且在此说明中存在诸如“value-of document/recipe/title”的值用来规定相关XSL动作和/或源XML标志。在另一例中,元标志可为其他规定相关XSL动作和/或源XML标志文本字符串。而且,文本装饰也将在转换过程中被传入动态信息。
图6B表示在FrontPage中带有***元标志信息和相关元标志信息的目标HTML文件的一个例子。尤其,此HTML文件是静态文本,例如“Title”、“From”、“Ingredient”……,和来自源XML文件的动态信息或对象的组合。而且在此例中动态信息在元标志{xc_xslfor-each}和间接由如图6C所示的元标志相关文件给出以规定相关XSL动作和/或源XML标志的相关元标志中表示。在另一例中,相关元标志可为其他作为唯一规定XSL动作和/或源XML标志的相关元标志标识符的文本字符串。尽管利用相关元标志需要附加映射,相关元标志可保持最后演示文稿的视觉-和-感觉,这在诸如FrontPage的WYSIWYG授权环境中尤其重要。
存在几种方法在目标授权工具中***元标志信息。在一实现中,通过在授权工具中直接输入元标志说明来***元标志。在另一实现中,通过从XML/DTD/模式编辑器至授权工具的剪贴板、拖放机制或OLE数据转换机制***元标志。
图7A描述数据处理装置700的方框图,其中带有元标志信息的目标文件由授权工具704创建并由转换器706转换为XSL文件。而且在授权工具中通过直接输入元标志说明或从XML/DTD/模式编辑器702的剪贴板、拖放机制或OLE数据转换机制来***元标志信息。
图7B表示根据本发明的一个实施例产生可扩展格式底稿的流程图710。在712,接收到一目标文件。如上所述,目标文件是用来在设备(即台式计算机或便携设备)上显示的演示文稿。例如,利用FrontPage创建的HTML目标文件显示在运行在台式计算机上的InternetExplorer。随着目标文件的显示,在714下载相应一个或多个源文件(即XML文件)连同相应DTD文件以便于创建可扩展格式底稿。接着,在716确定在所显示的目标文件中的动态对象并且每个动态对象均对应于源文件中的源元素或对象。取决于实现,动态对象可由用户人工确认或在目标文件创建时指出。
在718,每个元标志被确定对应动态对象之一。依据一个实施例,每个动态对象被一元标志或包括在一元标志中的路径信息替换。依据另一实施例,每个动态对象被拖动到由XML文件和/或DTD文件(如图5D)提供的XML树上一相应结点。通过拖动一动态对象到一结点,可建立动态对象和源文件中相应元素的联系。
在720,用于每个元标志的标志信息被确定,例如假设XML树的每个节点均分别对应每个元标志的相关信息,则可通过遍历XML树确定。作为722的结果,产生对应于目标文件的格式底稿。尤其,格式底稿以另一种标记语言表示在一文件中。此文件包括每个元标志的相应说明。
在某个目标文件中,存在涉及源文件相同元素的动态对象。为避免在确认相应元标志上可能存在不清楚的情况,可采用不同的确认机制。
图8A表示<root/>作为根元素的XML文件。XML文件包含采用XSLT符号的两个元素并可确认为<xsl:value ofselect=″root/book[1]/name/text()″/><xsl:value of select=″root/book[2]/name/text()″/>。
XML文件的数据和属性然后被置于HTML文件中使得HTML文件可用于产生一XSLT,其中XML文件的数据和属性可用于确认放置标志<xsl:value of select=″/″>的位置。例如,812作为图8A中<title/>元素的数据被放置。依据一个实施例,用户可利用图8AXML文档与图8BHTML文档的一字符串匹配使得HTML文档的“C++Programming”可被替换为<xsl:value of select=″toot/book[1]/name/text>。
然而,两个唯一可确定的元素的内容可作为一HTML元素标志即如图8B所示的<p/>的数据而给出。“C++Programming,Visual C++5”521作为<p/>元素的数据给出。利用DOM,“C++Programming,VisualC++5”521将被表示为<p/>元素的文本数据。通过精确的字符串匹配,由于XML文件包含“C++Programming”、“Michael Kim”“VisualC++5”以及“Ivor Horton”而不包含“C++Programming,Visual C++5”但期望的匹配是<p><xsl:value of select=″root/book[1]/name/text()″>,<p><xsl:value of select=″root/book[1]/name/text()″>时,“C++Programming,Visual C++5”将不会发现与如图8A的XML的任何数据或属性精确匹配。
本发明的特征之一是在不同存储器中存储所有XML数据和属性,其中每个XML数据和属性包含信息或与有关于元标志信息的链接。元标志信息包含有关于父元素和父元素与根结点关系的信息,因此元标志信息可有效寻址用于在<xsl:value of select=″″>中选择的正确的属性值。XML文档的数据和属性以及它们相应的元标志信息将按一顺序存储使得数据或属性可以递增或递减的顺序访问。
依据实施例,接收包含XML文档的数据或属性的HTML文档被接收。然后开始确认HTML文档数据并将此数据与存储在不同存储器中的XML数据或属性进行比较。然后对按字符串长度顺序存储在不同存储器中的数据和数据或属性进行比较和确认以确定是否最大匹配XML数据或属性被包括在HTML数据中。
图8C表示包含带有分XML文本数据元素HTML文档的一个例子。图8C显示包含图8A中文本数据“C++Programming”500的元素530<p/>。然而,文本数据进一步被分为两个独立文本数据这使得“C++”为作为<p/>元素530的子的<b/>的子而且“Programming”为<p/>元素的子。应注意到531和532均属于<p/>元素。
依据本发明的一个实施例,为将分文本数据作为HTML元素的相关元标志信息,利用了531和532均属于为530的<p/>元素的事实。本发明的软件实现获得530的子元素的第一文本数据531并将其放入一不同的存储器。然后本发明最佳实施例的软件实现获得下一文本数据532作为530下一相邻子结点并将532存储在530的下一位置。对于被给的元素不再发现有下一子元素或子元素的子之后,本发明首选的软件实现搜索用于匹配的XML文本数据或属性,例如并置的531和532。当发现匹配时,530的整个内容将被不久将替换为<xsl:value ofselect=″root/book[1]/name/text()″/>的500的元标志信息替换。
随着HTML文档的所有元标志信息被下载到计算机存储器中,所有元标志信息将进一步处理使得假如元标志信息是{xc_xslt:document/recipe/title},它将被替换为<xsl:value-ofselect=″document/recipe/title″>。假如元标志信息是如475的HTML文档属性结点值,元标志信息可被替换为{xsl:value-ofselect=″document/recipe/image/@img″}。在XML语法分析程序中的HTML的元标志信息和结构可进一步改变使得它能支持任何用户选择的XSLT元素。
图9表示处理动态对象的流程图,此对象涉及源文件中相同元素并可结合附图8A-8C理解。在902,一目标文件被接收。如上所述,目标文件是用来在设备(即台式计算机或便携设备)上显示的演示文稿。例如,利用FrontPage创建的HTML目标文件显示在运行在台式计算机上的Internet Explorer。随着目标文件的显示,在904下载相应一个或多个源文件(即XML文件)连同相应DTD文件以便于创建可扩展格式底稿。接着,在906确认在所显示的目标文件中的动态对象并且每个动态对象均对应于源文件中的源元素或对象。取决于实现,动态对象可由用户人工确定或在目标文件创建时指出。
在908,确定是否任何已确认的动态对象涉及源文件中的相同元素。假如无动态对象涉及源文件中的相同元素,则处理900进入912。假如动态对象的任意两个涉及源文件中的相同元素,处理900进入910,其中这些动态对象被标记不同。依据一个实施例,这些动态对象依据它们出现的顺序被数字标记,用于标记它们的标识符便于创建格式底稿。在这些动态对象被标记之后,处理900进入912。
无论如何,在912,每个元标志被确定对应动态对象之一。依据一个实施例,每个动态对象被一元标志或包括在一元标志中的路径信息替换。依据另一实施例,每个动态对象被拖动到由XML文件和/或DTD文件(如图5D)提供的XML树上一相应结点。通过拖动一动态对象到一结点,可建立动态对象和源文件中相应元素的联系。
在914用于每个元标志的标志信息被确定,例如假设XML树的每个节点均分别对应每个元标志的相关信息,则可通过遍历XML树确定。因此,在916产生对应于目标文件的格式底稿。尤其,格式底稿以另一种标记语言表示在一文件中。此文件包括每个元标志的相应说明。
本发明属于利用元标志信息设计用于转换源XML文件为目标文件的可扩展格式底稿(XSL)。本发明有无数利益、特征和优点。其中之一是利用了涉及目标文件中动态对象和源文件中相应元素间信息关系或联合的元标志。其他利益、特征和优点本领域普通技术人员很容易获知。
本发明已充分详细并在一定程度的特殊性上进行了描述。本领域普通技术人员在不脱离本发明权利要求所限定的精神和范围内可对本发明公开的实施例在排列组合上进行多种修改。因此,本发明的范围由所附权利要求而非前面对实施例的描述来限定。

Claims (34)

1、一种用于产生一可扩展格式底稿的方法,此方法包括:
接收第一标记语言的一目标文件;
接收至少一个第二标记语言的源文件;
确认目标文件中的动态对象;
通过元标志在每个目标文件的动态对象和至少一个源文件的元素之一之间建立联系;
用元标志替换每个动态对象;以及
参照目标文件产生可扩展格式底稿。
2、如权利要求1所述的方法,其中所述接收第一标记语言的一目标文件包括在一能以所需的方式显示目标文件的授权工具中显示目标文件。
3、如权利要求2所述的方法,其中目标文件包括静态内容和动态对象。
4、如权利要求3所述的方法,其中第一标记语言从一组包括超文本标记语言(HTML),可扩展标记语言(XML),标准通用标记语言(SGML)和无线标记语言(WML)中进行选择。
5、如权利要求5所述的方法,其中第二标记语言从一组包括超文本标记语言(HTML),可扩展标记语言(XML),标准通用标记语言(SGML)和无线标记语言(WML)中进行选择。
6、如权利要求5所述的方法还包括显示目标文件的演示文稿,其中演示文稿包括静态内容和多个动态对象。
7、如权利要求6所述的方法,其中所述接收至少一个第二标记语言的源文件包括:
接收包括文档类型定义(DTD)的一定义文件;
在定义文件中的至少一个定义与动态对象之一之间建立联系;以及
从目标文件产生一树结构,其中树包括结点,每个结点对应显示演示文稿的动态对象之一。
8、如权利要求7所述的方法,还包括遍历树结构以确定用于元标志的信息。
9、如权利要求8所述的方法,其中所述参照目标文件产生可扩展格式底稿包括产生第三标记语言的一结果文件,此结果文件包括至少一包括一说明和用于元标志信息的信息段。
10、如权利要求9所述的方法,其中目标文件可通过显示连同可扩展格式底稿的至少一源文件而被显示。
11、一用于产生一格式底稿的方法,此方法包括:
接收一标记语言的目标文件,此目标文件包括多个动态对象;
接收一结构树;此结构树的每个结点对应于目标文件的动态对象之一;
通过一元标志在目标文件的每个动态对象与至少一个源文件的一元素之间建立联系;以及
参照目标文件产生可扩展格式底稿。
12、如权利要求11所述的方法,其中所述接收一标记语言的目标文件包括在一能以所需的方式显示目标文件的授权工具中显示目标文件。
13、如权利要求12所述的方法,其中每个动态对象与出现在结构树中的一个或更多源文件中的一相应元素相关。
14、如权利要求13所述的方法,其中标记语言从一组包括超文本标记语言(HTML),可扩展标记语言(XML),标准通用标记语言(SGML)和无线标记语言(WML)中进行选择。
15、如权利要求14所述的方法,其中结构树是利用从一组包括超文本标记语言(HTML),可扩展标记语言(XML),标准通用标记语言(SGML)和无线标记语言(WML)中进行选择的标记语言而建立的。
16、如权利要求11所述的方法,其中所述在目标文件的每个动态对象与一元素之间建立联系包括:
在每个动态对象与结构树的结点之一建立联系;以及
遍历结构树以获得用于元标志的相关信息,其中相关信息包括在每个动态对象和在至少一源文件的元素之间的关联。
17、如权利要求11所述的方法,其中所述在目标文件的每个动态对象与一元素之间建立联系包括:
将每个动态对象复制到结构树的结点之一;以及
遍历结构树以获得用于每个动态对象的元标志的相关信息,其中相关信息包括在每个动态对象和在至少一源文件的元素之间的关联。
18、如权利要求11所述的方法,其中所述在目标文件的每个动态对象与一元素之间建立联系包括:
将元素经由结构树的结点之一从至少一源文件复制到每个动态对象;以及
遍历结构树以获得用于每个动态对象的元标志的相关信息,其中相关信息包括在每个动态对象和在至少一源文件的元素之间的关联。
19、一用于产生一格式底稿的方法,此方法包括:
接收第一标记语言的目标文件,此目标文件包括多个动态对象,至少两个动态对象与第二标记语言的源文件的一元素相关;
提供对应于一个或更多包括源文件的源文件的结构树,结构树的每个结点对应于目标文件的动态对象之一;
通过多个元标志经由结构树将动态对象与源文件分别建立联系;
确认用于涉及到源文件中相同元素的至少两个动态对象的相应元标志,其中相应元标志被不同的标识符标记;以及
参照目标文件产生可扩展格式底稿。
20、如权利要求19所述的方法,其中第一标记语言从一组包括超文本标记语言(HTML),可扩展标记语言(XML),标准通用标记语言(SGML)和无线标记语言(WML)中进行选择。
21、如权利要求20所述的方法,其中第二标记语言从一组包括超文本标记语言(HTML),可扩展标记语言(XML),标准通用标记语言(SGML)和无线标记语言(WML)中进行选择。
22、如权利要求19所述的方法,其中所述通过多个元标志经由结构树将动态对象与源文件分别建立联系包括:
用元标志之一替换每个动态对象;以及
遍历结构树以获得用于每个元标志的相关信息,其中相关信息包括在每个动态对象和至少一源文件中的一元素之间的关联。
23、如权利要求19所述的方法,其中所述通过多个元标志经由结构树将动态对象与源文件分别建立联系包括:
将每个动态对象复制到结构树的结点之一;以及
遍历结构树以获得用于每个元标志的相关信息,其中相关信息包括在每个动态对象和在至少一源文件的元素之间的关联。
24、如权利要求19所述的方法,其中所述确认用于至少两个动态对象的相应元标志包括在用于相应元标志的每个说明中***不同标识符。
25、如权利要求24所述的方法,其中不同标识符在一组包括数字、字符、文本和文字数字符号中选择。
26、一用于产生可扩展格式底稿的装置,此装置包括:
一显示屏;
用于存储作为一授权工具的代码的第一存储器;
用于存储作为软件模块的代码的第二存储器;
一处理器,与第一和第二存储器连接,当指示运行关于第一标记语言的目标文件的授权工具,使得目标文件作为输出演示文稿显示在显示屏上,其中输出演示文稿包括多个动态对象,每个对象涉及一个或更多第二标记语言的源文件中的一个元素,而且一属于源文件的结构树然后被检索,结构树的每个结点相应于目标文件的动态对象之一;以及
其中软件模块处理运行以执行通过一元标志在每个动态对象和一个或更多源文件中的一个元素之间建立联系的操作;
遍历结构树以获得用于元标志的相关信息;
以及参照目标文件产生可扩展格式底稿。
27、如权利要求26所述的装置,其中第一标记语言从一组包括超文本标记语言(HTML),可扩展标记语言(XML),标准通用标记语言(SGML)和无线标记语言(WML)中进行选择。
28、如权利要求27所述的装置,其中第二标记语言从一组包括超文本标记语言(HTML),可扩展标记语言(XML),标准通用标记语言(SGML)和无线标记语言(WML)中进行选择。
29、一计算机可读介质,至少包括运行在计算设备上用于产生一可扩展格式底稿的计算机程序代码,此计算机可读介质包括:
用于接收第一标记语言的一目标文件的程序代码;
用于接收至少一个第二标记语言的源文件的程序代码;
用于确认目标文件中的动态对象的程序代码;
用于通过元标志在每个目标文件的动态对象和至少一个源文件的元素之一之间建立联系的程序代码;
用于用元标志替换每个动态对象的程序代码;以及
用于参照目标文件产生可扩展格式底稿的程序代码。
30、如权利要求29所述的方法,其中用于接收第一标记语言的一目标文件的程序代码包括在一能以所需的方式显示目标文件的授权工具中显示目标文件的程序代码。
31、一计算机可读介质,至少包括运行在计算设备上用于产生一可扩展格式底稿的计算机程序代码,此计算机可读介质包括:
用于接收一标记语言的目标文件的程序代码,此目标文件包括多个动态对象;
用于接收一结构树的程序代码,此结构树的每个结点对应于目标文件的动态对象之一;
用于通过一元标志在目标文件的每个动态对象与至少一个源文件的一元素之间建立联系的程序代码;以及
用于参照目标文件产生可扩展格式底稿的程序代码。
32、如权利要求31所述的计算机可读介质,其中用于接收一标记语言的目标文件的程序代码包括在一能以所需的方式显示目标文件的授权工具中显示目标文件程序代码。
33、如权利要求32所述的计算机可读介质,其中每个动态对象与出现在结构树中的一个或更多源文件中的一相应元素相关。
34、一计算机可读介质,至少包括运行在计算设备上用于产生一可扩展格式底稿的计算机程序代码,此计算机可读介质包括:
用于接收第一标记语言的目标文件的程序代码,此目标文件包括多个动态对象,至少两个动态对象与第二标记语言的源文件的一元素相关;
用于提供对应于一个或更多包括源文件的源文件的结构树的程序代码,结构树的每个结点对应于目标文件的动态对象之一;
用于通过多个元标志经由结构树将动态对象与源文件分别建立联系的程序代码;
用于确认用于涉及到源文件中相同元素的至少两个动态对象的相应元标志,其中相应元标志被不同的标识符标记的程序代码;以及
用于参照目标文件产生可扩展格式底稿的程序代码。
CNA028011198A 2001-04-09 2002-04-08 采用元标志信息的可扩展格式底稿设计 Pending CN1471679A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US28260901P 2001-04-09 2001-04-09
US60/282,609 2001-04-09
US30609501P 2001-07-17 2001-07-17
US60/306,095 2001-07-17

Publications (1)

Publication Number Publication Date
CN1471679A true CN1471679A (zh) 2004-01-28

Family

ID=26961546

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA028011198A Pending CN1471679A (zh) 2001-04-09 2002-04-08 采用元标志信息的可扩展格式底稿设计

Country Status (5)

Country Link
EP (1) EP1377917A2 (zh)
JP (1) JP2004529427A (zh)
CN (1) CN1471679A (zh)
AU (1) AU2002256150A1 (zh)
WO (1) WO2002082326A2 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462090A (zh) * 2013-09-13 2015-03-25 方正信息产业控股有限公司 数据处理方法与装置
CN106227717A (zh) * 2016-07-15 2016-12-14 广东小天才科技有限公司 一种文档处理方法及装置、终端设备
CN113505567A (zh) * 2021-05-25 2021-10-15 北京北大方正电子有限公司 电子出版文件的生成方法和装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7703009B2 (en) 2001-04-09 2010-04-20 Huang Evan S Extensible stylesheet designs using meta-tag information
JP2008041155A (ja) 2006-08-04 2008-02-21 Sony Corp 表示制御装置、コンテンツ出力システム、検索用画像の表示制御方法、プログラム
JP7260244B2 (ja) * 2017-03-14 2023-04-18 Phcホールディングス株式会社 電子カルテ装置、及び、プログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6507857B1 (en) * 1999-03-12 2003-01-14 Sun Microsystems, Inc. Extending the capabilities of an XSL style sheet to include components for content transformation
AU7126400A (en) * 1999-09-09 2001-04-10 Percussion Software, Inc. Virtual server system for dynamic content in world wide web pages
AU7127800A (en) * 1999-09-09 2001-04-10 Percussion Software, Inc. Dynamic content identifier for xml web pages
GB2373085B (en) * 2001-03-08 2004-10-06 Ibm Method, computer program and system for style sheet generation

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462090A (zh) * 2013-09-13 2015-03-25 方正信息产业控股有限公司 数据处理方法与装置
CN106227717A (zh) * 2016-07-15 2016-12-14 广东小天才科技有限公司 一种文档处理方法及装置、终端设备
CN113505567A (zh) * 2021-05-25 2021-10-15 北京北大方正电子有限公司 电子出版文件的生成方法和装置

Also Published As

Publication number Publication date
JP2004529427A (ja) 2004-09-24
WO2002082326A2 (en) 2002-10-17
AU2002256150A1 (en) 2002-10-21
EP1377917A2 (en) 2004-01-07
WO2002082326A3 (en) 2003-08-21

Similar Documents

Publication Publication Date Title
US8484552B2 (en) Extensible stylesheet designs using meta-tag information
US7080083B2 (en) Extensible stylesheet designs in visual graphic environments
US7281018B1 (en) Form template data source change
US7685135B2 (en) Database facility for XML server pages language
US6748569B1 (en) XML server pages language
US20050198202A1 (en) Method for causing server to provide client computers with annotation functions for enabling users of the client computers to view object-based documents with annotations
US6799299B1 (en) Method and apparatus for creating stylesheets in a data processing system
JP4070643B2 (ja) 表示用データ生成装置、表示用データ生成システム、データ管理装置、表示用データ生成方法、プログラム及び記録媒体
CN105824787B (zh) 一种html模板动态配置的控制方法及***
US20040205592A1 (en) Method and apparatus for extensible stylesheet designs
CN1815477A (zh) 用于提供基于标记语言的限定词的方法和***
CN101055577A (zh) 可扩展标记语言集中器
CN1776678A (zh) 用于表的客户端操作的方法和***
Butler Current technologies for device independence
US20090083300A1 (en) Document processing device and document processing method
US20080005662A1 (en) Server Device and Name Space Issuing Method
CN1471679A (zh) 采用元标志信息的可扩展格式底稿设计
Artail et al. Device-aware desktop web page transformation for rendering on handhelds
Weber et al. Live documents with contextual, data-driven information components
US20080005085A1 (en) Server Device and Search Method
CN1967580A (zh) 电子帐单的实现方法
Jacobs Beginning XML with DOM and Ajax: from Novice to Professional
CN113139145B (zh) 页面生成方法、装置、电子设备及可读存储介质
Hori et al. Generating transformational annotation for web document adaptation: tool support and empirical evaluation
Phelps Multivalent documents: anytime, anywhere, any type, every way user-improvable digital documents and systems

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication