CN101971171A - 将电子文档逐页制备为电脑图形的方法和设备 - Google Patents

将电子文档逐页制备为电脑图形的方法和设备 Download PDF

Info

Publication number
CN101971171A
CN101971171A CN2009801051046A CN200980105104A CN101971171A CN 101971171 A CN101971171 A CN 101971171A CN 2009801051046 A CN2009801051046 A CN 2009801051046A CN 200980105104 A CN200980105104 A CN 200980105104A CN 101971171 A CN101971171 A CN 101971171A
Authority
CN
China
Prior art keywords
page
content
data element
value
electronic document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2009801051046A
Other languages
English (en)
Inventor
A·拉希克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BOOKRIX GmbH and Co KG
Original Assignee
BOOKRIX GmbH and Co KG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BOOKRIX GmbH and Co KG filed Critical BOOKRIX GmbH and Co KG
Publication of CN101971171A publication Critical patent/CN101971171A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/123Storage facilities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Processing Or Creating Images (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

至少将一页虚拟电子文档制备为电脑图形的方法,包含以下步骤:至少选择一个虚拟电子文档内容数据元素;确定格式数据;计算内容数据元素的页码识别值和页面上的元素位置值;保存内容数据元素、页码识别值和元素位置值的关联至数据库;分析虚拟电子文档页面要求;通过访问数据库确定至少一个内容数据元素及其位置值,内容数据元素要符合要求页面的页码识别值;基于格式数据和内容数据元素计算电脑图形,其中内容数据元素由要求的页面和关联的元素位置值确定;提供电脑图形,作为虚拟电子文档页面,进行展示,同时也提供相关的一种设备、布置方案和电脑程序产品。

Description

将电子文档逐页制备为电脑图形的方法和设备
技术领域
本发明为至少将一页虚拟电子文档制备为电脑图形,通过网络进行调用的方法,以及所需的一种设备、布置方案和电脑程序产品。
背景技术
为确保众多用户能够可靠、快速、灵活地阅读电子书等电子文档,将这些电子文档放到网络服务器或FTP等服务器上进行调用的方法非常广泛。
这样可以传输包含完整电子文档的文件,不依赖用户当前的网络连接进行阅读,这特别适用于在显示第一页前就会为下载带来很大负担的大文件,它会在监测设备中占用相应数量的存储容量。更为广泛的是传输电子书的单个页面,这些页面之前已经由用户或其监测设备从服务器进行了调用。
这两种情况下均可采用页面描述语言文件传输电子书和电子书单个页面的内容,即创建电子书或页面的内容元素(如文本、图表、图片)对象,按照各自的格式进行编码,通过页面描述语言分配至电子书页面。在此监测设备会对页面说明文件中包含的指示进行阐释,将字符编码的文本元素和像素图片文件等图片元素组合为电子文档。这类页面描述语言的例如有PostScript(PS)和便携文件格式(Portable Document Format,PDF)或与设备无关的文件格式(Device independent file format,DVI)。
另一方面也可以采用电脑图片文件格式传输整个文档或单个页面,即所有电子书页面的内容元素均采用像素或矢量图编码。这种图片传输形式的优势是文本字符采用图片形式显示,可以防止出现不希望的简单复制和继续使用等情形。但另一方面,查找文字、***备注、标记和继续编辑文本等文字操作难度也就明显加大。
欧洲专利文献EP 0 731 948 B1的德文译本DE 694 34 434 T2中公开了一个***,可以方便地显示和处理电脑图片形式的电子文档页面,其中的电脑图片来自专利文献打印版的扫描页面,电脑图片中显示的文本还会同时以字符编码形式进行保存。在此专利文献打印扫描页的页码同样采取字符编码。我们可以将文本图片和字符文本并排放置,进行显示。这种双重显示方式一方面可以忠实于原始图片,另一方面可以继续编辑字符文本,尤其是可以在文档内部进行查找和导航等操作。
由于用户仅仅可以在字符文本显示窗口中访问文本显示元素,所以在此需对内容进行双重显示。而且这种双重显示会降低阅读舒适度,比单一显示需要更大的显示界面。此外该***不仅要将页面转换为图片,还要将字符文本从服务器传输至客户端,因而通信负担更大。另外,此处的文本会以字符形式显示给用户,所以不会被保护,无法防止发生预期以外的再编辑。
发明内容
因此本发明的任务就是提供一种方法,以及所需的一种设备、布置方案和电脑程序产品。所述方法既可以通过网络调用电子文档页面,又避免当前技术的缺点,特别是要加大对内容进行预期以外的再编辑的难度,改进保存和数据传输效率。
本发明的任务通过权利要求1、16、17、18、19和20所述对象完成。
符合权利要求1的发明介绍了如何将至少一页虚拟电子文档制备为电脑图片,并通过网络进行调用,该方法包含以下步骤:
-选择至少一个虚拟电子文档的内容数据元素;
-确定虚拟电子文档的格式数据;
-根据格式数据,为至少一个内容数据元素计算虚拟电子文档页面页码识别值和在通过页码识别值识别的页面上的元素位置值;
-在一数据库中保存内容数据元素、内容数据元素的页码识别值和元素位置值的关联;
-在确定所需页面的页码识别值时分析虚拟电子文档的页面要求;
-访问数据库,确定至少一个内容数据元素及其元素位置值,该内容数据元素要与所需页面页码识别值相符;
-基于格式数据、所需页面的内容数据元素及所属元素位置值计算电脑图片;
-制备电脑图片,作为虚拟电子文档页面用于显示。
如果符合发明的内容元素不属于实际电子文档,要制备的内容元素仅为电子文档的虚拟组成部分,实际上却通过数据库进行管理,则要选择比传统电子文档保存更高效、处理方式更灵活的数据保存和数据组织形式。文档文本字符词语、图片对象引用等同类内容数据元素可以根据各个内容数据元素的虚拟文档页面和页面位置(如坐标)从数据库中直接进行定位和调用,不需查找整个电子文档。在使用数据库管理***(DBMS)或服务器上的文档数量巨大、内容广泛时,应用数据库的优势尤为明显。
计算虚拟电子文档的内容数据元素页数和位置,将其分配至各个内容数据元素,这种方式可以确保单独和直接访问数据库。由此可以通过虚拟文档的页面说明从数据库调用所有页面内容数据元素,继续进行相应分配。另外还可以通过页数和位置清楚地定位字符文字等内容数据元素,这就允许基于字符文字的图形位置对其进行编辑。
按照要求通过监测设备准备页面显示,然后进行调用,这种方式只需将显示的页面保持在监测器上,因此可以缩短浏览器加载选定页面的时间。这对于移动监测设备,如手机或数字化个人助理(Personal DigitalAssistants,PDAs)优势尤为明显。特别是与图片显示页面连用时,由于图片显示页面是在调用时根据数据库信息动态生成,不需存储,因而更具优势。
创建所需页面的电脑图片,将所需页面的内容数据元素转化为图片形式,根据其位置信息分配和总结为像素或矢量图电脑图片,然后通过网络进行调用,那么就仅有图片编码数据提供给用户使用,加大了对内容进行预期以外的再编辑的难度。
总而言之,这样就可以在提供使用的同时有效保存电子文档的内容,而且不用再采取双重数据保持和显示模式,即可单独定位显示的内容元素。此外还可以加大继续编辑难度,防止出现预期以外的再编辑等情形。
更多符合要求1的发明实施方式可以根据从属权利要求而实现。
本发明可改进为,在收到网络服务器要求后会对虚拟电子文档页面要求进行分析,和/或通过网络服务器传输图片文件,制备电脑图片。
本发明的改进方案可为,基于虚拟电子文档元素位置值进行分析,访问可用页面的内容数据元素,这样即可继续改进发明。在此可以通过页面图形显示的位置说明(元素位置值)指定各个内容数据元素,如单个文本词语。只需点击鼠标,根据元素位置值从数据库中调用字符编码格式,即可继续进行编辑。同时可以访问数据库,获取可用页面的页码标识值和元素位置值对应的内容数据元素。
可以通过分析查找命令的查找关键词,获取与查找关键词相应的虚拟电子文档内容数据元素,继续改进方法。虽然只有图片显示页面可用,这样仍然可以使用查找功能。
本发明各改进方案可以为,格式数据包含页面宽度值和/或页面高度值和/或版面宽度值和/或版面高度值。在此可以确定页面格式和虚拟电子文档的版面区域,以及生成的显示页面。
在发明实施方式中计算内容数据元素的范围时可以计算元素位置值,可以选择内容数据元素的次序。
在方法的实施方式中只要达到和/或超过版面宽度值,即可水平连接相邻的内容数据元素,加上各个内容数据元素的宽度,计算一行。该行是指考虑到其范围用于计算词语位置,并用作内容数据元素计算顺序辅助方式的计算行。相比之下此处只有在创建文档页面电脑图片时才会生成用于显示的文档(文本)行。
与之相应,在实施方式中只要达到版面高度值,即可通过垂直连接相邻的行,加上行高计算一页,此处的行高由最高行内容元素确定。此处的页面同样是指考虑到其范围用于计算词语位置,并用作内容数据元素的计算顺序辅助方式及内容数据元素的计算行。
发明实施方式的特点是将页码识别值分配至内容数据元素,页码识别值符合计算出的页面,可以在其中***内容数据元素。
在继续改进方法时可以将元素位置值分配至内容数据元素,元素位置值符合计算出的页面上内容数据元素的位置,可以在其中***内容数据元素。
在继续改进发明时内容数据元素可以显示为文本元素,并在附加空格符时计算其宽度。此时可以在附加字符时计算文本元素的高度,如字符链在文本元素的字体和字号中会达到最大可能的字体高度。
符合权利要求16的发明会根据发明方法提供数据准备设备,该设备带一个处理单元、一个存储器和一个通信接口,
特点如下
-处理单元设计为选择至少一个虚拟电子文档内容数据元素;
-处理单元设计为确定用于虚拟电子文档的格式数据;
-处理单元设计为根据为至少一个内容数据元素计算虚拟电子文档页面的页码识别值和格式数据在通过页码识别值识别的页面上的元素位置值;
-处理单元设计为将内容数据元素、内容数据元素的页码识别值和元素位置值的关联存储器中的数据库内。
这样可以制备一种设备,其在一数据库中生成方法中所需的和用于根据权利要求17所述的设备的数据基础,以按照方法生成虚拟电子文档页面图形,进行调用。
该设备和所有其它设备的处理单元及其布置方案可以通过多用途处理器等多用途硬件的程序技术装备,或通过组合使用编程和专用集成电路设计中心组件(Application Specific Integrated Circuits,ASICs)实现。特别是可以依靠由操作***或中间设备提供的功能和/或互联网专用技术,如PHP(PHP Hypertext Preprocessor,超文本预处理器)和/或JavaScript实现。
符合权利要求16的发明实施方式可以继续改进,适应从属要求并继续改进和执行其它所有发明设备和方法,特别是可以采用设计用于执行一个或多个方法特征的处理单元实现设备的实施方式。
符合权利要求17的发明会提供一种设备,用于制备至少一个虚拟电子文档页面,作为电脑图片通过网络进行调用,该设备带一个处理单元、一个存储器和一个连接至网络的通信接口,
特点如下
-存储器为一个数据库,内容数据元素、内容数据元素的页码识别值和元素位置值的关联;
-处理单元设计为在确定所需页面的页码识别值时对虚拟电子文档页面的要求进行分析;
-处理单元设计为在访问数据库时确定至少一个符合所需页码识别值的内容数据元素和其元素位置值;
-处理单元设计为根据数据格式、根据为所需页面确定的内容数据元素和所属元素位置值计算电脑图片;
-处理单元设计用于制备电脑图片,作为虚拟电子文档页面进行显示。
符合权利要求17的发明实施方式可以继续改进,适应从属要求并继续改进和执行所有发明设备及方法。特别是可以采用设计用于执行一个或多个方法特征的处理单元实现设备的实施方式。
符合权利要求18的发明会提供一个布置方案,使用符合权利要求16的设备和符合权利要求17的设备制备至少一个虚拟电子文档页面作为电脑图片,用于执行方法。设备的属性在此可以集成在一个公用处理单元、一个公用处理器和一个公用通信接口中。
符合权利要求18的发明实施方式可以继续改进,适应从属要求并继续改进和执行所有发明设备及方法。特别是可以采用设计用于执行一个或多个方法特征的处理单元实现设备的实施方式。
符合权利要求19的发明会提供一款电脑程序产品,存储在电脑可读的存储器媒介上,该媒介包含一个电脑可读的程序设备,用于执行发明方法的步骤。符合权利要求20的发明也相应提供一款电脑程序产品,包含在数字载波中。数字载波可以通过无线或有线电或光信号,或通过介质中所有承载信息的位形式实现。两款电脑程序产品均可在电脑上运行,用于执行方法。
电脑程序产品可以采用相应方式保存在CD-ROM、DVD-ROM、软盘或硬盘等磁或光数据载体上,或存储器模块或处理器存储器部件等半导体模块中。
附图说明
下面借助多个附图来对本发明进行进一步说明,其中:
图1方法实施例的图解概述;
图2图1中实施例第一部分细节的图解概述;
图3图1中实施例第二部分细节的图解概述;
图4制备和/或布置的设备实施例的图解显示;
图5制备和/或布置的实施例的图解显示,带有作为服务器/客户端配置的监测设备;
图6符合图1方法的行计算过程图解;
图7符合图1方法的页面计算过程图解;以及
图8图1方法实施例的继续改进的图解概述。
具体实施方式
图1为方法实施例的图解概述。内容提供商的服务器计算机的处理单元会在步骤100中选择一个内容数据元素连续布置方案,构成虚拟电子文档的内容。这些内容可以通过数据载体或网络连接由用户输入。例如通过终端设备(客户端)上相应的用户界面对话框输入内容元素,通过文本输入区、上传对话框集成图片文件和选择元素,指定设计选项,然后通过网络将客户端的内容数据元素传输到服务器上。
采用这种方式不仅可以向服务器传输格式或无格式文本、电脑图片文件、超链接、要使用的背景图片等内容数据元素,水印等不可视元素,声音、电影和/或动画文件等多媒体元素,以及专有显示格式(如AdobeFlash),还能传输不能自行显示的内容元素和控制指令等数据附件。
在此控制指令可以包含嵌入图片(图片内容数据元素)功能和/或控制图片内容数据元素显示及其校准、大小、透明度等更多功能。此外控制指令还可以包含确定生成文档页面图片的页面背景造型等功能,用于***分页符、控制文本内容数据元素(字体、字号、字模、字体颜色)显示、定义超链接和跳转至其它内容数据元素、其它页面或其它虚拟电子文档的跳转命令,以及调用JavaScript及类似程序等外部指令的更多功能。
如果要计算内容数据元素的位置值和页码识别值,并生成页面电脑图片用于调用,则处理单元会在步骤110中确定数据格式,用作虚拟电子文档页面外部设计标准。这可以通过用户数据和控制指令分析进行,分析可使用用户界面如上所述进行输入。尤其是在此还会确定页面高度和宽度以及版面高度和宽度(也就是页面使用面积,即页面大小减去页面边缘的面积)。
在步骤120中根据作为计算模板的计算页和计算行对每个内容数据元素进行计算,确定内容数据元素属于虚拟电子文档的哪个页面,又属于所属页面的哪个位置。为标记页面需要确定相应的页码识别值,为标记页面上的位置需要元素位置值,该位置值由坐标元组中的X和Y轴坐标组成(根据文档页的抽象坐标系或稍后动态创建的页面图片)。页码识别值可以包含页数或页数和页面所属虚拟电子文档标识值的组合。
位置计算详情稍后将在图2和3中进行进一步说明。
处理单元会为每个内容数据元素创建一个关联,每个关联都包含内容数据元素(或其参照)、内容数据元素页码识别值和元素位置值。在此还可能包含各个关联的更多信息。
在步骤130中处理单元会使用DBMS(关联DBMS或面向对象的DBMS)将关联保存到数据库中。
在此可以将关联的数据库条目概括为一个,用于整个计算页,一般页面格式数据库条目先于页面条目的关联条目,包含页面宽度、页面高度、版面宽度、版面高度、页面背景、页面背景镜像,不管当前页面是否是双页的左侧页,都会包含页码、页码颜色说明、标准字体、字号、字体颜色,以及纯文本格式的书页内容(用于不同的查找和索引功能)。
数据库摘要表格显示的结构如下(表格区用空格符隔开):
Figure BPA00001205387000121
(注:Zeitungspapier:新闻纸;Bilder koennen an beliebigerPosition eingebunden werden:图片可以集成至任意位置;bild:图片;odersogar auf die ganze Seite gestreckt werden:或可以扩大至整个页面)
在此可以看出,图片内容数据元素
(bild_000801_0087_0044_tsms.jpg)可以通过引用参照(此处为文件名)集成至数据库中,而文本内容数据元素(Bilder(图片)、
Figure BPA00001205387000122
(可以)、an(集成等))以字符编码形式在数据库中。
在步骤140中处理单元会对页面要求指令进行分析,指令可以通过客户端上的显示程序生成,客户端则通过网络与服务器相连。页面要求指令可能包含页码识别值,或者如果显示程序会生成指令,用于显示下一页或前一页,则处理单元也可以计算页面要求指令的页码识别值。
接着处理单元会在步骤150中根据调用页面的页码识别值从数据库调用所有内容数据元素。必要时可以在此调用更多属于页面的控制指令和/或数据条目。除了能有效进行数据保持,由于所有生成单个页面所需的数据都会专门高效调用,因此在生成调用页面时只会花费最小的总开销。
然后处理单元会在步骤160中计算一张电脑图片,根据格式和控制指令对内容元素进行图形转换,然后单独显示文档所需页面。
为此处理单元首先会制备一张图片,并通过格式数据给出(页面)宽度和高度(如PHP:imagecreatetruecolor)。如果指定了背景图片,则这些数据会使用图片总宽度和高度确定。在文档以双页显示时,可以确定是左侧还是右侧页面,以确保背景图片符合垂直线镜像。之后处理单元会对图片中的内容数据元素进行定位。
在文本元素的情况,这要通过相应的描绘功能定位到使用元素位置值规定的位置(如PHP:ImageTTFText)。
图片元素可以通过相应的功能(如:imagecopyresampled)嵌入到图片中使用元素位置值的规定位置,在此可以依据图形的宽度和高度按照格式规定对图片的宽度和高度进行匹配。
现在计算出的电脑图片已经可以通过网络调用,并传输至客户端计算机,在上面进行显示。
在该图中不再继续显示查找命令的编辑流程。根据页面要求指令的分析,当前也可以根据字符链等内容数据元素将查找指令从客户端传输到服务器,处理单元会用指定的字符链对该查找指令进行分析,并在下一步骤中从数据库调用关联,关联的内容数据元素要与查找字符链相符。这样处理单元即可生成查找结果,即页码识别值或由此得出的页数,并将其传输到客户端,进行显示。
处理单元可以进一步分析访问和选择指令,访问指令可以由用户在客户端页面图片显示上点击鼠标,显示元素位置值。然后处理单元将在下一步中在数据库内调回内容数据元素,这些元素要与当前显示页面的页码识别值和元素位置值相符。
选择和查找指令的分析可以与页面要求指令的分析并行或先后进行,这在图8的图解中也进行了展示。
这样选定或查找到的内容数据元素可以用图片元素进行补充,***页面图片中(PHP:imagefilledrectangle)。
图2为图1中实施例第一部分细节的图解概述,特别是计算内容数据元素的页码识别值和元素位置值。
处理单元首先会在步骤200中从内容数据元素布置方案内选择下一个要处理的内容数据元素,然后在步骤210中确定其是否为文本元素。
如果是文本元素,那么处理单元会在步骤220中为文本元素***临时字符,用于计算大小。因此只会临时增加一个空格符,用于计算宽度,确保不会改变现实中的词语。相应地也只能添加
Figure BPA00001205387000141
等可达到显示行最大可能高度和深度的字符,用于计算高度。在步骤230中基于当前指定的字体、字号和字模计算显示宽度和高度(如PHP:ImageTTFbbox功能)。
如果是图片元素,处理单元会在步骤230中直接计算显示宽度和高度(如PHP:getimagesize功能)。
在步骤240中处理单元会检查是否还有必须确定宽度和高度的内容数据元素。如果没有,则所有内容数据元素的宽度和高度确定完毕,处理单元会继续步骤250,首先制备计算行。
计算行处理单元会在步骤260、270和290中按照内容数据元素顺序***该行,并将***内容数据元素的宽度相加,直至计算行内容数据元素的总宽度超出行版面宽度。一旦超出,处理单元就会在步骤280中撤销最后***的计算行内容数据元素,将其重新(首先)归入尚未分配至计算行的内容数据元素,然后处理单元会在步骤250中再次创建一个新数据行,如上所述继续进行分配。
该过程将在图6中进一步描述。计算行40以内容数据元素42至48完全填充。计算行50包含元素62’,该元素与其它内容数据元素相加超出计算行框左右侧显示的版面宽度。那么该元素将从行中撤销,作为内容数据元素62***一个新创建的计算行60。
如图2中继续描述的,如果处理单元在步骤290中确定了没有内容数据元素未分配至计算行,即所有内容数据元素均已分配至计算行,则会继续步骤300。
通过相应的控制指令,可以影响关联过程,使图片等各个内容数据元素都单独定位在一行中。
图3是图2中详细显示的后续。
平行进行、逐行将内容元素分配至计算行的方式与垂直进行、逐页将计算行分配至计算页的方式类似。
为此处理单元首先会在步骤300中创建一个新计算页,然后在步骤310中选择第一个还未分配至页面的计算行,计算页按照图2中所述的顺序进行创建,并在步骤320中确定其高度。计算行的高度将始终由计算行内容数据元素的最大高度确定。
计算页处理单元会在步骤330、340和370中按照计算行的顺序进行***,直至超出版面高度。一旦超出,处理单元就会撤销计算页的计算行,将其重新(首先)归入尚未分配至计算页的计算行,接着处理单元会在步骤360中再次创建一个新计算页,如上所述继续进行分配。
该过程将在图7中进一步描述。计算页70带有已分配的计算行71至75,包含行81’,该行与其它计算行相加会超出计算页框上下显示的版面高度。该元素会相应地从页70中撤销,作为数据行81***一个新创建的计算页80。
如图3中继续显示,只要处理单元在步骤370中确定所有计算行已分配至计算页,再也没有未分配的计算页,则会继续执行步骤380。
在步骤380中处理单元会为每个按照行和页分配的内容数据元素确定页码识别值和元素位置值。页码识别值从计算页的顺序数字中得出,内容数据元素通过计算行进行分配,计算页按照所属内容数据元素的顺序进行分配。
如果利用坐标的组合作为元素位置值,那么坐标应如下计算:
内容数据元素的Y轴坐标原则上由内容数据元素计算页所有计算行的行高相加得出,有问题的内容数据元素也包含在内。
如果行内容数据元素左对齐,那么内容数据元素的X轴坐标为同一计算行所有在前内容数据元素的宽度总和,这要以版面左侧边缘为基准。计算公式如下:
X轴坐标=
该_行_内_所有_在前_元素_宽度+版面_左_侧_边缘
如果计算行中的内容数据元素右对齐,则X轴坐标由版面宽度减去同一计算行所有内容数据元素的宽度值总和,加上所有同一行在前内容数据元素宽度值总和得出,这要以版面左侧边缘为基准。计算公式如下:
X轴坐标=(版面_宽度-同_一_行_所有_元素_宽度)+同_一_行_所有_在前_元素_宽度+版面_左_侧_边缘
如果行元素居中,则X轴坐标为版面宽度减去同一计算行所有内容数据元素宽度值总和,除以2,加上同一计算行所有在前内容数据元素的宽度值总和,这要以版面左侧边缘为基准。计算公式如下:
X轴坐标=
(版面宽度-同_一_行_所有_元素_宽度)/2
+同_一_行_所有_在前_元素_宽度
+版面_左_侧_边缘
如果行中的元素为两端对齐,则X轴坐标为同一计算行所有在前内容数据元素的宽度值总和加上版面区域宽度减去同一行所有内容数据元素宽度值总和,再除以同一行所有元素数量减1得出的值,这要以版面左侧边缘为基准。
X轴坐标=
同_一_行_所有_在前_元素_宽度
+(版面区域_宽度-同_一_行_所有_元素_宽度)
/(同_一_行_所有_元素_数量-1)
+版面_左_侧_边缘
如果内容数据元素为图片,且图片宽度大于版面宽度,但小于页面宽度,则可将X轴坐标可以向左移动差值的一半,以改善视觉效果。如果内容数据元素为图片,且图片高度大于版面高度,但小于页面高度,则可将Y轴坐标可以向上移动差值的一半。
如同在图1中所述,现在可以将得出的数据写入书页数据库,在以下区域中会逐行写入每个内容数据元素(如词语)的数据:字号、X轴坐标、Y轴坐标、字体颜色、字体、元素数据。如果内容数据元素为图片,可以在字号区域中输入标记图片的代码PIC,在字体颜色和字体中输入空值“X”、“X”,然后输入图片的参考名称(文件名)。在整个页面上显示的图片可以不输入PIC,而输入FULLPIC,也不输入坐标,而输入空值“0”。
在当前示例中X和Y轴坐标位于文本元素左下角,图片元素左上角。在此可以使用PHP指令“ImageTTFText”和“imagecopyresampled”简化执行操作。
图4为制备和/或布置的实施例图解。
显示的设备及布置包含一个处理单元10、一个作为网络服务器进行网络连接的通信接口12,以及一个存储器14,即数据库16和采用当前***生成的电脑图片3。
处理单元10、通信接口12和存储器14可相互通信,通信方式为计算机内部总线***或网络。
数据库16是指关联18和18a,其中各包含一个内容数据元素19或19a,一个页码识别值19’或19a’,以及一个元素位置值19″或19a″。
通信接口12设计为通过网络接收或发送信息和请求,以传输至处理单元10,继续进行处理。处理单元设计为按照方法执行当前***的功能,并提供更多的DBMS功能,用于处理数据库16。
图4中显示的实施例可以指用于制备虚拟电子文档页面的设备,也可以指数据制备设备。专业人员可以轻易看出此时显示的电脑图片3没有包含在存储器中。显示的实施例还可以指集成有显示设备和制备设备的功能的布置方案。
图5是制备和/或布置的设备实施例的图解显示,与作为服务器/客户端配置的监测设备组合使用。
已经在图4中做过详细说明的设备1通过其设计用作网络服务器的通信接口12与作为连接线的网络相连接,该网络再连接至用作网络客户端的监测装置(客户端电脑)2的通信接口22。
客户端计算机2还包含一个处理单元20、一个存储器24和一个用户界面26。
处理单元20设计为在本地保存或执行之前执行通过网络由服务器1传输来的程序,它一方面可以通过用户界面26显示电脑图片3或调用各个页面,另一方面可以采用同样的方式输入内容数据元素或格式指令等信息,在服务器上创建虚拟电子文档。只要用户在客户端2上进行调用,相应调用指令即会传输至服务器,作为客户端上显示的虚拟电子文档相应页面的答复。服务器上会相应生成客户端选择或查找指令,并通过客户端2的用户界面26输入创建虚拟电子文档所需的所有数据和指示,然后传输至服务器1。
图8是继续改进方法的实施方式的图解概述,方法的实施方式在图1中已经进行过描述。步骤130至170可以参见图1中的描述。
上述图4和图5中描述的设备用于继续改进,其各个处理单元10设计为执行选择的或所有方法的步骤。
如图1中所述,来自一台用户电脑(客户端)2的页面要求指令、查找指令和/或选择指令会由设备(服务器)1进行处理。该处理操作在步骤140中用于页面要求指令,在步骤400中用于选择指令,在步骤410中用于查找指令。该分析步骤的细节在请参考图1的说明。分析可以平行进行,这通过步骤130中的多个流程箭头显示。
步骤140、400和410中的每个分析都会到达继续处理的正常过程(步骤140和410到达步骤150,步骤400到达160),另外作为平行示例可到达步骤420。
在步骤420中会对各个要求、选择或查找指令进行统计分析。这样在该步骤中即可确定各个内容元素的频率,作为该指令的对象,和/或可以确定时间间隙,其中确定的内容元素通常都是指令的对象。
当前结果在步骤430中用于相应缓存,此时要将通常作为指令对象的内容元素优先保存在存储器14中,以确保高效访问。存储器包括快速和慢速访问存储器的部件,由此可将通常作为指令对象的内容元素保存到带快速访问的存储器部件中。
同样可以将在显示当前时间的时窗中通常用作指令对象的内容元素优先保存到存储器14中,以确保高效访问。
统计分析可以进一步用于分析用户行为,为用户提供Banner广告等特别符合所涉及内容元素的内容。
在步骤150中可以采用同样的方式加速调用内容元素,如从优先访问存储器或包含优先访问存储器的部件中调用。因此当前的***可以制备电子文档页面,用于通过网络进行调用。这样制备内容的响应显示也可以出现在小型显示单元上,同时会加大处理电子处理内容的难度,提高存储和数据传输效率。
如专业人员在以前的显示和说明中容易获悉的,所述方法步骤在执行中转换至软件,程序指示在处理单元等处理器上退出方法步骤的执行。该软件包含在设备1的存储器14中(参照图4和图5)。
这适用于布置方案1,可以制备至少一个虚拟电子文档页面作为电脑图片,在此方法执行功能及处理单元的改进集成在一个***中,该***在所有实施方式中均同等用作服务器或网络服务器。同样要至少包含一个数据处理设备(设计用于执行方法步骤100-130)和一个制备设备,用于制备至少一个虚拟电子文档页面用作电脑图片(设计用于执行步骤140-170),以执行布置方案1。在此设备也可以在所有实施方式中用作服务器或网络服务器。此外数据准备设备可以通过步骤100-130中的数据处理软件模块,制备设备可以通过步骤140-170中的制备软件模块在同一一台电脑上运行并保存到其存储器中。在此涉及专业人员可以轻易确定的用户终端设备,即在所有实施方式中同样用作客户端或网络客户端的监测装置(监测设备),或与作为服务器及网络服务器的布置或制备设备交互使用。
附图标记列表
1        用于制备虚拟电子文档页面的设备及布置方案
2        用户电脑(客户端)
3        电脑图片
10       处理单元
12       通信接口
14       存储器
16       关联数据库
18,18a  第一和第二个关联
19,19a      第一和第二个内容数据元素
19’,19a’  第一和第二个内容数据元素的页码识别值
19″,19a″  第一和第二个内容数据元素的位置值
20           处理单元
22           通信接口
24           存储器
26           用户界面
40           计算行元素
42-48        已定位的内容数据元素
50           计算行元素
52-58        已定位的内容数据元素
60           计算行元素
62           位置已变更的内容数据元素
62’         位置要变更的内容数据元素
70           计算页元素
71-75        已定位的行元素
80           计算页元素
81           位置已变更的计算页元素
81’         位置要变更的计算页元素
100          选择内容数据元素
110          确定格式数据
120    计算各个内容数据元素的页码识别值和元素位置值
130    将关联保存到数据库
140    分析页面要求指令
150    调用所需页的所有内容元素
160    计算带页面内容元素的电脑图片
170    供应电脑图片
200    选择内容数据元素
210    检查是否为文本元素
220    ***未显示的尺寸符号
230    确定内容数据元素的宽度和高度
240    检查下一内容数据元素是否可用
250    打开一个新计算行
260    ***内容数据元素
270    检查是否超出行版面宽度
280    从行中撤销内容数据元素
290    检查下一内容数据元素是否可用
300    打开一个新计算页
310    选择一个计算行
320    确定行高
330    在计算页中***行
340    检查是否超出页面版面宽度
350    从计算页中撤销行
360    打开一个新计算行
370    检查下一行是否可用
380    确定各个内容数据元素的页码识别值和坐标
400    分析选择指令
410    分析查找指令
420    统计分析
430    缓存

Claims (20)

1.一种方法,其用于将至少一个虚拟电子文档页面制备为电脑图片(3)以用于通过网络来调用,步骤如下:
-选择(100)至少一个虚拟电子文档内容数据元素(19,19a);
-确定(110)所述虚拟电子文档的格式数据;
-根据格式数据为所述至少一个选定内容数据元素计算(120)虚拟电子文档页面的页码识别值(19’,19a’)和在通过页码识别值识别的页面上的元素位置值(19″,19a″);
-保存(130)选定内容数据元素、页码识别值和元素位置值的关联(18,18a)至数据库(16);
-在确定要求页面的页码识别值时分析(140)虚拟电子文档页面的要求;
-在访问数据库时确定(150)至少一个内容数据元素及其元素位置值,该内容数据元素要与要求页面的页码识别值相符;
-基于格式数据、要求页面的内容数据元素和所属元素位置值计算(160)电脑图片;
-制备(170)电脑图片,作为虚拟电子文档页面进行显示。
2.根据权利要求所述1的方法,其特征在于,从网络服务器(12)接收虚拟电子文档页面要求,然后进行分析。
3.根据权利要求1或2所述的方法,其特征在于,通过网络服务器(12)传输图形文件,制备电脑图片。
4.根据权利要求1至3中任一项权利所述的方法,其特征在于,基于虚拟电子文档页面的元素位置值访问内容数据元素,进行分析。
5.根据权利要求4所述的方法,其特征在于,访问数据库,获得与制备页面的页码识别值和元素位置值对应的内容数据元素。
6.根据权利要求1至5中任一项所述的方法,其特征在于,分析与查找概念对应的查找指令,获取与查找概念相符的虚拟电子文档内容数据元素。
7.根据权利要求1至6中任一项所述的方法,其特征在于,数据格式包含页面宽度值和/或页面高度值和/或版面宽度值和/或版面高度值。
8.根据权利要求1至7中任一项所述的方法,其特征在于,在计算选定内容数据元素的范围时计算元素位置值。
9.根据权利要求1至8中任一项所述的方法,其特征在于,选择内容数据元素的顺序。
10.根据权利要求9所述的方法,其特征在于,只要达到版面宽度值(270),即可加上各个内容数据元素的宽度,在水平连接(260)依次选定的内容数据元素时计算行(200-290)。
11.根据权利要求10所述的方法,其特征在于,只要达到版面高度值(340),即可加上行高,在垂直连接(330)依次选定的内容数据元素时计算页面(300-380),其中行高由最高的行内容数据元素确定。
12.根据权利要求11所述的方法,其特征在于,将页码识别值分配至选定内容数据元素(380),识别值需符合计算所得页面,其中***有选定的内容数据元素。
13.根据权利要求12的所述方法,其特征在于,将元素位置值分配至选定内容数据元素(380),位置值需符合计算所得页面上选定内容数据元素的位置,其中***有选定的内容数据元素。
14.根据权利要求1至11中任一项所述的方法,其特征在于,选定的内容数据元素含文本元素,并在附加(220)空格符时计算其宽度。
15.根据权利要求12所述的方法,其特征在于,在附加(220)字符时计算文本元素的高度,最大字体高度在文本元素字体和字号中产生。
16.根据权利要求1至15中任一项所述的方法数据准备设备(1),带一个处理单元(10)、一个存储器(14)和一个通信接口(12),
其特征在于,
-处理单元设计为选择至少一个虚拟电子文档内容数据元素(19,19a);
-处理单元设计为确定用于虚拟电子文档的格式数据;
-处理单元设计为根据格式数据为至少一个选定内容数据元素计算虚拟电子文档页面的页码识别值(19’,19a’)和在通过页码识别值识别的页面上的元素位置值(19″,19a″);
-处理单元设计为用于保存选定内容数据元素、页码识别值和元素位置值的关联(18,18a)至存储器数据库。
17.一种使用于根据权利要求1至15中任一项所述的方法的设备(1),其用于将至少一个虚拟电子文档页面制备为电脑图片(3)以用于通过网络来调用,该设备带一个处理单元(10)、一个存储器(14)和一个连接至网络的通信接口(12),
其特征在于
-存储器具有一数据库(16),该数据库具有内容数据元素(19,19a)、内容数据元素页码识别值(19’,19a’)和元素位置值(19″,19a″)的关联(18,18a);
-处理单元设计为在确定所需页面的页面标识值时分析虚拟电子文档页面要求;
-处理单元设计为在访问数据库时确定至少一个内容数据元素及其元素位置值,该内容数据元素与所需页面的页码识别值相符;
-处理单元设计为根据数据格式、要求页面的内容数据元素和所属元素位置值计算电脑图片;
-设计的处理单元用于制备电脑图片,作为虚拟电子文档页面进行显示。
18.用于权利要求1至15中的任意一方法的一种布置方案(1),使用符合权利要求16和符合权利要求17的设备,其中至少一个虚拟电子文档页面作为电脑图片(3)。
19.用于使电脑执行权利要求1至15中任一方法的一种电脑程序产品,保存在可以用电脑读取的存储设备上。
20.用于使电脑执行权利要求1至15中任一方法的一种电脑程序产品,以数字载波体现、带有可以由电脑读取的程序。
CN2009801051046A 2008-02-19 2009-02-05 将电子文档逐页制备为电脑图形的方法和设备 Pending CN101971171A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE102008010264.4 2008-02-19
DE102008010264A DE102008010264A1 (de) 2008-02-19 2008-02-19 Verfahren und Vorrichtung zur seitenweisen Bereitstellung eines elektronischen Dokumentes als Computergrafik
PCT/EP2009/051343 WO2009103620A1 (de) 2008-02-19 2009-02-05 Verfahren und vorrichtung zur seitenweisen bereitstellung eines elektronischen dokumentes als computergrafik

Publications (1)

Publication Number Publication Date
CN101971171A true CN101971171A (zh) 2011-02-09

Family

ID=40637130

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009801051046A Pending CN101971171A (zh) 2008-02-19 2009-02-05 将电子文档逐页制备为电脑图形的方法和设备

Country Status (8)

Country Link
US (1) US20110055258A1 (zh)
EP (1) EP2255300A1 (zh)
JP (1) JP2011515730A (zh)
KR (1) KR20110021714A (zh)
CN (1) CN101971171A (zh)
BR (1) BRPI0913663A2 (zh)
DE (1) DE102008010264A1 (zh)
WO (1) WO2009103620A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107562802A (zh) * 2017-08-07 2018-01-09 腾讯科技(深圳)有限公司 文本数据显示方法和装置与存储介质及电子装置
CN112036123A (zh) * 2020-08-31 2020-12-04 北京奇虎鸿腾科技有限公司 基于网页页面的pdf生成方法、装置、设备及存储介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8972853B2 (en) * 2012-04-13 2015-03-03 Business Objects Software Limited Rendering digital report elements using a layout optimization tool
CN110866205B (zh) * 2018-08-27 2023-05-02 北京易数科技有限公司 用于存储信息的方法和装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6002798A (en) * 1993-01-19 1999-12-14 Canon Kabushiki Kaisha Method and apparatus for creating, indexing and viewing abstracted documents
US5623681A (en) * 1993-11-19 1997-04-22 Waverley Holdings, Inc. Method and apparatus for synchronizing, displaying and manipulating text and image documents
JP2004139355A (ja) * 2002-10-17 2004-05-13 Fujitsu Ltd 電子書籍配信システムのサーバ及び電子書籍配信方法
JP4239874B2 (ja) * 2004-03-29 2009-03-18 日本電気株式会社 電子書籍配信閲覧方法、電子書籍配信閲覧装置及び電子書籍配信閲覧プログラム、サーバ、電子書籍配信プログラム
US8559764B2 (en) * 2004-06-15 2013-10-15 At&T Intellectual Property I, L.P. Editing an image representation of a text
JP4332477B2 (ja) * 2004-08-06 2009-09-16 キヤノン株式会社 レイアウト調整方法及び装置並びにプログラム
JP4817959B2 (ja) * 2006-05-16 2011-11-16 キヤノン株式会社 文書処理装置及び文書処理方法
JP2007316873A (ja) * 2006-05-24 2007-12-06 Canon Inc コンテンツサーバおよびレイアウトシステム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107562802A (zh) * 2017-08-07 2018-01-09 腾讯科技(深圳)有限公司 文本数据显示方法和装置与存储介质及电子装置
CN107562802B (zh) * 2017-08-07 2019-05-24 腾讯科技(深圳)有限公司 文本数据显示方法和装置与存储介质及电子装置
CN112036123A (zh) * 2020-08-31 2020-12-04 北京奇虎鸿腾科技有限公司 基于网页页面的pdf生成方法、装置、设备及存储介质
CN112036123B (zh) * 2020-08-31 2024-05-10 三六零数字安全科技集团有限公司 基于网页页面的pdf生成方法、装置、设备及存储介质

Also Published As

Publication number Publication date
DE102008010264A1 (de) 2009-08-20
WO2009103620A8 (de) 2009-10-15
EP2255300A1 (de) 2010-12-01
DE102008010264A8 (de) 2009-12-03
BRPI0913663A2 (pt) 2015-11-24
KR20110021714A (ko) 2011-03-04
WO2009103620A1 (de) 2009-08-27
JP2011515730A (ja) 2011-05-19
US20110055258A1 (en) 2011-03-03

Similar Documents

Publication Publication Date Title
US11372935B2 (en) Automatically generating a website specific to an industry
EP3499383B1 (en) Automated generation of web forms using fillable electronic documents
US20170060829A1 (en) Method and system for annotation and connection of electronic documents
US20060224952A1 (en) Adaptive layout templates for generating electronic documents with variable content
US9026900B1 (en) Invisible overlay for dynamic annotation
US20110131482A1 (en) System and method for multi-channel publishing
US11238215B2 (en) Systems and methods for generating social assets from electronic publications
US20100287187A1 (en) Method for query based on layout information
US20170109442A1 (en) Customizing a website string content specific to an industry
CN110309457B (zh) 网页数据处理方法、装置、计算机设备和存储介质
CN101971171A (zh) 将电子文档逐页制备为电脑图形的方法和设备
US20150169508A1 (en) Obfuscating page-description language output to thwart conversion to an editable format
KR20200001342A (ko) 개체를 렌더링하는 웹 전자 문서 편집 장치 및 이의 동작 방법
CN112581568A (zh) 动态海报的生成方法、装置、服务器及存储介质
CN108133029B (zh) 地图元素的调整方法、装置、设备及计算机可读存储介质
CN114417898A (zh) 数据处理方法、装置、设备及可读存储介质
CN108228688B (zh) 一种基于xbrl的模板生成方法、***及服务器
CN110362790A (zh) 字体文件的处理方法、装置、电子设备及可读存储介质
WO2019210573A1 (zh) 生成电子订单的方法、装置、计算机设备和存储介质
CN108536864A (zh) 页面数字显示方法、装置、计算机设备及存储介质
CN113703699B (zh) 电子文件的实时输出方法和装置
CN113297859A (zh) 表格信息的翻译方法、装置及电子设备
CN113487698B (zh) 基于双通道神经网络模型的表单生成方法及装置
KR102185851B1 (ko) 전자책 제작방법 및 그를 위한 컴퓨터 프로그램
CN114546306A (zh) 应用于报表套打的数据处理方法、装置、设备、介质和程序产品

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110209