CN111753501A

CN111753501A - Ofd文件合并展现迅捷阅读的方法

Info

Publication number: CN111753501A
Application number: CN202010643511.0A
Authority: CN
Inventors: 何冉冉; 蔡亚军; 何中; 顾永新; 张军; 戴建峰; 姚童; 陈明敏
Original assignee: Jiangsu Zhongwei Technology Software System Co ltd
Current assignee: Jiangsu Zhongwei Technology Software System Co ltd
Priority date: 2020-07-07
Filing date: 2020-07-07
Publication date: 2020-10-09
Anticipated expiration: 2040-07-07
Also published as: CN111753501B

Abstract

本发明公开了一种OFD文件合并展现迅捷阅读的方法，获取电子表单内容、解析表单结构后获取电子表单结构体，按照固定的JSON格式进行表单元素重组，并保存到工作流引擎***中；将多种格式文件转换成PDF版式文件；将超过***设定大小的版式文件进行切割；将超过***设定的阈值的那一份版式文件进行压缩，然后服务器解压OFD文件获取OFD文件夹；读取OFD文件夹下的文件、工作流电子表单与多个不同格式的文件转化的版式文件的目录后进行目录的重组；客户端将对应的文件数据进行格式解析加载后将页面进行渲染并完成展现。本发明能够阅读OFD文件、工作流电子表单与多种格式文件，文件的加载响应速度大幅提高。

Description

OFD文件合并展现迅捷阅读的方法

技术领域

本发明涉及一种合并展现迅捷阅读的方法，特别是一种OFD文件合并展现迅捷阅读的方法，属于计算机软件领域。

背景技术

2016年10月14日世界标准日，国家标准化管理委员会正式批准发布了基于自主技术的国家标准GB/T 33190-2016《电子文件存储与交换格式版式文档》（简称OFD）。OFD，Open Fixed-layout Document的简写，是我国自主可控的电子文件版式文档格式，对应的国际标准就是PDF。OFD版式文件，版面固定、不跑版、所见即所得，可以视为计算机时代的“数字纸张”；是电子文档发布、数字化信息传播和存档的理想文档格式。工作流的表单***：实现了抽象流程的流转，而具体业务的实现需要在电子表单模块中完成，例如公文签批，审核签批意见都对应一个业务模块，具体业务在业务模块中实现并将数据保存到数据库表中，从而实现业务数据的持久化。工作流引擎负责将这些业务模块串起来，实现业务流的流转。

文件流转基于工作流电子表单***，以电子表单实现业务数据交互与存储，一般以OFD文件为正文，PDF以及其他不同格式文件作为附件存在并整体流转。由于各文件的阅读方式不一致，用户想要同时阅读上述文件需要依次点击进行阅读，操作较为繁琐；而且目前现有的文件合并展现技术在处理较大文件时，客户端需要将文件远程下载，然后进行解压加载渲染，用户在线阅读时，需要较长的等待时间，无法做到即点即读的效果，在并发量较大的情况下，下载大文件会对服务器也造成很大的资源损耗，同时也会造成客户端资源的不必要损耗。

因此有必要设计一种能够实现工作流电子表单与OFD等多种格式文件的统一合并阅读技术方案，而且该技术方案还能够实现工作流电子表单与OFD等多种格式文件合并后的迅捷阅读响应阅读。

发明内容

本发明所要解决的技术问题是提供一种OFD文件合并展现迅捷阅读的方法，实现工作流电子表单与OFD等多种格式文件的统一合并以及迅捷阅读。

为解决上述技术问题，本发明所采用的技术方案是：

一种OFD文件合并展现迅捷阅读的方法，其特征在于包含以下步骤：

步骤一：获取电子表单内容、解析表单结构后获取电子表单结构体，按照固定的JSON格式进行表单元素重组，并保存到工作流引擎***中；

步骤二：将多种格式文件转换成PDF版式文件；

步骤三：判断步骤二中的版式文件的文件大小是否超过***设定的文件大小，若超过，将超过***设定大小的版式文件进行切割；

步骤四：判断步骤三中的切割后的每一份版式文件的单页文件大小是否超过***设定的阈值，若超过，将超过***设定的阈值的那一份版式文件进行压缩，然后服务器解压OFD文件获取OFD文件夹；

步骤五：读取OFD文件夹下的文件、工作流电子表单与多个不同格式的文件转化的版式文件的目录后进行目录的重组；

步骤六：客户端将对应的文件数据进行格式解析加载后将页面进行渲染并完成展现。

进一步地，所述步骤一具体为

读取电子表单的内容；将表单中的文档主体body、文档分区div、table、表格行tr、表头th、表格单元td、单行文本输入框input、多行文本输入框textarea、单选框radio、下拉框select和多选框checkbox内容解析出来，然后按照固定的JSON格式进行表单元素重组，并保存到工作流引擎***中。

进一步地，所述步骤一中标准电子表单中的元素包含单行文本输入框input、多行文本输入框textarea、下拉框select、多选框checkbox和单选框radio，输入框对象包含单行文本输入框input、多行文本输入框textarea、下拉框select、多选框checkbox、单选框radio和表格单元td。

进一步地，所述步骤二中多种格式文件包含wps、doc/docx、xls/xlsx、ppt/pptx、jpg、tif、gif、png和cad，其中，wps、doc/docx、xls/xlsx采用jcob，ppt/pptx采用PowerPoint.Application，cad采用autocad，jpg、tif、gif、png图片采用PdfWriter转换为PDF版式文件，或转化为OFD版式文件。

进一步地，所述步骤三具体为

步骤31：遍历步骤二中生成的版式文件，获取版式文件的大小M和文件页数page_number，***设定文件最大临界值为N，当文件大小M>N时，则将文件切割成nums份；nums的计算过程为：余数surplus= M%N，若surplus=0，则nums= M/N；若surplus>0，则nums = M/N+1；当文件大小M≤N时，不做文件切割操作；

步骤32：文件切割时，按文件页数page_number来进行切割，切割的每一份单个文件的页数为page_number/nums，并且所有份的单个文件按照在文件中的页码顺序进行排列，当余数Y=page_number%nums >0时，则切割出来的所有的单个文件中的最后面的Y份单个文件的页数page_number/nums+1。

进一步地，所述步骤四具体为

步骤41：步骤三中分割出来的所有份的单个文件，取其中任意一份单个文件，将所述单个文件的文件大小除以单个文件的页数，得到所述单个文件的单页文件大小；

步骤42：判断单页文件大小是否超过***设定的阈值，若超过，则将所述单个文件按照设定的比例进行压缩；

步骤43：按照步骤41-42对分割出来的所有份的单个文件进行处理。

进一步地，所述步骤42中***设定的阈值为500K，设定的比例为500/A *100%，其中A为每页文件的大小。

进一步地，所述步骤五具体为

步骤51：客户端读取OFD文件夹下的Pages文件夹下的Page_N文件，Page_N中的N是OFD文件的页码，Page_N下的content.xml文件是OFD文件夹中对应每一页OFD文件的内容，客户端依次读取每一个OFD文件夹下的Page_N文件的页码信息和content.xml文件的内容信息，并建立相应的页面路径；

步骤52：将若干个OFD文件的页面路径按照JSON的方式进行组织，拼接为JSON数组；JSON数组中个体均为一个文件，文件包含文件名NAME、文件唯一id、文件大纲，文件资源包RESOURCES和页面内容Pages；页面内容Pages包含每一页的文件内容指向路径URL、每页文件在原本所属文件中的页码Page；每页文件在多个文件中的文件页码directory、是否被签批sign、是否包含指定关键字keywords；

步骤53：阅读工作流电子表单时，解析工作流电子表单保存在工作流引擎***中的JSON数据，然后将工作流电子表单的JSON数据与OFD文件及其他文件的JSON数据组合成统一目录；

步骤54：阅读多种格式文件转化的版式文件以及步OFD版式文件时，解析返回的JSON数组的文件数据，获取JSON数组的文件名称、页码属性Page、多文件页码属性directory，对页码进行重组绘制，并根据页面是否签批意见sign、或检索的关键字keywords，在目录中进行标注；标注形式为签批意见采用标识图标在文件目录中标注，检索后有关键字的采用标识图标在文件目录中标注。

进一步地，所述步骤六具体为

客户端解析服务端返回的JSON数据，在文件展示底版区域默认只是前N页的内容，阅读过程中，采用目录跳转和鼠标滚动两种阅读方式，点击目录阅读时，即时加载该页面的内容，加载完成后，继续对页面往上或往下N页的预加载，上下内容已经提前下载渲染好；鼠标滚动阅读时，根据鼠标滚轮事件，采用分割加载、预加载的方式达到快读阅读的目的。

进一步地，所述步骤六中，客户端渲染页面时根据获取的文件数据区分该页面所属的文件格式，然后根据不同的文件格式选择不同的渲染方式，如果是电子表单，则直接展示电子表单的JSON数据内容，如果是OFD格式文件，根据对应的OFD文件页面的路径地址下载页面及文件页面的外引资源完成加载页面的显示，如果是PDF文件，根据对应的PDF文件的路径地址下载PDF文件并在底版区域加载；用户通过点击重组目录阅读任意文件的任意页面时，客户端根据对应的地址路径获取对应的文件数据进行解析加载，客户端加载完任意文件的任意页面后，该页面的页面信息自主留存，再次阅读时直接展示；用户通过重组目录上的签批意见的标识图标和检索关键字的标识图标直接快速点击阅读签批页面和关键字页面。

本发明与现有技术相比，具有以下优点和效果：

1、本发明能够阅读OFD文件、工作流电子表单与多种格式文件，不需要根据不同的文件格式安装多个阅读器；在基于工作流流转的环境之下，OFD保持原文件，其他格式文件转化为版式文件，然后与电子表单合并展现；

2、本发明在阅读OFD文件时，服务端对OFD文件进行解压并返回文件目录给客户端，客户端对单个阅读路径进行下载，减少了整体下载时间；对OFD以外的版式文件，进行切割重排，还将超过***设置文件大小的单页版式文件进行压缩处理，在版式文件切割的基础上进一步缩短了文件加载的时间，能够做到即点即读的效果，提高了阅读效率；

3、本发明在阅读任意文件任意页面时，程序后台自动加载阅读页面的前后N页，有效的提高了阅读速度以及阅读体验度，增加签批、检索功能，提升阅读体验，对版式数据流文件技术形成了有效的补充。

附图说明

图1是本发明的OFD文件合并展现迅捷阅读的方法的流程图。

图2是本发明实施例的工作流电子表单与OFD等多种格式文件切割加载的示意图。

图3是本发明实施例的工作流电子表单与OFD等多种格式文件重新排版的新目录示意图。

图4是本发明实施例的OFD文件被解压后的OFD文件夹的文件目录示意图。

具体实施方式

为了详细阐述本发明为达到预定技术目的而所采取的技术方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清晰、完整地描述，显然，所描述的实施例仅仅是本发明的部分实施例，而不是全部的实施例，并且，在不付出创造性劳动的前提下，本发明的实施例中的技术手段或技术特征可以替换，下面将参考附图并结合实施例来详细说明本发明。

如图1所示，本发明的一种OFD文件合并展现迅捷阅读的方法，包含以下步骤：

步骤一：获取电子表单内容、解析表单结构后获取电子表单结构体，按照固定的JSON格式进行表单元素重组，并保存到工作流引擎***中；或者将工作流电子表单转化为版式文件，并记载工作流电子表单页面上的元素信息并转化为文本值保存；

步骤一具体为读取电子表单的内容；将表单中的文档主体body、文档分区div、table、表格行tr、表头th、表格单元td、单行文本输入框input、多行文本输入框textarea、单选框radio、下拉框select和多选框checkbox内容解析出来，然后按照固定的JSON格式进行表单元素重组，并保存到工作流引擎***中。

或者：

步骤11：导入标准的电子表单，标准电子表单中的元素包含单行文本输入框input、多行文本输入框textarea、下拉框select、多选框checkbox和单选框radio。采用正则匹配，匹配出电子表单中的元素，将匹配出的元素替换为空白区域，获得html格式的文件基本内容底版，调用wkhtmltopdf将html格式的文件基本内容底版转化为PDF格式文件，或者继续将PDF格式文件转换为OFD格式版式文件，得到一个电子表单版式化后的文件底版；

步骤12：初始化元素坐标模块遍历电子表单中输入框对象，输入框对象包含单行文本输入框input、多行文本输入框textarea、下拉框select、多选框checkbox、单选框radio和表格单元td。将元素类型、横坐标startX、纵坐标startY、输入框宽度width、输入框高度height、元素名称、类别、值value组织成JSON格式数据，将组织成的JSON格式数据保存到数据库中；

步骤13：获取文件转换模块中的版式化的文件底版，在文件底版区域展示渲染对应的版式底版，获取初始化元素坐标模块中的JSON格式数据，解析JSON格式数据，根据横坐标startX、纵坐标startY在版式底版指定控制区域绘制输入框宽度width、输入框高度height的输入框，并标注该输入框的名称TagName；

步骤14：在电子表单中，根据实际内容，在各个输入框中输入对应的内容并保存，根据输入框的名称TagName与输入框对应的内容，将值一一匹配保存到数据库中，二次阅读时，把值直接拼接到value字段中，返回给客户端展示。

步骤二：将多种格式文件转换成PDF版式文件；

步骤二中多种格式文件包含wps、doc/docx、xls/xlsx、ppt/pptx、jpg、tif、gif、png和cad，其中，wps、doc/docx、xls/xlsx采用jcob，ppt/pptx采用PowerPoint.Application，cad采用autocad，jpg、tif、gif、png图片采用PdfWriter转换为PDF版式文件，或转化为OFD版式文件。

步骤三具体为

如图2所示，***判断多个不同格式的文件转化的版式文件的大小是否超过了***设定的文件大小，例如***设定的文件大小为500kb，cad文件转化的版式文件的大小为2M，doc转化的版式文件的大小为3M，***判定上述版式文件较大，***自动将cad文件转化的版式文件与doc转化的版式文件切割成若干个小版式文件，这些小版式文件可以是1页一个文件或者2页一个文件；本发明将超过***设置文件大小的版式文件进行切割重排处理，文件的加载响应速度大幅提高。

步骤四：判断步骤三中的切割后的每一份版式文件的单页文件大小是否超过***设定的阈值，若超过，将超过***设定的阈值的那一份版式文件进行压缩，然后服务器解压OFD文件获取OFD文件夹，如图4所示是OFD文件解压后的OFD文件的文件夹目录示意图；

步骤四具体为

步骤42：判断单页文件大小是否超过***设定的阈值，若超过，则将所述单个文件按照设定的比例进行压缩；***设定的阈值为500K，设定的比例为500/A *100%，其中A为每页文件的大小。

步骤43按照步骤41-42对分割出来的所有份的单个文件进行处理。

当多个不同格式的文件转化的版式文件只有单页时，而且该单页版式文件的大小大于***设置的文件大小，那么***无法将所述单页版式文件进行切割，只能将单页版式文件进行压缩处理，从而减小单页版式文件的大小。

步骤五具体为

本发明在版式文件切割的基础上进一步缩短了文件加载的时间，能够做到即点即读的效果。多种格式文件转化的版式文件在切割与压缩过程中不破坏转化前的工作流电子表单与多种格式文件。当处理完多个不同格式的文件转化的版式文件后，***调用服务器将OFD文件解压成所述OFD文件夹， OFD文件夹内包括OFD文件页面的路径地址以及OFD文件页面的外引资源， OFD文件页面的外引资源包括该页面的文字、样式、图片等信息；本发明的服务器对OFD文件进行解压并返回文件目录给客户端，客户端对单个阅读路径进行下载，减少了整体下载时间，便于客户端快速展示。

***读取所述OFD文件夹下的文件、工作流电子表单转化的版式文件与多个不同格式的文件转化的版式文件的目录后进行目录的重组，如图3所示，重组的目录是在保存原有OFD、工作流电子表单以及多个不同格式的文件目录的基础之上由多个文件目录重组而成。

步骤六具体为

客户端渲染页面时根据获取的文件数据区分该页面所属的文件格式，然后根据不同的文件格式选择不同的渲染方式，如果是电子表单，则直接展示电子表单的JSON数据内容，如果是OFD格式文件，根据对应的OFD文件页面的路径地址下载页面及文件页面的外引资源完成加载页面的显示，如果是PDF文件，根据对应的PDF文件的路径地址下载PDF文件并在底版区域加载；用户通过点击重组目录阅读任意文件的任意页面时，客户端根据对应的地址路径获取对应的文件数据进行解析加载，客户端加载完任意文件的任意页面后，该页面的页面信息自主留存，再次阅读时直接展示；用户通过重组目录上的签批意见的标识图标和检索关键字的标识图标直接快速点击阅读签批页面和关键字页面。

如图3所示，用户通过点击重组目录阅读任意文件的任意页面时，客户端根据对应的地址路径获取对应的文件数据判断该页面是属于OFD文件、工作流电子表单还是其他不同格式的文件，判断完成后将所述文件数据进行格式解析加载并根据不同的文件格式选择不同方式的渲染方法将页面展示出来，当需要渲染的是OFD文件时，客户端通过所述OFD文件页面的路径地址来下载对应的OFD页面及OFD文件页面的外引资源，然后利用所述OFD文件页面的外引资源渲染页面，最终将页面呈现给用户阅读。

当用户通过重组后的目录点击阅读任意文件的任意页面时，客户端自动加载并渲染该页面的前后N页，例如用户打开的是只有一页的OFD文件， OFD的上个文件是工作流电子表单，下个文件是doc转化的版式文件，此时客户端自动加载所述工作流电子表单的后五页以及所述doc转化的版式文件的前五页，所述客户端自动加载并渲染的前后N页的页数由后台程序设定；当客户端加载完任意文件的任意页面后，该页面的页面信息自主留存，再次阅读时直接展示即可。上述步骤有效的提高了阅读速度以及阅读体验度。

需要说明的是，在附图或说明书正文中，未绘示或描述的实现方式，均为所属技术领域中普通技术人员所知的实现方式，并未进行详细说明。此外，上述对各元件和方法的定义并不仅限于实施例中提到的各种具体结构、形状或方式。

还需要说明的是，本文可提供包含特定值的参数的示范，但这些参数无需确切等于相应的值，而是可在可接受的误差容限或设计约束内近似于相应值。此外，除非特别描述或必须依序发生的步骤，上述步骤的顺序并无限制于以上所列，且可根据所需设计而变化或重新排列。并且上述实施例可基于设计及可靠度的考虑，彼此混合搭配使用或与其他实施例混合搭配使用，即不同实施例中的技术特征可以自由组合形成更多的实施例。

以上所述，仅是本发明的较佳实施例，并非对本发明作任何形式上的限制，虽然本发明已以较佳实施例揭露如上，然而并非用以限定本发明，任何熟悉本专业的技术人员，在不脱离本发明技术方案范围内，当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例，但凡是未脱离本发明技术方案内容，依据本发明的技术实质，在本发明的精神和原则内，对以上实施例所作的任何简单的修改、等同替换与改进等，均在本发明技术方案的保护范围之内。

Claims

1.一种OFD文件合并展现迅捷阅读的方法，其特征在于包含以下步骤：

步骤二：将多种格式文件转换成PDF版式文件；

2.按照权利要求1所述的一种OFD文件合并展现迅捷阅读的方法，其特征在于：所述步骤一具体为

3.按照权利要求2所述的一种OFD文件合并展现迅捷阅读的方法，其特征在于：所述步骤一中标准电子表单中的元素包含单行文本输入框input、多行文本输入框textarea、下拉框select、多选框checkbox和单选框radio，输入框对象包含单行文本输入框input、多行文本输入框textarea、下拉框select、多选框checkbox、单选框radio和表格单元td。

4.按照权利要求1所述的一种OFD文件合并展现迅捷阅读的方法，其特征在于：所述步骤二中多种格式文件包含wps、doc/docx、xls/xlsx、ppt/pptx、jpg、tif、gif、png和cad，其中，wps、doc/docx、xls/xlsx采用jcob，ppt/pptx采用PowerPoint.Application，cad采用autocad，jpg、tif、gif、png图片采用PdfWriter转换为PDF版式文件，或转化为OFD版式文件。

5.按照权利要求1所述的一种OFD文件合并展现迅捷阅读的方法，其特征在于：所述步骤三具体为

6.按照权利要求1所述的一种OFD文件合并展现迅捷阅读的方法，其特征在于：所述步骤四具体为

7.按照权利要求6所述的一种OFD文件合并展现迅捷阅读的方法，其特征在于：所述步骤42中***设定的阈值为500K，设定的比例为500/A *100%，其中A为每页文件的大小。

8.按照权利要求1所述的一种OFD文件合并展现迅捷阅读的方法，其特征在于：所述步骤五具体为

9.按照权利要求1所述的一种OFD文件合并展现迅捷阅读的方法，其特征在于：所述步骤六具体为

10.按照权利要求9所述的一种OFD文件合并展现迅捷阅读的方法，其特征在于：所述步骤六中，客户端渲染页面时根据获取的文件数据区分该页面所属的文件格式，然后根据不同的文件格式选择不同的渲染方式，如果是电子表单，则直接展示电子表单的JSON数据内容，如果是OFD格式文件，根据对应的OFD文件页面的路径地址下载页面及文件页面的外引资源完成加载页面的显示，如果是PDF文件，根据对应的PDF文件的路径地址下载PDF文件并在底版区域加载；用户通过点击重组目录阅读任意文件的任意页面时，客户端根据对应的地址路径获取对应的文件数据进行解析加载，客户端加载完任意文件的任意页面后，该页面的页面信息自主留存，再次阅读时直接展示；用户通过重组目录上的签批意见的标识图标和检索关键字的标识图标直接快速点击阅读签批页面和关键字页面。