CN112861482A - 文件在线编辑方法 - Google Patents

文件在线编辑方法 Download PDF

Info

Publication number
CN112861482A
CN112861482A CN202110174847.1A CN202110174847A CN112861482A CN 112861482 A CN112861482 A CN 112861482A CN 202110174847 A CN202110174847 A CN 202110174847A CN 112861482 A CN112861482 A CN 112861482A
Authority
CN
China
Prior art keywords
file
xml
word
tag
editing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110174847.1A
Other languages
English (en)
Inventor
张世彤
张�杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
INST OF SCIENT AND TECHNICAL INFORMATION OF JILIN PROVINCE
Original Assignee
INST OF SCIENT AND TECHNICAL INFORMATION OF JILIN PROVINCE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by INST OF SCIENT AND TECHNICAL INFORMATION OF JILIN PROVINCE filed Critical INST OF SCIENT AND TECHNICAL INFORMATION OF JILIN PROVINCE
Priority to CN202110174847.1A priority Critical patent/CN112861482A/zh
Publication of CN112861482A publication Critical patent/CN112861482A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/84Mapping; Conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/986Document structures and storage, e.g. HTML extensions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种文件在线编辑方法,该方法包括:当接收到编辑请求时,从服务器的硬盘中获取WORD文件;通过开源程序docx4j对所述WORD文件进行解压,并另存为XML格式的文件;对所述XML格式的文件进行解析;将所述XML格式的文件中的各个标签与WORD标签库进行对比,从而确定出所述XML格式的文件中的各个标签的含义;根据所述XML格式的文件中的各个标签的含义,将所述XML格式的文件中的各个标签转换为相应的HTML标签;在所述HTML标签中设置自定义属性。该文件在线编辑方法能够在HTML网页上进行WORD文件的在线编辑。

Description

文件在线编辑方法
技术领域
本发明是关于计算机技术领域,特别是关于一种文件在线编辑方法。
背景技术
WORD是一种功能强大,非常常用的一款办公应用软件,例如可以进行文字处理,文挡编辑,表格制作,样式创建与应用,其他常规操作(邮件合并,拼写与语法检查等),文挡的打印,页面设置等等操作,应用非常广泛。
发明人在实现本发明的过程中发现,如果需要使用WORD编辑文件,首先必须在本地安装office软件,一方面会占用大量电脑硬盘空间,另一方面,用户电脑一旦出现问题,电脑上所存储文件将会丢失无法找回,对用户造成极大的损失;另外,用户使用台式机情况下,无法做到在任何地方对自己的文件进行编辑,只能通过移动存储设备进行拷贝保存。
公开于该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。
发明内容
本发明的目的在于提供一种文件在线编辑方法,其能够在HTML网页进行WORD文件的在线编辑。
为实现上述目的,本发明提供了一种文件在线编辑方法,其包括:当接收到编辑请求时,从服务器的硬盘中获取WORD文件;通过开源程序docx4j对所述WORD文件进行解压,并另存为XML格式的文件;对所述XML格式的文件进行解析;将所述XML格式的文件中的各个标签与WORD标签库进行对比,从而确定出所述XML格式的文件中的各个标签的含义;根据所述XML格式的文件中的各个标签的含义,将所述XML格式的文件中的各个标签转换为相应的HTML标签。
在本发明的一实施方式中,所述文件在线编辑方法还包括:在所述HTML标签中设置自定义属性。
在本发明的一实施方式中,在所述HTML标签中设置自定义属性包括:在所述HTML标签中添加ap属性。
在本发明的一实施方式中,将所述XML格式的文件中的各个标签转换为相应的HTML标签包括:采用多线程异步同时解析方法,将所述XML格式的文件中的各个标签转换为相应的HTML标签。
在本发明的一实施方式中,对所述XML格式的文件进行解析包括:采用开源XML解析包DOM4J对所述XML格式的文件进行解析。
在本发明的一实施方式中,所述文件在线编辑方法还包括:接收到保存请求后,将编辑后的WORD文件的HTML源码转换为XML格式,查询所述自定义属性从而获取所述WORD文件的修改位置;对所述XML格式的文件进行更新;通过所述开源程序docx4j对更新后的所述XML格式的文件进行读取并将所述XML格式的文件转换为WORD文件。
在本发明的一实施方式中,所述文件在线编辑方法还包括:将WORD文件存储至服务器的硬盘中。
基于同样的发明构思,本发明还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一实施方式所述方法的步骤。
基于同样的发明构思,本发明还提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任一实施方式所述方法的步骤。
与现有技术相比,根据本发明的文件在线编辑方法及电子装置,无需修改任何代码,就可以在Windows、linux、android等操作***进行部署,易于实施和维护。而且该方法无需用户在本地或服务器中安装Office办公软件,只要有互联网,用户就可以打开网页,直接对自己的WORD文件进行查看和编辑,并且WORD文件在云端实时保存,具有极高的便利性。
附图说明
图1是根据本发明一实施方式的文件在线编辑方法的步骤组成。
具体实施方式
下面结合附图,对本发明的具体实施方式进行详细描述,但应当理解本发明的保护范围并不受具体实施方式的限制。
除非另有其它明确表示,否则在整个说明书和权利要求书中,术语“包括”或其变换如“包含”或“包括有”等等将被理解为包括所陈述的元件或组成部分,而并未排除其它元件或其它组成部分。
为了克服现有技术的问题,本发明提供了一种文件在线编辑方法,能够在HTML网页进行WORD文件的在线编辑。
图1是根据本发明一实施方式的文件在线编辑方法的步骤组成。
在步骤S1中,获取WORD文件:当接收到编辑请求时,从服务器的硬盘中获取用户实现存储的WORD文件。
在步骤S2中进行WORD文件的格式转换:通过开源程序docx4j对所述WORD文件进行解压,并另存为XML格式的文件。
在步骤S3中对XML格式的文件进行解析。可选地,采用开源XML解析包DOM4J对所述XML格式的文件进行解析。
在步骤S4中确定标签含义:将所述XML格式的文件中的各个标签与WORD标签库进行对比,从而确定出所述XML格式的文件中的各个标签的含义。
在步骤S5中进行标签的转换:根据所述XML格式的文件中的各个标签的含义,将所述XML格式的文件中的各个标签转换为相应的HTML标签。例如XML中的<w:p>标签,通过WORD标签库进行对比后,确定该标签的含义为“表示一个段落”,则将该XML标签转换为HTML的段落的<p>标签。
优选地,可以采用多线程异步同时解析方法,将所述XML格式的文件中的各个标签转换为相应的HTML标签,由此可以加速对文件的解析,即使WORD文件过大,也可以快速解析完毕;快速在页面呈现,提高用户体验质量。
优选地,在步骤S6中在HTML标签中设置自定义属性。例如在HTML中的段落标签中的<p>标签中添加ap属性,用于编辑后保存时使用,该属性可以指示用户编辑后所修改的位置。
通过上述实施方式,WORD文件转化为HTML页面可以编辑的形式,用户可以在HTML网页上进行在线编辑。
优选地,在一实施方式中,用户在浏览器上对WORD文件内容编辑完成后,该文件在线编辑方法还包括:接收到保存请求后,将编辑后的WORD文件的HTML源码转换为XML格式,查询所述自定义属性从而获取所述WORD文件的修改位置;对所述XML格式的文件进行更新;通过所述开源程序docx4j对更新后的所述XML格式的文件进行读取并将所述XML格式的文件转换为WORD文件;将WORD文件存储至服务器的硬盘中。
基于同样的发明构思,一实施方式还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一实施方式所述方法的步骤。
基于同样的发明构思,一实施方式还提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任一实施方式所述方法的步骤。
综上,根据本实施方式的文件在线编辑方法及装置,可以在HTML网页上对WORD文件进行在线编辑,该方法无需修改任何代码,就可以在Windows、linux、android等操作***进行部署,易于实施和维护。而且该方法无需用户在本地或服务器中安装Office办公软件,只要有互联网,用户就可以打开网页,直接对自己的WORD文件进行查看和编辑,并且WORD文件在云端实时保存,具有极高的便利性。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
前述对本发明的具体示例性实施方案的描述是为了说明和例证的目的。这些描述并非想将本发明限定为所公开的精确形式,并且很显然,根据上述教导,可以进行很多改变和变化。对示例性实施例进行选择和描述的目的在于解释本发明的特定原理及其实际应用,从而使得本领域的技术人员能够实现并利用本发明的各种不同的示例性实施方案以及各种不同的选择和改变。本发明的范围意在由权利要求书及其等同形式所限定。

Claims (9)

1.一种文件在线编辑方法,其特征在于,包括:
当接收到编辑请求时,从服务器的硬盘中获取WORD文件;
通过开源程序docx4j对所述WORD文件进行解压,并另存为XML格式的文件;
对所述XML格式的文件进行解析;
将所述XML格式的文件中的各个标签与WORD标签库进行对比,从而确定出所述XML格式的文件中的各个标签的含义;
根据所述XML格式的文件中的各个标签的含义,将所述XML格式的文件中的各个标签转换为相应的HTML标签。
2.如权利要求1所述的文件在线编辑方法,其特征在于,对所述XML格式的文件进行解析包括:
采用开源XML解析包DOM4J对所述XML格式的文件进行解析。
3.如权利要求1所述的文件在线编辑方法,其特征在于,将所述XML格式的文件中的各个标签转换为相应的HTML标签包括:
采用多线程异步同时解析方法,将所述XML格式的文件中的各个标签转换为相应的HTML标签。
4.如权利要求1所述的文件在线编辑方法,其特征在于,所述文件在线编辑方法还包括:
在所述HTML标签中设置自定义属性。
5.如权利要求4所述的文件在线编辑方法,其特征在于,在所述HTML标签中设置自定义属性包括:
在所述HTML标签中添加ap属性。
6.如权利要求1所述的文件在线编辑方法,其特征在于,所述文件在线编辑方法还包括:
接收到保存请求后,将编辑后的WORD文件的HTML源码转换为XML格式,查询所述自定义属性从而获取所述WORD文件的修改位置;
对所述XML格式的文件进行更新;
通过所述开源程序docx4j对更新后的所述XML格式的文件进行读取并将所述XML格式的文件转换为WORD文件。
7.如权利要求1所述的文件在线编辑方法,其特征在于,所述文件在线编辑方法还包括:
将WORD文件存储至服务器的硬盘中。
8.一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述方法的步骤。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。
CN202110174847.1A 2021-02-07 2021-02-07 文件在线编辑方法 Pending CN112861482A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110174847.1A CN112861482A (zh) 2021-02-07 2021-02-07 文件在线编辑方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110174847.1A CN112861482A (zh) 2021-02-07 2021-02-07 文件在线编辑方法

Publications (1)

Publication Number Publication Date
CN112861482A true CN112861482A (zh) 2021-05-28

Family

ID=75989370

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110174847.1A Pending CN112861482A (zh) 2021-02-07 2021-02-07 文件在线编辑方法

Country Status (1)

Country Link
CN (1) CN112861482A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113742624A (zh) * 2021-09-03 2021-12-03 北京市律典通科技有限公司 一种Word文档在线免插件浏览编辑处理方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI248002B (en) * 2004-09-17 2006-01-21 Infopower Corp System and method of web-based editor for compound documents
CN102156742A (zh) * 2011-04-19 2011-08-17 北京神州数码思特奇信息技术股份有限公司 支持手机使用自带浏览器展示结构化文档的方法及中间件
CN102163233A (zh) * 2011-04-18 2011-08-24 北京神州数码思特奇信息技术股份有限公司 一种网页标记语言格式转换方法及***
CN105426480A (zh) * 2015-11-19 2016-03-23 中国地质大学(武汉) 一种用于HTML转换为Word文档的方法及装置
CN105786788A (zh) * 2016-03-22 2016-07-20 江苏国泰新点软件有限公司 一种利用word程序生成表单的方法和装置
CN108228777A (zh) * 2017-12-28 2018-06-29 北京洪泰同创信息技术有限公司 HTML文本导出到word文档的方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI248002B (en) * 2004-09-17 2006-01-21 Infopower Corp System and method of web-based editor for compound documents
CN102163233A (zh) * 2011-04-18 2011-08-24 北京神州数码思特奇信息技术股份有限公司 一种网页标记语言格式转换方法及***
CN102156742A (zh) * 2011-04-19 2011-08-17 北京神州数码思特奇信息技术股份有限公司 支持手机使用自带浏览器展示结构化文档的方法及中间件
CN105426480A (zh) * 2015-11-19 2016-03-23 中国地质大学(武汉) 一种用于HTML转换为Word文档的方法及装置
CN105786788A (zh) * 2016-03-22 2016-07-20 江苏国泰新点软件有限公司 一种利用word程序生成表单的方法和装置
CN108228777A (zh) * 2017-12-28 2018-06-29 北京洪泰同创信息技术有限公司 HTML文本导出到word文档的方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
周强 等: "基于dom4j转换XML为XHTML页面的方法", 《计算机技术与发展》 *
杨帆,赵义霞, 高等教育出版社 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113742624A (zh) * 2021-09-03 2021-12-03 北京市律典通科技有限公司 一种Word文档在线免插件浏览编辑处理方法及装置

Similar Documents

Publication Publication Date Title
US7802179B2 (en) Synchronizing data between different editor views
US10372792B2 (en) Document transformation performance via incremental fragment transformations
US20180181389A1 (en) Synchronizing comments in source code with text documents
CN106933887B (zh) 一种数据可视化方法及装置
US9672197B2 (en) Universal rebranding engine
CN110493342B (zh) 文件传输方法、装置、电子设备及可读存储介质
US20130124969A1 (en) Xml editor within a wysiwyg application
CN114138244A (zh) 模型类文件自动生成方法、装置、存储介质及电子设备
CN112861482A (zh) 文件在线编辑方法
CN110569488A (zh) 一种基于xml标记语言的模块化模板word生成方法
CN109558548B (zh) 一种消除css样式冗余的方法及相关产品
US10198426B2 (en) Method, system, and computer program product for dividing a term with appropriate granularity
US20110078552A1 (en) Transclusion Process
CN110245311B (zh) 局部页面动态渲染方法及装置
CN109977423B (zh) 一种生词处理方法、装置、电子设备和可读存储介质
US9223766B2 (en) Preserving formatting of content selection through snippets
CN112861483A (zh) 演示文稿在线编辑方法
CN114201215A (zh) 接口文档的生成方法、装置、电子设备及存储介质
CN110928549B (zh) 一种重编辑前端脚本程序的方法及装置
CN114048708A (zh) 一种基于富文本编辑器的自动排版方法和***
CN109634844B (zh) Js代码测试方法、装置及电子设备
JP7000709B2 (ja) 情報処理装置及びプログラム
US20230409521A1 (en) Automatic preservation
CN110569065B (zh) 基于域填充的处理器指令编码自动生成方法及装置
CN110661678B (zh) 一种异常监控方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210528

RJ01 Rejection of invention patent application after publication