CN111126006A - 导出带MathType公式的Word文档方法、装置、电子设备及存储介质 - Google Patents

导出带MathType公式的Word文档方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111126006A
CN111126006A CN201911360647.4A CN201911360647A CN111126006A CN 111126006 A CN111126006 A CN 111126006A CN 201911360647 A CN201911360647 A CN 201911360647A CN 111126006 A CN111126006 A CN 111126006A
Authority
CN
China
Prior art keywords
formula
mathtype
latex
word document
export
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911360647.4A
Other languages
English (en)
Inventor
高超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaochuanchuhai Education Technology Beijing Co ltd
Original Assignee
Xiaochuanchuhai Education Technology Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaochuanchuhai Education Technology Beijing Co ltd filed Critical Xiaochuanchuhai Education Technology Beijing Co ltd
Priority to CN201911360647.4A priority Critical patent/CN111126006A/zh
Publication of CN111126006A publication Critical patent/CN111126006A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/84Mapping; Conversion

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种导出带MathType公式的Word文档方法、装置、电子设备及存储介质,涉及文档处理技术领域。该方法包括:接收将数据内容导出为Word文档的导出请求;对数据内容进行解析处理,获得解析内容;判断解析内容中是否存在公式,如果存在,则根据解析内容,生成包括latex公式的Word基础文档;获取latex公式,根据latex公式,获取latex公式对应的MathType公式;将基础Word文档中的latex公式替换为MathType公式,导出带MathType公式的Word文档。高效完整地还原生产***生产的内容到Word文档,提高了从生产到排版最终交付物环节的效率;自动生成Word文档,无需对Word文档进行二次审校;Word文档中的公式支持MathType、OMML、latex格式,满足对公式的多场景支持;机器自动转换公式为MathType,无需使用MathType程序进行手动转换。

Description

导出带MathType公式的Word文档方法、装置、电子设备及存储 介质
技术领域
本发明涉及文档处理技术领域,尤其涉及一种导出带MathType公式的Word文档方法、装置、电子设备及存储介质。
背景技术
在如今的教育行业,为了实现多人协同、高效地完成教学内容的生产,各教育公司都会研发自己的内容生产***,作为生产***交付排版公司的最终产物。并且,在教学内容出版过程中,教学资料需要以word文档的形式交付给排版公司,对于文档中存在公式的,需要以MathType的方式显示在word文档中。如何高效的生产带公式word文档就成为了极其重要的一环,目前市面上并没有***可以实现此需求。
对于内容导出为word,网络上有不少解决方案,但是对于内容的格式及样式还原方面,并没有可以很好的支持案例;对于word文档中的公式,市面上的解决方案都是基于word自带的公式格式OMML来生成带公式的word文档,没有基于生成mathType公式的带公式word文档的解决方案;传统的方式都是生成word文档公式以latex码或OMML公式,然后通过mathType软件将这些公式转换为mathType公式,效率低下且不稳定。
发明内容
本申请涉及到的名词解释:
(1)Latex:一种生成数学公式的排版***语言;模块的唯一标记,用于追踪数据。
(2)MathType:MathType是一款专业的数学公式编辑器,兼容Office word,excel等700多种程序,用于编辑数学试卷、书籍、报刊、论文、幻灯演示等文档轻松输入各种复杂的数学公式和符号。
(3)MathML:一个用于描述数学公式、符号的一种XML标记语言。
(4)OMML:Office MathML的缩写,是微软对数学公式的一种XML标记语言
(5)OOXML:Office Open XML的缩写,是由微软公司为Office 2007产品开发的技术规范,现已成为国际文档格式标准,兼容前国际标准开放文档格式和中国文档标准“标文通”(外语简称:UOF)。于2006年12月成为ECMA标准。
(6)Word:是微软公司的一个文字处理器应用程序。
(7)JSON:是一种轻量级的数据交换格式。它基于ECMAScript(欧洲计算机协会制定的js规范)的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据。简洁和清晰的层次结构使得JSON成为理想的数据交换语言。易于人阅读和编写,同时也易于机器解析和生成,并有效地提升网络传输效率。
(8)API(Application Programming Interface,应用程序接口)函数:是一些预先定义的函数。
(9)wmf是Windows Metafile的缩写,简称图元文件,它是微软公司定义的一种Windows平台下的图形文件格式。
(10)bin是二进制文件,其用途依***或应用而定。一种文件格式binary的缩写。一个后缀名为".bin"的文件,只是表明它是binary格式。
(11)公式:用数学符号或文字表示各个数量之间的关系的式子,具有普遍性,适合于同类关系的所有问题。
(12)sdk:即软件开发工具包,是一些被软件工程师用于为特定的软件包、软件框架、硬件平台、操作***等创建应用软件的开发工具的集合,一般而言SDK即开发Windows平台下的应用程序所使用的SDK。它可以简单的为某个程序设计语言提供应用程序接口API的一些文件,但也可能包括能与某种嵌入式***通讯的复杂的硬件。一般的工具包括用于调试和其他用途的实用工具。SDK还经常包括示例代码、支持性的技术注解或者其他的为基本参考资料澄清疑点的支持文档。
(12)hash:一般翻译做散列、杂凑,或音译为哈希,是把任意长度的输入(又叫做预映射pre-image)通过散列算法变换成固定长度的输出,该输出就是散列值。这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空间,不同的输入可能会散列成相同的输出,所以不可能从散列值来确定唯一的输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
有鉴于此,为了解决或部分解决上述技术问题,本发明实施例提供了一种导出带MathType公式的Word文档方法、装置、电子设备及存储介质,将各类文档可视化编辑平台生成的数据以标准的数据格式(JSON),高效完整地生成并导出带MathType公式的Word文档。
根据本发明的一个方面,提供了一种导出带MathType公式的Word文档方法,包括:
接收将数据内容导出为Word文档的导出请求;
对所述数据内容进行解析处理,获得解析内容;
判断解析内容中是否存在公式,如果存在,则根据所述解析内容,生成包括latex公式的Word基础文档;
获取所述latex公式,根据所述latex公式,获取所述latex公式对应的MathType公式;
将所述基础Word文档中的latex公式替换为所述MathType公式,导出带MathType公式的Word文档。
可选地,所述根据所述latex公式,获取所述latex公式对应的MathType公式包括:
判断所述latex公式对应的MathType公式是否存在于预存公式库,如果不存在,则调用MathType官方sdk,将所述latex公式转换为MathType公式;
如果存在,则直接将所述基础Word文档中的latex公式替换为所述MathType公式,导出带MathType公式的Word文档。
可选地,所述方法还包括:
调用MathType官方sdk,将所述latex公式转换为MathType公式后,将latex所述公式对应的MathType公式保存至预存公式库;将所述latex公式的latex码转换为hash值;
将所述hash值作为所述latex公式的索引值保存至预存公式库,通过所述hash值判断所述latex公式是否已转换为MathType公式。
可选地,所述将所述latex公式转换为MathType公式包括:
生成MathType公式对应的wmf文件和bin文件,将所述wmf文件和bin文件的内容以base64编码的形式放入缓存。
可选地,所述方法还包括:
对于多个导出请求,按照导出请求时间、来源及导出优先级权值进行导出资源的分配;
和/或,
全程监控导出状态,如果监测到出错信息,则捕获所述出错信息,并进行报警;
和/或,
对所述导出请求和所述latex公式进行管理。
根据本发明的另一个方面,提供了一种导出带MathType公式的Word文档装置,包括:
导出请求接收模块,用于接收将数据内容导出为Word文档的导出请求;
解析模块,用于对所述数据内容进行解析处理,获得解析内容;
判断处理模块,用于判断解析内容中是否存在公式,如果存在,则根据所述解析内容,生成包括latex公式的Word基础文档;
目标公式获取模块,用于获取所述latex公式,根据所述latex公式,获取所述latex公式对应的MathType公式;
导出模块,用于将所述基础Word文档中的latex公式替换为所述MathType公式,导出带MathType公式的Word文档。
可选地,所述目标公式获取模块具体用于:
判断所述latex公式对应的MathType公式是否存在于预存公式库,如果不存在,则调用MathType官方sdk,将所述latex公式转换为MathType公式;
如果存在,则直接将所述基础Word文档中的latex公式替换为所述MathType公式,导出带MathType公式的Word文档。
可选地,所述装置还包括hash值获取模块,用于调用MathType官方sdk,将所述latex公式转换为MathType公式后,将latex所述公式对应的MathType公式保存至预存公式库;
将所述latex公式的latex码转换为hash值;
将所述hash值作为所述latex公式的索引值保存至预存公式库,通过所述hash值判断所述latex公式是否已转换为MathType公式;
可选地,所述目标公式获取模块具体还用于:
生成MathType公式对应的wmf文件和bin文件,将所述wmf文件和bin文件的内容以base64编码的形式放入缓存。
可选地,所述装置还包括:
分配模块,用于对于多个导出请求,按照导出请求时间、来源及导出优先级权值进行导出资源的分配;
和/或,
监控模块,用于全程监控导出状态,如果监测到出错信息,则捕获所述出错信息,并进行报警;
和/或,
管理模块,用于对所述导出请求和所述latex公式进行管理。
根据本发明的又一个方面,提供了一种电子设备,所述电子设备包括:壳体、处理器、存储器、电路板和电源电路,其中,电路板安置在壳体围成的空间内部,处理器和存储器设置在电路板上;电源电路,用于为上述电子设备的各个电路或器件供电;存储器用于存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行上述的方法。
根据本发明的又一个方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述的方法。
本发明通过接收将数据内容导出为Word文档的导出请求;对数据内容进行解析处理,获得解析内容;判断解析内容中是否存在公式,如果存在,则根据解析内容,生成包括latex公式的Word基础文档;获取latex公式,根据latex公式,获取latex公式对应的MathType公式;将基础Word文档中的latex公式替换为MathType公式,导出带MathType公式的Word文档。用将内容生产***产生的数据,以一套统一标准的数据结构采用JSON数据格式进行传输,经过公式转换等,高效完整地还原生产***生产的内容到word文档,提高了从生产到排版最终交付物环节的效率。本发明将生产***生产的数据,按照标准数据结构和格式,自动生成word文档,无需对word文档进行二次审校;Word文档中的公式支持mathType、OMML、latex格式,满足对公式的多场景支持;机器自动转换公式为mathType,无需使用mathType程序进行手动转换。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例提供的一种导出带MathType公式的Word文档方法流程图;
图2为本发明实施例提供的一种导出带MathType公式的Word文档装置示意图;
图3为本发明电子设备一个实施例的结构示意图。
具体实施方式
下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
图1为本发明实施例提供的一种导出带MathType公式的Word文档方法流程图,如图1所示,该方法包括以下步骤:
步骤S11:接收将数据内容导出为Word文档的导出请求;
接收各业务***或外部***导出请求,通过API(HTTP协议)接收各业务***或外部***的导出需求,放入任务队列中。其中,各业务***包括:讲义***,题库***,内容生成***等,外部***为其他公司的***。
步骤S12:对数据内容进行解析处理,获得解析内容;
解析导出请求的数据内容:解析需要导出的内容数据,转换为文档导出需要的数据格式。
步骤S13:判断解析内容中是否存在公式,如果存在,则根据解析内容,生成包括latex公式的Word基础文档;
a)按照解析出的内容,采用OOXML生成Word文档,其中公式格式支持的格式有latex,OMML,MathType;公式在Word中的表现形式可以是latex,omml和Mathtype,latex为一种描述公式的文本(使用$符号包裹起来),如:$a+b=c$,omml为Word自带的公式展现,这两种形式都不需要经过公式转换。
b)无论请求的导出公式格式为何,都会使用微软官方发布的OOXML标准先生成一份公式格式为latex的Word文档作为基础文档。
如果解析内容中不存在公式,则直接导出Word文档。
步骤S14:获取latex公式,根据latex公式,获取latex公式对应的MathType公式;
具体为:判断latex公式对应的MathType公式是否存在于预存公式库,如果不存在,则调用MathType官方sdk,将latex公式转换为MathType公式;如果存在,则直接将基础Word文档中的latex公式替换为MathType公式,导出带MathType公式的Word文档,可对基础文档采用编辑OOXML的方式将文档中的latex码替换为对应格式的公式资源。因为每一份Word文档都是以OOXML进行存储的,当预存公式库中存在latex公式对应的MathType公式,可以对提前生成好的Word文档中的latex码进行替换操作。
其中,OOXML的具体语法为现有技术不做赘述。
在本发明的一些实施例中,调用MathType官方sdk,将latex公式转换为MathType公式后,将latex公式对应的MathType公式保存至预存公式库;将latex公式的latex码转换为hash值;将hash值作为所述latex公式的索引值保存至预存公式库,通过hash值判断latex公式是否已转换为MathType公式。
举例来说,将latex公式的latex码经MD5转换为32位的hash值,作为索引存储到预存公式库中,该hash值作为此公式的唯一索引值,可以理解为在公式库中唯一的名字,这样在确认某个公式是否已转换就可以通过公式的latex码的MD5的32位hash值从预存公式库中快速检索到。
在本发明的一些实施例中,将latex公式转换为MathType公式包括:生成MathType公式对应的wmf文件和bin文件,将wmf文件和bin文件的内容以base64编码的形式放入缓存。
在Word中的MathType公式分为两部分,一部分是该公式的图形展现文件,即wmf文件;另一部分是MathType软件对该公式的具体加密描述文件,内容存放于bin文件中,该内容为MathType软件特有的加密方式,无法破译。
具体操作如下:
MathType官方提供了调取MathType转换程序的sdk,使用python语言调用MathType的sdk将公式的latex码转换为MathType公式,转换后的结果为上述的wmf和bin文件,此部分转换工作依赖于MathType软件。
将生成的wmf文件和bin文件的内容以base64编码的形式放入缓存的目的是为了加速提取速度,减少磁盘IO。
换言之,a)当接收到将latex公式转换为MathType公式的请求时,以latex码的hash值搜索预存公式库,如果预存公式库中不存在则放入转换队列任务中。
b)将latex转换为MathType的公式,会生成MathType公式对应的wmf和bin文件,并以latex码的hash值作为唯一索引,存入公式库中,作为公共资源进行复用。
c)将MathType公式对应的wmf和bin文件的内容以base64编码的形式放入缓存,缓存键值为latex码的hash值。
d)管理公式相关文件,可以对单个公式执行重新替换,上传文件替换等功能。
步骤S15:将基础Word文档中的latex公式替换为MathType公式,导出带MathType公式的Word文档。
在本发明的一些实施例中,该方法还包括:对于多个导出请求,按照导出请求时间、来源及导出优先级权值进行导出资源的分配;
在本发明的一些实施例中,该方法还包括:全程监控导出状态,如果监测到出错信息,则捕获出错信息,并进行报警;
在本发明的一些实施例中,该方法还包括:对导出请求和latex公式进行管理,管理方式主要包括:可以针对单个导出请求进行插队和重新执行处理,和,可以对单个公式执行重新转换,上传文件替换等功能。
在本发明的一些实施例中,该方法还包括:业务***或外部***请求时,生成回调地址,文档转换成功后会回传文档地址给业务***。
本发明提供的导出带MathType公式的Word文档方法,可以使用的应用场景包括:
1.内容生产***:线上制作讲义导出word文档供排版公司排版,线上制作试卷导出word文档进行打印。
2.内容下载服务:下载数据化的内容的可编辑word文档,如:试题、电子书、论文等。
本发明高效完整地还原生产***生产的内容到Word文档,提高了从生产到排版最终交付物环节的效率;自动生成Word文档,无需对Word文档进行二次审校;Word文档中的公式支持MathType、OMML、latex格式,满足对公式的多场景支持;机器自动转换公式为MathType,无需使用MathType程序进行手动转换。
图2为本发明实施例提供的一种导出带MathType公式的Word文档装置示意图,如图2所示,该装置20包括:
导出请求接收模块201,用于接收将数据内容导出为Word文档的导出请求;
解析模块202,用于对数据内容进行解析处理,获得解析内容;
判断处理模块203,用于判断解析内容中是否存在公式,如果存在,则根据解析内容,生成包括latex公式的Word基础文档;
目标公式获取模块204,用于获取latex公式,根据latex公式,获取latex公式对应的MathType公式;
导出模块导出模块205,用于将基础Word文档中的latex公式替换为MathType公式,导出带MathType公式的Word文档。
在本发明的一些实施例中,目标公式获取模块204具体用于:
判断latex公式对应的MathType公式是否存在于预存公式库,如果不存在,则调用MathType官方sdk,将latex公式转换为MathType公式;
如果存在,则直接将基础Word文档中的latex公式替换为MathType公式,导出带MathType公式的Word文档。
在本发明的一些实施例中,该装置还包括hash值获取模块,用于调用MathType官方sdk,将latex公式转换为MathType公式后,将latex公式对应的MathType公式保存至预存公式库;将latex公式的latex码转换为hash值;将hash值作为latex公式的索引值保存至预存公式库,通过hash值判断latex公式是否已转换为MathType公式。
在本发明的一些实施例中,目标公式获取模块204具体还用于:
生成MathType公式对应的wmf文件和bin文件,将wmf文件和bin文件的内容以base64编码的形式放入缓存。
在本发明的一些实施例中,该装置还包括:
分配模块206,用于对于多个导出请求,按照导出请求时间、来源及导出优先级权值进行导出资源的分配;
和/或,
监控模块207,用于全程监控导出状态,如果监测到出错信息,则捕获出错信息,并进行报警;
和/或,
管理模块208,用于对导出请求和latex公式进行管理。
图3为本发明电子设备一个实施例的结构示意图,上述电子设备可以包括:壳体31、处理器32、存储器33、电路板34和电源电路33,其中,电路板34安置在壳体31围成的空间内部,处理器32和存储器33设置在电路板34上;电源电路33,用于为上述电子设备的各个电路或器件供电;存储器33用于存储可执行程序代码;处理器32通过读取存储器33中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行前述任一实施例所述的方法。
处理器32对上述步骤的具体执行过程以及处理器32通过运行可执行程序代码来进一步执行的步骤,可以参见本发明图1-2所示实施例的描述,在此不再赘述。
该电子设备以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、***总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。
(5)其他具有数据交互功能的电子设备。
第四方面,本发明的实施例还提供计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现前述任一实现方式所述的方法。
本发明提供的导出带MathType公式的Word文档装置、电子设备及存储介质,可以使用的应用场景包括:
1.内容生产***:线上制作讲义导出word文档供排版公司排版,线上制作试卷导出word文档进行打印。
2.内容下载服务:下载数据化的内容的可编辑word文档,如:试题、电子书、论文等。
本发明通过接收将数据内容导出为Word文档的导出请求;对数据内容进行解析处理,获得解析内容;判断解析内容中是否存在公式,如果存在,则根据解析内容,生成包括latex公式的Word基础文档;获取latex公式,根据latex公式,获取latex公式对应的MathType公式;将基础Word文档中的latex公式替换为MathType公式,导出带MathType公式的Word文档。用将内容生产***产生的数据,以一套统一标准的数据结构采用JSON数据格式进行传输,经过公式转换等,高效完整地还原生产***生产的内容到word文档,提高了从生产到排版最终交付物环节的效率。本发明将生产***生产的数据,按照标准数据结构和格式,自动生成word文档,无需对word文档进行二次审校;Word文档中的公式支持mathType、OMML、latex格式,满足对公式的多场景支持;机器自动转换公式为mathType,无需使用mathType程序进行手动转换;同一公式生成一次即可共享使用,无需重复转换。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
为了描述的方便,描述以上装置是以功能分为各种单元/模块分别描述。当然,在实施本发明时可以把各单元/模块的功能在同一个或多个软件和/或硬件中实现。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种导出带MathType公式的Word文档方法,其特征在于,包括:
接收将数据内容导出为Word文档的导出请求;
对所述数据内容进行解析处理,获得解析内容;
判断解析内容中是否存在公式,如果存在,则根据所述解析内容,生成包括latex公式的Word基础文档;
获取所述latex公式,根据所述latex公式,获取所述latex公式对应的MathType公式;
将所述基础Word文档中的latex公式替换为所述MathType公式,导出带MathType公式的Word文档。
2.如权利要求1所述的方法,其特征在于,所述根据所述latex公式,获取所述latex公式对应的MathType公式包括:
判断所述latex公式对应的MathType公式是否存在于预存公式库,如果不存在,则调用MathType官方sdk,将所述latex公式转换为MathType公式;
如果存在,则直接将所述基础Word文档中的latex公式替换为所述MathType公式,导出带MathType公式的Word文档。
3.如权利要求2所述的方法,其特征在于,所述方法还包括:
调用MathType官方sdk,将所述latex公式转换为MathType公式后,将latex所述公式对应的MathType公式保存至预存公式库;将所述latex公式的latex码转换为hash值;
将所述hash值作为所述latex公式的索引值保存至预存公式库,通过所述hash值判断所述latex公式是否已转换为MathType公式。
4.如权利要求2或3所述的方法,其特征在于,所述将所述latex公式转换为MathType公式包括:
生成MathType公式对应的wmf文件和bin文件,将所述wmf文件和bin文件的内容以base64编码的形式放入缓存。
5.如权利要求1所述的方法,其特征在于,所述方法还包括:
对于多个导出请求,按照导出请求时间、来源及导出优先级权值进行导出资源的分配;
和/或,
全程监控导出状态,如果监测到出错信息,则捕获所述出错信息,并进行报警;
和/或,
对所述导出请求和所述latex公式进行管理。
6.一种导出带MathType公式的Word文档装置,其特征在于,包括:
导出请求接收模块,用于接收将数据内容导出为Word文档的导出请求;
解析模块,用于对所述数据内容进行解析处理,获得解析内容;
判断处理模块,用于判断解析内容中是否存在公式,如果存在,则根据所述解析内容,生成包括latex公式的Word基础文档;
目标公式获取模块,用于获取所述latex公式,根据所述latex公式,获取所述latex公式对应的MathType公式;
导出模块,用于将所述基础Word文档中的latex公式替换为所述MathType公式,导出带MathType公式的Word文档。
所述目标公式获取模块具体用于:
判断所述latex公式对应的MathType公式是否存在于预存公式库,如果不存在,则调用MathType官方sdk,将所述latex公式转换为MathType公式;
如果存在,则直接将所述基础Word文档中的latex公式替换为所述MathType公式,导出带MathType公式的Word文档。
7.如权利要求6所述的装置,其特征在于,所述装置还包括hash值获取模块,用于调用MathType官方sdk,将所述latex公式转换为MathType公式后,将latex所述公式对应的MathType公式保存至预存公式库;
将所述latex公式的latex码转换为hash值;
将所述hash值作为所述latex公式的索引值保存至预存公式库,通过所述hash值判断所述latex公式是否已转换为MathType公式;
所述目标公式获取模块具体还用于:
生成MathType公式对应的wmf文件和bin文件,将所述wmf文件和bin文件的内容以base64编码的形式放入缓存。
8.如权利要求6所述的装置,其特征在于,所述装置还包括:
分配模块,用于对于多个导出请求,按照导出请求时间、来源及导出优先级权值进行导出资源的分配;
和/或,
监控模块,用于全程监控导出状态,如果监测到出错信息,则捕获所述出错信息,并进行报警;
和/或,
管理模块,用于对所述导出请求和所述latex公式进行管理。
9.一种电子设备,其特征在于,所述电子设备包括:壳体、处理器、存储器、电路板和电源电路,其中,电路板安置在壳体围成的空间内部,处理器和存储器设置在电路板上;电源电路,用于为上述电子设备的各个电路或器件供电;存储器用于存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行权利要求1-5任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现权利要求1-5任一项所述的方法。
CN201911360647.4A 2019-12-25 2019-12-25 导出带MathType公式的Word文档方法、装置、电子设备及存储介质 Pending CN111126006A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911360647.4A CN111126006A (zh) 2019-12-25 2019-12-25 导出带MathType公式的Word文档方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911360647.4A CN111126006A (zh) 2019-12-25 2019-12-25 导出带MathType公式的Word文档方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN111126006A true CN111126006A (zh) 2020-05-08

Family

ID=70502540

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911360647.4A Pending CN111126006A (zh) 2019-12-25 2019-12-25 导出带MathType公式的Word文档方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111126006A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111046637A (zh) * 2019-12-25 2020-04-21 小船出海教育科技(北京)有限公司 一种科学公式正确性检验方法和装置
CN112083909A (zh) * 2020-08-07 2020-12-15 清华大学 工程结构设计标准公式识别及计算程序自动生成方法
CN112613279A (zh) * 2020-12-24 2021-04-06 北京乐学帮网络技术有限公司 一种文件的转换方法、装置、计算机装置及可读存储介质
CN112733491A (zh) * 2020-12-31 2021-04-30 北京乐学帮网络技术有限公司 一种数据转化方法、装置、计算机设备和存储介质
CN112800719A (zh) * 2020-12-28 2021-05-14 北京思题科技有限公司 一种电子文档结构化方法
CN113326675A (zh) * 2021-08-04 2021-08-31 江西风向标教育科技有限公司 一种用于教育资源库的公式处理方法及***
CN116702712A (zh) * 2023-08-09 2023-09-05 北京凯锐远景科技有限公司 一种Word任务书转换方法、装置、电子设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104750796A (zh) * 2014-11-13 2015-07-01 安徽四创电子股份有限公司 一种BS***下导出Word的方法
CN108153717A (zh) * 2017-12-29 2018-06-12 北京仁和汇智信息技术有限公司 一种科技期刊论文word文档的结构化处理方法及装置
CN108228777A (zh) * 2017-12-28 2018-06-29 北京洪泰同创信息技术有限公司 HTML文本导出到word文档的方法及装置
CN108319724A (zh) * 2018-02-28 2018-07-24 北京仁和汇智信息技术有限公司 一种带公式文件的网页发布方法及装置
CN110147534A (zh) * 2019-02-27 2019-08-20 中国地质大学(武汉) 一种LaTeX文档向Word文档转换的方法及***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104750796A (zh) * 2014-11-13 2015-07-01 安徽四创电子股份有限公司 一种BS***下导出Word的方法
CN108228777A (zh) * 2017-12-28 2018-06-29 北京洪泰同创信息技术有限公司 HTML文本导出到word文档的方法及装置
CN108153717A (zh) * 2017-12-29 2018-06-12 北京仁和汇智信息技术有限公司 一种科技期刊论文word文档的结构化处理方法及装置
CN108319724A (zh) * 2018-02-28 2018-07-24 北京仁和汇智信息技术有限公司 一种带公式文件的网页发布方法及装置
CN110147534A (zh) * 2019-02-27 2019-08-20 中国地质大学(武汉) 一种LaTeX文档向Word文档转换的方法及***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
窦盼英 等: "《现代教育技术实用教程》", 国防工业出版社, pages: 90 - 92 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111046637A (zh) * 2019-12-25 2020-04-21 小船出海教育科技(北京)有限公司 一种科学公式正确性检验方法和装置
CN112083909A (zh) * 2020-08-07 2020-12-15 清华大学 工程结构设计标准公式识别及计算程序自动生成方法
CN112613279A (zh) * 2020-12-24 2021-04-06 北京乐学帮网络技术有限公司 一种文件的转换方法、装置、计算机装置及可读存储介质
CN112800719A (zh) * 2020-12-28 2021-05-14 北京思题科技有限公司 一种电子文档结构化方法
CN112733491A (zh) * 2020-12-31 2021-04-30 北京乐学帮网络技术有限公司 一种数据转化方法、装置、计算机设备和存储介质
CN113326675A (zh) * 2021-08-04 2021-08-31 江西风向标教育科技有限公司 一种用于教育资源库的公式处理方法及***
CN116702712A (zh) * 2023-08-09 2023-09-05 北京凯锐远景科技有限公司 一种Word任务书转换方法、装置、电子设备及介质
CN116702712B (zh) * 2023-08-09 2023-10-17 北京凯锐远景科技有限公司 一种Word任务书转换方法、装置、电子设备及介质

Similar Documents

Publication Publication Date Title
CN111126006A (zh) 导出带MathType公式的Word文档方法、装置、电子设备及存储介质
US9977770B2 (en) Conversion of a presentation to Darwin Information Typing Architecture (DITA)
CN112015430A (zh) JavaScript代码翻译方法、装置、计算机设备及存储介质
CN109978629B (zh) 一种广告投放方法、装置、电子设备及存储介质
CN109495496B (zh) 语音处理方法、装置、电子设备及计算机可读介质
EP1999699A1 (en) Edi instance based transaction set definition
CN110020358B (zh) 用于生成动态页面的方法和装置
CN110855555B (zh) 邮件发送方法、装置、设备及计算机可读存储介质
CN102929912A (zh) 生成微博图片的方法及***
CN107566090B (zh) 一种定长/变长的文本报文处理方法及装置
CN114020846A (zh) 一种可更改nft作品处理方法及其装置
CN113268245A (zh) 代码分析方法、装置及存储介质
CN114020718A (zh) 一种不可更改nft作品处理方法及其装置
US11581903B2 (en) Data compression method and apparatus, computer-readable storage medium, and electronic device
CN111796727A (zh) 一种界面数据处理方法及装置
CN113010542A (zh) 业务数据处理方法、装置、计算机设备及存储介质
CN115841095A (zh) 一种文档建立方法、***、介质及设备
CN113342450B (zh) 页面处理的方法、装置、电子设备及计算机可读介质
CN115293123A (zh) 文档模板生成方法、报告在线生成方法及装置
CN115061785A (zh) 信息下发方法、装置、存储介质及服务器
CN114518881A (zh) 一种页面生成方法、***及存储介质
CN114866628A (zh) 一种报文处理的方法、装置、设备及存储介质
CN112527278A (zh) 智能表单生成及发布方法、装置、终端及存储介质
CN114036162A (zh) 一种游戏nft作品处理方法及其装置
CN112613279A (zh) 一种文件的转换方法、装置、计算机装置及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination