CN113221506A - 一种讲义排版的方法、装置、电子设备及存储介质 - Google Patents

一种讲义排版的方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113221506A
CN113221506A CN202110527443.6A CN202110527443A CN113221506A CN 113221506 A CN113221506 A CN 113221506A CN 202110527443 A CN202110527443 A CN 202110527443A CN 113221506 A CN113221506 A CN 113221506A
Authority
CN
China
Prior art keywords
file
typesetting
latex
standard
lecture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110527443.6A
Other languages
English (en)
Inventor
杨行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Youzhuju Network Technology Co Ltd
Original Assignee
Beijing Youzhuju Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Youzhuju Network Technology Co Ltd filed Critical Beijing Youzhuju Network Technology Co Ltd
Priority to CN202110527443.6A priority Critical patent/CN113221506A/zh
Publication of CN113221506A publication Critical patent/CN113221506A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Processing Or Creating Images (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本公开提供了一种讲义排版的方法、装置、电子设备及存储介质,其中,该方法包括:获取待排版的第一文档格式的讲义文件;基于标准内容模型,对讲义文件进行标准化处理,得到标准文件;标准内容模型用于统一描述不同文档格式下的富文本文档的内容和样式;基于标准文件,以及目标排版***配置信息,得到目标排版***文件;对目标排版***文件进行排版,生成排版后的第二文档格式的讲义文件。本公开中基于标准内容模型所生成的标准文件可以很好的兼顾讲义文件与排版***文件,确保了后续基于目标排版***配置信息对标准文件进行配置所生成的目标排版***文件与排版***之间的兼容性,从而降低了排版内容发生丢失和错误的概率,使得排版的准确度较高。

Description

一种讲义排版的方法、装置、电子设备及存储介质
技术领域
本公开涉及计算机技术领域,具体而言,涉及一种讲义排版的方法、装置、电子设备及存储介质。
背景技术
随着互联网技术向教育领域的拓展和渗透,在线教育平台已是层出不穷。在线教育场景下,教研老师使用在线讲义编写学习课件。有关在线讲义的排版印刷流程可以是将讲义导出为Word文件,再将Word文件导入线下排版软件中进行二次编辑,进而得到编辑好的学习课件。
然而,由于在线讲义与Word文件之间的格式存在差异,在将讲义导出为Word文件的情况下,难免会出现格式上的错误,此外,由于Word文件与排版软件存在不兼容性的问题,这使得最终编辑好的课件在内容和样式上存在较多的丢失和错误。
发明内容
本公开实施例至少提供一种讲义排版的方法、装置、电子设备及存储介质。
第一方面,本公开实施例提供了一种讲义排版的方法,所述方法包括:
获取待排版的第一文档格式的讲义文件;
基于标准内容模型,对所述讲义文件进行标准化处理,得到标准文件;所述标准内容模型用于统一描述不同文档格式下的富文本文档的内容和样式;
基于所述标准文件,以及目标排版***配置信息,得到目标排版***文件;
对所述目标排版***文件进行排版,生成排版后的第二文档格式的讲义文件。
采用上述讲义排版的方法,首先可以基于标准内容模型对待排版的讲义文件进行标准化处理,得到标准文件,由于这里的标准内容模型用于统一描述不同文档格式下的富文本文档的内容和样式,因而基于上述标准内容模型所生成的标准文件可以很好的兼顾讲义文件与排版***文件,确保了后续基于目标排版***配置信息对标准文件进行配置所生成的目标排版***文件与排版***之间的兼容性,从而降低了排版内容发生丢失和错误的概率,使得排版的准确度较高。
在一种可能的实施方式中,所述基于标准内容模型,对所述讲义文件进行标准化处理,得到标准文件,包括:
基于预先定义的文件解析模型对所述讲义文件进行解析,解析出与所述文件解析模型匹配的第一文件数据信息;
根据解析出的所述第一文件数据信息以及所述文件解析模型,确定解析后文件;
基于预先定义的标准内容模型对所述解析后文件进行转换,得到与所述标准内容模型匹配的第二文件数据信息;
基于得到的所述第二文件数据信息以及所述标准内容模型,得到所述标准文件。
这里,考虑到讲义文件的数据结构可读性较差的问题,这里可以先基于文件解析模型进行解析,而后再基于标准内容模型对解析得到的解析后文件进行转换,从而可以得到与所述标准内容模型匹配的第二文件数据信息,进而得到标准文件,实现了由讲义文件到标准文件的转化,更具实用性。
在一种可能的实施方式中,所述目标排版***文件包括LaTeX文件,所述基于所述标准文件,以及目标排版***配置信息,得到目标排版***文件,包括:
依次读取所述标准文件的各个段落;每个所述段落包括至少一个分块;
针对读取到的每个所述段落中的每个分块,基于预设的属性解析器对该分块进行属性解析,确定该分块的属性;
基于各属性与各LaTeX命令之间的预设对应关系,确定与每个分块的属性匹配的LaTeX命令;
基于与每个分块的属性匹配的LaTeX命令,得到LaTeX文件。
考虑到LaTeX文件在排版层面的优良特性,这里的目标排版***文件可以包括LaTeX文件。这里可以基于对标准文件的各个段落中的每个分块的属性解析结果来确定分块的属性,进而基于属性与LaTeX命令之间的预设对应关系来确定与每个分块的属性匹配的LaTeX命令。这样,基于LaTeX的命令配置即可以得到LaTeX文件,所得到的LaTeX文件可以更好的兼容后续的LaTeX排版***,除此之外,这里是针对分块的属性匹配对应的LaTeX命令,后续可以实现针对LaTeX命令的修改实现针对属性的统一修改,提升后续的排版效率。
在一种可能的实施方式中,所述基于与每个分块的属性匹配的LaTeX命令,得到LaTeX文件,包括:
针对每个所述段落中的每个分块,将与该分块的属性匹配的LaTeX命令、以及该分块的内容进行绑定,得到与该分块对应的LaTeX命令行;
针对每个所述段落,将属于该段落的各个分块对应的LaTeX命令行进行组合,得到与该段落对应的LaTeX命令行;
按照各个段落的排列顺序将与各个段落对应的LaTeX命令行进行组合,得到LaTeX文件。
这里,将分块的属性和分块的内容进行绑定,进而得到与每个段落对应的LaTeX命令行,通过段落组合可以得到最终的LaTeX文件。针对LaTeX文件而言,可以单独对分块的属性进行修改,也可以单独对分块的内容进行修改,提升了后续排版的效率。
在一种可能的实施方式中,所述第二文档格式的讲义文件包括PDF文件,所述对所述目标排版***文件进行排版,生成排版后的第二文档格式的讲义文件,包括:
在确定接收到客户端针对所述LaTeX文件的编辑指令的情况下,基于所述编辑指令对所述LaTeX文件进行修改,得到修改后的LaTeX文件;
对所述修改后的LaTeX文件进行排版,生成排版后的PDF文件。
在一种可能的实施方式中,所述LaTeX命令包括宏命令;接收到客户端针对所述LaTeX文件的编辑指令,包括:
接收到针对LaTeX文件中包括的任一分块的属性匹配的宏命令的样式编辑指令;
或者,接收到针对LaTeX文件中包括的任一分块的内容编辑指令。
这里,可以通过分块的属性匹配的宏命令的样式编辑指令实现样式编辑,也可以通过分块的内容编辑指令实现内容编辑,支持多种编辑需求。
在一种可能的实施方式中,所述对所述目标排版***文件进行排版,生成排版后的第二文档格式的讲义文件,包括:
通过调用预设排版引擎对所述目标排版***文件进行排版,生成排版后的第二文档格式的讲义文件。
在一种可能的实施方式中,得到用于描述各文件格式的标准文件之后,还包括:
在确定接收到由所述目标排版***文件指向其它目标排版***文件的转换指令的情况下,获取与所述目标排版***文件对应的标准文件,并基于所述标准文件,以及其它排版***配置信息,得到其它排版***文件。
这里,考虑到标准文件可以兼顾各种不同文档格式,因而可以基于标准文件实现目标排版***文件与其它排版***文件的任意转化,适应性更佳。
第二方面,本公开实施例还提供了一种讲义排版的装置,所述装置包括:
获取模块,用于获取待排版的第一文档格式的讲义文件;
第一生成模块,用于基于标准内容模型,对所述讲义文件进行标准化处理,得到标准文件;所述标准内容模型用于统一描述不同文档格式下的富文本文档的内容和样式;
第二生成模块,用于基于所述标准文件,以及目标排版***配置信息,得到目标排版***文件;
排版模块,用于对所述目标排版***文件进行排版,生成排版后的第二文档格式的讲义文件。
第三方面,本公开实施例还提供了一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如第一方面及其各种实施方式任一所述的讲义排版的方法的步骤。
第四方面,本公开实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如第一方面及其各种实施方式任一所述的讲义排版的方法的步骤。
关于上述讲义排版的装置、电子设备、及计算机可读存储介质的效果描述参见上述讲义排版的方法的说明,这里不再赘述。
为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本公开实施例所提供的一种讲义排版的方法的流程图;
图2示出了本公开实施例所提供的一种讲义排版的方法的应用示意图;
图3示出了本公开实施例所提供的一种讲义排版的装置的示意图;
图4示出了本公开实施例所提供的一种电子设备的示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
本文中术语“和/或”,仅仅是描述一种关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
经研究发现,由于在线讲义与Word文件之间的格式存在差异,在将讲义导出为Word文件的情况下,难免会出现格式上的错误,此外,由于Word文件与排版软件存在不兼容性的问题,这使得最终编辑好的课件在内容和样式上存在较多的丢失和错误。
基于上述研究,本公开提供了一种讲义排版的方法、装置、电子设备及存储介质,排版的准确度较高。
为便于对本实施例进行理解,首先对本公开实施例所公开的一种讲义排版的方法进行详细介绍,本公开实施例所提供的讲义排版的方法的执行主体一般为具有一定计算能力的计算机设备,该计算机设备例如包括:终端设备或服务端或其它处理设备,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字助理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该讲义排版的方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
参见图1所示,为本公开实施例提供的讲义排版的方法的流程图,所述方法包括步骤S101~S104,其中:
S101:获取待排版的第一文档格式的讲义文件;
S102:基于标准内容模型,对讲义文件进行标准化处理,得到标准文件;标准内容模型用于统一描述不同文档格式下的富文本文档的内容和样式;
S103:基于标准文件,以及目标排版***配置信息,得到目标排版***文件;
S103:对目标排版***文件进行排版,生成排版后的第二文档格式的讲义文件。
为了便于理解本公开实施例提供的讲义排版的方法,接下来首先对该方法的应用场景进行简单描述。上述讲义排版的方法主要可以应用于在线教育场景中,可以帮助教研老师将待排版的讲义文件排版为排版后的高印刷质量讲义文件以便于教研老师授课。这里待排版的讲义文件可以是利用在线讲义编辑工具上编辑的讲义文件,具有特殊的数据结构。这里的高印刷质量讲义文件可以指的是渲染出的PDF文件,可视化效果更佳。
其中,上述待排版的讲义文件的格式可以是利用协同协议的EasySync OT数据结构来描述的有关富文本的内容和样式的第一文档格式,上述EasySync OT数据结构的可读性较差。
为了更好实现讲义文件的排版,这里可以先对具有第一文档格式的讲义文件进行标准化处理,得到标准文件,该标准文件不仅可以很好的描述讲义文件与其它各种文件之间的转换关系,还可以解决上述可读性差的问题。这样,在利用目标排版***配置信息对标准文件进行配置之后,可以得到目标排版***文件。
这里的目标排版***文件可以是具有较好排版性能的文件,例如,可以是LaTeX文件,这样,在对目标排版***文件进行排版之后,可以得到排版后的第二文档格式的讲义文件。例如,在LaTeX文件作为目标排版***文件的情况下,这里的排版后的第二文档格式的讲义文件可以是PDF文件。在具体应用中,可以通过渲染技术实现最终的排版效果,这里不做赘述。
本公开实施例中可以基于标准内容模型实现针对讲义文件的标准化处理,这里的标准内容模型用于统一描述不同文档格式下的富文本文档的内容和样式,也即,可以作为各文档格式转换的中间模型,这样可以确保内容转换服务的通用性和可拓展性,实现各文档格式之间的互相转换。
上述标准内容模型可以是从各文档格式中抽取出的标准模型,可以兼顾各文档格式,这样,利用目标排版***配置信息可以方便快捷的得到目标排版***文件。可知的是,对于可读性较差的具有第一文档格式的讲义文件而言,这里可以进行可读性高这一约束下的标准化处理,进而可以实现针对具有良好排版特性的目标排版***文件的排版操作,这样所得到的具有第二文档格式的讲义文件,大大降低了排版内容发生丢失和错误的概率,使得排版的准确度较高。
本公开实施例中的目标排版***配置信息可以是针对目标排版***文件的相关配置命令。在具体应用中,可以基于不同的目标排版***文件选择相应的配置命令。考虑到LaTeX文件在排版层面所具备的优良特性,这里可以将LaTeX文件作为目标排版***文件。
针对LaTeX文件而言,本公开实施例中可以调用预设排版引擎来实现排版。在具体应用中,可以使用XeTeX排版引擎来编译和渲染,以支持OpenType字体技术,生成PDF文件。
其中,XeTeX排版引擎可以包含在TeX Live软件发行套装中,可以将TeX Live软件发行套装中的发行镜像打包在服务镜像中。这样,即可以通过直接调用XeTeX排版引擎,将LaTeX文件编译为PDF文件,并渲染在客户端以进行PDF文件的展示。
考虑到标准文件的生成对于后续进行排版的关键作用,接下来可以对生成标准文件的过程进行说明,具体包括如下步骤:
步骤一、基于预先定义的文件解析模型对讲义文件进行解析,解析出与文件解析模型匹配的第一文件数据信息;
步骤二、根据解析出的第一文件数据信息以及文件解析模型,确定解析后文件;
步骤三、基于预先定义的标准内容模型对解析后文件进行转换,得到与标准内容模型匹配的第二文件数据信息;
步骤四、基于得到的第二文件数据信息以及标准内容模型,得到标准文件。
这里,考虑到具有第一文档格式的讲义文件的可读性较差,首先可以利用预先定义的文件解析模型对讲义文件进行解析,解析出与文件解析模型匹配的第一文件数据信息,这里的解析可以是针对待排版的讲义文件的协同数据结构EasySync OT的解析。
上述文件解析模型可以用来描述文件段落和段落内各分块的内容和属性,可以理解为是一个框架模型。以在线教育为例,这里所解析出的第一文件数据信息,可以是有关分块的内容,包含了在线讲义内自有的试题、学科插件等特殊的业务元数据,还可以是有关分块的属性,包含了试题的样式等数据。
需要说明的是,不同的教育学科,所对应文件段落的具体指向内容可以不同。例如,在数学科目中,这里的文件段落可以指向一道数学题,该数学题可以包括题目、题干等内容,这里的题目和题干可以分别对应一个分块,对应有各自的属性,例如,题目是四号字体这一样式,题干是图片这一样式;再如,在语文科目中,这里的文件段落可以对应一篇文章的一个段落。
这里,将第一文件数据系信息输入至文件解析模型,即可以确定出解析后文件。针对解析后文件而言,本公开实施例可以基于标准内容模型对解析后文件进行转换。这里的标准内容模型也可以理解为是一个框架模型,描述的是通用的文档格式。同理,这里,可以将对解析后文件转换得到的第二文件数据信息输入至标准内容模型,即可以确定出标准文件。
本公开实施例提供的讲义排版的方法,基于标准文件可以生成目标排版***文件。在LaTeX文件作为目标排版***文件的情况下,可以按照如下步骤得到LaTeX文件:
步骤一、依次读取标准文件的各个段落;每个段落包括至少一个分块;
步骤二、针对读取到的每个段落中的每个分块,基于预设的属性解析器对该分块进行属性解析,确定该分块的属性;
步骤三、基于各属性与各LaTeX命令之间的预设对应关系,确定与每个分块的属性匹配的LaTeX命令;
步骤四、基于与每个分块的属性匹配的LaTeX命令,得到LaTeX文件。
为了更好的实现基于属性的批量修改,本公开实施例提供了一种将分块的属性和内容分别进行命令配置的方案。
这里,首先可以基于属性解析器实现对各分块的属性解析,进而确定与分块的属性匹配的LaTeX命令,然后再通过分块与段落之间的包含关系,各段落之间的排列顺序来确定最终的LaTeX文件。具体通过如下步骤来实现:
步骤一、针对每个段落中的每个分块,将与该分块的属性匹配的LaTeX命令、以及该分块的内容进行绑定,得到与该分块对应的LaTeX命令行;
步骤二、针对每个段落,将属于该段落的各个分块对应的LaTeX命令行进行组合,得到与该段落对应的LaTeX命令行;
步骤三、按照各个段落的排列顺序将与各个段落对应的LaTeX命令行进行组合,得到LaTeX文件。
考虑到在实际编写过程中,LaTeX会引用大量宏包和自定义宏命令,并经常需要对使用的样式定义做修改,以实现排版所需样式的设置。因而,这里的LaTeX命令主要可以是预先定义的宏命令。也即,每个属性可以对应指向一个宏命令,在确定出对应的宏命令之后,可以将对应分块的内容与该宏命令进行绑定,以得到与分块对应的LaTeX命令行。这样,在后续需要进行样式修改的情况下,只需要修改宏命令的预先定义即可,从而大大节省了排版编辑时间。
本公开实施例中的排版操作可以包括有关LaTeX文件的修改操作。这里,可以在客户端提供编辑窗口,在确定接收到客户端针对LaTeX文件的编辑指令的情况下,基于编辑指令对LaTeX文件进行修改,得到修改后的LaTeX文件,然后对修改后的LaTeX文件进行排版,生成排版后的PDF文件。
上述编辑指令可以是接收到针对LaTeX文件中包括的任一分块的属性匹配的宏命令的样式编辑指令确定的,也即,可以是在客户端进行宏命令的修改,以选择需要应用的样式,还可以是接收到针对LaTeX文件中包括的任一分块的内容编辑指令确定的,也即,可以是在客户端进行分块内容的修改,以确定修改后的内容。
不管是上述哪种编辑指令均可以是在客户端上设置的在线LaTeX编辑器所发起的,这主要是为了排版人员可以更好进行编辑操作。
为了便于理解上述服务端与客户端之间的交互过程,接下来可以结合图2进一步进行说明。
如图2所示,在客户端上呈现有编辑器界面。在当前编辑器界面上,用户可以利用LaTeX编辑器发起编辑指令,这样,在服务端可以基于排版项目管理进行指向具体的LaTeX文件的有关修改操作。这里的修改可以是针对讲义内容的修改,也可以是针对讲义版式的修改。
不管上述哪种修改方式,本公开实施例中均可以在服务端进行LaTeX文件编译,并将编译得到的PDF文件渲染在客户端的编辑器界面。
本公开实施例提供的讲义排版的方法还可以利用标准文件实现不同文件之间的转换,以满足用户的文件转换需求。这里,可以是在确定接收到由目标排版***文件指向其它目标排版***文件的转换指令的情况下,获取与目标排版***文件对应的标准文件,并基于标准文件,以及其它排版***配置信息,得到其它排版***文件。
这里的其它排版***文件可以是HTML文件,也可以是Word文件,还可以是其它***文件,本公开实施例对此不做具体的限制。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
基于同一发明构思,本公开实施例中还提供了与讲义排版的方法对应的讲义排版的装置,由于本公开实施例中的装置解决问题的原理与本公开实施例上述讲义排版的方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
参照图3所示,为本公开实施例提供的一种讲义排版的装置的示意图,装置包括:获取模块301、第一生成模块302、第二生成模块303和排版模块304;其中,
获取模块301,用于获取待排版的第一文档格式的讲义文件;
第一生成模块302,用于基于标准内容模型,对讲义文件进行标准化处理,得到标准文件;标准内容模型用于统一描述不同文档格式下的富文本文档的内容和样式;
第二生成模块303,用于基于标准文件,以及目标排版***配置信息,得到目标排版***文件;
排版模块304,用于对目标排版***文件进行排版,生成排版后的第二文档格式的讲义文件。
采用上述讲义排版的装置,首先可以基于标准内容模型对待排版的讲义文件进行标准化处理,得到标准文件,由于这里的标准内容模型用于统一描述不同文档格式下的富文本文档的内容和样式,因而基于上述标准内容模型所生成的标准文件可以很好的兼顾讲义文件与排版***文件,确保了后续基于目标排版***配置信息对标准文件进行配置所生成的目标排版***文件与排版***之间的兼容性,从而降低了排版内容发生丢失和错误的概率,使得排版的准确度较高。
在一种可能的实施方式中,第一生成模块302,用于按照以下步骤基于标准内容模型,对讲义文件进行标准化处理,得到标准文件:
基于预先定义的文件解析模型对讲义文件进行解析,解析出与文件解析模型匹配的第一文件数据信息;
根据解析出的第一文件数据信息以及文件解析模型,确定解析后文件;
基于预先定义的标准内容模型对解析后文件进行转换,得到与标准内容模型匹配的第二文件数据信息;
基于得到的第二文件数据信息以及标准内容模型,得到标准文件。
在一种可能的实施方式中,目标排版***文件包括LaTeX文件,第二生成模块303,用于按照以下步骤基于标准文件,以及目标排版***配置信息,得到目标排版***文件:
依次读取标准文件的各个段落;每个段落包括至少一个分块;
针对读取到的每个段落中的每个分块,基于预设的属性解析器对该分块进行属性解析,确定该分块的属性;
基于各属性与各LaTeX命令之间的预设对应关系,确定与每个分块的属性匹配的LaTeX命令;
基于与每个分块的属性匹配的LaTeX命令,得到LaTeX文件。
在一种可能的实施方式中,第二生成模块303,用于按照以下步骤基于与每个分块的属性匹配的LaTeX命令,得到LaTeX文件:
针对每个段落中的每个分块,将与该分块的属性匹配的LaTeX命令、以及该分块的内容进行绑定,得到与该分块对应的LaTeX命令行;
针对每个段落,将属于该段落的各个分块对应的LaTeX命令行进行组合,得到与该段落对应的LaTeX命令行;
按照各个段落的排列顺序将与各个段落对应的LaTeX命令行进行组合,得到LaTeX文件。
在一种可能的实施方式中,第二文档格式的讲义文件包括PDF文件,排版模块304,用于按照以下步骤对目标排版***文件进行排版,生成排版后的第二文档格式的讲义文件:
在确定接收到客户端针对LaTeX文件的编辑指令的情况下,基于编辑指令对LaTeX文件进行修改,得到修改后的LaTeX文件;
对修改后的LaTeX文件进行排版,生成排版后的PDF文件。
在一种可能的实施方式中,LaTeX命令包括宏命令;排版模块304,用于按照以下步骤接收到客户端针对LaTeX文件的编辑指令:
接收到针对LaTeX文件中包括的任一分块的属性匹配的宏命令的样式编辑指令;
或者,接收到针对LaTeX文件中包括的任一分块的内容编辑指令。
在一种可能的实施方式中,排版模块304,用于按照以下步骤对目标排版***文件进行排版,生成排版后的第二文档格式的讲义文件:
通过调用预设排版引擎对目标排版***文件进行排版,生成排版后的第二文档格式的讲义文件。
在一种可能的实施方式中,上述装置还包括:
转换模块305,用于得到用于描述各文件格式的标准文件之后,在确定接收到由目标排版***文件指向其它目标排版***文件的转换指令的情况下,获取与目标排版***文件对应的标准文件,并基于标准文件,以及其它排版***配置信息,得到其它排版***文件。
关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
本公开实施例还提供了一种电子设备,如图4所示,为本公开实施例提供的电子设备结构示意图,包括:处理器401、存储器402、和总线403。存储器402存储有处理器401可执行的机器可读指令(比如,图3中的装置中获取模块301、第一生成模块302、第二生成模块303、排版模块304对应的执行指令等),当电子设备运行时,处理器401与存储器402之间通过总线403通信,机器可读指令被处理器401执行时执行如下处理:
获取待排版的第一文档格式的讲义文件;
基于标准内容模型,对讲义文件进行标准化处理,得到标准文件;标准内容模型用于统一描述不同文档格式下的富文本文档的内容和样式;
基于标准文件,以及目标排版***配置信息,得到目标排版***文件;
对目标排版***文件进行排版,生成排版后的第二文档格式的讲义文件。
本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的讲义排版的方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。
本公开实施例还提供一种计算机程序产品,该计算机程序产品承载有程序代码,所述程序代码包括的指令可用于执行上述方法实施例中所述的讲义排版的方法的步骤,具体可参见上述方法实施例,在此不再赘述。
其中,上述计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的***、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务端,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。

Claims (11)

1.一种讲义排版的方法,其特征在于,所述方法包括:
获取待排版的第一文档格式的讲义文件;
基于标准内容模型,对所述讲义文件进行标准化处理,得到标准文件;所述标准内容模型用于统一描述不同文档格式下的富文本文档的内容和样式;
基于所述标准文件,以及目标排版***配置信息,得到目标排版***文件;
对所述目标排版***文件进行排版,生成排版后的第二文档格式的讲义文件。
2.根据权利要求1所述的方法,其特征在于,所述基于标准内容模型,对所述讲义文件进行标准化处理,得到标准文件,包括:
基于预先定义的文件解析模型对所述讲义文件进行解析,解析出与所述文件解析模型匹配的第一文件数据信息;
根据解析出的所述第一文件数据信息以及所述文件解析模型,确定解析后文件;
基于预先定义的标准内容模型对所述解析后文件进行转换,得到与所述标准内容模型匹配的第二文件数据信息;
基于得到的所述第二文件数据信息以及所述标准内容模型,得到所述标准文件。
3.根据权利要求1或2所述的方法,其特征在于,所述目标排版***文件包括LaTeX文件,所述基于所述标准文件,以及目标排版***配置信息,得到目标排版***文件,包括:
依次读取所述标准文件的各个段落;每个所述段落包括至少一个分块;
针对读取到的每个所述段落中的每个分块,基于预设的属性解析器对该分块进行属性解析,确定该分块的属性;
基于各属性与各LaTeX命令之间的预设对应关系,确定与每个分块的属性匹配的LaTeX命令;
基于与每个分块的属性匹配的LaTeX命令,得到LaTeX文件。
4.根据权利要求3所述的方法,其特征在于,所述基于与每个分块的属性匹配的LaTeX命令,得到LaTeX文件,包括:
针对每个所述段落中的每个分块,将与该分块的属性匹配的LaTeX命令、以及该分块的内容进行绑定,得到与该分块对应的LaTeX命令行;
针对每个所述段落,将属于该段落的各个分块对应的LaTeX命令行进行组合,得到与该段落对应的LaTeX命令行;
按照各个段落的排列顺序将与各个段落对应的LaTeX命令行进行组合,得到LaTeX文件。
5.根据权利要求4所述的方法,其特征在于,所述第二文档格式的讲义文件包括PDF文件,所述对所述目标排版***文件进行排版,生成排版后的第二文档格式的讲义文件,包括:
在确定接收到客户端针对所述LaTeX文件的编辑指令的情况下,基于所述编辑指令对所述LaTeX文件进行修改,得到修改后的LaTeX文件;
对所述修改后的LaTeX文件进行排版,生成排版后的PDF文件。
6.根据权利要求5所述的方法,其特征在于,所述LaTeX命令包括宏命令;接收到客户端针对所述LaTeX文件的编辑指令,包括:
接收到针对LaTeX文件中包括的任一分块的属性匹配的宏命令的样式编辑指令;
或者,接收到针对LaTeX文件中包括的任一分块的内容编辑指令。
7.根据权利要求1-6任一所述的方法,其特征在于,所述对所述目标排版***文件进行排版,生成排版后的第二文档格式的讲义文件,包括:
通过调用预设排版引擎对所述目标排版***文件进行排版,生成排版后的第二文档格式的讲义文件。
8.根据权利要求1-7任一所述的方法,其特征在于,得到用于描述各文件格式的标准文件之后,还包括:
在确定接收到由所述目标排版***文件指向其它目标排版***文件的转换指令的情况下,获取与所述目标排版***文件对应的标准文件,并基于所述标准文件,以及其它排版***配置信息,得到其它排版***文件。
9.一种讲义排版的装置,其特征在于,所述装置包括:
获取模块,用于获取待排版的第一文档格式的讲义文件;
第一生成模块,用于基于标准内容模型,对所述讲义文件进行标准化处理,得到标准文件;所述标准内容模型用于统一描述不同文档格式下的富文本文档的内容和样式;
第二生成模块,用于基于所述标准文件,以及目标排版***配置信息,得到目标排版***文件;
排版模块,用于对所述目标排版***文件进行排版,生成排版后的第二文档格式的讲义文件。
10.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至8任一所述的讲义排版的方法的步骤。
11.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至8任一所述的讲义排版的方法的步骤。
CN202110527443.6A 2021-05-14 2021-05-14 一种讲义排版的方法、装置、电子设备及存储介质 Pending CN113221506A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110527443.6A CN113221506A (zh) 2021-05-14 2021-05-14 一种讲义排版的方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110527443.6A CN113221506A (zh) 2021-05-14 2021-05-14 一种讲义排版的方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN113221506A true CN113221506A (zh) 2021-08-06

Family

ID=77091920

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110527443.6A Pending CN113221506A (zh) 2021-05-14 2021-05-14 一种讲义排版的方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113221506A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113569532A (zh) * 2021-09-22 2021-10-29 北京仁和汇智信息技术有限公司 一种html编辑方法、装置、电子设备及计算机可读存储介质
CN117236282A (zh) * 2023-10-24 2023-12-15 雅昌文化(集团)有限公司 基于xml数据的智能排版方法、装置、终端及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101872340A (zh) * 2009-04-23 2010-10-27 北京大学 一种基于版面格式模板的排版方法及装置
CN109815450A (zh) * 2017-11-20 2019-05-28 北大方正集团有限公司 XML文件转换Word文件的方法及装置
CN110147534A (zh) * 2019-02-27 2019-08-20 中国地质大学(武汉) 一种LaTeX文档向Word文档转换的方法及***
CN110532525A (zh) * 2019-07-18 2019-12-03 深圳点猫科技有限公司 一种基于web技术自动生成讲义的方法及装置
CN112651217A (zh) * 2019-10-09 2021-04-13 珠海金山办公软件有限公司 论文文档的处理方法、处理装置、电子设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101872340A (zh) * 2009-04-23 2010-10-27 北京大学 一种基于版面格式模板的排版方法及装置
CN109815450A (zh) * 2017-11-20 2019-05-28 北大方正集团有限公司 XML文件转换Word文件的方法及装置
CN110147534A (zh) * 2019-02-27 2019-08-20 中国地质大学(武汉) 一种LaTeX文档向Word文档转换的方法及***
CN110532525A (zh) * 2019-07-18 2019-12-03 深圳点猫科技有限公司 一种基于web技术自动生成讲义的方法及装置
CN112651217A (zh) * 2019-10-09 2021-04-13 珠海金山办公软件有限公司 论文文档的处理方法、处理装置、电子设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李园园;黄松;惠战伟;张东;: "XML-TeX-PDF文档转换方法与实现", 指挥信息***与技术, vol. 6, no. 06, 31 December 2015 (2015-12-31), pages 39 - 43 *
潘若瑛: ""多模板多格式论文综合校排***的研究和实现"", 《中国优秀硕士学位论文全文数据库(信息科技辑)》, 15 June 2015 (2015-06-15), pages 1 - 81 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113569532A (zh) * 2021-09-22 2021-10-29 北京仁和汇智信息技术有限公司 一种html编辑方法、装置、电子设备及计算机可读存储介质
CN117236282A (zh) * 2023-10-24 2023-12-15 雅昌文化(集团)有限公司 基于xml数据的智能排版方法、装置、终端及介质

Similar Documents

Publication Publication Date Title
Marin et al. Bayesian essentials with R
CN108595389B (zh) 一种将Word文档转换为txt纯文本文档的方法
Van Atteveldt et al. Computational analysis of communication
CN111512315A (zh) 文档元数据的按块提取
US9817887B2 (en) Universal text representation with import/export support for various document formats
CN113221506A (zh) 一种讲义排版的方法、装置、电子设备及存储介质
CN111309313A (zh) 一种快速生成html以及存储表单数据的方法
CN104008087A (zh) 一种针对具有标准格式的文案的自动排版方法和***
CN113283228A (zh) 文档生成方法、装置、电子设备及存储介质
CN106294480A (zh) 一种文件格式转换方法、装置及试题导入***
CN112860845A (zh) 一种试题检索方法、装置、电子设备及存储介质
CN116521621A (zh) 一种数据处理方法、装置、电子设备及存储介质
CN112733056B (zh) 一种文档处理方法、装置、设备及存储介质
CN110502735B (zh) 一种电子设备通用工艺文件快速制作方法及***
KR102126342B1 (ko) 접근성 태그를 이용하여 표와 서식이 포함된 전자문서를 점자로 변환하는 점자 변환방법
CN112487334A (zh) 用于前端页面语言翻译的方法、装置、计算机设备和介质
US11410575B2 (en) Interface and tools for accessible textbook generation
CN101464875B (zh) 使用xml表示电子字典数据的方法
CN116110065A (zh) 题卡数据生成方法、装置、计算机设备和存储介质
CN109284401A (zh) 课件标签添加、课件推荐方法、装置和存储介质
CN113792734A (zh) 神经网络训练及图像处理的方法、装置、设备及存储介质
Kruse et al. Word Processing Software: The Rise of MS Word
CN112613279A (zh) 一种文件的转换方法、装置、计算机装置及可读存储介质
CN101067785B (zh) 一种基于嵌入式平台的资源管理方法及***
KR20130083002A (ko) Xml 기반의 디지털 교육 콘텐츠 관리 장치 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination