CN111832262B - 一种文档处理方法、装置、电子设备及存储介质 - Google Patents
一种文档处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN111832262B CN111832262B CN201910248173.8A CN201910248173A CN111832262B CN 111832262 B CN111832262 B CN 111832262B CN 201910248173 A CN201910248173 A CN 201910248173A CN 111832262 B CN111832262 B CN 111832262B
- Authority
- CN
- China
- Prior art keywords
- paragraph
- document
- current
- processed
- page
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明实施例提供了一种文档处理方法、装置、电子设备及存储介质,所述方法包括:获取待处理文档;按照从文档末尾至文档顶端的顺序,遍历待处理文档的每个段落,每遍历一个段落,判断当前段落是否存在字符;如果不存在字符,判断当前段落所在页数与当前段落在待处理文档中的后一段落所在页数是否相同;如果不相同,判断当前段落是否具有分页符;如果不具有分页符,在当前段落***分页符,并遍历当前段落的下一段落。电子设备在确定当前段落为空白段落,并且与待处理文档中的后一段落不在同一页面时,说明该待处理文档中存在不规范分页方式,此时电子设备可以在当前段落***分页符,使得待处理文档的排版规范,方便后续对该待处理文档的处理。
Description
技术领域
本发明涉及文档处理技术领域,特别是涉及一种文档处理方法、装置、电子设备及存储介质。
背景技术
目前各类办公软件在人们的工作和生活中几乎已经成为不可缺少的部分,办公软件包括办公文档、演示文稿等,人们可以利用办公软件撰写电子文档、演示文稿等。
常用的办公文档一般为office word、wps,在用户撰写文档时,根据文档的布局,需要使段落分为多页显示。办公文档一般提供分页符按钮,用户可以通过点击分页符按钮在需要的位置***分页符,使分页符之后的内容显示于下一页面。由于一般通过点击键盘中的回车键便可以在文档中输入白段落,该操作比较方便,所以一些用户会通过在段落之间增加足够多的空白段落的方式,使段落分为多页显示。
这种操作方式并非规范的分页方式,会使得文档的排版不规范,还会影响后续对文档的处理,例如,当用户需要将文档内容复制到其他没有分页显示功能的应用程序中时,这些空白段落需要进行手动删除才能使文档内容连续,显然十分浪费时间。因此,需要一种能将上述非规范的分页方式转换为规范分页方式的方法,以使文档的排版规范,方便后续对文档的处理。
发明内容
本发明实施例的目的在于提供一种文档处理方法、装置、电子设备及存储介质,以使文档的排版规范,方便后续对文档的处理。具体技术方案如下:
第一方面,本发明实施例提供了一种文档处理方法,所述方法包括:
获取待处理文档;
按照从文档末尾至文档顶端的顺序,遍历所述待处理文档的段落,每遍历一个段落,判断当前段落是否存在字符;
如果不存在字符,判断所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数是否相同;
如果不相同,判断所述当前段落是否具有分页符;
如果不具有分页符,在所述当前段落***分页符,并遍历所述当前段落的下一段落。
可选的,所述方法还包括:
如果所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数相同,判断所述当前段落在所述待处理文档中的后一段落是否具有分页符;
如果所述后一段落具有分页符,删除所述当前段落,并遍历所述当前段落的下一段落;
如果所述后一段落不具有分页符,遍历所述当前段落的下一段落。
可选的,在所述判断所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数是否相同的步骤之前,所述方法还包括:
判断所述当前段落在所述待处理文档中的后一段落是否具有分页符;
如果所述后一段落不具有分页符,执行所述判断所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数是否相同的步骤;
如果所述后一段落具有分页符,删除所述当前段落,并遍历所述当前段落的下一段落。
可选的,如果所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数相同,所述方法还包括:
遍历所述当前段落的下一段落。
可选的,在所述判断所述当前段落在所述待处理文档中的后一段落是否具有分页符的步骤之前,所述方法还包括:
判断所述后一段落是否存在字符;
如果所述后一段落不存在字符,执行所述判断所述当前段落在所述待处理文档中的后一段落是否具有分页符的步骤;
如果所述后一段落存在字符,遍历所述当前段落的下一段落。
可选的,如果所述当前段落具有分页符,所述方法还包括:
遍历所述当前段落的下一段落。
可选的,所述获取待处理文档的步骤,包括:
接收用户发出的文档处理请求,其中,所述文档处理请求携带待处理文档标识;
获取所述待处理文档标识对应的待处理文档。
第二方面,本发明实施例提供了一种文档处理装置,所述装置包括:
待处理文档获取模块,用于获取待处理文档;
第一字数确定模块,用于按照从文档末尾至文档顶端的顺序,遍历所述待处理文档的段落,每遍历一个段落,判断当前段落是否存在字符;
段落页数确定模块,用于如果当前段落不存在字符,判断所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数是否相同;
第一分页符确定模块,用于如果所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数不相同,判断所述当前段落是否具有分页符;
分页符***模块,用于如果不具有分页符,在所述当前段落***分页符,并遍历所述当前段落的下一段落。
可选的,所述装置还包括:
第二分页符确定模块,用于如果所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数相同,判断所述当前段落在所述待处理文档中的后一段落是否具有分页符;
第一段落删除模块,用于如果所述后一段落具有分页符,删除所述当前段落,并按照遍历所述当前段落的下一段落;
第一遍历触发模块,用于如果所述后一段落不具有分页符,遍历所述当前段落的下一段落。
可选的,所述装置还包括:
第三分页符确定模块,用于在所述判断所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数是否相同之前,判断所述当前段落在所述待处理文档中的后一段落是否具有分页符;
页数确定触发模块,用于如果所述后一段落不具有分页符,触发所述段落页数确定模块;
第二段落删除模块,用于如果所述后一段落具有分页符,删除所述当前段落,并遍历所述当前段落的下一段落。
可选的,所述装置还包括:
第二遍历触发模块,用于如果所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数相同,遍历所述当前段落的下一段落。
可选的,所述装置还包括:
第二字数确定模块,用于在所述判断所述当前段落在所述待处理文档中的后一段落是否具有分页符之前,判断所述后一段落是否存在字符;
分页符判断触发模块,用于如果所述后一段落不存在字符,触发执行所述判断所述当前段落在所述待处理文档中的后一段落是否具有分页符;
第三遍历触发模块,用于如果所述后一段落存在字符,遍历所述当前段落的下一段落。
可选的,所述装置还包括:
第四遍历触发模块,用于如果所述当前段落具有分页符,遍历所述当前段落的下一段落。
可选的,所述待处理文档获取模块包括:
处理请求接收单元,用于接收用户发出的文档处理请求,其中,所述文档处理请求携带待处理文档标识;
待处理文档获取单元,用于获取所述待处理文档标识对应的待处理文档。
第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一所述的文档处理方法步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的文档处理方法步骤。
本发明实施例所提供的方案中,电子设备可以获取待处理文档,按照从文档末尾至文档顶端的顺序,遍历待处理文档的段落,每遍历一个段落,判断当前段落是否存在字符,如果不存在字符,判断当前段落所在页数与当前段落在待处理文档中的后一段落所在页数是否相同,如果不相同,再判断当前段落是否具有分页符,如果不具有分页符,在当前段落***分页符,并遍历当前段落的下一段落。电子设备在确定当前段落为空白段落,并且与待处理文档中的后一段落不在同一页面时,可以判断当前段落是否具有分页符,如果不具有分页符,说明该待处理文档中存在采用空白段落进行分页的不规范分页方式,此时电子设备可以在当前段落***分页符,并开始对当前段落的下一段落进行处理,使得待处理文档的排版规范,方便后续对该待处理文档的处理。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所提供的一种文档处理方法的流程图;
图2为本发明实施例所提供的文档处理方法的另一种流程图;
图3为本发明实施例所提供的文档处理方法的另一种流程图;
图4为本发明实施例所提供的确定当前段落的后一段落是否具有分页符的方式的一种流程图;
图5为本发明实施例所提供的一种文档处理装置的结构示意图;
图6为本发明实施例所提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了使文档的排版规范,方便后续对文档的处理,本发明实施例提供了一种文档处理方法、装置、电子设备及计算机可读存储介质。
下面首先对本发明实施例所提供的一种文档处理方法进行介绍。
本发明实施例所提供的一种文档处理方法可以应用于任意需要对文档进行处理的电子设备,例如,可以为电脑、手机、处理器等,在此不作具体限定。为了方便描述,以下简称电子设备。
如图1所示,一种文档处理方法,所述方法包括:
S101,获取待处理文档;
S102,按照从文档末尾至文档顶端的顺序,遍历所述待处理文档的段落,每遍历一个段落,判断当前段落是否存在字符;如果不存在字符,执行步骤S103;
S103,判断所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数是否相同,如果不相同,执行步骤S104;
S104,判断所述当前段落是否具有分页符,如果不具有分页符,执行步骤S105;
S105,在所述当前段落***分页符,并遍历所述当前段落的下一段落。
可见,本发明实施例所提供的方案中,电子设备可以获取待处理文档,按照从文档末尾至文档顶端的顺序,遍历待处理文档的段落,每遍历一个段落,判断当前段落是否存在字符,如果不存在字符,判断当前段落所在页数与当前段落在待处理文档中的后一段落所在页数是否相同,如果不相同,再判断当前段落是否具有分页符,如果不具有分页符,在当前段落***分页符,并遍历当前段落的下一段落。电子设备在确定当前段落为空白段落,并且与待处理文档中的后一段落不在同一页面时,可以判断当前段落是否具有分页符,如果不具有分页符,说明该待处理文档中存在采用空白段落进行分页的不规范分页方式,此时电子设备可以在当前段落***分页符,并开始对当前段落的下一段落进行处理,使得待处理文档的排版规范,方便后续对该待处理文档的处理。
在上述步骤S101中,电子设备可以获取待处理文档,其中,待处理文档即为需要进行处理的文档。电子设备可以获取本地保存的文档作为待处理文档,也可以从其他设备获取文档作为待处理文档,这都是合理的。在一种实施方式中,电子设备中可以安装办公软件,用户通过该办公软件撰写的文档既可以作为待处理文档。
获取待处理文档后,为了能将待处理文档中的不规范分页方式改为规范的分页方式,电子设备可以按照从文档末尾至文档顶端的顺序,遍历待处理文档的段落,也就是执行步骤S102。由于在对文档进行处理时,可能会进行删除空白段落等操作,因而会改变待处理文档中各段落的序号,因此,为了保证对文档的处理能够准确顺利地进行,电子设备可以按照从文档末尾至文档顶端的顺序,遍历待处理文档的每个段落,这样,按照待处理文档末尾至顶端的顺序来说,对于电子设备当前遍历的段落的序号是不会改变的。
由于在本发明实施例提供的文档处理方法中,电子设备要对采用空白段落来分页的不规范方式进行处理,所以电子设备每遍历一个段落,可以判断当前段落是否存在字符,以确定遍历的当前段落是否为空白段落。如果当前段落的字数不存在字符,说明当前段落的字数为0,也就是说当前段落为空白段落,那么电子设备可以继续执行步骤S103。
如果当前段落存在字符,说明当前段落不是空白段落,那么也就不需要进行处理,电子设备可以继续遍历当前段落的下一段落。其中,由于电子设备是按照从文档末尾至文档顶端的顺序,遍历待处理文档的段落,所以电子设备所遍历的当前段落的下一段落,在待处理文档中的位置是当前段落的上一个段落。
在确定当前段落为空白段落的情况下,为了确定该空白段落的作用是否为分页,电子设备可以执行步骤S103,即判断当前段落所在页数与当前段落在待处理文档中的后一段落所在页数是否相同。也就是判断当前段落与当前段落在待处理文档中的后一段落是否显示于同一页面,如果是,说明该空白段落的作用不是分页,那么电子设备可以不对其进行处理,或者进行一些其他处理,例如,删除等操作。
当前段落所在页数与当前段落在待处理文档中的后一段落所在页数不同,那么说明该空白段落与其在待处理文档中的后一段落不在同一页面,那么电子设备可以进一步确定当前段落是否具有分页符,也就是执行步骤S104。
如果当前段落具有分页符,那么说明当前段落与其在待处理文档中的下一段落之间的分页方式是规范的,电子设备可以不对当前段落进行处理,继续遍历下一段落。如果当前段落不具有分页符,那么说明当前段落与其在待处理文档中的下一段落之间的分页方式是不规范的,电子设备可以在当前段落***分页符,以使当前段落与其在待处理文档中的下一段落之间的分页方式规范。进而,电子设备可以继续遍历当前段落的下一段落,对下一段落进行处理。
为了对文档中的非分页作用的空白段落进行适当处理,作为本发明实施例的一种实施方式,如图2所示,本发明实施例所提供的文档处理方法可以包括:
S201,获取待处理文档;
S202,按照从文档末尾至文档顶端的顺序,遍历所述待处理文档的段落,每遍历一个段落,判断当前段落是否存在字符;如果不存在字符,执行步骤S203;如果存在字符,执行步骤S206;
S203,判断所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数是否相同,如果不相同,执行步骤S204;如果相同,执行步骤S207;
S204,判断所述当前段落是否具有分页符,如果不具有分页符,执行步骤S205;如果具有分页符,执行步骤S206;
S205,在所述当前段落***分页符,并执行步骤S206;
S206,遍历所述当前段落的下一段落。
由于上述步骤S201-步骤S206与上述步骤S101-步骤S105的实现方式相同,在此不做赘述。
S207,判断所述当前段落在所述待处理文档中的后一段落是否具有分页符,如果所述后一段落具有分页符,执行步骤S208;如果所述后一段落不具有分页符,执行步骤S206;
如果当前段落所在页数与当前段落在待处理文档中的后一段落所在页数相同,说明二者显示于待处理文档中的同一页面,那么说明当前段落的作用并不是用来分页,那么为了确定当前段落是否可以删除,电子设备可以判断当前段落在待处理文档中的后一段落是否具有分页符。
由于对于一段有文字内容的段落而言,用户***的分页符会默认显示于该段落的下一段落,而在空白段落***分页符,该分页符则会显示于该空白段落,所以如果上述后一段落具有分页符,由于上述后一段落是在当前段落之前电子设备设备处理的段落,其具有的分页符很可能是电子设备在处理该后一段落时***的,那么说明当前段落的作用也是用于分页,所以电子设备便可以执行步骤S208。
如果当前段落在待处理文档中的后一段落不具有分页符,那么说明该后一段落很可能是具有文字内容的段落,或者,该后一段落如果是空白段落,但是在电子设备对其进行遍历处理时,并没有***分页符,那么便说明空白段落很可能是用户根据需要添加的,并非用于分页,所以电子设备便可以执行步骤S206,也就是不对当前段落进行处理,而是继续遍历下一段落。
S208,删除所述当前段落,并执行步骤S206。
如果当前段落在待处理文档中的后一段落具有分页符,说明当前段落的作用也是用于分页,所以电子设备便可以删除当前段落,并执行步骤S206,继续遍历下一段落。
可见,在本实施例中,如果上述当前段落所在页数与当前段落在待处理文档中的后一段落所在页数相同,电子设备可以判断当前段落在待处理文档中的后一段落是否具有分页符,如果后一段落具有分页符,删除当前段落,并按照遍历当前段落的下一段落;如果后一段落不具有分页符,则继续遍历当前段落的下一段落。这样,电子设备不仅可以在用于分页的空白段落***分页符,使待处理文档的分页方式规范,还可以将用于分页的多余空白段落删除,进一步提升待处理文档的规范性。
为了对文档中的非分页作用的空白段落进行适当处理,作为本发明实施例的另一种实施方式,如图3所示,本发明实施例所提供的文档处理方法可以包括:
S301,获取待处理文档;
S302,按照从文档末尾至文档顶端的顺序,遍历所述待处理文档的段落,每遍历一个段落,判断当前段落是否存在字符;如果不存在字符,执行步骤S303;如果存在字符,执行步骤S308;
由于步骤S301-步骤S302的实现方式分别与上述步骤S101-步骤S102的实现方式相同,所以在此不再赘述。
S303,判断所述当前段落在所述待处理文档中的后一段落是否具有分页符,如果所述后一段落不具有分页符,执行步骤S304;如果所述后一段落具有分页符,执行步骤S305;
电子设备确定当前段落不存在字符,即当前段落为空白段落后,可以判断当前段落在待处理文档中的后一段落是否具有分页符,如果其后一段落不具有分页符,那么便需要继续执行步骤S304,以确定当前段落是否用于分页。如果其后一段落具有分页符,说明当前段落的作用为用于分页,那么电子设备便可以执行步骤S305,删除当前段落。
S304,判断所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数是否相同,如果不相同,执行步骤S306;如果相同,执行步骤S308;
如果电子设备确定当前段落所在页数与当前段落在待处理文档中的后一段落所在页数不相同,说明当前段落与当前段落在待处理文档中的后一段落显示于不同页面,当前段落的作用是用于分页,电子设备可以执行步骤S306。
如果电子设备确定当前段落所在页数与当前段落在待处理文档中的后一段落所在页数相同,说明当前段落与当前段落在待处理文档中的后一段落显示于同一页面,那么电子设备便可以执行步骤S308,继续遍历当前段落的下一段落。
S305,删除所述当前段落,并执行步骤S308;
S306,判断所述当前段落是否具有分页符,如果不具有分页符,执行步骤S307;如果具有分页符,执行步骤S308;
由于当前段落的作用为分页,电子设备可以判断当前段落是否具有分页符,以确定分页方式是否规范,如果当前段落不具有分页符,那么便可以执行步骤S307。如果当前段落具有分页符,说明分页方式是规范的,那么电子设备可以执行步骤S308,继续遍历当前段落的下一段落。
S307,在所述当前段落***分页符,并执行步骤S308;
由于当前段落不具有分页符,为了使待处理文档的分页方式规范,电子设备可以在当前段落***分页符。然后电子设备便可以执行步骤S309,继续遍历当前段落的下一段落,以对待处理文档的其他段落进行处理。
S308,遍历所述当前段落的下一段落。
可见,在本实施例中,在判断当前段落所在页数与当前段落在所述待处理文档中的后一段落所在页数是否相同之前,电子设备可以先判断当前段落在待处理文档中的后一段落是否具有分页符,如果后一段落不具有分页符,再判断当前段落所在页数与当前段落在待处理文档中的后一段落所在页数是否相同,如果后一段落具有分页符,则删除当前段落,并遍历当前段落的下一段落。这样,在当前段落在待处理文档中的后一段落不具有分页符时,再继续当前段落所在页数与当前段落在待处理文档中的后一段落所在页数是否相同,而在当前段落在待处理文档中的后一段落具有分页符时,说明当前段落的作用为用于分页,那么电子设备便可以删除当前段落,并继续遍历当前段落的下一段落,无需再进行进一步的判断,提高文档处理效率。
为了更准确地确定当前遍历的空白段落是否用于分页,作为本发明实施的一种实施方式,在上述判断所述当前段落在所述待处理文档中的后一段落是否具有分页符的步骤之前,如图4所示,上述方法还可以包括:
S401,判断所述后一段落是否存在字符,如果所述后一段落不存在字符,执行步骤S402;如果所述后一段落存在字符,执行步骤S403;
虽然对于一段有文字内容的段落而言,用户***的分页符会默认显示于该段落的下一段落,但是为了在用户手动将分页符从有文字内容的段落的下一段调整至该有文字内容的段落的情况下,电子设备也能准确地确定当前段落是否用于分页,电子设备在判断当前段落在待处理文档中的后一段落是否具有分页符之前,可以先判断其后一段落是否存在字符。
如果当前段落在待处理文档中的后一段落不存在字符,说明当前段落在待处理文档中的后一段落为空白段落,当前段落与其后一段落的作用很可能是用于分页,那么电子设备便可以继续判断当前段落在待处理文档中的后一段落是否具有分页符,即执行步骤S402,以确定当前段落是否用于分页。
S402,执行所述判断所述当前段落在所述待处理文档中的后一段落是否具有分页符的步骤;
S403,遍历所述当前段落的下一段落。
如果当前段落在待处理文档中的后一段落存在字符,说明当前段落在待处理文档中的后一段落不是空白段落,也就是具有文字内容,那么说明当前段落很可能是用户根据需要***的空白段落,而不是用于分页的空白段落,所以电子设备可以继续遍历当前段落的下一段落。
可见,在本实施例中,在判断当前段落在待处理文档中的后一段落是否具有分页符之前,电子设备可以判断后一段落是否存在字符,如果后一段落不存在字符,再判断当前段落在待处理文档中的后一段落是否具有分页符,如果后一段落存在字符,则继续遍历当前段落的下一段落。这样,电子设备可以在当前段落在待处理文档中的后一段落为空白段落的情况下再继续判断当前段落在待处理文档中的后一段落是否具有分页符,可以提高文档处理的效率,同时,在用户手动将分页符从有文字内容的段落的下一段调整至该有文字内容的段落的情况下,电子设备也能准确地确定当前段落是否用于分页。
作为本发明实施的一种实施方式,上述获取待处理文档的步骤,可以包括:
接收用户发出的文档处理请求;获取所述待处理文档标识对应的待处理文档。
为了方便用户操作,电子设备可以提供文档处理用户接口,例如,可以在显示屏幕中显示文档处理按钮,或者,在办公软件中显示文档处理菜单等。当用户通过该文档处理用户接口发出文档处理请求时,电子设备便可以接收到用户发出的文档处理请求。
其中,文档处理请求可以携带待处理文档标识,以方便获取待处理文档。待处理文档标识即为可以唯一标识待处理文档的标识,可以为数字、文字、符号等字符或字符的组合,例如,可以为S1、#a、797等,在此不作具体限定。
电子设备接收到文档处理请求时,说明用户需要对待处理文档进行处理,电子设备则可以获取文档处理请求所携带的待处理文档标识所对应的待处理文档,进而,采用上述任一实施例所述的文档处理方法进行处理。
可见,在本实施例中,电子设备可以接收用户发出的文档处理请求,进而获取文档处理请求所携带的待处理文档标识所对应的待处理文档。可以在用户需要进行文档处理时准确获取待处理文档,并对其进行处理,提高用户体验。
相应于上述文档处理方法,本发明实施例还提供了一种文档处理装置。下面对本发明实施例所提供的一种文档处理装置进行介绍。
如图5所示,一种文档处理装置,所述装置包括:
待处理文档获取模块510,用于获取待处理文档;
第一字数确定模块520,用于按照从文档末尾至文档顶端的顺序,遍历所述待处理文档的段落,每遍历一个段落,判断当前段落是否存在字符;
段落页数确定模块530,用于如果当前段落不存在字符,判断所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数是否相同;
第一分页符确定模块540,用于如果所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数不相同,判断所述当前段落是否具有分页符;
分页符***模块550,用于如果不具有分页符,在所述当前段落***分页符,并遍历所述当前段落的下一段落。
可见,本发明实施例所提供的方案中,电子设备可以获取待处理文档,按照从文档末尾至文档顶端的顺序,遍历待处理文档的段落,每遍历一个段落,判断当前段落是否存在字符,如果不存在字符,判断当前段落所在页数与当前段落在待处理文档中的后一段落所在页数是否相同,如果不相同,再判断当前段落是否具有分页符,如果不具有分页符,在当前段落***分页符,并遍历当前段落的下一段落。电子设备在确定当前段落为空白段落,并且与待处理文档中的后一段落不在同一页面时,可以判断当前段落是否具有分页符,如果不具有分页符,说明该待处理文档中存在采用空白段落进行分页的不规范分页方式,此时电子设备可以在当前段落***分页符,并开始对当前段落的下一段落进行处理,使得待处理文档的排版规范,方便后续对该待处理文档的处理。
作为本发明实施例的一种实施方式,上述装置还可以包括:
第二分页符确定模块(图5中未示出),用于如果所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数相同,判断所述当前段落在所述待处理文档中的后一段落是否具有分页符;
第一段落删除模块(图5中未示出),用于如果所述后一段落具有分页符,删除所述当前段落,并按照遍历所述当前段落的下一段落;
第一遍历触发模块(图5中未示出),用于如果所述后一段落不具有分页符,遍历所述当前段落的下一段落。
作为本发明实施例的一种实施方式,上述装置还可以包括:
第三分页符确定模块(图5中未示出),用于在所述判断所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数是否相同之前,判断所述当前段落在所述待处理文档中的后一段落是否具有分页符;
页数确定触发模块(图5中未示出),用于如果所述后一段落不具有分页符,触发所述段落页数确定模块530;
第二段落删除模块(图5中未示出),用于如果所述后一段落具有分页符,删除所述当前段落,并遍历所述当前段落的下一段落。
作为本发明实施例的一种实施方式,上述装置还可以包括:
第二遍历触发模块(图5中未示出),用于如果所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数相同,遍历所述当前段落的下一段落。
作为本发明实施例的一种实施方式,上述装置还可以包括:
第二字数确定模块(图5中未示出),用于在所述判断所述当前段落在所述待处理文档中的后一段落是否具有分页符之前,判断所述后一段落是否存在字符;
分页符判断触发模块(图5中未示出),用于如果所述后一段落不存在字符,触发执行所述判断所述当前段落在所述待处理文档中的后一段落是否具有分页符;
第三遍历触发模块(图5中未示出),用于如果所述后一段落存在字符,遍历所述当前段落的下一段落。
作为本发明实施例的一种实施方式,上述装置还可以包括:
第四遍历触发模块(图5中未示出),用于如果所述当前段落具有分页符,遍历所述当前段落的下一段落。
作为本发明实施例的一种实施方式,上述待处理文档获取模块510可以包括:
处理请求接收单元(图5中未示出),用于接收用户发出的文档处理请求,其中,所述文档处理请求携带待处理文档标识;
待处理文档获取单元(图5中未示出),用于获取所述待处理文档标识对应的待处理文档。
本发明实施例还提供了一种电子设备,如图6所示,电子设备可以包括处理器601、通信接口602、存储器603和通信总线604,其中,处理器601,通信接口602,存储器603通过通信总线604完成相互间的通信,
存储器603,用于存放计算机程序;
处理器601,用于执行存储器603上所存放的程序时,实现如下步骤:
获取待处理文档;
按照从文档末尾至文档顶端的顺序,遍历所述待处理文档的段落,每遍历一个段落,判断当前段落是否存在字符;
如果不存在字符,判断所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数是否相同;
如果不相同,判断所述当前段落是否具有分页符;
如果不具有分页符,在所述当前段落***分页符,并遍历所述当前段落的下一段落。
可见,本发明实施例所提供的方案中,电子设备可以获取待处理文档,按照从文档末尾至文档顶端的顺序,遍历待处理文档的段落,每遍历一个段落,判断当前段落是否存在字符,如果不存在字符,判断当前段落所在页数与当前段落在待处理文档中的后一段落所在页数是否相同,如果不相同,再判断当前段落是否具有分页符,如果不具有分页符,在当前段落***分页符,并遍历当前段落的下一段落。电子设备在确定当前段落为空白段落,并且与待处理文档中的后一段落不在同一页面时,可以判断当前段落是否具有分页符,如果不具有分页符,说明该待处理文档中存在采用空白段落进行分页的不规范分页方式,此时电子设备可以在当前段落***分页符,并开始对当前段落的下一段落进行处理,使得待处理文档的排版规范,方便后续对该待处理文档的处理。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
其中,如果上述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数相同,上述方法还可以包括:
判断所述当前段落在所述待处理文档中的后一段落是否具有分页符;
如果所述后一段落具有分页符,删除所述当前段落,并按照遍历所述当前段落的下一段落;
如果所述后一段落不具有分页符,遍历所述当前段落的下一段落。
其中,在上述判断所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数是否相同的步骤之前,上述方法还可以包括:
判断所述当前段落在所述待处理文档中的后一段落是否具有分页符;
如果所述后一段落不具有分页符,执行所述判断所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数是否相同的步骤;
如果所述后一段落具有分页符,删除所述当前段落,并遍历所述当前段落的下一段落。
其中,如果上述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数相同,上述方法还可以包括:
遍历所述当前段落的下一段落。
其中,在上述判断所述当前段落在所述待处理文档中的后一段落是否具有分页符的步骤之前,上述方法还可以包括:
判断所述后一段落是否存在字符;
如果所述后一段落不存在字符,执行所述判断所述当前段落在所述待处理文档中的后一段落是否具有分页符的步骤;
如果所述后一段落存在字符,遍历所述当前段落的下一段落。
其中,如果上述当前段落具有分页符,上述方法还可以包括:
遍历所述当前段落的下一段落。
其中,上述获取待处理文档的步骤,可以包括:
接收用户发出的文档处理请求,其中,所述文档处理请求携带待处理文档标识;
获取所述待处理文档标识对应的待处理文档。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取待处理文档;
按照从文档末尾至文档顶端的顺序,遍历所述待处理文档的段落,每遍历一个段落,判断当前段落是否存在字符;
如果不存在字符,判断所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数是否相同;
如果不相同,判断所述当前段落是否具有分页符;
如果不具有分页符,在所述当前段落***分页符,并遍历所述当前段落的下一段落。
可见,本发明实施例所提供的方案中,计算机程序被处理器执行时,可以获取待处理文档,按照从文档末尾至文档顶端的顺序,遍历待处理文档的段落,每遍历一个段落,判断当前段落是否存在字符,如果不存在字符,判断当前段落所在页数与当前段落在待处理文档中的后一段落所在页数是否相同,如果不相同,再判断当前段落是否具有分页符,如果不具有分页符,在当前段落***分页符,并遍历当前段落的下一段落。电子设备在确定当前段落为空白段落,并且与待处理文档中的后一段落不在同一页面时,可以判断当前段落是否具有分页符,如果不具有分页符,说明该待处理文档中存在采用空白段落进行分页的不规范分页方式,此时电子设备可以在当前段落***分页符,并开始对当前段落的下一段落进行处理,使得待处理文档的排版规范,方便后续对该待处理文档的处理。
其中,如果上述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数相同,上述方法还可以包括:
判断所述当前段落在所述待处理文档中的后一段落是否具有分页符;
如果所述后一段落具有分页符,删除所述当前段落,并按照遍历所述当前段落的下一段落;
如果所述后一段落不具有分页符,遍历所述当前段落的下一段落。
其中,在上述判断所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数是否相同的步骤之前,上述方法还可以包括:
判断所述当前段落在所述待处理文档中的后一段落是否具有分页符;
如果所述后一段落不具有分页符,执行所述判断所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数是否相同的步骤;
如果所述后一段落具有分页符,删除所述当前段落,并遍历所述当前段落的下一段落。
其中,如果上述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数相同,上述方法还可以包括:
遍历所述当前段落的下一段落。
其中,在上述判断所述当前段落在所述待处理文档中的后一段落是否具有分页符的步骤之前,上述方法还可以包括:
判断所述后一段落是否存在字符;
如果所述后一段落不存在字符,执行所述判断所述当前段落在所述待处理文档中的后一段落是否具有分页符的步骤;
如果所述后一段落存在字符,遍历所述当前段落的下一段落。
其中,如果上述当前段落具有分页符,上述方法还可以包括:
遍历所述当前段落的下一段落。
其中,上述获取待处理文档的步骤,可以包括:
接收用户发出的文档处理请求,其中,所述文档处理请求携带待处理文档标识;
获取所述待处理文档标识对应的待处理文档。
需要说明的是,对于上述装置、电子设备及计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
进一步需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (16)
1.一种文档处理方法,其特征在于,所述方法包括:
获取待处理文档;
按照从文档末尾至文档顶端的顺序,遍历所述待处理文档的段落,每遍历一个段落,判断当前段落是否存在字符;
如果不存在字符,判断所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数是否相同;
如果不相同,判断所述当前段落是否具有分页符;
如果不具有分页符,在所述当前段落***分页符,并遍历所述当前段落的下一段落。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
如果所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数相同,判断所述当前段落在所述待处理文档中的后一段落是否具有分页符;
如果所述后一段落具有分页符,删除所述当前段落,并遍历所述当前段落的下一段落;
如果所述后一段落不具有分页符,遍历所述当前段落的下一段落。
3.如权利要求1所述的方法,其特征在于,在所述判断所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数是否相同的步骤之前,所述方法还包括:
判断所述当前段落在所述待处理文档中的后一段落是否具有分页符;
如果所述后一段落不具有分页符,执行所述判断所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数是否相同的步骤;
如果所述后一段落具有分页符,删除所述当前段落,并遍历所述当前段落的下一段落。
4.如权利要求3所述的方法,其特征在于,如果所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数相同,所述方法还包括:
遍历所述当前段落的下一段落。
5.如权利要求2或3所述的方法,其特征在于,在所述判断所述当前段落在所述待处理文档中的后一段落是否具有分页符的步骤之前,所述方法还包括:
判断所述后一段落是否存在字符;
如果所述后一段落不存在字符,执行所述判断所述当前段落在所述待处理文档中的后一段落是否具有分页符的步骤;
如果所述后一段落存在字符,遍历所述当前段落的下一段落。
6.如权利要求1-4任一项所述的方法,其特征在于,如果所述当前段落具有分页符,所述方法还包括:
遍历所述当前段落的下一段落。
7.如权利要求1-4任一项所述的方法,其特征在于,所述获取待处理文档的步骤,包括:
接收用户发出的文档处理请求,其中,所述文档处理请求携带待处理文档标识;
获取所述待处理文档标识对应的待处理文档。
8.一种文档处理装置,其特征在于,所述装置包括:
待处理文档获取模块,用于获取待处理文档;
第一字数确定模块,用于按照从文档末尾至文档顶端的顺序,遍历所述待处理文档的段落,每遍历一个段落,判断当前段落是否存在字符;
段落页数确定模块,用于如果当前段落不存在字符,判断所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数是否相同;
第一分页符确定模块,用于如果所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数不相同,判断所述当前段落是否具有分页符;
分页符***模块,用于如果不具有分页符,在所述当前段落***分页符,并遍历所述当前段落的下一段落。
9.如权利要求8所述的装置,其特征在于,所述装置还包括:
第二分页符确定模块,用于如果所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数相同,判断所述当前段落在所述待处理文档中的后一段落是否具有分页符;
第一段落删除模块,用于如果所述后一段落具有分页符,删除所述当前段落,并按照遍历所述当前段落的下一段落;
第一遍历触发模块,用于如果所述后一段落不具有分页符,遍历所述当前段落的下一段落。
10.如权利要求8所述的装置,其特征在于,所述装置还包括:
第三分页符确定模块,用于在所述判断所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数是否相同之前,判断所述当前段落在所述待处理文档中的后一段落是否具有分页符;
页数确定触发模块,用于如果所述后一段落不具有分页符,触发所述段落页数确定模块;
第二段落删除模块,用于如果所述后一段落具有分页符,删除所述当前段落,并遍历所述当前段落的下一段落。
11.如权利要求10所述的装置,其特征在于,所述装置还包括:
第二遍历触发模块,用于如果所述当前段落所在页数与所述当前段落在所述待处理文档中的后一段落所在页数相同,遍历所述当前段落的下一段落。
12.如权利要求9或10所述的装置,其特征在于,所述装置还包括:
第二字数确定模块,用于在所述判断所述当前段落在所述待处理文档中的后一段落是否具有分页符之前,判断所述后一段落是否存在字符;
分页符判断触发模块,用于如果所述后一段落不存在字符,触发执行所述判断所述当前段落在所述待处理文档中的后一段落是否具有分页符;
第三遍历触发模块,用于如果所述后一段落存在字符,遍历所述当前段落的下一段落。
13.如权利要求8-11任一项所述的装置,其特征在于,所述装置还包括:
第四遍历触发模块,用于如果所述当前段落具有分页符,遍历所述当前段落的下一段落。
14.如权利要求8-11任一项所述的装置,其特征在于,所述待处理文档获取模块包括:
处理请求接收单元,用于接收用户发出的文档处理请求,其中,所述文档处理请求携带待处理文档标识;
待处理文档获取单元,用于获取所述待处理文档标识对应的待处理文档。
15.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-7任一所述的方法。
16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910248173.8A CN111832262B (zh) | 2019-03-29 | 2019-03-29 | 一种文档处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910248173.8A CN111832262B (zh) | 2019-03-29 | 2019-03-29 | 一种文档处理方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111832262A CN111832262A (zh) | 2020-10-27 |
CN111832262B true CN111832262B (zh) | 2023-06-20 |
Family
ID=72914259
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910248173.8A Active CN111832262B (zh) | 2019-03-29 | 2019-03-29 | 一种文档处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111832262B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3618032A (en) * | 1968-12-09 | 1971-11-02 | Ibm | Automatic data composing, editing and formatting system |
JP2007004583A (ja) * | 2005-06-24 | 2007-01-11 | Rococo:Kk | 自動組版システム |
CN102479215A (zh) * | 2010-11-30 | 2012-05-30 | 汉王科技股份有限公司 | 文件自动导出的方法及电子阅读装置 |
CN102681980A (zh) * | 2011-03-17 | 2012-09-19 | 珠海全志科技股份有限公司 | 基于原始文档的排版处理方法及装置 |
CN104424160A (zh) * | 2013-09-11 | 2015-03-18 | 北大方正集团有限公司 | 文档跳转的处理***和处理方法 |
CN108681531A (zh) * | 2018-05-09 | 2018-10-19 | 天津字节跳动科技有限公司 | 文档输入的控制方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102346782A (zh) * | 2011-10-25 | 2012-02-08 | 中兴通讯股份有限公司 | 在用户终端浏览器上按需显示图片的方法及装置 |
US10318614B2 (en) * | 2015-07-01 | 2019-06-11 | Tnq Books And Journals Private Limited | Transformation of marked-up content into a file format that enables automated browser based pagination |
-
2019
- 2019-03-29 CN CN201910248173.8A patent/CN111832262B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3618032A (en) * | 1968-12-09 | 1971-11-02 | Ibm | Automatic data composing, editing and formatting system |
JP2007004583A (ja) * | 2005-06-24 | 2007-01-11 | Rococo:Kk | 自動組版システム |
CN102479215A (zh) * | 2010-11-30 | 2012-05-30 | 汉王科技股份有限公司 | 文件自动导出的方法及电子阅读装置 |
CN102681980A (zh) * | 2011-03-17 | 2012-09-19 | 珠海全志科技股份有限公司 | 基于原始文档的排版处理方法及装置 |
CN104424160A (zh) * | 2013-09-11 | 2015-03-18 | 北大方正集团有限公司 | 文档跳转的处理***和处理方法 |
CN108681531A (zh) * | 2018-05-09 | 2018-10-19 | 天津字节跳动科技有限公司 | 文档输入的控制方法及装置 |
Non-Patent Citations (1)
Title |
---|
Word 2007让文档页面守点规矩;姚文连;;电脑爱好者(13);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111832262A (zh) | 2020-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111414727B (zh) | 一种pdf文档页眉页脚的编辑方法、装置及电子设备 | |
CN104182479B (zh) | 一种处理信息的方法及装置 | |
CN111832262B (zh) | 一种文档处理方法、装置、电子设备及存储介质 | |
CN111695414B (zh) | 文档处理方法及装置、电子设备、计算机可读存储介质 | |
EP3118731A1 (en) | Method and electronic device for inputting character | |
CN110659526B (zh) | 一种文档处理方法、装置及电子设备 | |
CN110852045B (zh) | 一种删除文档内容的方法、装置、电子设备及存储介质 | |
CN111553130A (zh) | 一种章节标题样式转换方法、装置、电子设备及存储介质 | |
CN109977423B (zh) | 一种生词处理方法、装置、电子设备和可读存储介质 | |
CN111507067A (zh) | 显示公式图片的获取方法、转存公式图片的方法及装置 | |
CN112416500B (zh) | 一种信息处理方法及电子设备 | |
CN110728113A (zh) | 一种电子表格的信息筛选方法、装置及终端设备 | |
CN111666020B (zh) | 一种文档页面切换的方法、装置、电子设备及存储介质 | |
CN108845845B (zh) | 一种快捷键创建方法、装置、电子设备及存储介质 | |
CN103927293B (zh) | 即时消息处理方法及电子设备 | |
CN112784526A (zh) | 一种文档页面调整方法及装置 | |
JP2009129231A (ja) | 電子データ自動印刷端末、電子データ自動印刷方法、及び電子データ自動印刷プログラム | |
CN111428210B (zh) | 一种编辑水印的方法、装置及电子设备 | |
CN112417822A (zh) | 一种更换电子表格单元格中图片的方法、装置及电子设备 | |
CN112052647B (zh) | 一种文档编辑方法、装置、电子设备和可读存储介质 | |
CN112783400B (zh) | 文档内容选中方法、装置、电子设备及存储介质 | |
CN110928470B (zh) | 一种签名框展示方法、装置、电子设备及存储介质 | |
CN111666733B (zh) | 一种文档中的单元格处理方法和装置 | |
CN112395829B (zh) | 一种为文档添加中文编号的方法、装置及电子设备 | |
CN110929048A (zh) | 一种书签生成方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |