CN113378525A - Pdf文档段落呈现方法、装置、存储介质及设备 - Google Patents

Pdf文档段落呈现方法、装置、存储介质及设备 Download PDF

Info

Publication number
CN113378525A
CN113378525A CN202110656519.5A CN202110656519A CN113378525A CN 113378525 A CN113378525 A CN 113378525A CN 202110656519 A CN202110656519 A CN 202110656519A CN 113378525 A CN113378525 A CN 113378525A
Authority
CN
China
Prior art keywords
paragraph
pdf document
information
pdf
paragraph information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110656519.5A
Other languages
English (en)
Inventor
邓斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Baoqu Technology Co Ltd
Original Assignee
Zhuhai Baoqu Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai Baoqu Technology Co Ltd filed Critical Zhuhai Baoqu Technology Co Ltd
Priority to CN202110656519.5A priority Critical patent/CN113378525A/zh
Publication of CN113378525A publication Critical patent/CN113378525A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明一个或多个实施例提供了一种PDF文档段落信息呈现方法、装置、存储介质及电子设备,其中,PDF文档段落信息呈现方法包括:响应于对PDF文档的保存操作,保存所述PDF文档的段落信息以及所述PDF文档;根据所述PDF文档的段落信息呈现所述PDF文档,本发明一个或多个实施例可保存PDF文档的段落信息,避免了在保存PDF文档后,PDF文档的段落信息丢失的问题。

Description

PDF文档段落呈现方法、装置、存储介质及设备
技术领域
本发明涉及计算机应用技术领域,尤其涉及一种PDF文档段落呈现方法、装置、存储介质及设备。
背景技术
PDF(Portable Document Format,便携式文档格式),是一种电子文件格式。这种文件格式与操作***平台无关,也就是说,PDF文件不管是在Windows,Unix还是在苹果公司的Mac OS操作***中都是通用的。这一性能使它成为在Internet上进行电子文档发行和数字化信息传播的理想文档格式。越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件开始使用PDF格式文件。随着技术的发展,不仅可以利用PDF阅读器对PDF文档进行阅读,还可对PDF文档进行编辑。
在用户通过PDF阅读器对PDF文档进行编辑操作时,用户可先通过PDF阅读器进入PDF编辑模式,在该编辑模式下对PDF文档进行编辑。但基于既有的PDF标准协议,PDF文档在编辑保存时,并不保存PDF文档的段落信息,这就使得,用户再次对该PDF文档进行编辑时,需要通过算法识别PDF文档中的段落信息,但通过这种方式识别PDF文档的段落信息通常会导致PDF文档的段落信息的丢失。
发明内容
有鉴于此,本发明一个或多个实施例提供了一种PDF文档段落呈现方法、装置、存储介质及电子设备,可保存PDF文档的段落信息,避免了在保存PDF文档后,PDF文档的段落信息丢失的问题。
本发明一个或多个实施例提供了一种PDF文档段落信息呈现方法,包括:响应于对PDF文档的保存操作,保存所述PDF文档的段落信息以及所述PDF文档;根据所述PDF文档的段落信息呈现所述PDF文档。
可选的,根据所述PDF文档的段落信息呈现所述PDF文档,包括:响应于对所述PDF文档的编辑操作或打开操作,根据所述PDF文档的段落信息呈现所述PDF文档。
可选的,所述PDF文档的段落信息,包括:段落标识符、段落开始标识符以及段落结束标识符,其中,所述段落标识符用于标识段落,所述段落开始标识符用于标识段落开始的位置,所述段落结束标识符用于标识段落结束的位置。
可选的,所述段落信息中还包括:以PDF标准协议中的绘制指令的形式表示的段落中的字符的格式信息,其中,所述字符的格式信息设置于所述段落开始标识符以及所述段落结束标识符之间。
可选的,所述PDF文档的段落信息还包括:字典数据,所述字典数据中包括一个段落的段落信息。
可选的,所述字典数据中包括的所述段落信息为段落的格式信息。
可选的,所述段落的格式信息至少包括以下一种:段落间距、段落的对齐方式以及段落的缩进。
本发明一个或多个实施例还提供了一种PDF文档段落信息呈现装置,包括:保存模块,被配置为响应于对PDF文档的保存操作,保存所述PDF文档的段落信息以及所述PDF文档;呈现模块,被配置为根据所述PDF文档的段落信息呈现所述PDF文档。
可选的,所述呈现模块具体被配置为:响应于对所述PDF文档的编辑操作或打开操作,根据所述PDF文档的段落信息呈现所述PDF文档。
可选的,所述PDF文档的段落信息,包括:段落标识符、段落开始标识符以及段落结束标识符;其中,所述段落标识符用于标识段落,所述段落开始标识符用于标识段落开始的位置,所述段落结束标识符用于标识段落结束的位置。
可选的,所述PDF文档的段落信息还包括:字典数据,所述字典数据中包括一个段落的段落信息。
可选的,所述段落信息中还包括:以PDF标准协议中的绘制指令的形式表示的段落中的字符的格式信息。
可选的,所述字典数据中包括的所述段落信息为段落的格式信息。
可选的,所述段落的格式信息至少包括以下一种:段落间距、段落的对齐方式以及段落的缩进。
本发明一个或多个实施例还提供了一种电子设备,所述电子设备包括:壳体、处理器、存储器、电路板和电源电路,其中,电路板安置在壳体围成的空间内部,处理器和存储器设置在电路板上;电源电路,用于为所述电子设备的各个电路或器件供电;存储器用于存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行上述任意一种PDF文档段落信息呈现方法。
本发明一个或多个实施例还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行上述任意一种的PDF文档段落信息呈现方法。
本发明一个或多个实施例提供的PDF文档段落信息呈现方法,可响应于PDF文档的保存操作,保存所述PDF文档以及所述PDF文档的段落信息,使得后续可根据保存的PDF文档的段落信息来呈现PDF文档,避免了在保存PDF文档时并不保存PDF文档的段落信息而导致再次编辑PDF文档时PDF文档段落信息丢失的问题,提高了PDF文档段落信息的准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是根据本发明一个或多个实施例示出的一种PDF文档段落信息呈现方法的流程图;
图2是根据本发明一个或多个实施例示出的一种PDF文档段落信息呈现装置的结构示意图;
图3是根据本发明一个或多个实施例示出的一种电子设备的结构示意图。
具体实施方式
下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
图1是根据本发明一个或多个实施例示出的一种PDF文档段落信息呈现方法的流程图,该方法例如可以由PDF阅读器来执行,如图1所示,该方法包括:
步骤101:响应于对PDF文档的保存操作,保存所述PDF文档以及所述PDF文档的段落信息;
在一个例子中,在获取PDF文档的保存操作之前,例如有用户通过PDF阅读器对原始PDF文档(指未进行编辑操作的PDF文档)进行了编辑操作,使得PDF文档的段落信息发生了改变。在获取到由用户执行的保存操作而触发的保存命令后,可生成编辑后的PDF文档的段落信息,该段落信息例如可以包括PDF文档中各个自然段的段落信息,将该段落信息保存在PDF文档中,例如可以以tag(标识)的形式将该段落信息保存在PDF文档中,其中,对PDF进行的编辑操作例如可包括对PDF文档中的内容(可包括文字及符号)进行的增加、删除以及修改等操作。
其中,PDF文档的保存操作例如用户点击PDF阅读器的用户界面上呈现的保存文件的控件所触发的保存操作。或用户在对PDF文档进行编辑后,直接关闭PDF文档而触发的保存操作。
步骤102:根据所述PDF文档的段落信息呈现所述PDF文档。
在本发明的一个或多个实施例中,呈现PDF文档可以指在PDF阅读器中显示PDF文档页面,根据PDF文档的段落信息呈现PDF文档可以是根据上述步骤101中保存的段落信息中记录的PDF文档各段落的信息,在PDF阅读器的显示页面中显示PDF文档的各个段落。
本发明一个或多个实施例提供的PDF文档段落信息呈现方法,可响应于PDF文档的保存操作,保存所述PDF文档以及所述PDF文档的段落信息,使得后续可根据保存的PDF文档的段落信息来呈现PDF文档,避免了在保存PDF文档时并不保存PDF文档的段落信息而导致再次编辑PDF文档时PDF文档段落信息丢失的问题,提高了PDF文档段落信息的准确度。
在本发明的一个或多个实施例中,根据所述PDF文档的段落信息呈现所述PDF文档,可包括:
响应于对所述PDF文档的编辑操作或打开操作,根据所述PDF文档的段落信息呈现所述PDF文档。
其中,对PDF文档的打开操作例如可以是通过PDF阅读器打开PDF文档,该打开操作例如可以是用户通过双击PDF文档图标实现,或者还可以是用户在PDF阅读器中选中并确定打开PDF文档实现。
沿用上述例子,在执行上述步骤101之后,可能会响应于关闭PDF文档的操作而触发关闭PDF文档的命令,根据该命令关闭PDF文档,或者,未获取关闭PDF文档的命令而保持PDF文档处于打开的状态。若关闭PDF文档,则可在下次根据PDF文档的打开命令再次打开该PDF文档时,获取上述步骤101中存储的PDF的段落信息,根据该段落信息呈现该PDF文档,由于在保存PDF文档之前已经对PDF文档进行了编辑操作,导致PDF文档相比于原始PDF文档(即未进行编辑操作之前的PDF文档)来说,其段落信息已经发生的改变,故,此时呈现的是编辑后的PDF文档的状态;若未关闭PDF文档,则可在进行下一次编辑操作之前,根据步骤101中保存的段落信息呈现PDF文档,同样的,此时呈现的PDF文档的段落信息也发生了改变。
在本发明的一个或多个实施例中,所述PDF文档的段落信息,可包括:
段落标识符、段落开始标识符以及段落结束标识符;其中,所述段落标识符用于标识段落,所述段落开始标识符用于标识段落开始的位置,所述段落结束标识符用于标识段落结束的位置。
例如,在保存上述PDF文档时,可以以tag来标识一个段落(例如一个自然段)中的内容(该段落中的内容可以包括文字以及标点符号)。基于此,后续PDF阅读器在对该tag进行识别时,可以将tag标识的内容作为一个段落。在保存PDF文档时,可以用开始标识符标识一个段落开始的位置,用段落结束标识符标识一个段落结束的位置,基于此,后续PDF阅读器在对段落开始标识符进行识别时,可将该段落开始标识符所标识的位置作为当前段落的开始位置,对段落结束标识符进行识别时,可将该段落结束标识符所标识的位置作为当前段落的结束位置。可见基于段落标识符、段落开始标识符以及段落结束标识符,即可以确定出一个段落对应的内容,段落开始的位置以及段落结束的位置。在保存PDF文档时,保存了这些段落信息后,再次打开或编辑PDF文档时,PDF阅读器即可根据保存的这些段落信息在PDF文档中呈现出各段落,避免了段落识别错误的问题发生。
在本发明的一个或多个实施例中,所述PDF文档的段落信息还可包括:
字典数据,所述字典数据中可包括一个段落的段落信息。即,可将PDF文档中各段落对应的段落信息以字典数据的形式表示,一个段落对应的字典数据对应于该段落的段落标识符、段落开始标识符以及段落结束标识符。可以以一个段落的段落标识符、段落开始标识符、段落结束标识符以及一个段落对应的字典数据来唯一标识一个段落。例如,在一个段落的段落信息中,字典数据例如可以位于段落标识之后,字典数据之后可以是段落开始标识符以及段落结束标识符。
在本发明的一个或多个实施例中,所述段落信息中还可包括:以PDF标准协议中的绘制指令的形式表示的段落中的字符的格式信息。所述段落信息中还可包括以PDF标准协议中的绘制指令的形式表示的段落中的字符(其中,字符可包括段落中的文字及符号)的格式信息,利用PDF标准协议中的绘制指令来标识段落中字符的格式信息,可无需再对段落中字符的格式信息进行重新定义,可借助既有的PDF标准协议中对绘制指令的解析方式来解析段落中的字符的格式信息,在遵循PDF标准协议的基础上,可提高对PDF段落信息的解析效率。其中,上述PDF标准协议中的绘制指令中包括但不限于:设置文字的字体、字号以及位置,还可包括其他PDF标准协议中关于PDF段落信息中的其他绘制指令。例如,以PDF标准协议中的绘制指令的形式表示的段落中的字符的格式信息可处于所述段落开始标识以及所述段落结束标识之间。
在本发明的一个或多个实施例中,所述字典数据中包括的所述段落信息为
段落的格式信息。结合上文所述,在对上述保存的PDF文档的段落信息进行解析时,在获知了一个段落的段落标识符、段落开始标识符、段落结束标识符、以及包含有段落中的字符的格式信息以及段落的格式信息之后,即可根据这些段落信息还原在PDF文档保存之前,一个段落在PDF文档中所呈现的状态,从而可在下一次编辑或打开PDF文档之前,可使PDF文档还原至该PDF文档保存之前的编辑状态,方便了使用者对PDF文档的编辑。
在本发明的一个或多个实施例中,所述段落的格式信息至少可包括以下一种:
段落间距、段落的对齐方式以及段落的缩进。其中,段落间距信息可包括段落间距对应的数值以及单位,段落的对齐方式例如可包括两端对齐、左对齐、居中、右对齐以及分散对齐,段落的缩进可以包括段落的缩进方式以及缩进量。
以下以一个例子对本发明一个或多个实施例的PDF文档段落呈现方法进行示例性说明。
当用户编辑完PDF文档的内容后,点击保存时,程序(例如上文中所述的PDF阅读器)将同一段落中的内容(包括同一段落中的文字及符号)放到一起,并以tag进行标识,生成该段落的段落信息,如下:
/Paragraph<</Section 0>>BDC
18.84 0 0 24 142.57 659.77Tm
<300876EE>Tj
EMC
在上述段落信息中,/Paragraph表示段落标识,用来标识一个段落,<</Section0>>即为上述字典数据的一个示例,字典数据中以key(键)和value(值)的方式配对出现,在上述示例的段落信息中,/Section为key,0为value,在<</Section0>>中存放段落信息,例如可存放上文中所述的段落的格式信息。其中,BDC表示tag开始,即为上述段落开始标识符,EMC表示tag结束,即为上述段落结束标识符。
其中,BDC以及EMC中间的数据即为PDF标准协议中的绘制指令,例如设置文字的字体、字号以及位置等。除上述示例的情况之外,上述字典数据中还可以存放其它段落信息,例如段落的对齐方式,如/Alignment/Left,表示段落的对齐方式为左对齐,例如缩进,/FrontIndentationValue 5/FrontIndentationUnit/Pound,表示段落前缩进为5,单位为磅。段间距等其他段落格式信息的表示形式与此类似,此处不再赘述。
当程序再次打开PDF文档进行编辑时,就可以通过解析上一次编辑后保存的段落信息得到PDF各段落对应的段落信息,根据解析得到的各段落信息呈现PDF文档。
基于上述示例,以下再通过两个例子对本发明一个或多个实施例的段落信息进行示例性说明。
在另一个例子中,响应于PDF保存操作,保存的PDF文档的某一个段落的段落信息如下所示:
/Paragraph<</Section 0/Alignment/Right>>BDC
18.84 0 0 24 142.57 659.77Tm
<300876EE>Tj
EMC
该段落信息表示段落为右对齐。
在又一个例子中,响应于PDF保存操作,保存的PDF文档的某一个段落的段落信息如下所示:
/Paragraph<</Section 0/BehindIndentationValue 10/BehindIndentationUnit/Inch>>BDC
18.84 0 0 24 142.57 659.77Tm
<300876EE>Tj
EMC
该段落信息表示段落后缩进为10,缩进单位为英寸。
需要说明的是,由于一个PDF文档通常包括多个段落,故,本发明一个或多个实施例中响应于保存操作所保存的PDF文档的段落信息例如可以包括多个上述示例所示出的段落信息。
图2是根据本发明一个或多个实施例示出的一种PDF文档段落信息呈现装置的结构示意图,如图2所示,该装置20包括:
保存模块21,被配置为响应于对PDF文档的保存操作,保存所述PDF文档的段落信息以及所述PDF文档;
呈现模块22,被配置为根据所述PDF文档的段落信息呈现所述PDF文档。
在本发明的一个或多个实施例中,上述呈现模块具体可被配置为:响应于对所述PDF文档的编辑操作或打开操作,根据所述PDF文档的段落信息呈现所述PDF文档。
在本发明的一个或多个实施例中,所述PDF文档的段落信息,可包括:段落标识符、段落开始标识符以及段落结束标识符;其中,所述段落标识符用于标识段落,所述段落开始标识符用于标识段落开始的位置,所述段落结束标识符用于标识段落结束的位置。
在本发明的一个或多个实施例中,所述PDF文档的段落信息还可包括:字典数据,所述字典数据中包括一个段落的段落信息。
在本发明的一个或多个实施例中,所述段落信息中还可包括:以PDF标准协议中的绘制指令的形式表示的段落中的字符的格式信息。
在本发明的一个或多个实施例中,所述字典数据中包括的段落信息为段落的格式信息。
在本发明的一个或多个实施例中,所述段落的格式信息至少可包括以下一种:段落间距、段落的对齐方式以及段落的缩进。
本发明一个或多个实施例还提供了一种电子设备,所述电子设备包括:壳体、处理器、存储器、电路板和电源电路,其中,电路板安置在壳体围成的空间内部,处理器和存储器设置在电路板上;电源电路,用于为所述电子设备的各个电路或器件供电;存储器用于存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行上述任意一种PDF文档段落信息呈现方法。
本发明一个或多个实施例还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行上述任意一种PDF文档段落信息呈现方法。
相应的,如图3所示,本发明的实施例提供的电子设备,可以包括:壳体31、处理器32、存储器33、电路板34和电源电路35,其中,电路板34安置在壳体31围成的空间内部,处理器32和存储器33设置在电路板34上;电源电路35,用于为所述服务器的各个电路或器件供电;存储器33用于存储可执行程序代码;处理器32通过读取存储器33中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行前述实施例提供的任意一种PDF文档段落信息呈现方法。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
为了描述的方便,描述以上装置是以功能分为各种单元/模块分别描述。当然,在实施本发明时可以把各单元/模块的功能在同一个或多个软件和/或硬件中实现。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种PDF文档段落信息呈现方法,其特征在于,包括:
响应于对PDF文档的保存操作,保存所述PDF文档的段落信息以及所述PDF文档;
根据所述PDF文档的段落信息呈现所述PDF文档。
2.根据权利要求1所述的方法,其特征在于,根据所述PDF文档的段落信息呈现所述PDF文档,包括:
响应于对所述PDF文档的编辑操作或打开操作,根据所述PDF文档的段落信息呈现所述PDF文档。
3.根据权利要求1所述的方法,其特征在于,所述PDF文档的段落信息,包括:
段落标识符、段落开始标识符以及段落结束标识符,其中,所述段落标识符用于标识段落,所述段落开始标识符用于标识段落开始的位置,所述段落结束标识符用于标识段落结束的位置。
4.根据权利要求3所述的方法,其特征在于,所述段落信息中还包括:
以PDF标准协议中的绘制指令的形式表示的段落中的字符的格式信息,其中,所述字符的格式信息设置于所述段落开始标识符以及所述段落结束标识符之间。
5.根据权利要求3所述的方法,其特征在于,所述PDF文档的段落信息还包括:
字典数据,所述字典数据中包括一个段落的段落信息。
6.根据权利要求5所述的方法,其特征在于,所述字典数据中包括的所述段落信息为段落的格式信息。
7.根据权利要求6所述的方法,其特征在于,所述段落的格式信息至少包括以下一种:
段落间距、段落的对齐方式以及段落的缩进。
8.一种PDF文档段落信息呈现装置,其特征在于,包括:
保存模块,被配置为响应于对PDF文档的保存操作,保存所述PDF文档的段落信息以及所述PDF文档;
呈现模块,被配置为根据所述PDF文档的段落信息呈现所述PDF文档。
9.一种电子设备,其特征在于,所述电子设备包括:壳体、处理器、存储器、电路板和电源电路,其中,电路板安置在壳体围成的空间内部,处理器和存储器设置在电路板上;电源电路,用于为所述电子设备的各个电路或器件供电;存储器用于存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行上述权利要求1至7中任一项所述的PDF文档段落信息呈现方法。
10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行权利要求1至7中任一项所述的PDF文档段落信息呈现方法。
CN202110656519.5A 2021-06-11 2021-06-11 Pdf文档段落呈现方法、装置、存储介质及设备 Withdrawn CN113378525A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110656519.5A CN113378525A (zh) 2021-06-11 2021-06-11 Pdf文档段落呈现方法、装置、存储介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110656519.5A CN113378525A (zh) 2021-06-11 2021-06-11 Pdf文档段落呈现方法、装置、存储介质及设备

Publications (1)

Publication Number Publication Date
CN113378525A true CN113378525A (zh) 2021-09-10

Family

ID=77574234

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110656519.5A Withdrawn CN113378525A (zh) 2021-06-11 2021-06-11 Pdf文档段落呈现方法、装置、存储介质及设备

Country Status (1)

Country Link
CN (1) CN113378525A (zh)

Similar Documents

Publication Publication Date Title
US10929449B2 (en) Generating a structured document guiding view
CN109902073B (zh) 日志处理方法、装置、计算机设备和计算机可读存储介质
JP2005536783A (ja) pdfドキュメントのセクション抽出ツール
CN110532056B (zh) 一种应用于用户界面中的控件识别方法及装置
WO2019075968A1 (zh) 表格信息跨页识别方法、电子设备及计算机可读存储介质
CN113158101A (zh) 一种可视化页面渲染方法、装置、设备及存储介质
CN109815243B (zh) 一种文档界面化修改时的结构化存储方法和装置
CN109558548B (zh) 一种消除css样式冗余的方法及相关产品
CN111026604B (zh) 一种日志文件解析方法及装置
AU2023258402A1 (en) Techniques for dynamically defining a data record format
CN112363814A (zh) 任务调度方法、装置、计算机设备及存储介质
CN112632425A (zh) 一种离线资源文件的生成方法、装置、设备及存储介质
CN111679825A (zh) 一种层叠样式表生成方法、装置、计算机设备及存储介质
CN111241096A (zh) 一种excel文档的文本提取方法、***、终端及存储介质
CN113378525A (zh) Pdf文档段落呈现方法、装置、存储介质及设备
US11630805B2 (en) Method and device to automatically identify themes and based thereon derive path designator proxy indicia
CN113378526A (zh) Pdf段落处理方法、装置、存储介质及设备
CN114743012A (zh) 一种文本识别方法及装置
CN110851346B (zh) 查询语句边界问题的检测方法、装置、设备及存储介质
CN108415814B (zh) 自动记录字段变化方法、应用服务器及计算机可读存储介质
CN113791860A (zh) 一种信息转换方法、装置和存储介质
CN111695327B (zh) 一种乱码修复方法、装置、电子设备及可读存储介质
CN107885839B (zh) 一种在Word文件中读取信息的方法和装置
CN115994521A (zh) 文档编辑方法、呈现方法、文档段落的识别方法及装置
CN116451710A (zh) 文案漏译检测方法、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 519031 Room 105-53811, No. 6 Baohua Road, Hengqin New District, Zhuhai City, Guangdong Province

Applicant after: Zhuhai Leopard Technology Co.,Ltd.

Address before: No. 006, floor 11, building 5, yard 33, Xierqi Middle Road, Haidian District, Beijing 100085

Applicant before: Zhuhai Leopard Technology Co.,Ltd.

CB02 Change of applicant information
WW01 Invention patent application withdrawn after publication

Application publication date: 20210910

WW01 Invention patent application withdrawn after publication