CN102567300A - 图片文档的处理方法及装置 - Google Patents

图片文档的处理方法及装置 Download PDF

Info

Publication number
CN102567300A
CN102567300A CN2011104510813A CN201110451081A CN102567300A CN 102567300 A CN102567300 A CN 102567300A CN 2011104510813 A CN2011104510813 A CN 2011104510813A CN 201110451081 A CN201110451081 A CN 201110451081A CN 102567300 A CN102567300 A CN 102567300A
Authority
CN
China
Prior art keywords
block
viewing area
character
picture
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011104510813A
Other languages
English (en)
Other versions
CN102567300B (zh
Inventor
胡希驰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Founder International Co Ltd
Founder International Beijing Co Ltd
Original Assignee
Founder International Co Ltd
Founder International Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Founder International Co Ltd, Founder International Beijing Co Ltd filed Critical Founder International Co Ltd
Priority to CN2011104510813A priority Critical patent/CN102567300B/zh
Publication of CN102567300A publication Critical patent/CN102567300A/zh
Application granted granted Critical
Publication of CN102567300B publication Critical patent/CN102567300B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明公开了一种图片文档的处理方法及装置。其中,该方法包括:对图片文档进行预处理,以获取基于连通域的页面图像;将基于连通域的页面图像进行切分,得到一个或多个图片区块,根据图片区块的文档内容属性确定图片区块的类型;根据显示区域的大小对任意一种或多种类型的图片区块进行对应的重排处理,以获取每一种图片区块的显示数据;在显示区域中显示图片区块的显示数据。通过本发明,能够实现直接在图片文档的图像层面上将版面重排,无需使用阅读工具,提高了阅读效率,避免了阅读工具转换过程中存在的转换错误,同时也降低了开发成本。

Description

图片文档的处理方法及装置
技术领域
本发明涉及图片处理领域,具体而言,涉及一种图片文档的处理方法及装置。
背景技术
现有技术的用于支持版面重排的阅读工具主要针对版式文档,如PDF,CEBX,EPUB等。这类文件本身包含了基于内容的信息,如文字的编码、文字的位置、文字的字号字体、插图位置、图形的表达式等等。这些都为根据不同的分辨率重新排列显示形式提供了便利。但针对经过扫描后的图片格式文档,使用上述现有技术进行重排之前,需要先通过OCR识别等技术进行识别,而OCR识别技术本身还存在着错误率、兼容性等问题。而且对于漫画图像或者扫描版的PDF等,由于没有相关的页面与OCR信息,所以无法直接进行重排。为了解决该问题,可以采用借助版式文档的重排工具,但必须先将扫描图像后的图片格式文件转换成相应的版式文档,该方式需要大量的处理时间,而且转换后的内容在识别过程中会出现许多错误,影响重排结果,另外,由于阅读工具必须支持多种文件格式,增加了开发成本,不具有通用性。
针对扫描后的图片文件,如BMP,JPEG格式文件,或者无版式信息的扫描版PDF文件,目前可以采用如下处理方式为用户提供阅读:通过对图片文件做切白边的处理,得到只显示图片中间的有效内容,可有效利用显示面积;或者按照阅读顺序切换显示焦点,如从上到下,从左到右,这种方式仅进行了局部显示,即对图片格式文件的局部内容放大后显示。上述方式存在如下问题:使用切白边对于大文档,如A4,在显示屏幕小的设备(如手机)上,显示仍然很小,无法直接阅读。而使用焦点转移的方式阅读还是很不方便,不符合人的阅读习惯。
目前针对相关技术的在阅读图片文档的过程中,现有的阅读工具存在阅读效率低、易出错,且开发成本高的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术的在阅读图片文档的过程中,现有的阅读工具存在阅读效率低、易出错,且开发成本高的问题,目前尚未提出有效的问题而提出本发明,为此,本发明的主要目的在于提供一种图片文档的处理方法及装置,以解决上述问题。
为了实现上述目的,根据本发明的一个方面,提供了一种图片文档的处理方法,该方法包括:对图片文档进行预处理,以获取基于连通域的页面图像;将基于连通域的页面图像进行切分,得到一个或多个图片区块,根据图片区块的文档内容属性确定图片区块的类型;根据显示区域的大小对任意一种或多种类型的图片区块进行对应的重排处理,以获取每一种图片区块的显示数据;在显示区域中显示图片区块的显示数据。
进一步地,图片区块的类型包括以下一种或多种类型:文字区块、图像区块、表格区块,其中,根据图片区块的文档内容属性确定图片区块的类型包括:检测图片区块的文档内容属性,其中,当检测到图片区块中各个合并连通域的矩形大小之差在预定范围之内时,确定图片区块为文字区块;当检测到图片区块中各个合并连通域的矩形大小之差大在预定范围之外时,确定图片区块为图像区块;当检测到图片区块中包括一条或多条表格线时,确定图片区块为表格区块。
进一步地,在图片区块为文字区块的情况下,根据显示区域的大小对任意一种或多种类型的图片区块进行对应的重排处理,以获取每一种图片区块的显示数据的步骤包括:根据需求设置对应显示区域的字符显示特征,字符显示特征包括:字符大小、字符间距和字符行距;根据字符显示特征计算得到对应显示区域的字符行数和每行中的字符数目;依次读取文字区块中所有的字符,并按照显示区域的字符行数和每行中的字符数目将字符缩放后进行依次排序,得到文字区块对应显示区域的显示数据。
进一步地,在依次读取文字区块中所有的字符之前,方法还包括:读取文字区块中的所有字符连通域;计算得到字符连通域的高度参考值,根据高度参考值来遍历所有字符连通域以对文字区块中的字块分行;根据字符的结构特征,对每行中的字符块进行单字切分和处理,以得到文字区块中所有的字符,其中,当字符为汉字的情况下,对每行中的字符块进行单字切分包括:将纵向坐标中上下关联的连通域合并为一个字符块,并将横向坐标中左右相邻距离小于等于预定值的连通域合并为一个字符块。
进一步地,在图片区块为表格区块的情况下,根据显示区域的大小对任意一种或多种类型的图片区块进行对应的重排处理,以获取每一种图片区块的显示数据的步骤包括:提取表格区块中的表格线,并根据表格线对表格进行划分,得到一个或多个具有行列坐标的单元格;根据需求设置对应显示区域的单元格显示特征,单元格显示特征包括:单元格大小、单元格间距和单元格行距;根据单元格显示特征计算得到对应显示区域的单元格行数和每行中的单元格数目;依次读取表格区块中所有的单元格,并按照显示区域的单元格行数和每行中的单元格数目将单元格缩放后进行依次排序,得到表格区块对应显示区域的显示数据。
进一步地,依次读取表格区块中所有的单元格,并按照显示区域的单元格行数和每行中的单元格数目将单元格缩放后进行依次排序,得到表格区块对应显示区域的显示数据包括:提取表格区块中的所有表头单元格;按照显示区域的单元格行数和每行中的单元格数目,确定每一个表头单元格在显示区域中的表头坐标位置;将各个表头单元格缩放后复制到显示区域中已经确定的表头坐标位置;读取表格区块中的字符单元格;根据已经确定的表头坐标位置和显示区域的单元格行数和每行中的单元格数目,确定每一个字符单元格的字符坐标位置;将各个表头单元格缩放后复制到显示区域中已经确定的字符坐标位置;其中,在各个表头单元格的表头坐标位置确定之后,在每一个显示区域中的相同坐标位置复制相同的表头单元格。
进一步地,在图片区块为图像区块的情况下,根据显示区域的大小对任意一种或多种类型的图片区块进行对应的重排处理,以获取每一种图片区块的显示数据的步骤包括:根据需求设置对应显示区域的图像显示特征,图像显示特征包括:图像大小、图像间距和图像行距;根据图像显示特征计算得到对应显示区域的图像行数和每行中的图像数目;依次提取图像区块中的一个或多个子图像,并按照显示区域的图像行数和每行中的图像数目将子图像缩放后进行依次排序,得到图像区块对应显示区域的显示数据。
进一步地,在提取图像区块中的一个或多个子图像之后,方法还包括:通过直方图均衡算法对各个子图像进行处理,以获取对比度超过预定值的子图像。
为了实现上述目的,根据本发明的另一方面,提供了一种图片文档的处理装置,该装置包括:预处理模块,用于对图片文档进行预处理,以获取基于连通域的页面图像;切分模块,用于将基于连通域的页面图像进行切分,得到一个或多个图片区块,根据图片区块的文档内容属性确定图片区块的类型;重排模块,用于根据显示区域的大小对任意一种或多种类型的图片区块进行对应的重排处理,以获取每一种图片区块的显示数据;显示模块,用于在显示区域中显示图片区块的显示数据。
进一步地,图片区块的类型包括以下一种或多种类型:文字区块、图像区块、表格区块,其中,切分模块包括:检测模块,用于检测图片区块的文档内容属性;第一获取模块,用于当检测到图片区块中各个合并连通域的矩形大小之差在预定范围之内时,确定图片区块为文字区块;第二获取模块,用于当检测到图片区块中各个合并连通域的矩形大小之差大在预定范围之外时,确定图片区块为图像区块;第二获取模块,用于当检测到图片区块中包括一条或多条表格线时,确定图片区块为表格区块。
进一步地,在图片区块为文字区块的情况下,重排模块包括:设置模块,用于根据需求设置对应显示区域的字符显示特征,字符显示特征包括:字符大小、字符间距和字符行距;计算模块,用于根据字符显示特征计算得到对应显示区域的字符行数和每行中的字符数目;排序模块,用于依次读取文字区块中所有的字符,并按照显示区域的字符行数和每行中的字符数目将字符缩放后进行依次排序,得到文字区块对应显示区域的显示数据。
进一步地,在图片区块为表格区块的情况下,重排模块包括:处理模块,用于提取表格区块中的表格线,并根据表格线对表格进行划分,得到一个或多个具有行列坐标的单元格;设置模块,用于根据需求设置对应显示区域的单元格显示特征,单元格显示特征包括:单元格大小、单元格间距和单元格行距;计算模块,用于根据单元格显示特征计算得到对应显示区域的单元格行数和每行中的单元格数目;排序模块,用于依次读取表格区块中所有的单元格,并按照显示区域的单元格行数和每行中的单元格数目将单元格缩放后进行依次排序,得到表格区块对应显示区域的显示数据。
进一步地,在图片区块为图像区块的情况下,重排模块包括:设置模块,用于根据需求设置对应显示区域的图像显示特征,图像显示特征包括:图像大小、图像间距和图像行距;计算模块,用于根据图像显示特征计算得到对应显示区域的图像行数和每行中的图像数目;排序模块,用于依次提取图像区块中的一个或多个子图像,并按照显示区域的图像行数和每行中的图像数目将子图像缩放后进行依次排序,得到图像区块对应显示区域的显示数据。
通过本发明,采用对图片文档进行预处理,以获取基于连通域的页面图像;将基于连通域的页面图像进行切分,得到一个或多个图片区块,根据图片区块的文档内容属性确定图片区块的类型;根据显示区域的大小对任意一种或多种类型的图片区块进行对应的重排处理,以获取每一种图片区块的显示数据;在显示区域中显示图片区块的显示数据,解决了相关现有技术的在阅读图片文档的过程中,现有的阅读工具存在阅读效率低、易出错,且开发成本高的问题,进而实现直接在图片文档的图像层面上将版面重排,无需使用阅读工具,提高了阅读效率,避免了阅读工具转换过程中存在的转换错误,同时也降低了开发成本的效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的图片文档的处理装置的结构示意图;
图2a-2e是根据图1所示实施例的对图片文档进行预处理的结果示意图;
图3是根据图1所示实施例的对图片文档进行区块分割的结果示意图;
图4是根据图3所示实施例的对文字区块进行字块分行处理的结果示意图;
图5是根据图4所示实施例的对文字区块进行单字切分处理的结果示意图;
图6是根据图5所示实施例的对文字区块进行重排处理的结果示意图;
图7a-7c是根据图3所示实施例的对表格区块进行重排处理的结果示意图;
图8a-8b是根据图3所示实施例的对图像区块进行重排处理的结果示意图;
图9是根据本发明实施例的图片文档的处理方法的流程图;
图10是根据图9所示实施例的图片文档的处理方法的详细流程图;
图11a-11b是根据图9所示实施例的图块的切分方法流程图;
图12是根据图9所示实施例的文字区块的处理方法流程图;
图13是根据图9所示实施例的表格区块的处理方法流程图;
图14是根据图9所示实施例的阅读顺序的分析流程图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
图1是根据本发明实施例的图片文档的处理装置的结构示意图;图2a-2e是根据图1所示实施例的对图片文档进行预处理的结果示意图;图3是根据图1所示实施例的对图片文档进行区块分割的结果示意图;图4是根据图3所示实施例的对文字区块进行字块分行处理的结果示意图;图5是根据图4所示实施例的对文字区块进行单字切分处理的结果示意图;图6是根据图5所示实施例的对文字区块进行重排处理的结果示意图;图7a-7c是根据图3所示实施例的对表格区块进行重排处理的结果示意图;图8a-8b是根据图3所示实施例的对图像区块进行重排处理的结果示意图。
如图1所示,该图片文档的处理装置包括:预处理模块10,用于对图片文档进行预处理,以获取基于连通域的页面图像;切分模块30,用于将基于连通域的页面图像进行切分,得到一个或多个图片区块,根据图片区块的文档内容属性确定图片区块的类型;重排模块50,用于根据显示区域的大小对任意一种或多种类型的图片区块进行对应的重排处理,以获取每一种图片区块的显示数据;显示模块70,用于在显示区域中显示图片区块的显示数据。
本申请上述实施例通过对进行预处理后的图片文档进行切分,并将各种切分后图像字块缩放后按新的显示要求贴图到显示区域的指定位置上。由于该实施例中直接利用图像处理技术对图片文档进行了预处理和分析,因此无需采用OCR技术进行阅读,提高了阅读效率,避免了使用阅读工具转换图片文件过程中存在的转换错误,同时也降低了开发成本的效果。
该技术尤其适合目前的手持设备,如智能手机、电子书、平板电脑。当前的这些设备中,使得对于扫描版的图片文档(例如BMP图片、JPEG图片、扫描版PDF或漫画)的处理不仅仅是切除白边和按注意区域转移显示,可以进一步满足用户的阅读需求,提供更好的用户体验。
具体的,如图2a-2e所示,上述实施利中对如图2a所示的图片文档(原始灰度图)进行预处理,可以实现根据图像质量和类型进行包括以下的一种或几种处理:降噪,灰度校正,几何校正,倾斜矫正,去黑边,二值化,连通域生成与合并等。例如,首先对图2a进行二值化处理得到图2b,可以采用阈值分割算法OTSU将原始灰度图像转换成二值图像;然后,在如图2b所示的二值图像的基础上进行连通域分析得到图2c,例如采用查找代表文字的黑像素的方式得到初始连通域,可以通过以一个黑像素点为开始,搜寻其周围8邻域的像素点,如果邻域上的像素点也为黑像素点则认为它们是一个连通域内的像素点,接着依次再计算邻域上黑像素点的邻域,最终找出一片相连的黑像素点区域,这个就是一个连通域。查找图像中其他没有计算过的位置,重复上述步骤,即可找出所有的连通域。对于每个连通域,其中每个像素点的x,y坐标,在一个连通域中所有的像素点计算最小和最大的x,y,即可得到该连通域的上下左右的边界坐标,即计算出了最小的外接矩形四个顶点,坐标分别为(xmin,ymin)、(xmin,ymax)、(xmax,ymin)、(xmax,ymax);在得到图片文档的初始连通域图2c之后,对图2c进行连通域合并得到图2d和2e,例如,例如图2e中,由于汉字字符的笔画及偏旁,需要对初始连通域中的包含和相交的矩形进行合并,以提高后续的处理准确率。
本申请上述实施例中的图片区块的类型可以包括以下一种或多种类型:文字区块、图像区块、表格区块,其中,切分模块30包括:检测模块,用于检测图片区块的文档内容属性;第一获取模块,用于当检测到图片区块中各个合并连通域的矩形大小之差在预定范围之内时,确定图片区块为文字区块;第二获取模块,用于当检测到图片区块中各个合并连通域的矩形大小之差大在预定范围之外时,确定图片区块为图像区块;第二获取模块,用于当检测到图片区块中包括一条或多条表格线时,确定图片区块为表格区块。该实施例提供了将整个图片文档中不同属性的区块区分开,以便于使用不同的方式进行重排处理。
上述实施例中针对区块的切分模块30具体可以实现,将图片文档版面中的元素按内容的属性分成各类区块。具体的,可以利用空白间隙查找的方法将连通域分割成许多大块;或者直接计算图像中各个像素点的邻域特征,利用不同的特征数值将版面分割成一些区块。例如,如果确定在图片文档中分隔出多幅图像漫画,则可以利用子图间的间隙以及子图内的连通域,将整图切分成几个小图。
具体的如图3所示,在以连通域为基础的图2e中,可以利用自底向上的合并算法或自上向下的空白区域分隔算法将文档图像分成很多区块。在分割成很多区块后,可以按照区块中的属性特征判断区块的具体类型,以便后续进一步处理,例如,需要判断每个区块是文字还是插图。可以利用图像的属性,比如文字区块中连通域的矩形大小一般比较均匀;而插图中可能大小不一;表格中会有各种相交的表格线。在切分得到多个区块之后,区块类型包括:文字区块、插图图像区块、插图图形区块(线条图)、表格区块、公式区块等等。所能利用的文档内容属性的特征包括但不限于一下特征:连通域的尺寸、连通域的空间分布周期性、尺寸的不均衡性、黑像素密度、黑游程长度及其统计特征、灰度分布特征、游程统计特征、频域特征、直方图分布特征、梯度分布特征、分型特征、各种纹理特征等;而判断方法可以采用根据各种特征设定阈值,然后决策树判断,也可使用样本集训练的方式,如神经网络、支撑向量机等。具体的,可以对各种文档内容属性的特征设定阈值,由决策树进行判断,例如采用连通域的长宽的统计分布作为特征,则文字区域长宽较为均一,即方差较小;图像区域的连通域长宽的方差较小。根据阈值的大小即可区分;也可使用样本集训练的方式,如神经网络、支撑向量机等。
本申请上述实施例中,在图片区块为文字区块的情况下,重排模块50可以包括:设置模块501,用于根据需求设置对应显示区域的字符显示特征,字符显示特征包括:字符大小、字符间距和字符行距;计算模块502,用于根据字符显示特征计算得到对应显示区域的字符行数和每行中的字符数目;排序模块503,用于依次读取文字区块中所有的字符,并按照显示区域的字符行数和每行中的字符数目将字符缩放后进行依次排序,得到文字区块对应显示区域的显示数据。
上述实施利通过对文字区块的处理为文字区块的重排操作做预备,具体的,可以对对文字区块中的字符进行如下处理:成行(列),单字切分,字符分类(标点不能出现在行头,英文单词、拼音、数字不能在行尾出现断续),公式区域判断(当成图像直接抠图),文字属性分析(大小、粗细(参考dpi))。在得到所有字符进行处理之后,可以根据设定的字体大小、字间距(可计算并保留原始值)、行间距(可计算并保留原始值)、原始dpi和目标显示分辨率,计算单字块、大区块的映射位置,同时在对每个字符进行缩放之后,将各个字符块拷贝到目标显示区域。
具体的,首先,需要根据目标屏幕的大小,通过用户设定的在目标显示区域中的期望字符大小、字间距、行距,计算每个屏幕上显示区域的字行数和每行中的字数,并将字符的矩形区域图像贴到目标区域上的相应位置即可。
在对文字区块的处理过程中还需要考虑字符类型和排版习惯,如标点不能出现在行头,英文单词、拼音、数字不能在行尾出现断续。具体的,可以判断每个字符的属性是否是标点,在,版面重排的时候,由于阅读习惯中,标点是不能放在一行的最前的,正常对于一行的宽度和要放置的字符宽度、间隔,需要计算出这一行能放多少个字符。如果检测到下一行的开始是一个标点,那么在在上一行可以细微调整字间距,将标点放置在这一行末。
优选地,在依次读取文字区块中所有的字符之前,可以读取文字区块中的所有字符连通域;计算得到字符连通域的高度参考值,根据高度参考值来遍历所有字符连通域以对文字区块中的字块分行;根据字符的结构特征,对每行中的字符块进行单字切分和处理,以得到文字区块中所有的字符,其中,当字符为汉字的情况下,对每行中的字符块进行单字切分包括:将纵向坐标中上下关联的连通域合并为一个字符块,并将横向坐标中左右相邻距离小于等于预定值的连通域合并为一个字符块。同时,可以对合并后的字块进行判断,只有在合并后的字符宽高满足预定范围时,则对连通域进行合并。
具体的,如图4所示,上述实施利具体实现方式如下:
首先对文字区块中的字符进行字块分行处理,在字块的处理中,将字符连通域进行成行处理,有助于字块分析、单字切分。这也是版面分析中的一个常用步骤;另外,还可使用如下方式:首先统计字块中的所有连通域的高度,计算概率最大的高度值,以此作为行高的参考值。通过上述处理方式遍历所有的连通域,如果该连通域不属于任何行,则新建一个行,以当前连通域外接矩形的中心上下半个行高做两条水平线(横排版),凡是中心点位于这两条线中间的连通域均属于这个新行,直至处理所有的连通域。
然后,在字块分行处理完成后,如图5所示,对文字区块字块进行分行处理使得页面成行之后,由于汉字有上下结构,对字块进行单字切分处理,即合并行内上下关系的连通域为一个字符。同时汉字是方块字,挑选出不接近正方形的外接矩形,如果这些连通域有左右很近的,合并后的字符宽高是否符合大多数字符的宽高特征,如果符合则合并,如果不符合则保持分离。
最后,以图5中所示的文字区块为例,在目标显示区域为每个字长宽均为50个像素,屏幕宽500像素,高600像素,字间距10,行间距20,如图6所示,每页只能排布8行,每行8个字符。因为50*8+9*10=490<500,50*8+9*20=580<600。图6为第一页显示区域,图5中的文字以上述方式依次以图6所示的布局进行显示。
本申请上述实施例中,在图片区块为表格区块的情况下,重排模块50根据显示区域的大小对任意一种或多种类型的图片区块进行对应的重排处理,以获取每一种图片区块的显示数据的步骤包括:处理模块,用于提取表格区块中的表格线,并根据表格线对表格进行划分,得到一个或多个具有行列坐标的单元格;设置模块501,用于根据需求设置对应显示区域的单元格显示特征,单元格显示特征包括:单元格大小、单元格间距和单元格行距;计算模块502,用于根据单元格显示特征计算得到对应显示区域的单元格行数和每行中的单元格数目;排序模块503,用于依次读取表格区块中所有的单元格,并按照显示区域的单元格行数和每行中的单元格数目将单元格缩放后进行依次排序,得到表格区块对应显示区域的显示数据。表格区块处理模块
上述实施例通过可将整个表格区块当做图像显示,首先通过提取表格区块中的表格线来将表格区块切分成多个单元格,然后对单元格进行排列分析,同时提取字符块,通过计算行、列数确定每个单元格在显示页面中的具***置以及缩放的大小。在经过上述针对单元格的分析之后,可实现设置按多行显示或多列显示,或定位行列区域显示。
具体的,如图7a-7c所示,利用表格线,以及文字成行的方法,可以将图7a所示的表格分成具有行列坐标的单元格。同上文字区块中的文字排布方式,可以根据目标屏幕大小及单元格大小,将每个单元格缩放后贴到显示区域的相应位置。为了方便阅读,可以在每页均复制贴上表头(及第一行)信息。
优选地,上述实施利中,依次读取表格区块中所有的单元格,并按照显示区域的单元格行数和每行中的单元格数目将单元格缩放后进行依次排序,得到表格区块对应显示区域的显示数据的步骤可以包括:提取表格区块中的所有表头单元格;按照显示区域的单元格行数和每行中的单元格数目,确定每一个表头单元格在显示区域中的表头坐标位置;将各个表头单元格缩放后复制到显示区域中已经确定的表头坐标位置;读取表格区块中的字符单元格;根据已经确定的表头坐标位置和显示区域的单元格行数和每行中的单元格数目,确定每一个字符单元格的字符坐标位置;将各个表头单元格缩放后复制到显示区域中已经确定的字符坐标位置;其中,在各个表头单元格的表头坐标位置确定之后,在每一个显示区域中的相同坐标位置复制相同的表头单元格。
本申请上述实施例中,在图片区块为图像区块的情况下,重排模块50包括:设置模块501,用于根据需求设置对应显示区域的图像显示特征,图像显示特征包括:图像大小、图像间距和图像行距;计算模块502,用于根据图像显示特征计算得到对应显示区域的图像行数和每行中的图像数目;排序模块503,用于依次提取图像区块中的一个或多个子图像,并按照显示区域的图像行数和每行中的图像数目将子图像缩放后进行依次排序,得到图像区块对应显示区域的显示数据。本申请上述实施例通过对图像区块进行处理,例如进行灰度调整,从而增强对比度或亮度;以及对图像区块进行二值化处理,使得显示更清晰,并将处理后的图像按照目标显示区域的大小进行放缩显示。
具体的,如图8a-8b所示,将图8a所示的图像区块进行直方图均衡处理得到图8b。例如,对于对比度不高的图像可以进行对比度增强,这里使用图像处理算法中常用的直方图均衡。对于文字区块,可以使用灰度图,也可以使用二值图。如果是二值图,则不需调整。该处理改善了视觉效果,提高了用户体验。
由上对各个区块的版面重排操作,使得各类区块在目标显示区域得到预定的显示效果。在版面重排后,可实现如下的调整:设置按多行显示或多列显示,或定位行列区域显示;对于漫画文档可按照设定顺序显示,如从上到下从左到右;可通过缩放各个单字块或大的图像、表格区块,以及调整文字笔画粗细或浓淡程度重排效果进行调整;通过对字体的二值化分割和区域标定,利用填充算法,调整字符与背景的颜色。
本申请上述实施例实现了在不利用OCR技术的情况下,对图片文档的页面图像进行切分。判断页面中区块的属性。如果是图像,可直接将区域抠出,显示时使用缩放技术;如果是文字块,进行行切分和字切分,在重排时按字块图像,回帖到合适位置。且利用基本的排版特征,如缩进、分栏等,可以获得段落和阅读顺序;如果是表格,利用线段检测和单元格分析,可以按列或按行或按块重新组织显示,也可将整个表格块作为插图处理。对于多格漫画,可利用其边框和插图联通情况,将原本一页的分多页显示。该技术尤其适合目前的手持设备,如智能手机、电子书、平板电脑。。
图9是根据本发明实施例的图片文档的处理方法的流程图;图10是根据图9所示实施例的图片文档的处理方法的详细流程图;图11a-11b是根据图9所示实施例的图块的切分方法流程图;图12是根据图9所示实施例的文字区块的处理方法流程图;图13是根据图9所示实施例的表格区块的处理方法流程图;图14是根据图9所示实施例的阅读顺序的分析流程图。
如图9所示该方法包括如下步骤:
步骤S102,通过图1中的预处理模块10对图片文档进行预处理,以获取基于连通域的页面图像。
步骤S104,通过图1中的切分模块30执行将基于连通域的页面图像进行切分,得到一个或多个图片区块,根据图片区块的文档内容属性确定图片区块的类型。
步骤S106,通过图1中的重排模块50来实现根据显示区域的大小对任意一种或多种类型的图片区块进行对应的重排处理,以获取每一种图片区块的显示数据。
步骤S108,通过图1中的显示模块70在显示区域中显示图片区块的显示数据。
本申请上述实施例通过对进行预处理后的图片文档进行切分,并将各种切分后图像字块缩放后按新的显示要求贴图到显示区域的指定位置上。由于该实施例中直接利用图像处理技术对图片文档进行了预处理和分析,因此无需采用OCR技术进行阅读,提高了阅读效率,避免了使用阅读工具转换图片文件过程中存在的转换错误,同时也降低了开发成本的效果。
本申请上述实施例中,图片区块的类型包括以下一种或多种类型:文字区块、图像区块、表格区块,其中,根据图片区块的文档内容属性确定图片区块的类型可以包括:检测图片区块的文档内容属性,其中,当检测到图片区块中各个合并连通域的矩形大小之差在预定范围之内时,确定图片区块为文字区块;当检测到图片区块中各个合并连通域的矩形大小之差大在预定范围之外时,确定图片区块为图像区块;当检测到图片区块中包括一条或多条表格线时,确定图片区块为表格区块。该实施例提供了将整个图片文档中不同属性的区块区分开,以便于使用不同的方式进行重排处理。
上述实施例中针对区块的切分模块30具体可以实现,将图片文档版面中的元素按内容的属性分成各类区块。具体的,如图11a和11b所示,可以利用空白间隙查找的方法将连通域分割成许多大块;或者直接计算图像中各个像素点的邻域特征,利用不同的特征数值将版面分割成一些区块。如图例如,如果确定在图片文档中分隔出多幅图像漫画,则可以利用子图间的间隙以及子图内的连通域,将整图切分成几个小图。
而且,如图10所示,在切分得到多个区块之后,可以通过区块属性进行判断,可以按照区块中的特征判断区块的具体类型,以便后续进一步处理。区块类型包括:文字区块、插图图像区块、插图图形区块(线条图)、表格区块、公式区块等等。所能利用的文档内容属性的特征包括但不限于一下特征:连通域的尺寸、连通域的空间分布周期性、尺寸的不均衡性、黑像素密度、游程统计特征、频域特征、直方图分布特征、梯度分布特征、分型特征、各种纹理特征等;而判断方法可以采用根据各种特征设定阈值,然后决策树判断,也可使用样本集训练的方式,如神经网络、支撑向量机等。具体的,在对每种区块中的内容基于目标显示区域的标准进行处理后,可以进行阅读顺序的分析,并在显示区域进行对应的重排并根据用户体验进行效果调整。
本申请上述实施例中,在图片区块为文字区块的情况下,根据显示区域的大小对任意一种或多种类型的图片区块进行对应的重排处理,以获取每一种图片区块的显示数据的步骤包括:根据需求设置对应显示区域的字符显示特征,字符显示特征包括:字符大小、字符间距和字符行距;根据字符显示特征计算得到对应显示区域的字符行数和每行中的字符数目;依次读取文字区块中所有的字符,并按照显示区域的字符行数和每行中的字符数目将字符缩放后进行依次排序,得到文字区块对应显示区域的显示数据。该实施例中,在执行重排操作之前,需要根据目标屏幕的大小,通过用户设定的在目标显示区域中的期望字符大小、字间距、行距,计算每个屏幕上显示区域的字行数和每行中的字数,并将字符的矩形区域图像贴到目标区域上的相应位置即可。
具体的,上述实施利通过对文字区块的处理为文字区块的重排操作做预备,具体的,可以对对文字区块中的字符进行如下处理:成行(列),单字切分,字符分类(标点不能出现在行头,英文单词、拼音、数字不能在行尾出现断续),公式区域判断(当成图像直接抠图),文字属性分析(大小、粗细(参考dpi))。在得到所有字符进行处理之后,可以根据设定的字体大小、字间距(可计算并保留原始值)、行间距(可计算并保留原始值)、原始dpi和目标显示分辨率,计算单字块、大区块的映射位置,同时在对每个字符进行缩放之后,将各个字符块拷贝到目标显示区域。考虑字符类型和排版习惯,如标点不能出现在行头,英文单词、拼音、数字不能在行尾出现断续。
优选地,在依次读取文字区块中所有的字符之前,方法还可以包括:读取文字区块中的所有字符连通域;计算得到字符连通域的高度参考值,根据高度参考值来遍历所有字符连通域以对文字区块中的字块分行;根据字符的结构特征,对每行中的字符块进行单字切分和处理,以得到文字区块中所有的字符,其中,当字符为汉字的情况下,对每行中的字符块进行单字切分包括:将纵向坐标中上下关联的连通域合并为一个字符块,并将横向坐标中左右相邻距离小于等于预定值的连通域合并为一个字符块。上述实施例如图12所示,在对文字区块中的各个字符进行一系列处理之后得到字符块,便于后续字符重排的操作。
由上分析可知,本申请中对于文字区块的处理首先对文字区块中的字符进行字块分行处理,在遍历所有的连通域得到分行处理后的文字区块;然后,在字块分行处理完成后,对文字区块字块进行分行处理使得页面成行之后,由于汉字有上下结构,对字块进行单字切分处理;最后,以图5中所示的文字区块为例,在目标显示区域为每个字长宽均为50个像素,屏幕宽500像素,高600像素,字间距10,行间距20,如图6所示,每页只能排布8行,每行8个字符。因为50*8+9*10=490<500,50*8+9*20=580<600。图6为第一页显示区域,图5中的文字以上述方式依次以图6所示的布局进行显示。
本申请上述实施例中,在图片区块为表格区块的情况下,根据显示区域的大小对任意一种或多种类型的图片区块进行对应的重排处理,以获取每一种图片区块的显示数据的步骤可以包括:提取表格区块中的表格线,并根据表格线对表格进行划分,得到一个或多个具有行列坐标的单元格;根据需求设置对应显示区域的单元格显示特征,单元格显示特征包括:单元格大小、单元格间距和单元格行距;根据单元格显示特征计算得到对应显示区域的单元格行数和每行中的单元格数目;依次读取表格区块中所有的单元格,并按照显示区域的单元格行数和每行中的单元格数目将单元格缩放后进行依次排序,得到表格区块对应显示区域的显示数据。
上述实施例通过可将整个表格区块当做图像显示,具体的,如图13所示,首先通过提取表格区块中的表格线来将表格区块切分成多个单元格,然后对单元格进行排列分析,同时提取字符块,通过计算行、列数确定每个单元格在显示页面中的具***置以及缩放的大小。在经过上述针对单元格的分析之后,可实现设置按多行显示或多列显示,或定位行列区域显示。如果是漫画文档,按照设定顺序显示,如从上到下从左到右。
优选地,依次读取表格区块中所有的单元格,并按照显示区域的单元格行数和每行中的单元格数目将单元格缩放后进行依次排序,得到表格区块对应显示区域的显示数据的步骤可以包括:提取表格区块中的所有表头单元格;按照显示区域的单元格行数和每行中的单元格数目,确定每一个表头单元格在显示区域中的表头坐标位置;将各个表头单元格缩放后复制到显示区域中已经确定的表头坐标位置;读取表格区块中的字符单元格;根据已经确定的表头坐标位置和显示区域的单元格行数和每行中的单元格数目,确定每一个字符单元格的字符坐标位置;将各个表头单元格缩放后复制到显示区域中已经确定的字符坐标位置;其中,在各个表头单元格的表头坐标位置确定之后,在每一个显示区域中的相同坐标位置复制相同的表头单元格。
本申请上述实施例中,在图片区块为图像区块的情况下,根据显示区域的大小对任意一种或多种类型的图片区块进行对应的重排处理,以获取每一种图片区块的显示数据的步骤可以包括:根据需求设置对应显示区域的图像显示特征,图像显示特征包括:图像大小、图像间距和图像行距;根据图像显示特征计算得到对应显示区域的图像行数和每行中的图像数目;依次提取图像区块中的一个或多个子图像,并按照显示区域的图像行数和每行中的图像数目将子图像缩放后进行依次排序,得到图像区块对应显示区域的显示数据。优选地,在提取图像区块中的一个或多个子图像之后,方法还包括:通过直方图均衡算法对各个子图像进行处理,以获取对比度超过预定值的子图像。本申请上述实施例通过对图像区块进行处理,例如进行灰度调整,从而增强对比度或亮度;以及对图像区块进行二值化处理,使得显示更清晰。并将处理后的图像按照目标显示区域的大小进行防缩显示。
本申请上述实施例实现了在不利用OCR技术的情况下,对图片文档的页面图像进行切分。判断页面中区块的属性。如果是图像,可直接将区域抠出,显示时使用缩放技术;如果是文字块,进行行切分和字切分,在重排时按字块图像,回帖到合适位置。且利用基本的排版特征,如缩进、分栏等,可以获得段落和阅读顺序;如果是表格,利用线段检测和单元格分析,可以按列或按行或按块重新组织显示,也可将整个表格块作为插图处理。对于多格漫画,可利用其边框和插图联通情况,将原本一页的分多页显示。该技术尤其适合目前的手持设备,如智能手机、电子书、平板电脑。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请上述实施例为了优化用户的阅读习惯,如图14所示,在重排过程中还可以采用阅读顺序分析模块对排版类型自动分析(或手工输入),利用版面基础先验知识(段落缩进,段后空白,标题、章节位置,分栏情况,)判断阅读顺序为重排提供依据。同时,也可以采用显示效果调整模块缩放各个单字块或大的图像、表格区块。调整文字笔画粗细或浓淡程度以达到最佳阅读效果。另外,通过对字体的二值化分割和区域标定,利用填充算法,还可实现设置字符与背景颜色的功能。手工输入即指在操作界面上提供一个设置工具,比如采用鼠标点击单选框,选中要处理的页面是“横排版”还是“竖排版”。自动处理就是指算法自动根据文字行、列方向排布方式、间隔、周期等计算出是“横排版”还是“竖排版”。
从以上的描述中,可以看出,本发明实现了如下技术效果:直接利用图像处理技术进行分析,无需OCR技术进行预先识别,将各种切分后图像字块缩放后按新的显示要求贴图到指定位置。该技术尤其适合目前的手持设备,如智能手机、电子书、平板电脑。利用上述技术的各种设备,针对扫描版的PDF或漫画的处理不仅仅处理是切除白边和按注意区域转移显示,满足了用户更多的阅读需求。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (13)

1.一种图片文档的处理方法,其特征在于,包括:
对图片文档进行预处理,以获取基于连通域的页面图像;
将所述基于连通域的页面图像进行切分,得到一个或多个图片区块,根据所述图片区块的文档内容属性确定所述图片区块的类型;
根据显示区域的大小对任意一种或多种类型的图片区块进行对应的重排处理,以获取每一种图片区块的显示数据;
在所述显示区域中显示所述图片区块的显示数据。
2.根据权利要求1所述的方法,其特征在于,所述图片区块的类型包括以下一种或多种类型:文字区块、图像区块、表格区块,其中,根据所述图片区块的文档内容属性确定所述图片区块的类型包括:
检测所述图片区块的文档内容属性,其中,
当检测到所述图片区块中各个合并连通域的矩形大小之差在预定范围之内时,确定所述图片区块为文字区块;
当检测到所述图片区块中各个合并连通域的矩形大小之差大在预定范围之外时,确定所述图片区块为图像区块;
当检测到所述图片区块中包括一条或多条表格线时,确定所述图片区块为表格区块。
3.根据权利要求2所述的方法,其特征在于,在所述图片区块为文字区块的情况下,根据显示区域的大小对任意一种或多种类型的图片区块进行对应的重排处理,以获取每一种图片区块的显示数据的步骤包括:
根据需求设置对应所述显示区域的字符显示特征,所述字符显示特征包括:字符大小、字符间距和字符行距;
根据所述字符显示特征计算得到对应所述显示区域的字符行数和每行中的字符数目;
依次读取所述文字区块中所有的字符,并按照所述显示区域的字符行数和每行中的字符数目将所述字符缩放后进行依次排序,得到所述文字区块对应所述显示区域的显示数据。
4.根据权利要求3所述的方法,其特征在于,在依次读取所述文字区块中所有的字符之前,所述方法还包括:
读取所述文字区块中的所有字符连通域;
计算得到字符连通域的高度参考值,根据所述高度参考值来遍历所有字符连通域以对所述文字区块中的字块分行;
根据字符的结构特征,对每行中的字符块进行单字切分和处理,以得到所述文字区块中所有的字符,其中,当所述字符为汉字的情况下,对每行中的字符块进行单字切分包括:将纵向坐标中上下关联的连通域合并为一个字符块,并将横向坐标中左右相邻距离小于等于预定值的连通域合并为一个字符块。
5.根据权利要求2所述的方法,其特征在于,在所述图片区块为表格区块的情况下,根据显示区域的大小对任意一种或多种类型的图片区块进行对应的重排处理,以获取每一种图片区块的显示数据的步骤包括:
提取所述表格区块中的表格线,并根据所述表格线对表格进行划分,得到一个或多个具有行列坐标的单元格;
根据需求设置对应所述显示区域的单元格显示特征,所述单元格显示特征包括:单元格大小、单元格间距和单元格行距;
根据所述单元格显示特征计算得到对应所述显示区域的单元格行数和每行中的单元格数目;
依次读取所述表格区块中所有的单元格,并按照所述显示区域的单元格行数和每行中的单元格数目将所述单元格缩放后进行依次排序,得到所述表格区块对应所述显示区域的显示数据。
6.根据权利要求5所述的方法,其特征在于,依次读取所述表格区块中所有的单元格,并按照所述显示区域的单元格行数和每行中的单元格数目将所述单元格缩放后进行依次排序,得到所述表格区块对应所述显示区域的显示数据包括:
提取所述表格区块中的所有表头单元格;
按照所述显示区域的单元格行数和每行中的单元格数目,确定每一个表头单元格在所述显示区域中的表头坐标位置;
将各个表头单元格缩放后复制到所述显示区域中已经确定的表头坐标位置;
读取所述表格区块中的字符单元格;
根据已经确定的表头坐标位置和所述显示区域的单元格行数和每行中的单元格数目,确定每一个字符单元格的字符坐标位置;
将各个表头单元格缩放后复制到所述显示区域中已经确定的字符坐标位置;
其中,在各个所述表头单元格的表头坐标位置确定之后,在每一个显示区域中的相同坐标位置复制相同的表头单元格。
7.根据权利要求2所述的方法,其特征在于,在所述图片区块为图像区块的情况下,根据显示区域的大小对任意一种或多种类型的图片区块进行对应的重排处理,以获取每一种图片区块的显示数据的步骤包括:
根据需求设置对应所述显示区域的图像显示特征,所述图像显示特征包括:图像大小、图像间距和图像行距;
根据所述图像显示特征计算得到对应所述显示区域的图像行数和每行中的图像数目;
依次提取所述图像区块中的一个或多个子图像,并按照所述显示区域的图像行数和每行中的图像数目将所述子图像缩放后进行依次排序,得到所述图像区块对应所述显示区域的显示数据。
8.根据权利要求7所述的方法,其特征在于,在提取所述图像区块中的一个或多个子图像之后,所述方法还包括:通过直方图均衡算法对各个子图像进行处理,以获取对比度超过预定值的图形。
9.一种图片文档的处理装置,其特征在于,包括:
预处理模块,用于对图片文档进行预处理,以获取基于连通域的页面图像;
切分模块,用于将所述基于连通域的页面图像进行切分,得到一个或多个图片区块,根据所述图片区块的文档内容属性确定所述图片区块的类型;
重排模块,用于根据显示区域的大小对任意一种或多种类型的图片区块进行对应的重排处理,以获取每一种图片区块的显示数据;
显示模块,用于在所述显示区域中显示所述图片区块的显示数据。
10.根据权利要求9所述的装置,其特征在于,所述图片区块的类型包括以下一种或多种类型:文字区块、图像区块、表格区块,其中,所述切分模块包括:
检测模块,用于检测所述图片区块的文档内容属性;
第一获取模块,用于当检测到所述图片区块中各个合并连通域的矩形大小之差在预定范围之内时,确定所述图片区块为文字区块;
第二获取模块,用于当检测到所述图片区块中各个合并连通域的矩形大小之差大在预定范围之外时,确定所述图片区块为图像区块;
第二获取模块,用于当检测到所述图片区块中包括一条或多条表格线时,确定所述图片区块为表格区块。
11.根据权利要求10所述的装置,其特征在于,在所述图片区块为文字区块的情况下,所述重排模块包括:
设置模块,用于根据需求设置对应所述显示区域的字符显示特征,所述字符显示特征包括:字符大小、字符间距和字符行距;
计算模块,用于根据所述字符显示特征计算得到对应所述显示区域的字符行数和每行中的字符数目;
排序模块,用于依次读取所述文字区块中所有的字符,并按照所述显示区域的字符行数和每行中的字符数目将所述字符缩放后进行依次排序,得到所述文字区块对应所述显示区域的显示数据。
12.根据权利要求10所述的装置,其特征在于,在所述图片区块为表格区块的情况下,所述重排模块包括:
处理模块,用于提取所述表格区块中的表格线,并根据所述表格线对表格进行划分,得到一个或多个具有行列坐标的单元格;
设置模块,用于根据需求设置对应所述显示区域的单元格显示特征,所述单元格显示特征包括:单元格大小、单元格间距和单元格行距;
计算模块,用于根据所述单元格显示特征计算得到对应所述显示区域的单元格行数和每行中的单元格数目;
排序模块,用于依次读取所述表格区块中所有的单元格,并按照所述显示区域的单元格行数和每行中的单元格数目将所述单元格缩放后进行依次排序,得到所述表格区块对应所述显示区域的显示数据。
13.根据权利要求10所述的装置,其特征在于,在所述图片区块为图像区块的情况下,所述重排模块包括:
设置模块,用于根据需求设置对应所述显示区域的图像显示特征,所述图像显示特征包括:图像大小、图像间距和图像行距;
计算模块,用于根据所述图像显示特征计算得到对应所述显示区域的图像行数和每行中的图像数目;
排序模块,用于依次提取所述图像区块中的一个或多个子图像,并按照所述显示区域的图像行数和每行中的图像数目将所述子图像缩放后进行依次排序,得到所述图像区块对应所述显示区域的显示数据。
CN2011104510813A 2011-12-29 2011-12-29 图片文档的处理方法及装置 Expired - Fee Related CN102567300B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011104510813A CN102567300B (zh) 2011-12-29 2011-12-29 图片文档的处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011104510813A CN102567300B (zh) 2011-12-29 2011-12-29 图片文档的处理方法及装置

Publications (2)

Publication Number Publication Date
CN102567300A true CN102567300A (zh) 2012-07-11
CN102567300B CN102567300B (zh) 2013-11-27

Family

ID=46412744

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011104510813A Expired - Fee Related CN102567300B (zh) 2011-12-29 2011-12-29 图片文档的处理方法及装置

Country Status (1)

Country Link
CN (1) CN102567300B (zh)

Cited By (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930262A (zh) * 2012-09-19 2013-02-13 北京百度网讯科技有限公司 一种从图像中提取文字行的方法及装置
CN103488619A (zh) * 2013-07-05 2014-01-01 百度在线网络技术(北京)有限公司 一种用于进行文档文件处理的方法及装置
CN103500332A (zh) * 2013-09-06 2014-01-08 优视科技有限公司 图片内文字显示方法及装置
CN103593329A (zh) * 2012-08-17 2014-02-19 腾讯科技(深圳)有限公司 一种文字图片重排方法及***
CN103778128A (zh) * 2012-10-18 2014-05-07 腾讯科技(深圳)有限公司 一种列表信息的绘制方法和装置
CN103870793A (zh) * 2012-12-10 2014-06-18 北大方正集团有限公司 纸媒广告的监测方法和装置
CN103970723A (zh) * 2014-05-16 2014-08-06 山西大学 基于图像检测和切割的电子文档屏幕显示方法
CN104077270A (zh) * 2013-03-29 2014-10-01 富士胶片株式会社 电子书制作装置、电子书***以及电子书制作方法
CN104717330A (zh) * 2015-01-30 2015-06-17 浙江吉利控股集团有限公司 移动终端及组合式终端设备
WO2015180587A1 (zh) * 2014-05-26 2015-12-03 阿里巴巴集团控股有限公司 一种图像的展示处理方法和装置
CN105389165A (zh) * 2015-10-21 2016-03-09 广州视睿电子科技有限公司 一种文档图片显示方法、装置及终端
CN106204439A (zh) * 2016-06-28 2016-12-07 乐视控股(北京)有限公司 图片自适应处理的方法和***
CN107689070A (zh) * 2017-08-31 2018-02-13 平安科技(深圳)有限公司 图表数据结构化提取方法、电子设备及计算机可读存储介质
CN107688789A (zh) * 2017-08-31 2018-02-13 平安科技(深圳)有限公司 文档图表抽取方法、电子设备及计算机可读存储介质
CN107798321A (zh) * 2017-12-04 2018-03-13 海南云江科技有限公司 一种试卷分析方法和计算设备
CN107832756A (zh) * 2017-10-24 2018-03-23 讯飞智元信息科技有限公司 快递单信息提取方法及装置、存储介质、电子设备
CN108074214A (zh) * 2017-12-20 2018-05-25 江苏省质量和标准化研究院 一种标准资源加工去污处理方法
CN108133214A (zh) * 2017-12-25 2018-06-08 广东小天才科技有限公司 一种基于图片纠正的信息搜索方法及移动终端
CN108133169A (zh) * 2016-12-01 2018-06-08 北京新唐思创教育科技有限公司 一种针对文本图像的成行处理方法及其装置
CN108228553A (zh) * 2017-12-28 2018-06-29 深圳市巨鼎医疗设备有限公司 一种信息处理的方法
CN108549643A (zh) * 2018-04-08 2018-09-18 北京百度网讯科技有限公司 翻译处理方法和装置
US10116778B2 (en) 2015-01-23 2018-10-30 Zhejiang Geely Holding Group Co., Ltd. Mobile terminals and combined terminal equipment
CN109933756A (zh) * 2019-03-22 2019-06-25 腾讯科技(深圳)有限公司 基于ocr的图像转档方法、装置、设备及可读存储介质
CN109948598A (zh) * 2019-05-15 2019-06-28 达而观信息科技(上海)有限公司 文档版面智能化分析方法及装置
CN110188745A (zh) * 2019-05-30 2019-08-30 北京爱尖子教育科技有限责任公司 教学内容在线代码化方法及***
CN110321470A (zh) * 2019-05-23 2019-10-11 平安科技(深圳)有限公司 文档处理方法、装置、计算机设备和存储介质
US10445049B2 (en) 2015-01-23 2019-10-15 Zhejiang Geely Holding Group Co., Ltd Mobile terminal, combined terminal device and method for splicing control
CN110363102A (zh) * 2019-06-24 2019-10-22 北京融汇金信信息技术有限公司 一种pdf文件的对象识别处理方法及装置
CN110442313A (zh) * 2019-06-27 2019-11-12 华为技术有限公司 一种显示属性调整方法以及相关设备
CN110633660A (zh) * 2019-08-30 2019-12-31 盈盛智创科技(广州)有限公司 一种文档识别的方法、设备和存储介质
CN111292302A (zh) * 2020-01-21 2020-06-16 上海悦易网络信息技术有限公司 屏幕检测方法及装置
CN111523286A (zh) * 2020-04-16 2020-08-11 维沃移动通信有限公司 图片显示方法及电子设备
CN111553372A (zh) * 2020-04-24 2020-08-18 北京搜狗科技发展有限公司 一种训练图像识别网络、图像识别搜索的方法及相关装置
CN112115111A (zh) * 2019-06-20 2020-12-22 上海怀若智能科技有限公司 一种基于ocr的文档版本管理方法和***
CN112149523A (zh) * 2020-09-04 2020-12-29 开普云信息科技股份有限公司 基于深度学习和并查集算法的ocr识别并抽取图片的方法、装置、电子设备及存储介质
CN112312189A (zh) * 2019-08-02 2021-02-02 百度在线网络技术(北京)有限公司 一种视频生成方法及视频生成***
CN112507983A (zh) * 2021-02-03 2021-03-16 北京世纪好未来教育科技有限公司 目标检测方法、装置、电子设备及存储介质
CN112632934A (zh) * 2020-12-22 2021-04-09 上海精密计量测试研究所 基于比例计算还原表格图片为可编辑的word文件表格的方法
WO2021083057A1 (zh) * 2019-10-29 2021-05-06 维沃移动通信有限公司 图片显示方法、装置、电子设备及介质
CN113408031A (zh) * 2021-06-22 2021-09-17 广联达科技股份有限公司 一种排布大样图的方法、装置、设备及可读存储介质
CN113538450A (zh) * 2020-04-21 2021-10-22 百度在线网络技术(北京)有限公司 用于生成图像的方法及装置
CN113673294A (zh) * 2021-05-11 2021-11-19 苏州超云生命智能产业研究院有限公司 文献关键信息的提取方法、装置、计算机设备和存储介质
CN115828883A (zh) * 2022-12-07 2023-03-21 广州文石信息科技有限公司 文档内容重排版的方法、装置、电子显示设备以及介质
CN116092097A (zh) * 2022-12-07 2023-05-09 广州文石信息科技有限公司 图像内容重排版的方法、装置、电子显示设备以及介质
US12014473B2 (en) 2021-09-10 2024-06-18 Acer Incorporated Intelligent zooming method and electronic device using the same
US12032975B2 (en) 2019-10-29 2024-07-09 Vivo Mobile Communication Co., Ltd. Picture display method and apparatus, electronic device, and medium

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0423240A (ja) * 1990-05-17 1992-01-27 Pioneer Electron Corp 案内溝付光ディスク
JPH08335249A (ja) * 1995-06-07 1996-12-17 Oki Electric Ind Co Ltd 文書読取装置
US5841900A (en) * 1996-01-11 1998-11-24 Xerox Corporation Method for graph-based table recognition
JPH11312231A (ja) * 1998-04-28 1999-11-09 Omron Corp データ処理プログラムを記録した記録媒体、データ処理装置およびデータ処理方法
US20040145593A1 (en) * 2003-01-29 2004-07-29 Kathrin Berkner Resolution sensitive layout of document regions
JP3577753B2 (ja) * 1994-09-22 2004-10-13 松下電器産業株式会社 文書レイアウト方法
CN1790336A (zh) * 2005-12-20 2006-06-21 无锡永中科技有限公司 文档显示方法
CN101140617A (zh) * 2007-09-29 2008-03-12 东莞市步步高教育电子产品有限公司 电子设备及其文本录入的方法
CN101149790A (zh) * 2007-11-14 2008-03-26 哈尔滨工程大学 中文印刷体公式识别方法
CN101540041A (zh) * 2008-03-21 2009-09-23 中国科学院计算技术研究所 一种扫描文档浏览适配方法
US20090285495A1 (en) * 2008-05-15 2009-11-19 International Business Machines Corporation Generating subimages of an image to use to represent the image
CN101984419A (zh) * 2010-10-21 2011-03-09 优视科技有限公司 用于对网页图片内容进行段落重排的方法及装置
CN101984426A (zh) * 2010-10-21 2011-03-09 优视科技有限公司 用于对网页图片进行字符切分的方法及装置

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0423240A (ja) * 1990-05-17 1992-01-27 Pioneer Electron Corp 案内溝付光ディスク
JP3577753B2 (ja) * 1994-09-22 2004-10-13 松下電器産業株式会社 文書レイアウト方法
JPH08335249A (ja) * 1995-06-07 1996-12-17 Oki Electric Ind Co Ltd 文書読取装置
US5841900A (en) * 1996-01-11 1998-11-24 Xerox Corporation Method for graph-based table recognition
JPH11312231A (ja) * 1998-04-28 1999-11-09 Omron Corp データ処理プログラムを記録した記録媒体、データ処理装置およびデータ処理方法
US20040145593A1 (en) * 2003-01-29 2004-07-29 Kathrin Berkner Resolution sensitive layout of document regions
CN1790336A (zh) * 2005-12-20 2006-06-21 无锡永中科技有限公司 文档显示方法
CN101140617A (zh) * 2007-09-29 2008-03-12 东莞市步步高教育电子产品有限公司 电子设备及其文本录入的方法
CN101149790A (zh) * 2007-11-14 2008-03-26 哈尔滨工程大学 中文印刷体公式识别方法
CN101540041A (zh) * 2008-03-21 2009-09-23 中国科学院计算技术研究所 一种扫描文档浏览适配方法
US20090285495A1 (en) * 2008-05-15 2009-11-19 International Business Machines Corporation Generating subimages of an image to use to represent the image
CN101984419A (zh) * 2010-10-21 2011-03-09 优视科技有限公司 用于对网页图片内容进行段落重排的方法及装置
CN101984426A (zh) * 2010-10-21 2011-03-09 优视科技有限公司 用于对网页图片进行字符切分的方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
魏宏喜 等: "一种基于连通域的蒙古文文档图像版面分析方法", 《内蒙古大学学报(自然科学版)》, vol. 38, no. 5, 30 September 2007 (2007-09-30), pages 586 - 590 *

Cited By (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593329A (zh) * 2012-08-17 2014-02-19 腾讯科技(深圳)有限公司 一种文字图片重排方法及***
CN103593329B (zh) * 2012-08-17 2018-03-13 腾讯科技(深圳)有限公司 一种文字图片重排方法及***
CN102930262A (zh) * 2012-09-19 2013-02-13 北京百度网讯科技有限公司 一种从图像中提取文字行的方法及装置
CN102930262B (zh) * 2012-09-19 2017-07-04 北京百度网讯科技有限公司 一种从图像中提取文字行的方法及装置
CN103778128A (zh) * 2012-10-18 2014-05-07 腾讯科技(深圳)有限公司 一种列表信息的绘制方法和装置
CN103778128B (zh) * 2012-10-18 2018-05-04 腾讯科技(深圳)有限公司 一种列表信息的绘制方法和装置
CN103870793A (zh) * 2012-12-10 2014-06-18 北大方正集团有限公司 纸媒广告的监测方法和装置
CN104077270A (zh) * 2013-03-29 2014-10-01 富士胶片株式会社 电子书制作装置、电子书***以及电子书制作方法
CN103488619A (zh) * 2013-07-05 2014-01-01 百度在线网络技术(北京)有限公司 一种用于进行文档文件处理的方法及装置
CN103500332B (zh) * 2013-09-06 2017-03-15 优视科技有限公司 图片内文字显示方法及装置
CN103500332A (zh) * 2013-09-06 2014-01-08 优视科技有限公司 图片内文字显示方法及装置
CN103970723A (zh) * 2014-05-16 2014-08-06 山西大学 基于图像检测和切割的电子文档屏幕显示方法
CN105335111A (zh) * 2014-05-26 2016-02-17 阿里巴巴集团控股有限公司 一种图像的展示处理方法和装置
WO2015180587A1 (zh) * 2014-05-26 2015-12-03 阿里巴巴集团控股有限公司 一种图像的展示处理方法和装置
US10116778B2 (en) 2015-01-23 2018-10-30 Zhejiang Geely Holding Group Co., Ltd. Mobile terminals and combined terminal equipment
US10445049B2 (en) 2015-01-23 2019-10-15 Zhejiang Geely Holding Group Co., Ltd Mobile terminal, combined terminal device and method for splicing control
CN104717330B (zh) * 2015-01-30 2018-02-23 浙江吉利控股集团有限公司 移动终端及组合式终端设备
CN104717330A (zh) * 2015-01-30 2015-06-17 浙江吉利控股集团有限公司 移动终端及组合式终端设备
CN105389165A (zh) * 2015-10-21 2016-03-09 广州视睿电子科技有限公司 一种文档图片显示方法、装置及终端
CN105389165B (zh) * 2015-10-21 2019-04-30 广州视睿电子科技有限公司 一种文档图片显示方法、装置及终端
CN106204439A (zh) * 2016-06-28 2016-12-07 乐视控股(北京)有限公司 图片自适应处理的方法和***
CN108133169A (zh) * 2016-12-01 2018-06-08 北京新唐思创教育科技有限公司 一种针对文本图像的成行处理方法及其装置
CN107689070B (zh) * 2017-08-31 2021-06-04 平安科技(深圳)有限公司 图表数据结构化提取方法、电子设备及计算机可读存储介质
CN107688789B (zh) * 2017-08-31 2021-05-18 平安科技(深圳)有限公司 文档图表抽取方法、电子设备及计算机可读存储介质
CN107688789A (zh) * 2017-08-31 2018-02-13 平安科技(深圳)有限公司 文档图表抽取方法、电子设备及计算机可读存储介质
CN107689070A (zh) * 2017-08-31 2018-02-13 平安科技(深圳)有限公司 图表数据结构化提取方法、电子设备及计算机可读存储介质
CN107832756A (zh) * 2017-10-24 2018-03-23 讯飞智元信息科技有限公司 快递单信息提取方法及装置、存储介质、电子设备
CN107832756B (zh) * 2017-10-24 2021-09-07 讯飞智元信息科技有限公司 快递单信息提取方法及装置、存储介质、电子设备
CN107798321A (zh) * 2017-12-04 2018-03-13 海南云江科技有限公司 一种试卷分析方法和计算设备
CN108074214A (zh) * 2017-12-20 2018-05-25 江苏省质量和标准化研究院 一种标准资源加工去污处理方法
CN108074214B (zh) * 2017-12-20 2020-01-10 江苏省质量和标准化研究院 一种标准资源加工去污处理方法
CN108133214A (zh) * 2017-12-25 2018-06-08 广东小天才科技有限公司 一种基于图片纠正的信息搜索方法及移动终端
CN108228553A (zh) * 2017-12-28 2018-06-29 深圳市巨鼎医疗设备有限公司 一种信息处理的方法
CN108549643A (zh) * 2018-04-08 2018-09-18 北京百度网讯科技有限公司 翻译处理方法和装置
CN109933756B (zh) * 2019-03-22 2022-04-15 腾讯科技(深圳)有限公司 基于ocr的图像转档方法、装置、设备及可读存储介质
CN109933756A (zh) * 2019-03-22 2019-06-25 腾讯科技(深圳)有限公司 基于ocr的图像转档方法、装置、设备及可读存储介质
WO2020192391A1 (zh) * 2019-03-22 2020-10-01 腾讯科技(深圳)有限公司 基于ocr的图像转档方法、装置、设备及可读存储介质
CN109948598A (zh) * 2019-05-15 2019-06-28 达而观信息科技(上海)有限公司 文档版面智能化分析方法及装置
CN110321470B (zh) * 2019-05-23 2024-05-28 平安科技(深圳)有限公司 文档处理方法、装置、计算机设备和存储介质
CN110321470A (zh) * 2019-05-23 2019-10-11 平安科技(深圳)有限公司 文档处理方法、装置、计算机设备和存储介质
CN110188745A (zh) * 2019-05-30 2019-08-30 北京爱尖子教育科技有限责任公司 教学内容在线代码化方法及***
CN112115111A (zh) * 2019-06-20 2020-12-22 上海怀若智能科技有限公司 一种基于ocr的文档版本管理方法和***
CN110363102A (zh) * 2019-06-24 2019-10-22 北京融汇金信信息技术有限公司 一种pdf文件的对象识别处理方法及装置
CN110363102B (zh) * 2019-06-24 2022-05-17 北京融汇金信信息技术有限公司 一种pdf文件的对象识别处理方法及装置
CN110442313A (zh) * 2019-06-27 2019-11-12 华为技术有限公司 一种显示属性调整方法以及相关设备
CN112312189A (zh) * 2019-08-02 2021-02-02 百度在线网络技术(北京)有限公司 一种视频生成方法及视频生成***
CN110633660A (zh) * 2019-08-30 2019-12-31 盈盛智创科技(广州)有限公司 一种文档识别的方法、设备和存储介质
CN110633660B (zh) * 2019-08-30 2022-05-31 盈盛智创科技(广州)有限公司 一种文档识别的方法、设备和存储介质
US12032975B2 (en) 2019-10-29 2024-07-09 Vivo Mobile Communication Co., Ltd. Picture display method and apparatus, electronic device, and medium
WO2021083057A1 (zh) * 2019-10-29 2021-05-06 维沃移动通信有限公司 图片显示方法、装置、电子设备及介质
CN111292302B (zh) * 2020-01-21 2022-12-27 上海万物新生环保科技集团有限公司 屏幕检测方法及装置
CN111292302A (zh) * 2020-01-21 2020-06-16 上海悦易网络信息技术有限公司 屏幕检测方法及装置
CN111523286A (zh) * 2020-04-16 2020-08-11 维沃移动通信有限公司 图片显示方法及电子设备
CN111523286B (zh) * 2020-04-16 2023-07-07 维沃移动通信有限公司 图片显示方法、装置、电子设备及计算机可读存储介质
US11810333B2 (en) 2020-04-21 2023-11-07 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for generating image of webpage content
CN113538450A (zh) * 2020-04-21 2021-10-22 百度在线网络技术(北京)有限公司 用于生成图像的方法及装置
CN111553372A (zh) * 2020-04-24 2020-08-18 北京搜狗科技发展有限公司 一种训练图像识别网络、图像识别搜索的方法及相关装置
CN111553372B (zh) * 2020-04-24 2023-08-08 北京搜狗科技发展有限公司 一种训练图像识别网络、图像识别搜索的方法及相关装置
CN112149523A (zh) * 2020-09-04 2020-12-29 开普云信息科技股份有限公司 基于深度学习和并查集算法的ocr识别并抽取图片的方法、装置、电子设备及存储介质
CN112632934A (zh) * 2020-12-22 2021-04-09 上海精密计量测试研究所 基于比例计算还原表格图片为可编辑的word文件表格的方法
CN112507983B (zh) * 2021-02-03 2021-11-16 北京世纪好未来教育科技有限公司 目标检测方法、装置、电子设备及存储介质
CN112507983A (zh) * 2021-02-03 2021-03-16 北京世纪好未来教育科技有限公司 目标检测方法、装置、电子设备及存储介质
CN113673294A (zh) * 2021-05-11 2021-11-19 苏州超云生命智能产业研究院有限公司 文献关键信息的提取方法、装置、计算机设备和存储介质
CN113408031A (zh) * 2021-06-22 2021-09-17 广联达科技股份有限公司 一种排布大样图的方法、装置、设备及可读存储介质
CN113408031B (zh) * 2021-06-22 2024-01-30 广联达科技股份有限公司 一种排布大样图的方法、装置、设备及可读存储介质
US12014473B2 (en) 2021-09-10 2024-06-18 Acer Incorporated Intelligent zooming method and electronic device using the same
CN115828883A (zh) * 2022-12-07 2023-03-21 广州文石信息科技有限公司 文档内容重排版的方法、装置、电子显示设备以及介质
CN116092097A (zh) * 2022-12-07 2023-05-09 广州文石信息科技有限公司 图像内容重排版的方法、装置、电子显示设备以及介质
CN116092097B (zh) * 2022-12-07 2024-04-26 广州文石信息科技有限公司 图像内容重排版的方法、装置、电子显示设备以及介质
CN115828883B (zh) * 2022-12-07 2024-05-28 广州文石信息科技有限公司 文档内容重排版的方法、装置、电子显示设备以及介质

Also Published As

Publication number Publication date
CN102567300B (zh) 2013-11-27

Similar Documents

Publication Publication Date Title
CN102567300B (zh) 图片文档的处理方法及装置
CN101453575B (zh) 一种视频字幕信息提取方法
CN107093172B (zh) 文字检测方法及***
JP3748172B2 (ja) 画像処理装置
US7298900B2 (en) Image processing method, image processing apparatus and image processing program
US8027550B2 (en) Image-document retrieving apparatus, method of retrieving image document, program, and recording medium
CN100565559C (zh) 基于连通分量和支持向量机的图像文本定位方法和装置
CN105528614B (zh) 一种漫画图像版面的识别方法和自动识别***
CN106156761A (zh) 面向移动终端拍摄的图像表格检测与识别方法
CN105308944A (zh) 对移动设备捕获的数字图像中的对象进行分类的***和方法
JPH03122773A (ja) 画像形成装置
CN102332097B (zh) 一种基于图割的复杂背景文本图像分割方法
US20100111419A1 (en) Image display device, image display method, and computer readable medium
CN109598185A (zh) 图像识别翻译方法、装置、设备及可读存储介质
JP4149464B2 (ja) 画像処理装置
CN111626145B (zh) 一种简捷有效的残缺表格识别及跨页拼接方法
CN115761773A (zh) 基于深度学习的图像内表格识别方法及***
US20190095743A1 (en) Line removal method, apparatus, and computer-readable medium
CN115588208A (zh) 一种基于数字图像处理技术的全线表结构识别方法
CN110516592A (zh) 一种基于手写数字字符的识别方法
CN108052955B (zh) 一种高精度盲文识别方法及***
CN107958261B (zh) 一种盲文点检测方法及***
CN115880362B (zh) 码区定位方法、装置、计算机设备及计算机可读存储介质
CN107066997A (zh) 一种基于图像识别的电气元件报价方法
CN108062548B (zh) 一种盲文方自适应定位方法及***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20131127

Termination date: 20141229

EXPY Termination of patent right or utility model