CN101931731B - 一种文稿方向的检测方法和装置 - Google Patents

一种文稿方向的检测方法和装置 Download PDF

Info

Publication number
CN101931731B
CN101931731B CN200910088352A CN200910088352A CN101931731B CN 101931731 B CN101931731 B CN 101931731B CN 200910088352 A CN200910088352 A CN 200910088352A CN 200910088352 A CN200910088352 A CN 200910088352A CN 101931731 B CN101931731 B CN 101931731B
Authority
CN
China
Prior art keywords
stroke
literal
node
cross characteristics
oriented
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200910088352A
Other languages
English (en)
Other versions
CN101931731A (zh
Inventor
张宏志
袁梦尤
李平立
六尾敏明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Founder International Beijing Co Ltd
Kyocera Document Solutions Inc
Original Assignee
Peking University
Founder International Beijing Co Ltd
Kyocera Mita Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University, Founder International Beijing Co Ltd, Kyocera Mita Corp filed Critical Peking University
Priority to CN200910088352A priority Critical patent/CN101931731B/zh
Priority to JP2010101989A priority patent/JP5271956B2/ja
Publication of CN101931731A publication Critical patent/CN101931731A/zh
Application granted granted Critical
Publication of CN101931731B publication Critical patent/CN101931731B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)
  • Character Discrimination (AREA)

Abstract

本发明提供了一种文稿方向的检测方法,该方法包括以下步骤:扫描文稿得到文稿中文字的笔画图;根据笔画图,提取文字的十字特征;根据十字特征,检测得到文稿方向。本发明还提供了一种文稿方向的检测装置,该装置包括:扫描模块,用于扫描文稿得到文稿中文字的笔画图;提取模块,用于根据笔画图,提取文字的十字特征;检测模块,用于根据十字特征,检测得到文稿方向。本发明克服了相关技术要求的计算量很大导致的存在时延较长、成本较高的问题,从而实现了计算量较小,能快速对文稿方向正确检测,便于得到正确的阅读方向的效果。

Description

一种文稿方向的检测方法和装置
技术领域
本发明涉及图像处理领域,具体而言,涉及一种文稿方向的检测方法和装置。
背景技术
现有技术中,当利用扫描装置对图像进行扫描时,均按照图像的原始摆放方向成像,若图像被侧转或倒置,则用户得到扫描后的成像结果也相应地为侧转或倒置。当扫描的图像为文稿时,有可能会得到侧转或倒置的方向混乱的成像结果。
由于无法对文稿成像结果进行文稿方向检测,从而无法得到正确的阅读方向,需要用户对其进行多次旋转即以人工校正的方式来获得正确的阅读方向,比较繁琐。
为了解决上述的问题,相关技术中提供了一种文稿方向的检测方法,通过对文稿的文字进行识别,然后根据识别结果再判断文稿方向。
在实现本发明过程中,发明人发现该方法由于在检测过程中必须首先完成文字识别,导致要求的计算量很大,从而存在时延较长、成本较高的缺陷。
发明内容
本发明旨在提供一种文稿方向的检测方法,能够解决相关技术要求的计算量很大导致的存在时延较长、成本较高的问题。
在本发明的实施例中,提供了一种文稿方向的检测方法,该方法包括以下步骤:扫描文稿得到文稿中文字的笔画图;根据笔画图,提取文字的十字特征;根据十字特征,检测得到文稿方向。
在本发明的实施例中,还提供了一种文稿方向的检测装置,该装置包括:扫描模块,用于扫描文稿得到文稿中文字的笔画图;提取模块,用于根据笔画图,提取文字的十字特征;检测模块,用于根据十字特征,检测得到文稿方向。
因为采用十字特征来检测文稿方向,并以此作为扫描装置自动校正文稿方向的基础,所以克服了相关技术要求的计算量很大导致的存在时延较长、成本较高的问题,从而实现了计算量较小,能快速对文稿方向正确检测,便于得到正确的阅读方向的效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了根据本发明一个实施例的文稿方向的检测方法的流程图;
图2示出了根据本发明一个实施例的检测方法中笔画结点的示意图;
图3示出了图2对应的笔画图;
图4示出了一个文字的示意图;
图5示出了图4对应的笔画图;
图6示出了根据本发明一个实施例的贯穿关系的示意图;
图7示出了根据本发明一个实施例的横向十字特征结构的示意图;
图8示出了根据本发明一个实施例的竖向十字特征结构的示意图;
图9示出了根据本发明另一个实施例的文稿方向的检测装置的结构图。
具体实施方式
下面将参考附图并结合实施例,来详细说明本发明。
图1示出了根据本发明一个实施例的文稿方向的检测方法的流程图,包括以下步骤:
步骤S10,扫描文稿得到文稿中文字的笔画图;
步骤S20,根据笔画图,提取文字的十字特征;
步骤S30,根据十字特征,检测得到文稿方向。
本实施例首先通过单次扫描文稿得到包含文字笔画信息的笔画图,然后从笔画图中提取其十字特征,最后根据十字特征检测得到文稿方向,这种基于十字特征的方法可实现对文稿方向的准确检测,从而克服了相关技术要求的计算量很大导致的存在时延较长、成本较高的问题,从而实现了计算量较小,能快速对文稿方向正确检测,便于得到正确的阅读方向的效果。
可选的,步骤S20具体包括:根据笔画图中的笔画结点body、直笔画wing、非直笔画及其连接关系,提取文字的十字特征结构为横向十字特征结构或竖向十字特征结构;当文字为横向十字特征结构时,进一步提取文字的十字特征朝向为向左或向右;当文字为竖向十字特征结构时,进一步提取文字的十字特征朝向为向上或向下。
本实施例首先从笔画图中提取文字的十字特征结构:为横向或者竖向,然后再进一步提取文字的十字特征朝向:如果是横向结构,则朝向为向左或向右,如果是竖向结构,则朝向为向上或向下。笔画图是扫描文稿得到的,它反映了笔画结点、直笔画、非直笔画等组成文字的基本元素之间的连接关系,所以从笔画图中提取文字的十字特征是完全可行的。
在一个逐行存储的图像中,具有相同灰度值的一些像素组成的序列称为行程(run),在行程中像素的个数称为行程长度(run-length)。在对文字进行图像处理时,可将run-length相近的相邻行程连接起来得到笔画结点(Stroke Node)。如图2所示,虚线椭圆框标示的区域中,各行程的run-length相近,彼此之间的差别不大,即每个虚线框对应于一个Stroke Node,对于图2中的“大”字,共有6个Stroke Node。
Stoke Node的基本类型包括:横,竖,点,撇,捺。同时StrokeNode中包含某些属性,如位置,长度等。
将笔画结点之间的连接关系用图表示出来即得到笔画图(Stroke Graph),图3示出了图2对应的笔画图,笔画图用基本类型的Stoke Node来表示图2中文字的原始图像。笔画图中,用边来表示笔画结点之间的连接关系,并用矩阵结构存储连接关系。图5为图4所示的文字对应的笔画图,图5中共18个笔画结点(0~17),其间的连接关系可用边表示如下:(3,0),(3,2),(4,3),(6,5),(7,4),(7,6),(9,7),(10,7),(11,8),(12,8),(13,9),(13,12),(14,13),(14,11),(15,10),(17,14)。每个边均被表示为一个数对,该数对中的元素即为相邻的两个笔画结点的编号.
当笔画满足如下条件时,认为其为直笔画:
a)由1个或多个笔画结点连接组成;
b)一端连接在笔画结点,另一端只有一个边;
c)其它笔画结点的边都为两个,且分别位于上下两方;
d)各笔画结点的平均宽度近似。
图6示出了根据本发明一个实施例的贯穿关系的示意图,连接关系包括贯穿关系,当两个笔画结点满足以下条件时,设置两个笔画结点互为贯穿结点,其连接关系为贯穿关系:与同一笔画结点相连的上下两个笔画结点的连接处run-length的中心点bcx和hcx之间的距离w小于同一笔画结点的高度h,且上下两个结点在垂直方向上的投影有重叠。
本实施例设置满足上述关系的两个笔画结点互为贯穿结点,贯穿是一种重要的连接关系,也是提取文字十字特征的基础。
图7示出了根据本发明一个实施例的横向十字特征结构的示意图,当文字同时满足以下条件时,文字为横向十字特征结构:文字的两个直笔画wing与同一个笔画结点body连接,且两个直笔画wing为贯穿关系;笔画结点body的端点到直笔画边界的距离大于直笔画wing的平均run-length宽度的1/2;与笔画结点body连接的其它笔画结点均位于直笔画wing的同侧。
本实施例根据文字中直笔画wing与笔画结点body之间是否为贯穿连接、其间的距离以及其它笔画结点的位置,即可提取得到文字的十字特征结构为横向十字特征结构,该方案简单、直观。
可选的,当同侧为右侧时,文字的十字特征朝向为向左;当同侧为左侧时,文字的十字特征朝向为向右。
本实施例在得到横向十字特征结构之后,仅通过判断与笔画结点body连接的其它笔画结点位于直笔画wing的左侧还是右侧就可以得到横向十字特征朝向。图7中,由于与笔画结点body连接的其它笔画结点位于直笔画wing的左侧,可得到该文字的十字特征朝向为向右。该方案简单、直观,且由于判断标准明确,误判率较小,所以保证了检测精度。
图8示出了根据本发明一个实施例的竖向十字特征结构的示意图,当文字同时满足以下条件时,文字为竖向十字特征结构:与第一笔画结点body上部连接的第二笔画结点个数为1,即upNum=1,downNum的值可为1或2,第一笔画结点body的宽度大于其高度的2倍;存在与第二笔画结点连接的贯穿结点,且贯穿结点位于第一笔画结点body的中间部分;与第一笔画结点body连接的所有笔画全部为直笔画,或者与第一笔画结点body连接的除了一个非直笔画之外全部为直笔画。
可选的,当文字同时满足以下条件时,文字为竖向十字特征结构:与第一笔画结点body下部连接的第二笔画结点个数为1,即downNum=1,upNum的值可为1或2,第一笔画结点body的宽度大于其高度的2倍;存在与第二笔画结点连接的贯穿结点,且贯穿结点位于第一笔画结点body的中间部分;与第一笔画结点body连接的所有笔画全部为直笔画,或者与第一笔画结点body连接的除了一个非直笔画之外全部为直笔画。
本实施例根据文字中根据与第一笔画结点body连接的第二笔画结点个数、第一笔画结点body的宽度高度比、第二笔画结点是否存在贯穿结点以及该贯穿结点与第一笔画结点body的关系、与第一笔画结点body连接的笔画性质,即可提取得到文字的十字特征结构为竖向十字特征结构,该方案简单、直观。
可选的,若与第一笔画结点body连接的所有笔画全部为直笔画,当第一笔画结点body下部连接有两个其它笔画结点时,文字的十字特征朝向为向上;当第一笔画结点body上部连接有两个其它笔画结点时,文字的十字特征朝向为向下。
可选的,若与第一笔画结点body连接的除了一个非直笔画之外全部为直笔画,当非直笔画处于第一笔画结点body下部时,文字的十字特征朝向为向上;当非直笔画处于第一笔画结点body上部时,文字的十字特征朝向为向下。
本实施例在得到竖向十字特征结构之后,仅通过判断与第一笔画结点body连接的其它笔画结点位于第一笔画结点body的上部还是下部就可以得到竖向十字特征朝向。该方案简单、直观,且由于判断标准明确,误判率较小,所以保证了检测精度。
可选的,步骤S30具体包括:统计文稿中十字特征朝向分别为向左、向右、向上、向下的文字的数量;设置最多数量对应的十字特征朝向为文稿方向。
本实施例通过统计文稿中大量文字的十字特征朝向,得到向左、向右、向上、向下四个朝向分别对应的文字数量,并将文字数量最多的那个朝向设置为文稿方向,即将从笔画图中提取的十字特征朝向作为文稿方向检测的基础,从而本实施例的文稿方向检测方法加快了文稿方向检测的速度,提高了文稿方向检测的精度。
可选的,文稿方向的检测方法还包括:当文稿中十字特征朝向不是预定朝向时,对文稿进行校正直至文稿的十字特征朝向为所述预定朝向,预定朝向为以下的其中一种:向左、向右、向上、向下。
本实施例利用检测得到的文稿方向对非预定朝向的文稿进行校正,以得到预定朝向的文稿,便于用户进行阅读。
图9示出了根据本发明另一个实施例的文稿方向的检测装置的结构图,包括:
扫描模块10,用于扫描文稿得到文稿中文字的笔画图;
提取模块20,用于根据笔画图,提取文字的十字特征;
检测模块30,用于根据十字特征,检测得到文稿方向。
本实施例首先采用扫描模块10对文稿进行单次扫描得到包含文字笔画信息的笔画图,然后采用提取模块20从笔画图中提取其十字特征,最后采用检测模块30根据十字特征检测得到文稿方向,这种基于十字特征的文稿方向检测装置可实现对文稿方向的准确检测,从而克服了相关技术要求的计算量很大导致的存在时延较长、成本较高的问题,从而实现了计算量较小,能快速对文稿方向正确检测,便于得到正确的阅读方向的效果。
可选的,提取模块20具体包括:十字特征结构提取单元,用于根据笔画图中的笔画结点body、直笔画wing、非直笔画及其连接关系,提取文字的十字特征结构为横向十字特征结构或竖向十字特征结构;十字特征朝向提取单元,用于根据十字特征结构进一步提取文字的十字特征朝向,当文字为横向十字特征结构时,进一步提取文字的十字特征朝向为向左或向右;当文字为竖向十字特征结构时,进一步提取文字的十字特征朝向为向上或向下。
本实施例首先采用十字特征结构提取单元从笔画图中提取文字的十字特征结构:为横向或者竖向,然后再采用十字特征朝向提取单元进一步提取文字的十字特征朝向:如果是横向结构,则朝向为向左或向右,如果是竖向结构,则朝向为向上或向下。笔画图是扫描文稿得到的,它反映了笔画结点body、直笔画wing、非直笔画等组成文字的基本元素之间的连接关系,所以从笔画图中提取文字的十字特征是完全可行的。
可选的,连接关系包括贯穿关系,当两个笔画结点满足以下条件时,设置两个笔画结点互为贯穿结点,其连接关系为贯穿关系:与同一笔画结点相连的上下两个笔画结点的连接处run-length的中心点之间的距离小于同一笔画结点的高度,且上下两个结点在垂直方向上的投影有重叠。
本实施例设置满足上述关系的两个笔画结点互为贯穿结点,贯穿是一种重要的连接关系,也是提取文字十字特征的基础。
可选的,当文字同时满足以下条件时,文字为横向十字特征结构:文字的两个直笔画wing与同一个笔画结点body连接,且两个直笔画wing为贯穿关系;笔画结点body的端点到直笔画边界的距离大于直笔画wing的平均run-length宽度的1/2;与笔画结点body连接的其它笔画结点均位于直笔画wing的同侧。
本实施例根据文字中直笔画wing与笔画结点body之间是否为贯穿连接、其间的距离以及其它笔画结点的位置,即可提取得到文字的十字特征结构为横向十字特征结构,该方案简单、直观。
可选的,当同侧为右侧时,文字的十字特征朝向为向左;当同侧为左侧时,文字的十字特征朝向为向右。
本实施例在得到横向十字特征结构之后,仅通过判断与笔画结点body连接的其它笔画结点位于直笔画wing的左侧还是右侧就可以得到横向十字特征朝向。该方案简单、直观,且由于判断标准明确,误判率较小,所以保证了检测精度。
可选的,当文字同时满足以下条件时,文字为竖向十字特征结构:与第三笔画结点body上部连接的第四笔画结点个数为1,即upNum=1,downNum的值可为1或2,第三笔画结点body的宽度大于其高度的2倍;存在与第四笔画结点连接的贯穿结点,且贯穿结点位于第三笔画结点body的中间部分;与第三笔画结点body连接的所有笔画全部为直笔画,或者与第三笔画结点body连接的除了一个非直笔画之外全部为直笔画。
可选的,当文字同时满足以下条件时,文字为竖向十字特征结构:与第三笔画结点body下部连接的第四笔画结点个数为1,即downNum=1,upNum的值可为1或2,第三笔画结点body的宽度大于其高度的2倍;存在与第四笔画结点连接的贯穿结点,且贯穿结点位于第三笔画结点body的中间部分;与第三笔画结点body连接的所有笔画全部为直笔画,或者与第三笔画结点body连接的除了一个非直笔画之外全部为直笔画。
本实施例根据文字中根据与第三笔画结点body连接的第四笔画结点个数、第三笔画结点body的宽度高度比、第四结点是否存在贯穿结点以及该贯穿结点与第三笔画结点body的关系、与第三笔画结点body连接的笔画性质,即可提取得到文字的十字特征结构为竖向十字特征结构,该方案简单、直观。
可选的,若与第三笔画结点body连接的所有笔画全部为直笔画,当第三笔画结点body下部连接有两个其它笔画结点时,文字的十字特征朝向为向上;当第三笔画结点body上部连接有两个其它笔画结点时,文字的十字特征朝向为向下。
可选的,若与第三笔画结点body连接的除了一个非直笔画之外全部为直笔画,当非直笔画处于第三笔画结点body下部时,文字的十字特征朝向为向上;当非直笔画处于第三笔画结点body上部时,文字的十字特征朝向为向下。
本实施例在得到竖向十字特征结构之后,仅通过判断与第三笔画结点body连接的其它笔画结点位于第三笔画结点body的上部还是下部就可以得到竖向十字特征朝向。该方案简单、直观,且由于判断标准明确,误判率较小,所以保证了检测精度。
可选的,检测模块30具体包括:统计单元,用于统计文稿中十字特征朝向分别为向左、向右、向上、向下的文字的数量;设置单元,用于设置最多数量对应的十字特征朝向为文稿方向。
本实施例采用统计单元统计文稿中大量文字的十字特征朝向,得到向左、向右、向上、向下四个朝向分别对应的文字数量,并采用设置单元将文字数量最多的那个朝向设置为文稿方向,即将从笔画图中提取的十字特征朝向作为文稿方向检测的基础,从而本实施例的文稿方向检测方法加快了文稿方向检测的速度,提高了文稿方向检测的精度。
可选的,文稿方向的检测装置还包括:校正模块,用于当文稿中十字特征朝向不是预定朝向时,对文稿进行校正直至文稿的十字特征朝向为所述预定朝向,预定朝向为以下的其中一种:向左、向右、向上、向下。
本实施例中的校正模块根据检测得到的文稿方向对非预定朝向的文稿进行校正,以得到预定朝向的文稿,便于用户进行阅读。
从以上的描述中,可以看出,本发明上述的实施例实现了计算量较小,能快速对文稿方向正确检测,便于得到正确的阅读方向的效果。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (16)

1.一种文稿方向的检测方法,其特征在于,包括以下步骤:
扫描文稿得到所述文稿中文字的笔画图;
根据所述笔画图,提取所述文字的十字特征;
根据所述十字特征,检测得到所述文稿方向,
其中,根据所述笔画图,提取所述文字的十字特征具体包括:
根据所述笔画图中的笔画结点、直笔画、非直笔画及其连接关系,提取所述文字的十字特征结构为横向十字特征结构或竖向十字特征结构;
当所述文字为所述横向十字特征结构时,进一步提取所述文字的十字特征朝向为向左或向右;
当所述文字为所述竖向十字特征结构时,进一步提取所述文字的十字特征朝向为向上或向下。
2.根据权利要求1所述的检测方法,其特征在于,所述连接关系包括贯穿关系,当两个所述笔画结点满足以下条件时,设置两个所述笔画结点互为贯穿结点,其连接关系为贯穿关系:
与同一笔画结点相连的上下两个笔画结点的端点之间的距离小于所述同一笔画结点的高度,且所述上下两个结点在垂直方向上的投影有重叠。
3.根据权利要求2所述的检测方法,其特征在于,当所述文字同时满足以下条件时,所述文字为所述横向十字特征结构:
所述文字的两个所述直笔画与同一个所述笔画结点连接,且两个所述直笔画为贯穿关系;
所述笔画结点的端点到所述直笔画边界的距离大于所述直笔画的平均行程宽度的1/2;
与所述笔画结点连接的其它笔画结点均位于所述直笔画的同侧。
4.根据权利要求3所述的检测方法,其特征在于,
当所述同侧为右侧时,所述文字的十字特征朝向为向左;
当所述同侧为左侧时,所述文字的十字特征朝向为向右。
5.根据权利要求2所述的检测方法,其特征在于,当所述文字同时满足以下条件时,所述文字为所述竖向十字特征结构:
与第一笔画结点上部或下部连接的第二笔画结点个数为1,所述第一笔画结点的宽度大于其高度的2倍;
存在与所述第二笔画结点连接的贯穿结点,且所述贯穿结点位于所述第一笔画结点的中间部分;
与所述第一笔画结点连接的所有笔画全部为所述直笔画,或者与所述第一笔画结点连接的除了一个所述非直笔画之外全部为所述直笔画。
6.根据权利要求5所述的检测方法,其特征在于,
若与所述第一笔画结点连接的所有笔画全部为所述直笔画,
当所述第一笔画结点下部连接有两个其它笔画结点时,所述文字的十字特征朝向为向上;
当所述第一笔画结点上部连接有两个其它笔画结点时,所述文字的十字特征朝向为向下;
若与所述第一笔画结点连接的除了一个所述非直笔画之外全部为所述直笔画,
当所述非直笔画处于所述第一笔画结点下部时,所述文字的十字特征朝向为向上;
当所述非直笔画处于所述第一笔画结点上部时,所述文字的十字特征朝向为向下。
7.根据权利要求1-6中任一项所述的检测方法,其特征在于,根据所述十字特征,检测得到所述文稿方向具体包括:
统计所述文稿中所述十字特征朝向分别为向左、向右、向上、向下的所述文字的数量;
设置最多数量对应的所述十字特征朝向为所述文稿方向。
8.根据权利要求7所述的检测方法,其特征在于,还包括:当所述文稿中所述十字特征朝向不是预定朝向时,对所述文稿进行校正直至所述文稿的所述十字特征朝向为所述预定朝向,所述预定朝向为以下的其中一种:向左、向右、向上、向下。
9.一种文稿方向的检测装置,其特征在于,包括以下步骤:
扫描模块,用于扫描文稿得到所述文稿中文字的笔画图;
提取模块,用于根据所述笔画图,提取所述文字的十字特征;
检测模块,用于根据所述十字特征,检测得到所述文稿方向,
其中,所述提取模块具体包括:
十字特征结构提取单元,用于根据所述笔画图中的笔画结点、直笔画、非直笔画及其连接关系,提取所述文字的十字特征结构为横向十字特征结构或竖向十字特征结构;
十字特征朝向提取单元,用于根据所述十字特征结构进一步提取所述文字的十字特征朝向,当所述文字为所述横向十字特征结构时,进一步提取所述文字的十字特征朝向为向左或向右;当所述文字为所述竖向十字特征结构时,进一步提取所述文字的十字特征朝向为向上或向下。
10.根据权利要求9所述的检测装置,其特征在于,所述连接关系包括贯穿关系,当两个所述笔画结点满足以下条件时,设置两个所述笔画结点互为贯穿结点,其连接关系为贯穿关系:
与同一笔画结点相连的上下两个笔画结点的端点之间的距离小于所述同一笔画结点的高度,且所述上下两个结点在垂直方向上的投影有重叠。
11.根据权利要求10所述的检测装置,其特征在于,当所述文字同时满足以下条件时,所述文字为所述横向十字特征结构:
所述文字的两个所述直笔画与同一个所述笔画结点连接,且两个所述直笔画为贯穿关系;
所述笔画结点的端点到所述直笔画边界的距离大于所述直笔画的平均行程宽度的1/2;
与所述笔画结点连接的其它笔画结点均位于所述直笔画的同侧。
12.根据权利要求11所述的检测装置,其特征在于,
当所述同侧为右侧时,所述文字的十字特征朝向为向左;
当所述同侧为左侧时,所述文字的十字特征朝向为向右。
13.根据权利要求10所述的检测装置,其特征在于,当所述文字同时满足以下条件时,所述文字为所述竖向十字特征结构:
与第三笔画结点上部或下部连接的第四笔画结点个数为1,所述第三笔画结点的宽度大于其高度的2倍;
存在与所述第四笔画结点连接的贯穿结点,且所述贯穿结点位于所述第三笔画结点的中间部分;
与所述第三笔画结点连接的所有笔画全部为所述直笔画,或者与所述第三笔画结点连接的除了一个所述非直笔画之外全部为所述直笔画。
14.根据权利要求13所述的检测装置,其特征在于,
若与所述第三笔画结点连接的所有笔画全部为所述直笔画,
当所述第三笔画结点下部连接有两个其它笔画结点时,所述文字的十字特征朝向为向上;
当所述第三笔画结点上部连接有两个其它笔画结点时,所述文字的十字特征朝向为向下;
若与所述第三笔画结点连接的除了一个所述非直笔画之外全部为所述直笔画,
当所述非直笔画处于所述第三笔画结点下部时,所述文字的十字特征朝向为向上;
当所述非直笔画处于所述第三笔画结点上部时,所述文字的十字特征朝向为向下。
15.根据权利要求9-14中任一项所述的检测装置,其特征在于,检测模块具体包括:
统计单元,用于统计所述文稿中所述十字特征朝向分别为向左、向右、向上、向下的所述文字的数量;
设置单元,用于设置最多数量对应的所述十字特征朝向为所述文稿方向。
16.根据权利要求15所述的检测装置,其特征在于,还包括:
校正模块,用于当所述文稿中所述十字特征朝向不是预定朝向时,对所述文稿进行校正直至所述文稿的所述十字特征朝向为所述预定朝向,所述预定朝向为以下的其中一种:向左、向右、向上、向下。
CN200910088352A 2009-06-26 2009-06-26 一种文稿方向的检测方法和装置 Active CN101931731B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN200910088352A CN101931731B (zh) 2009-06-26 2009-06-26 一种文稿方向的检测方法和装置
JP2010101989A JP5271956B2 (ja) 2009-06-26 2010-04-27 原稿方向の検出方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910088352A CN101931731B (zh) 2009-06-26 2009-06-26 一种文稿方向的检测方法和装置

Publications (2)

Publication Number Publication Date
CN101931731A CN101931731A (zh) 2010-12-29
CN101931731B true CN101931731B (zh) 2012-09-26

Family

ID=43370640

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910088352A Active CN101931731B (zh) 2009-06-26 2009-06-26 一种文稿方向的检测方法和装置

Country Status (2)

Country Link
JP (1) JP5271956B2 (zh)
CN (1) CN101931731B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577026B (zh) * 2013-11-15 2016-05-18 浪潮(北京)电子信息产业有限公司 一种检查单板上文字方向的方法
CN107798355B (zh) * 2017-11-17 2021-12-07 山西同方知网数字出版技术有限公司 一种基于文档图像版式自动分析与判断的方法
CN108509960B (zh) * 2018-04-20 2022-04-22 科大讯飞股份有限公司 一种文本朝向检测方法及装置
CN113673519B (zh) * 2021-08-24 2023-06-20 平安科技(深圳)有限公司 基于文字检测模型的文字识别方法及其相关设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0432723A2 (en) * 1989-12-12 1991-06-19 Sharp Kabushiki Kaisha Facsimile device enabling highly efficient data transmission
CN1174344A (zh) * 1996-02-19 1998-02-25 株式会社东芝 图像处理装置
CN1542656A (zh) * 2003-04-30 2004-11-03 ������������ʽ���� 信息处理装置、信息处理方法、存储介质及程序
CN1684494A (zh) * 2004-04-15 2005-10-19 富士施乐株式会社 图像形成装置、图像形成方法及其程序以及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04195485A (ja) * 1990-11-28 1992-07-15 Hitachi Ltd 画像情報入力装置
JP3587009B2 (ja) * 1997-02-07 2004-11-10 ミノルタ株式会社 画像入力装置
JP2001312697A (ja) * 2000-05-01 2001-11-09 Canon Inc 画像方向判別方法及び装置
US8340430B2 (en) * 2007-07-10 2012-12-25 Sharp Laboratories Of America, Inc. Methods and systems for identifying digital image characteristics

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0432723A2 (en) * 1989-12-12 1991-06-19 Sharp Kabushiki Kaisha Facsimile device enabling highly efficient data transmission
CN1174344A (zh) * 1996-02-19 1998-02-25 株式会社东芝 图像处理装置
CN1542656A (zh) * 2003-04-30 2004-11-03 ������������ʽ���� 信息处理装置、信息处理方法、存储介质及程序
CN1684494A (zh) * 2004-04-15 2005-10-19 富士施乐株式会社 图像形成装置、图像形成方法及其程序以及存储介质

Also Published As

Publication number Publication date
JP2011008770A (ja) 2011-01-13
JP5271956B2 (ja) 2013-08-21
CN101931731A (zh) 2010-12-29

Similar Documents

Publication Publication Date Title
JP5972468B2 (ja) 画像からのラベルの検出
Shi et al. Line separation for complex document images using fuzzy runlength
US20190188528A1 (en) Text detection method and apparatus, and storage medium
US7170647B2 (en) Document processing apparatus and method
CN109685055B (zh) 一种图像中文本区域的检测方法及装置
CN102982330B (zh) 文字图像中字符识别方法和识别装置
WO2019085971A1 (zh) 图像中定位文本的方法、装置、电子设备和存储介质
WO2017140233A1 (zh) 文字检测方法及***、设备、存储介质
JP4646797B2 (ja) 画像処理装置及びその制御方法、プログラム
US8428356B2 (en) Image processing device and image processing method for generating electronic document with a table line determination portion
KR100383372B1 (ko) 패턴 추출 장치, 패턴 추출 방법, 및 기억 매체
CN101931731B (zh) 一种文稿方向的检测方法和装置
CN104978576B (zh) 一种文字识别方法及装置
CN103577817A (zh) 表单识别方法与装置
CN104298982A (zh) 一种文字识别方法及装置
US8605986B2 (en) Burr detecting apparatus and burr detection method thereof
CN110598566A (zh) 图像处理方法、装置、终端和计算机可读存储介质
CN108830133A (zh) 合同影像图片的识别方法、电子装置及可读存储介质
CN101833546A (zh) 从可移植电子文档中提取表格的方法和装置
CN115761773A (zh) 基于深度学习的图像内表格识别方法及***
CN104021385B (zh) 基于模板匹配及曲线拟合的视频字幕细化方法
CN105373790B (zh) 版面分析方法和装置
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
CN102096906A (zh) 用于全景二值图像的反白处理方法和装置
Kshetry Image preprocessing and modified adaptive thresholding for improving OCR

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant