CN102890784B - 识别图像块中文字的方向的方法和装置 - Google Patents

识别图像块中文字的方向的方法和装置 Download PDF

Info

Publication number
CN102890784B
CN102890784B CN201110209833.5A CN201110209833A CN102890784B CN 102890784 B CN102890784 B CN 102890784B CN 201110209833 A CN201110209833 A CN 201110209833A CN 102890784 B CN102890784 B CN 102890784B
Authority
CN
China
Prior art keywords
subimage
correctness
block
tolerance
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201110209833.5A
Other languages
English (en)
Other versions
CN102890784A (zh
Inventor
孙俊
直井聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to CN201110209833.5A priority Critical patent/CN102890784B/zh
Priority to US13/525,736 priority patent/US8787674B2/en
Priority to JP2012150259A priority patent/JP5910365B2/ja
Priority to KR1020120073938A priority patent/KR101345925B1/ko
Priority to EP12176593.7A priority patent/EP2549407B1/en
Publication of CN102890784A publication Critical patent/CN102890784A/zh
Application granted granted Critical
Publication of CN102890784B publication Critical patent/CN102890784B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1463Orientation detection or correction, e.g. rotation of multiples of 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/88Image or video recognition using optical means, e.g. reference filters, holographic masks, frequency domain filters or spatial domain filters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

本发明公开了一种识别图像块中文字的方向的方法和装置。所述方法包括:分别以不同的方向作为假设文字方向对图像块进行光学字符识别处理,以得到各个假设文字方向上的子图像块、子图像块对应的识别字符及其正确性度量;搜索最小匹配对;最小匹配对是在互相为180°关系的假设文字方向上位置对应、大小相同、包含最小个数的子图像块的两个子图像块集合;当最小匹配对中仅包含两个子图像块,且这两个子图像块对应的识别字符是同一旋转不变字符或属于同一旋转不变字符对时,将两个子图像块对应的正确性度量调整为同一数值;基于调整后的子图像块计算各个假设文字方向上的累积正确性度量;以及根据累积正确性度量识别图像块中文字的方向。

Description

识别图像块中文字的方向的方法和装置
技术领域
本发明一般地涉及文档图像处理。具体而言,本发明涉及一种识别图像块中文字的方向的方法和装置。
背景技术
当用户使用扫描仪等设备对一叠文档进行扫描时,理想的输入是每个文档的每一页都以正向放置。以正向放置文档时,用户能够轻松阅读该文档,扫描出的文档图像也无需用户调整方向即可阅读。然而,实际使用中,用户要扫描的文档往往是以正向0°、反向180°、横向90°和270°交叠放置。如果用户需要在扫描时对文档的放置方向进行逐页的检查和调整,工作是繁重而耗时的。因此,扫描仪设计有自动文档图像方向判别的功能。基于自动文档图像方向判别功能,扫描得到的文档图像可以被调整为正向,从而减轻了用户的负担,提高了用户的使用效率。
传统的文档图像自动判别方法是:找到文档图像中的文本行,在4个可能的方向上分别做光学字符识别OCR(OpticalCharacterRecognition)处理,得到4个可能方向上的识别字符及对应的置信度或识别距离,并计算文本行的平均置信度或平均识别距离。平均置信度最大或平均识别距离最小的方向被判别为文本行的方向。进而根据文本行的方向判断文档图像的方向。文本行的方向是指文本行的正向,文档图像的方向是指文档图像的正向。下文中,文字(的)方向是指文字的正向。
发明内容
在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
如图1所示,输入文本行“TIPAMOUNT”的图像块,设该方向为0°方向,将该文本行图像块旋转180°得到180°方向的文本行图像块。由于90°和270°方向与0°和180°方向的处理类似,因此这里仅以0°和180°为例进行说明。分别对0°和180°上的文本行图像块进行OCR处理,得到如图1中所示的两个方向上的子图像块、子图像块对应的识别字符及其置信度。
采用传统的方法,0°方向上识别字符的平均置信度=(0.59+0.36+0.53+0.61+0.61+0.61+0.53+0.72)/8=0.57,180°方向上识别字符的平均置信度=(0.62+0.58+0.65+0.67+0.60+0.46+0.50+0.58)/8=0.5825。由于0.57小于0.5825,传统的方法会将180°方向(即平均置信度高的方向)错误地判断为文本行图像块中文字的方向。
产生上述错误的原因之一是180°图像是从0°图像旋转得到的,识别字符当中存在很多旋转不变字符或者旋转不变字符对,比如N、O、p-d、U-n。如果同一个图像在正反两个方向识别的结果是同一旋转不变字符或者属于同一旋转不变字符对,实际上对应的识别置信度应该是一致的,因为正反两个方向的识别结果都是同一形状的正确的识别结果。在传统的利用平均识别置信度来判断文本行方向的方法中,由于没有考虑到旋转不变的特性,造成了一定的性能下降。
旋转不变字符包括具有180°自旋转对称性的字符,即所述旋转不变字符旋转180°后是其本身,例如,“I”,“O”,“Z”,“N”,“$”,“%”,等等。
旋转不变字符对包括两个字符,且所述两个字符中的任意一个旋转180°后与另一个字符一致或具有形状上的高相似度,例如,“W-M”,“U-n”,“P-d”,等等。
本发明的目的是针对上述问题,提出了一种能够正确识别图像块中文字的方向的方法和装置。该方案通过考虑旋转不变特性并据此对识别字符对应的正确性度量(置信度或识别距离)进行调整,能够提高自动文档图像方向判别的正确率。
为了实现上述目的,根据本发明的一个方面,提供了一种识别图像块中文字的方向的方法,包括:分别以不同的方向作为假设文字方向对所述图像块进行光学字符识别处理,以得到在各个所述假设文字方向上的子图像块、子图像块对应的识别字符及其正确性度量;在互相为180°关系的假设文字方向上的子图像块中,搜索子图像块的最小匹配对;所述最小匹配对是在互相为180°关系的假设文字方向上位置对应、大小相同、包含最小个数的子图像块的两个子图像块集合;当最小匹配对中的两个假设文字方向上各有一个子图像块,且属于该最小匹配对的两个子图像块对应的识别字符是同一旋转不变字符或属于同一旋转不变字符对时,将所述两个子图像块对应的正确性度量调整为同一数值;基于调整后的子图像块计算各个所述假设文字方向上的累积正确性度量;以及根据所述累积正确性度量识别图像块中文字的方向。
根据本发明的一个具体实施例,所述旋转不变字符包括具有180°自旋转对称性的字符,即所述旋转不变字符旋转180°后是其本身;以及所述旋转不变字符对包括两个字符,且所述两个字符中的任意一个旋转180°后与另一个字符一致或具有形状上的高相似度。
根据本发明的一个具体实施例,所述将所述两个子图像块对应的正确性度量调整为同一数值包括将所述两个子图像块对应的正确性度量调整为两个子图像块对应的正确性度量的平均值。
根据本发明的一个具体实施例,所述将所述两个子图像块对应的正确性度量调整为同一数值包括将所述两个子图像块对应的正确性度量调整为两个子图像块对应的正确性度量之一。
根据本发明的一个具体实施例,所述正确性度量包括置信度和识别距离;以及所述不同方向包括所述图像块的横向上的两个方向和纵向上的两个方向。
根据本发明的一个具体实施例,所述基于调整后的子图像块计算各个所述假设文字方向上的累积正确性度量包括:将各个所述假设文字方向上的调整后的子图像块的正确性度量之和除以相应假设文字方向上的最小匹配对数的结果作为相应假设文字方向上的累积正确性度量。
根据本发明的另一个方面,提供了一种识别图像块中文字的方向的装置,包括:光学字符识别处理单元,配置为分别以不同的方向作为假设文字方向对所述图像块进行光学字符识别处理,以得到在各个所述假设文字方向上的子图像块、子图像块对应的识别字符及其正确性度量;最小匹配对搜索单元,配置为在互相为180°关系的假设文字方向上的子图像块中,搜索子图像块的最小匹配对;所述最小匹配对是在互相为180°关系的假设文字方向上位置对应、大小相同、包含最小个数的子图像块的两个子图像块集合;子图像块调整单元,配置为当最小匹配对中的两个假设文字方向上各有一个子图像块,且属于该最小匹配对的两个子图像块对应的识别字符是同一旋转不变字符或属于同一旋转不变字符对时,将所述两个子图像块对应的正确性度量调整为同一数值;累积正确性度量计算单元,配置为基于调整后的子图像块计算各个所述假设文字方向上的累积正确性度量;以及文字方向识别单元,配置为根据所述累积正确性度量识别图像块中文字的方向。
根据本发明的一个具体实施例,所述子图像块调整单元配置为当最小匹配对中的两个假设文字方向上各有一个子图像块,且属于该最小匹配对的两个子图像块对应的识别字符是同一旋转不变字符或属于同一旋转不变字符对时,将所述两个子图像块对应的正确性度量调整为两个子图像块对应的正确性度量的平均值。
根据本发明的一个具体实施例,所述子图像块调整单元配置为当最小匹配对中的两个假设文字方向上各有一个子图像块,且属于该最小匹配对的两个子图像块对应的识别字符是同一旋转不变字符或属于同一旋转不变字符对时,将所述两个子图像块对应的正确性度量调整为两个子图像块对应的正确性度量之一。
根据本发明的一个具体实施例,所述累积正确性度量计算单元配置为将各个所述假设文字方向上的调整后的子图像块的正确性度量之和除以相应假设文字方向上的最小匹配对数的结果作为相应假设文字方向上的累积正确性度量。
另外,根据本发明的另一方面,还提供了一种存储介质。所述存储介质包括机器可读的程序代码,当在信息处理设备上执行所述程序代码时,所述程序代码使得所述信息处理设备执行根据本发明的上述方法。
此外,根据本发明的再一方面,还提供了一种程序产品。所述程序产品包括机器可执行的指令,当在信息处理设备上执行所述指令时,所述指令使得所述信息处理设备执行根据本发明的上述方法。
附图说明
参照下面结合附图对本发明实施例的说明,会更加容易地理解本发明的以上和其它目的、特点和优点。附图中的部件只是为了示出本发明的原理。在附图中,相同的或类似的技术特征或部件将采用相同或类似的附图标记来表示。附图中:
图1示出了文本行图像块在OCR处理后所得到的0°和180°方向上的子图像块、识别字符、置信度;
图2示出了文本行图像块在OCR处理后所得到的0°和180°方向上的子图像块、识别字符、识别距离;
图3示出根据本发明的第一实施例的识别图像块中文字的方向的方法的流程图;
图4示出根据本发明的第二实施例的识别图像块中文字的方向的方法的流程图;
图5示出根据本发明的一个实施例的识别图像块中文字的方向的识别装置的结构方框图;以及
图6示出可用于实施根据本发明实施例的方法和装置的计算机的示意性框图。
具体实施方式
在下文中将结合附图对本发明的示范性实施例进行详细描述。为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施例的过程中必须做出很多特定于实施方式的决定,以便实现开发人员的具体目标,例如,符合与***及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的不同而有所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益于本公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。
在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本发明,在附图中仅仅示出了与根据本发明的方案密切相关的装置结构和/或处理步骤,而省略了与本发明关系不大的其他细节。另外,还需要指出的是,在本发明的一个附图或一种实施方式中描述的元素和特征可以与一个或更多个其它附图或实施方式中示出的元素和特征相结合。
下面将参照图3-图4描述根据本发明的实施例的识别图像块中文字的方向的方法的流程。
在本文中进行如下假设,已经从文档图像中找到文本行,并从文档图像中分割出包含文本行的图像块。本发明的重点并不在于如何从文档图像中搜索文本行的位置,而关注如何正确识别包含文本行的图像块中文字的正确方向。
一般而言,主要考虑四个主要方向作为假设文字方向。即图像块本身的方向(0°方向)、将图像块旋转180°的方向、将图像块旋转90°的方向、将图像块旋转270°的方向,也可称为图像块的横向上的两个方向和纵向上的两个方向。90°和270°方向主要应用于汉语、日语等可能竖写文字的情形。由于0°和180°方向与90°和270°方向的情况类似,因此,在下文中以0°和180°方向为例进行说明。
下面将参照图3描述根据本发明的第一实施例的识别图像块中文字的方向的方法的流程。
首先,以0°和180°作为假设文字方向对图像块进行OCR处理,以得到0°和180°方向上的子图像块、子图像块对应的识别字符及其置信度(步骤S301)。图1示出了0°和180°方向上的子图像块、识别字符、置信度的示例,并对子图像块设置了序号。OCR识别结果一般包括分割出的子图像块、子图像块对应的识别字符、识别字符的正确性度量。正确性度量反映了识别字符的可靠程度,通常为置信度或识别距离。置信度越大,识别字符正确的可能性越大;识别距离越小,识别字符正确的可能性越大。在第一实施例中,将以识别结果中包括置信度为例进行说明。在第二实施例中将对识别结果中包括识别距离的情况进行说明。
接着,在0°和180°方向上的子图像块中,搜索子图像块的最小匹配对(步骤S302)。所述最小匹配对是在互相为180°关系的假设文字方向上位置对应、大小相同、包含最小个数的子图像块的两个子图像块集合。最小匹配对包括两个子图像块集合,这两个子图像块集合中包括的子图像块分别位于互相为180°关系的两个假设文字方向上,并且两个子图像块集合的位置对应,大小相同,即两个子图像块集合中的任一子图像块集合在随着其所在的文本行旋转180°后,会与同属于一个最小匹配对中的另一个子图像块集合重合。当这两个子图像块集合中包含的子图像块个数最小时,称这两个子图像块集合构成了最小匹配对。例如,在图1中,P1与N8构成最小匹配对。类似地,P2与N7、P3与N6、P4与N5、P5与N4、P6与N3、P7与N2、P8与N1分别构成最小匹配对。最小匹配对的搜索方法有很多,例如,可以根据最小匹配对的定义从两个方向的对应侧依次寻找最小匹配对。具体地说,如图1所示,在0°方向的最左侧和180°方向的最右侧,分别找到第一个子图像块P1和N8,判断两个子图像块大小相同,因此将P1和N8确定为一个最小匹配对。然后,继续沿上述两个方向寻找下一个子图像块P2和N7,判断两个图像块大小相同,因此将P2和N7确定为一个最小匹配对。依次类推,直至互相为180°关系的两个假设文字方向上的所有最小匹配对均被找到。
如上所述,出现错误的原因之一在于没有考虑到字符的旋转不变特性,对于是同一旋转不变字符或属于同一旋转不变字符对的两个方向上的识别结果给出了不同的置信度。通过上述步骤S302中找到的最小匹配对,可以认定为将文本行的图像块进一步细分的结果。
因此,在步骤S303中,判断是否最小匹配对中的两个假设文字方向上各有一个子图像块,且属于该最小匹配对的两个子图像块对应的识别字符是同一旋转不变字符或属于同一旋转不变字符对。可以预先定义好旋转不变性字符字典,其中记录有已知的旋转不变字符及旋转不变字符对。通过利用该字典,可以进行步骤S303中的判断。如果步骤S303判断结果为否,则无需调整,直接进行到步骤S305进行后续处理。如果步骤S303判断为是,则进入步骤S304,对最小匹配对中的子图像块对应的置信度进行调整。
调整最小匹配对中的子图像块对应的置信度主要是考虑到了旋转不变字符和旋转不变字符对的旋转不变特性。具体地,在步骤S304中,将最小匹配对中的两个子图像块对应的置信度调整为同一数值。同一数值的取值有多种选择。在此,给出几种示例性的实施方式。
方式一:最小匹配对中的两个子图像块对应的置信度调整为两个子图像块对应的置信度的平均值。
如图1所示,旋转不变字符或者旋转不变字符对包括:P1-N8、P2-N7、P5-N4、P7-N2。因此,可将P1、N8的置信度调整为(0.59+0.58)/2=0.585,将P2、N7的置信度调整为(0.36+0.50)/2=0.43,将P5、N4的置信度调整为(0.61+0.67)/2=0.64,将P7、N2的置信度调整为(0.53+0.58)/2=0.555。
方式二:将最小匹配对中的两个子图像块对应的置信度调整为两个子图像块对应的置信度之一。
例如,可将P1、N8的置信度调整为0.59,将P2、N7的置信度调整为0.36,将P5、N4的置信度调整为0.61,将P7、N2的置信度调整为0.53。
在步骤S304中调整了其两个假设文字方向上各有一个子图像块,且这两个子图像块对应的识别字符是同一旋转不变字符或属于同一旋转不变字符对的最小匹配对中的两个子图像块对应的置信度,获得了经调整的置信度,处理进行到步骤S305,基于调整后的置信度计算各个假设方向上的累积置信度,并根据累积置信度识别文本行图像块中文字的方向。
累积置信度是用来表征一个方向上文本行图像块的识别结果整体的正确性度量。通常有两种具体方式计算累积置信度。可以将一个假设文字方向上的所有子图像块对应的置信度之和作为该方向上的累积置信度。也可以将一个假设文字方向上的所有子图像块对应的置信度的算术平均值作为该方向上的累积置信度。累积置信度更高的方向更有可能是正确的识别结果。
在上述步骤S304中,方式一和方式二的目的都是通过调整最小匹配对中的置信度来针对具有旋转不变特性的识别字符给出更合理的置信度,调整的结果都是最小匹配对整体的置信度更为合理。在步骤S305中,累积置信度的计算方法有多种,作为示例,可计算一个假设文字方向上的所有置信度的总和作为累积置信度,也可计算一个假设文字方向上的平均置信度作为累积置信度。计算平均置信度时,优选地,取一个假设文字方向上的最小匹配对数作为分母,取一个假设文字方向上的所有置信度的总和作为分子。此时的物理意义是将最小匹配对中的子图像块集合作为文本行图像块分割得到的结果的基本单位,调整了最小匹配对中两个子图像块集合对外整体的置信度,不难理解,此时宜取最小匹配对数作为计算平均置信度时的分母。当然,也可取一个假设文字方向上的所有置信度的总和作为分子,并取一个假设文字方向上的子图像块个数作为分母来计算平均置信度。在这种情况下,如果各个假设文字方向上的子图像块个数不同,优选地,在计算各个假设文字方向上的平均置信度时,取同一个假设文字方向上的子图像块个数作为相同的分母。
显然,各个假设文字方向中,累积置信度最高的假设文字方向应被判定为正确的识别结果所在的方向。
以取一个假设文字方向上的所有置信度的平均置信度作为累积置信度为例,采用上述步骤S304的方式一和方式二,计算的累积置信度分别为:
方式一:
0°方向累积置信度=(0.585+0.43+0.53+0.61+0.64+0.61+0.555+0.72)/8=0.585
180°方向累积置信度=(0.62+0.555+0.65+0.64+0.60+0.46+0.43+0.585)/8=0.5675
方式二:
0°方向累积置信度=(0.59+0.36+0.53+0.61+0.61+0.61+0.53+0.72)/8=0.57
180°方向累积置信度=(0.62+0.53+0.65+0.61+0.60+0.46+0.36+0.59)/8=0.5525。
可见,采用上述两种方式调整置信度后,均为0°方向累积置信度大于180°方向累积置信度。可见,给出了更为准确的判断结果。
下面将参照图4描述根据本发明的第二实施例的识别图像块中文字的方向的方法的流程。
如上所述,OCR识别结果一般包括分割出的子图像块、子图像块对应的识别字符、识别字符的正确性度量。正确性度量反映了识别字符的可靠程度,通常为置信度或识别距离。以上在第一实施例中,以识别结果中包括置信度为例进行说明。在第二实施例中将对识别结果中包括识别距离的情况进行说明。图2给出了示出了0°和180°方向上的子图像块、识别字符、识别距离的示例,并对子图像块设置了序号。
在图2中,采用传统的方法,0°方向上识别字符的平均识别距离=(828+1279+934+774+778+789+940+595)/8=864.625,180°方向上识别字符的平均识别距离=(759+840+704+669+802+1087+1005+790)/8=832。由于832小于864.625,传统的方法会将180°方向(即平均识别距离小的方向)错误地判断为文本行图像块中文字的方向。造成这个错误的原因在于没有考虑到字符的旋转不变特性,对于是同一旋转不变字符或属于同一旋转不变字符对的两个方向上的识别结果给出了不同的置信度。
由于产生问题的原因在于没有考虑到字符的旋转不变特性,而本发明所采用的方法是将旋转不变字符或旋转不变字符对的正确性度量调整为同一数值,因此,上述在第一实施例中所描述的思想同样适用于识别结果中包括识别距离而非置信度的情形。
下面将参照图4描述根据本发明的第二实施例的识别图像块中文字的方向的方法的流程。第二实施例的方法与第一实施例的方法类似。
首先,以0°和180°作为假设文字方向对图像块进行OCR处理,以得到0°和180°方向上的子图像块、子图像块对应的识别字符及其识别距离(步骤S401)。
接着,在0°和180°方向上的子图像块中,搜索子图像块的最小匹配对(步骤S402)。例如,在图1中,在图1中,P1与N8构成最小匹配对。类似地,P2与N7、P3与N6、P4与N5、P5与N4、P6与N3、P7与N2、P8与N1分别构成最小匹配对。
在步骤S403中,判断是否最小匹配对中的两个假设文字方向上各有一个子图像块,且属于该最小匹配对的两个子图像块对应的识别字符是同一旋转不变字符或属于同一旋转不变字符对。可以预先定义好旋转不变性字符字典,其中记录有已知的旋转不变字符及旋转不变字符对。通过利用该字典,可以进行步骤S403中的判断。如果判断结果为否,则无需调整,直接进行到步骤S405进行后续处理。如果判断为是,则进入步骤S404,对最小匹配对中的子图像块对应的识别距离进行调整。
调整最小匹配对中的子图像块对应的识别距离是主要是考虑到了旋转不变字符和旋转不变字符对的旋转不变特性。具体地,将最小匹配对中的两个子图像块对应的识别距离调整为同一数值。同一数值的取值有多种选择。在此,给出几种示例性的实施方式。
方式一:将最小匹配对中的两个子图像块对应的识别距离调整为两个子图像块对应的识别距离的平均值。
如图1所示,旋转不变字符或者旋转不变字符对包括:P1-N8、P2-N7、P5-N4、P7-N2。因此,可将P1、N8的识别距离调整为(828+790)/2=809,将P2、N7的识别距离调整为(1279+1005)/2=1142,将P5、N4的识别距离调整为(778+669)/2=723.5,将P7、N2的识别距离调整为(940+840)/2=890。
方式二:将最小匹配对中的两个子图像块对应的识别距离调整为两个子图像块对应的识别距离之一。
例如,可将P1、N8的识别距离调整为828,将P2、N7的识别距离调整为1279,将P5、N4的识别距离调整为778,将P7、N2的识别距离调整为940。
在步骤S404中调整了其两个假设文字方向上各有一个子图像块,且这两个子图像块对应的识别字符是同一旋转不变字符或属于同一旋转不变字符对的最小匹配对中的两个子图像块对应的识别距离,获得了经调整的识别距离,处理进行到步骤S405,基于调整后的识别距离计算各个假设方向上的累积识别距离,并根据累积识别距离识别文本行图像块中文字的方向。
累积识别距离是用来表征一个方向上文本行图像块的识别结果整体的正确性度量。通常有两种具体方式计算累积识别距离。可以将一个假设文字方向上的所有子图像块对应的识别距离之和作为该方向上的累积识别距离。也可以将一个假设文字方向上的所有子图像块对应的识别距离的算术平均值作为该方向上的累积识别距离。累积识别距离更小的方向更有可能是正确的识别结果。
在上述步骤S404中,方式一和方式二的目的都是通过调整最小匹配对中的识别距离来针对具有旋转不变特性的识别字符给出更合理的识别距离,调整的结果都是最小匹配对整体的识别距离更为合理。在步骤S405中,累积识别距离的计算方法有多种,作为示例,可计算一个假设文字方向上的所有识别距离的总和作为累积识别距离,也可计算一个假设文字方向上的平均识别距离作为累积识别距离。计算平均识别距离时,优选地,取一个假设文字方向上的最小匹配对数作为分母,取一个假设文字方向上的所有识别距离的总和作为分子。此时的物理意义是将最小匹配对中的子图像块集合作为文本行图像块分割得到的结果的基本单位,调整了最小匹配对中两个子图像块集合对外整体的识别距离,不难理解,此时宜取最小匹配对数作为计算平均识别距离时的分母。
显然,各个假设文字方向中,累积识别距离最小的假设文字方向应被判定为正确的识别结果所在的方向。
以取一个假设文字方向上的平均识别距离作为累积识别距离为例,采用上述步骤S404的方式一和方式二,计算的累积识别距离分别为:
方式一:
0°方向累积识别距离=(809+1142+934+774+723.5+789+890+595)/8=832.0625
180°方向累积识别距离=(759+890+704+723.5+802+1087+1142+809)/8=864.5625
方式二:
0°方向累积识别距离=(828+1279+934+774+778+789+940+595)/8=864.625
180°方向累积识别距离=(759+940+704+778+802+1087+1279+828)/8=897.125。
可见,采用上述两种方式调整识别距离后,均为0°方向累积识别距离小于180°方向累积识别距离。可见,给出了更为准确的判断结果。
下面将结合图5描述根据本发明的一个实施例的识别图像块中文字的方向的识别装置的结构。如图5所示,根据该实施例的识别图像块中文字的方向的识别装置500包括:光学字符识别处理单元501,配置为分别以不同的方向作为假设文字方向对所述图像块进行光学字符识别处理,以得到在各个所述假设文字方向上的子图像块、子图像块对应的识别字符及其正确性度量;最小匹配对搜索单元502,配置为在互相为180°关系的假设文字方向上的子图像块中,搜索子图像块的最小匹配对;所述最小匹配对是在互相为180°关系的假设文字方向上位置对应、大小相同、包含最小个数的子图像块的两个子图像块集合;子图像块调整单元503,配置为当最小匹配对中的两个假设文字方向上各有一个子图像块,且属于该最小匹配对的两个子图像块对应的识别字符是同一旋转不变字符或属于同一旋转不变字符对时,将所述两个子图像块对应的正确性度量调整为同一数值;累积正确性度量计算单元504,配置为基于调整后的子图像块计算各个所述假设文字方向上的累积正确性度量;以及文字方向识别单元505,配置为根据所述累积正确性度量识别图像块中文字的方向。
由于在根据本发明的识别装置500所包括的光学字符识别处理单元501、最小匹配对搜索单元502、子图像块调整单元503、累积正确性度量计算单元504以及文字方向识别单元505中的处理分别与上面描述的识别图像块中文字的方向的方法的步骤S301-S305、S401-S405中的处理类似,因此为了简洁起见,在此省略这些单元中的详细描述。
此外,这里尚需指出的是,上述装置中各个组成模块、单元可以通过软件、固件、硬件或其组合的方式进行配置。配置可使用的具体手段或方式为本领域技术人员所熟知,在此不再赘述。在通过软件或固件实现的情况下,从存储介质或网络向具有专用硬件结构的计算机(例如图6所示的通用计算机600)安装构成该软件的程序,该计算机在安装有各种程序时,能够执行各种功能等。
在图6中,中央处理单元(CPU)601根据只读存储器(ROM)602中存储的程序或从存储部分608加载到随机存取存储器(RAM)603的程序执行各种处理。在RAM603中,还根据需要存储当CPU601执行各种处理等等时所需的数据。CPU601、ROM602和RAM603经由总线604彼此连接。输入/输出接口605也连接到总线604。
下述部件连接到输入/输出接口605:输入部分606(包括键盘、鼠标等等)、输出部分607(包括显示器,比如阴极射线管(CRT)、液晶显示器(LCD)等,和扬声器等)、存储部分608(包括硬盘等)、通信部分609(包括网络接口卡比如LAN卡、调制解调器等)。通信部分609经由网络比如因特网执行通信处理。根据需要,驱动器610也可连接到输入/输出接口605。可拆卸介质611比如磁盘、光盘、磁光盘、半导体存储器等等可以根据需要被安装在驱动器610上,使得从中读出的计算机程序根据需要被安装到存储部分608中。
在通过软件实现上述系列处理的情况下,从网络比如因特网或存储介质比如可拆卸介质611安装构成软件的程序。
本领域的技术人员应当理解,这种存储介质不局限于图6所示的其中存储有程序、与设备相分离地分发以向用户提供程序的可拆卸介质611。可拆卸介质611的例子包含磁盘(包含软盘(注册商标))、光盘(包含光盘只读存储器(CD-ROM)和数字通用盘(DVD))、磁光盘(包含迷你盘(MD)(注册商标))和半导体存储器。或者,存储介质可以是ROM602、存储部分608中包含的硬盘等等,其中存有程序,并且与包含它们的设备一起被分发给用户。
本发明还提出一种存储有机器可读取的指令代码的程序产品。所述指令代码由机器读取并执行时,可执行上述根据本发明实施例的方法。
相应地,用于承载上述存储有机器可读取的指令代码的程序产品的存储介质也包括在本发明的公开中。所述存储介质包括但不限于软盘、光盘、磁光盘、存储卡、存储棒等等。
本发明实施例中公开的识别图像块中文字的方向的识别装置,识别图像块中文字的方向的识别方法,以及相应的程序产品可以用于扫描仪等图像扫描装置,用于识别所扫描的文件中文字的方向。
在上面对本发明具体实施例的描述中,针对一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其它实施方式中使用,与其它实施方式中的特征相组合,或替代其它实施方式中的特征。
应该强调,术语“包括/包含”在本文使用时指特征、要素、步骤或组件的存在,但并不排除一个或更多个其它特征、要素、步骤或组件的存在或附加。
此外,本发明的方法不限于按照说明书中描述的时间顺序来执行,也可以按照其他的时间顺序地、并行地或独立地执行。因此,本说明书中描述的方法的执行顺序不对本发明的技术范围构成限制。
根据以上多个实施例,本发明还包括以下附记:
附记1.一种识别图像块中文字的方向的方法,包括:
分别以不同的方向作为假设文字方向对所述图像块进行光学字符识别处理,以得到在各个所述假设文字方向上的子图像块、子图像块对应的识别字符及其正确性度量;
在互相为180°关系的假设文字方向上的子图像块中,搜索子图像块的最小匹配对;所述最小匹配对是在互相为180°关系的假设文字方向上位置对应、大小相同、包含最小个数的子图像块的两个子图像块集合;
当最小匹配对中的两个假设文字方向上各有一个子图像块,且属于该最小匹配对的两个子图像块对应的识别字符是同一旋转不变字符或属于同一旋转不变字符对时,将所述两个子图像块对应的正确性度量调整为同一数值;
基于调整后的子图像块计算各个所述假设文字方向上的累积正确性度量;以及
根据所述累积正确性度量识别图像块中文字的方向。
附记2.根据附记1所述的方法,其中
所述旋转不变字符包括具有180°自旋转对称性的字符,即所述旋转不变字符旋转180°后是其本身;以及
所述旋转不变字符对包括两个字符,且所述两个字符中的任意一个旋转180°后与另一个字符一致或具有形状上的高相似度。
附记3.根据附记1所述的方法,其中所述将所述两个子图像块对应的正确性度量调整为同一数值包括将所述两个子图像块对应的正确性度量调整为两个子图像块对应的正确性度量的平均值。
附记4.根据附记1所述的方法,其中所述将所述两个子图像块对应的正确性度量调整为同一数值包括将所述两个子图像块对应的正确性度量调整为两个子图像块对应的正确性度量之一。
附记5.根据附记1-4之一所述的方法,其中
所述正确性度量包括置信度和识别距离;以及
所述不同方向包括所述图像块的横向上的两个方向和纵向上的两个方向。
附记6.根据附记1-4之一所述的方法,其中所述基于调整后的子图像块计算各个所述假设文字方向上的累积正确性度量包括:将各个所述假设文字方向上的调整后的子图像块的正确性度量之和除以相应假设文字方向上的最小匹配对数的结果作为相应假设文字方向上的累积正确性度量。
附记7.一种识别图像块中文字的方向的装置,包括:
光学字符识别处理单元,配置为分别以不同的方向作为假设文字方向对所述图像块进行光学字符识别处理,以得到在各个所述假设文字方向上的子图像块、子图像块对应的识别字符及其正确性度量;
最小匹配对搜索单元,配置为在互相为180°关系的假设文字方向上的子图像块中,搜索子图像块的最小匹配对;所述最小匹配对是在互相为180°关系的假设文字方向上位置对应、大小相同、包含最小个数的子图像块的两个子图像块集合;
子图像块调整单元,配置为当最小匹配对中的两个假设文字方向上各有一个子图像块,且属于该最小匹配对的两个子图像块对应的识别字符是同一旋转不变字符或属于同一旋转不变字符对时,将所述两个子图像块对应的正确性度量调整为同一数值;
累积正确性度量计算单元,配置为基于调整后的子图像块计算各个所述假设文字方向上的累积正确性度量;以及
文字方向识别单元,配置为根据所述累积正确性度量识别图像块中文字的方向。
附记8.如附记7所述的装置,其中所述子图像块调整单元配置为当最小匹配对中的两个假设文字方向上各有一个子图像块,且属于该最小匹配对的两个子图像块对应的识别字符是同一旋转不变字符或属于同一旋转不变字符对时,将所述两个子图像块对应的正确性度量调整为两个子图像块对应的正确性度量的平均值。
附记9.如附记7所述的装置,其中所述子图像块调整单元配置为当最小匹配对中的两个假设文字方向上各有一个子图像块,且属于该最小匹配对的两个子图像块对应的识别字符是同一旋转不变字符或属于同一旋转不变字符对时,将所述两个子图像块对应的正确性度量调整为两个子图像块对应的正确性度量之一。
附记10.如附记7所述的装置,其中所述累积正确性度量计算单元配置为将各个所述假设文字方向上的调整后的子图像块的正确性度量之和除以相应假设文字方向上的最小匹配对数的结果作为相应假设文字方向上的累积正确性度量。
附记11.一种扫描仪,所述扫描仪包括附记7-10之一所述的识别图像块中文字的方向的装置。
尽管上面已经通过对本发明的具体实施例的描述对本发明进行了披露,但是,应该理解,上述的所有实施例和示例均是示例性的,而非限制性的。本领域的技术人员可在所附权利要求的精神和范围内设计对本发明的各种修改、改进或者等同物。这些修改、改进或者等同物也应当被认为包括在本发明的保护范围内。

Claims (10)

1.一种识别图像块中文字的方向的方法,包括:
分别以不同的方向作为假设文字方向对所述图像块进行光学字符识别处理,以得到在各个所述假设文字方向上的子图像块、子图像块对应的识别字符及其正确性度量;
在互相为180°关系的假设文字方向上的子图像块中,搜索子图像块的最小匹配对;所述最小匹配对是在互相为180°关系的假设文字方向上的相邻子图像块构成的两个子图像块集合,其中所述最小匹配对中的任一子图像块集合在随着所述图像块整体旋转180°后,会与另一个子图像块集合重合,且满足上述条件时这两个子图像块集合中包含的子图像块个数最小;
当最小匹配对中的两个假设文字方向上各有一个子图像块,且属于该最小匹配对的两个子图像块对应的识别字符是同一旋转不变字符或属于同一旋转不变字符对时,将所述两个子图像块对应的正确性度量调整为同一数值;
基于调整后的子图像块计算各个所述假设文字方向上的累积正确性度量;以及
根据所述累积正确性度量识别图像块中文字的方向。
2.根据权利要求1所述的方法,其中
所述旋转不变字符包括具有180°自旋转对称性的字符,即所述旋转不变字符旋转180°后是其本身;以及
所述旋转不变字符对包括两个字符,且所述两个字符中的任意一个旋转180°后与另一个字符一致或具有形状上的高相似度。
3.根据权利要求1所述的方法,其中所述将所述两个子图像块对应的正确性度量调整为同一数值包括将所述两个子图像块对应的正确性度量调整为两个子图像块对应的正确性度量的平均值。
4.根据权利要求1所述的方法,其中所述将所述两个子图像块对应的正确性度量调整为同一数值包括将所述两个子图像块对应的正确性度量调整为两个子图像块对应的正确性度量之一。
5.根据权利要求1所述的方法,其中所述基于调整后的子图像块计算各个所述假设文字方向上的累积正确性度量包括:将各个所述假设文字方向上的调整后的子图像块的正确性度量之和除以相应假设文字方向上的最小匹配对数的结果作为相应假设文字方向上的累积正确性度量。
6.一种识别图像块中文字的方向的装置,包括:
光学字符识别处理单元,配置为分别以不同的方向作为假设文字方向对所述图像块进行光学字符识别处理,以得到在各个所述假设文字方向上的子图像块、子图像块对应的识别字符及其正确性度量;
最小匹配对搜索单元,配置为在互相为180°关系的假设文字方向上的子图像块中,搜索子图像块的最小匹配对;所述最小匹配对是在互相为180°关系的假设文字方向上的相邻子图像块构成的两个子图像块集合,其中所述最小匹配对中的任一子图像块集合在随着所述图像块整体旋转180°后,会与另一个子图像块集合重合,且满足上述条件时这两个子图像块集合中包含的子图像块个数最小;
子图像块调整单元,配置为当最小匹配对中的两个假设文字方向上各有一个子图像块,且属于该最小匹配对的两个子图像块对应的识别字符是同一旋转不变字符或属于同一旋转不变字符对时,将所述两个子图像块对应的正确性度量调整为同一数值;
累积正确性度量计算单元,配置为基于调整后的子图像块计算各个所述假设文字方向上的累积正确性度量;以及
文字方向识别单元,配置为根据所述累积正确性度量识别图像块中文字的方向。
7.如权利要求6所述的装置,其中所述子图像块调整单元配置为当最小匹配对中的两个假设文字方向上各有一个子图像块,且属于该最小匹配对的两个子图像块对应的识别字符是同一旋转不变字符或属于同一旋转不变字符对时,将所述两个子图像块对应的正确性度量调整为两个子图像块对应的正确性度量的平均值。
8.如权利要求6所述的装置,其中所述子图像块调整单元配置为当最小匹配对中的两个假设文字方向上各有一个子图像块,且属于该最小匹配对的两个子图像块对应的识别字符是同一旋转不变字符或属于同一旋转不变字符对时,将所述两个子图像块对应的正确性度量调整为两个子图像块对应的正确性度量之一。
9.如权利要求6所述的装置,其中所述累积正确性度量计算单元配置为将各个所述假设文字方向上的调整后的子图像块的正确性度量之和除以相应假设文字方向上的最小匹配对数的结果作为相应假设文字方向上的累积正确性度量。
10.一种扫描仪,所述扫描仪包括权利要求6-9之一所述的识别图像块中文字的方向的装置。
CN201110209833.5A 2011-07-20 2011-07-20 识别图像块中文字的方向的方法和装置 Expired - Fee Related CN102890784B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201110209833.5A CN102890784B (zh) 2011-07-20 2011-07-20 识别图像块中文字的方向的方法和装置
US13/525,736 US8787674B2 (en) 2011-07-20 2012-06-18 Method of and device for identifying direction of characters in image block
JP2012150259A JP5910365B2 (ja) 2011-07-20 2012-07-04 画像ブロックにおける文字の方向を認識する方法及び装置
KR1020120073938A KR101345925B1 (ko) 2011-07-20 2012-07-06 이미지 블록에서 문자의 방향을 식별하는 방법 및 장치
EP12176593.7A EP2549407B1 (en) 2011-07-20 2012-07-16 Method of and device for identifying direction of characters in image block

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110209833.5A CN102890784B (zh) 2011-07-20 2011-07-20 识别图像块中文字的方向的方法和装置

Publications (2)

Publication Number Publication Date
CN102890784A CN102890784A (zh) 2013-01-23
CN102890784B true CN102890784B (zh) 2016-03-30

Family

ID=46679100

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110209833.5A Expired - Fee Related CN102890784B (zh) 2011-07-20 2011-07-20 识别图像块中文字的方向的方法和装置

Country Status (5)

Country Link
US (1) US8787674B2 (zh)
EP (1) EP2549407B1 (zh)
JP (1) JP5910365B2 (zh)
KR (1) KR101345925B1 (zh)
CN (1) CN102890784B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106778733A (zh) * 2015-11-25 2017-05-31 中兴通讯股份有限公司 调整图片文字的显示方法及装置
US10210384B2 (en) * 2016-07-25 2019-02-19 Intuit Inc. Optical character recognition (OCR) accuracy by combining results across video frames
CN108345827B (zh) * 2017-01-24 2021-11-30 富士通株式会社 识别文档方向的方法、***和神经网络
CN107220640B (zh) * 2017-05-23 2020-07-17 广州绿怡信息科技有限公司 字符识别方法、装置、计算机设备和计算机可读存储介质
CN114842464A (zh) * 2022-05-13 2022-08-02 北京百度网讯科技有限公司 图像方向识别方法、装置、设备、存储介质及程序产品

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1242560A (zh) * 1998-06-01 2000-01-26 佳能株式会社 图象处理方法、装置及其存储介质
US6993205B1 (en) * 2000-04-12 2006-01-31 International Business Machines Corporation Automatic method of detection of incorrectly oriented text blocks using results from character recognition
CN101833648A (zh) * 2009-03-13 2010-09-15 汉王科技股份有限公司 文本图像的校正方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5031225A (en) * 1987-12-09 1991-07-09 Ricoh Company, Ltd. Character recognition method for recognizing character in an arbitrary rotation position
JPH04195485A (ja) 1990-11-28 1992-07-15 Hitachi Ltd 画像情報入力装置
JP3251959B2 (ja) * 1991-10-17 2002-01-28 株式会社リコー 画像形成装置
JP3727971B2 (ja) * 1995-02-01 2005-12-21 キヤノン株式会社 文書処理装置、及び文書処理方法
JPH08293000A (ja) * 1995-04-21 1996-11-05 Canon Inc 画像処理装置及び方法
JPH09282413A (ja) 1996-04-16 1997-10-31 Canon Inc 文書方向獲得方法とその装置並びに文字認識方法とその装置
JP3728040B2 (ja) * 1996-12-27 2005-12-21 キヤノン株式会社 画像形成装置及び方法
JPH11213089A (ja) * 1998-01-23 1999-08-06 Canon Inc 画像処理装置及びその方法
US6151423A (en) 1998-03-04 2000-11-21 Canon Kabushiki Kaisha Character recognition with document orientation determination
US6804414B1 (en) * 1998-05-01 2004-10-12 Fujitsu Limited Image status detecting apparatus and document image correcting apparatus
JPH11338974A (ja) * 1998-05-28 1999-12-10 Canon Inc 文書処理方法及び装置、記憶媒体
JP2002125114A (ja) 2000-10-13 2002-04-26 Ricoh Co Ltd 画像読取装置
JP2004013704A (ja) * 2002-06-10 2004-01-15 Sumitomo Denko Systems Kk 文字認識処理における原稿方向判別方法
JP2004272798A (ja) * 2003-03-11 2004-09-30 Pfu Ltd 画像読み取り装置
US8200043B2 (en) 2008-05-01 2012-06-12 Xerox Corporation Page orientation detection based on selective character recognition
US8023770B2 (en) * 2008-05-23 2011-09-20 Sharp Laboratories Of America, Inc. Methods and systems for identifying the orientation of a digital image
JP4927122B2 (ja) * 2009-06-15 2012-05-09 シャープ株式会社 画像処理方法、画像処理装置、画像形成装置、プログラムおよび記録媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1242560A (zh) * 1998-06-01 2000-01-26 佳能株式会社 图象处理方法、装置及其存储介质
US6993205B1 (en) * 2000-04-12 2006-01-31 International Business Machines Corporation Automatic method of detection of incorrectly oriented text blocks using results from character recognition
CN101833648A (zh) * 2009-03-13 2010-09-15 汉王科技股份有限公司 文本图像的校正方法

Also Published As

Publication number Publication date
JP5910365B2 (ja) 2016-04-27
US8787674B2 (en) 2014-07-22
CN102890784A (zh) 2013-01-23
KR101345925B1 (ko) 2013-12-27
KR20130011921A (ko) 2013-01-30
JP2013025800A (ja) 2013-02-04
EP2549407A3 (en) 2014-06-04
EP2549407A2 (en) 2013-01-23
EP2549407B1 (en) 2020-06-10
US20130022271A1 (en) 2013-01-24

Similar Documents

Publication Publication Date Title
CN102890783B (zh) 识别图像块中文字的方向的方法和装置
US9201879B2 (en) Method, apparatus and system for generating a feature vector
CN102890784B (zh) 识别图像块中文字的方向的方法和装置
CN103455806B (zh) 文档处理装置、文档处理方法以及扫描仪
EP2172856A2 (en) Image processing apparatus, image processing method and program
EP2211302A1 (en) Feature point arrangement checking device, image checking device, method therefor, and program
US20140368689A1 (en) Image similarity determining device and method, and an image feature acquiring device and method
CN112699775A (zh) 基于深度学习的证件识别方法、装置、设备及存储介质
CN111209827B (zh) 一种基于特征检测的ocr识别票据问题的方法及***
CN105224708A (zh) 集成电路中网路的确定方法和装置
CN102855477B (zh) 识别图像块中文字的方向的方法和装置
US20150055866A1 (en) Optical character recognition by iterative re-segmentation of text images using high-level cues
CN102024138A (zh) 字符识别方法和字符识别装置
CN113158895A (zh) 票据识别方法、装置、电子设备及存储介质
CN115546809A (zh) 基于单元格约束的表格结构识别方法及其应用
CN115359308A (zh) 模型训练、难例识别方法、装置、设备、存储介质及程序
US9798711B2 (en) Method and system for generating a graphical organization of a page
CN111651625A (zh) 图像检索方法、装置、电子设备及存储介质
CN106157250A (zh) 去除文档图像中的印记的方法和设备
US10185885B2 (en) Tex line detection
CN113673214A (zh) 信息清单的对齐方法、装置、存储介质和电子设备
CN114495144A (zh) 文本图像中表格key-value信息的提取方法及装置
CN113254248A (zh) 一种故障诊断方法、***及计算设备
CN104112135A (zh) 文本图像提取装置以及方法
JP2022003446A (ja) 情報処理装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160330

Termination date: 20210720

CF01 Termination of patent right due to non-payment of annual fee