CN103136544A - 图像判断装置 - Google Patents

图像判断装置 Download PDF

Info

Publication number
CN103136544A
CN103136544A CN2011104121139A CN201110412113A CN103136544A CN 103136544 A CN103136544 A CN 103136544A CN 2011104121139 A CN2011104121139 A CN 2011104121139A CN 201110412113 A CN201110412113 A CN 201110412113A CN 103136544 A CN103136544 A CN 103136544A
Authority
CN
China
Prior art keywords
cell
image
ruling
template image
input picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011104121139A
Other languages
English (en)
Inventor
张庆久
乐宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to CN2011104121139A priority Critical patent/CN103136544A/zh
Priority to JP2012249290A priority patent/JP5619111B2/ja
Publication of CN103136544A publication Critical patent/CN103136544A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Processing (AREA)

Abstract

本发明提供一种判断精度高的图像判断装置。在图像提取装置(100)中设置有特征量提取部(11),其从输入图像中提取格线以及单元格;对齐部(13),其基于模板图像中格线的间隔与输入图像中格线的间隔,使模板图像中的单元格以及格线与输入图像中的单元格以及格线对齐;和判断部(14),其计算被对齐部(13)对齐后的输入图像中单元格与模板图像中单元格间的单元格彼此的重叠率,基于算出的重叠率来计算输入图像与模板图像的一致率,当算出的一致率比规定的阈值高时,判断为输入图像与模板图像一致。

Description

图像判断装置
技术领域
本发明涉及判断帐票等包含格线以及单元格的输入图像是否与模板图像一致的图像判断装置。
背景技术
在金融业等的事务处理中,要处理已填写日期、金额等事项的帐票。近些年,为了实现省力化,通过信息处理装置自动地提取在帐票中填写的事项的技术的开发正在进行。另外,作为提取在帐票中填写的事项的前阶段,判断帐票种类的技术的开发也正在进行。
例如,在专利文献1中,记载有将填写完毕的帐票分类为多种帐票原本中的任意一种的帐票识别装置。专利文献1记载的帐票识别装置基于从由扫描仪读取填写完毕的帐票而得到的输入图像中提取出来的格线与从由扫描仪预先读取帐票原本而得到的模板图像中预先提取出来的格线,判断输入图像与模板图像是否一致。更详细地来讲,专利文献1记载的帐票识别装置使基于输入图像中格线提取出来的输入图像中最小矩形的框线与基于模板图像中格线预先提取出来的模板图像中最小矩形的框线1对1地进行对应,算出在对应的最小矩形的框线间的相异度,当相异度小时,判断为输入图像与模板图像一致。
专利文献1:日本特开2004-334913号公报
发明内容
在从模板图像中提取格线时,通常使用者确认格线是否能够被正确地识别,当格线缺失时能够根据需要对格线进行修正。因此,在帐票识别装置中存储的模板图像的格线是完整的,基于格线提取的最小矩形的框线也是完整的。与此相对,由于不对输入图像进行修正等,因此当已填写完毕的帐票中有缺陷,或者扫描仪的性能降低时,格线有可能变得不完整。
当输入图像中的格线不完整时,提取的最小矩形的形状、大小与模板图像差异较大,由此输入图像中最小矩形与模板图像中最小矩形的对应关系会发生变化。那样的话,在专利文献1中记载的帐票识别装置中,就不能正确地算出对应的最小矩形的框线间的相异度,从而不能正确地进行判断。
本发明为解决上述的课题而提出,其目的在于提供判断精度高的图像判断装置。
本发明的图像判断装置的特征在于,具备:特征量提取部,其从输入图像中提取格线以及单元格;对齐部,其基于预先提取且存储的模板图像中格线的间隔与通过所述特征量提取部提取出来的所述输入图像中格线的间隔,使预先提取且存储的模板图像中单元格以及格线与通过所述特征量提取部提取出来的所述输入图像中单元格以及格线对齐;和判断部,其计算被所述对齐部对齐后的所述输入图像中单元格与所述模板图像中单元格间的单元格彼此的重叠率,基于算出的重叠率来计算所述输入图像与所述模板图像的一致率,当算出的一致率比规定的阈值高时,判断为所述输入图像与所述模板图像一致。
另外,本发明的特征在于,所述判断部当从所述输入图像中提取出来的单元格的个数与所述模板图像中的单元格的个数不同时,针对单元格的个数少的一方的图像中的各个单元格,计算该单元格与单元格的个数多的一方的图像中的任意1个单元格的重叠的部分的面积与单元格的个数少的一方的图像中的单元格的总面积的比例作为所述重叠率,剔除算出的重叠率中比规定的界限值低的重叠率,来计算各重叠率的平均值,将算出的平均值作为所述一致率。
另外,本发明的特征在于,所述对齐部计算所述模板图像中格线的间隔与所述输入图像中格线的间隔的多个比率,将算出的多个比率作为多个备选倍率,针对多个备选倍率的每一个备选倍率,计算使所述模板图像中格线的任意1个与所述输入图像中格线的任意1个一致的多个备选平行移动,针对各备选倍率以及各备选平行移动,评价根据所述备选倍率来放大或者缩小所述模板图像或者所述输入图像中的任意一方的格线,并根据所述备选平行移动来平行移动所述模板图像或者所述输入图像中的任意一方的格线后的格线与所述模板图像或者所述输入图像中的任意另一方的格线中的格线的一致度,根据所述一致度最高时的备选倍率以及备选平行移动来放大或者缩小所述模板图像或者所述输入图像中的任意一方的格线以及单元格,通过平行移动来与所述模板图像或者所述输入图像中的任意另一方的格线以及单元格对齐。
另外,本发明的特征在于,具备识别部,当所述输入图像中单元格的数量比规定的基准值少时,该识别部不使所述对齐部进行对齐并且不使所述判断部进行判断,当所述输入图像中单元格的数量比所述规定的基准值多时,该识别部使所述对齐部进行对齐并且使所述判断部进行判断。
根据本发明,在使输入图像中的单元格与模板图像中的单元格对齐后,根据单元格彼此的重叠率进行判断,因此不需要考虑单元格间的对应关系,能够进行精度良好的判断。
另外,根据本发明,单元格的个数少的图像中的单元格与单元格的个数多的一方的图像中的任意1个单元格的重复部分的面积与单元格的个数少的一方的图像中的单元格的总面积的比例被计算为单元格的重叠率,对单元格的个数少的一方的图像中的各单元格的各重叠率的剔除了比规定的界限值低的重叠率的平均值被计算为一致率。例如,当输入图像中的格线缺失时,输入图像中的单元格的个数会比模板图像中的单元格的个数少,相应地,在输入图像中出现了比模板图像中的单元格面积大的单元格。该面积大的单元格与模板图像中的任意1个单元格的重叠率会比规定的界限值低,因此在一致率的计算中不予考虑。也就是说,本发明的图像判断装置能够排除输入图像中的格线的缺失引起的单元格的个数的减少以及面积大的单元格的出现的影响来进行判断。
另外,根据本发明,将格线的间隔彼此的比率设为多个备选倍率,对每个备选倍率计算多个备选平行移动,根据格线的一致度最高的备选倍率以及备选平行移动使输入图像中格线以及单元格与模板图像中格线以及单元格对齐。因此,能够精度良好地进行对齐。
另外,根据本发明,利用识别部,当判断为输入图像中单元格的数量比规定的基准值少时,不进行基于所述对齐部的对齐以及基于所述判断部的判断,因此能够减少计算量。
附图说明
图1是功能性地表示图像提取装置100的构成的框图。
图2是表示由扫描仪等读取未填写文字等的帐票而得到的图像的图。
图3是表示由扫描仪等读取已填写完毕的帐票而得到的图像的图。
图4是概要地表示图像提取装置100的处理的流程图。
图5是表示从图2所示的模板图像中提取出来的格线以及单元格的图。
图6是表示从图3所示的输入帐票图像中提取出来的格线以及单元格的图。
图7是使图5所示的格线以及单元格与图6所示的格线以及单元格对齐时的图。
附图标记的说明
10...图像判断部;11...特征量提取部;12...识别部;13...对齐部;14...判断部;20...图像提取部;30...存储部;100...图像提取装置。
具体实施方式
下面,对作为本发明的实施方式的图像提取装置100进行说明。图1是功能性地表示图像提取装置100的构成的框图。图像提取装置100由MFP(Multi Function Printer)等所具备的以往公知的控制运算电路以及存储电路实现,功能上包含图像判断部10、图像提取部20和存储部30。图像判断部10包含特征量提取部11、识别部12、对齐部13和判断部14。
概要地说,图像提取装置100是用于提取帐票中填写的文字等的装置。图2表示由扫描仪等读取未填写文字等的帐票(以下,称为“帐票原本”)而得到的图像(以下,称为“模板图像”)。帐票例如是图2所示那样的矩形形状的记录纸张,画有多条格线,在由纵向延伸的2条格线KY与横向延伸的2条格线KX划分出的矩形形状的区域(以下,称为“单元格”)CE中,填写文字等。图3表示由扫描仪等读取在帐票原本中的空白栏的单元格中已填写了文字等的帐票,即已填写完毕的帐票而得到的图像(以下,称为“输入帐票图像”)。
图4是概要地表示图像提取装置100的处理的流程图。当图像被输入时,特征量提取部11从输入的图像中提取作为该图像的特征量的格线以及单元格(步骤S1)。
接下来,在步骤S2中,识别部12基于提取出来的格线以及单元格,判断被输入的图像是否是模板图像或者输入帐票图像,当被输入的图像是模板图像或者输入帐票图像时,进入步骤S3,当被输入的图像不是模板图像或者输入帐票图像时,进入步骤S8。例如,识别部12当被输入的图像中的单元格的数量比规定的基准值(例如10)少时,判断为被输入的图像不是模板图像或者输入帐票图像。在步骤S8中,图像提取装置100通知使用者被输入的图像不是帐票,结束处理。
在步骤S3中,图像提取装置100催促使用者输入模板图像或者输入帐票图像中的任一个,当输入的是模板图像时,进入步骤S4,当输入的是输入帐票图像时,进入步骤S5。
在步骤S4中,存储部30存储模板图像的格线以及单元格的信息。这时,图像提取装置100也可以显示模板图像的格线以及单元格,让使用者确认,格线以及单元格中是否存在错误。此外,图像提取装置100也可以构成为当格线以及单元格中存在错误时,使用者能够进行修正。另外,图像提取装置100也可以构成为与模板图像的格线以及单元格的信息一起,存储由使用者输入的模板图像的名称或种类、关注区域等。这里,关注区域是指当与模板图像相同种类的输入帐票图像被输入时,成为图像提取装置100提取文字等的对象的单元格。
在步骤S5中,对齐部13基于存储部30中存储的模板图像中的格线的间隔与通过特征量提取部11提取出来的输入帐票图像中格线的间隔,使该模板图像中单元格以及格线与该输入帐票图像中单元格以及格线对齐。这里所指的对齐是指使模板图像中单元格以及格线与输入图像中单元格以及格线在相同大小以及位置处对齐。对齐分别在图像的纵方向以及横方向进行。
具体而言,对齐部13首先计算模板图像中格线的间隔与输入帐票图像中格线的间隔的比率。通常,帐票中格线的间隔存在多个,因此要计算多个比率。然后,对齐部13将算出的多个比率作为备选倍率。若模板图像与输入帐票图像基于相同种类的帐票,则利用多个备选倍率中的任意1个来进行放大或者缩小即可,模板图像与输入帐票图像对齐成相同大小。
接下来,对齐部13当对多个备选倍率的每一个备选倍率,用备选倍率进行了放大或者缩小时,设定多个诸如模板图像中格线的任意1个与输入图像中格线的任意1个一致这样的备选平行移动(备选移动距离)。然后,对各备选倍率以及各备选平行移动,评价根据备选倍率来对模板图像或者输入帐票图像中的任意一方的格线进行放大或者缩小,并根据备选平行移动来平行移动模板图像或者输入帐票图像中的任意一方的格线·后的格线与模板图像或者输入帐票图像中的任意另一方的格线间的格线的一致度。一致度高的,评价设定为高。也就是说,若模板图像与输入帐票图像基于相同种类的帐票,则使用一致度最高时的备选倍率以及备选平行移动的组,来放大或者缩小模板图像或者输入帐票图像中的任意一方的格线,平行移动后的格线与模板图像或者输入帐票图像中的任意另一方的大小以及位置会对齐。这样,对齐部13使模板图像中的单元格以及格线与输入帐票图像中的单元格以及格线对齐。
在步骤S6中,判断部14计算由对齐部13对齐后的输入帐票图像中单元格与模板图像中单元格中的单元格彼此的重叠率。然后,判断部14基于算出的重叠率来计算输入帐票图像与模板图像的一致率,当算出的一致率比规定的阈值(例如95%)高时,判断为输入帐票图像与模板图像一致,进入步骤S7。对存储部30中存储的所有的模板图像进行对齐以及判断的结果,当判断为输入帐票图像与任意的模板图像均不一致时,进入步骤S9。在步骤S9中,图像提取装置100通知使用者输入的图像是未分类的帐票,结束处理。
在步骤S6中,当输入帐票图像中单元格的个数与模板图像中单元格的个数不同时,判断部14按照如下的方式来计算重叠率以及一致率。下面,假设输入帐票图像中单元格的个数比模板图像中单元格的个数少。在这样的情况下,判断部14对输入帐票图像中的各个单元格,将该单元格与模板图像中的任意1个单元格重叠的部分的面积与单元格的总面积的比例计算为重叠率。也就是说,重叠率=(重叠的部分的面积/单元格的总面积)×100[%]。判断部14对输入帐票图像中的各个单元格,计算重叠率,剔除算出的重叠率中的比规定的界限值(例如75%)低的重叠率,计算各重叠率的平均值。判断部14将这样算出的平均值作为一致率。
在步骤S7中,图像提取部20从判断为与模板图像一致的输入帐票图像中的单元格中、存储于存储部30的关注区域中提取图像。然后,图像提取部20基于提取出来的图像,利用OCR(Optical CharacterRecognition)生成文字等并将其存储于存储部30中,结束处理。
根据这样的图像提取装置100,使输入帐票图像中的单元格与模板图像中的单元格对齐后,根据单元格彼此的重叠率来进行一致判断,因此不需要考虑单元格间的对应关系,能够进行精度良好的判断。
另外,在步骤S6中,单元格的个数少的图像的单元格与单元格的个数多的一方的图像中任意1个单元格的重复部分的面积与单元格的个数少的一方的图像中单元格的总面积的比例被计算为单元格的重叠率,剔除关于单元格的个数少的一方的图像中各单元格的各重叠率的、比规定的界限值低的重叠率的平均值被计算为一致率,因此能够进行精度良好的判断。例如,当输入帐票图像中格线缺失时,输入帐票图像中单元格的个数比模板图像中单元格的个数少,相应地,在输入帐票图像中,出现了比模板图像中单元格面积大的单元格。该面积大的单元格与模板图像中任意1个单元格的重叠率比规定的界限值低,因此在一致率的计算中不予考虑。也就是说,根据图像提取装置100,能够排除输入帐票图像中格线的缺失所引起的单元格的个数的减少以及面积大的单元格的出现的影响来进行判断,其结果,能够进行精度良好的判断。
另外,在步骤S5中,将格线的间隔彼此的比率作为多个备选倍率,对每个备选倍率,设定多个备选平行移动,根据格线的一致度最高的备选倍率以及备选平行移动,来使输入帐票图像中格线以及单元格与模板图像中格线以及单元格对齐。因此,图像提取装置100能够精度良好地进行对齐,其结果,能够进行精度良好的判断。
另外,在步骤S2中,当输入的图像中单元格的数量比规定的基准值少时,判断为输入的图像不是模板图像或者输入帐票图像,在该情况下,不进行步骤S3~S7、S9的处理。因此,在该情况下,不进行对齐部13的对齐以及判断部14的判断,因此能够减少图像提取装置100的计算量。
以下,对特征量提取部11的具体动作进行说明。特征量提取部11从图2所示的模板图像中提取图5所示的格线以及单元格,或者从图3所示的输入帐票图像中提取图6所示的格线以及单元格。
具体而言,特征量提取部11首先对输入的图像进行倾斜校正处理。倾斜校正处理是在由扫描仪等读取帐票时帐票稍微倾斜的情况下,为了校正该倾斜,使图像向与倾斜的方向相反的方向旋转数度左右的处理。
接下来,特征量提取部11将倾斜校正处理后的图像变换为灰阶(例如,255灰度的灰阶)的图像。然后,从变换后的图像的左上像素依次以右方向为主扫描方向(X方向),下方向为副扫描方向(Y方向),逐个像素地进行扫描来进行像素的提取,进行将提取到的像素作为黑像素,将除此以外的作为白像素的2值化。提取出来的像素是具有比前后左右的任意一个像素的灰度值高出规定的值(例如50)以上的灰度值的像素。另外,与前面提取出来的像素相邻的具有同程度(例如,±10程度)的灰度值的像素也被提取出来。这样通过进行2值化,如图2以及图5及图3以及图6所示,能够将灰的单元格变换为白,并且将灰的格线变换为黑。与此相对,如果单纯地利用1个阈值对输入的图像进行2值化时,灰的单元格都会变换为黑或者灰的格线会变换为白。
接下来,特征量提取部11通过公知的线段提取方法,例如Hough变换,来提取在X方向或者Y方向平行的线段,存储线段的两端点的XY坐标值。然后,特征量提取部11对规定的值(例如5)以内的间隔的平行的线段组,对齐位置。具体而言,若是与X轴平行的线段组,则计算Y坐标值的算术平均值,将该值作为线段组所包含的各线段的Y坐标值。例如,当线段A的两端点的XY坐标值为(1,2)、(10,2),线段B的两端点的XY坐标值为(20,2.1)、(25,2.1),线段C的两端点的XY坐标值为(11,1.6)、(15,1.6)时,计算线段A~C的Y坐标值的算术平均值(2+2.1+1.6)/3=1.9,将线段A的两端点的XY坐标值置换为(1,1.9)、(10,1.9),将线段B的两端点的XY坐标值置换为(20,1.9)、(25,1.9),将线段C的两端点的XY坐标值置换为(11,1.9)、(15,1.9)。特征量提取部11对与Y轴平行的线段组,也进行同样的处理。
接下来,特征量提取部11连接以规定的值(例如3)以下相邻的线段彼此。例如,线段A的两端点的XY坐标值为(1,1.9)、(10,1.9),线段B的两端点的XY坐标值为(20,1.9)、(25,1.9),线段C的两端点的XY坐标值为(11,1.9)、(15,1.9),因此线段A与线段C相邻,另外线段B与线段C相邻。在这样的情况下,特征量提取部11连接线段A与线段C,并且连接线段B与线段C,连成1个线段。这1个线段的两端点的XY坐标值变为(1,1.9)、(25,1.9)。
接下来,特征量提取部11确认规定的短线段(例如,线段的长度小于5)是否与垂直的线段交叉。而且,当该短线段与垂直的线段不交叉,或者交叉的1个或者多个垂直的线段的长度小于规定的长度(例如10)时,删除该短线段。接下来,特征量提取部11确认剩余的线段是否与垂直的线段交叉,当不交叉时删除该线段。经过以上的处理而剩余的线段被视为格线。
接下来,特征量提取部11从图像的上部按顺序,当Y坐标值相等时按照从左开始的顺序关注线段的交点中的关注交点,进行以下(a)~(d)的处理来对单元格进行提取。
(a)确认是否存在具有与关注交点相同的Y坐标值并且比关注交点靠右侧的交点(第1交点)。当存在时,进行(b)的处理,当不存在时,移向下一个关注交点。
(b)确认是否存在具有与关注交点相同的X坐标值并且比关注交点靠下侧的交点(第2交点)。当存在时,进行(c)的处理,当不存在时,移向下一个关注交点。
(c)确认是否存在具有与第1交点相同的X坐标值并且具有与第2交点相同的Y坐标值的交点(第3交点)。当存在时,进行(d)的处理,当不存在时,移向下一个关注交点。
(d)将关注交点以及第1交点~第3交点的XY坐标值设为1个组,与1个单元格相对应地进行存储,移向下一关注交点。
接下来,对识别部12的具体动作进行说明。当满足例如以下的(e)~(g)的条件时,识别部12判断为被输入的图像是模板图像或者输入帐票图像。
(e)单元格的个数在规定的数量(例如10)以上。
(f)单元格的面积/所有的单元格的合计面积为规定的范围(例如1%~5%)的单元格在规定的数量(例如5)以上。
(g)单元格的面积/被输入的图像整体的面积为规定的范围(例如,0.2%~2%)的单元格在规定的数量(例如5)以上。其中,也可以利用“包含全部单元格的最小矩形的面积”来代替“全部矩形的合计面积”。
接下来,针对对齐部13的具体动作进行说明。对齐部13使图5所示的格线以及单元格与图6所示的格线以及单元格对齐成图7所示的样子。
具体而言,首先,对齐部13对输入帐票图像与模板图像,分别计算与X轴平行的线段(格线)间的间隔DYE、DYT。例如,在输入帐票图像中存在的与X轴平行的线段的数量为5的情况下,当各线段的Y坐标值YE1~5从小的一方按顺序为{1、4、8、13、18}时,为DYE={3、4、5、5}。另外,例如在模板图像中存在的与X轴平行的线段的数量为6的情况下,当各线段的Y坐标值YT1~6从小的一方按顺序为{21、33、39、47、57、67}时,为DYT={12、6、8、10、10}。
接下来,对齐部13在DYE的各要素与DYT的各要素之间计算多个比率,计算以各比率为要素的比率组。该计算以DYE、DYT中的、要素数量少的一方为分母,以多的一方为分子。换言之,在Y方向放大或者缩小与X轴平行的格线的数量少的一方的图像,使其与格线的数量多的一方的图像对齐。下面,将以DYE的要素为分母,以DYT的要素为分子的比率构成的组表示为PYT/E。此外,当计算比率时,相同值的比率有可能出现多个,该情况下,不重复PYT/E的要素。另外,当PYT/E的要素过多,计算量庞大时,也可以从相同值的比率的出现数量多的一方+按顺序仅将规定的个数(例如10个)的比率作为PYT/E的要素。
例如,当DYE={3、4、5、5},DYT={12、6、8、10、10}时,由多个比率构成的比率组PYT/E为PYT/E={4、2、8/3、10/3、3、3/2、5/2、12/5、6/5、8/5}。这里,作为PYT/E的要素的4表示为了将作为DYE的要素的3与作为DYT的要素的12对齐,需要放大12/3=4[倍]。同样地,作为PYT/E的要素的2表示为了将作为DYE的要素的3与作为DYT的要素的6对齐,需要放大6/3=2[倍]。对齐部13不能判别DYT的任意一个要素与DYE的任意一个要素是否对应,因此如上假定所有的对应关系来计算PYT/E
接下来,对齐部13将PYT/E的各要素PYT/E (k)(该值为备选倍率)乘以作为格线的数量少的一方的图像中的Y坐标值的YE1~5,算出作为Y轴上的数列的第k数列EY(k)。例如,在上例中,当假设PYT/E (1)=4时,第1数列EY(1)={4、16、32、52、72}。另外,当使用PYT/E (2)=2时,第2数列EY(2)={2、8、16、26、36}。
接下来,对齐部13使第k数列在Y轴上平行移动,以使第k数列的第n个要素En与格线的数量多的一方的图像中的Y坐标值YT1~6的第m个要素Tm一致。例如,使第1数列在Y轴上平行移动+31(该值为备选平行移动),以使第1数列EY(1)={4、16、32、52、72}的第2个要素16与Y坐标值YT1~6={21、33、39、47、57、67}的第4个要素47一致。在该情况下的平行移动后的数列EY(k) nm成为EY(1) 24={35、47、63、83、103}。
然后,对齐部13确认该平行移动后的数列EY(1) 24与Y坐标值YT1~ 6的其他的一致点。具体而言,确认在剔除了作为一致的要素的47的Y坐标值YT1~6的各要素Tm-Min(DYT)×0.1~Tm+Min(DYT)×0.1的范围内,是否存在EY(1) 24的任意一个要素(除去作为一致的要素的47),对一致的Tm的个数的每1个评价为1点。此外,设有Tm-Min(DYT)×0.1~Tm+Min(DYT)×0.1这样的范围是因为也含有各要素完全不一致的情况。
在上例中,EY(1) 24的除了47以外的要素与Y坐标值YT1~6的除了47以外的要素均不一致(不包含在YT1~6的附近的范围内),因此对EY(1) 24的评价值为0点。另外,例如在EY(2) 12的情况下,备选平行移动为+31,EY(2) 12={33、39、47、57、67},因此与Y坐标值YT1~6中的EY(2) 12一致的要素(除去作为一致的要素的33)为39、47、57、67这4个要素,因此对EY(2) 12的评价值为4点。这样,对齐部13对所有的EY(k) nm分别计算评价值。
接下来,对齐部13选择与评价值最高的EY(k) nm对应的备选平行移动以及备选倍率作为使模板图像与输入帐票图像在Y方向对齐用的备选平行移动以及备选倍率。此外,在评价值最高的EY(k) nm存在2个以上,因而备选平行移动以及备选倍率的组存在2组以上的情况下,选择被视为一致的各要素为最近的一组。
最后,对齐部13对格线的数量少的一方的图像(在上例中为输入帐票图像),根据选择出的备选倍率来放大或者缩小与X轴平行的格线彼此在Y方向的间隔、以及与Y轴平行的格线的长度,进而根据选择出的备选来平行移动,使各格线在Y方向平行移动。然后,对齐部13对与Y轴平行的线段(格线)也进行以上的处理,在X方向以及Y方向的两个方向使输入帐票图像与模板图像对齐。
接下来,对判断部14的具体动作进行说明。判断部14计算如图7那样被对齐了的输入帐票图像中单元格与模板图像中单元格的重叠率。如上述那样,当输入帐票图像中单元格的个数比模板图像中单元格的个数少时,判断部14对输入帐票图像中的单元格的每一个单元格,计算该单元格与模板图像中任意1个单元格重叠部分的面积与单元格总面积的比例作为重叠率。采用任意1个单元格是因为可能存在模板图像中的多个单元格与输入帐票图像中的单元格重叠的情况。当多个重叠时,将在模板图像中每一个单元格中重叠的部分面积中的最大值作为在重叠率的计算中使用的重叠部分的面积。
此外,在输入帐票图像中单元格的个数与模板图像中单元格的个数相等的情况下,判断部14也可以与上例相反地计算该单元格与输入帐票图像中任意1个单元格的重叠部分的面积与模板图像中单元格的总面积的比例作为重叠率。
接下来,判断部14基于重叠率计算一致率。如上述那样,当输入帐票图像中单元格的个数比模板图像中单元格的个数少时,判断部14剔除算出的各重叠率中的、比规定的界限值(例如75%)低的重叠率,计算各重叠率的平均值作为一致率。
此外,平均值也可以是算术平均值,也可以是面积的加权平均值。另外,判断部14在输入帐票图像中单元格的个数与模板图像中单元格的个数相等的情况下,不进行重叠率是否比规定的界限值低的判断,对所有的重叠率计算平均值。这是因为在该情况下,可以认为在输入帐票图像中的格线中不存在缺失。但是,在输入帐票图像中单元格的个数与模板图像中单元格的个数相等的情况下,也可以当重叠率比规定的界限值低时,剔除该重叠率。
当如此地算出一致率时,判断部14判断该一致率是否比规定的阈值(例如95%)高,当判断为高时,判断输入帐票图像与模板图像一致。
以上那样的图像提取装置100能够通过在以往公知的信息处理装置中存储作为使该信息处理装置作为图像提取装置100发挥作用的程序的图像提取程序来实现。该图像提取程序能够存储于以往公知的计算机可读取的存储介质中。
通过将上述图像提取程序存储于存储介质中,能够携带自如地提供存储了用于执行图像提取装置100进行的各种处理的程序代码(执行格式程序、中间代码程序、源程序等)的存储介质。
此外,存储介质可以是微型计算机进行处理用的存储器,例如ROM(Read Only Memory)那样的程序介质,或者可以是通过***到计算机作为外部存储装置所具备的程序读取装置进行读取的程序介质。
在存储介质中存储的程序可以是微处理器访问存储介质来执行的方式,或者可以是微处理器从存储介质中读出程序代码,读出的程序代码被下载在微型计算机的程序存储区中,从而该程序被执行的方式。该下载用的程序预先存储于本体装置中。
这里,上述程序介质是可以与本体分离地构成的存储介质,也可以是磁带、盒式磁带等磁带系,软盘、硬盘等磁盘,CD-ROM(CompactDisc-Read Only Memory)、MO(Magneto Optical disc)、MD(MiniDisc)、DVD(Digital Versatile Disc)等光盘的盘系,IC(IntegratedCircuit)卡(包含存储器卡)、光卡等卡系,或者MASK ROM(掩模型只读存储器)、EPROM(Erasable Programmable Read OnlyMemory)、EEPROM(Electrically Erasable Programmable Read OnlyMemory)、FLASH ROM等包含了半导体存储器的固定地保存程序代码的介质。
另外,若计算机是可以连接包含因特网的通信网络的***构成,则存储介质也可以是按照从通信网络下载程序代码的方式流动地保存程序代码的介质。此外,在如此地从通信网络下载程序的情况下,该下载用的程序被预先存储在本体装置中、或者从其他的存储介质安装。另外,上述图像提取程序也可以通过用电子传输实现的在载波中装载上述程序代码的计算机数据信号的方式实现。

Claims (4)

1.一种图像判断装置,其特征在于,具备:
特征量提取部,其从输入图像中提取格线以及单元格;
对齐部,其基于预先提取且存储的模板图像中格线的间隔以及通过所述特征量提取部提取出来的所述输入图像中格线的间隔,使预先提取且存储的模板图像中单元格以及格线与通过所述特征量提取部提取出来的所述输入图像中单元格以及格线对齐;和
判断部,其计算被所述对齐部对齐后的所述输入图像中单元格与所述模板图像中单元格间的单元格彼此的重叠率,基于算出的重叠率来计算所述输入图像与所述模板图像的一致率,当算出的一致率比规定的阈值高时,判断为所述输入图像与所述模板图像一致。
2.根据权利要求1所述的图像判断装置,其特征在于,
所述判断部构成为:
当从所述输入图像中提取出来的单元格的个数与所述模板图像中的单元格的个数不同时,
针对单元格的个数少的一方的图像中的各单元格,计算重叠面积与该单元格的面积的比例作为所述重叠率,
剔除算出的各重叠率中的比规定的界限值低的重叠率,来计算各重叠率的平均值,将算出的平均值作为所述一致率,
其中,所述重叠面积是单元格的个数少的一方的图像中的单元格与单元格的个数多的一方的图像中的任意1个单元格间相重叠的部分的面积。
3.根据权利要求1或2所述的图像判断装置,其特征在于,
所述对齐部计算所述模板图像中格线的间隔与所述输入图像中格线的间隔的多个比率,将算出的多个比率作为多个备选倍率,针对多个备选倍率的每一个备选倍率,计算使所述模板图像中格线的任意1个与所述输入图像中格线的任意1个一致的多个备选平行移动,
针对各备选倍率以及各备选平行移动,评价根据所述备选倍率来放大或者缩小所述模板图像或者所述输入图像中的任意一方的格线且根据所述备选平行移动来平行移动所述模板图像或者所述输入图像中的任意一方的格线后的格线与所述模板图像或者所述输入图像中的任意另一方的格线中的格线的一致度,
根据所述一致度最高时的备选倍率以及备选平行移动来放大或者缩小所述模板图像或者所述输入图像中的任意一方的格线以及单元格,通过平行移动来与所述模板图像或者所述输入图像中的任意另一方的格线以及单元格对齐。
4.根据权利要求1~3的任意一项所述的图像判断装置,其特征在于,
具备识别部,当所述输入图像中单元格的数量比规定的基准值少时,该识别部不使所述对齐部进行对齐并且不使所述判断部进行判断,当所述输入图像中单元格的数量比所述规定的基准值多时,该识别部使所述对齐部进行对齐并且使所述判断部进行判断。
CN2011104121139A 2011-11-30 2011-11-30 图像判断装置 Pending CN103136544A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN2011104121139A CN103136544A (zh) 2011-11-30 2011-11-30 图像判断装置
JP2012249290A JP5619111B2 (ja) 2011-11-30 2012-11-13 画像判定装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011104121139A CN103136544A (zh) 2011-11-30 2011-11-30 图像判断装置

Publications (1)

Publication Number Publication Date
CN103136544A true CN103136544A (zh) 2013-06-05

Family

ID=48496352

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011104121139A Pending CN103136544A (zh) 2011-11-30 2011-11-30 图像判断装置

Country Status (2)

Country Link
JP (1) JP5619111B2 (zh)
CN (1) CN103136544A (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6467787B2 (ja) * 2014-05-27 2019-02-13 株式会社リコー 画像処理システム、撮像装置、画像処理方法およびプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0973516A (ja) * 1995-09-04 1997-03-18 Nippon Telegr & Teleph Corp <Ntt> 帳票種類識別方法
US20010031086A1 (en) * 1996-12-25 2001-10-18 Hitachi, Ltd. Image processor, image processing apparatus, and image processing method
CN1460961A (zh) * 2003-06-27 2003-12-10 杭州信雅达***工程股份有限公司 票据图象版面识别方法
CN102129547A (zh) * 2010-01-20 2011-07-20 富士施乐株式会社 帐票识别装置、帐票处理***和帐票识别方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0728935A (ja) * 1993-07-07 1995-01-31 Oki Electric Ind Co Ltd 文書画像処理装置
JP3353215B2 (ja) * 1995-05-15 2002-12-03 日本電信電話株式会社 帳票書式識別方法及び装置
JPH1027208A (ja) * 1996-07-10 1998-01-27 N T T Data Tsushin Kk 帳票照合方法及び装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0973516A (ja) * 1995-09-04 1997-03-18 Nippon Telegr & Teleph Corp <Ntt> 帳票種類識別方法
US20010031086A1 (en) * 1996-12-25 2001-10-18 Hitachi, Ltd. Image processor, image processing apparatus, and image processing method
CN1460961A (zh) * 2003-06-27 2003-12-10 杭州信雅达***工程股份有限公司 票据图象版面识别方法
CN102129547A (zh) * 2010-01-20 2011-07-20 富士施乐株式会社 帐票识别装置、帐票处理***和帐票识别方法

Also Published As

Publication number Publication date
JP5619111B2 (ja) 2014-11-05
JP2013114678A (ja) 2013-06-10

Similar Documents

Publication Publication Date Title
CN110738602B (zh) 图像处理方法、装置、电子设备及可读存储介质
CN109657665B (zh) 一种基于深度学习的***批量自动识别***
US7657091B2 (en) Method for automatic removal of text from a signature area
CN102782703B (zh) 经历光学字符识别的图像的页面布局确定
US5857034A (en) System for inputting character data
CN1184987A (zh) 电子交易***
CN101303779B (zh) 存款自动存取机和银行券的跟踪方法
CN102222241A (zh) 字符串识别装置及字符串识别方法
JP2004139484A (ja) 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
CN102156864A (zh) 票据处理***
EP0546343A2 (en) Diagram recognizing system
US20010051965A1 (en) Apparatus for rough classification of words, method for rough classification of words, and record medium recording a control program thereof
CN102339352A (zh) 电子阅卷方法
CN110427853A (zh) 一种智能票据信息提取处理的方法
CN105590367B (zh) Ic卡交易异常的处理方法以及实现该处理方法的受理终端
CN1185614A (zh) 电子交易***
CN103136544A (zh) 图像判断装置
JP4983464B2 (ja) 帳票画像処理装置及び帳票画像処理プログラム
CN115438682B (zh) 用于确定解码方向的方法、装置及解码设备
JP6757152B2 (ja) 紙幣処理システムおよび紙幣処理方法
JP4521466B2 (ja) 帳票処理装置
KR101001693B1 (ko) 지로 장표 수납기의 문자인식방법
JP2005165916A (ja) 磁気icカード処理装置
EP0288820A2 (en) A slip and method of and apparatus for automatic reading of the slip
CN106558139A (zh) 特殊券识别方法、特殊券识别装置以及自助设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130605