CN101295359A - 图像处理程序及图像处理装置 - Google Patents

图像处理程序及图像处理装置 Download PDF

Info

Publication number
CN101295359A
CN101295359A CNA2008100058810A CN200810005881A CN101295359A CN 101295359 A CN101295359 A CN 101295359A CN A2008100058810 A CNA2008100058810 A CN A2008100058810A CN 200810005881 A CN200810005881 A CN 200810005881A CN 101295359 A CN101295359 A CN 101295359A
Authority
CN
China
Prior art keywords
mentioned
information
data
background
color
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008100058810A
Other languages
English (en)
Other versions
CN101295359B (zh
Inventor
关峰伸
浅野英辅
永吉洋登
永崎健
新庄广
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Omron Financial System Co Ltd
Original Assignee
Hitachi Omron Financial System Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Omron Financial System Co Ltd filed Critical Hitachi Omron Financial System Co Ltd
Publication of CN101295359A publication Critical patent/CN101295359A/zh
Application granted granted Critical
Publication of CN101295359B publication Critical patent/CN101295359B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/254Analysis of motion involving subtraction of images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Processing (AREA)

Abstract

本发明提供一种图像处理程序及图像处理装置,从包含色偏差或颜色模糊的文档图像中,高精度地抽取记入文字、印迹、标记等。本发明的图像处理方法构成:从彩色图像或亮度图像中除去背景部分,生成表示背景以外的部分的背景除去数据的背景除去数据生成部;在彩色图像或亮度图像的上述背景以外部分中,生成将背景以外部分的轮廓的颜色转换成在背景以外部分的轮廓的内侧中的像素的颜色的数据的轮廓颜色转换数据生成部;和抽取特定对象部分的特定对象抽取部。

Description

图像处理程序及图像处理装置
技术领域
本发明涉及一种利用光学文字读取装置(OCR:OpticalCharacter Reader)、扫描仪、数字照相机等拍摄例如帐票等文档,从生成的文档图像中抽取记入文字、印迹、标记等特定对象的图像处理方法及图像处理装置。
背景技术
在金融机关或自治团体中,使用OCR等扫描仪装置,实现帐票等文档处理业务的高效化。OCR的主要功能是文档图像的生成、文档图像中文字的抽取、文字识别。作为生成的文档图像的种类,有二值图像、亮度图像、彩色图像。
使用二值图像的处理,由于数据量小,因此处理时间变少。但是,在二值图像处理中,在帐票中预先印刷的称为预印(Preprint)的格线、位线、提示文字、阴影和手写或后来印刷的记入文字有很大重叠的情况下,难以区分它们。因此,存在文字的抽取结果中产生噪声的情况、或抽取的文字的一部分欠缺的情况,有文字识别出错的问题。
使用亮度图像的处理是黑白的浓淡图像处理。由于在亮度图像处理中,利用预印和记入文字的亮度值不同来区别它们,因此在预印和记入文字重叠的情况下,区分它们比二值图像处理变得容易。但预印和记入文字的亮度值相近的情况下,它们的判别精度变低。
在利用彩色图像的处理中,由于能根据预印和记入文字的颜色的不同而区别,因此区别它们比亮度图像处理变得容易。在彩色图像处理中,通过去除预印的颜色来抽取记入文字、印迹、标记等。
该方法中,有像【专利文献3】那样去除在帐票输入前指定的去除颜色的方法,和像【专利文献1】或【专利文献2】那样抽取在输入的帐票内的像格线那样的特定的形状部分,去除与该抽取部分的颜色相同颜色的方法。
【专利文献1】特开2003-196592
【专利文献2】特开2005-258683
【专利文献3】特开2006-134355
【专利文献4】特开2004-336106
【专利文献5】特开2005-18810
在上述彩色图像处理中,存在由于由OCR、扫描仪、数字照相机生成的图像中产生色偏差,不能正确地抽取记入文字或印迹等特定对象,而留有一部分预印,或特定对象的一部分欠缺等问题。
所谓色偏差是指感测到的3原色的颜色分量,成为红色分量的R值、成为绿色分量的G值及成为蓝色分量的B值中至少一个值的位置偏移。作为色偏差产生的主要原因,列举镜头的色差、传感器的配置位置、搬运速度等。特别是在利用台式扫描仪或数字照相机等的二维CCD的扫描仪中,产生较多因色差而带来的色偏差。
由于色偏差,在预印或记入文字等的特定对象的轮廓部分中,产生与特定对象的本来的颜色不同的伪色。例如,有在黑色文字的轮廓中,产生红色和蓝色的伪色的情况,或在蓝色的格线的轮廓上产生浅红色的伪色的情况等。因此,在根据颜色的信息区别记入文字和预印等的彩色图像处理中产生错误。
对此,【专利文献4】尝试除去镜头的色差、【专利文献5】尝试除去由传感器的配置位置而产生的色偏差。
然而,即使进行计侧并补正偏差量的方法,从图像中完全除去色偏差是困难的。此外,更高精度的色偏差补正要花费很多的格线时间的问题也出现了。
此外,在上述彩色图像处理或亮度图像处理中,在图像中产生颜色模糊的情况下,存在不能正确地抽取记入文字或印迹等特定对象,留有一部分预印,或文字的一部分欠缺的问题。
所谓颜色模糊,是指格线或记入文字的轮廓部分的颜色模糊,产生浅色。由于颜色模糊而使预印或记入文字的红色分量、蓝色分量、绿色分量、明度、彩度、色相、亮度等颜色信息的分散变大,因此区别记入文字和预印变得困难。
发明内容
本发明鉴于这些问题而完成,提供一种从含有色偏差或颜色模糊的文档图像中,高精度地抽取记入文字、印迹、标记等特定对象的图像处理方法及图像处理装置。
为达到上述目的,本发明在从利用扫描仪或数字照相机读取帐票等文档的彩色图像或亮度图像中,抽取记入文字、印迹、标记等特定对象的图像处理方法中,具备以下特征,具有:从彩色图像或亮度图像中除去背景,生成显示背景以外的部分的背景除去数据的背景除去生成处理;生成在彩色图像或亮度图像中的上述背景以外部分中、将背景以外部分的轮廓的颜色信息转换为在背景以外部分的轮廓内侧的图像的颜色信息的数据的轮廓颜色转换数据生成处理;和抽取特定对象部分的特定对象抽取处理。
此外,上述轮廓颜色转换数据生成处理的特征在于,对于彩色图像或亮度原图像内的关注像素,参照作为在其附近的多个像素的附近像素,生成将关注像素的红色分量、蓝色分量、绿色分量、明度、彩度、色相、亮度等颜色信息转换为在附近像素和关注像素中亮度值最低的像素的颜色信息的低亮度颜色膨胀亮度数据。
上述特定对象判别处理的特征在于,进行格线抽取、特定对象候补抽取、格线的颜色信息和特定对象的颜色信息的推定和特定对象的判别。
根据本发明,即使是有色偏差或颜色模糊的彩色图像或亮度图像,也能高精度地区别预印、记入文字、印迹、标记等特定对象,例如能高精度地仅抽取记入文字。不仅限于记入文字,也能高精度地抽取印迹或标记等在文档图像内的特定对象。
附图说明
图1是表示特定对象抽取处理的结构的图。
图2是表示图像处理装置的图。
图3是彩色图像的例子。
图4是背景除去数据。
图5是特定对象的判别结果。
图6是表示背景除去数据生成处理的例子的图。
图7是表示以往的特定对象判别处理的图。
图8是格线抽取结果。
图9是格线除去结果。
图10是特定对象候补抽取结果。
图11是记入文字的色偏差的例子。
图12是格线的色偏差的例子。
图13是表示轮廓颜色转换数据生成处理的例子的图。
图14是表示图11的图像的轮廓颜色转换数据生成处理的图。
图15是表示图12的图像的轮廓颜色转换数据生成处理的图。
图16是表示特定对象判别处理的图。
图17是表示仅利用格线颜色的推定的特定对象判别处理的图。
图18是表示仅利用特定对象颜色的推定的特定对象判别处理的图。
图19是表示利用聚类的特定对象判别处理的图。
图20是表示添加色偏差补正的特定对象抽取处理程序的结构的图。
图21是表示具备抽取对象颜色指定功能的特定对象抽取处理程序的结构的图。
图22是表示包含指定抽取对象颜色的从属特定对象判别处理程序的图。
图23是表示利用包含指定抽取对象颜色的聚类的特定对象判别处理的图。
图24是表示颜色模糊的例子的图。
图25是表示对于有颜色模糊的图像的轮廓颜色转换数据生成处理的情况的图。
图26是表示亮度图像输入的轮廓颜色转换数据生成处理的例子的图。
图27是彩色图像的显示例。
图28是特定对象的判别结果的显示例。
(符号说明)
101图像取得模块
102背景除去数据生成模块
103轮廓颜色转换数据生成模块
104特定对象判别模块
105控制模块
具体实施方式
以下,对于应用本发明的图像处理方法及图像处理装置,利用附图详细说明。
实施例1
图2是表示本发明的图像处理装置的一实施方式的图。
这是将通信装置201、图像取得装置202、显示装置203、外部存储装置204、存储器205、CPU(Central Processing Unit)206、键盘或鼠标等输入装置207利用PCI总线等通信线连接的图像处理装置208。
图1所示的具备特定对象抽取处理的结构的程序容纳在外部存储装置204或存储器205等的存储装置中,利用CPU205执行。
输入到CPU中的文档的彩色图像或亮度图像,可以从扫描仪、OCR等图像取得装置202或通信装置201输入,也可以存储在外部存储装置204中。
特定对象抽取处理的结果,有输出到显示装置203中的情况、经由通信装置201输出到外部的情况或被用于在图像取得处理装置208内的其他程序的情况等。作为其他程序的例子,有进行文字识别的程序。
图27是将从图像取得装置202或通信装置201输入、或存储在外部存储装置204中的彩色图像在显示装置203上的显示窗口2701中显示的例子。此外,图28是将特定对象抽取处理的结果在显示装置203上的显示窗口2702中显示的例子。
图1是表示应用本发明的特定对象抽取处理程序的结构的图。特定对象抽取处理程序由图像取得模块101、背景除去数据生成模块102、轮廓颜色转换数据生成模块103、特定对象判别模块104及控制模块105构成。
图像取得模块101进行利用扫描仪或OCR等取得将纸质文档等图像化的彩色图像或亮度图像的图像取得处理。
背景除去数据生成模块102进行从输入到CPU206中的彩色图像或亮度图像中生成背景除去数据的背景除去数据生成处理。
例如,在取得像图3那样含有格线301、位线302和阴影303的预印和记入文字304的彩色图像的情况下,背景除去数据生成模块102生成图4所示的显示格线、位线和记入文字部分的数据。
背景除去数据生成处理是除去图像中的背景部分,抽取格线和位线的预印部分和记入文字部分的处理。为实现该处理有多种方法,采取图6所示的方法。
首先,在亮度值数据生成处理601中,从由RGB的3原色(R值、G值、B值)表示的彩色图像中生成由亮度表示的亮度图像。然后,在块分割(block generation)处理602中,将亮度图像分割为多个块。最后,在二值化处理603中,对每个块生成在块内将亮度值低的像素设为黑色、亮度值高的像素设为白色的二值数据。这样生成的二值数据,如图4所示,是黑色像素表示背景以外的部分的背景除去数据。
轮廓颜色转换数据生成模块103进行生成轮廓颜色转换数据1303的轮廓颜色转换数据生成处理,该轮廓颜色转换数据1303是输入彩色图像604及背景除去数据605,将格线、位线和记入文字的轮廓的颜色转换为轮廓的内侧部分的颜色而得到的。另外,彩色图像604可以是亮度图像。
特定对象判别模块104,进行对于输入到CPU206中的背景除去数据605、参照轮廓颜色转换数据1303、生成表示图5所示的记入文字部分的数据的特定对象的判定处理,输出特定对象判别结果706。
这里,利用图7对以往的特定对象判别处理进行说明。在以往的特定对象判别处理中,输入背景除去数据,参照彩色图像,输出特定对象的判别结果。
图7表示以往的特定对象判别处理。首先,在格线抽取处理701′中,抽取格线部分。在该处理中,通过抽取背景除去数据内的黑色像素长长地直线性地连接的部分而抽取格线部分。其结果是图8。
然后,在格线除去处理702′中,生成从背景除去数据中除去了格线部分的格线除去数据。其结果是图9。
然后,在特定对象候补抽取处理703′中,从格线除去数据中,利用矩形的尺寸或位置的信息,抽取成为作为特定对象的记入文字部分的候补的记入文字部分候补。其结果是图10。
然后,在格线颜色和特定对象颜色的推定处理704′中,通过参照彩色图像604,推定作为格线部分的颜色信息的格线部分颜色信息和作为记入文字候补部分的颜色信息的记入文字候补部分颜色信息。
然后,在特定对象的判别处理705′中,利用格线部分颜色信息和记入文字候补部分颜色信息,判别背景除去数据中的黑色像素部分的各像素是否是记入文字的像素。该处理是在背景除去数据中的黑色像素部分的各像素的位置中,判别彩色图像的颜色信息属于格线部分颜色信息,还是属于记入文字候补部分的颜色信息的处理。
具体来说,对每个在背景除去数据605中的黑色像素部分的像素进行以下的处理。在背景除去数据605中的某个黑色像素位置(Xa,Xb)的处理中,判定在彩色图像604的(Xa,Xb)中的颜色信息与由格线颜色和特定对象颜色的推定处理704′输出的格线部分颜色信息和记入文字候补部分颜色信息中的哪一个接近。并且,如果(Xa,Xb)的颜色信息接近格线部分颜色信息,则判定(Xa,Xb)的位置是格线部分,如果(Xa,Xb)的颜色信息接近记入文字候补部分颜色信息,则判定(Xa,Xb)的位置是记入文字部分。
作为该彩色图像604的颜色信息,可以利用RGB 3原色的R值、G值、B值,也可以是将它们转换了的颜色信息,例如亮度值或HSV空间的色相、彩度、明度。此外可以仅利用它们中的一个值,也可以利用多个值。此外,在判别方法中,能使用利用教师数据的多种判别算法。例如,利用神经网络、线性识别器、马氏距离(MahalanobisDistance)等。
然后,通过参照彩色图像604,进行特定对象的判定处理,输出特定对象判别结果706′,特定对象判别处理结束。
然而,在以往的特定对象判别处理的情况下,如果输入的彩色图像604中有色偏差,由于彩色图像604中的颜色信息也产生偏差,所以基于接近格线部分颜色信息和记入文字候补部分颜色信息中的哪一个的颜色信息的判定本身有产生偏差的可能性,因此有利用颜色信息不能区别预印和记入文字的问题。因此,根据利用以往方法得到的特定对象判定结果,有时不能得到本申请发明的判别结果,例如图5那样的输出。
这里,图11是有色偏差的图像(记入文字)的例子。在图11中,本来是黑色的记入文字的轮廓上产生蓝色的伪色和红色的伪色。
此外,图12也是有色偏差的图像(格线)的例子。在图12中,本来是蓝色的格线的轮廓上产生了浅红色的伪色。考虑从包括黑色的记入文字和蓝色的格线的图像中利用颜色信息仅抽取记入文字的情况。
在记入文字和格线中没有色偏差的情况下,能利用以往的特定对象判别处理仅抽取记入文字。但是,在如图11和图12那样有色偏差的图像中,由于在记入文字的轮廓和格线的轮廓中都存在红色分量,因此有格线的轮廓部分作为噪声产生的情况或文字的一部分欠缺的情况。在这样产生色偏差的情况下,有不能利用颜色信息区别预印和记入文字的问题。
对于图11、12那样的图像,在应用本发明的图像处理装置中进行轮廓颜色转换数据生成处理,参照轮廓颜色转换数据进行特定对象判别处理。
上述轮廓颜色转换数据生成模块103进行轮廓颜色转换数据生成处理。具体来说,生成在彩色图像604中的背景以外部分中、将背景以外部分的轮廓的颜色转换为在背景以外部分的轮廓的内侧中的像素的颜色的数据。也就是说,生成将彩色图像中的格线、位线和记入文字的轮廓的颜色信息转换为该轮廓的内侧部分的颜色信息的数据。
图13是轮廓颜色转换数据生成处理的具体的处理流程的例子。
在轮廓颜色转换数据生成处理中,从通信装置201、图像取得装置202或外部存储装置204经由存储器205,输入彩色图像604和背景除去数据605。
并且,在附近亮度值生成处理1301和低亮度颜色膨胀处理1302中,逐一选择(将被选择的像素称为关注像素)在彩色图像中背景以外的区域中的像素,转换该关注像素的颜色信息。这两个处理重复进行至在彩色图像中的背景以外的区域中的所有的像素被处理。
在附近亮度值生成处理1302中,分别生成围着关注像素的附近的领域内的像素(在图14的例子中,作为以关注像素为中心的3×3的范围的领域内的9像素)的亮度值。以下设领域内的关注像素以外的像素为附近像素。上述领域,不仅限于3×3,例如也可以是2×2或4×4。此外,关注像素不仅限于领域内的中心,可将领域设定为使关注像素位于领域内的任何位置。
然后,在低亮度颜色膨胀处理1302中,将关注像素的颜色信息(例如R值、G值和B值)转换为在关注像素和附近像素中亮度值最低的像素的颜色信息。这样,将R值、G值、B值产生偏差的轮廓部的颜色信息转换为轮廓部的内侧的颜色信息,成为模拟地将伪色转换为本来的颜色信息的处理。
更具体来说,算出领域内的关注像素及附近像素的亮度值,抽取具有最低亮度值的像素,将关注像素的颜色信息转换为具有最低亮度值的像素的颜色信息。如果关注像素的亮度值是最低的亮度值,关注像素的颜色信息按原样维持。这样,在彩色图像604中的格线、位线和记入文字的部分中,生成作为转换了颜色信息的数据的轮廓颜色转换数据1303。
利用轮廓颜色转换数据生成处理,例如在记入文字的情况下,如图14所示,将在图11中所示的记入文字的轮廓部中的亮度高的红色和蓝色的伪色转换为在轮廓内侧中的亮度低的黑色。
此外,利用轮廓颜色转换数据生成处理,例如在格线的情况下,如图15所示,将在图12中所示的格线的轮廓部中的亮度高的浅红色的伪色转换为在本轮廓内侧中的亮度低的蓝色。
图16是本实施例1中特定对象判别处理的具体的处理流程的图。
首先,进行输入背景除去数据、抽取格线部分的格线抽取处理701。
然后,进行生成从背景除去数据中除去格线部分的格线除去数据的格线除去处理702。
然后,进行从格线除去数据中、利用矩形的尺寸或位置的信息、抽取成为作为特定对象的记入文字部分的候补的记入文字部分候补的特定对象候补抽取处理703。
然后,在本发明的特定对象判别处理中,在格线颜色和特定对象颜色的推定处理1601和特定对象的判别处理1602中,参照轮廓颜色转换数据1303的RGB值。
在相当于背景颜色除去数据的黑色像素区域的轮廓颜色转换数据1303的区域中,由于具有因色偏差产生的伪色的像素变少,因此特定对象颜色和格线颜色的推定精度更佳,作为结果,也提高格线和特定对象的判别的精度。
这样,在应用本发明的图像处理装置208中,在格线颜色和特定对象颜色的推定1601和特定对象的判别处理1602中,由于能将记入文字部设为黑色,格线部设为蓝色来处理,因此能正确地判别记入文字部分。
以上,根据图像处理装置208,参照含有轮廓颜色转换处理后的RGB值的轮廓颜色转换数据,因此能从含有色偏差的彩色图像中,高精度地抽取成为特定对象的记入文字。此外,将作为该图像处理装置的输出的记入文字抽取结果作为输入的文字识别装置,能得到更高精度的识别结果。并且,将抽取记入文字作为例子而利用,但是在抽取印迹或标记的情况下也同样能高精度地抽取。
下面,对本发明的其他实施方式进行说明。
实施例2
如图17所示,也可以在特定对象判别部104中,采用仅利用格线颜色的推定而进行特定对象的判别的特定对象抽取处理。
图17所示的处理是在格线颜色的推定处理1701中,参照轮廓颜色转换数据,仅推定格线的颜色信息。然后,在格线颜色部分的除去处理1702中,通过利用格线的颜色信息,从背景除去数据605除去格线颜色部分,判别成为特定对象的记入文字部分。
实施例3
如图18所示,也可以在特定对象判别部104中,采用仅利用特定对象颜色的推定而进行特定对象判别处理的特定对象抽取处理。
图18所示的处理是在特定对象颜色的推定处理1801中,参照轮廓颜色转换数据1303,仅推定特定对象候补的颜色信息。然后,在特定对象颜色部分的抽取处理1702中,利用特定对象的颜色信息,从背景除去数据605抽取成为特定对象的记入文字部分。
实施例4
如图19所示,也可以采用在特定对象判别部104中,利用聚类进行特定对象判别处理的特定对象抽取处理。
图19所示的处理中,没有利用格线抽取的结果而仅利用背景以外部分的颜色信息进行判别。首先在聚类处理1901中,对背景以外部分的轮廓颜色转换数据1303进行聚类。在聚类中,可利用RGB 3原色的R值、G值、B值,也可以是将它们转换了的颜色信息,例如亮度值或HSV空间的色相、彩度、明度。此外可以仅利用它们中的一个值,也可利用多个值。在聚类的方法中,有k-means法或区域扩张法或判别分析等方法。
然后,在特定对象的类的选择处理1902中,从利用聚类得到的多个类中,选择特定对象的类。选择的方法有多种方法,例如选择具有亮度值高的值的类等方法。
并且,在特定对象类颜色部分的抽取1903中,通过从背景除去数据的黑色像素部分中抽取具有上述选择的类的颜色信息的像素,抽取成为特定对象的记入文字。
实施例5
也可采用在图1所示的特定对象抽取处理程序的结构中,又添加色偏差补正模块2001的特定对象抽取处理。
该特定对象抽取处理程序是如图20所示的结构,除了下面所说明的处理以外进行与如图1所示的实施例相同的处理。
色偏差补正模块2001执行色偏差补正处理。色偏差补正处理通过改变利用文档图像取得处理所取得的彩色图像604的R值、G值、B值,或扩大缩小等,来生成作为减轻了颜色的偏差的数据的色偏差补正数据。
并且,相对于在图1所示的结构中,输入到背景除去数据生成处理、轮廓颜色转换数据生成处理中的数据利用彩色图像604,在图20中的实施例中,输入到背景除去数据生成处理、轮廓颜色转换数据生成处理中的数据是色偏差补正数据。这样,即使在色偏差的偏差量多的图像中,也能高精度地抽取记入文字等特定对象。
实施例6
也可采用在图1所示的特定对象抽取处理程序的结构中,又添加指定颜色取得模块2101的特定对象抽取处理。
该特定对象抽取处理是如图21所示的结构,除了下面所说明的处理以外进行与如图1所示的实施例相同的处理。
在指定颜色取得模块中,进行指定颜色取得处理。指定颜色取得处理中取得作为抽取的特定对象而指定的颜色即指定抽取对象颜色信息2203。关于该指定抽取对象颜色信息,有用户预先在程序中指定的信息、或从键盘或鼠标等输入装置输入的信息等等。并且,该颜色信息,可利用RGB的R值、G值、B值,也可以是将它们转换了的颜色信息,例如亮度值或HSV空间的色相、彩度、明度。此外可以仅利用它们中的一个值,也可利用多个值。此外,可以是显示一个颜色的值,也可以是显示颜色的值的范围。
并且,特定对象判别处理成为如图22或图23那样将指定抽取对象颜色信息2203包含在输入中的处理。
图22在图16的特定对象判别处理中,利用指定抽取对象颜色信息2203和格线颜色和特定对象颜色的推定1601的结果,进行特定对象的判别2201。
图23在利用图19的聚类1901的特定对象判别处理中,利用指定抽取对象颜色信息2203进行特定对象的类的确定2301。
以上所说明的实施例,不仅对于色偏差的问题,对于颜色模糊的问题也是有效的。图24是记入文字的轮廓部分变成浅色的颜色模糊的例子。对于图24的图像,如果进行轮廓颜色转换数据生成处理,就生成图25所示的轮廓颜色转换数据1303。在轮廓颜色转换数据1303中,输入的彩色图像604中模糊的浅色的部分,被转换成深色。这样,对于有颜色模糊的图像也能高精度地抽取特定对象。
此外,以上所说明的实施例,不仅在输入彩色文档的情况下,对于在输入了产生颜色模糊的亮度图像的情况下也是有效的。在输入了亮度图像的情况下,在图1的实施例中,通过将轮廓颜色转换数据生成处理设为图26所示的处理而能够应对。
图26中输入亮度图像2604和背景除去数据605,在亮度图像2604中除了背景以外的部分中,对每个像素逐一进行亮度图像的低亮度颜色膨胀处理2601的处理。并且,背景以外的部分,也就是在格线、位线和记入文字的部分中,生成作为将亮度图像2604中亮度值转换了的数据的轮廓颜色转换数据1303。
在亮度图像的低亮度颜色膨胀处理2601中,将关注像素和附近像素中亮度值最低的像素的亮度值转换为关注像素的亮度值。

Claims (15)

1.一种图像处理装置,其特征在于,具备:
从输入的图像信息除去背景,生成表示背景以外的区域的背景除去数据的单元;
生成颜色转换数据的单元,该颜色转换数据是在输入的图像信息的背景以外的区域中,将与特定对象有关的轮廓的像素的颜色信息转换为在上述轮廓的内侧的像素的颜色信息的颜色转换数据;
存储上述背景除去数据及上述颜色转换数据的单元;和
从上述背景除去数据选择特定对象候补,参照上述颜色转换数据,输出特定对象部分的特定对象判别单元。
2.根据权利要求1所述的图像处理装置,其特征在于:
上述图像信息是图像的彩色图像信息或亮度信息。
3.根据权利要求1所述的图像处理装置,其特征在于:
在上述生成颜色转换数据的单元中,
从表示上述背景以外的区域的背景除去数据中选择包含多个像素的领域,
生成上述领域内的像素的亮度值,
生成将上述领域内的关注像素的颜色信息转换为在上述领域内的像素中亮度值最低的像素的颜色信息的颜色转换数据。
4.根据权利要求1所述的图像处理装置,其特征在于:
上述图像信息是存储在外部存储装置中的信息、利用图像取得装置取得的信息,或从通信装置输入的信息中的任一个。
5.根据权利要求1所述的图像处理装置,其特征在于:
上述生成颜色转换数据的单元,
设定上述图像信息上的关注像素,参照作为围着关注像素的附近的领域内的像素的附近像素,
生成将上述关注像素的颜色信息转换为在附近像素和关注像素中亮度值最低的像素的颜色信息的低亮度颜色膨胀亮度数据。
6.根据权利要求1所述的图像处理装置,其特征在于:
上述颜色信息是红色分量、蓝色分量、绿色分量、明度、彩度、色相、亮度中至少任何一个以上。
7.根据权利要求1所述的图像处理装置,其特征在于,还具备:
从上述背景除去数据中抽取格线信息的单元;
除去从上述背景除去数据中抽取的格线信息的单元;和
从除去了上述格线信息的背景除去数据中选择特定对象候补,参照上述颜色转换数据,输出特定对象部分的特定对象判别单元。
8.一种图像处理方法,利用具备存储单元、图像取得单元、运算单元、显示单元的处理装置,该图像处理方法具备:
从由上述图像取得单元输入的图像信息中除去背景,生成表示背景以外的区域的背景除去数据的步骤;
生成颜色转换数据的步骤,该颜色转换数据是在输入的图像信息的背景以外的区域中,将与特定对象有关的轮廓的像素的颜色信息转换为在上述轮廓的内侧的像素的颜色信息的颜色转换数据;
将上述背景除去数据及颜色转换数据存储在存储单元中的步骤;和
从存储在上述存储单元中的背景除去数据中选择特定对象候补,参照上述颜色转换数据,将特定对象部分输出到上述显示单元中的特定对象判别步骤。
9.根据权利要求8所述的图像处理方法,其特征在于:
上述图像信息是图像的彩色图像信息或亮度信息。
10.根据权利要求8所述的图像处理方法,其特征在于:
在上述生成颜色转换数据的步骤中,
从表示上述背景以外的图像信息的背景除去数据中选择包含多个像素的领域,
生成领域内的像素的亮度值,
生成将领域内的关注像素的亮度值转换为在领域内的像素中最低的亮度值的颜色转换数据。
11.根据权利要求8所述的图像处理方法,其特征在于:
上述图像信息是存储在外部存储装置中的信息、利用图像取得装置取得的信息、或从通信装置输入的信息中的任一个。
12.根据权利要求8所述的图像处理方法,其特征在于:
在上述生成颜色转换数据的步骤中,
对于领域内的关注像素,参照作为领域内的关注像素以外的像素的附近像素,
生成将上述关注像素的颜色信息转换为在附近像素和关注像素中亮度值最低的像素的颜色信息的低亮度颜色膨胀亮度数据。
13.根据权利要求8所述的图像处理方法,其特征在于:
上述颜色信息是红色分量、蓝色分量、绿色分量、明度、彩度、色相、亮度中至少任何一个以上。
14.根据权利要求8所述的图像处理方法,其特征在于,还具备:
从上述背景除去数据中抽取格线信息的步骤;
除去从上述背景除去数据中抽取的格线信息的步骤;和
从除去上述格线信息的背景除去数据中选择特定对象候补,参照上述颜色转换数据,输出特定对象部分的特定对象判别步骤。
15.一种图像处理程序,为了进行图像处理而使计算机作为如下单元发挥功能:
从由图像取得单元输入的图像信息除去背景,生成表示背景以外的区域的背景除去数据的单元;
生成颜色转换数据的单元,该颜色转换数据是在输入的图像信息的背景以外的区域中,将与特定对象有关的轮廓的像素的颜色信息转换为在上述轮廓的内侧的像素的颜色信息的颜色转换数据;
将上述背景除去数据及颜色转换数据存储在存储单元中的单元;和
从存储在上述存储单元中的背景除去数据选择特定对象候补,参照上述颜色转换数据,将特定对象部分输出到上述显示单元中的特定对象判别单元。
CN2008100058810A 2007-04-25 2008-02-15 图像处理装置及图像处理方法 Expired - Fee Related CN101295359B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2007-114988 2007-04-25
JP2007114988A JP4857173B2 (ja) 2007-04-25 2007-04-25 画像処理装置、画像処理方法及び画像処理プログラム

Publications (2)

Publication Number Publication Date
CN101295359A true CN101295359A (zh) 2008-10-29
CN101295359B CN101295359B (zh) 2010-09-29

Family

ID=40048876

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008100058810A Expired - Fee Related CN101295359B (zh) 2007-04-25 2008-02-15 图像处理装置及图像处理方法

Country Status (4)

Country Link
JP (1) JP4857173B2 (zh)
KR (1) KR101461233B1 (zh)
CN (1) CN101295359B (zh)
TW (1) TWI350997B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101916327A (zh) * 2010-07-09 2010-12-15 北京商纳科技有限公司 一种生成错题本的方法及***
CN106228157A (zh) * 2016-07-26 2016-12-14 江苏鸿信***集成有限公司 基于图像识别技术的彩色图像文字段落分割与识别方法
CN106599818A (zh) * 2016-12-07 2017-04-26 广州视源电子科技股份有限公司 一种基于图片生成笔迹格式的文件的方法及装置
CN107659799A (zh) * 2016-07-25 2018-02-02 佳能株式会社 摄像装置、图像处理方法和存储介质
CN109104545A (zh) * 2017-06-20 2018-12-28 富士施乐株式会社 图像处理设备、图像处理方法和图像处理***
CN109389658A (zh) * 2017-08-10 2019-02-26 富士施乐株式会社 信息处理装置
CN110536043A (zh) * 2018-05-23 2019-12-03 富士施乐株式会社 信息处理装置、信息处理方法及存储介质
CN110895696A (zh) * 2019-11-05 2020-03-20 泰康保险集团股份有限公司 一种图像信息提取方法和装置
CN113083804A (zh) * 2021-04-25 2021-07-09 中国铁建重工集团股份有限公司 激光智能除锈方法、***及可存读介质

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5127739B2 (ja) * 2009-02-06 2013-01-23 キヤノン株式会社 画像処理方法および画像処理装置およびプログラム
JP5337563B2 (ja) * 2009-04-08 2013-11-06 日立コンピュータ機器株式会社 帳票認識方法および装置
JP5867045B2 (ja) * 2011-12-12 2016-02-24 富士ゼロックス株式会社 画像処理装置及びプログラム
RU2534005C2 (ru) * 2013-02-01 2014-11-27 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ и система преобразования моментального снимка экрана в метафайл
US10083364B2 (en) 2014-04-16 2018-09-25 Glory Ltd. Method and apparatus for removing character background from colored image

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58142675A (ja) * 1982-02-18 1983-08-24 Sanyo Electric Co Ltd カラ−画像処理方式
JP3048158B2 (ja) * 1988-10-04 2000-06-05 キヤノン株式会社 カラー画像処理装置
JP2746692B2 (ja) * 1989-10-09 1998-05-06 富士通株式会社 色画像データ処理装置
JPH0414960A (ja) * 1990-05-09 1992-01-20 Fujitsu Ltd カラー読取装置
JPH06266816A (ja) * 1993-03-12 1994-09-22 Fujitsu Ltd カラー画像処理方法及びカラー画像処理装置
JP3923293B2 (ja) * 2000-11-22 2007-05-30 シャープ株式会社 画像処理方法および画像処理装置ならびに画像形成装置
JP4141310B2 (ja) * 2003-04-16 2008-08-27 株式会社リコー 画像処理装置、画像処理方法、およびコンピュータが実行するためのプログラム
JP4423076B2 (ja) * 2004-03-22 2010-03-03 キヤノン株式会社 認識対象切出し装置および方法
JP2006042267A (ja) * 2004-07-30 2006-02-09 Canon Inc 画像処理方法、画像処理装置、およびプログラム
JP4127691B2 (ja) * 2004-10-04 2008-07-30 株式会社東芝 文字認識装置及びその方法
TWI309026B (en) * 2005-04-12 2009-04-21 Newsoft Technology Corp Method for auto-cropping image objects and method for detecting image object contour
KR20060109211A (ko) * 2005-04-15 2006-10-19 삼성전자주식회사 에이브이 시스템 및 에이브이 시스템의 비트맵 폰트 외곽선생성 방법

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101916327A (zh) * 2010-07-09 2010-12-15 北京商纳科技有限公司 一种生成错题本的方法及***
CN101916327B (zh) * 2010-07-09 2011-11-09 北京商纳科技有限公司 一种生成错题本的方法及***
CN107659799B (zh) * 2016-07-25 2022-03-25 佳能株式会社 摄像装置、图像处理方法和存储介质
CN107659799A (zh) * 2016-07-25 2018-02-02 佳能株式会社 摄像装置、图像处理方法和存储介质
CN106228157A (zh) * 2016-07-26 2016-12-14 江苏鸿信***集成有限公司 基于图像识别技术的彩色图像文字段落分割与识别方法
CN106599818B (zh) * 2016-12-07 2020-10-27 广州视源电子科技股份有限公司 一种基于图片生成笔迹格式的文件的方法及装置
CN106599818A (zh) * 2016-12-07 2017-04-26 广州视源电子科技股份有限公司 一种基于图片生成笔迹格式的文件的方法及装置
CN109104545A (zh) * 2017-06-20 2018-12-28 富士施乐株式会社 图像处理设备、图像处理方法和图像处理***
CN109389658A (zh) * 2017-08-10 2019-02-26 富士施乐株式会社 信息处理装置
CN109389658B (zh) * 2017-08-10 2023-07-28 富士胶片商业创新有限公司 信息处理装置
CN110536043A (zh) * 2018-05-23 2019-12-03 富士施乐株式会社 信息处理装置、信息处理方法及存储介质
US11399119B2 (en) 2018-05-23 2022-07-26 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium storing program for color conversion
CN110895696A (zh) * 2019-11-05 2020-03-20 泰康保险集团股份有限公司 一种图像信息提取方法和装置
CN113083804A (zh) * 2021-04-25 2021-07-09 中国铁建重工集团股份有限公司 激光智能除锈方法、***及可存读介质

Also Published As

Publication number Publication date
JP2008269509A (ja) 2008-11-06
TW200842734A (en) 2008-11-01
JP4857173B2 (ja) 2012-01-18
KR20080095743A (ko) 2008-10-29
TWI350997B (en) 2011-10-21
CN101295359B (zh) 2010-09-29
KR101461233B1 (ko) 2014-11-12

Similar Documents

Publication Publication Date Title
CN101295359B (zh) 图像处理装置及图像处理方法
CN107633239B (zh) 基于深度学习和ocr的票据分类及票据字段提取方法
US20160117570A1 (en) Note recognition and management using color classification
CN103699532B (zh) 图像颜色检索方法和***
Kanagarathinam et al. Text detection and recognition in raw image dataset of seven segment digital energy meter display
CN107066972B (zh) 基于多通道极值区域的自然场景文本检测方法
JP5701181B2 (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
JP5830338B2 (ja) 帳票認識方法および帳票認識装置
CN107659799B (zh) 摄像装置、图像处理方法和存储介质
CN104408449A (zh) 智能移动终端场景文字处理方法
CN106203415A (zh) 一种基于数字图像处理的银行***自动识别装置
CN104008401A (zh) 一种图像文字识别的方法及装置
CN110598566A (zh) 图像处理方法、装置、终端和计算机可读存储介质
CN106446885A (zh) 纸介盲文识别方法和***
CN103530625A (zh) 一种基于数字图像处理的光学字符识别方法
Khan et al. Car Number Plate Recognition (CNPR) system using multiple template matching
RU2603495C1 (ru) Классификация изображений документов на основе параметров цветовых слоев
Patil et al. Multi font and size optical character recognition using template matching
CN110619331A (zh) 一种基于颜色距离的彩色影像字段定位方法
JP2014071556A (ja) 画像処理装置、画像処理方法、及びプログラム
CN113065407B (zh) 基于注意力机制和生成对抗网络的财务票据***擦除方法
CN101620668A (zh) 近单色文字特征撷取的影像辨识处理***及其方法
CN114581922A (zh) 一种基于深度学习的中文手写签名识别方法及***
JP3955467B2 (ja) 画像処理プログラム及び画像処理装置
Karthick et al. Consumer service number recognition using template matching algorithm for improvements in ocr based energy consumption billing

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100929

Termination date: 20180215

CF01 Termination of patent right due to non-payment of annual fee