JP2006023983A - 文字画像分離装置、文字画像分離方法、文字画像分離プログラム、およびこのプログラムを格納した記録媒体 - Google Patents

文字画像分離装置、文字画像分離方法、文字画像分離プログラム、およびこのプログラムを格納した記録媒体 Download PDF

Info

Publication number
JP2006023983A
JP2006023983A JP2004201619A JP2004201619A JP2006023983A JP 2006023983 A JP2006023983 A JP 2006023983A JP 2004201619 A JP2004201619 A JP 2004201619A JP 2004201619 A JP2004201619 A JP 2004201619A JP 2006023983 A JP2006023983 A JP 2006023983A
Authority
JP
Japan
Prior art keywords
character
ruled line
pixel
region
processing target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004201619A
Other languages
English (en)
Inventor
Hideaki Yamagata
秀明 山形
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2004201619A priority Critical patent/JP2006023983A/ja
Publication of JP2006023983A publication Critical patent/JP2006023983A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

【課題】
学習の容易な統計的手法を用いて、小領域ごとに文字領域とそれ以外の領域を分離し、その結果を統合することで、信頼性の高い文字領域抽出結果を得ることができる。
【解決手段】
文字・罫線抽出装置11は、処理対象画像中の文字または罫線を抽出するものであって、処理対象画像をn×m個の画素からなる小領域Rに分割する処理対象画像分割手段111と、処理対象画像分割手段111により分割した各小領域Rごとに、当該領域Rに文字または罫線が含まれるか否かを、小領域Rの位置をずらして繰り返して判定する文字・罫線領域判定手段112と、文字・罫線領域判定手段112により各画素について判定した結果を統合することで、処理対象画像から文字・罫線を分離する文字・罫線抽出手段113とを備えたことを特徴とする。
【選択図】 図1

Description

本発明は、学習の容易な統計的手法を用いて、小領域ごとに文字領域とそれ以外の領域を分離し、その結果を統合することで、信頼性の高い文字領域抽出結果を得ることができる文字画像分離装置、文字画像分離方法、文字画像分離プログラム、およびこのプログラムを格納した記録媒体に関する。
従来、文字認識装置の前段の処理として、画像中の文字領域を抽出する処理は数多く提案されてきた。その多くは2値の文書画像をターゲットとしたものであり、画像から抽出された矩形の情報などを用いてルールベースでの判定を行う方法が主流であった。
一方、近年では保存媒体の大容量化・低価格化や、ネットワークの転送速度の向上、コンピュータの性能向上などを背景に、カラー画像を取り扱うケースが増加している。高解像度のカラー画像については近年本格的な流通・保存が開始されたところであり、画像の処理などに関してもまだまだ改善の余地は大きい。
この種の文字認識においても、画像の容量削減などのために画像中から文字領域を抽出する処理は重要となる。例えば、PDFなどにおいては、文字画像を分離し、別のレイヤーとして保存することで、ファイルの容量を小さくする事が可能である(特許文献1,2参照)。
(特開2001−186356 特開2002−369011
これら情報圧縮の観点からは、文字画像とそれ以外を画素単位で分離する必要は無く、適当な大きさ(典型的には8×8画素など)の小領域ごとに文字領域であるか、文字以外の領域であるかを分離できれば十分な場合が多い。また、対象とする画像は2値画像の場合と比較して非常にバラエティに富んでおり、ルールベースでの識別を行う場合、ルールの構築に多くの時間を要することとなる。
本発明はこのような背景の下になされたものであり、学習の容易な統計的手法を用いて、小領域ごとに文字領域とそれ以外の領域を分離し、その結果を統合することで、信頼性の高い文字領域抽出結果を得ることができる文字画像分離装置、文字画像分離方法、文字画像分離プログラム、およびこのプログラムを格納した記録媒体を提供することを目的とする。
本発明の文字・罫線抽出装置は、処理対象画像中の文字または罫線を抽出するものであって、前記処理対象画像をn×m個の画素からなる小領域に分割する処理対象画像分割手段と、前記処理対象画像分割手段により分割した前記各小領域ごとに、当該領域に文字または罫線が含まれるか否かを、前記小領域の位置をずらして繰り返して判定する文字・罫線領域判定手段と、前記文字・罫線領域判定手段により各画素について判定した結果を統合することで、処理対象画像から文字・罫線を分離する文字・罫線抽出手段とを備えたことを特徴とする。
本発明の文字・罫線抽出装置では、前記文字・罫線抽出手段により分離した前記文字または前記罫線、あるいは前記処理対象画像から前記文字または前記罫線を分離した後の画像を出力する画像出力手段を備えることができる。
本発明の文字・罫線抽出装置では、前記文字・罫線領域判定手段は、同一画素についての異なる小領域の判定結果を統合して文字領域であるか否かを判断するようにできる。
本発明の文字・罫線抽出装置では、前記文字・罫線領域判定手段が、前記小領域が文字または罫線を含む領域であると判定したときは、各画素ごとに設けられたカウンタに「1」を加算し、当該カウンタの値が所定しきい値を超えたときは、当該画素が文字または罫線の一部であると判断する文字・罫線判断手段を備えることができる。
本発明の文字・罫線抽出装置では、前記小領域内の各画素の値をソートする画素値ソート手段と、前記画素値ソート手段により得られた画素値列を特徴ベクトルとして、前記各画素が文字または罫線を構成するか否かを判定する文字構成画素判定手段とを備えることができる。
本発明の文字・罫線抽出装置では、前記文字構成画素判定手段は、前記画素値ソート手段によりソートした前記各画素値について隣接する画素値との差を算出し、当該差をソートして得られた差分値列を特徴ベクトルとして、前記各画素が文字または罫線を構成するか否かを判定するようにできる。
本発明の文字画像分離方法は、処理対象画像中の文字または罫線を抽出するものであって、前記処理対象画像をn×m個の画素からなる小領域に分割する処理対象画像分割ステップと、前記処理対象画像分割ステップにおいて分割した前記各小領域ごとに、当該領域に文字または罫線が含まれるか否かを、前記小領域の位置をずらして繰り返して判定する文字・罫線領域判定ステップと、前記文字・罫線領域判定ステップにおいて各画素について判定した結果を統合することで、処理対象画像から文字・罫線を分離する文字・罫線抽出ステップとを有することを特徴とする。
本発明の文字画像分離方法では、前記文字・罫線抽出ステップにおいて分離した前記文字または前記罫線、あるいは前記処理対象画像から前記文字または前記罫線を分離した後の画像を出力する画像出力ステップを有することをができる。
本発明の文字画像分離方法では、前記文字・罫線領域判定ステップは、同一画素についての異なる小領域の判定結果を統合して文字領域であるか否かを判断することができる。
本発明の文字画像分離方法では、前記文字・罫線領域判定ステップにおいて、前記小領域が文字または罫線を含む領域であると判定したときは、各画素ごとに設けられたカウンタに「1」を加算し、当該カウンタの値が所定しきい値を超えたときは、当該画素が文字または罫線の一部であると判断する文字・罫線判断ステップを有することができる。
本発明の文字画像分離方法では、前記小領域内の各画素の値をソートする画素値ソートステップと、前記画素値ソートステップにおいて得られた画素値列を特徴ベクトルとして、前記各画素が文字または罫線を構成するか否かを判定する文字構成画素判定ステップとを有することができる。
本発明の文字画像分離方法では、前記文字構成画素判定ステップは、前記画素値ソートステップによりソートした前記各画素値について隣接する画素値との差を算出し、当該差をソートして得られた差分値列を特徴ベクトルとして、前記各画素が文字または罫線を構成するか否かを判定することができる。
本発明の文字画像分離プログラムは、上記各ステップするコンピュータにより実行可能なもので、この文字画像分離プログラムはコンピュータにより読取り可能な記録媒体に格納することができる。
本発明によれば、学習の容易な統計的手法を用いて、小領域ごとに文字領域とそれ以外の領域を分離し、その結果を統合することで、信頼性の高い文字領域抽出結果を得ることができる。
以下、本発明の実施形態を説明する。
〔第1実施形態〕
図1は第1実施形態にかかる文字画像分離装置を示す機能ブロック図である。
図1において、文字画像分離装置11は、処理対象画像中の文字または罫線を抽出するもので、処理対象画像分割手段111と、文字・罫線領域判定手段112と、文字・罫線抽出手段113と、画像出力手段114と、文字・罫線判断手段115と、画素値ソート手段116と、文字構成画素判定手段117とを備えている。
処理対象画像分割手段111は、処理対象画像OGをn×m個の画素からなる小領域Rに分割することができる。
文字・罫線領域判定手段112は、処理対象画像分割手段111により分割した各小領域Rごとに、各小領域Rに文字または罫線が含まれるか否かを、小領域Rの位置をずらして繰り返して判定する。文字・罫線領域判定手段112は、同一画素についての異なる小領域の判定結果を統合(合成)して文字領域であるか否かを判断することができる。
文字・罫線抽出手段113は、文字・罫線領域判定手段112により各画素について判定した結果を統合することで、処理対象画像OGから文字または罫線を分離することができる。
画像出力手段114は、文字・罫線抽出手段113により分離した文字または罫線、あるいは処理対象画像OGから文字または罫線を分離した後の画像を出力することができる。
文字・罫線判断手段115は、文字・罫線領域判定手段113が、小領域Rが文字または罫線を含む領域であると判定したときは、各画素ごとに設けられたカウンタ1151に「1」を加算し、当該カウンタの値が所定しきい値を超えたときは、当該画素が文字または罫線の一部であると判断することができる。
画素値ソート手段116は、小領域R内の各画素の値をソートし、文字構成画素判定手段117は、画素値ソート手段116により得られた画素値列を特徴ベクトルとして、前記各画素が文字または罫線を構成するか否かを判定することができる。文字構成画素判定手段117は、画素値ソート手段116によりソートした各画素値について、隣接する画素値との差を算出し、当該差をソートして得られた差分値列を特徴ベクトルとして、各画素が文字または罫線を構成するか否かを判定することができる。
上述した各手段は、コンピュータの記憶装置(RAMやROM)に格納されたプログラムをCPU等のプロセッサが、処理対象画像分割ステップと、文字・罫線領域判定ステップと、文字・罫線抽出ステップと、画像出力ステップと、文字・罫線判断ステップと、画素値ソートステップと、文字構成画素判定ステップとして実行することにより達成することができ、あるいはDSPにより達成することができる。
以下、処理対象画像OG画像から文字を抽出する場合を説明する。なお、経線の抽出についても、文字抽出と同じである。
処理対象画像OGは、まず処理対象画像分割手段111に入力される。ここでは、フルカラーの24bit画像(R.G.Bそれぞれ8bit)が入力されたものとする。
文字・罫線領域判定手段112は、原画像OGをm×n(ここでは、8×8)画素の小領域Rに分割する。小領域Rの、左上の座標は(x,y)(x=0,1,2,・・・,xm、y=0,1,2,・・・,ym)となる。図2,図3,図4は、その一例を示すもので、小領域Rの開始点(左上の座標)は図2では(0,0)に、図3では(2,0)に、図4では(0,1)に設定されている。以後、必要に応じて、開始点座標を用いて、それぞれの小領域Rを(x,y)(x=0,1,2,・・・,xm、y=0,1,2,・・・,ym)で表す。
次に、画素値ソート手段116は小領域Rにおいて、各画素の明度を特徴量として算出し、明度値の大きい順に値をソートする。
特徴量はベクトルであり、その概念図を図5(A)に示す。図5(A)では、説明の便宜上8次元ベクトルの場合を示しているが、本実施形態では特徴量は64次元ベクトルである。
図5(B)は、明度値順にソートしたヒストグラムである。図5(C)は、隣り合う小領域のヒストグラムとの差を示す図である。
文字構成画素判定手段117、図5(D)に示すように、(C)における差を大きさ順にソートし、各小領域について得られた、64次元ベクトルを用いて、各画素が文字領域であるか、そうでないかを判定する。このようなベクトルを用いた識別については、過去に数多くの手法が提案されている。ベクトル間の相違度を算出する方法としてはユークリッド距離やマハラノビス距離などが代表的であり、それを利用したクラスタリング手法としてはWard法やK−mean法などが提案されているので、文字列画像を収集して、あらかじめ所定の方法で学習しておけばよい。また、近年では2値分類に適した手法として、Support Vector Machine なども応用が盛んであるので、本発明に適用してもよい。
ここでは、64次元のベクトルについて、あらかじめ典型的な文字画像のベクトルを複数求めておき、そのベクトルとの間でユークリッド距離を算出し、ユークリッド距離が所定のしきい値よりも小さかった場合にその小領域が文字画像であったと判定する。
このような判定処理を、小領域R(x,y)の全てについて行う。
文字・罫線抽出手段113は、全ての小領域Rについて判定処理が終了したならば、処理対象画像OG上の各画素について、その画素の属する全ての小領域Rの判定結果を統合する。
文字・罫線判断手段115は、統合(合成)にあたっては、文字・罫線領域判定手段113が、小領域Rが文字領域であると判定した場合には、その文字領域が属する画素の各画素に対応するカウンタ1151に「1」を、それ以外の場合には「0」を加える。
ある画素について、その画素が属する全ての小領域Rについての値がカウンタに加算される。したがって、1つの画素には、64個の小領域に属するので、この値は0〜64の値をとる。この値が32以上の場合にその画素は文字の一部であり、それ以外の場合には文字以外であると判断する。
〔第2実施形態〕
本実施形態では、各画素について文字領域であるか否かを判断する部分までは第1実施形態と処理が同じであるので、説明を省略する。
本実施形態では、画素単位の判定結果に基づいて、再び小領域単位での文字であるか田舎の判定を行う。画像圧縮などを目的とする場合、小領域Rごとに文字が含まれているか否かの判定を行うことは重要な処理である。
ここでは、原画像OGを、小領域Rmn(8×m,8×n)(m=0,1,・・・,M、n=0,1,・・・,N)に分割する。
まず、小領域Rmn(この小領域は重ならないように選ばれる)について、文字の一部であると判断された画素の数を算出する。この画素の数が32画素以上の場合には、この小領域Rmnを文字画像領域とし、同時に32との差分をエラーとして算出する。たとえば、小領域Rmn内で文字の一部であると判断された画素数が43の場合には、この小領域Rmnを文字画像領域とし、エラーは9である。一方、小領域Rmn内で文字の一部であると判断された画素数が31以下の場合には、この小領域Rmnは文字以外の領域と判断し、31との差分をエラーとして算出する。
たとえば、小領域Rmn内に文字の一部であると判断された画素数が19の場合には、この小領域Rmnは文字画像領域RLではないとし、エラーは12である。
この処理を全ての小領域Rmnに対して行い、エラー合計値E(m,n)(m=0,1,・・・,M、n=0,1,・・・,N)を求める。そして、エラー合計値E(m,n)が最小となる小領域Rmnにより、最終的に文字画像領域RLと、それ以外の領域を判別する。この処理により、8×8の小領域Rmn単位で文字画像領域が抽出される。
〔第3実施形態〕
本実施形態では、第1実施形態とは異なる特徴量を用いる。文字画像には、図2から図4の例にも示したように、エッジがはっきりと現れる場合が多い。そこで、本実施形態では第1実施形態で用いた画素濃度の代わりに、エッジ強度のヒストグラムを用いる。エッジ強度の算出には、種々の方法が提案されている。カラー画像のエッジ強度を算出する方法の一例として、たとえば、特開2003−187253に示されているような手法を用いればよい。
本実施形態では、まず、図5(A)に示すように、各画素についてのエッジ強度のヒストグラムを作成する。次に、図5(B)に示すように得られたヒストグラムをエッジ強度の強い順にソートし、図5(C)に示すように得られたヒストグラムについて隣り合うヒストグラムの差分を算出し、図5(D)に示すようにその差分をソートした結果を特徴ベクトルとして用いる。
残りの処理については第1実施形態と同じである。
〔第4実施形態〕
第1実施形態とは異なる特徴量を用いる。文字画像は、線分を基に構成されているので、画像や背景と比較すると、周波数軸で特徴が現れる場合が多い。
そこで、例えば8×8画素の画像に対して離散コサイン変換を施し、得られた周波数成分をそのまま特徴量(特徴ベクトル)として用いることもできる。
〔第5実施形態〕
画像の圧縮を目的とした場合に最適な小領域のサイズと、文字領域を識別するために最適な小領域のサイズは必ずしも同じとは限らない。
本実施形態においては、文字領域を識別するために最適な小領域Rの大きさが4×4画素、画像圧縮時には8×8画素の単位で文字領域の判定を行う場合に圧縮効率を最適化することができる。
本実施形態では、処理対象画像OGは、まず処理対象画像分割手段111に入力される。ここではフルカラーの24bit画像(R.G.Bそれぞれ8bit)が入力されたものとする。処理対象画像分割手段111では、処理対象画像OGを、たとえば4×4画素ごとの小領域rに分割する。そして、小領域rは、各画素について16通りとなる。以後、開始点座標を用いてそれぞれの小領域をr(x,y)として示す。
次に、文字・罫線領域判定手段112は各小領域rにおいて、各画素の明度を算出し(図5(A)参照)、明度値の大きい順に値をソートする(図5(B)参照)。得られた16次元のベクトルを用いて、文字領域であるか、それ以外であるかを判定する。判定の方法については第1実施形態で説明したので、ここでは説明を省略する。
判定処理を小領域r(x,y)の全てについて行う。全ての小領域rについて判定処理が終了したならば、2×2の小領域ごとをまとめて中領域として、文字領域かそれ以外であるかを判定する。ここでは4つの小領域rのうち、2つ以上が文字領域と判定されている場合に、中領域を文字領域であると判断する。これにより、画像圧縮に最適な大きさの領域による文字分割が可能となる。
〔第6実施形態〕
本実施形態では、文字・罫線領域判定手段112は、画素単位の判定結果に基づいて、処理対象画像分割手段111により分割した小領域rとは異なる大きさの領域での文字領域判定を行う。なお、ここでは説明の便宜上、小領域rとは異なる大きさの領域を「r′」とするが、領域r′の大きさが小領域rの大きさよりも小さい場合であっても本発明の適用が可能である。
各画素について文字領域であるか否かを判断する部分までの処理は、第1実施形態の処理と同じであるので、説明を省略する。
本実施形態では、処理対象画像分割手段111は、領域r′は16×16画素からなる中領域により、小領域rの8×8画素を生成した場合と同様に原画像OGを分割する。文字・罫線領域判定手段112は、各中領域r′について、文字領域と判断された画素数を算出する。この画素数は最大で256画素であるが、ここでは文字の一部であると判断された画素数が128画素以上の場合には中領域を文字画像領域と判断する。同様の処理を全ての中領域r′に対して施し、16×16画素ごと(中領域r′)ごとの文字領域検出結果を得る。
本発明の一実施形態を示すブロック図である。 原画像を小領域に分割した例を示す図である。 原画像を小領域に分割した他の例を示す図である。 原画像を小領域に分割したさらに他の例を示す図である。 特徴量ベクトルの説明図であり、(A)は各画素値のヒストグラムを示す図、(B)は、明度値順にソートしたヒストグラム、(C)は隣り合う小領域のヒストグラムとの差を示す図、(D)は(C)における差を大きさ順にソートした結果を示す図である。
符号の説明
11 文字画像分離装置
111 処理対象画像分割手段
112 文字・罫線領域判定手段
113 文字・罫線抽出手段
114 画像出力手段
115 文字・罫線判断手段
116 画素値ソート手段
117 文字構成画素判定手段

Claims (14)

  1. 処理対象画像中の文字または罫線を抽出する文字・罫線抽出装置であって、
    前記処理対象画像をn×m個の画素からなる小領域に分割する処理対象画像分割手段と、
    前記処理対象画像分割手段により分割した前記各小領域ごとに、当該領域に文字または罫線が含まれるか否かを、前記小領域の位置をずらして繰り返して判定する文字・罫線領域判定手段と、
    前記文字・罫線領域判定手段により各画素について判定した結果を統合することで、処理対象画像から文字・罫線を分離する文字・罫線抽出手段と、
    を備えたことを特徴とする文字画像分離装置。
  2. 前記文字・罫線抽出手段により分離した前記文字または前記罫線、あるいは前記処理対象画像から前記文字または前記罫線を分離した後の画像を出力する画像出力手段を備えたことを特徴とする請求項1に記載の文字画像分離装置。
  3. 前記文字・罫線領域判定手段は、同一画素についての異なる小領域の判定結果を統合して文字領域であるか否かを判断することを特徴とする請求項1または2に記載の文字画像分離装置。
  4. 前記文字・罫線領域判定手段が、前記小領域が文字または罫線を含む領域であると判定したときは、各画素ごとに設けられたカウンタに「1」を加算し、当該カウンタの値が所定しきい値を超えたときは、当該画素が文字または罫線の一部であると判断する文字・罫線判断手段を備えたことを特徴とする請求項1から3の何れかに記載の文字画像分離装置。
  5. 前記小領域内の各画素の値をソートする画素値ソート手段と、
    前記画素値ソート手段により得られた画素値列を特徴ベクトルとして、前記各画素が文字または罫線を構成するか否かを判定する文字構成画素判定手段と、
    を備えたことを特徴とする請求項1から4の何れかに記載の文字画像分離装置。
  6. 前記文字構成画素判定手段は、前記画素値ソート手段によりソートした前記各画素値について隣接する画素値との差を算出し、当該差をソートして得られた差分値列を特徴ベクトルとして、前記各画素が文字または罫線を構成するか否かを判定することを特徴とする請求項5に記載の文字画像分離装置。
  7. 処理対象画像中の文字または罫線を抽出する文字・罫線抽出方法であって、
    前記処理対象画像をn×m個の画素からなる小領域に分割する処理対象画像分割ステップと、
    前記処理対象画像分割ステップにおいて分割した前記各小領域ごとに、当該領域に文字または罫線が含まれるか否かを、前記小領域の位置をずらして繰り返して判定する文字・罫線領域判定ステップと、
    前記文字・罫線領域判定ステップにおいて各画素について判定した結果を統合することで、処理対象画像から文字・罫線を分離する文字・罫線抽出ステップと、
    を有することを特徴とする文字画像分離方法。
  8. 前記文字・罫線抽出ステップにおいて分離した前記文字または前記罫線、あるいは前記処理対象画像から前記文字または前記罫線を分離した後の画像を出力する画像出力ステップを有することを特徴とする請求項7に記載の文字画像分離方法。
  9. 前記文字・罫線領域判定ステップは、同一画素についての異なる小領域の判定結果を統合して文字領域であるか否かを判断することを特徴とする請求項7または8に記載の文字画像分離方法。
  10. 前記文字・罫線領域判定ステップにおいて、前記小領域が文字または罫線を含む領域であると判定したときは、各画素ごとに設けられたカウンタに「1」を加算し、当該カウンタの値が所定しきい値を超えたときは、当該画素が文字または罫線の一部であると判断する文字・罫線判断ステップを有することを特徴とする請求項7から9の何れかに記載の文字画像分離方法。
  11. 前記小領域内の各画素の値をソートする画素値ソートステップと、
    前記画素値ソートステップにおいて得られた画素値列を特徴ベクトルとして、前記各画素が文字または罫線を構成するか否かを判定する文字構成画素判定ステップと、
    を有することを特徴とする請求項7から10の何れかに記載の文字画像分離方法。
  12. 前記文字構成画素判定ステップは、前記画素値ソートステップによりソートした前記各画素値について隣接する画素値との差を算出し、当該差をソートして得られた差分値列を特徴ベクトルとして、前記各画素が文字または罫線を構成するか否かを判定することを特徴とする請求項11に記載の文字画像分離方法。
  13. 請求項7から12に記載の各ステップするコンピュータにより実行可能な文字画像分離プログラム。
  14. 請求項13に記載の文字画像分離プログラムを格納したコンピュータにより読取り可能な記録媒体。
JP2004201619A 2004-07-08 2004-07-08 文字画像分離装置、文字画像分離方法、文字画像分離プログラム、およびこのプログラムを格納した記録媒体 Pending JP2006023983A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004201619A JP2006023983A (ja) 2004-07-08 2004-07-08 文字画像分離装置、文字画像分離方法、文字画像分離プログラム、およびこのプログラムを格納した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004201619A JP2006023983A (ja) 2004-07-08 2004-07-08 文字画像分離装置、文字画像分離方法、文字画像分離プログラム、およびこのプログラムを格納した記録媒体

Publications (1)

Publication Number Publication Date
JP2006023983A true JP2006023983A (ja) 2006-01-26

Family

ID=35797213

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004201619A Pending JP2006023983A (ja) 2004-07-08 2004-07-08 文字画像分離装置、文字画像分離方法、文字画像分離プログラム、およびこのプログラムを格納した記録媒体

Country Status (1)

Country Link
JP (1) JP2006023983A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010092224A (ja) * 2008-10-07 2010-04-22 Canon Inc 画像処理装置及び画像処理方法
JP2012194705A (ja) * 2011-03-15 2012-10-11 Omron Corp 画像処理装置、画像処理方法および画像処理プログラム
JP2013031104A (ja) * 2011-07-29 2013-02-07 Brother Ind Ltd 画像処理装置およびプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010092224A (ja) * 2008-10-07 2010-04-22 Canon Inc 画像処理装置及び画像処理方法
US8542948B2 (en) 2008-10-07 2013-09-24 Canon Kabushiki Kaisha Image processing apparatus and method
JP2012194705A (ja) * 2011-03-15 2012-10-11 Omron Corp 画像処理装置、画像処理方法および画像処理プログラム
JP2013031104A (ja) * 2011-07-29 2013-02-07 Brother Ind Ltd 画像処理装置およびプログラム

Similar Documents

Publication Publication Date Title
Abd Warif et al. Copy-move forgery detection: survey, challenges and future directions
JP3740065B2 (ja) 領域分割された映像の領域特徴値整合に基づいた客体抽出装置およびその方法
Santosh et al. Overlaid arrow detection for labeling regions of interest in biomedical images
US20110085728A1 (en) Detecting near duplicate images
US20120163708A1 (en) Apparatus for and method of generating classifier for detecting specific object in image
US20130322743A1 (en) Multi-class identifier, method, and computer-readable recording medium
Lin et al. Reconstruction of shredded document based on image feature matching
JP2008148298A (ja) 画像における異なった内容の領域を識別する方法、画像における異なった内容の領域を識別する装置、および画像における異なった内容の領域を識別するコンピュータ・プログラムを具現するコンピュータ読み取り可能な媒体
CN108875727B (zh) 图文标识的检测方法及装置、存储介质、处理器
Al-Qershi et al. Enhanced block-based copy-move forgery detection using k-means clustering
JP2008251029A (ja) 文字認識装置、ナンバープレート認識システム
WO2007026951A1 (ja) 画像検索方法及び装置
CN112508000B (zh) 一种用于ocr图像识别模型训练数据生成的方法及设备
CN111832497B (zh) 一种基于几何特征的文本检测后处理方法
EP2735997B1 (en) Image processing apparatus
CN116912184B (zh) 一种基于篡改区域分离和区域约束损失的弱监督深度修复图像篡改定位方法及***
CN115410191B (zh) 文本图像识别方法、装置、设备和存储介质
JP2006023983A (ja) 文字画像分離装置、文字画像分離方法、文字画像分離プログラム、およびこのプログラムを格納した記録媒体
CN112288045B (zh) 一种***真伪判别方法
Srinivas et al. Forged File Detection and Steganographic content Identification (FFDASCI) using Deep Learning Techniques.
JP4264332B2 (ja) 文字認識装置、ナンバープレート認識システム
JP4941299B2 (ja) 画像識別システム及び方法
Calarasanu et al. From text detection to text segmentation: a unified evaluation scheme
JP4116377B2 (ja) 画像処理方法および画像処理装置
JP3090070B2 (ja) 帳票識別方法及び装置