JP5322517B2 - 画像処理装置および方法 - Google Patents

画像処理装置および方法 Download PDF

Info

Publication number
JP5322517B2
JP5322517B2 JP2008177907A JP2008177907A JP5322517B2 JP 5322517 B2 JP5322517 B2 JP 5322517B2 JP 2008177907 A JP2008177907 A JP 2008177907A JP 2008177907 A JP2008177907 A JP 2008177907A JP 5322517 B2 JP5322517 B2 JP 5322517B2
Authority
JP
Japan
Prior art keywords
character
rectangle
noise
image
black pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008177907A
Other languages
English (en)
Other versions
JP2010020394A (ja
JP2010020394A5 (ja
Inventor
浩司 前川
茂雄 福岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008177907A priority Critical patent/JP5322517B2/ja
Priority to US12/498,006 priority patent/US8452095B2/en
Publication of JP2010020394A publication Critical patent/JP2010020394A/ja
Publication of JP2010020394A5 publication Critical patent/JP2010020394A5/ja
Application granted granted Critical
Publication of JP5322517B2 publication Critical patent/JP5322517B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/164Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

本発明は画像処理に関する。特に詳細には、文字認識技術の前処理として、イメージ画像からノイズと文字を分離して文字を抽出することに関する。
従来、文字画像からのノイズ除去方法は、画像の膨張と縮小を繰り返すことでノイズを除去する方法と、画像から孤立点を探して、孤立点であると判定した場合にはノイズとして除去する方法が知られていた。
特許文献1では、文字認識処理の実行結果が良好でない場合、切り出されたパターンの左右方向に投影を行い、投影像に基づいてノイズ部分を特定する。そして、切り出されたパターンからノイズ部分を除去した後で再度文字認識を実行する技術が開示されている。
特許文献2では、文字切りだし手段によって切り出した文字画像に対して識別処理を行い、識別結果と識別の確信度を取得する。取得した識別結果を出力するかどうかの判定を行い、出力できないと判定した場合にはノイズ除去手段によってノイズ除去を行い再び識別処理を行う。ノイズ除去を行う際は、孤立黒画素を検出し、検出した孤立黒画素の大きさと他の黒画素からの距離とに基づいて、ノイズの可能性が高い孤立黒画素を削除対象にすることが記載されている。
特許文献3では、行の高さに基づいて基準値を定め、当該基準値以下の大きさの連結黒画素をノイズとして除去する。ノイズ除去した後で文字の切り出しを行い、切り出した画像を文字認識する。
特開平05−210761号公報 特開平07−49926号公報 特開2002−157550号公報
一方、文字の外接矩形が正確に取れていない場合においては、文字認識精度に大きな影響を与えていた。例えば、文字付近のノイズを文字の一部と判断してしまい、図1の1.1のような文字画像とノイズとに外接する文字矩形を抽出することになる。この場合、文字認識のための文字特徴量は1.2のような外接ノイズを含む特徴領域からの特徴量を求めることになる。
図1の1.2のノイズを含む画像から求めた特徴量を、文字認識辞書に格納されている1.3の「ノ」の文字特徴量および1.4の「イ」の文字特徴量と比較した場合、入力画像の特徴量は「イ」の特徴のほうに近いと判定されることがある。このとき、認識結果は「イ」と出力されてしまうことになる。
また、画像内から孤立点を検出する場合、文字領域画像全体を孤立点探索の処理対象として、連結画素の検出や投影処理を行うために、処理負荷が大きくなり速度的に問題があった。
本発明の目的は、上記の課題を解決して、文字矩形抽出の後処理の速度を向上させ、且つ文字認識の精度を向上させることである。
上記課題を解決するために本発明が提供する装置は、文書画像に対して行方向の射影と行方向に垂直な方向の射影とを取ることにより、文字画像を含む矩形領域を文字矩形として抽出する文字矩形抽出手段と、前記抽出した文字矩形の外接枠に沿って黒画素の探索を行って、当該外接枠に接する連結黒画素を取得する取得手段と、前記取得手段で取得した連結黒画素がノイズである可能性があるか否かの判定を行う判定手段と、前記判定手段でノイズである可能性があると判定した連結黒画素を前記文字矩形内の画像から除去し、当該除去後の前記文字矩形内の黒画素に外接する外接矩形の領域をノイズ候補除去文字矩形として生成する生成手段と、前記ノイズ候補除去文字矩形内の画像及び前記文字矩形内の画像についてそれぞれ文字認識処理を実行し、前記ノイズ候補除去文字矩形及び前記文字矩形の形状を解析し、当該解析した各矩形の文字幅と標準文字幅との誤差、及び当該解析した各矩形の文字高さと標準文字高さとの誤差、のうち少なくとも一つと前記文字認識処理結果に基づいて、前記ノイズ候補除去文字矩形と前記文字矩形とのうち妥当性が高いほうの矩形を選択する選択手段とを備える。
上記課題を解決するために本発明が提供する方法は、文字矩形抽出手段が、文書画像に対して行方向の射影と行方向に垂直な方向の射影とを取ることにより、文字画像を含む矩形領域を文字矩形として抽出する文字矩形抽出ステップと、取得手段が、前記抽出した文字矩形の外接枠に沿って黒画素の探索を行って、当該外接枠に接する連結黒画素を取得する取得ステップと、判定手段が、前記取得ステップで取得した連結黒画素がノイズである可能性があるか否かの判定を行う判定ステップと、生成手段が、前記判定ステップでノイズである可能性があると判定した連結黒画素を前記文字矩形内の画像から除去し、当該除去後の前記文字矩形内の黒画素に外接する外接矩形の領域をノイズ候補除去文字矩形として生成する生成ステップと、選択手段が、前記ノイズ候補除去文字矩形内の画像及び前記文字矩形内の画像についてそれぞれ文字認識処理を実行し、前記ノイズ候補除去文字矩形及び前記文字矩形の形状を解析し、当該解析した各矩形の文字幅と標準文字幅との誤差、及び当該解析した各矩形の文字高さと標準文字高さとの誤差、のうち少なくとも一つと前記文字認識処理結果に基づいて、前記ノイズ候補除去文字矩形と前記文字矩形とのうち妥当性が高いほうの矩形を選択する選択ステップとを含む。
上記課題を解決するために本発明が提供するコンピュータプログラムは、コンピュータを、文書画像に対して行方向の射影と行方向に垂直な方向の射影とを取ることにより、文字画像を含む矩形領域を文字矩形として抽出する文字矩形抽出手段、前記抽出した文字矩形の外接枠に沿って黒画素の探索を行って、当該外接枠に接する連結黒画素を取得する取得手段、前記取得手段で取得した連結黒画素がノイズである可能性があるか否かの判定を行う判定手段、前記判定手段でノイズである可能性があると判定した連結黒画素を前記文字矩形内の画像から除去し、当該除去後の前記文字矩形内の黒画素に外接する外接矩形の領域をノイズ候補除去文字矩形として生成する生成手段、前記ノイズ候補除去文字矩形内の画像及び前記文字矩形内の画像についてそれぞれ文字認識処理を実行し、前記ノイズ候補除去文字矩形及び前記文字矩形の形状を解析し、当該解析した各矩形の文字幅と標準文字幅との誤差、及び当該解析した各矩形の文字高さと標準文字高さとの誤差、のうち少なくとも一つと前記文字認識処理結果に基づいて、前記ノイズ候補除去文字矩形と前記文字矩形とのうち妥当性が高いほうの矩形を選択する選択手段、として機能させるためのコンピュータプログラムである。
上記本発明によれば、正確かつ高速にノイズ除去することが可能となり、文字の外接矩形を正確に取得できるために、文字矩形抽出の後処理の速度を向上させ、且つ文字認識の精度を向上させることができる。
図2は本発明に係る画像処理を実施するために必要な情報処理(画像処理)システムのシステム構成を示す構成図である。
スキャナなどの入力装置(3)からの処理画像或いは外部記憶装置(4)に記憶されている処理画像を入力し、RAM(2)上に展開されている処理プログラム(2.2)をCPU(1)で実行することで、処理結果(2.3)を得る。処理結果は出力として出力装置(5)或いは外部記憶装置(4.3)に記憶される。すなわち、処理プログラムは、後述するフローチャートの各ステップの処理を実行する処理ユニット(各処理手段)として、コンピュータ(CPU)を機能させるためのコンピュータプログラムである。
図3は本発明の一実施形態における処理手順を表すフローチャートである。この処理フローに基づいて本発明の実施形態を説明する。
S301では、処理画像として、図4に一例を示すような行領域を切り出して入力する。なお、この行領域は、例えば、文書画像に対する行方向の射影をとり、その射影の黒画素分布位置に基づいて切り出された文字行の画像であるとする。なお、文書画像に対してまず公知の領域分離処理を行うことによりテキスト領域を特定し、当該テキスト領域に対して行方向の射影をとって、行領域の画像を抽出するのが好適である。
S302では、行領域に対する垂直方向の射影情報を使用して、該行領域から文字領域(文字矩形領域)を抽出する。
図4及び図6のように行方向とは垂直方向に射影をとり、黒の射影が繋がっている範囲ごとに文字矩形候補として、文字矩形候補(射影の元になった黒画素を囲む領域)の高さを抽出する。そして、文字矩形候補のうち、所定のサイズより大きいものを文字矩形として取得する。すなわち、抽出した文字矩形候補のサイズが閾値以下(本実施例では高さ4ドット以下、幅4ドット以下)であった場合、当該文字矩形をノイズとして予め除去しておく。
図6の例では、射影に基づいて文字矩形候補を取り出すと文字矩形情報1が得られる。この文字矩形情報1から、文字矩形「b」は4×4以下であると判定されるので、文字矩形情報から削除して、最終的に文字矩形情報2を得ることが出来る。
S303では、S302で取り出した文字矩形情報から、以下のようにして、文字矩形の境界部分に存在するノイズ(外接ノイズ)を除去する。
図5は、図3のS303(外接ノイズ判定処理)における処理手順の詳細を示すフローチャートである。ここでは、図6の文字矩形情報(a)を例として、図5の外接ノイズ判定処理について説明する。
S501では、処理対象となる文字矩形情報(a)を外接ノイズ判定処理に入力する。
S502では、文字矩形の外接枠についてのみの黒画素探索を行い、黒画素検知処理を行う。すなわち、外接枠を構成する辺に沿って順に黒画素であるかどうかを判断する。図7に示した黒画素探索における7.1では、まず外接枠の上辺から順に、外接枠に沿って黒画素を探索している。
S503では外接枠上の画素が黒画素であると判断した場合、ステップS504に進み、当該見つけた黒画素に隣接する黒画素があるか探索する。
S503で黒画素でないと判断した場合、S506に進んで外接枠上の次の画素を検査対象として移動する。
S504では、外接枠上の黒画素に隣接する黒画素を追跡(輪郭追跡)することにより連結黒画素(画素塊)を判断する。このとき、隣接する黒画素を追跡するたびに、輪郭を構成する黒画素の数(輪郭(アウトライン)を構成するストロークの長さ)、X方向の最大位置(Xmax)と最小位置(Xmin)、Y方向の最大位置(Ymax)と最小位置(Ymin)を更新していく。更新するたびに、3通りの場合に、当該連結黒画素(画素塊)はノイズではないと判定する(S505:No)。輪郭を構成する黒画素の数が閾値以上の場合、判定中の黒画素の高さ(Ymax−Ymin)が高さの閾値(thY)よりも大きい場合、或いは幅(Xmax−Xmin)が幅の閾値(thX)よりも大きい場合のいずれかを満たしたと判定した場合である。なお、判定中の黒画素の高さ及び幅から算出される、隣接する黒画素で構成される画素塊の面積や、他の画素塊からの距離を閾値と比較してノイズ判定することもできる。
一方、上述した条件を満たさなかった場合、当該輪郭追跡処理で得た連結黒画素(画素塊)はノイズの可能性があると判定され(S505:Yes)、S509に進み外接枠上のノイズ情報として出力する。
図7の7.2で示した、外接枠上辺で見つけた黒画素の黒画素探索(輪郭追跡処理)では、Ymax−Ymin>thYと判定されるため、追跡中の画素塊はノイズではないという判定を行う。
S506ではノイズではないと判定された場合、黒画素探索開始位置から外接枠上の次の画素を検知対象として移動する。
S507では、外接枠全ての探索が終了したか判断し、終了するまでS503に戻って処理を継続する。一方、外接枠の上辺、右辺、下辺、左辺の全ての検査が終了したならば、S508に進んで、外接枠上にノイズなしと決定する。
図7の7.3の例では、下辺追跡中に再び黒画素が検出され、輪郭線追跡を行った結果、ノイズ(1)として検出する。そして、検出したノイズの情報として図7に示した黒画素探索における7.5の通りに、矩形のX座標(Xn1)、Y座標(Yn1)、矩形幅(Wn1)、矩形高さ(Wh1)、さらにノイズ矩形が外接していた辺(下辺)を、ノイズ情報として出力する。
続いて図3のS304では、外接ノイズ判定によって、ノイズと見なされる矩形領域が外接枠上に見つかったかどうか判定する。
外接枠上にノイズが見つかった場合、S305に進み、ノイズ候補の矩形情報を記憶する。すなわち、S509で得たノイズ情報を記憶する。
本実施例では、ノイズ候補となるノイズ(1)の情報が出力されるので、ノイズ(1)の情報を記憶、保持する。
S306では、ノイズ矩形を除去し、ノイズ除去後の外接矩形(ノイズ候補除去文字矩形)を生成する。
図8のように、ノイズ矩形内を白画素で埋めることにより、ノイズを除去した画像を新たに生成し、外接枠を更新して外接ノイズ判定処理を継続する。本実施例では除去したノイズ矩形のY座標はYn1であるので、Yn1の座標から上から下へ黒画素探索を行い、黒画素がなくなったY座標の位置を新しい外接矩形の下辺とする。上記の処理により、下辺の位置を更新した外接矩形をノイズ除去後の外接矩形として保持する。
上記の処理では、例えば、黒画素が上辺で見つかった場合は、ノイズ矩形のY座標から黒画素探索を開始して黒画素が出現するY座標の位置を新しい外接矩形の上辺とする。同様に、黒画素が右辺で見つかった場合、ノイズ矩形のX座標から黒画素探索を開始して、黒画素がなくなったX座標の位置を新しい外接矩形の右辺とする。同様に、黒画素が左辺で見つかった場合、ノイズ矩形のX座標から黒画素探索を開始して、黒画素が出現するX座標の位置を新しい外接矩形の右辺とする。
ノイズを除去して外接矩形を更新するとS303〜S304の処理に戻り、ノイズ判定処理を継続する。外接枠上の黒画素探索はノイズ(1)が下辺で見つかったため、左辺から行う。外接矩形が変わらなかった場合、最初の外接枠上のノイズが他にもある可能性があるとして下辺の外接枠の探索を継続する。
図8の例では、上、右、左に外接枠上のノイズは発見されず、下辺でノイズが発見された。そこで、1回ノイズ除去された画像に対して、更に、下辺の外接ノイズ判定を行い、図9に示すようにノイズ(2)を出力し、S305でノイズ矩形情報として記憶し、S306でノイズを除去して外接矩形を更新する。この時点で、検出したノイズの矩形情報は図9に示した黒画素探索2のように、ノイズ(2)について矩形のX座標(Xn2)、Y座標(Yn2)、矩形幅(Wn2)、矩形高さ(Wh2)、ノイズ矩形が外接していた辺(下辺)が追加される。
S304の判定で、すべての辺においてノイズ矩形がなくなるまで、上記処理を継続する。
S304において、外接枠上のすべての辺にノイズがないと判定した場合、S306では図10に示すように、元の文字画像から外接ノイズを消したパターンすべてを生成する。すなわち、元の文字矩形1,ノイズ候補除去文字矩形である文字矩形2,文字矩形3が生成される。
S307では、文字矩形の確定処理を行なう。すなわち、上記すべてのパターンについてそれぞれ文字認識処理を行い、それぞれの文字認識結果の妥当性を計算し、妥当性が高いほうの文字矩形を選択する。文字矩形確定に必要な情報として、本実施例では文字の信頼度(類似度)、文字矩形の高さ、文字矩形の幅、平均的な文字の高さ、平均的な文字の幅を確定に必要な妥当性を示す情報として計算し、最も妥当な文字矩形を選択する。
このうち、文字の信頼度については、文字認識処理を行ったときの信頼度を利用する。文字認識処理については、図11を参照して概要を説明する。
文字の外接矩形を取得し、文字矩形をn×m分割する。本実施例では文字矩形1,2,3のそれぞれを、3×3に分割し、分割した部分画像における黒画素分布方向(エッジの方向(縦、横、斜め))を特徴量として求める。
上記のようにして得た文字の特徴量と、予め学習されている文字特徴量(すなわち、文字認識辞書に格納されている文字特徴量)と比較して、特徴量が最も近い文字コードと、その類似度(認識類似度)を信頼度として出力する。
文字矩形1では「イ」の特徴量に近いと判定される。文字矩形2においても「イ」の特徴量に近いと判定される。文字矩形3においては、「ノ」の特徴量に近いと判定される。それぞれの文字矩形に対する文字認識結果として、図12のような情報が得られる。なお、平均幅・平均高さは、行領域から得られた複数の文字矩形の平均である。
これらの情報をもとに、得られた文字矩形のどれが一番妥当かを判定して、妥当と思われる矩形を選択して最終結果として確定する。妥当性の判定は次式に示すような矩形補正値及び妥当性の計算式によって判定する。矩形補正値は文字矩形の形状を解析するものである。
矩形補正値=((文字幅−平均文字幅)/平均文字幅)2+((文字高−平均文字高)/平均文字高)2
妥当性=(1−矩形補正値)×信頼度
文字矩形1に関しては、文字矩形の文字幅と標準文字幅である平均的な文字幅との誤差(30−45)及び文字高さと標準文字高さである平均的な文字高さとの誤差(65−45)から矩形補正値を求め、求めた矩形補正値と信頼度90から妥当性が求められる。
文字矩形1の矩形補正値=((30−45)/45)2+((65−45)/45)2=0.309
文字矩形1の妥当性=(1−0.309)×90=62.2
文字矩形2に関して、同様に矩形補正値及び妥当性が求められる。
文字矩形2の矩形補正値=((30−45)/45)2+((50−45)/45)2=0.123
文字矩形2の妥当性=(1−0.123)×60=52.6
文字矩形3に関して、同様に矩形補正値及び妥当性が求められる。
文字矩形3の矩形補正値=((30−45)/45)2+((40−45)/45)2=0.123
文字矩形3の妥当性=(1−0.123)×90=78.9
そこで、妥当性が高い文字矩形3を最終結果として選択する。
このようにして選択した文字矩形を抽出することで正確かつ高速にノイズ除去することが可能となり、文字の外接矩形を正確に取得できるために、文字矩形抽出の後処理の精度(文字認識の精度)を向上させることができる。また、ノイズの黒画素検知を行う際に、外接枠を対象にして走査を行うので、文字領域全てを走査するのに比べて処理が少なくて済むので、処理速度も速くなる。
(本発明の他の実施形態)
前述した実施形態の機能を実現するように前述した実施形態の構成を動作させるプログラムを記憶媒体に記憶させ、該記憶媒体に記憶されたプログラムをコードとして読み出し、コンピュータにおいて実行する処理方法も上述の実施形態の範疇に含まれる。また、前述のプログラムが記憶された記憶媒体はもちろんそのプログラム自体も上述の実施形態に含まれる。
かかるコンピュータ読み取り可能な記憶媒体としては、たとえばフロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD―ROM、磁気テープ、不揮発性メモリカード、ROMを用いることができる。
また前述の記憶媒体に記憶されたプログラム単体で処理を実行しているものに限らず、他のソフトウエア、拡張ボードの機能と共同して、OS上で動作し前述の実施形態の動作を実行するものも前述した実施形態の範疇に含まれる。
従来技術の課題を説明する図である。 本発明に係る画像処理を実施するために必要な情報処理(画像処理)システムのシステム構成を示す構成図である。 本発明の一実施形態における処理手順を表すフローチャートである。 本発明の一実施形態における行領域画像を表す図である。 図3の処理手順における外接ノイズ判定処理における処理手順を詳細に表すフローチャートである。 本発明の一実施形態における文字矩形抽出処理を説明する図である。 図6の文字矩形抽出処理における文字矩形情報(a)についての黒画素探索1を説明する図である。 本発明の一実施形態においてノイズ除去して更新した外接枠を説明する図である。 本発明の一実施形態における文字矩形情報(a)についての黒画素探索2を説明する図である。 本発明の一実施形態におけるノイズ除去後の文字矩形パターン生成を説明する図である。 本発明の一実施形態における文字認識処理を説明する図である。 本発明の一実施形態における文字矩形比較情報を表す図である。
符号の説明
1 CPU
2 RAM
2.2 処理プログラム
2.3 処理結果
3 入力装置
4 外部記憶装置
4.3 外部記憶装置
5 出力装置

Claims (8)

  1. 文書画像に対して行方向の射影と行方向に垂直な方向の射影とを取ることにより、文字画像を含む矩形領域を文字矩形として抽出する文字矩形抽出手段と、
    前記抽出した文字矩形の外接枠に沿って黒画素の探索を行って、当該外接枠に接する連結黒画素を取得する取得手段と、
    前記取得手段で取得した連結黒画素がノイズである可能性があるか否かの判定を行う判定手段と、
    前記判定手段でノイズである可能性があると判定した連結黒画素を前記文字矩形内の画像から除去し、当該除去後の前記文字矩形内の黒画素に外接する外接矩形の領域をノイズ候補除去文字矩形として生成する生成手段と、
    前記ノイズ候補除去文字矩形内の画像及び前記文字矩形内の画像についてそれぞれ文字認識処理を実行し、前記ノイズ候補除去文字矩形及び前記文字矩形の形状を解析し、当該解析した各矩形の文字幅と標準文字幅との誤差、及び当該解析した各矩形の文字高さと標準文字高さとの誤差、のうち少なくとも一つと前記文字認識処理結果に基づいて、前記ノイズ候補除去文字矩形と前記文字矩形とのうち妥当性が高いほうの矩形を選択する選択手段と
    を備えることを特徴とする画像処理装置。
  2. 請求項1に記載の装置において、
    前記判定手段は、前記連結黒画素の幅、前記連結黒画素の高さ、前記連結黒画素の面積、前記連結黒画素のアウトラインを構成するストロークの長さ、及び、前記連結黒画素の他の連結黒画素からの距離、のうち少なくとも一つに基づいて前記判定を行うことを特徴とする装置。
  3. 請求項に記載の装置において、
    前記選択手段は、前記解析した各矩形の文字幅と標準文字幅との誤差及び前記解析した各矩形の文字高さと標準文字高さとの誤差とに基づいて各矩形の矩形補正値を求め、前記文字認識処理結果として得られた認識類似度と前記求めた矩形補正値とに基づいて、前記妥当性が高いほうの文字矩形を選択することを特徴とする装置。
  4. 文字矩形抽出手段が、文書画像に対して行方向の射影と行方向に垂直な方向の射影とを取ることにより、文字画像を含む矩形領域を文字矩形として抽出する文字矩形抽出ステップと、
    取得手段が、前記抽出した文字矩形の外接枠に沿って黒画素の探索を行って、当該外接枠に接する連結黒画素を取得する取得ステップと、
    判定手段が、前記取得ステップで取得した連結黒画素がノイズである可能性があるか否かの判定を行う判定ステップと、
    生成手段が、前記判定ステップでノイズである可能性があると判定した連結黒画素を前記文字矩形内の画像から除去し、当該除去後の前記文字矩形内の黒画素に外接する外接矩形の領域をノイズ候補除去文字矩形として生成する生成ステップと、
    選択手段が、前記ノイズ候補除去文字矩形内の画像及び前記文字矩形内の画像についてそれぞれ文字認識処理を実行し、前記ノイズ候補除去文字矩形及び前記文字矩形の形状を解析し、当該解析した各矩形の文字幅と標準文字幅との誤差、及び当該解析した各矩形の文字高さと標準文字高さとの誤差、のうち少なくとも一つと前記文字認識処理結果に基づいて、前記ノイズ候補除去文字矩形と前記文字矩形とのうち妥当性が高いほうの矩形を選択する選択ステップと
    を含むことを特徴とする文字矩形抽出方法。
  5. 請求項に記載の方法において、
    前記判定ステップにおいて、前記連結黒画素の幅、前記連結黒画素の高さ、前記連結黒画素の面積、前記連結黒画素のアウトラインを構成するストロークの長さ、及び、前記連結黒画素の他の連結黒画素からの距離、のうち少なくとも一つに基づいて前記判定を行うことを特徴とする方法。
  6. 請求項に記載の方法において、
    前記選択ステップにおいて、前記解析した各矩形の文字幅と標準文字幅との誤差及び前記解析した各矩形の文字高さと標準文字高さとの誤差とに基づいて各矩形の矩形補正値を求め、前記文字認識処理結果として得られた認識類似度と前記求めた矩形補正値とに基づいて、前記妥当性が高いほうの文字矩形を選択することを特徴とする方法。
  7. コンピュータを、
    文書画像に対して行方向の射影と行方向に垂直な方向の射影とを取ることにより、文字画像を含む矩形領域を文字矩形として抽出する文字矩形抽出手段、
    前記抽出した文字矩形の外接枠に沿って黒画素の探索を行って、当該外接枠に接する連結黒画素を取得する取得手段、
    前記取得手段で取得した連結黒画素がノイズである可能性があるか否かの判定を行う判定手段、
    前記判定手段でノイズである可能性があると判定した連結黒画素を前記文字矩形内の画像から除去し、当該除去後の前記文字矩形内の黒画素に外接する外接矩形の領域をノイズ候補除去文字矩形として生成する生成手段、
    前記ノイズ候補除去文字矩形内の画像及び前記文字矩形内の画像についてそれぞれ文字認識処理を実行し、前記ノイズ候補除去文字矩形及び前記文字矩形の形状を解析し、当該解析した各矩形の文字幅と標準文字幅との誤差、及び当該解析した各矩形の文字高さと標準文字高さとの誤差、のうち少なくとも一つと前記文字認識処理結果に基づいて、前記ノイズ候補除去文字矩形と前記文字矩形とのうち妥当性が高いほうの矩形を選択する選択手段、
    として機能させるためのコンピュータプログラム。
  8. 請求項7に記載のコンピュータプログラムを格納した、コンピュータ読み取り可能な記憶媒体。
JP2008177907A 2008-07-08 2008-07-08 画像処理装置および方法 Expired - Fee Related JP5322517B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008177907A JP5322517B2 (ja) 2008-07-08 2008-07-08 画像処理装置および方法
US12/498,006 US8452095B2 (en) 2008-07-08 2009-07-06 Image processing for post-processing rate of character rectangle extraction and character recognition accuracy

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008177907A JP5322517B2 (ja) 2008-07-08 2008-07-08 画像処理装置および方法

Publications (3)

Publication Number Publication Date
JP2010020394A JP2010020394A (ja) 2010-01-28
JP2010020394A5 JP2010020394A5 (ja) 2011-08-25
JP5322517B2 true JP5322517B2 (ja) 2013-10-23

Family

ID=41505228

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008177907A Expired - Fee Related JP5322517B2 (ja) 2008-07-08 2008-07-08 画像処理装置および方法

Country Status (2)

Country Link
US (1) US8452095B2 (ja)
JP (1) JP5322517B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5280425B2 (ja) * 2010-11-12 2013-09-04 シャープ株式会社 画像処理装置、画像読取装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
JP6046982B2 (ja) * 2011-11-08 2016-12-21 キヤノン株式会社 文字幅を判定する方法及び装置、文字集合を分割する装置、及びコンピュータプログラム
CN103310209A (zh) * 2012-03-09 2013-09-18 富士通株式会社 识别图像中的字符串的方法和装置
US9684844B1 (en) * 2016-07-15 2017-06-20 StradVision, Inc. Method and apparatus for normalizing character included in an image
JP2018088116A (ja) * 2016-11-29 2018-06-07 キヤノン株式会社 情報処理装置、プログラム、情報処理方法
JP6903966B2 (ja) * 2017-03-16 2021-07-14 富士フイルムビジネスイノベーション株式会社 情報処理装置、情報処理システム及びプログラム
JP7338159B2 (ja) * 2019-01-24 2023-09-05 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4251799A (en) * 1979-03-30 1981-02-17 International Business Machines Corporation Optical character recognition using baseline information
JPS61251982A (ja) * 1985-04-30 1986-11-08 Toshiba Corp 光学的文字読取装置
JPS63136181A (ja) * 1986-11-27 1988-06-08 Toshiba Corp 文字読取装置
JPH05210761A (ja) * 1992-01-30 1993-08-20 Omron Corp 文字認識装置
JPH0749926A (ja) * 1993-08-04 1995-02-21 Fuji Xerox Co Ltd 文字認識装置
US5930393A (en) * 1997-08-11 1999-07-27 Lucent Technologies Inc. Method and apparatus for enhancing degraded document images
US7308126B2 (en) * 1997-08-28 2007-12-11 Icad, Inc. Use of computer-aided detection system outputs in clinical practice
US6847734B2 (en) * 2000-01-28 2005-01-25 Kabushiki Kaisha Toshiba Word recognition method and storage medium that stores word recognition program
JP4613397B2 (ja) * 2000-06-28 2011-01-19 コニカミノルタビジネステクノロジーズ株式会社 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP4204185B2 (ja) 2000-11-17 2009-01-07 株式会社リコー 文字認識装置、文字認識方法、および記録媒体
GB2370438A (en) * 2000-12-22 2002-06-26 Hewlett Packard Co Automated image cropping using selected compositional rules.
JP2007304864A (ja) * 2006-05-11 2007-11-22 Fuji Xerox Co Ltd 文字認識処理システムおよび文字認識処理プログラム
US8155444B2 (en) * 2007-01-15 2012-04-10 Microsoft Corporation Image text to character information conversion

Also Published As

Publication number Publication date
JP2010020394A (ja) 2010-01-28
US8452095B2 (en) 2013-05-28
US20100008587A1 (en) 2010-01-14

Similar Documents

Publication Publication Date Title
JP5322517B2 (ja) 画像処理装置および方法
US5410611A (en) Method for identifying word bounding boxes in text
JP5357612B2 (ja) 下線除去装置
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
JP5906788B2 (ja) 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
JP3615333B2 (ja) 罫線消去装置
JP2008011484A (ja) 文字図形列抽出装置,文字図形列抽出方法,その方法を実行するプログラム,そのプログラムを記録した記録媒体
US10984277B2 (en) Image analysis apparatus, image analysis method, and non-transitory computer readable medium
JP2006155126A (ja) 車両番号認識装置
JP5439069B2 (ja) 文字認識装置及び文字認識方法
JP4078045B2 (ja) 画像処理装置、方法、プログラム、及び記憶媒体
JP2796561B2 (ja) 表形式文書認識方式
JP4731748B2 (ja) 画像処理装置、方法、プログラム及び記憶媒体
JP2917427B2 (ja) 図面読取装置
JP3077929B2 (ja) 文字切出し方式
JP2003208568A (ja) 画像処理装置、画像処理方法、及び同方法に用いるプログラム
JP2004334461A (ja) 文字認識装置及び文字認識プログラム
JP3133797B2 (ja) 文字認識方法及びその装置
JP4571447B2 (ja) 文字画像抽出プログラム、文字画像抽出方法および文字画像抽出装置
JP3880091B2 (ja) 情報処理装置及び方法
JP2803735B2 (ja) 罫線を含んだ文字認識装置
JP2797523B2 (ja) 図面続取装置
JP3566738B2 (ja) 網掛け領域処理方法および網掛け領域処理装置
JP2023034823A (ja) 画像処理装置、画像処理装置の制御方法およびプログラム
JP3039427B2 (ja) 文字切り出し方式及び方法

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20101106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110708

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110708

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121012

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121023

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130618

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130716

LAPS Cancellation because of no payment of annual fees