JP3548234B2 - 文字認識方法及び装置 - Google Patents

文字認識方法及び装置 Download PDF

Info

Publication number
JP3548234B2
JP3548234B2 JP14763194A JP14763194A JP3548234B2 JP 3548234 B2 JP3548234 B2 JP 3548234B2 JP 14763194 A JP14763194 A JP 14763194A JP 14763194 A JP14763194 A JP 14763194A JP 3548234 B2 JP3548234 B2 JP 3548234B2
Authority
JP
Japan
Prior art keywords
recognition
character
determined
rectangular area
divided
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP14763194A
Other languages
English (en)
Other versions
JPH0816719A (ja
Inventor
裕章 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP14763194A priority Critical patent/JP3548234B2/ja
Publication of JPH0816719A publication Critical patent/JPH0816719A/ja
Application granted granted Critical
Publication of JP3548234B2 publication Critical patent/JP3548234B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Description

【0001】
【産業上の利用分野】
本発明は文書画像より文字単位の画像ブロックの取り出しを行って、ブロック単位で文字認識を行うための文字切り出し方法及びこれを用いた文字認識方法及び装置に関する。
【0002】
【従来の技術】
一般に、光学式文字認識装置(OCR)では、光学的に読み取った文書画像より文字単位の画像ブロックを取り出して文字の切り出しを行い、切り出された各文字毎に文字認識が行われる。一般的なOCRで行なわれる認識処理の一例を図7及び図8を用いて説明する。
【0003】
図8は一般的なOCRによる文字認識処理の手順を表すフローチャートである。まず、ステップS701において、イメージスキャナ等を用いて文書画像を入力する。次に、ステップS702で、入力された文書画像から画像ブロックの取り出しを行なう。
【0004】
図9は一般的な文字認識処理において用いられる画像ブロックの取り出し方法を説明する図である。図9においては、射影を用いた縦書き文書の画像ブロック取り出しの例が示されており、まず、上下方向に射影801を取ることで行を抽出する。そして、行を抽出後、各行に対して行方向と直角方向に射影802を取ることで画像ブロック803を取り出すことができる。このままでは、2つ以上の文字が接触していることにより複数の文字を含むブロック804が存在したり、分離した部分を有する文字について分離されたブロック805が存在したりする。
【0005】
このため、ステップS703で文字単位の画像ブロック(文字画像ブロック)を作成する。まず、各行で各画像ブロックの高さの平均をとったり、画像ブロックの高さの分布からもっとも頻度の大きい高さを抽出する等して標準文字高を求める。そして、画像ブロックの高さが標準文字高の整数倍であれば、その整数で高さを等分して画像ブロックの分離を行い文字画像ブロックとする。更に、複数の画像ブロックを結合した場合にその高さが標準文字高になるのであればそれらの画像ブロックを結合することで文字画像ブロックを生成する。例えば、図8において、画像ブロック804なら2分割して2つの文字画像ブロックが生成され、画像ブロック805なら2つの画像ブロックを結合することで1つの文字画像ブロックが生成される。
【0006】
以上のようにして、ステップS702とステップS703により文字画像ブロックを生成することにより文字の切り出しが行われるので、ステップS704で各文字画像ブロック毎に識別演算を行ない、類似度が最も大きいカテゴリ(文字)を認識結果とするように構成されている。
【0007】
【発明が解決しようとする課題】
しかしながら、上記の手法による文字の切り出しにおいては、図10にあるような縦書き文書に含まれる横組みの文字については、901のように、それらが1つの文字画像ブロックとして取り出されてしまうため、文字単位に切り出せず、認識不能となったり、誤認識の原因になったりするという問題がある。
【0008】
本発明はこのような問題に鑑みてなされたものであり、行方向の行中に含まれる文字の切り出し時に、列方向の文字列についても文字の切り出しを行うことを可能とし、文字の認識率を向上する文字切り出し方法とこれを用いた文字認識方法及び装置を提供することを目的とする。
【0009】
【課題を解決するための手段】
上記の目的を達成するための本発明による文字認識装置は以下の構成を備える。即ち、
文書画像内に含まれる文字画像に対して文字認識処理を行う文字認識装置であって、
前記文書画像の行方向の射影に基づいて行を抽出し、当該抽出された行に直交する列方向の射影に基づいて認識対象文字画像を含む矩形領域を獲得する獲得手段と、
前記獲得手段により獲得された矩形領域毎に、文字認識処理を行って認識結果のカテゴリとその類似度とを得る第1認識手段と、
前記第1認識手段で得た類似度が所定閾値より小さいか否かに基づいて、前記矩形領域を列方向に分割するか否か判断する第1判断手段と、
前記第1認識手段で分割すると判断された矩形領域に対して前記行方向の射影を取ることにより前記列方向の分割を行い、前記第1認識手段で分割しないと判断された矩形領域に対しては前記列方向の分割を行わない分割手段と、
前記分割手段で分割されて得られた矩形領域のそれぞれに対して、文字認識処理を行ってそれぞれの認識結果のカテゴリとその類似度とを得る第2認識手段と、
前記分割されて得られた矩形領域それぞれに対して得られた類似度のうち、少なくとも1つの類似度が所定閾値より小さいか否か判断する第2判断手段と、
前記第1認識手段で分割しないと判断された矩形領域に対しては前記第1認識手段で得たカテゴリを最終結果として出力し、前記第1認識手段で分割すると判断され且つ前記第2認識手段で得た類似度の少なくとも1つが前記所定閾値より小さいと判断された矩形領域に対しては、前記第1認識手段で得たカテゴリを最終結果として出力し、前記第1認識手段で分割すると判断され且つ前記第2認識手段で得た類似度の全てが前記所定閾値以上であると判断された矩形領域に対しては、前記第2認識手段で得たカテゴリを最終結果として出力する出力手段とを有する。
【0010】
また、上記の目的を達成するための本発明による文字認識方法は、
文書画像内に含まれる文字画像に対して文字認識処理を行う文字認識方法であって、
前記文書画像の行方向の射影に基づいて行を抽出し、当該抽出された行に直交する列方向の射影に基づいて認識対象文字画像を含む矩形領域を獲得する獲得工程と、
前記獲得工程により獲得された矩形領域毎に、文字認識処理を行って認識結果のカテゴリとその類似度とを得る第1認識工程と、
前記第1認識工程で得た類似度が所定閾値より小さいか否かに基づいて、前記矩形領域を列方向に分割するか否か判断する第1判断工程と、
前記第1認識工程で分割すると判断された矩形領域に対して前記行方向の射影を取ることにより前記列方向の分割を行い、前記第1認識工程で分割しないと判断された矩形領域に対しては前記列方向の分割を行わない分割工程と、
前記分割工程で分割されて得られた矩形領域のそれぞれに対して、文字認識処理を行ってそれぞれの認識結果のカテゴリとその類似度とを得る第2認識工程と、
前記分割されて得られた矩形領域それぞれに対して得られた類似度のうち、少なくとも1つの類似度が所定閾値より小さいか否か判断する第2判断工程と、
前記第1認識工程で分割しないと判断された矩形領域に対しては前記第1認識工程で得たカテゴリを最終結果として出力し、前記第1認識工程で分割すると判断され且つ前記第2認識工程で得た類似度の少なくとも1つが前記所定閾値より小さいと判断された矩形領域に対しては、前記第1認識工程で得たカテゴリを最終結果として出力し、前記第1認識工程で分割すると判断され且つ前記第2認識工程で得た類似度の全てが前記所定閾値以上であると判断された矩形領域に対しては、前記第2認識工程で得たカテゴリを最終結果として出力する出力工程とを有する。
【0018】
尚、本発明において、行方向及び列方向は、縦書き文書の場合は夫々縦方向、横方向に対応する。又、横書き文書にあっては、行方向は横方向、列方向は縦方向に夫々対応する。
【0019】
【実施例】
以下に添付の図面を参照して本発明の好適な実施例を説明する。
【0020】
[実施例1]
図1は本発明を実施するための文字認識装置の構成を示すブロック図である。101はCPUであり、ROM102に格納されている制御プログラムに従って本装置における各種の制御を行なう。102はROMであり、CPU101が実行する制御プログラムや各種データを格納する。後述するフローチャートで示される処理を実現する制御プログラムもこのROM102に格納されている。103はRAMであり、CPU101が各種の処理を実行する際の作業エリアを提供する。又、RAM103は、光学的に読み取られた文書画像などを格納する領域も含む。104はディスプレイであり、読取画像や、各種認識結果等を表示する。105はキーボードであり、各種指示やデータの入力を行う。106はイメージスキャナであり、画像を光学的に読み取る。
【0021】
次に、図1に示す構成の文字認識装置が実行する本実施例の動作について説明する。
【0022】
図2は、本実施例における文字画像ブロックの切り出しの概要を説明する図である。同図において、201は標準的な大きさを有する画像ブロックであり、そのまま文字画像ブロックとなる。202は横組み文字に対する画像ブロックであり、標準の文字幅よりも広い横幅(w1)を有する。203は文字画像ブロックの標準サイズを表す標準ブロックであり、スキャナ106より読み取られた文字画像より切り出した画像ブロックより所定の方法で算出される。この標準ブロック203の横幅wsに所定の係数をかけることで横組み文字を含む画像ブロックを識別するための閾値Tが得られる。そして、切り出された各画像ブロックの横幅と閾値Tとを比較して、Tよりも大きい横幅を有する画像ブロックが横組み文字を含む画像ブロックであるとして、横組み文字用の分割処理を行う。例えば図2においては、画像ブロック202がw1>Tとなり、この画像ブロックについて更に行方向に射影を行い、その結果3つのブロックに再分割される状態が示されている。
【0023】
次に、図3及び図4を用いて本実施例1の動作を更に詳細に説明する。
【0024】
図3は、実施例1の文字認識装置による文字認識処理を表すフローチャートである。まず、ステップS201でイメージスキャナ106を用いて文書画像を入力し、得られた画像データをRAM103に格納する。このとき入力画像をディスプレイ104に表示するようにしてもよい。
【0025】
次に、縦書き文書について縦書き用文字切り出しを行ない、その結果をRAM103に格納する。次にステップS202において、画像ブロックの切り出しを行う。縦書き用文字の切り出しは、従来例で説明したようにステップS202で縦方向の射影をとって行を抽出し、各行について横方向の射影をとることで画像ブロックを取り出す。但し、このままでは行内に横組み文字が存在した場合、横組み文字の横幅が行の幅となってしまう。従って、本例では、切り出された各画像ブロックについて左右両側の余白部分の切り落しを行い、各画像ブロックの横幅を修正する。
【0026】
次に、ステップS203において、文字単位の画像ブロック(文字画像ブロック)を生成する。ここでは、従来技術のところで説明したように、各画像ブロックについて分離、結合を施すことで、1文字単位の画像ブロックを生成する。
【0027】
続くステップS204〜ステップS208の処理により、全文字画像ブロックについて横組み文字か否かの判定を行い、横組み文字と判定された文字画像ブロックについては更に分離を行う。
【0028】
ステップS204において、文字画像ブロックを一つずつ注目していき、当該文字画像ブロックが横組み文字を含むか否かを調べる。注目する文字画像ブロックが横組み文字を含むと判定されたならば、その文字画像ブロックに対して横書き文字用の切り出し処理を施すべくステップS205へ進む。一方、注目している文字画像ブロックが横組み文字を含まないと判定されればステップS207へ進む。尚、ステップS204における横組み文字か否かの判定方法については後述する。
【0029】
横書き文字用の切り出し処理では、まずステップS205で画像ブロックを取り出す。一般的には、横書き文字用の切り出し処理も、縦書き文字の切り出し処理と同様の手順がとられる。即ち、入力画像に対して左右方向の射影を取って横方向の行を抽出し、その後、各行に対して縦方向に射影を取ることで画像ブロックの切り出しが行なわれる。但し、本実施例の場合は、注目画像ブロックに対しての処理なので、既に横方向の行が抽出されているとして処理を始めてよい。
【0030】
次に、ステップS206で文字単位の画像ブロックを生成する。これは、縦書き文字画像における文字画像ブロックの切り出しにおける画像ブロックの「高さ」を、「幅」に置き換えることで、縦書きの場合と同様に行うことができる。但し、縦書き文書の横組み文字は文字数が少ないので、標準文字幅が精度良く求まらないことも多い。従って、本処理(ステップS206)を割愛して、ステップS205で得られた画像ブロックをそのまま文字画像ブロックとして用いてもよい。そして、以上の結果をRAM103に格納する。
【0031】
ステップS207では注目している文字画像ブロックを次のブロックに更新する。ステップS208において、すべての文字画像ブロックについてステップS204の調査を終えたか否かを判定し、終了していなければステップS204へ戻り上述の処理を繰り返す。
【0032】
一方、すべてのブロックについてステップS204の調査が終了していれば、ステップS210へ進む。ステップS210では、各文字画像ブロックについて識別演算を行ない、類似度が最も大きいカテゴリ(文字)を認識結果とし、RAM103に格納する。ここで、認識結果をディスプレイ104に表示するようにしてもよい。
【0033】
次に、ステップS204で行われる横組み文字かどうかの判定について、図4のフローチャートを用いてさらに詳細な説明を行なう。図4は、文字画像ブロックが横組み文字を含むか否かを判定するための処理手順を表すフローチャートである。
【0034】
まずステップS301において全ての文字画像ブロックの幅を求める。次に、ステップS302において、例えば、行内の文字画像ブロックの幅の平均を求め、標準文字幅を求める。ここで、句読点や記号等、幅の著しく小さいものが含まれると、標準文字幅の精度が低下してしまうので例えば以下の処理を施す。
【0035】
例えば、先のステップS203における文字画像ブロックの生成において求めた標準文字高Hと、予め経験的に求められた値m及びn(0<m<n)により、画像ブロック幅wがmH<w<nHの範囲にある文字画像ブロックを抽出する。そして、これら抽出された文字画像ブロックを用いて平均値の算出を行い、これを標準文字幅とすることにより、標準文字幅の精度を向上することができる。また、文字画像ブロックの幅に関する分布を取り、頻度が最大となるクラスの代表値を標準文字幅としてもよい。ここで、上述のm及びnの値としては、m=0.7、n=1.3程度が好ましい。
【0036】
ステップS303では、求めた標準文字幅wを用いて、各文字画像ブロックが横組み文字を含むか否かを判断するための閾値Tを決定する。一般に、縦書き文書内において、横組み文字を含む文字画像ブロックの横幅は標準文字幅wsより大きくなる。従って、例えば、経験的に求めた値t(t>1)を用いて閾値T=t×wsを求めておき、この閾値Tと各文字画像ブロックの横幅とを比較することにより、各文字画像ブロックが横組み文字列を含むか否かを判定できる。ここで、上述のtの値としては、t=1.2程度が好ましい。
【0037】
従って、ステップS304では、各画像ブロックの幅wと閾値Tを比較する。ここで、w>Tならば、当該文字画像ブロックは横組み文字を含むとしてステップS305に進む。一方、w≦TであればステップS306へ進み、通常の文字画像ブロックとする。
【0038】
以上説明したように、本実施例1によれば、縦書き内の横組み文字の文字画像ブロックの幅が通常の文字画像ブロックの幅に比べて大きいことを利用し、横組み文字を含む文字画像ブロックを抽出することが可能となる。更に、その文字画像ブロックに横書き用の文字切り出し処理を行なうことで、縦書き文書の中に含まれる横組み文字についても、文字単位に切り出すことが可能となる。
【0039】
なお、上記実施例は、本発明を実施するための一構成例であり、各種の応用が可能であることはいうまでもない。例えば、オペレータが認識領域を指定したり、認識結果を修正する操作ができるように構成されていたり、認識領域をオペレータが介在することなく自動的に決定したり、本処理後に誤認識を減少させるための処理が加わるように構成されていてもよい。
【0040】
更に、閾値Tを各文字画像ブロックの高さに応じて変化させるように構成してもよい。上記実施例1では、標準文字高さから求められた標準文字幅により閾値Tを1つ決定しているが、全角文字の中に4倍角の文字が混在した場合に、この4倍角文字を横組み文字として認識する可能性がある。従って、閾値Tを文字画像ブロックの高さの関数(例えば閾値T=k×h、ここでkは定数、hは文字画像ブロックの高さ)とすれば、このような不具合を解消できる。
【0041】
また、汎用コンピュータに、本発明を実施する処理を行なうプログラムを外部から提供し、RAMに本装置の制御プログラムを格納するように構成されていてもよいことはいうまでもない。
【0042】
[実施例2]
次に、実施例2について説明する。上記実施例1では文字画像ブロックの大きさに基づいて横組み文字を含む文字画像ブロックか否かを判定している。本実施例2では、まず各文字画像ブロックについて識別演算を行い、その類似度が所定値よりも小さいカテゴリしか存在しない文字画像ブロックについて、横組み文字としての処理を施す。尚、実施例2の文字認識装置の構成は実施例1(図1)と同様であるのでここでは説明を省略する。
【0043】
図5は実施例2における文字認識の手順を表すフローチャートである。前記実施例と同様、まずステップS401で文書画像を入力し、ステップS402で画像ブロックを取り出し、更にステップS403で文字単位の画像ブロック(文字画像ブロック)にする。その後ステップS404で各文字画像ブロックについて識別演算を行なう。
【0044】
次に、文字画像ブロックの一つ一つについて注目し、各文字画像ブロックについて、横組み文字として文字の切り出し及び識別演算を行なうかどうかの判定を行なう(ステップS405)。ここで、注目している文字画像ブロックについて横組み文字として再処理を行なうと判定された場合は、ステップS406へ進む。又、横組み文字としての再処理を実行しない場合はステップS410へ進む。このステップS405における判定処理については図6のフローチャートにより後述する。
【0045】
ステップS406では、当該文字画像ブロックに対して横書き用の文字切り出し処理を行なって新たに画像ブロックを取り出す。更に、ステップS407において、ステップS406で得られた画像ブロックから文字画像ブロックの生成を行う。但し、実施例1でも説明したように、ステップS407における画像ブロックの分離、結合による文字画像ブロックの生成は、標準文字幅が精度よく求められないので、このステップを省略し、ステップS406で得られた画像ブロックをそのまま文字画像ブロックとしてもよい。
【0046】
ステップS408では、ステップS406、ステップS407にて新たに切り出された文字画像ブロックについて識別演算を行う。そして、ステップS409において、再文字切り出し前の文字画像ブロック(ステップS402〜ステップS403で切り出された文字画像ブロック)と再文字切り出し後の文字画像ブロック(ステップS406〜ステップS407で切り出された文字画像ブロック)とを比較し、信頼度が大きい方の結果を採用し、これを認識結果とする。このステップS409における信頼度の判定は図7のフローチャートを用いて後述する。
【0047】
ステップS410では、注目文字画像ブロックを次に進める。そして、ステップS411で全ての文字画像ブロックを調べたか否かを判定し、まだ未処理の文字画像ブロックがあればステップS405へ戻る。一方、全ての文字画像ブロックについて処理を終了したならば本処理を終了する。
【0048】
次に、上述のステップS405における判定方法を説明する。図6は、各文字画像ブロックについて、横組み文字として再処理するか否かを判定する手順を表すフローチャートである。
【0049】
ステップS404の識別演算において、全カテゴリと各文字画像ブロックとの類似度を計算し、類似度が最大のカテゴリを識別演算の結果としている。文字の切り出しが誤っている場合のように、類似した文字が存在しない画像を識別しようとした場合、その類似度は、正しく切り出しが行われている場合に比べて、一般的に低くなる。本例ではこの性質を用いて再処理が必要か否かを判定する。ここで、文字切り出しの再処理が必要か否かを判断するための類似度の閾値をVとする。
【0050】
まず、ステップS501において、予め設定されている類似度の閾値Vと注目する文字画像ブロックの類似度vとを比較する。ここで、v<VならばステップS503に進み、再度処理を行なう文字画像ブロックであると判定する。また、v≧VであればステップS502へ進む。ステップS502では、「10」と「Ю」や「00」と「∞」などのように誤認識しやすい文字を予め記憶した誤認識リストを参照し、ステップS404による認識結果この誤認識リストに含まれるかどうかを調べる。認識結果が誤認識リストに存在したならばステップS503に進み、当該文字画像ブロックを再度処理するものと判定する。尚、誤認識リストはROM102もしくはRAM103に格納されている。
【0051】
以上のようにして、再び文字切り出し処理を行なうべき文字画像ブロックが選択される。
【0052】
また、ステップS409において、再文字切り出し前後の認識結果のどちらを採用するかを決定するが、以下にこの処理について説明する。図7は、文字切り出しの再処理(即ち横書き用の文字切り出し)が行なわれた文字画像ブロックについて、再処理前後のどちらの結果を採用するかを決定する手順を表すフローチャートである。
【0053】
まず、ステップS601において、文字切り出しの再処理(ステップS406〜ステップS407による横書き用の文字切り出し)により分割された画像ブロックに対する識別演算(ステップS408)の結果、類似度が予め定めた閾値Vより小さいものが存在するか否かを判断する。類似度の小さいものが1つでも存在する場合はステップS602に進み、再処理される前の元の結果(即ちステップS404で得られた結果)を最終的な認識結果とする。一方、新たに切り出された全ての文字画像ブロックにおける類似度が閾値Vより大きければ、横組みの文字切り出しが成功したとして、ステップS603で再処理された後の結果(即ちステップS408で得られた結果)を最終結果とする。
【0054】
以上説明したように本実施例2によれば、識別演算による類似度を、縦書き内横組み文字のための処理を行なうかどうかの判定に用いることで、縦書き文書の中に含まれる横組み文字部分を認識することが可能となる。さらに、縦書き内の横組文字の処理が終了したあとに、その結果を採用するかどうかを判定することで、誤認識を減少させ、認識精度を向上させる効果がある。
【0055】
また実施例1で説明した、文字画像ブロックの大きさを用いて再処理を行うか否かの判断を行う処理を本実施例2に加えた構成で実施してもよいことはいうまでもない。
【0056】
以上説明したように、縦書き文書の認識を行なう場合、縦書き内横組文字を判定し、その部分に対し横書き用の処理を実施することで、これまで正しく行なうことができなかった縦書き内横組み文字の認識を可能にし、OCRによる入力作業をより正確に行なえ、誤認識や認識不能文字の修正を軽減する効果がある。
【0057】
尚、上記実施例においては縦書き文書における横組み文字の混在を説明したが、横書き文書における立て組み文字の混在に対しても上述と同様の概念で実現できることはいうまでもない。
【0058】
尚、本発明は、複数の機器から構成されるシステムに適用しても1つの機器からなる装置に適用しても良い。また、本発明はシステム或いは装置に本発明により規定される処理を実行させるプログラムを供給することによって達成される場合にも適用できることはいうまでもない。
【0059】
【発明の効果】
以上説明したように、本発明によれば、行方向の行中に含まれる文字の切り出し時に、列方向の文字列についても文字の切り出しを行うことが可能となり、文字の認識率が向上する。
【0060】
【図面の簡単な説明】
【図1】本発明を実施するための文字認識装置の構成を示すブロック図である。
【図2】本実施例における文字画像ブロックの切り出しの概要を説明する図である。
【図3】実施例1の文字認識装置による文字認識処理を表すフローチャートである。
【図4】文字画像ブロックが横組み文字を含むか否かを判定するための処理手順を表すフローチャートである。
【図5】実施例2における文字認識の手順を表すフローチャートである。
【図6】各文字画像ブロックについて横組み文字として再処理するか否かを判定する手順を表すフローチャートである。
【図7】再処理前後のどちらの認識結果を採用するかを決定する手順を表すフローチャートである。
【図8】一般的なOCRによる文字認識処理の手順を表すフローチャートである。
【図9】一般的な文字認識処理において用いられる画像ブロックの取り出し方法を説明する図である。
【図10】横組みの文字を含む縦書き文書の例を表す図である。
【符号の説明】
101 CPU
102 ROM
103 RAM
104 ディスプレイ
105 キーボード
106 イメージスキャナ

Claims (2)

  1. 文書画像内に含まれる文字画像に対して文字認識処理を行う文字認識装置であって、
    前記文書画像の行方向の射影に基づいて行を抽出し、当該抽出された行に直交する列方向の射影に基づいて認識対象文字画像を含む矩形領域を獲得する獲得手段と、
    前記獲得手段により獲得された矩形領域毎に、文字認識処理を行って認識結果のカテゴリとその類似度とを得る第1認識手段と、
    前記第1認識手段で得た類似度が所定閾値より小さいか否かに基づいて、前記矩形領域を列方向に分割するか否か判断する第1判断手段と、
    前記第1認識手段で分割すると判断された矩形領域に対して前記行方向の射影を取ることにより前記列方向の分割を行い、前記第1認識手段で分割しないと判断された矩形領域に対しては前記列方向の分割を行わない分割手段と、
    前記分割手段で分割されて得られた矩形領域のそれぞれに対して、文字認識処理を行ってそれぞれの認識結果のカテゴリとその類似度とを得る第2認識手段と、
    前記分割されて得られた矩形領域それぞれに対して得られた類似度のうち、少なくとも1つの類似度が所定閾値より小さいか否か判断する第2判断手段と、
    前記第1認識手段で分割しないと判断された矩形領域に対しては前記第1認識手段で得たカテゴリを最終結果として出力し、前記第1認識手段で分割すると判断され且つ前記第2認識手段で得た類似度の少なくとも1つが前記所定閾値より小さいと判断された矩形領域に対しては、前記第1認識手段で得たカテゴリを最終結果として出力し、前記第1認識手段で分割すると判断され且つ前記第2認識手段で得た類似度の全てが前記所定閾値以上であると判断された矩形領域に対しては、前記第2認識手段で得たカテゴリを最終結果として出力する出力手段とを有することを特徴とする文字認識装置。
  2. 文書画像内に含まれる文字画像に対して文字認識処理を行う文字認識方法であって、
    前記文書画像の行方向の射影に基づいて行を抽出し、当該抽出された行に直交する列方向の射影に基づいて認識対象文字画像を含む矩形領域を獲得する獲得工程と、
    前記獲得工程により獲得された矩形領域毎に、文字認識処理を行って認識結果のカテゴリとその類似度とを得る第1認識工程と、
    前記第1認識工程で得た類似度が所定閾値より小さいか否かに基づいて、前記矩形領域を列方向に分割するか否か判断する第1判断工程と、
    前記第1認識工程で分割すると判断された矩形領域に対して前記行方向の射影を取ることにより前記列方向の分割を行い、前記第1認識工程で分割しないと判断された矩形領域に対しては前記列方向の分割を行わない分割工程と、
    前記分割工程で分割されて得られた矩形領域のそれぞれに対して、文字認識処理を行ってそれぞれの認識結果のカテゴリとその類似度とを得る第2認識工程と、
    前記分割されて得られた矩形領域それぞれに対して得られた類似度のうち、少なくとも1つの類似度が所定閾値より小さいか否か判断する第2判断工程と、
    前記第1認識工程で分割しないと判断された矩形領域に対しては前記第1認識工程で得たカテゴリを最終結果として出力し、前記第1認識工程で分割すると判断され且つ前記第2認識工程で得た類似度の少なくとも1つが前記所定閾値より小さいと判断された矩形領域に対しては、前記第1認識工程で得たカテゴリを最終結果として出力し、前記第1認識工程で分割すると判断され且つ前記第2認識工程で得た類似度の全てが前記所定閾値以上であると判断された矩形領域に対しては、前記第2認識工程で得たカテゴリを最終結果として出力する出力工程とを有することを特徴とする文字認識方法。
JP14763194A 1994-06-29 1994-06-29 文字認識方法及び装置 Expired - Fee Related JP3548234B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14763194A JP3548234B2 (ja) 1994-06-29 1994-06-29 文字認識方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14763194A JP3548234B2 (ja) 1994-06-29 1994-06-29 文字認識方法及び装置

Publications (2)

Publication Number Publication Date
JPH0816719A JPH0816719A (ja) 1996-01-19
JP3548234B2 true JP3548234B2 (ja) 2004-07-28

Family

ID=15434702

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14763194A Expired - Fee Related JP3548234B2 (ja) 1994-06-29 1994-06-29 文字認識方法及び装置

Country Status (1)

Country Link
JP (1) JP3548234B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5812702B2 (ja) * 2011-06-08 2015-11-17 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 文字の読み順を決定するための読み順決定装置、方法及びプログラム
JP6046982B2 (ja) * 2011-11-08 2016-12-21 キヤノン株式会社 文字幅を判定する方法及び装置、文字集合を分割する装置、及びコンピュータプログラム
JP6039413B2 (ja) * 2012-12-27 2016-12-07 日本電産サンキョー株式会社 文字切り出し装置、文字認識装置、文字切り出し方法、およびプログラム
CN106940799B (zh) * 2016-01-05 2020-07-24 腾讯科技(深圳)有限公司 文本图像处理方法和装置

Also Published As

Publication number Publication date
JPH0816719A (ja) 1996-01-19

Similar Documents

Publication Publication Date Title
EP0439951B1 (en) Data processing
JP2536966B2 (ja) テキスト編集システム
JPH10162150A (ja) ページ解析システム
US8787702B1 (en) Methods and apparatus for determining and/or modifying image orientation
CN110008960B (zh) 一种检测字符片段完整性的方法及终端
JP3548234B2 (ja) 文字認識方法及び装置
JPH07220023A (ja) 表認識方法及びその装置
JP2000322514A (ja) パターン抽出装置及び文字切り出し装置
JP3135290B2 (ja) 画像処理方法及び装置
JP3157530B2 (ja) 文字切り出し方法
JPH117493A (ja) 文字認識処理装置
JP2612383B2 (ja) 文字認識処理方式
JPH0728934A (ja) 文書画像処理装置
JPH06162106A (ja) 電子ファイリングシステム
JPH09269970A (ja) 文字認識方法とその装置
JPH05114047A (ja) 文字切り出し装置
JPH04276885A (ja) 文字切出し装置
JP3320083B2 (ja) 文字認識装置及び方法
JPH06215183A (ja) 文字認識装置
JPH08147314A (ja) 認識型文書ファイリング装置及びその制御方法
JP3600364B2 (ja) 文字切り出し方法及び装置
JPH1166225A (ja) 表情報抽出装置及び方法並びに記録媒体
JPH0535916A (ja) 文字切り出し方法
JP3243389B2 (ja) 文書識別方法
JP3226355B2 (ja) 認識結果評価方法

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040412

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040416

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090423

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090423

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100423

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110423

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130423

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130423

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140423

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees