JPH0816719A - 文字切り出し方法とこれを用いた文字認識方法及び装置 - Google Patents
文字切り出し方法とこれを用いた文字認識方法及び装置Info
- Publication number
- JPH0816719A JPH0816719A JP6147631A JP14763194A JPH0816719A JP H0816719 A JPH0816719 A JP H0816719A JP 6147631 A JP6147631 A JP 6147631A JP 14763194 A JP14763194 A JP 14763194A JP H0816719 A JPH0816719 A JP H0816719A
- Authority
- JP
- Japan
- Prior art keywords
- character
- recognition
- rectangular area
- row
- image block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
Abstract
いて列方向の文字列についても文字の切り出しを行うこ
とを可能とし、文字の認識率を向上する。 【構成】画像ブロック201は標準的な大きさを有し、
そのまま文字画像ブロックとなる。画像ブロック202
は横組み文字を含み、標準の文字幅よりも広い横幅(w
1)を有する。標準ブロック203は文字画像ブロック
の標準サイズを表し、文字画像より切り出した画像ブロ
ックより所定の方法で算出される。この標準ブロック2
03の横幅wsに所定の係数をかけることで横組み文字
を含む画像ブロックを識別するための閾値Tが得られ
る。そして、切り出された各画像ブロックの横幅と閾値
Tとを比較して、Tよりも大きい横幅を有する画像ブロ
ックが横組み文字を含む画像ブロックであるとして、こ
のブロックについて横組み文字列用の分割処理を行う。
Description
画像ブロックの取り出しを行って、ブロック単位で文字
認識を行うための文字切り出し方法及びこれを用いた文
字認識方法及び装置に関する。
では、光学的に読み取った文書画像より文字単位の画像
ブロックを取り出して文字の切り出しを行い、切り出さ
れた各文字毎に文字認識が行われる。一般的なOCRで
行なわれる認識処理の一例を図7及び図8を用いて説明
する。
の手順を表すフローチャートである。まず、ステップS
701において、イメージスキャナ等を用いて文書画像
を入力する。次に、ステップS702で、入力された文
書画像から画像ブロックの取り出しを行なう。
られる画像ブロックの取り出し方法を説明する図であ
る。図9においては、射影を用いた縦書き文書の画像ブ
ロック取り出しの例が示されており、まず、上下方向に
射影801を取ることで行を抽出する。そして、行を抽
出後、各行に対して行方向と直角方向に射影802を取
ることで画像ブロック803を取り出すことができる。
このままでは、2つ以上の文字が接触していることによ
り複数の文字を含むブロック804が存在したり、分離
した部分を有する文字について分離されたブロック80
5が存在したりする。
画像ブロック(文字画像ブロック)を作成する。まず、
各行で各画像ブロックの高さの平均をとったり、画像ブ
ロックの高さの分布からもっとも頻度の大きい高さを抽
出する等して標準文字高を求める。そして、画像ブロッ
クの高さが標準文字高の整数倍であれば、その整数で高
さを等分して画像ブロックの分離を行い文字画像ブロッ
クとする。更に、複数の画像ブロックを結合した場合に
その高さが標準文字高になるのであればそれらの画像ブ
ロックを結合することで文字画像ブロックを生成する。
例えば、図8において、画像ブロック804なら2分割
して2つの文字画像ブロックが生成され、画像ブロック
805なら2つの画像ブロックを結合することで1つの
文字画像ブロックが生成される。
テップS703により文字画像ブロックを生成すること
により文字の切り出しが行われるので、ステップS70
4で各文字画像ブロック毎に識別演算を行ない、類似度
が最も大きいカテゴリ(文字)を認識結果とするように
構成されている。
手法による文字の切り出しにおいては、図10にあるよ
うな縦書き文書に含まれる横組みの文字については、9
01のように、それらが1つの文字画像ブロックとして
取り出されてしまうため、文字単位に切り出せず、認識
不能となったり、誤認識の原因になったりするという問
題がある。
ものであり、行方向の行中に含まれる文字の切り出し時
に、列方向の文字列についても文字の切り出しを行うこ
とを可能とし、文字の認識率を向上する文字切り出し方
法とこれを用いた文字認識方法及び装置を提供すること
を目的とする。
認識装置は以下の構成を備える。即ち、画像より文字の
認識を行う文字認識装置であって、前記画像の行方向の
射影に基づいて行を抽出し、抽出された行に直交する列
方向の射影に基づいて認識対象文字を含む矩形領域を獲
得する獲得手段と、前記矩形領域の夫々について列方向
の文字列を含むか否かを判定する判定手段と、前記判定
手段により列方向の文字列を含むと判定された矩形領域
について、列方向の分割を行って新たな矩形領域を生成
する分割手段と、前記獲得手段及び分割手段により得ら
れた矩形領域毎に文字認識処理を行う認識手段とを備え
る。
た矩形領域について、列方向に並ぶ複数の文字で構成さ
れた列方向の文字列が存在するか否かを判定し、列方向
の文字列が存在すると判定された矩形領域については更
に列方向の分割を行う。このようにして切り出された矩
形ブロックの夫々について文字認識処理が実行される。
像の行方向の射影に基づいて行を抽出し、抽出された行
に直交する列方向の射影に基づいて認識対象文字を切り
出し、該認識対象文字を内包するほぼ最少の矩形領域を
獲得し、前記判定手段は、前記矩形領域の夫々につい
て、その列方向の大きさに基づいて列方向の文字列を含
むか否かを判定する。列方向に複数の文字が並ぶ場合、
通常の文字よりもその列方向の大きさが大きくなるの
で、これを利用することにより容易に列方向文字列を含
む矩形領域を識別できるからである。
得手段により得られた矩形領域の平均の行方向長さに基
づいて矩形領域の標準の列方向長さを生成し、前記矩形
領域の夫々について、その列方向長さと該標準の列方向
長さとに基づいて列方向の文字列を含むか否かを判定す
る。列方向の標準の大きさを各文字の行方向の大きさに
基づいて設定することが可能となり、文字の大きさが異
なる各種の文書画像に柔軟に対応することが可能となる
からである。
定手段により列方向の文字列を含むと判定された矩形領
域について行方向の射影をとることにより認識対象文字
の切り出しを行って新たな矩形領域を生成する。
の他の構成による文字認識装置は例えば以下の構成を備
える。即ち、画像より文字の認識を行う文字認識装置で
あって、前記画像の行方向の射影に基づいて行を抽出
し、抽出された行に直交する列方向の射影に基づいて認
識対象文字を含む矩形領域を獲得する獲得手段と、前記
獲得手段により獲得された矩形領域毎に標準パターンと
の類似度を獲得して文字認識を行う第1認識手段と、前
記第1認識手段により獲得された類似度が所定値よりも
小さい矩形領域について列方向の分割を行い分割された
矩形領域を獲得する分割手段と、前記分割された矩形領
域の夫々について文字認識を行う第2認識手段とを備え
る。
矩形領域について文字認識処理を行い、その類似度が所
定値以下であった場合に当該矩形領域について更に列方
向の分割を行って文字認識処理を行う。
形状を有する文字を記憶する記憶手段を更に備え、前記
分割手段は、前記第1認識手段により獲得された類似度
が所定値よりも小さい場合、もしくは前記第1認識手段
による認識結果が前記記憶手段に記憶された文字である
場合、当該矩形領域について列方向の分割を行って矩形
領域を獲得する。横方向の文字列と誤認識しやすい文字
を登録しておくことにより、このような文字であると認
識された場合には、その類似度が所定値以上であっても
列方向の分割と文字認識処理を行うことにより、認識の
精度が更に向上する。
されて得られた矩形領域の少なくとも1つにおいて前記
第2認識手段により得られた類似度が所定の値以下であ
る場合、該分割された矩形領域の分割前の矩形領域に対
する前記第1認識手段の認識結果を選択する選択手段を
更に備える。分割手段による更なる分割により類似度が
却って低下した場合は、その分割前の認識結果を採用す
ることで、認識率の低下が防止できるからである。
は、縦書き文書の場合は夫々縦方向、横方向に対応す
る。又、横書き文書にあっては、行方向は横方向、列方
向は縦方向に夫々対応する。
実施例を説明する。
の文字認識装置の構成を示すブロック図である。101
はCPUであり、ROM102に格納されている制御プ
ログラムに従って本装置における各種の制御を行なう。
102はROMであり、CPU101が実行する制御プ
ログラムや各種データを格納する。後述するフローチャ
ートで示される処理を実現する制御プログラムもこのR
OM102に格納されている。103はRAMであり、
CPU101が各種の処理を実行する際の作業エリアを
提供する。又、RAM103は、光学的に読み取られた
文書画像などを格納する領域も含む。104はディスプ
レイであり、読取画像や、各種認識結果等を表示する。
105はキーボードであり、各種指示やデータの入力を
行う。106はイメージスキャナであり、画像を光学的
に読み取る。
行する本実施例の動作について説明する。
クの切り出しの概要を説明する図である。同図におい
て、201は標準的な大きさを有する画像ブロックであ
り、そのまま文字画像ブロックとなる。202は横組み
文字に対する画像ブロックであり、標準の文字幅よりも
広い横幅(w1)を有する。203は文字画像ブロック
の標準サイズを表す標準ブロックであり、スキャナ10
6より読み取られた文字画像より切り出した画像ブロッ
クより所定の方法で算出される。この標準ブロック20
3の横幅wsに所定の係数をかけることで横組み文字を
含む画像ブロックを識別するための閾値Tが得られる。
そして、切り出された各画像ブロックの横幅と閾値Tと
を比較して、Tよりも大きい横幅を有する画像ブロック
が横組み文字を含む画像ブロックであるとして、横組み
文字用の分割処理を行う。例えば図2においては、画像
ブロック202がw1>Tとなり、この画像ブロックに
ついて更に行方向に射影を行い、その結果3つのブロッ
クに再分割される状態が示されている。
動作を更に詳細に説明する。
字認識処理を表すフローチャートである。まず、ステッ
プS201でイメージスキャナ106を用いて文書画像
を入力し、得られた画像データをRAM103に格納す
る。このとき入力画像をディスプレイ104に表示する
ようにしてもよい。
り出しを行ない、その結果をRAM103に格納する。
次にステップS202において、画像ブロックの切り出
しを行う。縦書き用文字の切り出しは、従来例で説明し
たようにステップS202で縦方向の射影をとって行を
抽出し、各行について横方向の射影をとることで画像ブ
ロックを取り出す。但し、このままでは行内に横組み文
字が存在した場合、横組み文字の横幅が行の幅となって
しまう。従って、本例では、切り出された各画像ブロッ
クについて左右両側の余白部分の切り落しを行い、各画
像ブロックの横幅を修正する。
位の画像ブロック(文字画像ブロック)を生成する。こ
こでは、従来技術のところで説明したように、各画像ブ
ロックについて分離、結合を施すことで、1文字単位の
画像ブロックを生成する。
の処理により、全文字画像ブロックについて横組み文字
か否かの判定を行い、横組み文字と判定された文字画像
ブロックについては更に分離を行う。
ックを一つずつ注目していき、当該文字画像ブロックが
横組み文字を含むか否かを調べる。注目する文字画像ブ
ロックが横組み文字を含むと判定されたならば、その文
字画像ブロックに対して横書き文字用の切り出し処理を
施すべくステップS205へ進む。一方、注目している
文字画像ブロックが横組み文字を含まないと判定されれ
ばステップS207へ進む。尚、ステップS204にお
ける横組み文字か否かの判定方法については後述する。
テップS205で画像ブロックを取り出す。一般的に
は、横書き文字用の切り出し処理も、縦書き文字の切り
出し処理と同様の手順がとられる。即ち、入力画像に対
して左右方向の射影を取って横方向の行を抽出し、その
後、各行に対して縦方向に射影を取ることで画像ブロッ
クの切り出しが行なわれる。但し、本実施例の場合は、
注目画像ブロックに対しての処理なので、既に横方向の
行が抽出されているとして処理を始めてよい。
ブロックを生成する。これは、縦書き文字画像における
文字画像ブロックの切り出しにおける画像ブロックの
「高さ」を、「幅」に置き換えることで、縦書きの場合
と同様に行うことができる。但し、縦書き文書の横組み
文字は文字数が少ないので、標準文字幅が精度良く求ま
らないことも多い。従って、本処理(ステップS20
6)を割愛して、ステップS205で得られた画像ブロ
ックをそのまま文字画像ブロックとして用いてもよい。
そして、以上の結果をRAM103に格納する。
像ブロックを次のブロックに更新する。ステップS20
8において、すべての文字画像ブロックについてステッ
プS204の調査を終えたか否かを判定し、終了してい
なければステップS204へ戻り上述の処理を繰り返
す。
S204の調査が終了していれば、ステップS210へ
進む。ステップS210では、各文字画像ブロックにつ
いて識別演算を行ない、類似度が最も大きいカテゴリ
(文字)を認識結果とし、RAM103に格納する。こ
こで、認識結果をディスプレイ104に表示するように
してもよい。
文字かどうかの判定について、図4のフローチャートを
用いてさらに詳細な説明を行なう。図4は、文字画像ブ
ロックが横組み文字を含むか否かを判定するための処理
手順を表すフローチャートである。
画像ブロックの幅を求める。次に、ステップS302に
おいて、例えば、行内の文字画像ブロックの幅の平均を
求め、標準文字幅を求める。ここで、句読点や記号等、
幅の著しく小さいものが含まれると、標準文字幅の精度
が低下してしまうので例えば以下の処理を施す。
字画像ブロックの生成において求めた標準文字高Hと、
予め経験的に求められた値m及びn(0<m<n)によ
り、画像ブロック幅wがmH<w<nHの範囲にある文
字画像ブロックを抽出する。そして、これら抽出された
文字画像ブロックを用いて平均値の算出を行い、これを
標準文字幅とすることにより、標準文字幅の精度を向上
することができる。また、文字画像ブロックの幅に関す
る分布を取り、頻度が最大となるクラスの代表値を標準
文字幅としてもよい。ここで、上述のm及びnの値とし
ては、m=0.7、n=1.3程度が好ましい。
wを用いて、各文字画像ブロックが横組み文字を含むか
否かを判断するための閾値Tを決定する。一般に、縦書
き文書内において、横組み文字を含む文字画像ブロック
の横幅は標準文字幅wsより大きくなる。従って、例え
ば、経験的に求めた値t(t>1)を用いて閾値T=t
×wsを求めておき、この閾値Tと各文字画像ブロック
の横幅とを比較することにより、各文字画像ブロックが
横組み文字列を含むか否かを判定できる。ここで、上述
のtの値としては、t=1.2程度が好ましい。
ロックの幅wと閾値Tを比較する。ここで、w>Tなら
ば、当該文字画像ブロックは横組み文字を含むとしてス
テップS305に進む。一方、w≦Tであればステップ
S306へ進み、通常の文字画像ブロックとする。
ば、縦書き内の横組み文字の文字画像ブロックの幅が通
常の文字画像ブロックの幅に比べて大きいことを利用
し、横組み文字を含む文字画像ブロックを抽出すること
が可能となる。更に、その文字画像ブロックに横書き用
の文字切り出し処理を行なうことで、縦書き文書の中に
含まれる横組み文字についても、文字単位に切り出すこ
とが可能となる。
めの一構成例であり、各種の応用が可能であることはい
うまでもない。例えば、オペレータが認識領域を指定し
たり、認識結果を修正する操作ができるように構成され
ていたり、認識領域をオペレータが介在することなく自
動的に決定したり、本処理後に誤認識を減少させるため
の処理が加わるように構成されていてもよい。
に応じて変化させるように構成してもよい。上記実施例
1では、標準文字高さから求められた標準文字幅により
閾値Tを1つ決定しているが、全角文字の中に4倍角の
文字が混在した場合に、この4倍角文字を横組み文字と
して認識する可能性がある。従って、閾値Tを文字画像
ブロックの高さの関数(例えば閾値T=k×h、ここで
kは定数、hは文字画像ブロックの高さ)とすれば、こ
のような不具合を解消できる。
する処理を行なうプログラムを外部から提供し、RAM
に本装置の制御プログラムを格納するように構成されて
いてもよいことはいうまでもない。
する。上記実施例1では文字画像ブロックの大きさに基
づいて横組み文字を含む文字画像ブロックか否かを判定
している。本実施例2では、まず各文字画像ブロックに
ついて識別演算を行い、その類似度が所定値よりも小さ
いカテゴリしか存在しない文字画像ブロックについて、
横組み文字としての処理を施す。尚、実施例2の文字認
識装置の構成は実施例1(図1)と同様であるのでここ
では説明を省略する。
表すフローチャートである。前記実施例と同様、まずス
テップS401で文書画像を入力し、ステップS402
で画像ブロックを取り出し、更にステップS403で文
字単位の画像ブロック(文字画像ブロック)にする。そ
の後ステップS404で各文字画像ブロックについて識
別演算を行なう。
て注目し、各文字画像ブロックについて、横組み文字と
して文字の切り出し及び識別演算を行なうかどうかの判
定を行なう(ステップS405)。ここで、注目してい
る文字画像ブロックについて横組み文字として再処理を
行なうと判定された場合は、ステップS406へ進む。
又、横組み文字としての再処理を実行しない場合はステ
ップS410へ進む。このステップS405における判
定処理については図6のフローチャートにより後述す
る。
ックに対して横書き用の文字切り出し処理を行なって新
たに画像ブロックを取り出す。更に、ステップS407
において、ステップS406で得られた画像ブロックか
ら文字画像ブロックの生成を行う。但し、実施例1でも
説明したように、ステップS407における画像ブロッ
クの分離、結合による文字画像ブロックの生成は、標準
文字幅が精度よく求められないので、このステップを省
略し、ステップS406で得られた画像ブロックをその
まま文字画像ブロックとしてもよい。
6、ステップS407にて新たに切り出された文字画像
ブロックについて識別演算を行う。そして、ステップS
409において、再文字切り出し前の文字画像ブロック
(ステップS402〜ステップS403で切り出された
文字画像ブロック)と再文字切り出し後の文字画像ブロ
ック(ステップS406〜ステップS407で切り出さ
れた文字画像ブロック)とを比較し、信頼度が大きい方
の結果を採用し、これを認識結果とする。このステップ
S409における信頼度の判定は図7のフローチャート
を用いて後述する。
ックを次に進める。そして、ステップS411で全ての
文字画像ブロックを調べたか否かを判定し、まだ未処理
の文字画像ブロックがあればステップS405へ戻る。
一方、全ての文字画像ブロックについて処理を終了した
ならば本処理を終了する。
定方法を説明する。図6は、各文字画像ブロックについ
て、横組み文字として再処理するか否かを判定する手順
を表すフローチャートである。
カテゴリと各文字画像ブロックとの類似度を計算し、類
似度が最大のカテゴリを識別演算の結果としている。文
字の切り出しが誤っている場合のように、類似した文字
が存在しない画像を識別しようとした場合、その類似度
は、正しく切り出しが行われている場合に比べて、一般
的に低くなる。本例ではこの性質を用いて再処理が必要
か否かを判定する。ここで、文字切り出しの再処理が必
要か否かを判断するための類似度の閾値をVとする。
定されている類似度の閾値Vと注目する文字画像ブロッ
クの類似度vとを比較する。ここで、v<Vならばステ
ップS503に進み、再度処理を行なう文字画像ブロッ
クであると判定する。また、v≧VであればステップS
502へ進む。ステップS502では、「10」と
「Ю」や「00」と「∞」などのように誤認識しやすい
文字を予め記憶した誤認識リストを参照し、ステップS
404による認識結果この誤認識リストに含まれるかど
うかを調べる。認識結果が誤認識リストに存在したなら
ばステップS503に進み、当該文字画像ブロックを再
度処理するものと判定する。尚、誤認識リストはROM
102もしくはRAM103に格納されている。
を行なうべき文字画像ブロックが選択される。
切り出し前後の認識結果のどちらを採用するかを決定す
るが、以下にこの処理について説明する。図7は、文字
切り出しの再処理(即ち横書き用の文字切り出し)が行
なわれた文字画像ブロックについて、再処理前後のどち
らの結果を採用するかを決定する手順を表すフローチャ
ートである。
り出しの再処理(ステップS406〜ステップS407
による横書き用の文字切り出し)により分割された画像
ブロックに対する識別演算(ステップS408)の結
果、類似度が予め定めた閾値Vより小さいものが存在す
るか否かを判断する。類似度の小さいものが1つでも存
在する場合はステップS602に進み、再処理される前
の元の結果(即ちステップS404で得られた結果)を
最終的な認識結果とする。一方、新たに切り出された全
ての文字画像ブロックにおける類似度が閾値Vより大き
ければ、横組みの文字切り出しが成功したとして、ステ
ップS603で再処理された後の結果(即ちステップS
408で得られた結果)を最終結果とする。
識別演算による類似度を、縦書き内横組み文字のための
処理を行なうかどうかの判定に用いることで、縦書き文
書の中に含まれる横組み文字部分を認識することが可能
となる。さらに、縦書き内の横組文字の処理が終了した
あとに、その結果を採用するかどうかを判定すること
で、誤認識を減少させ、認識精度を向上させる効果があ
る。
クの大きさを用いて再処理を行うか否かの判断を行う処
理を本実施例2に加えた構成で実施してもよいことはい
うまでもない。
行なう場合、縦書き内横組文字を判定し、その部分に対
し横書き用の処理を実施することで、これまで正しく行
なうことができなかった縦書き内横組み文字の認識を可
能にし、OCRによる入力作業をより正確に行なえ、誤
認識や認識不能文字の修正を軽減する効果がある。
ける横組み文字の混在を説明したが、横書き文書におけ
る立て組み文字の混在に対しても上述と同様の概念で実
現できることはいうまでもない。
システムに適用しても1つの機器からなる装置に適用し
ても良い。また、本発明はシステム或いは装置に本発明
により規定される処理を実行させるプログラムを供給す
ることによって達成される場合にも適用できることはい
うまでもない。
行方向の行中に含まれる文字の切り出し時に、列方向の
文字列についても文字の切り出しを行うことが可能とな
り、文字の認識率が向上する。
示すブロック図である。
の概要を説明する図である。
表すフローチャートである。
判定するための処理手順を表すフローチャートである。
チャートである。
再処理するか否かを判定する手順を表すフローチャート
である。
決定する手順を表すフローチャートである。
すフローチャートである。
ブロックの取り出し方法を説明する図である。
である。
Claims (10)
- 【請求項1】 画像より文字の認識を行う文字認識装置
であって、 前記画像の行方向の射影に基づいて行を抽出し、抽出さ
れた行に直交する列方向の射影に基づいて認識対象文字
を含む矩形領域を獲得する獲得手段と、 前記矩形領域の夫々について列方向の文字列を含むか否
かを判定する判定手段と、 前記判定手段により列方向の文字列を含むと判定された
矩形領域について、列方向の分割を行って新たな矩形領
域を生成する分割手段と、 前記獲得手段及び分割手段により得られた矩形領域毎に
文字認識処理を行う認識手段とを備えることを特徴とす
る文字認識装置。 - 【請求項2】 前記獲得手段は、前記画像の行方向の射
影に基づいて行を抽出し、抽出された行に直交する列方
向の射影に基づいて認識対象文字を切り出し、該認識対
象文字を内包するほぼ最少の矩形領域を獲得し、 前記判定手段は、前記矩形領域の夫々について、その列
方向の大きさに基づいて列方向の文字列を含むか否かを
判定することを特徴とする請求項1に記載の文字認識装
置。 - 【請求項3】 前記判定手段は、前記獲得手段により得
られた矩形領域の平均の行方向長さに基づいて矩形領域
の標準の列方向長さを生成し、前記矩形領域の夫々につ
いて、その列方向長さと該標準の列方向長さとに基づい
て列方向の文字列を含むか否かを判定することを特徴と
する請求項2に記載の文字認識装置。 - 【請求項4】 前記分割手段は、前記判定手段により列
方向の文字列を含むと判定された矩形領域について行方
向の射影をとることにより認識対象文字の切り出しを行
って新たな矩形領域を生成することを特徴とする請求項
1に記載の文字認識装置。 - 【請求項5】 画像より文字の認識を行う文字認識装置
であって、 前記画像の行方向の射影に基づいて行を抽出し、抽出さ
れた行に直交する列方向の射影に基づいて認識対象文字
を含む矩形領域を獲得する獲得手段と、 前記獲得手段により獲得された矩形領域毎に標準パター
ンとの類似度を獲得して文字認識を行う第1認識手段
と、 前記第1認識手段により獲得された類似度が所定値より
も小さい矩形領域について列方向の分割を行い分割され
た矩形領域を獲得する分割手段と、 前記分割された矩形領域の夫々について文字認識を行う
第2認識手段とを備えることを特徴とする文字認識装
置。 - 【請求項6】 列方向の文字と類似した形状を有する文
字を記憶する記憶手段を更に備え、 前記分割手段は、前記第1認識手段により獲得された類
似度が所定値よりも小さい場合、もしくは前記第1認識
手段による認識結果が前記記憶手段に記憶された文字で
ある場合、当該矩形領域について列方向の分割を行って
矩形領域を獲得することを特徴とする請求項5に記載の
文字認識装置。 - 【請求項7】 前記分割手段により分割されて得られた
矩形領域の少なくとも1つにおいて前記第2認識手段に
より得られた類似度が所定の値以下である場合、該分割
された矩形領域の分割前の矩形領域に対する前記第1認
識手段の認識結果を選択する選択手段を更に備えること
を特徴とする請求項5に記載の文字認識装置。 - 【請求項8】 画像より文字の認識を行う文字認識方法
であって、 前記画像の行方向の射影に基づいて行を抽出し、抽出さ
れた行に直交する列方向の射影に基づいて認識対象文字
を含む矩形領域を獲得する獲得工程と、 前記矩形領域の夫々について列方向の文字列を含むか否
かを判定する判定工程と、 前記判定工程により列方向の文字列を含むと判定された
矩形領域について、列方向の分割を行って新たな矩形領
域を生成する分割工程と、 前記獲得工程及び分割工程により得られた矩形領域毎に
文字認識処理を行う認識工程とを備えることを特徴とす
る文字認識方法。 - 【請求項9】 画像より文字の認識を行う文字認識方法
であって、 前記画像の行方向の射影に基づいて行を抽出し、抽出さ
れた行に直交する列方向の射影に基づいて認識対象文字
を含む矩形領域を獲得する獲得工程と、 前記獲得工程により獲得された矩形領域毎に標準パター
ンとの類似度を獲得して文字認識を行う第1認識工程
と、 前記第1認識工程により獲得された類似度が所定値より
も小さい矩形領域について列方向の分割を行い分割され
た矩形領域を獲得する分割工程と、 前記分割された矩形領域の夫々について標準パターンと
の類似度を獲得して文字認識を行う第2認識工程とを備
えることを特徴とする文字認識方法。 - 【請求項10】 画像より文字の切り出しを行う文字切
り出し方法であって、 前記画像の行方向の射影に基づいて行を抽出し、抽出さ
れた行に直交する列方向の射影に基づいて認識対象文字
を含む矩形領域を獲得する獲得工程と、 前記矩形領域の夫々について列方向の文字列を含むか否
かを判定する判定工程と、 前記判定工程により列方向の文字列を含むと判定された
矩形領域について、列方向の分割を行って新たな矩形領
域を生成する分割工程とを備えることを特徴とする文字
切り出し方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP14763194A JP3548234B2 (ja) | 1994-06-29 | 1994-06-29 | 文字認識方法及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP14763194A JP3548234B2 (ja) | 1994-06-29 | 1994-06-29 | 文字認識方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0816719A true JPH0816719A (ja) | 1996-01-19 |
JP3548234B2 JP3548234B2 (ja) | 2004-07-28 |
Family
ID=15434702
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP14763194A Expired - Fee Related JP3548234B2 (ja) | 1994-06-29 | 1994-06-29 | 文字認識方法及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3548234B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012256160A (ja) * | 2011-06-08 | 2012-12-27 | Internatl Business Mach Corp <Ibm> | 文字の読み順を決定するための読み順決定装置、方法及びプログラム |
JP2013101610A (ja) * | 2011-11-08 | 2013-05-23 | Canon Inc | 平均文字幅を判定する方法及び装置、並びに文字分割方法及び装置 |
JP2014127161A (ja) * | 2012-12-27 | 2014-07-07 | Nidec Sankyo Corp | 文字切り出し装置、文字認識装置、文字切り出し方法、およびプログラム |
JP2018519574A (ja) * | 2016-01-05 | 2018-07-19 | ▲騰▼▲訊▼科技(深▲セン▼)有限公司 | テキスト画像処理方法および装置 |
-
1994
- 1994-06-29 JP JP14763194A patent/JP3548234B2/ja not_active Expired - Fee Related
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012256160A (ja) * | 2011-06-08 | 2012-12-27 | Internatl Business Mach Corp <Ibm> | 文字の読み順を決定するための読み順決定装置、方法及びプログラム |
JP2013101610A (ja) * | 2011-11-08 | 2013-05-23 | Canon Inc | 平均文字幅を判定する方法及び装置、並びに文字分割方法及び装置 |
JP2014127161A (ja) * | 2012-12-27 | 2014-07-07 | Nidec Sankyo Corp | 文字切り出し装置、文字認識装置、文字切り出し方法、およびプログラム |
JP2018519574A (ja) * | 2016-01-05 | 2018-07-19 | ▲騰▼▲訊▼科技(深▲セン▼)有限公司 | テキスト画像処理方法および装置 |
US10572728B2 (en) | 2016-01-05 | 2020-02-25 | Tencent Technology (Shenzhen) Company Limited | Text image processing method and apparatus |
Also Published As
Publication number | Publication date |
---|---|
JP3548234B2 (ja) | 2004-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4914709A (en) | Method for identifying unrecognizable characters in optical character recognition machines | |
US7519226B2 (en) | Form search apparatus and method | |
US5410611A (en) | Method for identifying word bounding boxes in text | |
US5034991A (en) | Character recognition method and system | |
US6741745B2 (en) | Method and apparatus for formatting OCR text | |
EP0439951B1 (en) | Data processing | |
JPH08293001A (ja) | 画像処理装置及び光学的文字認識装置及びそれらの方法 | |
CN110008960B (zh) | 一种检测字符片段完整性的方法及终端 | |
JP2002015280A (ja) | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 | |
JPH0816719A (ja) | 文字切り出し方法とこれを用いた文字認識方法及び装置 | |
JP2612383B2 (ja) | 文字認識処理方式 | |
JP3135290B2 (ja) | 画像処理方法及び装置 | |
JPH09269970A (ja) | 文字認識方法とその装置 | |
JP3157530B2 (ja) | 文字切り出し方法 | |
JP2995818B2 (ja) | 文字切り出し方法 | |
JPH0535916A (ja) | 文字切り出し方法 | |
JPH06215183A (ja) | 文字認識装置 | |
JPH09106437A (ja) | 文字切出し装置および文字切出し方法 | |
JPH06215181A (ja) | 文字・文字列切り出し方法および文字認識装置 | |
JPH1185905A (ja) | 書体識別装置および書体識別方法および情報記憶媒体 | |
JP3320083B2 (ja) | 文字認識装置及び方法 | |
JPH08147314A (ja) | 認識型文書ファイリング装置及びその制御方法 | |
JPH10134147A (ja) | フォント識別装置およびそのフォント識別処理を記憶した記憶媒体 | |
JP4544691B2 (ja) | 文字読取装置 | |
JP3243389B2 (ja) | 文書識別方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040412 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040416 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090423 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090423 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100423 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110423 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130423 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130423 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140423 Year of fee payment: 10 |
|
LAPS | Cancellation because of no payment of annual fees |