JPH1027214A

JPH1027214A - 光学式文字認識コンピュータにおける接触文字の分離方法及び装置

Info

Publication number: JPH1027214A
Application number: JP8354733A
Authority: JP
Inventors: Hamadi Jamali; ジャマリハムディ
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1995-12-22
Filing date: 1996-12-20
Publication date: 1998-01-27
Also published as: CA2192023C; DE69626182D1; EP0780782A3; DE69626182T2; CA2192023A1; EP0780782A2; US5768414A; EP0780782B1

Abstract

(57)【要約】（修正有）【課題】ＯＣＲにおいて、２値とグレイスケールの両
形式で分割イメージボックスを生成できるようにし、接
触している文字を正確に分離する。【解決手段】分類モジュール６は２進化あるいはグレ
イスケール画像に対して動作し、分割モジュール４の描
いた分割イメージボックス５内でモデルライブラリ７に
基づき分類を行う。分類できた文字は符号化されてＡＳ
ＣＩＩなどにコード化される。分類できなかった部分に
ついては、解析モジュール１２が画素ブリッジを生成し
たスプレッドファンクション効果を解消しようとグレイ
スケールイメージにフィルタを施し、これに対して、こ
れを２進化したイメージに基づき分割モジュール４が新
しいボックスを描く。それでも接触している文字が残っ
ている場合は、隣接走査線検査モジュール１４や分離し
きい値決定モジュール１０が再処理を行う。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、光学式文字認識コ
ンピュータにおいて接触している文字を分離するための
方法及び装置、並びに光学式文字認識コンピュータに関
する。

【０００２】

【従来の技術】光学式文字認識 (OCR) の過程には、ス
キャナにより光学的に走査された入力文書のコンピュー
タ解析が、その入力文書に表われている文字を判別する
上で是非とも必要である。入力文書が印刷によって作り
出される場合もある。印刷や走査のステップでは歪みが
生じることもあって、結果として解析される文字の中に
は接触して見える文字が存在することがある。このよう
な場合、OCRコンピュータがこのような文字を正確に識
別することは困難である。

【０００３】文字が接触する原因としては、多種多様の
原因がある。プリンタに起因した接触している文字の原
因には、プリンタのスプレッドファンクション、インク
の飛散、プリンタノイズ、機械的な妨害、ほこりの汚
点、プリンタの低解像度などがある。スキャナに起因し
た接触している文字の原因には、スキャナのスプレッド
ファンクション、スキャナの動作によるノイズ、低解像
度などがある。接触している文字の他の例は、フォント
のデザインによっても生じる可能性がある。たとえば、
相互に接触させるとか、あるいは非常に接近させてデザ
インしてある文字による場合である。以上に述べた要因
の一部または全部が相互に関連して接触している文字を
高率で生じさせるとも考えられる。たとえば、６００dp
i (dot perinchインチあたりのドット数) のテキストを
４００dpiで走査すると、接触している文字の発生率が
２０％になることも珍しくはない。これでは、読み易い
OCRを行おうとする折角の試みも台無しとなる。

【０００４】

【発明が解決しようとする課題】接触している文字を補
正する従来技術の方法は粗雑なものであり、接触してい
ることを無視するか、十分な部分的分離しきい値を求め
るか、接触しそうな文字の組合せから成るテンプレート
をデザインするか、そのいずれかに集中していた。これ
らの方法は試行錯誤に基づく方法であって、通常、多く
は次のような特徴を有する普通のフォントの場合にさえ
失敗が生じている。すなわち、細い文字ストロークに起
因する明暗度のレベルが、2個の文字が接触している領
域ゆえに生じる明暗度のレベルよりも低いようなフォン
トの場合である。更にその上、公知の方法は分類モジュ
ールを有していても、このモジュールが作動するのは２
進イメージに対してだけである。従って、達成できる精
度水準に限界があった。

【０００５】本発明は、上述の問題点を解消するため
に、２進フォーマット及びグレイスケールフォーマット
の両形式で分割イメージボックスの生成を可能にし、こ
れによって、光学式文字認識（OCR）コンピュータ内で
の接触している文字を正確に分離することができる方法
及び装置並びにOCRコンピュータを提供することを目的
とする。

【０００６】

【問題を解決するための手段】上記目的を達成するため
に、本発明は、入力文書を光学式に走査して一組の走査
線を生成するステップと、前記一組の走査線に対して分
割過程を実行して一組の分割イメージボックスを生成す
るステップと、各走査線について分離しきい値を決定す
るステップと、解析関数を用いて各走査線を解析するス
テップと、各走査線をその分離しきい値を使用して２進
化して一組の処理された走査線を生成するステップと、
前記一組の処理された走査線に対して分割過程を実行し
て新しい一組の分割イメージボックスを生成するステッ
プと、前記新しい一組の分割イメージボックスに対して
分類操作を実行して前記入力文書の２進化表示を生成す
るステップとから成る、光学式文字認識コンピュータに
おける接触文字の分離方法を提供する。

【０００７】好ましくは、前記光学式走査ステップはグ
レイスケールスキャナにより実行される。

【０００８】また好ましくは、前記分離しきい値決定ス
テップの後に、その分離しきい値に関して各走査線を正
規化するステップを更に含む。

【０００９】前記分離しきい値決定ステップは前記解析
ステップの前または、後に実行される。

【００１０】好ましくは、前記解析関数は積算−加算移
動平均関数、積算−加算自己回帰関数、積算−加算自己
回帰移動平均関数、２次積算−加算移動平均関数、２次
積算−加算自己回帰関数、または２次積算−加算自己回
帰移動平均関数のいずれか１つである。

【００１１】好ましくは、前記分離しきい値は各走査線
について同一であるか、または、各走査線は自己の分離
しきい値を有する。

【００１２】また、前記分類操作実行ステップの後で、
接触している文字が残存するか否かを判定するステップ
を実行することが好ましい。この場合、接触している文
字が残存している場合には、再分類ステップを実行する
とよい。更に、前記再分類ステップは、接触部分を分割
するか否かを判別するために、隣接走査線を同一の水平
方向の（画素）位置で検査するのが好ましい。

【００１３】更に好ましくは、前記再分類ステップは、
接触部分を分割するために分離しきい値を移動させるこ
とを含む。また前記再分類ステップは、前記解析関数に
異なるパラメータを用いて前記解析ステップを繰返し実
施することを含む。

【００１４】また、上記目的を達成するために、本発明
は、入力文書を光学式に走査して一組の走査線を生成す
る手段と、前記一組の走査線に対して分割過程を実行し
て一組の分割イメージボックスを生成する手段と、各走
査線について分離しきい値を決定する手段と、解析関数
を用いて各走査線を解析する手段と、各走査線をその分
離しきい値を使用して２進化して一組の処理された走査
線を生成する手段と、前記一組の処理された走査線に対
して分割過程を実行して新しい一組の分割イメージボッ
クスを生成する手段と、前記新しい一組の分割イメージ
ボックスに対して分類操作を実行して前記入力文書の２
進化表示を生成する手段とから成る光学式文字認識コン
ピュータにおける接触文字を分離する装置を提供する。

【００１５】更に、上記目的を達成するために、本発明
は、光学式に入力文書を走査して一組の走査線を生成す
るための手段と、前記一組の走査線に接続された入力を
有する分割モジュールと、前記分割モジュールの出力に
接続された分類モジュールと、前記分割モジュールの入
力に接続された２進化モジュールと、前記２進化モジュ
ールの入力に接続された解析モジュールと、前記解析モ
ジュールに接続された分離しきい値決定モジュールとを
備えた光学式文字認識コンピュータを提供する。

【００１６】

【発明の実施の形態】以下、本発明の実施の形態を図面
を参照して詳細に説明する。

【００１７】図１は、本発明を使用したOCRコンピュー
タのブロックダイアグラムである。スキャナ（２）は入
力文書(２０)を走査して数値の配列を作り出す。この配
列の数値の各行は、走査線（３）と呼ばれる。該一組の
走査線 (３) に対して分割モジュール（４）が作動し
て、一組の相互に接続した成分のイメージボックス(５)
を生成する。このボックス（５）中の各走査線（３）に
ついて分離しきい値（Ｔ）が決定される（１０）。各走
査線（３）に解析モジュール（１２）による解析ステッ
プが適用される。各走査線（３）は、自己の分離しきい
値（Ｔ）を使用して２進化モジュール（１３）により２
進化されて一組の処理された走査線を生成する。該一組
の処理された走査線に対して前記分割モジュール（４）
による分割処理が行われて、新しい一組の分割イメージ
ボックス（５）を生成する。該新しい一組の分割イメー
ジボックス（５）に対して分類モジュール（６）による
分離操作が実行されて、前記入力文書（２０）の２進化
表示（８）を生成する。

【００１８】入力文書２０は、場合によっては、英数文
字が印刷してある紙１頁のこともあるがいずれにして
も、光学式スキャナ２により走査される。スキャナ２
は、図示したようにグレイスケールスキャナである。し
かし、フルカラースキャナなど他のスキャナを使用する
ことも可能である。スキャナ２は、光学式文字認識 (OC
R)コンピュータ１の一部を成することもでき、あるいは
物理的に分離した単体でもよい。このように２通りの可
能性があるゆえ、図１ではスキャナ２の部分だけを点線
で囲んで示してある。

【００１９】スキャナ２の出力は数値の配列であるが、
これを一組の走査線３として視ることができる。各走査
線３は、入力文書２０の頁上に水平方向の位置の関数と
してグレイスケールレベルを描いている。入力文書２０
の頁の１文字あたりの走査線３の数は、文字サイズ、ス
キャナ２の解像度等によって一様ではないが、サイズ１
２の書体の場合には１文字あたり約６０個の走査線が一
般的である。

【００２０】グレイスケールのレベル数は、スキャナ２
の特性に基づいて異なり、一般的には２５６である。こ
のようなグレイスケールの解像度の場合は、一般的に
は、レベル２５５で純然たる黒を、レベルゼロで純白を
表わすものと想定できる。

【００２１】図2（a）、（b）、及び（c）に、走査線３
の具体例を３例示す。図2（a）は、弱い結合部４０及び
分離しきい値Ｔを有する走査線３を表わす。図2（b）
は、中程度の結合部４０及び分離しきい値Ｔを有する走
査線３を表わす。図2（c）は、強度の結合部４０及び分
離しきい値Ｔを有する走査線３を表わす。

【００２２】図2（a）、（b）、及び（c）の横軸は、入
力文書２０の頁の横軸に一致し、スキャナ２の解像度に
従って個別の画素数に区切られている。図2（a）、
（b）、及び（c）の各走査線３は、一対の接触している
文字から採ってある。四角で囲った範囲４１は、文字内
の細いストロークの領域を表わす。丸で囲った範囲４０
は、該２つの文字が接触している領域を表わす。この範
囲４０は、結合部、つまり「画素ブリッジ」と呼ばれる
こともあり、文字間にあってグレイスケールのレベル
が、たとえ画素が１つの場合でも決してゼロにならない
範囲と定義されている。

【００２３】図2（a）、（b）、及び（c）の走査線３に
対応する元の鮮明な画素マトリックスイメージの行は、
通常入手不可能であるが、図2（a）、（b）、及び（c）
に一連の点線５で表わされている。図2（a）、（b）、
及び（c）に示した（分割イメージボックス５にあた
る）点線のグレイスケール２５５の台地状形は、文字中
の異なるストロークを表わす。もっとも、他の走査線の
場合にはこうした台地状形が１文字全体を表わすことが
あることは後で明らかになる。元の画素は０か２５５の
どちらか一方のグレイスケール値を有していたのだが、
「従来の技術」の項で述べた１つあるいはそれ以上の過
程によって歪められたのである。たとえば、元の画素マ
トリックスは、コンピュータ上にも作り出せたはずであ
るが、その場合は、該コンピュータが文字を印刷し、文
書２０として作りだすと、最初の一組の歪みが表われ
た。二番目の一組の歪みは、文書２０をスキャナ２によ
って走査した際に表われたのである。

【００２４】図2（a）に示された画素ブリッジ４０は、
弱いブリッジと考えられる。ブリッジ４０中のグレイス
ケールの最高レベルが、どの文字ストロークのグレイス
ケールの最低レベルの内の最高レベルと比較しても低い
ためである。図2（b）に示された画素ブリッジ４０は中
程度のブリッジと考えられるが、それはブリッジ４０中
のグレイスケールの最高レベルが、文字の幾つかの部分
のグレイスケールの最低レベルの内の最高レベルと同程
度であるからである。図2（c）の画素ブリッジ４０は、
強度のブリッジ４０と考えられる。ブリッジ４０中のグ
レイスケールのレベルが、イメージ中のグレイスケール
の最高レベルに非常に接近していて、文字の幾つかの細
いストロークのグレイスケールのレベルよりも目立って
高いからである。図2（a）から注目すべきことは、（弱
い結合部４０としても知られている）弱いブリッジ４０
が、走査線分離しきい値Ｔにより解像できる点である。
中程度の結合部４０も値が対応する走査線３の分離しき
い値Ｔの値よりも少々高めのしきい値を使用して解像可
能である。但し、この場合のイメージは、グレイスケー
ルレベルが中程度のブリッジ４０のグレイスケールレベ
ルより低い細いストロークを含まない場合である。たと
えば、図2（a）及び（b）の走査線３が同一イメージを
元にしているならば、これは不可能である。強度の結合
部４０は、単にしきい値を操作するだけでは上手く解像
できない。各走査線３について異なった分離しきい値Ｔ
を有することが、この走査線３を処理する独特な基準を
提供してくれる。このことによって異なった大きさのブ
リッジ４０は、それらが同一イメージ中に存在する場合
でも解像可能になる。そして、こうした場合は、往々に
して起こりうるケースなのである。

【００２５】従来のOCRの過程と同様に、走査線３は、
入力として分割モジュール４に送られる。分割モジュー
ル４は、その一組の走査線３を分割して一組の分割イメ
ージボックス５に変えるが、このイメージボックス５
は、文字に分類される候補である部分を取り囲んでい
る。ユーザの必要に応じて、このイメージボックスには
２進イメージか、あるいはグレイスケールイメージのど
ちらか一方が入っている。スキャナ２が内蔵の２進化装
置を備えていない場合は、スキャナ２が出力した走査線
３はグローバル２進化モジュール１５を通過させられ、
２進化される。この場合は、分割モジュールは、グレイ
スケール走査線３か、あるいは２進化された走査線３の
いずれか一方に対して作動することができる。しかし、
文字が接触している場合は、分割イメージボックス５は
個々の文字を取り囲むのではなくて、接触している文字
群を取り囲むのである。図2（c）のケースでは、単一の
ボックス５が２つの文字を取り囲んでいる。

【００２６】OCR過程における次のステップは分類のス
テップである。このステップは分類モジュール６が実行
する。分類モジュール６は、分割イメージボックス５を
検査し、それを実際の文字に対応する予め設定されたモ
デルライブラリ７と比較する。分類モジュール６は、認
識可能な文字の特徴ならどれでも基にすることができ
る。たとえば、分類モジュール６はテンプレートマッチ
ングモジュールでもよい。この場合、モデルライブラリ
７は、実際の文字のテンプレートイメージから成る。ま
た別の例では、分類モジュール６は、イメージから選択
された値の幾分減少されたベクトルを基にすることも可
能である。この場合、モデルライブラリ７は実際の文字
を表わす類似のベクトルから成る。また、他の方法を選
択することも可能である。加えて、分類モジュール６
は、ボックス５に含まれる２進イメージか、あるいはグ
レイスケールイメージのいずれか一方に対して作動する
ことができる。各分類方法には、近似もしくは類似度が
あって、その度数に基づいてマッチング（一致度）に関
する判定が下される。これは、分類方法の信頼度と呼ば
れる。

【００２７】分類モジュール６は、ボックス５が囲んだ
候補文字の一つが既知の文字であるか否かの判定を、該
候補文字とライブラリ７内に格納してあるモデルの一つ
との間の近似（類似）度に基づいて行う。たとえば、テ
ンプレートマッチングの場合、類似度は、往々相関係数
として表わされる。係数１は完全な一致を、係数０は全
くの不一致を示す。０．９４よりも大きい相関係数は良
好と見做されて、その結果、大方のOCRシステムにおい
ては、候補文字はライブラリのテンプレートのセットか
ら出た文字であるという肯定的判定が下される。通常
は、かかる肯定的判定の結果として、記憶領域８に記憶
されている文字が２進化表示される。２進表示８を生成
するのに使用される２進コードは、いかなる２進コード
でもよいのだが、たとえば、ASCIIがある。２進化表示
８は、OCRコンピュータ１のユーザが操作することも可
能であるし、コンピュータ１からの出力として幾つかの
可能な出力装置の内のいずれか１つ、またはそれ以上に
送ることも可能である。出力装置には制限がなく、ディ
スプレイ３０、ローカルエリアネットワーク（LAN）３
１、ワイドエリアネットワーク（WAN）３２、プリンタ
３３、ファクシミリ３４などが含まれる。

【００２８】非常に低い信頼度を示すような候補文字に
関しては、分類モジュール６は、接触文字判定モジュー
ル９に管理を委ねる。モジュール９は、一連のステップ
を実用して、低い類似度が確かに２つまたはそれ以上の
接触している文字を表わすものであって、それが何か他
の理由により、たとえば単一の文字でライブラリ７中に
一致するモデルが存在しないような文字により生じてい
るのではない旨を確認するのが好ましい。

【００２９】モジュール９が実行する確認ステップは、
モジュール４、６、及び９−１４が実行する全てのステ
ップと同様に、ソフトウェア、ハードウェア、ファーム
ウェア、またはそれらの幾つかの組合せにより実施する
ことができる。ハードウェアにより実施する場合には、
モジュール４、６、及び９−１４はコンピュータ１内の
単一のプロセッサにより実行可能である。代替方法とし
ては、モジュール４、６、及び９−１４のうちの１つま
たはそれ以上が、専用のプロセッサを有することも可能
である。

【００３０】確認ステップは、概して、ボックス５全体
の大きさ、走査線３内のボックス５の水平方向の位置、
及びボックス５内の画素数のチェックを含む。（このチ
ェックは、上述のパラメータとモジュール９内に格納さ
れた一組の基本線パラメータとを比較することにより行
われるのであるが、）このチェックにより２つ以上の接
触している文字の存在が示されれば、管理は次に実行さ
れるモジュールに委ねられる。このモジュールは、通
常、分離しきい値決定モジュール１０であるが、解析(d
econvolution)モジュール１２でもよい。

【００３１】一方、もし確認ステップで、候補文字が未
知の文字であって、２つ以上の接触している文字ではな
いことが示されれば、その未知の文字の２進表示が２進
表示記憶領域８に送られる。

【００３２】記憶領域８は、走査線３、分割イメージボ
ックス５、及びモデルライブラリ７を格納している記憶
領域と同様に、コンピュータで使用する記憶領域ならば
どれであっても可能であり、たとえば、フロッピーディ
スク、ハードディスク、磁気メモリ、光学メモリ、バブ
ルメモリなどがある。

【００３３】分離しきい値決定モジュール１０は通常は
解析モジュール１２に先立って実行されるが、解析モジ
ュール１２の後に実行しても構わない。オプションの正
規化モジュール１１を呼び出す場合は、モジュール１０
及び１１は両方ともモジュール１２に先立ち実行され
る。

【００３４】モジュール１０の目的は、各走査線３につ
いてグレイスケールレベルで表わされた分離しきい値Ｔ
を決定することである。Ｔよりも上のグレイスケールレ
ベルは、文字、文字の一部（ストローク）、または接触
している文字間の画素ブリッジ４０を表わすものと見做
される。これに対して、Ｔよりも下のグレイスケールレ
ベルは、文字間の、または同じ文字の部分間の間隔領域
と見做される。

【００３５】各走査線３には、それ独自のＴを割り当て
ることができる。この方式は、動的しきい値決定として
知られている。これには、走査線３を個々に処理する独
特な基準を提供するという利点があって、それによっ
て、同一のイメージ中で異なる厳密度を用いて結合部を
扱う際にその処理が更に柔軟になるという結果が得られ
る。一方、同一のＴ値を文書２０内の走査線３の全てに
使用することもできる。この方式は、静的しきい値決定
として知られている。

【００３６】しきい値レベルＴは、何らかの任意の数、
たとえばグレイスケールレベル１００でもよい。代替方
法としては、Ｔを走査線３の平均グレイスケールレベル
として算出することもできる。この平均レベルは「重
心」と呼ばれることがある。フォントあるいは関連する
フォントセットに従ってＴを決定するには、重心に予め
選択した係数、たとえば０．９を乗じることも可能であ
る。

【００３７】各走査線３についてしきい値Ｔがモジュー
ル１０によって決められた後、（必ずしも必要ではない
が）通常は、正規化モジュール１１が呼び出される。正
規化モジュール１１の目的は、解析モジュール１２が実
行する計算の簡略化にある。正規化ステップにおいて
は、各走査線３に対する縦（グレイスケール）軸の目盛
りの位置が変更されて、レベルＴがグレイスケールレベ
ルの０になるように再設定される。この結果、グレイス
ケールレベルの位置関係は、Ｔより上にある画素の目盛
りがプラスに、Ｔより下にある画素の目盛りがマイナス
に変化している。モジュール１１の出力は、図3（a）、
（b）、及び（c）に示してあり、それぞれ、図2（a）、
（b）、及び（c）に示した走査線３に対応している。

【００３８】解析モジュール１２は各走査線３に対して
解析関数ｆを適用する。この目的は、まず第一に、画素
ブリッジを生成したスプレッドファンクション効果を、
まず可能な限り反転しようとする試みである。モジュー
ル１２の出力は、図4（a）、（b）、及び（c）に示して
あリ、それぞれ、図3（a）、（b）、及び（c）に対応し
ている。関数ｆは、一般には積算−加算解析関数（mult
iply-add deconvolution function)である。関数ｆは、
移動平均関数、自己回帰関数、もしくは自己回帰移動平
均関数でもよい。関数ｆは、上記いずれのフィルタ構造
の二次元バージョンであってもよく、そのバージョンは
幾つかの走査線３に同時に適用できる。このような関数
ｆは、フォントに対する感度が高い。たとえば、単純な
移動平均関数では、僅か2つの画素、つまり、画素ｐ及
び画素ｐ−１（図3（a）及び4（a）を参照）が使用され
るのみである。このような画素の各対については、各画
素ｐに対するグレイスケールの新しい値が、関数ｆによ
って、画素ｐ及び画素ｐ−１の元のグレイスケールレベ
ルの加重平均として算出される。たとえば、画素ｐに対
する新しい値は、ｐの値からｐ−１の値の０．６倍を差
し引いたものである。かかる移動平均関数は、比較的暗
い画素のグレイスケール値を増加させかつ比較的明るい
画素のグレイスケール値を減少させることにより走査線
３のコントラストを高める。注目すべきは、かかる基本
的積算−加算フィルタに対してさえも中程度のブリッジ
４０のグレイスケールレベルは０以下に下がり、図4bに
示すような分離の成功を示すという点である。

【００３９】上述の構造のいずれかを有する最適な関数
ｆは、適応的方法でデータから算出できる。それにはフ
ィルタ係数を最新のものにする最適化のメカニズムを設
定する必要がある。この最適化のメカニズムは、標準最
小平均２乗誤差基準か、あるいはその非線形ヴァリエー
ションのどれか、たとえば一定の係数誤差基準（consta
nt modulus error criterion)か、そのいずれか一つに
基づくことができる。また、現在市場に出回っているプ
リンタやスキャナのタイプに関しては、上で概説した構
造の族から得られる名目的で一定なパラメータ関数ｆで
十分である。簡易さ、実行速度、及び性能の点で特に好
ましい実施の形態は、積算−加算フィルタ解析関数が下
記式で表されるものである。

【００４０】Yp ＝ f(yp) ＝ yp ＋ ayp-1 ここで、Ypは、走査線３の画素位置ｐにおけるグレイス
ケールの算出されたレベル、ypは、走査線３の画素位置
ｐにおけるグレイスケールの実際のレベル、yp-1は、位
置ｐの左の画素位置におけるグレイスケールの実際のレ
ベル、a は、通常は−0.06であり、プリンタかスキャナ
２が変われば異なる可能性がある。

【００４１】２進化モジュール１３の目的は、画素全て
に純然たる黒か白の状態になるような特性を与えること
である。２進化過程においては、しきい値Ｔよりも上に
存在する解析関数ｆを施された画素は、最大グレイスケ
ール値をとるように設定され、この場合、その値は２５
５である。レベルＴよりも下に存在する解析された画素
は、グレイスケールレベル０をとるように設定される。

【００４２】２進化モジュール１３の出力は、図5
（a）、（b）、及び（c）に示してあり、それぞれ、図4
（a）、（b）、及び（c）に対応する。図5（a）及び
（b）にあるように、基本的一次解析モジュール１２の
移動平均積算−加算過程の後に２進化モジュール１３を
適用することにより、弱い画素ブリッジ４０及び中程度
の画素ブリッジ４０を、（グレイスケールレベルがゼロ
に設定されて）分離することに成功した。一方、強度の
画素ブリッジ４０の場合も同様の手順で２５５に設定さ
れるが、図5cにあるように接触している文字が相変わら
ず残存していることが分る。

【００４３】２進化モジュール１３の出力は分割モジュ
ール４に送られ、分割モジュール４は新しい一組の分割
イメージボックス５を生成する。分類モジュール６が２
進イメージ５に対して作動するタイプであれば、イメー
ジボックス５は、図5（d）のタイプの走査線３で作られ
る。一方、分類モジュール６がグレイスケールイメージ
５を処理の対象とする場合は、イメージボックス５は，
図5（e）のタイプの走査線３で作られる。図示例では、
分割モジュール４は、図5（a）及び（b）のそれぞれに
ある走査線３のイメージに対応するグレイスケール文字
の回りに、結果として得られた２進イメージから抽出さ
れる寸法を使用して、２つのボックス５を描く。これら
のボックス５はいずれも、1個の文字イメージを含んで
いる。一方、図5（c）の走査線３の２進イメージから抽
出されたパラメータからは、２つの接触している文字を
取り囲むボックス５が１つだけ生成される結果となる。
分類モジュール６は、次に、これらの新しい分割イメー
ジボックス５をモデルライブラリ７と比較する。図示例
では、最初の２つの候補文字は、既知の文字として分類
されて２進化され、２進化表示記憶領域８に送られる。
しかし、分類モジュール６が接触文字判定モジュール９
を調べて確かめた結果、一対の接触している文字は相変
わらず残っている場合には、この時点で、分類モジュー
ル６は何らかの再処理が必要であると判断する。再処理
の実施の形態は、以下に述べるように３つある。

【００４４】第１の再処理の実施の形態は好ましい形態
であって、この実施形態においては、分類モジュール６
は隣接走査線検査モジュール１４に管理を委ねる。モジ
ュール１４は、図4（a）、（b）、及び（c）に示した種
類の走査線の、予め２進化された組に対して作動する。
モジュール１４は、走査線３に沿った同一の水平方向の
（画素）位置p*（図4（c）を参照）近傍の隣接走査線３
のグループを検査する。この水平方向の位置は、画素ブ
リッジ４０であると思われる位置ならどの位置でもよ
い。図示した例では、モジュール１４は、走査線３が同
一イメージから採ってあり、かつ隣接していると想定し
て１４から１８及び３１から３３の位置（それぞれ、四
角で囲まれた範囲４１及び丸で囲まれた範囲４０）近傍
の走査線３の一部または全部を検査する。

【００４５】モジュール１４を実行する一つの方法は、
モジュール１４を次のような内容のプログラムに組むこ
とである。すなわち、検査した全ての走査線３について
画素p*のグレイスケールレベルのパーセンテージがほん
の少々（たとえば１０％以下）でも結合部（画素ブリッ
ジ）の存在を示す場合は、位置p*のグレイスケールレベ
ル全体を０に設定すると判定するようにプログラムを組
むのである。そうでない場合は、位置p*のグレイスケー
ルレベル全体が２５５に設定される。図示例の場合、図
4（a）、（b）、及び（c）は、１４から１８の画素位置
近傍のグレイスケールレベルが３つの走査線３の全てに
おいてゼロまたはそれよりも低いことを示しており、こ
の位置が正当な白の領域であることが分る。しかし、画
素位置３１から３３の近傍ではグレイスケールレベルが
ゼロより低下している（図4（a）及び4（b））のは３つ
の走査線３の内の２つだけである。図示例では、図4
（c）の３１から３３の位置のグレイスケールレベルを
ゼロに設定する方を選択して、この位置もブリッジ４０
であると考えられることを示すようにしてもよい。実際
の状況では、両方の位置の走査線３を全て処理して初め
て、そのような結論に至るのである。

【００４６】この方法を改良した実施の形態としては、
モジュール１４のプログラムを、モジュール１４が画素
p*のレベルを０に設定するか２５５に設定するか判定す
る際に、隣接の画素を検査するように組む。たとえば、
位置p*＋１及びp*−１も検査する。その際は加重平均が
採られる。たとえば、位置p*には、位置p*＋１及びp*−
１の各々の２倍の加重を与えることができる。次に、検
査した全ての走査線３について、３つの位置の全てに対
する全体的なグレイスケールレベルが計算される。この
平均グレイスケールレベルが或る予め選択したレベル
（レベルＴか、あるいはＴの関数でもよい）よりも低け
れば、位置p*のグレイスケールレベルは０に設定され
る。さもなければ、それは最大レベルの２５５に設定さ
れる。図5（d）は、モジュール１４が本発明の例を用い
てこれを実行した結果を示している。図5（e）は、分類
モジュール６がグレイスケールイメージ５を必要とする
際に、分割モジュール４により出力され、ボックス５と
して描かれた走査線３のタイプを示している。

【００４７】モジュール１４が再処理を実行した後、管
理は分割モジュール４に戻されて、処理は前と同様に続
行される。

【００４８】第２の再処理の実施の形態においては、分
類モジュール６は、分離しきい値決定モジュール１０に
管理を委ねる。分離しきい値決定モジュール１０は（図
2（a）、（b）、及び（c）における）Ｔの位置を変更し
て、Ｔに最も接近しているがＴの上にあるような画素
ブリッジ４０の最低グレイスケールレベルよりも少し上
に、Ｔがくるようにする。これは、図4（a）、（b）、
及び（c）においてゼロレベルの位置を変更するのと同
じことである。図4（a）、（b）、及び（c）に示した例
では、そのような「最低の下降部分」が画素p*に表われ
ている。かくして、モジュール１０は、Ｔの位置を画素
ｐ*の元のグレイスケールレベルよりも少し上に変更す
るか、あるいは同じことであるが、図4（a）、（b）、
及び（c）におけるゼロレベルの位置をp*のレベルより
も少し上に変更する。再処理がモジュール１０によって
実行された後は、管理は前と同様に正規化モジュール１
１か、あるいは解析モジュール１２に委ねられる。

【００４９】第３の再処理の実施の形態においては、分
類モジュール６は、解析モジュール１２に管理を委ね
る。モジュール１２は、（位置p*の）最低の下降部分が
レベルＴよりも（モジュール１２の出力ではゼロより
も）下がるまで繰返し実行される。これは、解析関数ｆ
内の重みを変更したり、関数ｆ内の計算に更に多くの画
素を採り入れたりすること等によって実施可能である。
再処理がモジュール１２によって実行された後は、管理
は前と同様に２進化モジュール１３に委ねられる。

【００５０】再処理ステップの後、分割モジュール４
は、もう一組の分割イメージボックス５を生成し、分類
モジュール６はそれをモデルライブラリ７と比較する。
再処理ステップは、一回または予め選択した任意の回数
実行できる。あるいは、所望通り、接触している文字を
全て分離し終えるまで実行することも可能である。

【００５１】図6（a）は、イメージを従来の光学式文字
認識方法で処理した後のその印刷出力を表現したもので
ある。文字「ａ」及び「ｒ」が強度の結合のために上手
く分離できていない点に注意する必要がある。図6（b）
は、図6（a）と同一の入力文書２０を本発明のOCRコン
ピュータ１により処理した後でプリンタ３３に出力した
ものを示している。本発明が「ａ」及び「ｒ」の文字を
見事に分離していて、しかも、文字「ａ」では更に完全
なる状態が得られていることに注目されたい。

【００５２】以上、好ましい実施の形態の作用をも含め
て説明したが、上記の説明は本発明の範囲を限定するも
のではない。本発明の範囲は冒頭の特許請求の範囲によ
ってのみ限定されるべきである。上記の説明から、様々
な変更や修正が可能であり、しかも、本発明の精神及び
範囲から逸脱することなくそれを達成し得ることは、当
業者には明白であろう。たとえば、好ましい実施の形態
は、グレイスケールスキャナ２との関連で示したが、本
発明は同様にカラースキャナでも使用できる。ただし、
処理は全て３次元で行われるものであって、１次元で行
われるものではない。

【００５３】

【発明の効果】以上説明したように、本発明によれば、
２進フォーマット及びグレイスケールフォーマットの両
形式で分割イメージボックスの生成を可能にし、これに
よって、光学式文字認識（OCR）コンピュータ内での接
触している文字を正確に分離することができるという効
果を奏する。

【図面の簡単な説明】

【図１】本発明を使用したOCRコンピュータのブロック
ダイアグラムである。

【図２】（a）グレイスケールを画素位置の関数として
示し、本発明のモジュール１０により拡大された弱い結
合部４０を有する典型的走査線３を示す図である。
（b）グレイスケールを画素位置の関数として示し、本
発明のモジュール１０により中程度の結合部４０を有す
る拡大された典型的走査線３を示す図である。（c）グ
レイスケールを画素位置の関数として示し、本発明のモ
ジュール１０により拡大された強い結合部４０を有する
典型的走査線３を示す図である。

【図３】（a）モジュール１１により処理された後の図2
aの走査線３を示す図である。（b）モジュール1１によ
り処理された後の図2bの走査線３を示す図である。
（c）モジュール１１により処理された後の図2cの走査
線３を示す図である。

【図４】（a）基本的一次移動平均積算−加算解析モジ
ュール１２によって処理された後の図3（a）の走査線を
示す図である。（b）基本的一次移動平均積算−加算解
析モジュール１２によって処理された後の図3（b）の走
査線を示す図である。（c）基本的一次移動平均積算−
加算解析モジュール１２によって処理された後の図3
（c）の走査線を示す図である。

【図５】（a）２進化モジュール１３によって処理され
た後の図4（a）の走査線を示す図である。（b）２進化
モジュール１３によって処理された後の図4（b）の走査
線を示す図である。（c）２進化モジュール１３によっ
て処理された後の図4（c）の走査線を示す図である。
（d）隣接走査線検査モジュール１４及び２進化モジュ
ール１３によって処理された後の図3（c）の走査線３を
示す図である。（e）図2（c）から画素ブリッジ４０を
取り除いた元の走査線３を示す図である。

【図６】（a）従来の明暗度に基づく方法が失敗した典
型的なケースを示す図である。（b）図6（a）を得たと
同じ例に対して、本発明が接触している文字を正しく分
割する結果を得ていること示す図である。

【符号の説明】

１ OCRコンピュータ２スキャナ３走査線４分割モジュール５分割イメージボックス６分類モジュール７モデルライブラリ８２進化表示９接触文字判定モジュール１０分離しきい値決定モジュール１１正規化モジュール１２解析モジュール１３２進化モジュール１４隣接走査線検査モジュール１５包括２進化モジュール２０入力文書３３プリンタ３４ファクシミリ

Claims

【特許請求の範囲】

【請求項１】入力文書を光学式に走査して一組の走査
線を生成するステップと、前記一組の走査線に対して分割過程を実行して一組の分
割イメージボックスを生成するステップと、各走査線について分離しきい値を決定するステップと、解析関数を用いて各走査線を解析するステップと、各走査線をその分離しきい値を使用して２進化して一組
の処理された走査線を生成するステップと、前記一組の処理された走査線に対して分割過程を実行し
て新しい一組の分割イメージボックスを生成するステッ
プと、前記新しい一組の分割イメージボックスに対して分類操
作を実行して前記入力文書の２進化表示を生成するステ
ップとから成る、光学式文字認識コンピュータにおける
接触文字の分離方法。
【請求項２】前記光学式走査ステップはグレイスケー
ルスキャナにより実行されることを特徴とする請求項１
記載の接触文字の分離方法。
【請求項３】前記分離しきい値決定ステップの後に、
その分離しきい値に関して各走査線を正規化するステッ
プを更に含むことを特徴とする請求項１記載の接触文字
の分離方法。
【請求項４】前記分離しきい値決定ステップは前記解
析ステップの前に実行されることを特徴とする請求項１
記載の接触文字の分離方法。
【請求項５】前記分離しきい値決定ステップは前記解
析ステップの後に実行されることを特徴とする請求項１
記載の接触文字の分離方法。
【請求項６】前記解析関数は積算−加算移動平均関数
であることを特徴とする請求項１記載の接触文字の分離
方法。
【請求項７】前記解析関数は積算−加算自己回帰関数
であることを特徴とする請求項１記載の接触文字の分離
方法。
【請求項８】前記解析関数は積算−加算自己回帰移動
平均関数であることを特徴とする請求項１記載の接触文
字の分離方法。
【請求項９】前記解析関数は２次積算−加算移動平均
関数であることを特徴とする請求項１記載の接触文字の
分離方法。
【請求項１０】前記解析関数は２次積算−加算自己回
帰関数であることを特徴とする請求項１記載の接触文字
の分離方法。
【請求項１１】前記解析関数は２次積算−加算自己回
帰移動平均関数であることを特徴とする請求項１記載の
接触文字の分離方法。
【請求項１２】前記分離しきい値は各走査線について
同一であることを特徴とする請求項１記載の接触文字の
分離方法。
【請求項１３】各走査線は自己の分離しきい値を有す
ることを特徴とする請求項１記載の接触文字の分離方
法。
【請求項１４】前記分類操作実行ステップの後で、接
触している文字が残存するか否かを判定するステップを
実行することを特徴とする請求項１記載の接触文字の分
離方法。
【請求項１５】接触している文字が残存している場合
には、再分類ステップを実行することを特徴とする請求
項１４記載の接触文字の分離方法。
【請求項１６】前記再分類ステップは、接触部分を分
割するか否かを判別するために、隣接走査線を同一の水
平方向の（画素）位置で検査することを含むことを特徴
とする請求項１５記載の接触文字の分離方法。
【請求項１７】前記再分類ステップは、接触部分を分
割するために分離しきい値を移動させることを含むこと
を特徴とする請求項１５記載の接触文字の分離方法。
【請求項１８】前記再分類ステップは、前記解析関数
に異なるパラメータを用いて前記解析ステップを繰返し
実施することを含むことを特徴とする請求項１５記載の
接触文字の分離方法。
【請求項１９】入力文書を光学式に走査して一組の走
査線を生成する手段と、前記一組の走査線に対して分割過程を実行して一組の分
割イメージボックスを生成する手段と、各走査線について分離しきい値を決定する手段と、解析関数を用いて各走査線を解析する手段と、各走査線をその分離しきい値を使用して２進化して一組
の処理された走査線を生成する手段と、前記一組の処理された走査線に対して分割過程を実行し
て新しい一組の分割イメージボックスを生成する手段
と、前記新しい一組の分割イメージボックスに対して分類操
作を実行して前記入力文書の２進化表示を生成する手段
とから成る、光学式文字認識コンピュータにおける接触
文字を分離する装置。
【請求項２０】光学式に入力文書を走査して一組の走
査線を生成するための手段と、前記一組の走査線に接続された入力を有する分割モジュ
ールと、前記分割モジュールの出力に接続された分類モジュール
と、前記分割モジュールの入力に接続された２進化モジュー
ルと、前記２進化モジュールの入力に接続された解析モジュー
ルと、前記解析モジュールに接続された分離しきい値決定モジ
ュールとを備えた光学式文字認識コンピュータ。