JPH06274691A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH06274691A
JPH06274691A JP5049650A JP4965093A JPH06274691A JP H06274691 A JPH06274691 A JP H06274691A JP 5049650 A JP5049650 A JP 5049650A JP 4965093 A JP4965093 A JP 4965093A JP H06274691 A JPH06274691 A JP H06274691A
Authority
JP
Japan
Prior art keywords
image
character
character recognition
document image
binarized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5049650A
Other languages
English (en)
Inventor
Takeshi Furuto
健 古戸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sumitomo Electric Industries Ltd
Original Assignee
Sumitomo Electric Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sumitomo Electric Industries Ltd filed Critical Sumitomo Electric Industries Ltd
Priority to JP5049650A priority Critical patent/JPH06274691A/ja
Publication of JPH06274691A publication Critical patent/JPH06274691A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【構成】イメージスキャナ装置2は、文書画像が形成さ
れた原稿を微小な画素毎に読み取る。そして、各画素の
濃度を検出するとともに、検出された濃度を3種類の二
値化閾値で二値化して3枚の二値化文書画像を生成す
る。この3枚の二値化文書画像は、OCR本体1に転送
され、画像メモリ16に格納される。中間的な値の二値
化閾値に対応した二値化文書画像は、表示装置3に表示
される。操作者は、表示された画像に基づき、3枚の二
値化文書画像のうちで最も適切な濃度の二値化文書画像
を選択する。この選択された二値化文書画像に対して、
文字切出し部17および文字認識部19などによる文字
認識処理が施される。 【効果】簡単な構成で、文字認識処理を効率的に且つ良
好に行える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、OCR(光学式文字読
取装置)などのように文字や記号等(以下、代表して
「文字」という。)を認識する装置に適用される文字認
識装置に関するものである。
【0002】
【従来の技術】光学式文字読取装置(OCR)は、文書
画像が形成された原稿を光学的に読み取り、原稿中の各
文字を認識して、認識された文字の文字コードを出力す
る装置である。このようなOCRは、CPU(中央処理
装置)などを含むOCR本体、原稿を光学的に読み取る
ためのイメージスキャナ装置、および操作を支援するた
めの表示装置やキー入力装置などから構成されている。
【0003】イメージスキャナ装置には、原稿の濃度を
微小な画素毎に検出するイメージセンサと、このイメー
ジセンサが検出した各画素の濃度を二値化して白黒の二
値画像データを生成する二値化部とが備えられている。
各画素の濃度を二値化するときの二値化閾値は、OCR
本体側から設定される。イメージスキャナ装置が出力す
る二値画像データはOCR本体に転送され、文書画像を
表すデータとして画像メモリに格納される。この画像メ
モリに格納された二値化文書画像は1文字分の文字画像
毎に切り出される。切り出された文字画像からは所定の
特徴量が抽出される。この抽出された特徴量は、認識可
能な各文字の標準的な特徴量を記憶した認識用辞書の内
容と照合され、特徴量の類似度が最も高い文字の文字コ
ードが認識結果として出力される。
【0004】ところが、イメージスキャナ装置による原
稿の読み取りは、原稿の紙質や印刷状態の影響を受け
る。そのため、OCR本体から設定した二値化閾値によ
ってイメージセンサが検出した画素濃度を二値化した場
合に、必ずしも良好な二値画像が得られるとは限らな
い。すなわち、二値化閾値は原稿の状態に応じて最適に
決定される必要がある。二値化閾値が小さすぎるときに
は、黒画素で構成された文字画像は、たとえば図6(a)
に示すような画像となる。すなわち、文字の「つぶれ」
が生じる。また、二値化閾値が大きすぎるときには、黒
画素で構成された文字画像はたとえば図6(c) に示すよ
うな画像となり、文字の「かすれ」が生じる。
【0005】このような「つぶれ」や「かすれ」が生じ
た文字画像からは、その文字が本来有するべき特徴量を
良好に抽出することができないから、文字認識処理が不
良になり、誤認識確率が高くなる。そこで、従来では、
イメージスキャナ装置から転送されて画像メモリに格納
された二値化文書画像を表示装置に表示させ、操作者が
目視によって二値化閾値が適切であるかどうかを判断し
ていた。そして、二値化閾値が不適切であるときには、
操作者は、キー入力装置などを操作して二値化閾値を設
定し直し、イメージスキャナ装置による原稿の読取を再
度行うようにしていた。
【0006】
【発明が解決しようとする課題】しかし、このような方
法では、原稿を何度もイメージスキャナ装置で読み取ら
せることになり、作業効率が悪いという問題があった。
この問題を解決するために、イメージスキャナ装置から
は検出された各画素の濃度を多値データ(たとえば8ビ
ット256階調のデータ)として出力させ、この多値デ
ータをOCR本体内に取り込んだ後に、OCR本体内部
で最適な二値化閾値を決定して、二値化処理を行う技術
が提案されている。この構成では、多値データをOCR
本体内に取り込んで記憶しておくことにより、原稿の読
取をやり直すことなく、最適な二値化文書画像を得るこ
とができ、文書入力作業の効率が向上する。
【0007】ところが、このような技術では、イメージ
スキャナ装置からOCR本体に転送される画像データ
が、極めて多くなる。たとえば、日本工業規格A列4番
のサイズの文書を1インチ当たり400ドットの密度で
読み取り、各画素の濃度を256階調の多値データで表
現するとすると、データ量は15Mバイト程度となり、
二値データの場合の8倍となる。そのため、メモリが大
量に必要となるからOCR本体の大きさやコストが大幅
に増加するうえ、イメージスキャナ装置からOCR本体
へのデータ転送速度が遅くなるなどという新たな問題が
生じ、実用的ではなかった。
【0008】この問題を解決するために、たとえば、特
開平2−24787号公報に開示された技術を応用する
ことが考えられる。すなわち、多値データを記憶するメ
モリと、メモリから読み出した多値データを二値化する
二値化部とをイメージスキャナ装置側に設ける。そし
て、OCR本体から二値化部に複数種類の二値化閾値を
順に与え、各二値化閾値に基づいて二値化部が生成した
二値データをOCR本体に転送する。OCR本体では、
転送されてきた二値データで構成される二値化文書画像
に基づいて所定のパラメータを演算し、各二値化閾値毎
のパラメータに基づいて最適な二値化閾値を決定する。
そして、この最適な二値化閾値に対応した二値化文書画
像に基づいて、文字認識処理を行う。
【0009】この構成を採用すれば、イメージスキャナ
装置からは多値データではなく、二値データが転送され
るから、データ転送量は少なくなり、OCR本体側には
大量のメモリを設ける必要がないと考えられる。しかし
ながら、この構成では、複数種類の二値化閾値に対応し
た各二値化文書画像毎に所定のパラメータを計算して最
適な二値化閾値を決定しているから、処理時間が長くか
かる。また、パラメータの計算のための回路の追加が必
要であるから、構成が複雑になり、コストの増加にもつ
ながる。
【0010】そこで、本発明の目的は、上述の技術的課
題を解決し、簡単な構成で、文字認識処理を良好に行う
ことができる文字認識装置を提供することである。
【0011】
【課題を解決するための手段および作用】上記の目的を
達成するための請求項1記載の文字認識装置は、文字を
含む文書画像の各部の濃度に対応する信号を相互に異な
る複数種類の二値化閾値で二値化する二値化手段と、各
二値化閾値で二値化して得られた複数の二値化文書画像
を記憶する記憶手段と、二値化文書画像を表示するため
の表示手段と、上記複数種類の二値化閾値のうちの所定
の二値化閾値に対応した二値化文書画像を上記記憶手段
から読み出して上記表示手段に表示させる手段と、上記
記憶手段に記憶された複数の二値化文書画像から、任意
の二値化文書画像を文字認識処理対象の画像として選択
するための入力手段と、この入力手段からの入力によっ
て文字認識対象の画像として選択された二値化文書画像
を上記記憶手段から読み出す手段と、この読み出された
二値化文書画像に基づいて、その二値化文書画像中に含
まれている文字を認識する文字認識手段とを含むことを
特徴とする。
【0012】上記の構成によれば、文書画像の各部の濃
度に対応する信号は複数種類の二値化閾値で二値化さ
れ、これによって得られた複数の二値化文書画像が記憶
手段に記憶される。そして、所定の二値化閾値に対応し
た二値化文書画像が記憶手段から読み出されて表示手段
に表示される。操作者は、表示手段に表示された二値化
文書画像の良否に基づき、入力手段からの入力により、
記憶手段に記憶された任意の二値化文書画像を文字認識
処理対象の画像として選択する。これにより、選択され
た二値化文書画像が記憶手段から読み出されて文字認識
手段に与えられ、文字認識処理が行われる。
【0013】このようにして、パラメータなどを演算す
るための複雑な構成を要することなく、文字認識処理に
適した二値化文書画像を良好に選択して、文字認識処理
を良好に行わせることができる。また、パラメータなど
の演算は不要なので、処理時間が長くなることもない。
さらに、記憶手段には二値化文書画像が記憶できればよ
いから、この記憶手段が大きな記憶容量を有している必
要はない。
【0014】請求項2記載の文字認識装置は、文字を含
む文書画像の各部の濃度に対応する信号を相互に異なる
複数種類の二値化閾値で二値化する二値化手段と、各二
値化閾値で二値化して得られた複数の二値化文書画像を
記憶する記憶手段と、上記複数の二値化文書画像のそれ
ぞれに対して文字認識処理を行い、各二値化文書画像中
に含まれている文字を認識する文字認識手段と、上記複
数の二値化文書画像に対する文字認識処理結果のうちで
最も確からしい文字認識処理結果を見出して認識文字を
決定する認識文字決定手段とを含むことを特徴とする。
【0015】この構成では、文書画像の各部の濃度を表
す信号を複数種類の二値化閾値で二値化して得られた複
数の二値化文書画像の全てに関して文字認識処理が行わ
れる。そして、各二値化文書画像の文字認識処理結果の
うちで最も確からしい文字認識処理結果が見出され、認
識文字が決定される。このようにして、操作者の入力操
作を要することなく、完全に自動で文字認識処理を行わ
せることができる。
【0016】この場合に、請求項3に記載されているよ
うに、上記複数の二値化文書画像に対する文字認識処理
結果の多数決を採って認識文字を決定することとすれ
ば、文字認識を正確に行うことができる。しかも、多数
決を採る処理は比較的簡単な処理であるので、過度に複
雑な回路が必要となることも、処理に長時間を要するこ
ともない。
【0017】
【実施例】以下では、本発明の実施例を、添付図面を参
照して詳細に説明する。図1は本発明の第1実施例の文
字認識装置である光学式文字読取装置(OCR:Optica
l Character Reader)の構成を示すブロック図でる。こ
のOCRはCPU11などを有するOCR本体1を備え
ている。OCR本体1には、原稿を光学的に読み取るた
めのイメージスキャナ装置2と、入力操作を支援するた
めの情報を表示したりするための表示装置3と、入力装
置としてのキーボード4およびマウス5とが接続されて
いる。
【0018】イメージスキャナ装置2は、文書画像が形
成された白黒の二値画像を所定の画素毎に光学的に読み
取って各画素毎に画像の濃度を検出し、さらに検出した
濃度をOCR本体1側から設定される二値化閾値で二値
化して、二値画像データを作成するものである。イメー
ジスキャナ装置2からの二値画像データは、文書画像を
表すデータとしてOCR本体1に与えられる。OCR本
体1は、二値画像データで構成された二値化文書画像か
ら1文字毎の文字画像を順に切り出し、各文字画像の特
徴量に基づいて文字認識処理を行う。
【0019】イメージスキャナ装置2によって二値画像
を読み込む場合、読み込まれる二値画像は図2のような
濃度分布を有していると考えられる。この場合に、図2
に示されているように、二値化閾値Bthを分布の谷部に
設定すれば、最適な二値化処理が行える。OCR本体1
内には、イメージスキャナ装置2を制御するためのイメ
ージスキャナ制御部12、表示装置3を制御するための
表示制御部13、ならびにキーボード4およびマウス5
を制御するためのキーボード・マウス制御部14が備え
られている。これらは、バス15を介してCPU11に
接続されている。
【0020】バス15には、さらに、CPU11のワー
クエリアなどとして用いられるRAM(ランダムアクセ
スメモリ)31、イメージスキャナ装置2からの二値化
文書画像を格納するための画像メモリ16、画像メモリ
16に記憶された二値化文書画像から1文字毎の文字画
像を切り出す文字切出し部17、および、イメージスキ
ャナ装置2に与えるべき二値化閾値を決定するための二
値化閾値決定部18などが接続されている。また、フレ
キシブルディスク6やハードディスク7などの外部記憶
媒体に対する記録/読出などを行うための外部記憶制御
部32や、通信網との間で情報の授受を行うための通信
制御部33などもバス15に接続されている。
【0021】文字切出し部17で切り出された文字画像
は、文字認識部19に与えられ、所定の特徴量が抽出さ
れる。文字認識部19には、認識可能な全ての文字に関
する標準的な特徴量を各文字毎に記憶した認識辞書20
が接続されている。文字認識部19は、文字画像から抽
出した特徴量と認識辞書20に記憶された各文字の標準
的な特徴量とを比較照合することによって、いずれかの
文字を認識文字として決定し、その文字コードを生成す
る。生成された文字コードは、バス15に与えられる。
【0022】図3はイメージスキャナ装置2の内部の電
気的構成を示すブロック図である。イメージスキャナ装
置2は、原稿が提示される透明板(図示せず。)と、こ
の透明板の原稿載置面とは反対側に配置された一次元イ
メージセンサ21と、この一次元イメージセンサ21を
透明板の一端部から他端部まで等速で駆動することによ
って原稿を走査させる走査駆動機構(図示せず。)とを
備えている。一次元イメージセンサ21は、透明板に提
示された原稿の表面の画像を所定の大きさの画素毎に光
学的に読み取り、各画素の濃度に対応した信号を出力す
るものである。この一次元イメージセンサ21における
電気的な走査によって原稿の主走査が達成され、一次元
イメージセンサ21が上記の走査駆動機構によって駆動
されることによって主走査と交差する方向への副走査が
達成される。なお、副走査は、一次元イメージセンサ2
1を固定しておき、読み取るべき原稿をイメージセンサ
21の近傍を通る経路を介して等速で搬送することによ
って行うこともできる。
【0023】一次元イメージセンサ21の出力信号は、
アナログ/ディジタル(A/D)変換器22によって濃
度を表す多値データに変換される。この多値データはた
とえば8ビットのものであり、この場合には、各画素の
濃度は256階調で表現されることになる。アナログ/
ディジタル変換器22からの多値データは多値イメージ
メモリ23に格納される。すなわち、多値イメージメモ
リ23には、多値データで表された文書画像が格納され
ることになる。多値イメージメモリ23の記憶データ
は、二値化部24に与えられ、二値化閾値Bthに基づい
て「1」または「0」の二値データに変換される。すな
わち、二値化閾値Bthよりも濃度の高い画素については
黒画素であることを表す二値データ「1」が割り当てら
れ、二値化閾値Bth以下の濃度の画素については白画素
であることを表す二値データ「0」が割り当てられる。
この二値データがOCR本体1に転送される。二値化部
24の二値化閾値Bthは可変であり、OCR本体1側か
ら任意に設定することができる。
【0024】図4は、文書画像が形成された原稿をイメ
ージスキャナ装置2によって読み取り、その読み取られ
た文書画像中の各文字を認識する場合の動作を説明する
ためのフローチャートである。操作者は、まず、イメー
ジスキャナ装置2の設定操作を行う(ステップS1)。
イメージスキャナ装置2の設定操作とは、具体的には、
キーボード4やマウス5を操作して、原稿の紙質や印刷
状態などに基づき、二値化24における二値化閾値Bth
を設定する操作である。多値イメージメモリ23に記憶
された多値データが256階調で表現されたものであれ
ば、たとえば、0〜255の範囲のいずれかの数値を入
力することになる。
【0025】操作者の入力操作に応答して、閾値決定部
18によって3種類の二値化閾値B thH,BthM,Bth
Lが演算されて求められる(ステップS2)。操作者が
入力した二値化閾値をBthIとすると、三種類の二値化
閾値BthH,BthM,BthLは、下記第(1) 式乃至第
(3) 式に従って定められる。ΔBは正の定数であり、二
値化後の画像濃度を充分に変化させることができる値に
設定される。
【0026】 BthH=BthI+ΔB ・・・・ (1) BthM=BthI ・・・・ (2) BthL=BthI−ΔB ・・・・ (3) たとえば、BthI=128、ΔB=16であるとする
と、BthH=144、B thM=128、BthL=112
となる。
【0027】3種類の二値化閾値BthH,BthM,Bth
Lが決定すると、OCR本体1からイメージスキャナ装
置2に対して、当該3種類の二値化閾値と読取命令とが
転送される。これに応答して、スキャナ装置2は原稿の
走査を開始し、この走査によって読み取られた画像の多
値データを多値イメージメモリ23に蓄積する(ステッ
プS3)。
【0028】さらに、イメージスキャナ装置2では、二
値化部24において、3種類の二値化閾値BthH,Bth
M,BthLに基づく二値化処理が順に行われる。すなわ
ち、まず、二値化閾値BthHを用いて多値イメージメモ
リ23内の多値データに対する二値化処理が施され、こ
れによって得られた二値画像データが文書画像を表すデ
ータとしてOCR本体1に転送される(ステップS
4)。この転送された二値画像データは、二値化文書画
像として画像メモリ16に蓄積される。同様な動作が他
の2種類の二値化閾値BthM,BthLに関して行われ
(ステップS4)、その結果、画像メモリ16には、読
取画像を3種類の二値化閾値BthH,BthM,BthLで
二値化して得られた、各二値化文書画像が格納されるこ
とになる。
【0029】画像メモリ16への二値化文書画像の格納
が終了すると、CPU11は、中間的な二値化閾値Bth
Mに対応した二値化文書画像を画像メモリ16から読み
出して表示制御部13に与える。これにより、表示装置
3には、中間的な閾値BthMに対応した二値化文書画像
が表示されることになる(ステップS5)。このときの
表示装置3における表示態様は図5に示されている。す
なわち、表示画面51には、二値化文書画像52と、そ
の文書画像52に基づいて文字認識処理を行ってもよい
か否かを確認するためのメッセージ53とが表示され
る。さらに、二値化文書画像52を別の二値化閾値の二
値化文書画像に交換したり、文字認識対象の二値化文書
画像を決定したりするための入力手段の一部をなす入力
部54が表示される。この入力部54には、低い二値化
閾値BthLに対応した濃い画像に文書画像52を交換す
べきことを指示するためのメニュー「>濃」と、そのま
まの文書画像52で良いことを指示するためのメニュー
「OK」と、高い二値化閾値BthHに対応した薄い画像
に文書画像52を交換すべきことを指示するためのメニ
ュー「薄<」とが含まれている。これらのメニューは、
キーボード4やマウス5を操作してポインタPを選択し
たいメニューの表示位置に移動したうえで、所定の入力
操作を行うことで選択することができる。
【0030】図6は、入力部54内のメニューの選択に
よる表示画像の変化を説明するための図である。図6
(a) は二値化閾値Bthが低すぎるために「つぶれ」が生
じた画像であり、図6(b) は文字認識処理を正確に行え
る適正な画像であり、図6(c)は二値化閾値Bthが高す
ぎるために「かすれ」が生じた画像である。図6(a) の
画像が表示画面51に表示されているときにメニュー
「薄<」を選択すると図6(b) の画像が表示され、図6
(b) の画像が表示されているときにメニュー「薄<」を
選択すると図6(c) の画像が表示される。逆に、図6
(c) の画像が表示されているときにメニュー「>濃」を
選択すると図6(b) の画像となり、図6(b) の画像が表
示されているときにメニュー「>濃」を選択すると図6
(a) の画像となる。メニュー「OK」が選択されれば、
表示画像は変化しない。
【0031】操作者は、表示画面51を目視して、図6
(b) のような適正な画像が得られるように、入力部54
内のいずれかのメニューを選択することになる。再び図
4のフローチャートを参照して説明する。ステップS6
で操作者が入力部54内のメニュー「>濃」を選択する
と、低い二値化閾値BthLの二値化文書画像が表示装置
3に表示される(ステップS7)。そして、この低い二
値化閾値BthLの二値化文書画像が文字切出し部17に
与えられ、1文字ずつの文字画像を切り出すための文字
切出し処理に供される(ステップS9)。
【0032】一方、操作者が入力部54内のメニュー
「薄<」を選択した場合には、高い二値化閾BthHの二
値化文書画像が表示装置3に表示され(ステップS
8)、その高い二値化閾値BthHの二値化文書画像が文
字切出し部17に与えられて文字切出し処理が施され
る。また、メニュー「OK」が選択された場合には、表
示されている二値化文書画像52は交換されることはな
く、その表示されている二値化文書画像が文字切出し部
17に与えられて文字切出し処理に供される。
【0033】文字切出し処理によって得られた文字画像
は、文字認識部19に与えられて文字認識処理が施され
る(ステップS10)。すなわち、文字認識部19は、
与えられた文字画像から所定の特徴量を抽出し、この特
徴量を認識辞書20に記憶された各文字毎の標準的な特
徴量と比較する。そして、最も類似度の高い文字を認識
文字として決定し、その文字コードをバス15からRA
M31に格納する(ステップS11)。文書画像から切
り出された各文字毎に同様な文字認識処理および文字コ
ードの出力が行われることによって、読み取られた文書
画像を構成する文字の文字コード列を生成することがで
きる。RAM31に格納された文字コード列は、CPU
11によって読み出され、外部記憶制御部32や通信制
御部33に与えられる。
【0034】以上のように本実施例のOCRでは、イメ
ージスキャナ装置2からは3種類の二値化閾値BthL,
thM,BthHに対応した各二値画像データが生成さ
れ、この二値画像データがOCR本体1に転送されて画
像メモリ16に格納される。そして、中間的な二値化閾
値BthMに対応した二値化文書画像が表示装置3に表示
される。操作者は表示された二値化文書画像に基づいて
文字認識処理を行うのに適正な濃度の二値化文書画像を
3種類の二値化閾値BthL,BthM,BthAに対応した
各画像のなかから選択する。
【0035】このようにして、最初に操作者が入力した
二値化閾値BthIが不適切であっても、イメージスキャ
ナ装置2による原稿読取を再度行わせる必要がない。そ
のため、作業を効率的に行える。また、イメージスキャ
ナ装置2からOCR本体1に転送されるデータは二値画
像データであるので、データ量が少ない。そのため、画
像データの転送に長時間を要することがなく、また、O
CR本体1内に大量のメモリを備える必要もない。さら
には、最適な濃度の二値化文書画像の選択は、パラメー
タなどの演算処理によって行われるのではなく、単に操
作者の選択に委ねられているから、OCR本体1内の回
路構成が複雑化することがなく、文字認識処理時間が長
くなることもない。このようにして、簡単で安価な構成
によって、文書入力作業を効率的に行うことができる。
【0036】図7は、本発明の第2実施例の文字認識装
置であるOCRにおける処理を説明するためのフローチ
ャートである。本実施例の説明では、上述の図1、図3
および図5を再び参照する。また、上述の図4に示され
た各ステップと同様な処理が行われるステップには同一
の参照符号を付して示す。本実施例では、操作者が入力
した二値化閾値BthIを中間的な値として含む4種類以
上の二値化閾値Bth(1) ,Bth(2) ,Bth(3) ,B
th(4) ,・・・・(ただし、Bth(1) <Bth(2) <Bth(3)
<Bth(4) <・・・・であるとする。)が設定される(ステ
ップS1,S2)。すなわち、原稿読取開始(ステップ
S3)に先立って、上記の複数種類の二値化閾値がイメ
ージスキャナ装置2に与えられる。そして、イメージス
キャナ装置2からは、多値イメージメモリ23に蓄えら
れた多値画像データを各二値化閾値で二値化して得られ
た二値画像データがOCR本体1に転送され、画像メモ
リ16に格納される(ステップS4)。
【0037】ステップS5において、表示装置3に最初
に二値化文書画像が表示されるときには、操作者が入力
した二値化閾値BthIに対応する二値化文書画像が表示
される。そして、ステップS6において、操作者がメニ
ュー「OK」以外のメニュー「>濃」または「薄<」を
選択したときには、ステップS7a,S8aにおいて、
1段階低い二値化閾値または1段階高い二値化閾値の二
値化文書画像が画像メモリ16から読み出されて表示装
置3に与えられ、これらの画像が表示される(ステップ
S5)。そして、操作者がメニュー「OK」を選択した
場合にのみ、ステップS9の文字切出し処理に移る。
【0038】このようにして本実施例では、入力部54
内のメニュー「>濃」または「薄<」が選択されたとき
には1段階濃い画像または1段階薄い画像が表示され、
メニュー「OK」を選択したときに、文字認識処理が開
始される。そのため、複数種類の二値化閾値に対応した
複数の二値化文書画像のなかから文字認識処理が適正に
行われる濃度の二値化文書画像を探し出し、その後にメ
ニュー「OK」を選択すれば、文字認識処理を良好に行
わせることができる。
【0039】図8は本発明の第3実施例のOCRの構成
を示すブロック図である。この図8において、上記の図
1に示された各部に対応する部分には同一の参照符号を
付して示す。上述の第1実施例や第2実施例では、文字
認識処理対象の二値化文書画像の選択を操作者の操作に
委ねているため、原稿の読取の度に二値化文書画像を選
択するめの操作を行う必要があり、完全自動化が行えな
い。そのため、イメージスキャナ装置2に自動原稿供給
装置(図示せず。)を設けて多数枚の原稿を自動的に読
み取って処理しようとする場合には、あまり適切ではな
い。
【0040】本実施例の構成では、上記の問題が解決さ
れ、操作者の入力操作を要することなく原稿の読取から
文字認識処理までを自動的に行える。具体的に説明する
と、文字認識部19においては、3種類の二値化閾値B
thH,BthM,BthLに基づいて得られた3つの二値化
文書画像の全部に関して文字認識処理が行われる。そし
て、3つの二値化文書画像にそれぞれ対応した3つの文
字画像の認識結果に対して、認識文字決定手段としての
多数決処理部60における多数決処理が施され、その処
理結果が認識結果として出力される。
【0041】図9は複数枚の原稿を自動的に読み取って
文字認識処理を行う場合の処理を説明するためのフロー
チャートである。操作者が、キーボード4またはマウス
5を操作して、二値化閾値BthIを入力するとともに、
処理の開始を指示するための入力操作を行うと、イメー
ジスキャナ装置2による原稿の読取が開始される(ステ
ップS31)。ただし、原稿の読取の開始に先立って、
閾値決定部18によって3種類の二値化閾値BthH,B
thM,BthLが演算されて求められ、3種類の二値化閾
値BthH,BthM,BthLと読取命令とがOCR本体1
からイメージスキャナ装置2に転送される。
【0042】イメージスキャナ装置2では、二値化部2
4により、3種類の二値化閾値BthH,BthM,Bth
に基づいて、多値イメージメモリ23内の多値データに
対して順に二値化処理が施される。こうして3種類の二
値化閾値BthH,BthM,B thLに対応して得られた各
二値画像データがOCR本体1に転送され(ステップS
32)、画像メモリ16に蓄積される。
【0043】画像メモリ16に格納された3種類の二値
化文書画像は、文字切出し部17に与えられる。文字切
出し部17は、3枚の二値化文書画像から同じ領域に対
応する文字画像を切り出して(ステップS33)、文字
認識部19に与える。文字認識部19は、同じ領域に対
応する3つの文字画像のそれぞれに対して文字認識処理
を行う(ステップS34)。同様な動作が、切り出され
た全ての文字画像に関して行われる(ステップS3
5)。
【0044】1枚の文書画像中から切り出された全ての
文字画像についての文字認識処理が終了すると、文字認
識部19は、認識結果の文字コードを、各文字コードの
評価値とともに多数決処理部60に与える。評価値と
は、認識結果の確信度に対応するもので、たとえば、認
識結果の文字の標準的な特徴量と、認識すべき文字画像
から抽出された特徴量との類似度に相当する値である。
【0045】多数決処理部60では、次の〜のよう
な多数決処理が行われ(ステップS36)、3枚の二値
化文書画像に関して得られた3種類の文字認識処理結果
のうちで最も確からしい認識処理結果が見出され、認識
結果文字コードが生成される。 各文字画像毎に3つの認識結果のうち2つ以上が一
致していれば、その一致している認識結果の文字コード
を認識結果文字コードとして確定させる。
【0046】 3つの認識結果がすべて異なっている
場合には、最も評価値の高い認識結果の文字コードを認
識結果文字コードとして確定させる。 3つの認識結
果の評価値が所定の閾値Vに満たないときには、認識不
能であったことを表すリジェクト文字を認識結果文字コ
ードとする。この処理は、上記およびの処理よりも
優先される。
【0047】このような多数決処理が文書画像から切り
出された全ての文字画像に関して行われる。そして、認
識結果文字コードは、バス15からRAM31に格納さ
れる。1枚の文書画像についての多数決処理が終了する
と、ステップS37では、全ての原稿についての処理が
終了したかどうかが判断され、未処理の原稿が有ればス
テップS31に戻る。そして、全ての原稿についての処
理が終了すると、CPU11は、複数枚の文書画像の認
識結果を表す文字コード列を外部記憶制御部32や通信
制御部33に与える(ステップS88)。
【0048】図10は多数決処理部60の動作をさらに
具体的に説明するための図である。図10(a) は文字認
識処理部19での処理結果を表し、図10(b) は多数決
処理部60での処理結果を表している。認識対象の文字
列は「特許請求の範囲は」である。また、リジェクト文
字とするかどうかの上記の閾値Vはたとえば30であ
る。この図10から理解されるように、多数決処理を行
うことで、極めて正確な認識結果を得ることができる。
【0049】以上のように本実施例によれば、多数決処
理によって認識文字を決定することとしているから、結
果として、最適な二値化閾値に対応した文書画像を選択
した場合と同様な認識結果を得ることができる。しか
も、適切な濃度の二値化文書画像を選択するための入力
操作も不要であるから、原稿の読取から文字認識処理ま
でを完全に自動化することができる。また、多数決処理
はさほど複雑な処理ではないから、多数決処理部60は
比較的簡単な構成の回路で実現でき、しかも、その処理
に長時間を要することがない。そのため、構成が過度に
複雑化したり、コストが過度に増加したりすることがな
く、また、文字認識処理時間が長くなることもない。
【0050】本発明の実施例の説明は以上のとおりであ
るが、本発明は上記の実施例に限定されるものではな
い。たとえば、上記の第1実施例では、3種類の二値化
閾値が設定されているが、二値化閾値の種類は2種類で
もよく、また、4種類以上であってもよい。これらの場
合には、入力部54から各二値化閾値に対応した二値化
文書画像を選択することができるようにしておけばよ
い。
【0051】また、上記の第2実施例では、4種類以上
の二値化閾値が設定されているが、2種類または3種類
の二値化閾値が設定される場合についても、この第2実
施例を容易に応用することができる。さらに、上記の第
3実施例に関しても、イメージスキャナ装置2が読み取
った画像を二値化するときの二値化閾値は3種類に設定
する必要はなく、2種類でもよく、また4種類以上でも
よい。
【0052】また、上記の第1および第2実施例では、
表示装置3には1種類の二値化文書画像のみが表示され
ているが、表示装置に2種類以上の二値化閾値に対応し
た複数の二値化文書画像を同時に表示するようにしても
よい。その他、本発明の要旨を変更しない範囲で種々の
設計変更を施すことが可能である。
【0053】
【発明の効果】請求項1記載の文字認識装置によれば、
パラメータなどを演算するための複雑な構成を要するこ
となく、文字認識処理に適した二値化文書画像を良好に
選択して、文字認識処理を良好に且つ速やかに行わせる
ことができる。しかも、二値化文書画像を記憶できる記
憶手段を用意すればよいから、この記憶手段が大きな記
憶容量を有している必要はない。
【0054】請求項2記載の文字認識装置によれば、複
数の二値化文書画像の全てに関して文字認識処理が行わ
れ、各二値化文書画像に対する文字認識処理結果のうち
で最も確からしい文字認識処理結果が見出されて認識文
字が決定される。そのため、操作者の入力操作を要する
ことなく、完全に自動で文字認識処理を行わせることが
できる。
【0055】しかも、請求項3に記載されているよう
に、複数の二値化文書画像に対する文字認識処理結果の
多数決を採って認識文字を決定することとすれば、文字
認識を正確に行うことができる。さらに、多数決を採る
処理は比較的簡単な処理であるので、過度に複雑な回路
が必要となることも、処理に長時間を要することもな
い。
【図面の簡単な説明】
【図1】本発明の一実施例の文字認識装置である光学式
文字読取装置の構成を示すブロック図である。
【図2】イメージスキャナ装置によって読み取られる原
稿の画素濃度のヒストグラムを示す図である。
【図3】イメージスキャナ装置の構成を示すブロック図
である。
【図4】光学式文字読取装置の動作を説明するためのフ
ローチャートである。
【図5】表示装置における表示態様を示す図である。
【図6】二値化閾値の変化による画像の変化を説明する
ための図である。
【図7】本発明の第2実施例の光学式文字読取装置の動
作を説明するためのフローチャートである。
【図8】本発明の第3実施例の光学式文字読取装置の構
成を示すブロック図である。
【図9】上記第3実施例の光学式文字読取装置の動作を
説明するためのフローチャートである。
【図10】上記第3実施例の光学式文字読取装置におい
て行われる多数決処理を説明するための図である。
【符号の説明】
1 OCR本体 2 イメージスキャナ装置 3 表示装置 4 キーボード 5 マウス 11 CPU 16 画像メモリ 17 文字切出し部 18 閾値決定部 19 文字認識部 21 一次元イメージセンサ 23 多値イメージメモリ 24 二値化部 51 表示画面 54 入力部 P ポインタ 60 多数決処理部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】文字を含む文書画像の各部の濃度に対応す
    る信号を相互に異なる複数種類の二値化閾値で二値化す
    る二値化手段と、 各二値化閾値で二値化して得られた複数の二値化文書画
    像を記憶する記憶手段と、 二値化文書画像を表示するための表示手段と、 上記複数種類の二値化閾値のうちの所定の二値化閾値に
    対応した二値化文書画像を上記記憶手段から読み出して
    上記表示手段に表示させる手段と、 上記記憶手段に記憶された複数の二値化文書画像から、
    任意の二値化文書画像を文字認識処理対象の画像として
    選択するための入力手段と、 この入力手段からの入力によって文字認識対象の画像と
    して選択された二値化文書画像を上記記憶手段から読み
    出す手段と、 この読み出された二値化文書画像に基づいて、その二値
    化文書画像中に含まれている文字を認識する文字認識手
    段とを含むことを特徴とする文字認識装置。
  2. 【請求項2】文字を含む文書画像の各部の濃度に対応す
    る信号を相互に異なる複数種類の二値化閾値で二値化す
    る二値化手段と、 各二値化閾値で二値化して得られた複数の二値化文書画
    像を記憶する記憶手段と、 上記複数の二値化文書画像のそれぞれに対して文字認識
    処理を行い、各二値化文書画像中に含まれている文字を
    認識する文字認識手段と、 上記複数の二値化文書画像に対する文字認識処理結果の
    うちで最も確からしい文字認識処理結果を見出して認識
    文字を決定する認識文字決定手段とを含むことを特徴と
    する文字認識装置。
  3. 【請求項3】上記認識文字決定手段は、上記複数の二値
    化文書画像に対する文字認識処理結果の多数決を採って
    認識文字を決定するものであることを特徴とする請求項
    2記載の文字認識装置。
JP5049650A 1993-03-10 1993-03-10 文字認識装置 Pending JPH06274691A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5049650A JPH06274691A (ja) 1993-03-10 1993-03-10 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5049650A JPH06274691A (ja) 1993-03-10 1993-03-10 文字認識装置

Publications (1)

Publication Number Publication Date
JPH06274691A true JPH06274691A (ja) 1994-09-30

Family

ID=12837075

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5049650A Pending JPH06274691A (ja) 1993-03-10 1993-03-10 文字認識装置

Country Status (1)

Country Link
JP (1) JPH06274691A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009294704A (ja) * 2008-06-02 2009-12-17 Mitsubishi Heavy Ind Ltd ナンバー認識装置およびナンバー認識方法
JP2011088120A (ja) * 2009-10-26 2011-05-06 Nec Corp 郵便物区分装置、郵便物区分方法およびプログラム
JP2021072484A (ja) * 2019-10-29 2021-05-06 京セラドキュメントソリューションズ株式会社 画像処理装置、画像処理方法及び画像処理プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009294704A (ja) * 2008-06-02 2009-12-17 Mitsubishi Heavy Ind Ltd ナンバー認識装置およびナンバー認識方法
JP2011088120A (ja) * 2009-10-26 2011-05-06 Nec Corp 郵便物区分装置、郵便物区分方法およびプログラム
JP2021072484A (ja) * 2019-10-29 2021-05-06 京セラドキュメントソリューションズ株式会社 画像処理装置、画像処理方法及び画像処理プログラム

Similar Documents

Publication Publication Date Title
JPS63158678A (ja) 単語間スペ−ス検出方法
JPH07168948A (ja) 文書イメージ品質改善方法
JP3335009B2 (ja) 画像処理方法及び画像処理装置
EP0676891A2 (en) Method of thresholding document images
JP4077919B2 (ja) 画像処理方法及び装置及びその記憶媒体
JPH09186877A (ja) 画像処理装置
US7151859B2 (en) Method and system for correcting direction or orientation of document image
US5812695A (en) Automatic typing of raster images using density slicing
EP0949801B1 (en) Image process apparatus, image process method and storage medium
JPH06274691A (ja) 文字認識装置
JPH06187496A (ja) 印字識別方法
JPH07288679A (ja) 画像処理装置
EP0975146A1 (en) Locating the position and orientation of multiple objects with a smart platen
JPH10222602A (ja) 光学式文字読取装置
JP3268542B2 (ja) 微細文字画像の拡大方法
EP0715274A2 (en) Method and apparatus for detecting whether an electronic image has been faxed
KR940010474B1 (ko) 화질 개선 방법
JP2865611B2 (ja) 文字の特徴抽出方法及びその装置並びに文字認識方法及びその装置
JPH0916715A (ja) 文字認識装置および方法
JP2789647B2 (ja) 線画像認識方法
JP3754721B2 (ja) 画像処理装置及びその方法
JP2994985B2 (ja) 文字認識方法及び文字認識装置
JPH0338782A (ja) 原稿濃度検出装置
JP2747136B2 (ja) 文字認識装置
JP2023132586A (ja) 画像処理装置、画像処理方法、及びプログラム