JPS60159986A - 光学的文字読取装置 - Google Patents

光学的文字読取装置

Info

Publication number
JPS60159986A
JPS60159986A JP59014707A JP1470784A JPS60159986A JP S60159986 A JPS60159986 A JP S60159986A JP 59014707 A JP59014707 A JP 59014707A JP 1470784 A JP1470784 A JP 1470784A JP S60159986 A JPS60159986 A JP S60159986A
Authority
JP
Japan
Prior art keywords
character
line
histogram
character pattern
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59014707A
Other languages
English (en)
Inventor
Toru Suzuki
透 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP59014707A priority Critical patent/JPS60159986A/ja
Publication of JPS60159986A publication Critical patent/JPS60159986A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、特に手書き文字を認識するための光学的文字
読取装置に関する。
〔発明の技術的背景とその問題点〕
従来、光学的文字読取装置(OCR)では、1文字毎に
記入するための文字枠(通常ドロップアウトカラーで印
刷されている)を備えた帳票が使用されることが多い。
このような帳票を用いると、OCRは複数の文字列から
確実な文字切出し処理が可能となシ、文字認識処理の植
皮を高めることができる。
ところで、帳票に記入する文字が例えば手書きの数字で
ある場合、第1図に示すように各数字2が文字枠1から
はみ出す様に続けて記入されることがある。このような
場合、従来のOCRでは、文字切出し処理が困難となシ
、リジェクト(読取不可)されることが多くなる欠点が
あったO 〔発明の目的〕 本発明は上記の事情に鑑みてなされたもので、その目的
は、手書き数字等を続けて記入された文字の場合でも、
確実な文字切出し処理を実現して、文字読取率を大幅に
向上することカニできる光学的文字読取装置を提供する
ことにある。
〔発明の概要〕
本発明では、メモリ手段に格納された1行分の文字ノリ
ーンデータに対して垂直方向の濃度ヒスドグ2ムを検出
するヒストグラム検出手段が設けられる。判定手段は、
上記濃度ヒストグラム及び予め設定されるフォーマット
コントロールデータに基づいて、上記文字IJ?ターン
データの1文字分の文字ブロック領域を判定する。
この判定結果による文字ブロック領域内において、文字
切出し手段は所定の文字高さに対応する水平射影及びそ
の文字高さに応じた垂直射影を検出して、各射影に基づ
く1文字分の文字ノ4ターンを切出す。この切出された
文字/4′ターンが、文字認識手段によシ認識されるこ
とになる。
これによシ、手書き数字等を続けて記入された文字情報
の場合でも、文字切出し処理を確実に行なうことができ
、文字読取率を大幅に向上することができる。
〔発明の実施例〕
以下図面を参照して本発明の一実施例について説明する
。第2図は一実施例に係わるOCRの構成を示すブロッ
ク図である。第2図において、10はラインバッファで
ある。このラインバッファIQは、2値化信号からなる
文字ツヤターンデータ(以下単に文字パターンと称す)
Dを1行分格納するバッファメモリである。文字ノJ?
ターンDは、通常図示しない光電変換回路によシ帳票上
の文字が電気信号(2値化信号)に変換され、さらに前
処理回路で前処理された後に送られるデータである。ラ
インバッファ10は、制御信号(1画素毎に送信される
書込み信号及び1走査毎の走査開始を示すスタート信号
を含む)Cに同期して1行分の文字パターンを格納する
。ラインバッファ10の行方向アドレス及び列方向アド
レスは、それぞれラインアドレスカウンタ11及びロー
アドレスカウンタ12により設定される。
さらに、ヒストグラム回路13゛はラインアドレスカウ
ンタ11のアドレスに応じて文字ノjターンDに対する
垂直方向の濃度ヒストグラムを検出する。制御回路14
は、マイクロプロセッサ及びフォーマットコントロール
データを格納するメモリ(RAM )からな如、ヒスト
グラム回路13の検出結果及びフォーマットコントロー
ルデータに基づいてラインノ々ツファ10内の文字パタ
ーンから1文字分の文字切出し処理を行なう。認識部1
5は、制御回路14の動作によシ切出された文字パター
ンに対する文字認識処理を行なう。
上記のよう力構成のOCRにおいて、第3図及び第4図
を参照して動作を説明する。先ず、帳票上に第1図に示
すよう寿数字が続けて記入されており、その文字列(複
数桁の数字)に対応する1行分の文字パターンPがライ
ンバッファ10に格納されたとする。このとき、1行分
の文字ノ母ターンPはヒストグラム回路13へも送られ
る。ヒストグラム回路13では、第3図に示すような文
字パターンに対する垂直方向の濃度ヒストグラム20が
検出される。この場合、文字ノ9ターンの行方向(第3
図の矢印21)を水平方向とする。検出された濃度ヒス
トグラム20は、ヒストグラム回路13から制御回路1
4へ送られる。
制御回路14では、先ず予め設定されたフオがめられる
。ここで、フォーマットコントロールデータとは、読取
字体、文字ピッチP1読取開始・終了位置(マスクスタ
ート、マスクエンド)等のデータからなる。そして、制
御回路14は、通常理論座標位置pi(l=zz〜13
)の近辺のヒストグラム20を観測して、白を検出する
とその位置を実際の座標位置と決定する。
しかしながら、第3図に示すように、座標位置pHでは
白を検出できるが、座標位置P12゜PI3の近辺では
白を検出することはできない。
このため本発明の制御回路14では、全体的な濃度ヒス
ドグ2ム20の状態及び上記理論座標位置Piに基づい
て、第3図に示すような実際的な座標位置a、b及びc
、dが検出される。このスタート点a (C)及びエン
ド点b (d)からなる領域を、1文字分の推定文字ブ
ロック領域として想定する。制御回路14は、さらに第
4図に示すように例えば推定文字!ロック領域c、dに
対して水平方向にtm分拡張した文字ブロック領域e、
fを設定する。そして、上記文字ブロック領域e、fに
おいて、制御回路14はラインアドレスカウンタ11及
びローアドレスカウンタ12を制御して、ラインバッフ
ァ10内の文字ノナターンを水平方向に走置し、第4図
に示す水平射影30を作成する。この水平射影30によ
シ、文字パターンの文字高さHを測定して、さらに文字
パターンの上端部分を除いた文字高さ領域h(例えばh
は3/4H程度)をめる0次に制御回路14は、ライン
バッファ10内の上記文字高さhに相当する領域及び文
字ブロック領域e、fの文字ノ(ターンを垂直方向(矢
印3〕)に走査して、垂直射影32を作成する。
この垂直射影32及び上記水平射影30に基づいて、制
御回路14はラインバッファ10内から1文字分の文字
パターン(第4図の33)を切出して、認識部15へ送
るように制御する。
認識部15は、予め登録された辞書/4′ターン<S準
パターン)に基づいて、ラインバッファ10から切出さ
れて送られる文字パターンに対する認識処理を行なう。
この場合、辞書Aターンとして続は文字認識用辞書パタ
ーンを用意することによシ、文字認識精度を高めること
ができる。続は文字は通常数字の場合が大部分であるた
め、続は文字認識用辞書パターンとしては数字に相当す
るものだけでよい。
このようにして、帳票上に続けて記入された文字の場合
でも、1文字分の文字切出し処理を確実に行なうことが
できる。この場合、本発明では濃度ヒスドグ2ムに基づ
いて文字ブロック領域e、fが検出され、この文字ブロ
ック領域e、fでの水平射影が作成される。この水平射
影から、本来の文字パターンの認識に必要な文字高さh
が設定される。そして、文字高さhに応じて垂直射影が
作成されることによシ、文字切出し処理に必要な各射影
を確実に得ることができる。
〔発明の効果〕
以上詳述したように本発明によれば、帳票上に手書き数
字等の文字が続けて記入された場合でも、1文字分の文
字パターンを切出す文字切出し処理を確実に行なうこと
ができる。したがって、文字読取率を大幅に高めること
ができ、結果的に帳票に手書き文字を記入する際の制限
を緩和することができるなどの効果を得ることができる
ものである。
【図面の簡単な説明】 第1図は帳票上に続けて記入した文字の一例を示す図、
第2図は本発明の一実施例に係わる光学的文字読取装置
の構成を示すブロック図、第3図は第2図のヒストグラ
ム回路の動作を説明するための図、第4図は第2図の制
御回路の動作を説明するための図である。 10・・・ラインバッファ、11・・・ラインアドレス
カウンタ、12・・・ローアドレスカウンタ、13・・
・ヒストグラム回路、14・・・制御回路、15・・・
認識部。 出願人代理人 弁理士 鈴 江 武 彦第1図 第2図 第3図 第4図

Claims (1)

    【特許請求の範囲】
  1. 1行分の文字パターンデータを格納するメモリ手段と、
    上記文字パターンデータの垂直方向の濃度ヒストグラム
    を検出するヒストグラム検出手段と、このヒスドグシム
    検出手段の検出結果及び予め設定されるフォーマットコ
    ントロールデータに基づいて上記メモリ手段に格納され
    た文字パターンデータの1文字分の文字ブロック領域を
    判定する判定手段と、上記判定手段の判定結果による上
    記文字ブロック領域内においてパターンの水平射影及び
    垂直射影を検出し各射影に基づく1文字分の文字ノ+タ
    ーンを切出す文字切出し手段と、上記文字切出し手段か
    ら出力される文字i4ターンを予め設定される所定の辞
    書ノ4ターンに基づいて認識する文字認識手段とを具備
    してなることを特徴とする光学的文字読取装置。
JP59014707A 1984-01-30 1984-01-30 光学的文字読取装置 Pending JPS60159986A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59014707A JPS60159986A (ja) 1984-01-30 1984-01-30 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59014707A JPS60159986A (ja) 1984-01-30 1984-01-30 光学的文字読取装置

Publications (1)

Publication Number Publication Date
JPS60159986A true JPS60159986A (ja) 1985-08-21

Family

ID=11868634

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59014707A Pending JPS60159986A (ja) 1984-01-30 1984-01-30 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JPS60159986A (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56166588A (en) * 1980-05-28 1981-12-21 Toshiba Corp Character segmentation control system
JPS575181A (en) * 1980-06-10 1982-01-11 Toshiba Corp Character detection and segmentation system
JPS57137972A (en) * 1981-02-20 1982-08-25 Nec Corp Character out position detecting method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56166588A (en) * 1980-05-28 1981-12-21 Toshiba Corp Character segmentation control system
JPS575181A (en) * 1980-06-10 1982-01-11 Toshiba Corp Character detection and segmentation system
JPS57137972A (en) * 1981-02-20 1982-08-25 Nec Corp Character out position detecting method

Similar Documents

Publication Publication Date Title
US5164996A (en) Optical character recognition by detecting geo features
JPS63216189A (ja) 文字認識方法
JPS6115284A (ja) 光学的文字読取装置
JPS60159986A (ja) 光学的文字読取装置
JP2503208B2 (ja) 名刺画像処理方法
JPS6054082A (ja) 光学文字読取装置
JP2877380B2 (ja) 光学的文字読取装置
JPS60142784A (ja) 文字分離方式
JPS60181880A (ja) 光学的文字入力装置
JPS615383A (ja) 文字パタ−ン分離装置
JP3160458B2 (ja) 文字読取装置及び文字読取方法
JPH0244487A (ja) 光学文字読取装置の7b文字読取方式
JPS5972577A (ja) 図面読取装置
JPH07160810A (ja) 文字認識装置
JPS5850078A (ja) 文字認識装置
JPS59158482A (ja) 文字認識装置
JPH0797390B2 (ja) 文字認識装置
JP2578768B2 (ja) 画像処理方法
JP2578767B2 (ja) 画像処理方法
JPS60160486A (ja) 光学的文字読取装置
JPS6160184A (ja) 光学的文字読取装置
JPH0578068B2 (ja)
JPH04359393A (ja) 光学的文字読取装置
JPH01265378A (ja) 欧文文字認識方式
JPS61289479A (ja) 繋がり文字を読取る文字認識装置