JPS6174083A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS6174083A
JPS6174083A JP59195108A JP19510884A JPS6174083A JP S6174083 A JPS6174083 A JP S6174083A JP 59195108 A JP59195108 A JP 59195108A JP 19510884 A JP19510884 A JP 19510884A JP S6174083 A JPS6174083 A JP S6174083A
Authority
JP
Japan
Prior art keywords
character
type
character pattern
features
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59195108A
Other languages
English (en)
Inventor
Yukikazu Kaburayama
蕪山 幸和
▲はい▼ 東善
Touzen Hai
Eiichiro Yamamoto
山本 栄一郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP59195108A priority Critical patent/JPS6174083A/ja
Publication of JPS6174083A publication Critical patent/JPS6174083A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は文字認識装置の改良に関する。
光学文字読取り装置(QC−R装置)に代表される文字
認識装置は1例えば帳票上の所定の文字記入枠に手書き
または活字等によって記入された文字パターン(入力文
字パターン)を1例えばCCD素子等の光電変換素子を
用い背景と共に所定の大きさの画素毎にラスク走査によ
って観測して。
文字パターン構成画素(黒画素)を“1″とし。
背景構成画素(白画素)を“0”とする2値データに変
換し、このようにして表される1行分の文字パターンか
ら、前記文字記入枠を基準として1文字分の文字パター
ンを切出してその特徴を抽出し、これを予め認識辞書に
記憶する文字種毎の標準パターンの特徴と照合すること
によって、入力文字パターンの文字種を決定する装置で
ある。
ところで1日本語を対象とする文字認識装置においては
2文字様の総数が非常に多いため、認識に長時間を要す
るほか、誤認識等によって認識精度が低下し易いという
特殊性がある。
しかし、読み取りの対象とする帳票の種別、あるいは帳
票上の文字記入枠の種別等によって1文字種が1例えば
、英数字・平仮名・片仮名あるいは特定の漢字(例えば
住所に用いられる漢字)等にta定されることがあるの
で、このような場合には、状況に応じて文字種を限定す
ることにより。
認識時間の短縮および誤認識の防止を図った文字認識装
置がある。
〔従来の技術〕
第2図(alは文字認識装置の従来例の構成図であり、
1は入力文字パターンの特徴を抽出する特徴抽出部、2
は特徴抽出部1によって抽出された入力文字パターンの
特徴を、−文字種毎に後記認識辞書4に記憶される標準
文字パターンの特徴のうち。
後記辞書領域指定部3によって指定される領域に含まれ
るものと照合し、類似度が最も高い文字カテゴリを選択
し認識結果として出力する照合部63は後記認識辞書4
の領域のうち、読み取りの対象とする帳票の種別あるい
は帳票上の文字肥大枠の種別等1こ応した文字種の集合
が記憶されている領域を指定する辞書領域指定部、4は
標準文字パターンの特徴を予め決定した文字種の集合毎
に文字種を示す文字種識別(文字コード)と共に記憶す
る認識辞書である。
また、第2図[b)は認識辞書4の構成例の説明図であ
り、 4a・4b・・・は前記文字種毎の標準文字パタ
ーンの特徴を1文字種の集合毎にまとめて記憶する領域
であり+ 4aはアルファへノドの各標準文字パターン
の特徴を記憶する領域、 4bは算用数字の各標準文字
パターンの特徴を記憶する領域。
4cは片仮名の各標準文字パターンの特徴を記憶する領
域、 4dは平仮名の各標準文字パターンの特徴を記憶
する領域、また、 4eは常用漢字の各標準文字パター
ンの特徴を記憶する領域である。
すなわち、辞書領域指定部3は、読取りの対象とする帳
票の種別に応じて、あるいは帳票内の文字肥大枠の種別
に応じて、対応する認識辞書4の領域を各々の領域の開
始アドレスと終了アドレスによって指定し、照合部2は
特徴抽出部lによって抽出された人力文字パターンの特
徴を、認識辞書4に記憶される標準文字パターンの特徴
のうち。
辞書領域指定部3によって指定される領域に含まれるも
のと照合し、類似度が最も高い文字カテゴリを選択し出
力するものである。
〔発明が16′、決しようとする問題点〕上記構成のも
のにおいては、前記のように、認・識辞書の領域をアル
ファベント・算用数字・片仮名・平仮名および常用漢字
のような集合に分ける場合には特に問題は生しない。
しかし1例えは常用漢字の集合の他に住所用漢字の集合
・都道府県名漢字の集合・市町村名漢字の集合等を設け
る場合には、相互に重複する漢字があるため認識辞書が
大きくなる。各集合の漢字の追加あるいは削除に伴う認
識辞書の管理が複雑になる。あるいは、複数の領域を1
組の開始アドレスと終了アドレスとによって指定できな
い等の問題点がある。
C問題点を解決するための手段〕 本発明になる文字認識装置は、入力文字パターンの特徴
を抽出する特徴抽出部と1文字種毎の標準文字パターン
から抽出した前記特徴と同種の特徴を各々の文字種を識
別する文字種識別と各々の文字種が属する集合を識別す
る集合識別とを付して記憶ずろ認識辞書と、前記認識辞
書の記憶内容のうち外部から指定される集合識別が付さ
れたものを選択する集合選択部と、前記抽出された入力
文字パターンの特徴を前記選択された文字種の標準特徴
と照合し類似度が高い文字種を認識結果として出力する
照合部とを備えることにより、前記問題点の解消を図っ
たものである。
〔作用〕
すなわち1文字種毎の標準文字パターンから抽出した特
徴を各々の文字種を各々の文字種が属する集合の識別を
付して認識辞書に記憶するとともに、入力文字パターン
から抽出した特徴を認識辞書の記憶内容のうち所定の集
合識別が付されたものとのみ照合するものである。
〔実施例〕
以下に本発明の要旨を第1図に示す実施例によって具体
的に説明する。   □ 第1図(alは本発明一実施例の構成を示すブロック図
であり、第2図(alの従来例と共通する符号は同一の
対象を指すほか、5は1文字種毎の標準文字パターンか
ら抽出した特徴を各々の文字種を識別する文字コードと
各々の文字種が屈する集合。
例えば、英数字・片仮名・平仮名・常用漢字・地名漢字
および姓名漢字等を識別する集合識別とを付して記憶す
る認識辞書、6は、認識辞書5の記憶内容のうち、読取
りの対象とする帳票の種別に応して、あるいは帳票内の
文字記入枠の種別に応じて、外部から指定される集合識
別が付されたものを選択する集合選択部である。
また第1図(blは認識辞書5の記憶内容の文字種毎の
データ構成を示す図であり、■は各々の文字種が属する
集合を示す8ビツトの集合識別、■は各々の文字種を識
別する16ビ7)の文字コード。
また■は文字種毎の標準文字パターンから抽出した特徴
値である。
8ビツトの集合識別のうち1例えば、第1ビツトは数字
の集合を、第2ビツトはアルファベット文字の集合を、
第3ビツトは片仮名の集合を、第4ビツトは平仮名の集
合を、第5ビツトは常用漢字の集合を、第6ビノトは地
名文字の集合を、第7ヒントは姓名漢字の集合を、また
第8ビツトは他の特定漢字の集合を、それぞれ“1°と
して識別する識別ビットとする。
なお1例えば常用漢字・地名漢字あるいは姓名漢字等の
ように、複数の文字集合に属する文字種に対しては、複
数の識別ビットによって識別がなされる。
一方、集合゛選択部6には8ピントの制御メモリ61が
設けられ1例えば、読取りの対象とする帳票の種別によ
って、その帳票には算用数字以外の文字が記入されてい
ないことが明らかな場合には。
例えばスイッチ操作等によって、集合選択部6の制御メ
モリ61の第1ピントに“1”を、また他のビットには
すべて“O”を書き込む。
あるいは、観測中の帳票上の文字記入枠が住所記入部で
ある場合には、制御メモリ61の第6ビツトに“I”を
、また他のヒ゛ントにはすべて“O”を書き込む。
照合部2は、特徴抽出部1によって抽出された入力文字
パターンを、認識辞書5の記憶内容のうち集合選択部6
によって選択された集合、すなわち算用数字あるいは住
所文字の標準文字パターンの特徴とのみ照合する。
なお、制御メモリ61の複数のビットを“1”にするこ
とによって、複数の文字集合1例えば数字とアルファベ
ントとを選択することも出来る。
その結果、従来例と同様に、照合時間の短縮。
認識辞書に記憶する文字種毎の特徴量の減少、あるいは
認識精度の向上等の効果が得られる。
〔発明の効果〕
以上説明したように2本発明によれば、認識辞書には文
字種毎の標準文字パターンから抽出した特徴とその文字
コードとの他に、各々の文字種が属する集合を示す集合
識別を付けて記憶するだけであり、従来例のように複数
の集合に属する文字種の標ψ特徴を重複して記憶する必
要がない、認識辞書の構成が簡単なため認識辞書の管理
が容易である。また、認識辞書中の文字集合の選択が簡
単にてきる1等の効果が得られる。
【図面の簡単な説明】
第1図(a)は本発明一実施例のブロック図2第1図(
blは同実施例の認識辞書に関する説明図。 第2図(a)は従来例のブロック図。 第2図中)は同従来例の認識辞書に関する説明図である
。 図中。 1は特徴抽出部、    2は照合部 5は認識辞書、     6は集合選択部である。 (I2.、) 竿 2 g (ご2.ン (A)

Claims (1)

    【特許請求の範囲】
  1. 入力文字パターンの特徴を抽出する特徴抽出部と、文字
    種毎の標準文字パターンから抽出した前記特徴と同種の
    特徴を各々の文字種を識別する文字種識別と各々の文字
    種が属する集合を識別する集合識別とを付して記憶する
    認識辞書と、前記認識辞書の記憶内容のうち外部から指
    定される集合識別が付されたものを選択する集合選択部
    と、前記抽出された入力文字パターンの特徴を前記選択
    された文字種の標準特徴と照合し類似度が高い文字種を
    認識結果として出力する照合部とを備えることを特徴と
    する文字認識装置。
JP59195108A 1984-09-18 1984-09-18 文字認識装置 Pending JPS6174083A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59195108A JPS6174083A (ja) 1984-09-18 1984-09-18 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59195108A JPS6174083A (ja) 1984-09-18 1984-09-18 文字認識装置

Publications (1)

Publication Number Publication Date
JPS6174083A true JPS6174083A (ja) 1986-04-16

Family

ID=16335638

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59195108A Pending JPS6174083A (ja) 1984-09-18 1984-09-18 文字認識装置

Country Status (1)

Country Link
JP (1) JPS6174083A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63126082A (ja) * 1986-11-14 1988-05-30 Ricoh Co Ltd 文字認識方式
JP2009223556A (ja) * 2008-03-14 2009-10-01 Omron Corp 文字認識プログラム、文字認識電子部品、文字認識装置、文字認識方法、およびデータ構造

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63126082A (ja) * 1986-11-14 1988-05-30 Ricoh Co Ltd 文字認識方式
JP2009223556A (ja) * 2008-03-14 2009-10-01 Omron Corp 文字認識プログラム、文字認識電子部品、文字認識装置、文字認識方法、およびデータ構造

Similar Documents

Publication Publication Date Title
US5850480A (en) OCR error correction methods and apparatus utilizing contextual comparison
JP2726568B2 (ja) 文字認識方法及び装置
JP2713622B2 (ja) 表形式文書読取装置
JP3452774B2 (ja) 文字認識方法
JPS6262387B2 (ja)
JPH087033A (ja) 情報処理方法及び装置
US6535652B2 (en) Image retrieval apparatus and method, and computer-readable memory therefor
JPS6174083A (ja) 文字認識装置
KR100241447B1 (ko) 윤곽선 정보를 이용한 영문/숫자 인식방법
JP2640472B2 (ja) 文字認識方法
JPS63263588A (ja) 文字読取装置
JP2746345B2 (ja) 文字認識の後処理方法
JPS61272887A (ja) 文字認識方式
JP2907947B2 (ja) 光学文字読取システム
JPH0935007A (ja) 手書き文字・図形認識装置
JPH11120294A (ja) 文字認識装置および媒体
JP2886690B2 (ja) 光学的文字読取装置における文字認識方法
JPS60160484A (ja) 文字読取装置
JPH0338786A (ja) 文字認識処理装置
JPS62152096A (ja) 光学式文字読取装置
JPH11134439A (ja) 単語認識方法
JPH06203201A (ja) 光学的手書き文字列認識方法および装置
JPH05307647A (ja) 用語認識システム
JPH0484380A (ja) 文字認識装置
JPH0644298A (ja) 電子辞書