JPS58125187A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS58125187A
JPS58125187A JP57007212A JP721282A JPS58125187A JP S58125187 A JPS58125187 A JP S58125187A JP 57007212 A JP57007212 A JP 57007212A JP 721282 A JP721282 A JP 721282A JP S58125187 A JPS58125187 A JP S58125187A
Authority
JP
Japan
Prior art keywords
pattern
recognition
character pattern
recognition dictionary
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57007212A
Other languages
English (en)
Inventor
Kozo Tomono
伴野 浩三
Masataka Yamamoto
山本 勝敬
Hajime Nanbu
南部 元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP57007212A priority Critical patent/JPS58125187A/ja
Publication of JPS58125187A publication Critical patent/JPS58125187A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 この発明はパターンマツチング法尋によって文字を認識
する文字認識装置に関するものであり、更に詳しくは認
識辞書容量の小さい文字認識装置に関するものである。
従来のとの検装置の構成を第1図に示し説明する。用紙
+1+に記入または印刷された文字を走査部(2)で走
査することによって1文字パターンをバックアメモリ(
3)に記憶する。前処理部(4)はバッファメモリ(3
)に記憶された文字パターンに大きさの正規化、2値化
、ノイズ除去、平滑化等の前処理を行い、パターンメモ
1月5)に送る。
認識部(6)はパターンメモ1月5)に記憶された文字
パターンと認識辞書())に記憶された各カテゴリの基
準文字パターンとの類似度を計算し、類似度が大きく、
シかも開繊方式によって定められた条件を満たすものを
認識結果として出力する。
従来、この種装置では、認識辞書にパターンメモリと同
じ大きさの基準パターンが記憶されており、その数はカ
テゴリ毎に最低1つ、認識精度を上けるためには2つ以
上用いられるのが通常であった。それゆえ、カテゴリ?
が多くなると認識辞書容量が膨大となる欠漬があった。
即ち、英数字カタカナ記号の全てを対象とする場合はも
ちろんのこと、漢字等のようにカテゴリ数が1000以
上となると認識辞書容量の増大は深刻な問題となってく
る。
例えば0文字パターンの大きさを32X32ビツトとし
、基準パターンケカテゴリ毎に1つとすると、英数字3
6カテゴリでは4.608バイトであるが、漢字100
0カテゴリでは128.000バイトとなシ、装置の価
格が大巾に増大するという欠潰があった。
この発明は、これらの欠点を解決するため。
基鵡又字パターンを予め符号化して認識辞書に記憶させ
ておき、認識部で会費とする時点に必賢とする基準文字
パターンな復号器で復号化して用いることを特徴とし、
その目的は認識辞書容量を減少させ、装置の価格を低減
させることにある。
第2図は、この発明の実施例の構成図である。
入力文字パターンは、走査部(2)、前処理部(4)を
経てパターンメモリA(8)に送られる。一方、認識辞
書(7)の基準パターンは復号器(9)によって復号化
され、パターンメモ+) B (IIに送られる。認識
部(6) Id ハターンメモリム(8)の文字パター
ンとパターンメモリB QQの基準文字パターンとの類
似度を計算し、所定の条件を満足するカテゴリを認識結
果として出力する。
基準文字パターンの符号化と復号化は1例えばDF表現
(Depth First Expression ・
・・ 昭和56年10月発行の情報処理学会誌Vo1.
22NO10F967に詳細説明あシ)の如き、この種
分野の技術者にとって周知の手法を用いて実現できる。
例えは丁・F表現を用いれは文字パターンは1/3以下
に圧縮されるので、認識辞書容量は大巾に減少し、大き
な改善効果をもたらす。
なお2以上は入カバターンとすべての基準パターンとの
類似度を計算して認識する場合について訣明したが、こ
の発明はこれに限らず、ia!識辞書を階ノー構造にし
、先に適当な文字特徴を用いて大分類、した後、会費な
基準パターンとのみ類似度を計算して認識するようにし
てもよい。
こうすることによって、復号化のための処理時間の増加
をきわめて小さくすることができる。
以上のように、この発明によれii′認識辞書に基準文
字パターンを符号化して記憶し、認識の際に復号化して
用いるので認識辞書容量を小さくできる利点がある。
【図面の簡単な説明】
第1図は従来のこの種装置の構成図、第2図はこの発明
の実施例による装置の構成図である。 図中、(1)は用紙、(2)は走査部、(3)はバッフ
ァメモリ、(4)は前処理部、(5)はパターンメモリ
。 (6)は認識部、(7)は認識辞書、(8)はパターン
メモIJA、+91は復号器、 Ql)はパターンメモ
リBである。 なお0図中、同一あるいは相当部分には同一符号を付し
て示しである。 代理人 葛 野 信 − 第1図 第2図

Claims (1)

  1. 【特許請求の範囲】 帳票などの記録媒体に記入またけ印刷された文字を認識
    する文字認識装置において0文字を走査して光電変換す
    る走査部と、入力文字パターンの正規化、2値化、ノイ
    ズ除去、平滑化等の前処理を行う前処理部と、符号化さ
    れた基準文字パターンを記憶する認識辞書と、認識辞書
    内の基準文字パターンな復号化する復号器と。 認識辞書を参照して入力文字パターンを認識する認識部
    を具備し、走査部から送られてくる入力文字パターンと
    認識辞書内の基準文字パターンとから類似度を求める際
    に、認識辞書内に符妥化されて記憶されている基準パタ
    ーンな復号器によって復号化して用いることを特徴とす
    る文字認識装置。
JP57007212A 1982-01-20 1982-01-20 文字認識装置 Pending JPS58125187A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57007212A JPS58125187A (ja) 1982-01-20 1982-01-20 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57007212A JPS58125187A (ja) 1982-01-20 1982-01-20 文字認識装置

Publications (1)

Publication Number Publication Date
JPS58125187A true JPS58125187A (ja) 1983-07-26

Family

ID=11659688

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57007212A Pending JPS58125187A (ja) 1982-01-20 1982-01-20 文字認識装置

Country Status (1)

Country Link
JP (1) JPS58125187A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8240469B2 (en) 2009-08-28 2012-08-14 Ricoh Company, Ltd. Packaging container

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8240469B2 (en) 2009-08-28 2012-08-14 Ricoh Company, Ltd. Packaging container

Similar Documents

Publication Publication Date Title
JP3139521B2 (ja) 自動言語決定装置
CA1229894A (en) Cryptographic analysis system
US6360010B1 (en) E-mail signature block segmentation
Margner SARAT-A system for the recognition of Arabic printed text
JPS58125187A (ja) 文字認識装置
Al-Fedaghi et al. Morphological compression of Arabic text
JP2751865B2 (ja) 文字列認識装置
JP2894111B2 (ja) 光学式活字文字認識装置における認識結果の総合判定方式
JP3163698B2 (ja) 文字認識方法
JPS59158482A (ja) 文字認識装置
JPH01311390A (ja) 文字置換制御方式
JP2972443B2 (ja) 文字認識装置
JP2917396B2 (ja) 文字認識方式
JPS6139175A (ja) 光学的文字読取装置
JP3100786B2 (ja) 文字認識後処理方式
JPS60237584A (ja) 文字認識方式
JPS61251984A (ja) マルチフオント活字文字認識装置
JP2641212B2 (ja) 文字認識装置
JPH10171924A (ja) 文字認識装置
JPH0812683B2 (ja) 特定文字列高速抽出方法
JPS60110089A (ja) 文字認識装置
JPS6086672A (ja) 文書処理装置
JPS6073793A (ja) 光学文字読取装置
JPS6336392A (ja) 閾値設定方式
JPH02242391A (ja) 文字認識方式