JPH0452782A - 文字読み取り装置 - Google Patents

文字読み取り装置

Info

Publication number
JPH0452782A
JPH0452782A JP2155982A JP15598290A JPH0452782A JP H0452782 A JPH0452782 A JP H0452782A JP 2155982 A JP2155982 A JP 2155982A JP 15598290 A JP15598290 A JP 15598290A JP H0452782 A JPH0452782 A JP H0452782A
Authority
JP
Japan
Prior art keywords
character
pattern
character pattern
section
shape
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2155982A
Other languages
English (en)
Other versions
JP2982221B2 (ja
Inventor
Yasuyuki Nishioka
靖幸 西岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2155982A priority Critical patent/JP2982221B2/ja
Publication of JPH0452782A publication Critical patent/JPH0452782A/ja
Application granted granted Critical
Publication of JP2982221B2 publication Critical patent/JP2982221B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、ワードプロセッサーや電子組版システムに用
いられる情報入力装置のとくに光学式の文字読み取り装
置に関する。
従来の技術 近年、ワードプロセンサーや電子組版システムか普及し
、情報量の増大による入力の負担増か叫ばれ、入力の効
率化が要望されている。また、文書情報の有効利用を図
るために文書処理をコンビ二一夕により支援し、文書の
蓄積、検索を効率化したいとするニーズか高まっている
。その要望に応えるためには、文書形式、文書書体なと
に依存しない印刷文書を入力できる光学式文字読み取り
装置か必要である。従来の光学式文字読み取り装置は、
文字切り出しで黒画素連結成分情報による文字の切り出
し方法や1文字ごとの文字幅の平均より文字の切り出し
を行う方法か行われている。
以下に従来の文字切り出し方法の動作を第5図を用いて
説明する。黒画素連結成分情報による文字切り出し方法
では、黒画素501の8方向(第5図(a))に接する
黒画素は、同し1つの文字パターンであるという規則に
基つき区別する。たとえば、第5図(blのように50
2で1つの文字パターン、503で1つの文字パターン
となる。このように、従来の方法は上記黒画素連結成分
より求めた外接矩形枠幅の平均を1文字の幅と仮定して
文字切り出しを行う方法であった。
発明か解決しようとする課題 しかしながら上記従来の方法では、黒画素に接する8方
向の黒画素を同し1つの文字パターンと見なすため、接
触している文字を1つの文字と見なしてしまう。このた
め、文字と文字の接触お1よび、複雑な文字に対して正
しい文字切り出しか行えないという問題点を有していた
本発明は、上記問題に留意し、簡単な構成で精度の良い
文字切り出しか行える文字読み取り装置を提供すること
を目的とする。
課題を解決するための手段 本発明の上記目的を達成するため、文字パターンの左側
面の形状を求める形状検出部と、形状より文字の推測を
行う文字推測部と、文字の推測に基つき文字の切り出し
位置を求める文字切り出し位置検出部を備え文字推測部
により推測した文字パターンを、文字切り出し位置決定
部により決定した位置で切り出して文字認識を行う、文
字読み取り装置である。
作用 上記構成の本発明の文字読み取り装置は、形状検出部で
、認識しようとする文字パターンを左から右にセンサを
走査し、順次下側に移動させて一面の走査を行い、この
文字パターンを検出するまでの左から右への走査の距離
でその特徴を検出し、この検出された左側面形状から、
文字推測部に記憶されている辞書データより文字パター
ンを推測するものである。この推測された文字パターン
から文字切り出し位置決定部により、切り出す位置を決
定し、他の文字と切り離して認識するものである。これ
により文字パターンか接触した場合や、文字の外形が複
雑な文字パターンであっても正しい文字切り出し位置を
求めることか可能となる。
実施例 第1図は、本発明の一実施例の文字読み取り装置の構成
を示すブロック図である。第1図に示すように構成要素
として、100は文字パターン入力部であり、文字切り
出し処理を行うパターンを入力する。101は文字パタ
ーン入力部100より入力された文字パターンに外接す
る矩形枠を求める外接矩形検出部、102は上記外接矩
形内の文字数を検出する矩形内文字数検出部、103は
入力文字パターンの左側面形状を検出する形状検出部、
104は形状検出部103で求めた形状より文字を推測
する文字推測部、105は文字推測部104で推測した
文字から切り出し位置を求める文字切り出し位置決定部
、106は文字の切り出し位置を表示する表示部、10
7は文字推測を行うための辞書で構成されている。
以下に第1図のブロック図および、第4図ta+の切り
出し例題文字パターン「f iJを用いて、本実施例の
動作について説明を行う。
マス、2値パターン「fl」は文字パターン入力部10
0で、入力される。
つぎに外接矩形検出部101で、上記2値パターンにラ
ベリング処理を行い、同一ラベルの画素を検出し、当該
画素に外接する矩形を検出する。文字パターンrfiJ
の外接矩形を第4図(alに示す。
この外接矩形の矩形内文字数検出部102は、矩形内の
文字が1文字であるかきうかすなわち、文字同士が接触
していないが、または文字同士が複雑に入り組んでいな
いかを検出する。検出の方法として入力文字パターン幅
か他の文字バク〜ン外接矩形幅の平均値の2倍より小さ
いときは1文字と見なし、等しいかそれ以上のときは2
文字以上と見なす。2文字以上と見なされる入力文字パ
ターンは以下の処理を行い、1文字と見なされる文字は
、以下形状検出部103、文字推測部104、および文
字切り出し位置決定部105の処理を行わず、表示部1
06へ処理を移す。
形状検出部103は、上記外接矩形の左辺の左上端を起
点として、左から右へ走査して最初に文字パターンとぶ
つかったところまでの距離を1次特徴とする(第4図(
b))。文字パターンとぶつからないときは、外接矩形
の幅を第1次特徴とする。同様に、外接矩形の左辺より
走査して、二度目に文字パターンとぶつかったところま
での距離を2次特徴として用いる(第4図(C))。文
字パターンとぶつからないときは、外接矩形の幅を第2
次特徴とする。これを、外接矩形の底辺まで繰り返し行
う。
辞書107には、上記1次特徴、2次特徴とそれに対応
する横/縦比を記憶させておく。横″縦比は、予め標準
文字パターンの外接矩形の横、・′縦の比より求めた値
である。
つぎに文字推測部104で、入力文字パターンから求め
た特徴量と予め標準パターンより作1fflした辞書1
07とを比較して、もっとも特徴量の近い文字を捜し出
す。入力文字パターン「fl、の場合は、“f”という
文字が得られる。
文字切り出し位置決定部105では、前記文字推測部よ
り求められた文字の標準パターンの横/縦比に入力文字
パターンの高さ(第4図(dlの、ポイント400から
ポイント401)を掛けた値を計算し、入カバターンの
左端から当該値たけ右側の位置を文字切り出し位置とす
る(第4図fdlのポイント402からポイント403
)。入力文字パターンrfiJの場合は、“f”という
文字を推測したことより“f”の標準文字パターンの横
/縦比に入力文字パターンrfiJの高さを掛けた値を
計算し、入カバターンの左端から当該値だけ右側の位置
になる。この位置より外接矩形の右辺までが後ろの文字
“i”の文字パターンとなる。
つぎに、第2図および第3図に示すフローチャートに基
づいて本実施例の処理の流れを詳細に説明する。ステッ
プ5200では、2値化された文字パターンが入力され
る。ステップ5201においては、黒画素連結成分によ
って文字パターンに外接する矩形枠を求める。ステップ
5202においては、上記外接矩形内の文字数を検出す
る。ステップ5203においては、外接矩形内の文字の
数が1つであるか判断する。正しい場合はステップS 
205へ、異なる場合はステップ5204へ処理を移す
。ステップ5204は、文字の分離サブルーチンである
。ステップ5205では、全ての外接矩形について処理
を終了したか判断する。
終了した場合はステップ5206へ、そうでない場合は
ステップ5202へ処理を移す。ステップ5206は終
了である。
文字の分離サブルーチンについて第3図のフローチャー
トに示し、以下に説明する。ステップ5301では、2
文字以上と判断された文字パターンが入力される。ステ
ップ5302で水平文字パターンの第1次特徴および第
2次特徴を求める。つぎにステップ5303において、
文字の推測を行う。ステップ5304において、文字推
測の決定により文字切り出し位置を決める。
以上説明したように、本実施例においては切り出し位置
を文字の推測を行ってから決定するので精度の良い切り
出しが可能である。
発明の効果 本発明は、左側面形状を検出する形状検出部と文字推測
部により、まず入力文字パターンの文字推測を行うこと
により、入力文字パターンが接触していたり、文字の外
形が複雑な入力文字パターンであっても正しい文字切り
出しを行うことができ、さらに文字の推測をしたことに
より、光学式文字読み取りの認識率向・上という効果を
得ることができることを特徴とした文字読み取り装置で
ある。
【図面の簡単な説明】
第1図は本発明の一実施例の文字読み取り装置の構成を
示すブロック図、第2図、第3図は同実施例のフローチ
ャート、第4図は同実施例により切り出し位置か決定さ
れるまでの説明のための文字パターン図、第5図は従来
例の説明のだめの文字パターン図である。 100・・・・・・文字パターン入力部、101・・・
・・・外接矩形検出部、102・・・・・・矩形内文字
数検出部、103・・・・・・形状検出部、104・・
・・・・文字推測部、105・・・・・・文字切り出し
位置決定部。

Claims (4)

    【特許請求の範囲】
  1. (1)認識対象文字パターンの左側面形状を検出する形
    状検出部と、 前記形状検出部により検出された前記認識対象文字パタ
    ーンの左側面形状より文字パターンを推測する文字推測
    部と、 前記文字推測部により推測した文字パターンより文字切
    り出し位置を決定する文字切り出し位置決定部とを具備
    し、 前記文字切り出し位置決定部により決められた切り出し
    位置で1文字ごとに分離し文字抽出を行うようにしてな
    る文字読み取り装置。
  2. (2)文字切り出し位置決定部が、文字推測部により推
    測した文字パターンの標準パターンの横/縦比より、文
    字切り出し位置を決定する請求項1記載の文字読み取り
    装置。
  3. (3)形状検出部が、左から右に走査して、文字パター
    ンを検出するまでの距離で、前記文字パターンの左側面
    形状を検出する請求項1記載の文字読み取り装置。
  4. (4)文字推測部が、文字パターンの左側面形状と、横
    /縦比のデータを含む標準文字パターンが記憶された辞
    書を有する請求項1記載の文字読み取り装置。
JP2155982A 1990-06-14 1990-06-14 文字読み取り装置 Expired - Fee Related JP2982221B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2155982A JP2982221B2 (ja) 1990-06-14 1990-06-14 文字読み取り装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2155982A JP2982221B2 (ja) 1990-06-14 1990-06-14 文字読み取り装置

Publications (2)

Publication Number Publication Date
JPH0452782A true JPH0452782A (ja) 1992-02-20
JP2982221B2 JP2982221B2 (ja) 1999-11-22

Family

ID=15617770

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2155982A Expired - Fee Related JP2982221B2 (ja) 1990-06-14 1990-06-14 文字読み取り装置

Country Status (1)

Country Link
JP (1) JP2982221B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5631683A (en) * 1993-12-28 1997-05-20 Seiko Epson Corporation Ink jet cartridge and printer using it

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5631683A (en) * 1993-12-28 1997-05-20 Seiko Epson Corporation Ink jet cartridge and printer using it

Also Published As

Publication number Publication date
JP2982221B2 (ja) 1999-11-22

Similar Documents

Publication Publication Date Title
EP0854434B1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
US4757551A (en) Character recognition method and system capable of recognizing slant characters
JP3345224B2 (ja) パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
LeBourgeois Robust multifont OCR system from gray level images
US20220301329A1 (en) Image processing system and an image processing method
JPH05500129A (ja) 光学式文字認識のための行ごとのセグメント化及びしきい値設定
JP3411472B2 (ja) パターン抽出装置
KR100383858B1 (ko) 문자인식장치의 문자추출방법 및 장치
JPH0452782A (ja) 文字読み取り装置
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JP2827960B2 (ja) 宛名行抽出装置
JP3457094B2 (ja) 文字認識装置及び文字認識方法
JP4136257B2 (ja) 文字認識装置、文字認識方法および記憶媒体
JPH07160810A (ja) 文字認識装置
JP2978801B2 (ja) 手書き文字認識の文字入力方式
JPS61190679A (ja) 文字デ−タ処理装置
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
JPH0656625B2 (ja) 特徴抽出方式
JP3027232B2 (ja) 文字認識装置
JP2000181989A (ja) 文字認識装置及びその方法並びにその方法をプログラムとして記録したコンピュータ読み取り可能な記録媒体
JPH0573718A (ja) 領域属性識別方式
JPH01265378A (ja) 欧文文字認識方式
JPH05135204A (ja) 文字認識装置
JPH0281283A (ja) 文字認識方法
JPH02245887A (ja) 文字認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees