JP2982221B2 - 文字読み取り装置 - Google Patents

文字読み取り装置

Info

Publication number
JP2982221B2
JP2982221B2 JP2155982A JP15598290A JP2982221B2 JP 2982221 B2 JP2982221 B2 JP 2982221B2 JP 2155982 A JP2155982 A JP 2155982A JP 15598290 A JP15598290 A JP 15598290A JP 2982221 B2 JP2982221 B2 JP 2982221B2
Authority
JP
Japan
Prior art keywords
character
pattern
unit
character pattern
cutout position
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2155982A
Other languages
English (en)
Other versions
JPH0452782A (ja
Inventor
靖幸 西岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2155982A priority Critical patent/JP2982221B2/ja
Publication of JPH0452782A publication Critical patent/JPH0452782A/ja
Application granted granted Critical
Publication of JP2982221B2 publication Critical patent/JP2982221B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、ワードプロセッサーや電子組版システムに
用いられる情報入力装置のとくに光学式の文字読み取り
装置に関する。
従来の技術 近年、ワードプロセッサーや電子組版システムが普及
し、情報量の増大による入力の負担増が叫ばれ、入力の
効率化が要望されている。また、文書情報の有効利用を
図るために文書処理をコンピュータにより支援し、文書
の蓄積、検索を効率化したいとするニーズが高まってい
る。その要望に応えるためには、文書形式、文書書体な
どに依存しない印刷文書を入力できる光学式文字読み取
り装置が必要である。従来の光学式文字読み取り装置
は、文字切り出しで黒画素連結成分情報による文字の切
り出し方法や1文字ごとの文字幅の平均より文字の切り
出しを行う方法が行われている。
以下に従来の文字切り出し方法の動作を第5図を用い
て説明する。黒画素連結成分情報による文字切り出し方
法では、黒画素501の8方向(第5図(a))に接する
黒画素は、同じ1つの文字パターンであるという規則に
基づき区別する。たとえば、第5図(b)のように502
で1つの文字パターン、503で1つの文字パターンとな
る。このように、従来の方法は上記黒画素連結成分より
求めた外接矩形枠幅の平均を1文字の幅と仮定して文字
切り出しを行う方法であった。
発明が解決しようとする課題 しかしながら上記従来の方法では、黒画素に接する8
方向の黒画素を同じ1つの文字パターンと見なすため、
接触している文字を1つの文字と見なしてしまう。この
ため、文字と文字の接触および、複雑な文字に対して正
しい文字切り出しが行えないという問題点を有してい
た。
本発明は、上記問題に留意し、簡単な構成で精度の良
い文字切り出しが行える文字読み取り装置を提供するこ
とを目的とする。
課題を解決するための手段 本発明の上記目的を達成するため、文字パターンの左
側面の形状を求める形状検出部と、形状より文字の推測
を行う文字推測部と、文字の推測に基づき文字の切り出
し位置を求める文字切り出し位置検出部を備え文字推測
部により推測した文字パターンを、文字切り出し位置決
定部により決定した位置で切り出して文字認識を行う、
文字読み取り装置である。
作用 上記構成の本発明の文字読み取り装置は、形状検出部
で、認識しようとする文字パターンを左から右にセンサ
を走査し、順次下側に移動させて一面の走査を行い、こ
の文字パターンを検出するまでの左から右への走査の距
離でその特徴を検出し、この検出された左側面形状か
ら、文字推測部に記憶されている辞書データより文字パ
ターンを推測するものである。この推測された文字パタ
ーンから文字切り出し位置決定部により、切り出す位置
を決定し、他の文字と切り離して認識するものである。
これにより文字パターンが接触した場合や、文字の外形
が複雑な文字パターンであっても正しい文字切り出し位
置を求めることが可能となる。
実施例 第1図は、本発明の一実施例の文字読み取り装置の構
成を示すブロック図である。第1図に示すように構成要
素として、100は文字パターン入力部であり、文字切り
出し処理を行うパターンを入力する。101は文字パター
ン入力部100より入力された文字パターンに外接する矩
形枠を求ける外接矩形検出部、102は上記外接矩形内の
文字数を検出する矩形内文字数検出部、103は入力文字
パターンの左側面形状を検出する形状検出部、104は形
状検出部103で求めた形状より文字を推測する文字推測
部、105は文字推測部104で推測した文字から切り出し位
置を求める文字切り出し位置決定部、106は文字の切り
出し位置を表示する表示部、107は文字推測を行うため
の辞書で構成されている。
以下に第1図のブロック図および、第4図(a)の切
り出し例題文字パターン「fi」を用いて、本実施例の動
作について説明を行う。
まず、2値パターン「fi」は文字パターン入力部100
で、入力される。
つぎに外接矩形検出部101で、上記2値パターンにラ
ベリング処理を行い、同一ラベルの画素を検出し、当該
画素に外接する矩形を検出する。文字パターン「fi」の
外接矩形を第4図(a)に示す。
この外接矩形の矩形内文字数検出部102は、矩形内の
文字が1文字であるかどうかすなわち、文字同士が接触
していないか、または文字同士が複雑に入り組んでいな
いかを検出する。検出の方法として入力文字パターン幅
が他の文字パターン外接矩形幅の平均値の2倍より小さ
いときは1文字と見なし、等しいかそれ以上のときは2
文字以上と見なす。2文字以上と見なされる入力文字パ
ターンは以下の処理を行い、1文字と見なされる文字
は、以下形状検出部103、文字推測部104、および文字切
り出し位置決定部105の処理を行わず、表示部106へ処理
を移す。
形状検出部103は、上記外接矩形の左辺の左上端を起
点として、左から右へ走査して最初に文字パターンとぶ
つかったところまでの距離を1次特徴とする(第4図
(b))。文字パターンとぶつからないときは、外接矩
形の幅を第1次特徴とする。同様に、外接矩形の左辺よ
り走査して、二度目に文字パターンとぶつかったところ
までの距離を2次特徴として用いる(第4図(c))。
文字パターンとぶつからないときは、外接矩形の幅を第
2次特徴とする。これを、外接矩形の底辺まで繰り返し
行う。
辞書107には、上記1次特徴、2次特徴とそれに対応
する横/縦比を記憶させておく。横/縦比は、予め標準
文字パターンの外接矩形の横/縦の比より求めた値であ
る。
つぎに文字推測部104で、入力文字パターンから求め
ら特徴量と予め標準パターンより作成した辞書107とを
比較して、もっとも特徴量の近い文字を捜し出す。入力
文字パターン「fi」の場合は、“1"という文字が得られ
る。
文字切り出し位置決定部105では、前記文字推測部よ
り求められた文字の標準パターンの横/縦比に入力文字
パターンの高さ(第4図(d)の,ポイント400からポ
イント401)を掛けた値を計算し、入力パターンの左端
から当該値だけ右側の値を文字切り出し位置とする(第
4図(d)のポイント402からポイント403)。入力文字
パターン「fi」の場合は、“f"という文字を推測したこ
とより“f"の標準文字パターンの横/縦比に入力文字パ
ターン「fi」の高さを掛けた値を計算し、入力パターン
の左端から当該値だけ右側の位置になる。この位置より
外接矩形の右辺までが後ろの文字“i"の文字パターンと
なる。
つぎに、第2図および第3図に示すフローチャートに
基づいて本実施例の処理の流れを詳細に説明する。ステ
ップS200では、2値化された文字パターンが入力され
る。ステップS201においては、黒画素連結成分によって
文字パターンに外接する矩形枠を求める。ステップS202
においては、上記外接矩形内の文字数を検出する。ステ
ップS203においては、外接矩形内の文字の数が1つであ
るか判断する。正しい場合はステップS205へ、異なる場
合はステップS204へ処理を移す。ステップS204は、文字
の分離サブルーチンである。ステップS205では、全ての
外接矩形について処理を終了したか判断する。終了した
場合はステップS206へ、そうでない場合はステップS202
へ処理を移す。ステップS206は終了である。
文字の分離サブルーチンについて第3図のフローチャ
ートに示し、以下に説明する。ステップS301では、2文
字以上と判断された文字パターンが入力される。ステッ
プS302で水平文字パターンの第1次特徴および第2次特
徴を求める。つぎにステップS303において、文字の推測
を行う。ステップS304において、文字推測の決定により
文字切り出し位置を決める。
以上説明したように、本実施例においては切り出し位
置を文字の推測を行ってから決定するので精度の良い切
り出しが可能である。
発明の効果 本発明は、左側面形状を検出する形状検出部と文字推
測部により、まず入力文字パターンの文字推測を行うこ
とにより、入力文字パターンが接触していたり、文字の
外形が複雑な入力文字パターンであっても正しい文字切
り出しを行うことができ、さらに文字の推測をしたこと
により、光学式文字読み取りの認識率向上という効果を
得ることができることを特徴とした文字読み取り装置で
ある。
【図面の簡単な説明】
第1図は本発明の一実施例の文字読み取り装置の構成を
示すブロック図、第2図,第3図は同実施例のフローチ
ャート、第4図は同実施例により切り出し位置が決定さ
れるまでの説明のための文字パターン図、第5図は従来
例の説明のための文字パターン図である。 100……文字パターン入力部、101……外接矩形検出部、
102……矩形内文字数検出部、103……形状検出部、104
……文字推測部、105……文字切り出し位置決定部。

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】認識対象文字パターンの左側面形状を検出
    する形状検出部と、 前記形状検出部により検出された前記認識対象文字パタ
    ーンの左側面形状より文字パターンを推測する文字推測
    部と、 前記文字推測部により推測した文字パターンより文字の
    切り出し位置を決定する文字切り出し位置決定部とを具
    備し、 前記文字切り出し位置決定部により決められた切り出し
    位置で1文字ごとに分離し文字抽出を行うようにしてな
    る文字読み取り装置。
  2. 【請求項2】文字切り出し位置決定部が、文字推測部に
    より推測した文字パターンの標準パターンの横/縦比よ
    り、文字切り出し位置を決定する請求項1記載の文字読
    み取り装置。
  3. 【請求項3】文字推測部が、文字パターンの左側面形状
    と、横/縦比のデータを含む標準文字パターンが記憶さ
    れた辞書を有する請求項1記載の文字読み取り装置。
JP2155982A 1990-06-14 1990-06-14 文字読み取り装置 Expired - Fee Related JP2982221B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2155982A JP2982221B2 (ja) 1990-06-14 1990-06-14 文字読み取り装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2155982A JP2982221B2 (ja) 1990-06-14 1990-06-14 文字読み取り装置

Publications (2)

Publication Number Publication Date
JPH0452782A JPH0452782A (ja) 1992-02-20
JP2982221B2 true JP2982221B2 (ja) 1999-11-22

Family

ID=15617770

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2155982A Expired - Fee Related JP2982221B2 (ja) 1990-06-14 1990-06-14 文字読み取り装置

Country Status (1)

Country Link
JP (1) JP2982221B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3346064B2 (ja) * 1993-12-28 2002-11-18 セイコーエプソン株式会社 インクジェットカートリッジ

Also Published As

Publication number Publication date
JPH0452782A (ja) 1992-02-20

Similar Documents

Publication Publication Date Title
US7580571B2 (en) Method and apparatus for detecting an orientation of characters in a document image
JP5600723B2 (ja) 様々な文字幅を有するテキスト行の文字を分割するための方法及びシステム
US7146047B2 (en) Image processing apparatus and method generating binary image from a multilevel image
JP2982221B2 (ja) 文字読み取り装置
JPH0410087A (ja) 基本ライン抽出方法
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JPH04352295A (ja) 文字列方向判別装置
JP4136257B2 (ja) 文字認識装置、文字認識方法および記憶媒体
JPH04112283A (ja) 画像処理方法及び装置
JP3411795B2 (ja) 文字認識装置
JP3095470B2 (ja) 文字認識装置
JP3457094B2 (ja) 文字認識装置及び文字認識方法
JPH07160810A (ja) 文字認識装置
JP2630261B2 (ja) 文字認識装置
JP3000480B2 (ja) 文字領域区切り検出方法
JP3711186B2 (ja) サイズ識別方法および装置
JP4580520B2 (ja) 文字認識方法および文字認識装置
JP2715930B2 (ja) 線分検出方法
JPH10162104A (ja) 文字認識装置
JPH07168911A (ja) 文書認識装置
JP3190794B2 (ja) 文字切り出し装置
JP3071479B2 (ja) 行間スペース検出方法
JP3276554B2 (ja) フォーマット認識装置及び文字読取り装置
JPH06150062A (ja) 文字認識装置
JPH0656625B2 (ja) 特徴抽出方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees