JPS60181880A - 光学的文字入力装置 - Google Patents

光学的文字入力装置

Info

Publication number
JPS60181880A
JPS60181880A JP59037506A JP3750684A JPS60181880A JP S60181880 A JPS60181880 A JP S60181880A JP 59037506 A JP59037506 A JP 59037506A JP 3750684 A JP3750684 A JP 3750684A JP S60181880 A JPS60181880 A JP S60181880A
Authority
JP
Japan
Prior art keywords
character
trajectory
turn
pattern
row
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59037506A
Other languages
English (en)
Other versions
JPH0557632B2 (ja
Inventor
Hiromi Nanba
難波 広海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP59037506A priority Critical patent/JPS60181880A/ja
Publication of JPS60181880A publication Critical patent/JPS60181880A/ja
Publication of JPH0557632B2 publication Critical patent/JPH0557632B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、例えば文字認識装置dに使用される光学的文
字入力装置に関する。
〔発明の技術的背景とその問題点〕
従来、光学的文字読取装置 (OCR)では、比較的文
字行の傾きが小さく、行間隔が一定な文字が記録されて
いる文書を読取対象とするのが一般的である。これは、
文字認識処理では文■、中の文字群から1文字毎の検出
切出し処理が行なわれ、この検出切出し処理には文字行
の位置を確実に検出することが必要となるためである。
具体的には、例えば第1図(a)に示すような文書10
において、記録された文字に対して行方向に走査し、各
走査線II毎に検出される黒のドツト数を計数して同図
(b)に示すようなヒストグラム12を作成する。そし
て、ヒストグラム12を所定のレベル13でスライスし
て2値化信号I4に変換し、この2値化信号I4にょシ
文字行の位置を検出する。この検出した文字行から、上
記のような検出切出し処理により文字が検出切出されて
、文字認識部で認識されることになる。
ところで近年、自由度の高いフォーマットの文相に対す
る読取処理を可能とするOCRの開発が行なわれている
。ここで、自由・iの高いフォーマットの文岩とは、例
えば第2図に示すように、所定の文字行20に対して行
間隔1行スキー−9文字サイズ及びフォント等のフォー
マットが異なる文字行21が印刷された文書22である
。このような文書22に対して、従来の方式によるOC
Rでは各文字行を正確に検出することは困難であシ、こ
のため文字の読取処理も不曳能であった。
〔発明の目的〕
本発明は上記の事情に鑑みてなされたもので、その目的
は、比較的自由度の高いフォーマットの文書の場合でも
、文書に記録された文字の読取処理を確実に行なうこと
ができる光学的文字入力装置を提供することにある。
〔発明の概要〕 本発明では、用紙上に記録された文字を光電変換後に得
られる2値化・やターン信号を格納する・やターンバッ
ファメモリが設けられる。軌跡パターン作成手段は、上
記2値化・ぐターン信号を平行移動して得られる軌跡・
ぐターンを作成する。この軌跡・母ターン作成手段によ
υ作成された軌跡・リーンは、軌跡パターンバッファメ
モリに格納される。検出手段は、軌跡・やターンバッフ
ァメモリ内を走査して文字行の輪郭を検出する。この検
出結果である文字行の輪郭点座標情報に基づいて、検出
切出し手段は・ぐターンバッファメモリ内の2値化・や
ターン信号から1文字毎の文字パターンを検出切出しを
行なうように構成されている。
これによυ、行間隔等のフォーマットが異なる文字行を
含む文書の場合でも、文字行の位置を確実に検出するこ
とができる。そして、文字行の検出結果に基づいて、1
文字毎の文字・やターンを確実に検出切出すことができ
る。
〔発明の実施例〕
以下図面を参照して本発明の一実施例を説明する。第3
図は一実施例に係わる光学的文字入力装置の構成を示す
ブロック図である。第3図において、光電変換部30は
文書上の文字を光電変換し、光電変換で得られる電気信
号を2値化・七ターン信号(以下2値化信号と称す)P
に変換して出力する。ビデオバッファ31は、光電変換
部30から出力される2値化・ぐターン信号Pを通常1
行分格納する。カウンタ32は、周期式カウンタ(例え
ばTexas Instruments社のS N 7
4 ALS16IN)であり、光電変換部30から2値
化信号Pが出力される際の走査クロックでカウントアツ
プし、2値化信号Pが黒レベルのときは値「0」がロー
ドされるように動作する。コン・ぐレータ33は、予め
設定される一定値B及びカウンタ32の出力値Aとを比
較し、一定値Bの方が大きい場合に出力Qを軌跡・母タ
ーンバッファ34に出力する。軌跡・ぐターンバッファ
34は、コンツヤレータ33からの出力Q即ち2値化信
号P(第4図(a))を一定距離(一定値BK相当)平
行移動して得られる軌跡パターン(第4図(b))を格
納する。
カウンタ35は、1走査期間においてコンをレータ33
から出力される軌跡パターンの黒ビット数をカウントし
、そのカウント出力である射影ヒストグラムを射影バッ
ファ36に出力する。一方、書込みコントローラ37は
、2値化信号Pがビデオバッファ3ノに格納される際、
光電変換部30.ビデオバッファ31.軌跡パターンバ
ッファ34.射影バッファ36及び各カウンタ3 ’2
 、35の動作を制御する。また、読出しコントローラ
38は、ビデオバッファ3Iから1文字毎の文字・やタ
ーンが検出切出さ−れる際、ビデオバッファ31.軌路
パターンバッファ34及び射影バッファ36の動作を制
御する。
上記のような構成の光学的文字入力装置において、一実
施例に係わる動作を説明する。いま仮に、第5図(a)
に示すような文書52が光電変換部30により走査され
て、各文字行に対応する2値化化号Pがビデオバッファ
31に格納される。一方、2値化化号Pに基づいて、上
記のようなカウンタ、92及びコン・やレータ33の動
作により、第5図(a)に示すような各文字行に対応す
る軌跡・やターンQが作成されて軌跡・やターンバッフ
ァ34に格納される。上記のようにして作成された軌跡
・やターンQはカウンタ35に供給される。カウンタ3
5は、上記のように1走査期間中にコンパレータ33か
ら出力される軌跡・eターンの黒ビット数をカウントす
る。このカウント出力である射影ヒストグラム(第5図
(b)の53)は、射影バッファ36に格納される。
このようにして、2値化化号P及び軌跡・母ターンQの
書込み動作が終了すると、文字行の輪郭を検出する動作
が行なわれる。即ち、先ず読出しコントローラ38にょ
シ、射影バッファ36内がサーチされて、文字行の検出
始点X。
がめられる。この始点Xoに基づいて、祢出しコントロ
ーラ38により軌跡・ぞターンバッファ34内を右方向
ヘサーチされ、第6図に示すような軌跡・やターンQの
追跡始点X1がめられる。
そして請求められた追跡始点X、から軌跡パターンQの
輪郭を追跡し、軌跡・母ターンの輪郭点座標系列がめら
れる。この場合、始点X、がら開始された追跡が始点X
1に戻ると、停止される。
ここで、次の軌跡・量ターンの追跡では、既に検出され
た軌跡・やターンを避けて水平に走査し、次の始点X2
が検出される。[試下同様にして、軌跡Iリーンの追跡
動作が繰返される。
次に1上記のようにしてめられた輪郭点座標系列から、
例えば第7図(a)に示すような文字検出走査始点Yが
読出しコントローラ′38にょ請求められる。そして請
求められた始点Yに基づいて、ビデオバッフ731内の
2値化化号Pに対して、第7図(b)に示すように縦方
向走査が右方向へ移動されるように行なわれる。これに
rh−1文字毎、の文字Iリーンが検出切出される。な
お、上記のような軌跡・量ターンの作成動作において、
2値化化号Pを一方向に一定距離移動して作成したが、
両方向に移動させて作成してもよい。
上記のようにして、文1に記録された各文字行に対応す
る軌跡・やターンQを作成し、この軌跡パターンQに基
づいて文字行の輪郭を検出する。この検出された輪郭(
輪郭点座標系列)に基づいて、ビデオバッファ31に格
納された2値化化号Pから1文字毎の文字パターンが検
出切出されることになる。したがって、行間隔。
行スキュー、文字サイズ及びフォント等のフォーマット
が異なる文字行が混在する文書の場合でも、確実に各文
字行を検出することができ、1文字毎の文字・やターン
を検出切出することかできる。
〔発明の効果〕
以上詳述したように本発明によれば、行間隔等が異なる
文字行が混在する比較的自由度の高いフォーマットの文
書の場合でも、各文字行を検出して1文字毎の文字を確
実に読取処理することができる。したがって、OCRに
適用した場合、文1中の文字を確実に認識することがで
き、また文字行単位のイメージデータを再編集する転記
または清書装置の入力装置として適用することができる
ものである。
【図面の簡単な説明】
第1図は従来のOCRの動作を説明するための図で同図
(−)は文書、同図(b)はヒストグラムを示す図、第
2図は自由度の高いフォーマットの文書の一例を示す図
、第3図は本発明の一実施例に係わる光学的文字入力装
置の構成を示すブロック図、第4図は第3図の装置の動
作を説明するための図で同図(a)は2値化パタ一ン信
号、同図(b)は軌跡・千ターンの一例を示す図、第5
図も同様に第3図の装置の動作を説明するための図で同
図(a)は文書、同図(b)は射影ヒストグラムの一例
を示す図、第6図は第3図の装置において文字行の輪郭
を検出するための動作を説明するための図、第7図は第
3図の装置において検出切出し動作を説明するための図
で、同図(a)・は軌跡・(クーン、同図(b)は2値
化パタ一ン信号の一例を示す図である。 30・・・光電変換部、3I・・・ビデオバッファ1、
? 2 、35・・・カウンタ、33・・・コン/9レ
ータ、34・・・軌跡・平ターンバッファ、36・・・
射影バッファ、37・・・書込みコントローラ、38・
・・読出しコントローラ。 出願人代理人 弁理士 鈴 江 武 彦第1図 (a) (b) 第2図 第3図 35 36 第4図 (a) Abcd e+ (b) 帰巳l 第5図 ・ (a) (b)

Claims (1)

  1. 【特許請求の範囲】 用紙上に記録された文字を光電変換して得られる2値化
    ・ぐターン信号を出力する光電変換手段と、この光を変
    換手段から出力される上記2値化パタ一ン信号を格納す
    るパターンバッファメモリ内 記2値化・やターン信号を平行移動して得られる軌跡パ
    ターンを作成する軌跡パターン作成手段と、この軌跡・
    やターン作成手段によシ作成された上記軌跡パターンを
    格納する軌跡・やターンバッファメモリと、この軌跡・
    母ターンバッファメモリ内を走査して文字行の輪郭を検
    出する検出手段と、この検出手段の検出結果でちる上記
    文字行の輪郭点座標情報に基づいて上記パターンバッフ
    ァメモリ内の2値化・ぐターン信号から1文字毎の文字
    ・やターンを検出切出する検出切出し手段とを具備して
    なることを特徴とする光学的文字入力装置。
JP59037506A 1984-02-29 1984-02-29 光学的文字入力装置 Granted JPS60181880A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59037506A JPS60181880A (ja) 1984-02-29 1984-02-29 光学的文字入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59037506A JPS60181880A (ja) 1984-02-29 1984-02-29 光学的文字入力装置

Publications (2)

Publication Number Publication Date
JPS60181880A true JPS60181880A (ja) 1985-09-17
JPH0557632B2 JPH0557632B2 (ja) 1993-08-24

Family

ID=12499411

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59037506A Granted JPS60181880A (ja) 1984-02-29 1984-02-29 光学的文字入力装置

Country Status (1)

Country Link
JP (1) JPS60181880A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63291185A (ja) * 1987-05-25 1988-11-29 Hitachi Seiko Ltd 文字列抽出方法
JPS63291184A (ja) * 1987-05-25 1988-11-29 Hitachi Seiko Ltd 文字列抽出方法
JPS63305482A (ja) * 1987-06-05 1988-12-13 Sumitomo Electric Ind Ltd 光学文字読取装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63291185A (ja) * 1987-05-25 1988-11-29 Hitachi Seiko Ltd 文字列抽出方法
JPS63291184A (ja) * 1987-05-25 1988-11-29 Hitachi Seiko Ltd 文字列抽出方法
JPS63305482A (ja) * 1987-06-05 1988-12-13 Sumitomo Electric Ind Ltd 光学文字読取装置

Also Published As

Publication number Publication date
JPH0557632B2 (ja) 1993-08-24

Similar Documents

Publication Publication Date Title
US4741045A (en) Optical character isolation system, apparatus and method
US5410611A (en) Method for identifying word bounding boxes in text
US4897880A (en) Data acquisition control method and system for a hand held reader
JPS63158678A (ja) 単語間スペ−ス検出方法
US3925760A (en) Method of and apparatus for optical character recognition, reading and reproduction
JPS6115284A (ja) 光学的文字読取装置
JPS60181880A (ja) 光学的文字入力装置
JP3160458B2 (ja) 文字読取装置及び文字読取方法
JPS5856076A (ja) 光学的文字読取装置
JPS6095689A (ja) 光学的文字読取装置
JPS60159985A (ja) 光学的文字読取装置
JP2578767B2 (ja) 画像処理方法
JP2578768B2 (ja) 画像処理方法
JPS62281091A (ja) パタ−ン情報認識方法
JPH04359393A (ja) 光学的文字読取装置
JPH0615327Y2 (ja) 光学式文字読取装置
JPS6327990A (ja) 文字認識方法
JPS5914078A (ja) 帳票読取装置
JPS62281088A (ja) 画像処理方法
JPS60159986A (ja) 光学的文字読取装置
JPH039506B2 (ja)
JPS62279482A (ja) 文字認識装置
JPS6227876A (ja) 文字読取装置
JPH04251395A (ja) 光学的文字図形読取装置
JPH01147784A (ja) 文字認識装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term