JPH02245887A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH02245887A
JPH02245887A JP1067265A JP6726589A JPH02245887A JP H02245887 A JPH02245887 A JP H02245887A JP 1067265 A JP1067265 A JP 1067265A JP 6726589 A JP6726589 A JP 6726589A JP H02245887 A JPH02245887 A JP H02245887A
Authority
JP
Japan
Prior art keywords
character
character line
line
standard
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1067265A
Other languages
English (en)
Inventor
Mikio Aoki
三喜男 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP1067265A priority Critical patent/JPH02245887A/ja
Publication of JPH02245887A publication Critical patent/JPH02245887A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野1 本発明は、紙面上に書かれた文字を画像として入力する
ことにより、文字画像から文字領域を捜し出し、コード
番号に変換する文字認識装置に関する。
〔従来の技術] 近年、文字認識装置の急激なる進歩により、さまざまな
文書画像から文字領域を自動的に抽出し、さらに一つ一
つの文字を切り出し、認識し、自動的に文書ファイルが
作成できるようになってきており、文字行の抽出方法に
はさまざまな方法が考え出されている。
例えば、文字画像の文字例をマークする方法がある。該
方法は、抽出文字列を蛍光ペン等でマークすることによ
り、反射率等の変化により領域を認識でき、文字列を抽
出することが可能となる。
しかしながら、このような方法は、走査上非常に面倒で
あるため一般にあまり用いられていない。
一般に多く用いられている方法に、文字画像の周辺分布
を計数する方法がある。該方法は、電子通信学会論文誌
183.1.VolJ66−D、No、1.P、P、1
11−118に掲載されている様に、入力画像のさまざ
まな方向の周辺分布を計数し1周辺分布の形状、ピーク
の大きさから入力画像の書式、傾きを検出する方法であ
る。
[発明が解決しようとする課題] 従来の方法においては、周辺分布を計数することによっ
て入力画像の傾きを検出し、後に文字行の位置を抽出す
る際に一つ問題があった0通常の文字画像の場合、文字
行方向の周辺分布を計数すると、行の存在する位置に対
応する部分には大きな数値の固まりがあり、行と行の中
間材に対応する部分は周辺分布の値が存在しない、従っ
て、周辺分布の値の存在する部分を捜すことによって文
字行の位置を推定することが可能となる。しかしながら
、文字画像はこの様に周辺分布の固まりがはっきり分か
れるものばかりでなく、第2図(a)に示す様な文字画
像においては、第2図(b)に示す様に周辺分布の固ま
りが連なってしまう場合が生じ、文字行の位置の推定が
不可能となる。
そこで1本発明は上記の課題を解決するもので、その目
的とするところは、周辺分布の固まりが連なった文字画
像からも正確に文字行の位置を推定する方法を提供する
ことにある。
〔課題を解決するための手段1 本発明の文字認識装置は、光字的画像入力手段により紙
面等に書かれた文字画像を読み取り、該読み取り画像中
の文字を認識し、コード番号に置き換える文字認識装置
において、文字行の切り出し時において ■文字行方向の周辺分布を計数し、 ■該周辺分布において、周辺分布の値の存在する位置は
文字行と判断し、存在しない位置は文字行間隔と判断し
て文字行の抽出を行い、■前記方法にて文字行の存在位
置を抽出できなかった場合には文字行と文字行間隔の判
断の基準となるしきい値を大きくして再度文字行の位置
の抽出を行い、 ■文字行の存在を確認するまで、上記繰り返しを文字行
の長さに応じて繰り返すことを特徴とする。
[実 施 例1 以下、本発明について実施例に基づいて詳細に説明する
本発明の文字認識装置は、第1図のブロック図に示す様
に、RAM7に文字画像のデータを読み込む画像入力装
置2.RAM7に入力された画像データをプログラムR
OM5中のプログラムに従って演算し認識を行うCPU
1.認識用の辞書の納まったフォント辞書ROM6、プ
ログラムROM5、フォント辞書RO6及びRAM8の
納まった記憶装置4、認識された結果を表示する認識結
果表示装置3より構成されている。
以下、本発明の文字認識装置の動作を第4図に示すフロ
ーチャートに基づいて詳細に説明する。
文字認識装置においては、先づ画像入力装置2によりR
AM7に文字画像が入力される。RAM7に入力される
文字画像は1画像入力装置2によるが通常の場合第3図
(a)に示す様な複数行の画像が入力される。もしここ
で、RAM7に入力された文字画像が傾いている可能性
のある場合には、さまざまな方向の周辺分布を計数する
ことによりそのピークの大きさより傾きが分かり、最終
的に第3図(a)のような水平な画像が得られる1次に
、文字行切り出し手段において、文字行方向の周辺分布
を計数する。第3図(a)の文字行方向の周辺分布を計
数すると、第3図(b)に示す周辺分布を得る。該周辺
分布においては、文字行の位置に相当する位置には値の
大きな固まりが存在し、文字行と文字行の中間部に相当
する部分には周辺分布の値は存在しない、従って、周辺
分布の固まり301〜307の存在する位置、すなわち
領域311〜317の領域は文字行の存在する位置と推
定できる。
ところが、文字画像は第3図(a)に示した様なものば
かりでなく、第2図(a)に示した様な文字画像も時と
して存在する。該文字画像第2図(a)は、文字画像中
に文字行と垂直な方向に線が入ったものである。従って
、該文字画像の行方向の周辺分布を計数すると第2図(
b)の様に。
文字行の周辺分布固まりが他の文字行の固まりと連って
一つの周辺分布の固まりを形成している。
従来の方法により該周辺分布より文字行の位置を推定し
ようとすると、周辺分布の固まりの境が存在しないため
に、一つ一つの行の抽出が不可能となる。そこで本発明
においては、この様な場合には、文字行と文字行間隔と
の判断の基準を大きくする。まず、判断の基準を位置2
20から位置221に動かす、該基準位置より周辺分布
の値が大きい部分を文字行、小さい部分を文字行間隔と
して文字行の位置を推定する。その結果基準位置221
においては文字行の位置の推定は不可能となる。そこで
次に基準位置を222に動かして文字行の推定を行い、
文字行の位置がみつかるまで基準位置を223.224
と動かして推定を試みる。そこ結果、文字行の領域21
1〜217の推定に成功する。またこの様な基準線の移
動の繰り返しは、通常の文書画像の場合基準線の位置が
文字行の長さのl/l O程度の大きさのところまで行
えば良く、1/!Oの大きさまでやってみつからない場
合には特別な文字画像、あるいは図形画像と判断しても
良い。
以上の様にして文字行の抽出が終了すると1次に該抽出
文字行の縦方向の周辺分布を計数し1文字間隔及び単語
間隔を推定することにより一つ一つの単語の抽出を行う
、単語の抽出が終了すると一つ一つの文字を切り出し、
フォント辞書ROM6中のフォント辞書と比較しながら
一文字一文字の画像をコード番号に変換する。こうして
変換された文字を認識結果表示装置3に出力して終了す
る。
以上の様に本発明によれば、文字行の垂直な方向に線が
入ったために文字行方向の周辺分布が連なってしまい文
字行の位置の推定が不可能な文字画像においても正確に
文字行の位置を推定することが可能となる。その結果、
今まで認識処理不可能であった文書画像においても認識
が可能となった。
[発明の効果] 以上述べた様に本発明により、文字認識装置の文字行切
り出し時において、行方向の周辺分布を計数した際に、
文字行と垂直な方向の線が存在したために文字行の位置
の推定が不可能となった文字画像からも、判断の基準を
移動して文字行の抽出を試みるので、今まで不可能であ
った文字画像からも正確に文字行の位置を推定すること
が可能となった。
またこの結果、文字認識装置の用途が広がり、信頼性も
向上する。
【図面の簡単な説明】
第1図に本発明の文字認識装置のブロック図。 第2図(a)(b)、第3図(a)(b)に本発明の文
字行抽出方法を示した図。 第4図に本発明の文字認識装置のフローチャートを示す
。 l ・ ・ ・ ・ ・ 2 ・ ・ ・ ・ ・ 3 ・ ・ ・ ・ ・ 4 ・ ・ ・ ・ ・ 5 ・ ・ ・ ・ ・ 6 ・ ・ ・ ・ ・ 7 ・ ・ ・ ・ ・ 201  ・ ・ ・ ・ ・ 211〜227 ・ 221〜224 ・ 301〜307 ・ 311〜317  ・ PLI 画像入力装置 認識結果表示装置 記憶装置 プロプラムROM フォント辞書ROM AM 周辺部 文字行領域 判断基準位置 周辺分布 文字行領域 以上 出願人 セイコーエプソン株式会社 代理人 弁理士 鈴 木 喜三部(他1名)第3図 負13 図 (b) 第2図(α) 第2図(し) 第4図

Claims (1)

  1. 【特許請求の範囲】 光字的画像入力手段により紙面等に書かれた文字画像を
    読み取り、該読み取り画像中の文字を認識し、コード番
    号に置き換える文字認識装置の文字行の切り出し時にお
    いて (a)文字行方向の周辺分布を計数し、 (b)該周辺分布において、周辺分布の値の存在する位
    置は文字行と判断し、存在しない位置は文字行間隔と判
    断して文字行の抽出を行い、 (c)前記方法にて文字行の存在位置を抽出できなかっ
    た場合には文字行と文字行間隔の判断の基準となるしき
    い値を大きくして再度文字行の位置の抽出を行い、 (d)文字行の存在を確認するまで、上記繰り返しを文
    字行の長さに応じて繰り返すことを特徴とする文字認識
    装置。
JP1067265A 1989-03-18 1989-03-18 文字認識装置 Pending JPH02245887A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1067265A JPH02245887A (ja) 1989-03-18 1989-03-18 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1067265A JPH02245887A (ja) 1989-03-18 1989-03-18 文字認識装置

Publications (1)

Publication Number Publication Date
JPH02245887A true JPH02245887A (ja) 1990-10-01

Family

ID=13339959

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1067265A Pending JPH02245887A (ja) 1989-03-18 1989-03-18 文字認識装置

Country Status (1)

Country Link
JP (1) JPH02245887A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9432571B2 (en) 2013-02-21 2016-08-30 Brother Kogyo Kabushiki Kaisha Storage medium and control device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9432571B2 (en) 2013-02-21 2016-08-30 Brother Kogyo Kabushiki Kaisha Storage medium and control device

Similar Documents

Publication Publication Date Title
EP0854434B1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
JP2822189B2 (ja) 文字認識装置及び方法
JPS63216189A (ja) 文字認識方法
JP3411472B2 (ja) パターン抽出装置
JP2554187B2 (ja) 基本ライン抽出方法
JPH02245887A (ja) 文字認識装置
JP2000090194A (ja) 画像処理方法および画像処理装置
JP2993252B2 (ja) 同形異文字判別方法および装置
JP2788506B2 (ja) 文字認識装置
JP2728086B2 (ja) 文字切り出し方法
JPH01281585A (ja) 文字行切り出し方法
JPS59158482A (ja) 文字認識装置
JPH0354684A (ja) 文字認識装置
JPH0371380A (ja) 文字認識装置
JP2612383B2 (ja) 文字認識処理方式
JP3344069B2 (ja) 文字切り出し装置
JPH04130979A (ja) 文字画像切出し方法
JPH0452782A (ja) 文字読み取り装置
JPH07262314A (ja) 手書き文字切り出し回路
JPH0350689A (ja) 文字認識装置
JP2728085B2 (ja) 文字切り出し方法
JPH02199595A (ja) 文字切り出し手段
JPH01265378A (ja) 欧文文字認識方式
JPH08339424A (ja) 画像処理装置及び方法
JPH01270183A (ja) 文字認識装置