JPH0371380A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0371380A
JPH0371380A JP1208870A JP20887089A JPH0371380A JP H0371380 A JPH0371380 A JP H0371380A JP 1208870 A JP1208870 A JP 1208870A JP 20887089 A JP20887089 A JP 20887089A JP H0371380 A JPH0371380 A JP H0371380A
Authority
JP
Japan
Prior art keywords
character
font
fonts
character recognition
gothic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1208870A
Other languages
English (en)
Inventor
Mitsuru Kubota
満 久保田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP1208870A priority Critical patent/JPH0371380A/ja
Publication of JPH0371380A publication Critical patent/JPH0371380A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、文字認識装置に関する。
[従来の技術] 従来の文字認識装置においては、イタリック体専用また
は、明朝体・ゴシック体専用装置を用いた文字認識、ま
たは、使用者にフォントの種類を選択させることによる
文字認識、または、すべてのフォントの文字パターンデ
ータと比較することにより文字認識を行っていた。
[発明が解決しようとする課題] しかし、前述の従来技術では、各フォント専用の文字認
識装置を用いる場合、認識対象のフォントが限られるの
で汎用性が非常に少ない。
また使用者にフォントの種類を選択させる方法では、使
用者に負担がかかるなどの問題がある。また、フォント
を決定せずに抽出された文字と、あらかじめ所有してい
る文字パターンデータの全てと比較を行う場合では、時
間が非常にかかるという問題を有し、さらにすべての文
字パターンデータ(イタリック体および明朝体・ゴシッ
ク体)と比較を行うために、フォントの違いにより全く
別の文字が、同じようなデータをもつ可能性が生じ、誤
認識する。(例えば、ゴシック体のJとイタリック体の
tなど)。そこで、本発明は、以上のような問題点を解
決するもので、その目的とするところは、入力された画
像よりフォントを自動的に決定し、刻フォントに応じた
文字認識方法で効率よく、正確に文字を認識する文字認
識装置を提供することにある。
[課題を解決するための手段] 本発明の文字認識装置は、紙面等の反射光を光電変換し
て文書画像を入力する光学的画像入力手段と、前記抽出
された単語から一文字一文字を抽出しあらかじめ所有し
ている文字パターンデータとの比較を行うことにより、
一致度の最も高い文字コードに変換する文字認識手段と
を具備する文字認識装置において、イタリック体または
明朝体およびゴシック体のフォントを決定する手段を有
することを特徴とする。また、前記フォントを決定する
手段は行方向と垂直方向の周辺分布および行方向とある
傾きをもつ複数の周辺分布を調べることにより推定する
ことを特徴とし、また、前記文字パターンデータはフォ
ントの種類により分類されていることを特徴とする。
[実施例コ 以下本発明について実施例に基づいて詳細に示す。
本発明の文字認識装置のブロック図を禽1図に示す。文
字認識装置は、プログラムに従って処理を実行する0P
U1、文字画像を記憶装置に入力する画像入力装置2、
文字認識結果を表示する文字表示装置3、認識用の文字
データ辞書の納まりているROM4、文字画像を記憶す
る記憶装置であるRAM5より構成されている。
以下、本発明の文字認識装置の認識方法を第2図に示す
フローチャートに基づいて、第6図、第4図を用いて詳
細に説明する。
本発明の文字認識装置は、まず初めに画像入力装置にお
いて、光学的な方法により紙面等に書かれた文書をイメ
ージデータとして記憶装置であるRAM5に入力する6
゜次に入力した前記イメージデータから単語領域の抽出
を行う。単語領域の抽出はまず入力文字画像の文字方向
(行方向)の周辺分布を計数する7゜該周辺分布(図示
せず)は、文字行の存在する位置で値が大きくなり、文
字行と文字行との間は周辺分布の値が小さくなる。従っ
て、該周辺分布の値により文字行の位置が容易に推定で
きる。
次に入力画像の文字の行方向と垂直方向の周辺分布を計
数する8゜第3図(α)及び第3図(b)は、このよう
にして得られたイタリック体および明朝体(ゴシック体
)の文字の行方向と垂直方向の周辺分布図である。第3
図(α)に示すように明朝体(ゴシック体)は、単語お
よび文字間隔が明確であるのに対して、イタリック体は
第3図cb>に示すように分布図になまりがみもれ、単
語間隔および文字間隔が不明確である。
次に第4図(α)及び第4図(b)に示すように衾々の
画像を文字行方向とLαをたす斜め方向からの周辺分布
図を計数する9、第4図は、乙αをイタリック体の平均
的な傾きとしてとったものであり前記垂直方向とは反対
に第4図(OL)に示すように明朝体(ゴシック体)は
単語間隔および文字間隔が不明確となるのに対して、イ
タリック体の方は第4図Cb)に示すように明確となる
このように、垂直方向と斜め方向との周辺分布を計数し
、分布図の形状を調べることにより、フォントの種類を
決定できる1o、つまり行方向と垂直をなす方向からの
周辺分布図により単語9文字間隔が明確となるのが明朝
体(ゴシック体)であり、乙αの斜め方向か′らの周辺
分布図により明確となるのがイタリック体である。以上
の龜うにして、フォントの決定を行った後、該フォント
にあった方法で単語抽出11し、該単語より一文字−文
字の切り出し、さらに文字パターンデータとの比較を行
う12ことにより文字をコード化する。
文字パターンデータとの比較を行う際には、あらかじめ
フォントの種類が決定しているため、文字パターンデー
タなフォントの種類別に分類しそのフォントのデータの
みと比較することによりフォントの違う同じ様なデータ
に対する誤認識を防ぐことができ、認識に要する時間を
短くすることが可能である。
[発明の効果] 以上述べたように、本発明によれば、文字行と垂直方向
および乙αをなす斜め方向の周辺分布を調べることによ
り、フォントの種類を決定できる。
これにより、文字認識装置内部でのフォントの自動選択
が可能となり、使用者への負担が軽減できるようになっ
た。さらに、フォントが決定された後に、フォント別に
分類された文字パターンデータとの比較を行うことによ
り、フォントの異なる同じ様なデータに対する誤認識を
防ぐことができさらに認識時間を短縮できるという効果
を得る。
【図面の簡単な説明】
第1図に、本発明の文字認識装置のブロック図、第2図
に、本発明のフォント判断のフローチャート、第3図に
明朝体(ゴシック体)およびイタリック体の文字列の行
方向と垂直な方向で計数した周辺分布図、第4図に、斜
め方向で計数した周辺分布図を示す。 1 ・・・・・・・・・ CPU 2・・・・・・・・・画像入力装置 3・・・・・・・・・文字表示装置 4 ・・・・・・・・・ ROM 5・・・・・・・・・RAM 6・・・・・・・・・画像入力 フ・・・・・・・・・行方向周辺分布の計数8・・・・
・・・・・垂直方向周辺分布の計数9・・・・・・・・
・斜め方向周辺分布の計数0・・・・・・・・・フォン
トの決定 1・・・・・・・・・単語抽出 2・・・・・・・・・文字の認識 3・・・・・・・・・ゴシック体 4・・・・・・・・・ゴシック体の垂直方向周辺分布図
5・・・・・・・・・イタリック体 6・・・・・・・・・イタリック体の垂直方向周辺分布
図7・・・・・・・・・ゴシック体の斜め方向周辺分布
図(Zα) 18・・・・・・・・・イタリック体の斜め方向周辺分
布図(Lα) 以上

Claims (3)

    【特許請求の範囲】
  1. (1)紙面等の反射光を光電変換して文書画像を入力す
    る光学的画像入力手段と 前記入力画像から文字行および単語の位置を検知して単
    語を抽出する手段と 前記抽出された単語から一文字一文字を抽出しあらかじ
    め所有している文字パターンデータとの比較を行うこと
    により、一致度の最も高い文字コードに変換する文字変
    換手段とを具備する文字認識装置において イタリック体および明朝体・ゴシック体のフォントを決
    定する手段を有することを特徴とする文字認識装置。
  2. (2)前記フォントを決定する手段は、行方向と垂直方
    向の周辺分布および、行方向とある傾きをもつ複数の周
    辺分布を調べることにより推定することを特徴とする請
    求項1記載の文字認識装置。
  3. (3)前記文字パターンデータは、フォントの種類によ
    り分類されていることを特徴とする請求項1記載の文字
    認識装置。
JP1208870A 1989-08-11 1989-08-11 文字認識装置 Pending JPH0371380A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1208870A JPH0371380A (ja) 1989-08-11 1989-08-11 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1208870A JPH0371380A (ja) 1989-08-11 1989-08-11 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0371380A true JPH0371380A (ja) 1991-03-27

Family

ID=16563484

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1208870A Pending JPH0371380A (ja) 1989-08-11 1989-08-11 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0371380A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05242142A (ja) * 1991-11-19 1993-09-21 Xerox Corp 文書画像の復号なしに文書を要約するための方法
US10706337B2 (en) 2017-02-27 2020-07-07 Kyocera Document Solutions Inc. Character recognition device, character recognition method, and recording medium

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05242142A (ja) * 1991-11-19 1993-09-21 Xerox Corp 文書画像の復号なしに文書を要約するための方法
US10706337B2 (en) 2017-02-27 2020-07-07 Kyocera Document Solutions Inc. Character recognition device, character recognition method, and recording medium

Similar Documents

Publication Publication Date Title
US6643401B1 (en) Apparatus and method for recognizing character
US4903312A (en) Character recognition with variable subdivisions of a character region
US8059868B2 (en) License plate recognition apparatus, license plate recognition method, and computer-readable storage medium
Pal et al. Identification of different script lines from multi-script documents
JPH0950527A (ja) 枠抽出装置及び矩形抽出装置
JPH0371380A (ja) 文字認識装置
JPH02116987A (ja) 文字認識装置
JPH0350692A (ja) 文字認識装置
JP2917427B2 (ja) 図面読取装置
JPH03278290A (ja) 文字認識装置
JPH02230484A (ja) 文字認識装置
JPS6227887A (ja) 文字種分離方式
JPH0368093A (ja) 文字認識装置
JPH02141891A (ja) 接続文字の切出し方法
JP2993252B2 (ja) 同形異文字判別方法および装置
KR100317653B1 (ko) 대용량인쇄체문자인식을위한특징추출방법
KR910005385B1 (ko) 스트로크 근사 직선 추출에 의한 문자인식방법
JP2982221B2 (ja) 文字読み取り装置
JPH0281189A (ja) 文字認識方法
JPS63269267A (ja) 文字認識方法
JPH09282417A (ja) 文字認識装置
JPH0273484A (ja) 文字認識方法
JPH10214308A (ja) 文字判別方法
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
JP2578768B2 (ja) 画像処理方法