JPH02116987A

JPH02116987A - 文字認識装置

Info

Publication number: JPH02116987A
Application number: JP63269365A
Authority: JP
Inventors: Kaoru Suzuki; 薫鈴木
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1988-10-27
Filing date: 1988-10-27
Publication date: 1990-05-01

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】［発明の目的］（産業上の利用分野）この発明は文字行を含む文書などから文字行を切出し、
その文字行の傾きを検出する操作を行なう文字認識装置
に関する。

（従来の技術）各種文書に記載された文字を自動読取りする文字読取装
置では、文書中から各文字を切出してパターン認識技術
に基づいて各文字を認識する文字認識装置が使用される
。

その種の文字認識装置は、人カバターンと予め用意され
た辞書との間のパターン照合処理を基本とするものであ
った。

しかしながら、人カバターンが傾いていると、正しいカ
テゴリの辞書パターンをあてはめても類偏度が十分大き
くならないため、誤ったカテゴリと対応付けられること
があり、このために認識率が低下するという問題点があ
った。

また、自由書式の文書を読取るためには、縦書き、横書
き、斜め書きなどに対処することが必要となるが、この
際にも文字行の回転を検出する必要があった。

さらに、文字パターンだけでは識別できない文字、例え
ばｒｓＪとｒｓＪ、「、」と「°」、「つ」と「っ」の
ような文字については、その大きさや位置についての評
価が必要であるが、この際にも文字行の傾きが補正され
ていれば、評価の基準を文字パターンの上端、下端位置
に基づいて設定できるため、便利である。

従って、高度の文字認識装置を実現するためには、文字
行の傾きを検出することが重要な課題となる。

そこで、例えば、特開昭６１−１６０１８０号に示され
るように、文字列を構成するパターン列を複数方向から
投影して得られる複数の１次元ヒストグラムより当該文
字列の傾きを求める方式も提案されている。

しかしながら、この方式では、パターン列を構成する全
ての画素を対象としなければならないこと、傾き検出の
精度を向上させるためには、多くの方向についてヒスト
グラムを作成、分析しなければならないことなどにより
、精度の向上を図ろうとすると処理コストが著しく増加
する傾向があった。

また、例えば、特公昭６１−２９９５号に示されるよう
に、文字列ブロックのぼかしパターンを最小２乗近似し
て得られる直線の傾きを文字列の傾きとする方式も提案
されている。

しかしながら、この方式では、ぼかしパターンを使用す
ることにより文字列を構成する文字の大きさのばらつき
の影響を除くことには成功するが、ぼかしパターンを用
いるため、傾き検出の精度が上がらないという問題点が
あった。

（発明が解決しようとする課題）このように、従来の文字行の傾き検出が可能な文字認識
装置では、傾き検出の処理コスト低減と高精度との両立
が図れないという問題点があった。

この発明は、このような従来の問題点に鑑みてなされた
もので、文字行の傾き検出に十分な精度があり、かつそ
のための処理コストも低いものとすることのできる文字
認識装置を提供することを「１的とする。

［発明の構成］（課題を解決するための手段）この発明の文字認識装置は、文字行を含む画像データの
入力手段と、この入力手段の画像データから文字行を抽
出する文字行抽出手段と、この文字行抽出手段の抽出し
た文字行から各文字を切出す文字切出し手段と、この文
字切出し手段が切出す各文字についてその特定の位置を
通る任意の直線を想定し、この直線を規定するパラメー
タの組についてパラメータ空間上のヒストグラムを求め
、ヒストグラムの最開度を与えるパラメータの組が規定
する直線を基準線として抽出すると共に−その基準線の
傾きを文字行の傾きとする基準線抽出手段とを備えたも
のである。

また、前記基準線抽出手段として、Ｈｏｕｇｈ変換によ
り文字行の基準線を抽出するものを用いることができる
。

さらに、前記基準線抽出手段として、各文字の下端部を
代表する点を用いて基準線を抽出し、それをベースライ
ンとするものを用いることができる。

（作用）この発明の文字認識装置では、文字行抽出手段により文
字行を含む画像データから文字行を切出し、文字切出、
し手段により切出された文字行から各文字を切出し、さ
らに基準線抽出手段により、切出された各文字に関連す
る特定の位置を通る直線を想定し、この直線の取り得る
パラメータについてパラメータ空間上のヒストグラムを
求め、このヒストグラムに基づいて当該文字行の傾きを
抽出することができる。

また、この発明の文字認識装置では、基■線抽出手段に
Ｈｏｕｇｈ変換手段を利用し、各文字の特定の位置を代
表する点を通る任意の直線についてこのＨｏ　ｕ　ｇｈ
変換によりパラメータの組を求め、パラメータ空間上で
各文字の代表点ごとにその点を通る直線についてのパラ
メータの組のヒストグラムを求め、このパラメータ空間
上のヒストグラムの最頻度を与えるパラメータの組を基
準線として抽出し、その傾きを求めることができる。

さらに、この発明の文字認識装置では、基準線抽出手段
により各文字ごとの下端部の位置について基準線を抽出
し、それをベースラインとすることができる。

（実施例）以下、この発明の実施例を図に基づいて詳説する。

第１図はこの発明の一実施例を示しており、入力手段１
と、この入力手段１からの画（象データをもとに文字行
を抽出する文字行抽出部２と、抽出された文字行から各
文字を切出す文字切出し部３と、文字行の基準線とその
傾きを抽出する基準線抽出部４と、この基準線抽出部４
において得られた基準線をもとに各文字の種類を分類す
る分類部５と、文字パターンの認識部６と、この文字パ
ターン認識部６におけるパターン認識のための文字分類
区分別パターン照合用辞書７と、出力手段８とで構成さ
れている。

上記の構成の文字認識装置の動作について、次に説明す
る。

前記入力手段］は、例えばラインイメージセンサを備え
たスキャナにより構成され、読取るべき文書を読取って
、文書画像データを出力する。

前記文字行抽出部２は、入力手段１から与えられた文書
画１象データから、例えば黒画素を横方向へ延長してつ
ながる部分は１つの文字行であるとラベリングし、その
文字行を抽出する。

前記文字切出し部３は、上記の文字行抽出部２で抽出さ
れた文字行から各文字を、黒画素の連続している部分を
１文字としてラベリングして切出し、各文字についてそ
の文字パターンとその外接矩形とを別々に出力する。

前記基準線抽出部４では、後に詳説するように一連の文
字外接矩形から、文字行の傾きと基準線を抽出する。

分類部５は、基準線抽出部４により抽出された基準線に
対する各外接矩形の°位置と大きさとに基づいて文字を
分類する。

パターン認識部６は、必要な場合には文字の傾きを補正
した後、各文字の上記分類部５による分類結果に基づき
、文字分類区分別パターン照合用辞書７のうちパターン
照合に使用すべき辞書パターンを選択して、文字切出し
部３で切出された文字パターンとの間でパターン照合処
理を行ない、この照合処理により得られた認識結果を出
力手段８を介して出力する。

次に、基準線抽出部４と分類部５との動作について、さ
らに詳細に説明する。

これらの各部４．５において、入力文字が第２図に示す
ように１０個のカテゴリに分類される。

すなわち、基帛文字１１、アセンダ文字１２、デイセン
ダ文字１３、上下突出文字１４、上付き微小文字１５、
下付き微小文字１６、中央付近微小文字１７、巨大文字
１８、上付き文字１９、下付き文字２００１０個に分類
されるのである。

そのために、基準線抽出部４は、１文字行分の文字外接
矩形を入力として、第３図に示す処理に従って各文字を
前記１０個のカテゴリに分類するのに必要な大きさの基
準と基弗線とを求める。

まず下端ボーティングステップ３１では、各文字の特定
位置としてのＦ端位置を代表する点をその外接矩形の左
下端とし、この点を通る全ての直線を各々定義するパラ
メータを求める。

つまり、第４図に示すように任意の直線りを定義するパ
ラメータの組（θ、ρ）は、次式で与えられる。

ρ−ｘ”ｃｏｓθ＋ｙ＊ｓｉｎθ （θ　：　０　≦　θ　≦　２　π）そこで、θとρとの組によって張られるパラメータ空間
を定義し、各代表点についてθに応じたρを１１算し、
このθとρとの組により指定されるパラメータ空間上の
点の値を１増やすこと、つまリＨｏｕｇｈボーティング
を行なう。尚、このとき、θの値がある狭い範囲に限定
されるならば、計算量を大幅に削減できる。例えば、文
字行がほとんど水平に近い場合には、θの値の範囲はπ
／２付近に限定できる。

１文字行中の全ての文字について、以上の操作を行なう
と、ある直線についてそのパラメータにより指定される
パラメータ空間上の点の持つ度数は、その直線の通過す
る代表点の数に等しくなる。

すなわち、多くの代表点を通過する直線はどその直線に
対応したパラメータ空間上の点の度数が高くなるのであ
る。

Ｈｏｕｇｈボーティング後のパラメータ空間の例を第５
図に示すと、同図（ｂ）の曲線Ｑ＋、Ｑ２、Ｑ３．Ｑ４
それぞれは同図（ａ）における代表点Ｒ＋　　（ｘ＋　
、）’ｌ　）、Ｒ２（Ｘ２．Ｖ２）。

Ｒ３（Ｘ３．ｙ３）、Ｒ４（Ｘ４．Ｙ４）それぞれにお
ける直線を規定するパラメータ（θ、ρ）の組の描く軌
跡である。そこで、ｘｙ空間中の代表点Ｒ，，Ｒ２、Ｒ
３、Ｒ４についてこの曲線、を求めると、パラメータ空
間上で互いに交差する点Ｐ　Ｉ　、Ｒ２＋　　Ｒ３が現
れるが、これらはｘｙ空間で複数の代表点を通る共通の
直線があることを示しており、パラメータ空間上で２本
の曲線が交差する場合にはｘｙ空間上で２つの代表点の
間に共通の直線があることを示し、パラメータ空間上で
３本の曲線が同一点で交差する場合にはｘｙ空間上で３
つの代表点の間に共通する直線があることを示している
。

従って、第５図の場合、パラメータ空間上の交点Ｐ１は
、曲線Ｑ＋　、Ｑ２　、Ｑ：］の３本の曲線が交差して
いる点てあり、ｘｙ空間上で３つの代表点Ｒ，，Ｒ２、
Ｒ３を通る共通の直線り、が存在することを示している
。またパラメータ空間上の交点ｐ２．ｐ３．ｐ４はそれ
ぞれ曲線Ｑ３とＱ４、曲線Ｑ２とＱ４、曲線Ｑ＋　とＱ
４がそれぞれ交差する点であり、ｘｙ空間上の代表点Ｒ
３とＲ４、代表点Ｒ２とＲ４、代表点Ｒ１とＲ４それぞ
れを通る共通の直線Ｌ２．Ｌ３．Ｌ４が存在することを
示している。

従って、ｘｙ空間上で多くの代表点を通過する共通の直
線が存在する場合、パラメータ空間上では多くの曲線が
同時に交差する１点が存在することになる。

そこで、乗用推定ステップ３２では、座標系に対する文
字行の傾き角（重色）の値とベースラインを推定する。

一般に文字行の傾きに一致した重色をもつ直線が最も多
くの代表点を通過すると考えられるので、パラメータ空
間上で最大度数を持つ点を発見し、その点のθの値を求
めることにより文字行の傾きを推定するのである。

特に英文の場合には、最も出現頻度の高いアセンダ文字
と基準文字とがその下端を共有するので、最大度数を持
つ点により与えられる直線はこれらの文字種の下端をな
ぞるベースラインであると考えることができる。このこ
とにより、まず下端に関するＨｏｕｇｈボーティングを
行なうのである。

例えば、第５図に示した例の場合には、３つの曲線が交
差する点Ｐ１が最も度数の高い点であり、その座標（θ
ず、ρＩ）から文字行の傾きとベースラインの式を得る
ことができる。このベースラインと文字行の傾きとの関
係は第６図に示すようになる。

次に傾き補正ステップ３３を行なうが、これは文字外接
矩形の高さ位置を文字行の傾きと矩形の横位置によって
決まる量だけ高さ方向にシフトさせる補ｉＥであり、こ
の操作により文字行は水（１悄こ補正される。そして、
以後の処理は傾き補ＩＥ文字行について行なわれる。

文字クラスタリングステップ３４では、入力文字外接矩
形の上下幅、上端高さ位置、下端高さ位置それぞれの傾
き補正後の値について、同様の性質を持つ文字同士をま
とめて１つのクラスとする。

続いて、各クラスをその構成文字の下端がベースライン
より上方に位置するグループ１、ベースライン上に位置
するグループ２、ベースラインより下方に位置するグル
ープ３の３つに分類する。

この結果、グループ１には上付き微小文字、中央付近微
小文字、上付き文字が含まれ、グループ２には基僧文字
、アセンダ文字、下付き微小文字の一部、巨大文字が含
まれ、グループ３にはデイセンダ文字、上下突出文字、
下付き微小文字の一部、巨大文字、下付き文字が含まれ
ることになる。

第８図を参照して、次のＬＭＩＮ推定ステップ３５では
、前記グループ２に属する文字の上下幅の平均を求めて
、この値のａ％（ａ＞１００％）の大きさＬＭＩＮを巨
大文字の上下幅を最小値とする。従って、入力文字中に
このＬＭＩＮ以上の上下幅を持つ文字があれば、それを
巨大文字と決定する。

ＳＭＡＸ推定ステップ３６では、前記グループ２に属す
る文字のうち巨大文字を除く文字の上下幅の平均を求め
て、この値のｂ％（ｂ、１００％）の大きさＳＭＡＸを
微小文字の上下幅の最大値とする。従って、入力文字行
中に上下幅がこの値以下のものがあれば、それを微小文
字と決定する。

ＡＮライン推定ステップ３７では、巨大文字と微小文字
を除くグループ２の文字クラスを基僧文字とアセンダ文
字に分解する。巨大文字と微小文字を除くグループ２の
文字の上端高さ位置の平均を求め、この値を基準文字と
アセンダ文字とを分ける水平な基準線ＡＮの高さとする
。もし、巨大文字と微小文字を除くグループ２の文字が
唯１つのクラスから成る場合には、ＡＮを文字行の最上
端の高さ位置と定義する。

ＤＮライン推定ステップ３８では、巨大文字と微小文字
とを除くグループ３の文字の下端高さ位置のうち最も上
にあるものの値とベースラインＢの高さ位置との平均を
求め、この値を基中文字とデイセンダ文字とを分ける水
平な基準線ＤＮの高さとする。もし、巨大文字と微小文
字を除くグループ３の文字が存在しない場合には、ＤＮ
を文字行の最下端の高さ位置に定義する。

Ｎライン推定ステップ３９では、巨大文字と微小文字と
を除くグループ２の文字のうち、その上端がＡＮライン
以下に位置する文字を選択し、その上端高さ位置のうち
最も度数の多いものを基準文字ラインＮの値とし、この
ＮとベースラインＢとの間の距離をＴＭＡＸとする。

上付き・下付き判定ライン推定ステップ４０では、ＴＭ
ＡＸの０％（Ｃ＜１００％）の値をＸとして、ＹＵをＮ
から下方にＸだけ下がった位置に、またＹＬをベースラ
インから上方にＸだけ上がった位置に各々定義する。さ
らに基準文字ラインＮとベースラインＢとの中間の線を
文字行の中心線Ｃとし、ＹＭＵを中心線Ｃから下方にＸ
だけ下がった位置に、またＹＭＬを中心線から上方にＸ
だけ上がった位置に各々定義する。

このようにして基準線抽出部４は種々の基準線を定義す
るのである。

次に分類部５の動作について説明する。

この分類部５は基準線抽出部４で求めたＬＭＩＮ、ＳＭ
ＡＸ、ＴＭＡＸ、及び９本の基準線、つまりベースライ
ンＢ、ＡＮ、ＤＮ、Ｎ、ＹＵ、ＹＬ１中心線ＣＳＹＭＵ
１ＹＭＬのうちのＬＭ　Ｉ　Ｎ。

ＳＭＡＸＳＡＮ、ＤＮ、ＹＵＳＹＬ、ＹＭＵＳＹＭＬを
用いて１文字ごとに文字を分類する。

第７図に分類部５のフローチャートが示されているが、
このフローチャートと第８図とを参照して、巨大文字分
類ステップ５１ては、入力文字外接矩形の上下幅がＬＭ
ＩＮ以上の場合には入力文字を巨大文字と判定する。

微小文字分類ステップ５２では、上記巨大文字分類５１
に該当しなかった文字について、その外接矩形の上下幅
がＳＭＡＸ以下の場合には、この文字を微小文字として
上付き、下付き、中央付近のいずれであるかを判定する
。この判定は、以下による。

ｉ、入力文字の上端がＹＵより上方に、かつ下端がＹＭ
Ｕより上方にある場合には、入力文字を上付き微小文字
と判定する。

ｌｉ１入力文字の上端がＹＭＬより下方に、かつ下端が
ＹＬより果報にある場合には、入力文字をした付き微小
文字と判定する。

ｉ　ｉ　＊、上記２つのいずれかにも該当しない場合に
は、入力文字を中央付近微小文字と判定する。

基皇文字分類ステップ５３では、上記各分類ステップ５
１．５２に該当しない文字について、その上端がＡＮ以
下に位置し、かつ下端がＤＮ以上に位置する場合には、
入力文字を基準文字と判定する。ただし、ＡＮが入力文
字行の最上端に定義されている場合には、このカテゴリ
が基準文字であるのか、アセンダ文字であるのか識別で
きないので、この後に続くパターン認識部６において、
基準文字とアセンダ文字との両方のパターン照合用辞書
７を用いてパターン照合を行なうようにする。

上端突出文字分類ステップ５４では、上記分類ステップ
５１〜５３に該当しない文字について、その上端がＡＮ
より上方に位置し、かつ下端がＤＮ以上に位置する場合
には、この文字を上端が突出している文字であるとして
、アセンダ文字、上付き文字の判別を行なう。この判別
は、以Ｆに条件により行なう。

ｉ０入力文字の下端がＹＭＵ以上に位置する場合には、
入力文字を上付き文字と判定する。

１１、上記に該当しない場合には、入力文字をアセンダ
文字と判定する。

下端突出文字分類ステップ５５では、上記分類５１〜５
４に該当しなかった文字について、そ°の上端がＡＮ以
下に位置し、かつ下端がＤＮより下に位置する場合には
、この文字を下端が突出している文字であるとしてデイ
センダ文字、下付き文字の判別を行なう。この判別は、
以下による。

１、入力文字の上端がＹＭＬ以下に位置する場合には、
入力文字を下付き文字と判定する。

１１、上記に該当しない場合には、入力文字をデイセン
ダ文字と判定する。

上下突出文字分類ステップ５６では、上記分類ステップ
５１〜５５に該当しなかった文字について、その上端が
ＡＮより上に位置し、かつ下端がＤＮより下方に位置す
る場合には、この文字を上下突出文字と判定する。

以上の処理により、文字行を構成する各文字はその位置
と大きさに関して上述の１０種のカテゴリに分類される
。

以上で求めた文字分類結果と文字行の傾き情報とは、第
１図のパターン照合部６に与えられる。

パターン照合部６では、必要ならば入カバターンの傾き
を補正した後、文字分類区分別パターン照合用辞書７の
うち、与えられた文字分類結果で示されるカテゴリに対
応した分類区分のパターン照合辞書だけを用いてパター
ン照合を行なう。尚、各分類区分に属する文字の例を以
下に示す。

［基準文字］・・・　　　　ｒａＪ、ｒｃＪ、ｒｅＪな
どの背の低い小文字、英記号の一部。

［アセンダ文字］・・・　　ｒＡＪ、ｒＢＪ、ｒＣＪな
どの大文字、ｒｂＪ、ｒｄＪ、ｒｆＪなどの背の高い小
文字、数字、記号の一部。

［デイセンダ文字］・・・　ｒｇＪ、ｒｐＪ、ｒｑＪな
どの下に突き出した小文字、英記号の一部。

［上下突出文字］・・・　　小文字「ｊ」、及びｒ／Ｊ
、ｒ　（Ｊ、ｒｌ　Ｊなどの英記号の一部。

［上付き微小文字］・・・　「″」、「”」などの英記
号の一部。

［下付き微小文字］・・・　ｒ、Ｊ、ｒ、Ｊなどの英記
号の一部。

［中央付近微小文字］・・・ｒ−Ｊ、ｒ・」などの英記
号の一部。

［巨大文字］・・・　　　　特に大きい文字で、数行に
跨がっているものもある。主に大文字である。

［上付き文字］・・・　　　通常の位置より上にずれて
印字されている文字。アルファベット、数字、記号を含
む。

［下付き文字］・・・　　　通常の位置より下にずれて
印字されている文字。アルファベット、数字、記号を含
む。

この結果、当該文字に比べて大きさ、位置の異なる文字
についてのパターン照合処理を省くことができ、形だけ
では難しい文字の区別とパターン照合の省力化を実現す
ることができる。このとき、同じ文字であってもフォン
トの違いなどにより複数の分類カテゴリに属する文字は
、その属する全てのカテゴリのパターン照合用辞書に登
録しておくことが必要である。

尚、この発明は上記の実施例に限定されるものではなく
、次のような実施例も可能である。

例えば、パラメータ空間上のヒストグラムを行の傾きを
検出するためだけに用いてもよく、特、に文字の分類に
のみに利用するのではなく、様々に応用することができ
る。

また、文字行から抽出されたベースラインに基づいて、
行ピッチの検出、行の比較、統合、分類などの処理を行
なうようにしてもよい。すなわち、隣接した２つの文字
行のベースライン同士の距離を求めれば隣接行間の距離
、つまり行ピッチが得られる。一定の行ピッチで連続し
ている箇所については、同一内容が記述されたいると判
断して、その内容を統合することが可能である。また、
行方向に隣接した行のベースライン同士の位置の差やピ
ッチの差が同程度の行についても同一の行に統合するこ
とができる。

さらに、この発明は１行分の情報のみならず、複数行の
情報を用いて同様の処理を行なってもよい。例えば、初
めに１行ないし数行に関して求めた文字行の傾きから、
次回のＨｏｕｇｈ変換のための平角の値の範囲を大幅に
限定できるので、処理時間を節減することができる。

加えて、ベースライン抽出後、傾きを補正しないまま、
外接矩形上端に関するＨｏｕｇｈボーティングを行なう
ことによって直接的に残りの基準線を抽出してもよい。

さらに上記実施例ではＨｏｕｇｈ変換により各文字の代
表点における任意の直線を規定するパラメータの組につ
いてパラメータ空間上でヒストグラムを取るようにした
が、他のパラメータ変換法を用いてもよく、数学的な処
理手順は限定されることはない。例えば、第９図（ａ）
のように各文字の代表点としての外接矩形の左下端点Ｒ
ＩＲ２、Ｒ３、・・・、Ｒｎのｎ個の点について、各々
２点を結ぶ線分Ｒ，Ｒ２、Ｒ，Ｒ３、Ｒ，Ｒ４。

−、Ｒｎ−Ｉ　Ｒｎの（ｎ−１）／２本をすべて求め、
これらについてそのパラメータ（θ、ρ）を計算する。

そして１、このパラメータの組を同図（ｂ）のようにパ
ラメータ空間上にｐ、、ｐ２．ｐ３゜・・・、とボーデ
ィングし、パラメータ空間上で最大度数の得られるパラ
メータの組、実施例の場合に１；ｉＰ、（θ丁、ρ１）
を見出すことによりベースラインを決定することができ
る。

またさらに、各文字についてその代表点とじて外接矩形
の左下端を用いたのは英字の場合には右上がりの文字が
多く見られるためであるが、この代表点の選び方も特に
限定されることはなく、外接矩形に限らず外接円の最下
端位置や各文字自体の最下端位置などを代表点とするこ
ともできる。

［発明の効果］以上のようにこの発明によれば、文字画像データから文
字行を抽出し、抽出された文字行から各文字を切出し、
基準線抽出手段により文字行の各文字の特定点における
任意の直線を表わすパラメータの組についてそのパラメ
ータ空間上でヒストグラムを取り、ヒストグラム上の最
頻度を与えるパラメータの組が規定する直線を基皇線と
し、その基準線の傾きを求めるようにしているため、文
字行を含む画像データの収集のために高度な画像入力手
段を用いる必要がなく、比較的少ない画像データから文
字行の傾きを割り出すことができ、処理コストを低く抑
えることがてき、しがちパラメータ空間上でヒストグラ
ムを取って基準線の傾きを最頻度点のパラメータの組か
ら決定するために精度高く文字行の傾きを求めることが
できる。

【図面の簡単な説明】

第１図はこの発明の一実施例のブロック図、第２図は上
記実施例により分類される文字の種類を示す説明図、第
３図は上記実施例における基準線抽出部の処理動作を示
すフローチャート、第４図は上記実施例におけるＨｏｕ
ｇｈ変換のｘｙ座標、θρ座標間の関係を示す説明図、
第５図（ａ）。（ｂ）は上記実施例におけるｘｙ座標空間上の直線群と
Ｈｏｕｇｈ変換したθρ空間上の曲線群それぞれを示す
説明図、第６図は上記実施例における文字行の傾き抽出
動作を示す説明図、第７図は上記実施例における分類部
の動作を示すフローチャート、第８図は上記実施例にお
ける文字種の分類のための基準線と各文字カテゴリとの
関係を示す説明図、第９図はこの発明の他のパラメータ
変換方法を説明する説明図である。１・・・入力部　　　　　２・・・文字行抽出部３・・
・文字切出し部　　４・・・基準線抽出部５・・・分類
部　　　　　６・・・パターン認識部・・文字分類区分
別パターン照合用辞書８・・・出力手段

Claims

【特許請求の範囲】

（１）文字行を含む画像データの入力手段と、この入力
手段の画像データから文字行を抽出する文字行抽出手段
と、この文字行抽出手段の抽出した文字行から各文字を
切出す文字切出し手段と、この文字切出し手段が切出す
各文字についてその特定の位置を通る任意の直線を想定
し、この直線を規定するパラメータの組についてパラメ
ータ空間上のヒストグラムを求め、ヒストグラムの最頻
度を与えるパラメータの組が規定する直線を基準線とし
て抽出すると共にその基準線の傾きを文字行の傾きとす
る基準線抽出手段とを備えて成る文字認識装置。
（２）前記基準線抽出手段は、Ｈｏｕｇｈ（ハフ）変換
により文字行の基準線を抽出することを特徴とする請求
項１に記載の文字認識装置。
（３）前記基準線抽出手段は、各文字の特定の位置とし
て各文字の下端部を代表する点を用いて基準線を抽出し
、これをベースラインとすることを特徴とする請求項１
または２に記載の文字認識装置。