JPH01124082A

JPH01124082A - 文字認識装置

Info

Publication number: JPH01124082A
Application number: JP62283501A
Authority: JP
Inventors: Zuiseki Ro; 呂　瑞鉐; Biei Chin; 陳　美瑛; Inchiyuu En; 袁　允中; Toshihiro Hayashi; 俊宏林
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1987-11-10
Filing date: 1987-11-10
Publication date: 1989-05-16

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】産業上の利用分野本発明はまず電子計算機により原稿の文字を高い精度で
切り出し、次に文字パターンをマツチング計算（照合計
算）することにより、文字を認識する文字認識装置に関
するものである。

従来の技術近年よりパーソナル・コンピュータやワートプロセッザ
が事務所や一般家庭に普及するようになり、いわゆるオ
フィス・オートメーション（０ｆｆｉｃｅ　　Ａｕｔｏ
ｍａｔｉｏｎ　　）やホーム・オートメーション（Ｈｏ
ｍｅ　八ｕｔｏｍａｔｉｏｎ　　）の潮流をもたらした
。しかし、現在のパーソナル・コンピュ、−夕やワード
・プロセッサは、まだ、ギーボードによるデータの入力
にたよっている。ギーボートで入力する方式は、入力速
度がおそいことと、オペ−レータの倦怠感が起こり易い
という欠点があった。このために、高速度で取扱い易い
入力方式の開発が要望されている。この発明による文字
認識装置は、上記の要望を満すことができるように発明
されたものである。

第２図は、従来の文字認識装置を示すブロック図である
。同図において、１０は、例えば、イメージ・スキャン
ナで原稿を走査し、その原稿にある白点を”　ｏ　”、
黒点を”１″とするバイナリ・データ（Ｂｉｎａｒｙ　
Ｄａｔａ　）に変換したのちに、それをバッファ・メモ
リ部に貯蔵するためのイメージ・データ入力手段であり
、２０はバッファ・メモリ部に貯蔵されたバイナリ・デ
ータを検査し、各文字並びになった文字列の位置座標を
検査して各文字の位置座標を検出して記録する文字列切
り出し手段である。３０は上記各文字列の範囲にあるバ
イナリ・データを検出して記録する文字切り出し手段で
あり、４０は切り出した上記各文字を解析し、例えばそ
の周辺特徴を計算して識別用の特徴を抽出する特徴抽出
手段である。５５は、上記入力された文字と比較するた
めに各識別文字の特徴、例えばその周辺特徴がメモリ部
に貯蔵されている標準文字パターンである。５０は、上
記特徴抽出手段４０からの文字特徴と、上記標準文字パ
ターン５５からのすべての文字の特徴とを逐一比較して
その距離を求め、距離のうちで最も小さいものを認識結
果にする比較手段である。６０は上記認識結果を端末デ
゛イスプレイなどの表示装置に表示する出力手段である
。

文字認識装置においては、文字切り出しが極めて重要な
前処理であり、文字切り出しに際し、もしエラーが生ず
るき、その次の識別が必然的に不正確となるからである
。そして、第２図に示す一般の文字認識装置における文
字切り出し手段３０は、例えば、昭和６１年度日本電子
通信学会総合全国大会で、発表された「文書清書システ
ムの第２部、文字切り出しアルゴリズム」に記載された
ようなものがあるが、それは、文字のヒストグラムが用
いられている。第３図に示すように、まず文字列の横軸
に投影されたヒストグラム量を計算し、そのヒストグラ
ム量がしきい値（スレッシュボールド）を超過したとこ
ろは、文字があることを表わし、ヒストグラム量がしき
い値よりも低いところは、文字間の分離点を表わす。ま
た、例えば、日本国の特公昭６０−５３９１６号には、
文字の各要素における外接四角形のパラメタの計算、比
較、組合せなどの手法により、文字を切り出す方法が開
示されており、正書体文字の「八」なとのような分離部
のある文字を切り出すことができるが、第４図に示すよ
うな斜書体（１ｔａ−ｌｉｅ　　）や、複数の文字が結
合している連結文字に対しては、やはり正確に切り出す
ことができないという欠点があった。

発明が解決しようとする問題点すなわち、上記従来の文字のヒストグラム量による文字
切り出し手段は、字と字との間のヒストグラム量の変化
が激しい正書体文字、すなわち正規フォントの切り出し
に対して確かに有効であるが、斜書体文字、例えば第４
図に示したように、文字と文字との間にヒストグラムが
重なり合っている斜書体文字或いは連結文字に対しては
、ヒストグラム量による文字間の切り出しく分離点）を
判断することができなくなる。これは、ヒストグラム量
による文字を切り出す方法の致命的な欠点である。

本発明は上記問題点に鑑み、精度高く文字切り出し文字
の認識を行う文字認識装置を提供することを目的とする
。

問題点を解決するための手段上記の問題点を解消するために、本発明は、所定の特徴
量で貯蔵される標準文字パターンと、画像を走査して２
値データに変換する画像データ入力手段と、前記入力さ
れた画像データから文字列を切り出す文字列切り出し手
段と、前記文字列方向に対して垂直に投影したヒストグ
ラム量を用いて文字の境界を検出する文字ブロック境界
検出手段と、文字ブロックの幅を基準として文字である
か、複数の文字である文字群かを判定する判定手段と、
文字群であれば、多角形により各文字を切り出す多角形
文字切り出し手段と、切り出した各文字に対してそれぞ
れ所定の特徴量を抽出する特徴抽出手段と、抽出した特
徴量と上記の標準文字、パターンとを比較してその距離
の最も小さい文字パターンを認識結果とする比較手段な
どを備えたことを特徴とする文字認識装置である。

作　　用この発明によれば、上記のように構成された文字認識装
置は斜書体文字、正書体文字或いは連結文字を問わず、
高い精度で文字を切り出すことができ、ひいては、文字
認識装置全体の認識率を向上させることができるもので
ある。

実施例第１図は、本発明の一実施例を示すブロック図である。

第１図において、第２図のものと同一動作を行なうもの
は、同一符号を付している。第１図において、ｌＯは、
原稿を走査して映像の２値データに変換させるイメージ
・データ入力手段、２゜は、縦軸に対するヒストグラム
量及びスレッシュホールド調整により文字列を切り出す
文字列切り出し手段と、３１は、左から右へ文字列に沿
って、横軸に投影したヒストグラム量を計算し、文字ブ
ロック判断のスレッシュホールドに超えたがどうかを検
出する文字ブロック境界検出手段である。

そのヒストグラム量は、下記の式により計算できる。

なお、文字列は、座標　’Ｙｌ（とｙＬの間に存在する
ものとする（第５図）。

ここで、Ｈ（Ｘりは横軸に投影した点Ｘ１のヒストグラ
ムを示し、ｐ　（ｘ＋、ｙ）は画素（Ｘｌ。

ｙ）のイメージの２値化値である。黒点を”１°゛とし
、白点を”Ｏ゛とすると、文字ブロック境界の検出条件
は、ヒストグラム量が′°０“°の場合或いは既にその
行の右端に到達している場合とになる。

３２は、文字ブロックに含まれたものが単一の文字かま
たは複数個の文字からなる文字群であるかを判断するた
めの文字または文字群判断手段である。その判断基準は
下記の通りである。

即ち、文字ブロックの幅が（Ｘａｖ、＋Ｎ、＋ｚｅ）よ
りも小さい場合は、単一文字であると判断し、そうでな
い場合は、文字群であると判断する。ここで、Ｘ　ｉ　
ｖ　ａは、切り出された文字の平均幅［その初期値（ｉ
ｎｉｔｉａｌ　　ｖａｌｕｅ）がＸ　＋　ｎ　Ｉ　ｔで
ある］を示し、Ｎ　＊　＋　ｘ　ｅは、ノイズの幅（経
験値による）を示すものである。

３３は、多角形の追跡手段である。本実施例では最大へ
辺の多角形とする。その追跡動作は、左から右へ文字ブ
ロックを走査し、第１番目の文字の最左側の黒点を探し
出してから、この黒点を始点として、当該文字の外廓を
追跡するとともに、第６図に示したように当該文字を囲
む八辺形の関係パラメタを計算して八辺形を得る。その
八辺形の幅及び高さを検出し、若し両方とも所定値より
小さければ、この六辺形内の文字をノイズとして廃棄す
る。次に、上記と同じような計算を、文字ブロック全体
の処理が終わるまで繰り返す。上記の八辺形に関係のあ
るパラメタの計算を第７図に示す。

この八辺形の各辺は、下記のように定義する。

辺１　：　Ｘ　”　Ｘｍａｘ辺２：　２ｘ＋ｙ＝Ｃｓ辺３　：　ｙ＝　’！　ｍｍ、辺４：２ｘ−ｙ＝ｃ２辺５：Ｘ：ｘＩｎＩｈ辺６　：　２ｘ＋ｙ−Ｃ１辺５　：　Ｖ　＝　Ｖ＋ｎｉｎ辺６：２ｘ−ｙ＝Ｃ４上記のＸ　ＩＴｌａ　Ｘ　ｓ　Ｘ　１．ｌ＋　１１、’
ｌ　ｍ　ｔ　ｘ、’Ｉ＋ｎ＋ｎ、　Ｃ１，Ｃ２、Ｃ３、
及びＣ４の値を算出すれば、該文字を囲んだ八辺形を描
（ことができる。そして、この六辺形の幅はＸＩ、、ａ
Ｘ−ｘｌｎｌｌ、で高さはｙ、ｎＡＸ−ｙｌｎｌｌ。

である。

３４は、文字境界補正手段であり、この手段で、例えば
”ｉ　”、”ｊ″、“′％″、′”−″及び一部分の漢
字が二つ又は二つ以上の分離部分を有する文字を六辺形
で完全に切り出すことができる。その補正方法は、第８
図に示すように、仮に第８図における“元の六辺形“の
枠が、上記六辺形の追跡手段３３に至るまでに得た文字
枠とすれば、上下の斜線部分を検査し、もし黒点が存在
した場合には、この黒点を始点とし、もう−度上記の六
辺形の追跡手段３３により、その外周を追跡し、それを
元の六辺形に納めることにより、当該文字の境界を補正
することができる。

３５は、連がっている２個又は２個以上の文字どうしを
切り出すための連結文字処理手段である。

切り出された六辺形が、下記の五つの条件を満足したも
のは、連結文字として認定する。

（１）、（ｘ＋ｎａｘ−ｘｍｔｎ）　＞　（ｘａｖｅｘ
７／４）（２）、　　Ｖｍ＋ｎ　＞　（ｊ　ｔａｐ　＋
　５　）（３）、（Ｃ３Ｃ１）＞　　（ＸａｖａＸ　２
　）（４）、（２Ｘ　Ｘｍｊｎ　　　Ｃ２）＞　　（Ｙ
ｍｔｎ＋　Ｖｍａｘ）／２（５）０文字ブロックの中央
線付近のヒストグラム量が、どれも（ＶｍａＸＶ＋ｎ＋
ｎ）　Ｘ３／４よりも少ないこと。

ここで、Ｘ　ｎ　ｖ　ｅは、切り出された文字の平均幅
であり、ｔ　１ｌａｒは、文字列の始まり位置で、Ｘ□
８８、Ｘ　ｍ　ｔ　ｎ　ｓ　ｙｌｎｓ　ｘ　ｓ　Ｖ　ｍ
　＋　ｎ、Ｃ１、Ｃ２、Ｃ３、Ｃ４は、全部前記の六辺
形の追跡手段３３で述べた定義と同じである。

連結文字を切り出すく分割）方法は、まず連結文字の横
軸上でのヒストグラム量を計算し、ヒストグラム量の最
も小さいものを選び、次に斜線（ｘ＋３ｙ＝ｃ）に沿っ
て連結文字の斜方向ヒストグラム量を求め、その最も小
さいものを選んだのちに、両方の求めたヒストグラム量
を比較して、小さい方の点を区切り点とする方法である
。

上記各手段による可変多角形で、一つの文字を囲い出す
ので、この多角形は、該文字の外接多角形になる。第９
図に示す六辺形は、各辺ごとにフォント（字体）の形状
に応じて、その辺の長さと位置が調整されるようになっ
ている。異なったフォントや大きさの異なる文字に対し
、本発明の文字認識装置では、多角形の辺の長さを自動
的に調整することにより、それぞれ異なった形状の多角
形で、必要な文字を囲い出すことができる。その斜書体
文字と結合文字に対する切り出しの成功例を第１０図に
示す。ここで特に強調したい事は、この発明の文字切り
出し作用は、各種フォント（正書体又は斜書体）の文字
に対して有効であるのみならず、連結文字或いは一部分
が分離している文字に対しても、有効である。

本実施例の文字認識装置のハードウェアの構成図を、第
１１図に示す。第１１図において、この発明になる文字
認識装置の中心部の認識ボード（Ｒｅｃｏｇｎｉｔｉｏ
ｎ　Ｂｏａｒｄ）には、ディジタル・シグナル・プロセ
ッサ（Ｄｉｇｉｔａｌ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓ
ｏｒ）が含まれている。認識処理の主要動動作は、のプ
ロセッサに実行させる。認識すべき原稿はイメージ・ス
キャンナにより、映像のバイナリ・データを得たのちに
、これらのデータを検査し、前記の処理によって、文字
列又は文字を切り出す。次に、切り出された文字の特徴
を表わすパラメータとしては、日本電子通信学会全国大
会論文集（１９８５年、Ｐ１５７７）に示される境界密
度（Ｂｏｕｎｄａｒｙ　Ｄｅｎｓｉｔｙ　）や背景密度
（ＢａｃｋｇｒｏｕｎｄＤｅｎｓｉｔｙ　　）が公知で
ある。この特徴を計算するとともに、各文字ごとに、小
区間に分けて、所定バイト（ｂｙｔｅ　）数の特徴量を
得る。これを、同様にして予め作成された標準文字パタ
ーンの対応区間に、同一バイト数の特徴量と逐一比較し
、距離の最も小さい文字パターンを認識結果とする。本
実施例の場合、標準文字パターンに複数種類のフォント
を含み、そして、クラスタリング（ｃｌｕｓｔｅｒ−ｉ
ｎｇ）手法を利用して、標準文字パターン全体を記憶す
るのに必要とする記憶体空間を節約しつつ、マルチフォ
ントの認識に対応することが可能である。

この発明は、上記実施例に限定されることな（、その要
旨を変更しない限り、適当に変形して実施することがで
きる。例えば、文字を囲み出す多角形は、八辺形に限ら
れず、十辺形や六辺形を用いても、同じような区切り結
果が得られる。

また、この発明の切り出し対象は、文字に限らず、図形
にも適用でき、しかもその切り出しの精度はなんら影響
されることがない。

また、データの入力方式は、イメージ・スキャンナを使
用することに限られることなく、ＴＶカメラ等による入
力方式を使っても、イメージ・データをメモリ部に記憶
させることができる。

発明の結果本発明によれば、英文の大文字や小文字、数字及び特殊
記号など１００個の文字を認識対象として、上記文字認
識装置により、多角形の演算法で文字を切り出すことが
できるとともに、境界密度と背景密度の特徴を算出する
ことにより、その特徴を抽出することができ、かつ文字
の切り出しの正確率が９９．８％以上、文字の認識率が
９８゜９％以上に達した結果が得られたので、実用性が
はるかに大きいである。

図

【図面の簡単な説明】

第１図は本発明の文字認識装置の一実施例の構成を示す
ブロック図、第２図は従来例の文字認識装置の構成を示
すブロック図、第３図、第４図は従来例におけるヒスト
グラムによる文字切り出しの動作説明図、第５図は文字
列の一例を示す説明図、第６図は本発明の一実施例にお
ける八辺形パラメタの定義を示す説明図、第７図は八辺
形の定義を示す説明図、第８図は文字境界の補正領域を
示す説明図、第９図は八辺形の各辺の伸縮方向を示す説
明図、第１０図は八辺形で連結文字と斜書体文字の切り
出しの成功例を示す説明図、第１１図はこの発明の一実
施例におけるハードウェアの配置図である。（ｌＯ）・・・イメージ・データ入力手段、（２０）・
・・文字列切り出し手段、（３１）・・・文字ブロック
境界検索手段、（３２）・・・文字又は文字群判断手段
、（３３）・・・八辺形の追跡手段、（３４）・・・文
字境界補正手段、（３５）・・・連結文字処理手段、（
４０）・・・特徴抽出手段、（５０）・・・比較手段、
（５５）・・・標準文字パターン、（６０）・・・出力
手段。代理人の氏名　弁理士　中尾敏男　はか１名」ベム′へ
ＩＩ′Ｉべ中　　シベムベ）へ４酬塚

Claims

【特許請求の範囲】

（１）　所定の特徴量で貯蔵される標準文字パターンと
、画像を走査して２値データに変換する画像データ入力
手段と、前記入力された画像データから文字列を切り出
す文字列切り出し手段と、前記文字列方向に対して垂直
に投影したヒストグラム量を用いて文字の境界を検出す
る文字ブロック境界検出手段と、文字ブロックの幅を基
準として文字であるか、複数の文字である文字群かを判
定する判定手段と、文字群であれば、多角形により各文
字を切り出す多角形文字切り出し手段と、切り出した各
文字に対してそれぞれ所定の特徴量を抽出する特徴抽出
手段と、抽出した特徴量と上記の標準文字パターンとを
比較してその距離の最も小さい文字パターンを認識結果
とする比較手段などを備えたことを特徴とする文字認識
装置。
（２）　多角形文字切り出し手段は、各文字パターンの
枠を求める手段を備えたことを特徴とする特許請求範囲
第１項記載の文字認識装置。
（３）　多角形文字切り出し手段は、切り出された各文
字において各文字の分離部分を前記多角形に包含する文
字分離部補正手段を備えたことを特徴とする特許請求範
囲第２項記載の文字認識装置。（４）　多角形文字切り
出し手段は、多角形の条件により、複数の文字が結合し
ている連結文字であることを判定し、文字列方向に対し
て垂直方向又は斜方向上のヒストグラム量の最も小さい
ところを区切り点として連結文字を区切る連結文字処理
手段を備えたことを特徴とする特許請求範囲第２項記載
の文字認識装置。