JP2007026470A

JP2007026470A - パターン認識装置

Info

Publication number: JP2007026470A
Application number: JP2006298258A
Authority: JP
Inventors: Satoshi Naoi; 聡直井; Misako Suwa; 美佐子諏訪; Yoshinobu Hotta; 悦伸堀田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1996-09-27
Filing date: 2006-11-01
Publication date: 2007-02-01

Abstract

【課題】文字の書かれている環境に応じた適切な認識処理を精度良く行うことが可能なパターン認識装置を提供する。
【解決手段】本発明のパターン認識装置は、入力画像から文字を抽出する文字抽出手段と、入力画像から非文字を抽出する非文字抽出手段と、文字についての認識処理を行う文字認識手段（１２）と、非文字についての認識処理を行う非文字認識手段（２５）と、前記文字抽出手段が文字を抽出した場合、前記文字認識手段により認識処理を行わせ、前記非文字抽出手段が非文字を抽出した場合、前記非文字認識手段により認識処理を行わせる環境認識手段（１１）とを備える。
【選択図】図３

Description

本発明はパターン認識装置に係わり、特に手書き用文字認識装置のみならず、印刷文字認識装置や図面認識装置における文字、図形及び記号の認識を入力画像の様々な状態に応じて正確に行うようにするものである。

ＯＣＲ（Optical Character Reader) 等の手書き文字認識装置は、会計帳票などに書かれている文字を自動的に読み取って、文字を自動入力することにより、会計帳票などから人手で文字を見つけ出し、文字をキー入力するような手間を省くようにしていた。

図７９は、従来の手書き文字認識装置の構成を示すブロック図である。
図７９において、帳票／文書３１１をスキャナで読み込み、その帳票／文書３１１の多値画像を得る。

次に、前処理部３１２において、その多値画像の２値化、雑音除去、帳票／文書３１１の傾き補正を行う。
次に、文字切り出し部３１３において、予め定義されている罫線情報や文字の位置情報を用いることにより、文字を１文字づつ切り出す。

次に、文字認識部３１４において、それぞれの文字ごとに文字認識を行い、文字コードを出力する。ここで、この文字認識は、文字切り出し部３１３により切り出された未知の文字パターンの特徴のそれぞれに対し、認識辞書３１５に予め登録されている個々の文字カテゴリの特徴と１つずつ照合することにより行われる。

例えば、２次元の文字パターンを文字の特徴を表す特徴空間上の特徴ベクトルに変換し、未知の文字パターンと認識辞書３１５に予め登録されている文字カテゴリとの類似度として、特徴空間上の特徴ベクトル間の距離を算出する。そして、未知の文字パターンの特徴ベクトルと認識辞書３１５に予め登録されている文字カテゴリの特徴ベクトルとの間の距離が最も近いものを、未知の文字パターンに対応する文字カテゴリとして認識する。

ここで、消し線、雑音、模様などの非文字を文字と誤って認識し、文字の文字コードが非文字に対して出力されることを防止するため、２つの特徴ベクトル間の距離に対してしきい値を設定しておく。そして、２つの特徴ベクトル間の距離がこのしきい値以上の場合、未知の文字パターンが認識辞書３１５に予め登録されている文字カテゴリのどれに対応しているのかかわからないとするか、非文字であると判断してリジェクトコードを出力するようにしていた。

また、認識辞書３１５として、高品質文字、かすれ文字、つぶれ文字のそれぞれの文字カテゴリの特徴を登録したものを用意しておき、高品質文字に対しては、高品質文字についての認識辞書３１５を使用し、かすれ文字に対しては、かすれ文字についての認識辞書３１５を使用し、つぶれ文字に対しては、つぶれ文字についての認識辞書３１５を使用することにより、帳票／文書３１１の文字の品質の違いに対応できるようにしていた。

しかしながら、従来の手書き文字認識装置は、文字がかすれている場合であっても、文字がつぶれている場合であっても、文字が高品質文字であっても、切り出した１文字に対して、同一の認識辞書３１５を用いて画一的に処理を行っていた。

このため、認識辞書３１５に登録してあるかすれ文字についての情報が、高品質文字の認識処理を行う際に悪影響を及ぼし、かすれ文字が認識辞書３１５に登録してあるために、高品質文字が読めなくなってしまうという問題があった。

また、かすれやつぶれだけでなく、文字が罫線に接触しているなどの文字が書かれている環境は様々なものがあり、画一的な認識辞書３１５で様々な環境に対応しようとした場合、互いに相互作用を及ぼし合い、認識処理の精度の大幅な改善は望めないという問題があった。

そこで、本発明の目的は、文字の書かれている環境に応じた適切な認識処理を精度よく行うことが可能なパターン認識装置を提供することである。

上述した課題を解決するために、本発明のパターン認識装置は、入力画像から文字を抽出する文字抽出手段と、入力画像から非文字を抽出する非文字抽出手段と、文字についての認識処理を行う文字認識手段と、非文字についての認識処理を行う非文字認識手段と、前記文字抽出手段が文字を抽出した場合、前記文字認識手段により認識処理を行わせ、前記非文字抽出手段が非文字を抽出した場合、前記非文字認識手段により認識処理を行わせる環境認識手段とを備える。

なお、本発明の一態様によれば、処理対象の状態を入力画像から抽出し、その状態に適した認識処理を処理対象ごとに選択することにより、パターン認識を行うようにしている。

このことにより、様々な状態を有する入力画像に対し、それぞれの状態に適したパターン認識処理を行うことができ、認識処理を精度よく行うことが可能となる。
また、本発明の一態様によれば、処理対象の状態を入力画像から抽出し、第１の状態を有する処理対象に対しては、第１の状態専用のパターン認識処理を行い、第２の状態を有する処理対象に対しては、第２の状態専用のパターン認識処理を行うようにしている。

このことにより、第１の状態を有する処理対象の認識処理と第２の状態を有する処理対象の認識処理とが互いに相互作用を及ぼすことがなくなり、認識処理を精度よく行うことが可能となる。

また、本発明の一態様によれば、様々な状態を有する入力画像に対し、認識辞書を使い分けるようにしている。
このことにより、例えば、かすれ文字やつぶれ文字や高品質文字が入力画像の中に混在している場合においても、かすれ文字に対してはかすれ文字に適した認識辞書を使用し、つぶれ文字に対してはつぶれ文字に適した認識辞書を使用し、高品質文字に対しては高品質文字に適した認識辞書を使用して認識処理を行うことができ、認識処理を精度よく行うことが可能となる。

また、本発明の一態様によれば、様々な状態を有する入力画像に対し、識別関数を使い分けるようにしている。
このことにより、例えば、１文字枠に書かれている文字についてはシティブロック距離を用いて文字認識を行い、フリーピッチ枠に書かれている文字に対しては判別関数を用いて文字の切り出し信頼度を考慮しながら文字認識を行うことができ、認識処理を精度よく行うことが可能となる。

また、本発明の一態様によれば、様々な状態を有する入力画像に対し、知識を使い分けるようにしている。
このことにより、例えば、未知文字の変形が大きくて、認識辞書に格納されている文字カテゴリとの対応関係が取れない場合、文字セグメントに文字を分割することにより、未知文字と文字カテゴリとの対応関係をとるようにしたり、文字列から文字を切り出す場合、学習パターンに基づいて生成した判別関数を用いて切り出し信頼度を算出したり、枠接触文字についての文字認識を行う場合、学習パターンにより得られた信頼度を用いて、枠接触文字についての認識信頼度を評価したりすることができ、認識処理を精度よく行うことが可能となる。

また、本発明の一態様によれば、同一の処理対象に対して複数の認識処理が呼ばれた場合、認識処理による信頼度が所定の値以上となるまで、優先順位に従って認識処理を行わせるようにしている。

このことにより、認識処理の信頼度を上げることができ、認識処理の精度を向上させることができる。
また、本発明の一態様によれば、入力画像から非文字を抽出し、この非文字についての認識処理を文字についての認識処理と別々に行うようにしている。

このことにより、文字が非文字とみなされたり、非文字が文字とみなされたりして認識処理が行われることが減少し、認識処理を精度よく行うことが可能となる。

以上説明したように、本発明によれば、処理対象の状態を入力画像から抽出し、その状態に適した認識処理を処理対象ごとに選択することにより、様々な状態を有する入力画像に対し、それぞれの状態に適したパターン認識処理を行うことができ、認識処理を精度よく行うことが可能となる。また、処理対象の評価が、その状態を抽出する時と、その処理対象についての認識処理を行う時の両方で行われるので、認識処理の精度をより一層向上させることができる。

また、本発明の一態様によれば、処理対象の状態を入力画像から抽出し、第１の状態を有する処理対象に対しては、第１の状態専用のパターン認識処理を行い、第２の状態を有する処理対象に対しては、第２の状態専用のパターン認識処理を行うことにより、第１の状態を有する処理対象の認識処理と第２の状態を有する処理対象の認識処理とが互いに相互作用を及ぼすことがなくなり、認識処理を精度よく行うことが可能となる。

また、本発明の一態様によれば、様々な状態を有する入力画像に対し、認識辞書を使い分けることにより、それぞれの状態に対して最適な認識辞書を使用することができ、認識処理の精度を向上させることが可能となる。

また、本発明の一態様によれば、様々な状態を有する入力画像に対し、識別関数を使い分けることにより、それぞれの状態に対して最適な識別関数を使用しながら認識処理を行うことができ、認識処理の精度を向上させることが可能となる。

また、本発明の一態様によれば、様々な状態を有する入力画像に対し、知識を使い分けることにより、それぞれの状態に対して最適な知識を使用しながら認識処理を行うことができ、認識処理の精度を向上させることが可能となる。

また、本発明の一態様によれば、認識処理による信頼度が所定の値以上となるまで、同一の処理対象に対して複数の認識処理を行うようにすることにより、認識処理の信頼度を上げることができ、認識処理の精度を向上させることができる。

また、本発明の一態様によれば、非文字についての認識処理と文字についての認識処理とを別々に行うようにすることにより、文字を非文字とみなしたり、非文字を文字とみなしたりして認識処理が行われることが減少し、認識処理を精度よく行うことが可能となる。

以下、本発明の一実施例によるパターン認識装置について図面を参照しながら説明する。
図１は、本発明の一実施例によるパターン認識装置の機能的な構成を示すブロック図である。

図１において、環境認識手段１は、第１〜第Ｎの状態を入力画像から抽出する。ここで、入力画像から抽出される状態とは、例えば、１文字枠やフリーピッチ枠や表などのいずれの形式で文字が書かれているかの状態、文字と枠との接触状態、文字のかすれ状態、文字のつぶれ状態、文字が消し線で消されている状態などである。

第１のパターン認識手段２は、第１の状態を有する処理対象についてのパターン認識処理を専用に行い、第２のパターン認識手段４は、第２の状態を有する処理対象についてのパターン認識処理を専用に行い、第Ｎのパターン認識手段６は、第Ｎの状態を有する処理対象についてのパターン認識処理を専用に行う。

ここで、第１〜第Ｎのパターン認識手段２、４、６は、それぞれの認識結果についての信頼度を算出する信頼度算出手段３、５、７を備え、第１〜第Ｎのパターン認識手段２、４、６による認識結果についての信頼度を算出する。

そして、環境認識手段１は、第１〜第Ｎのパターン認識手段２、４、６の中から、第１〜第Ｎの状態に対応するものを呼び出して認識処理を実行させる。
例えば、環境認識手段１が、入力画像から第１の状態を抽出した場合、その第１の状態の処理対象に対して、第１のパターン認識手段２によるパターン認識処理を呼び出し、入力画像から第２の状態を抽出した場合、その第２の状態の処理対象に対して、第２のパターン認識手段４によるパターン認識処理を呼び出し、入力画像から第Ｎの状態を抽出した場合、その第Ｎの状態の処理対象に対して、第Ｎのパターン認識手段６によるパターン認識処理を呼び出す。

また、環境認識手段１が、同一の処理対象に対して、例えば、第１の状態及び第２の状態を抽出した場合、第１のパターン認識手段２によるパターン認識処理及び第２のパターン認識手段４によるパターン認識処理を、その同一の処理対象に対して呼び出す。

例えば、第１の状態が一文字枠に文字が書かれている状態であるとし、第２の状態がフリーピッチ枠に文字列が書かれている状態であるとし、第３の状態が文字と枠とが接触している状態であるとし、第４の状態が文字のかすれ状態であるとし、第５の状態が文字のつぶれ状態であるとし、第６の状態が文字が消し線で訂正された状態であるとすると、第１のパターン認識手段２は一文字枠に書かれている文字についての認識処理を行い、第２のパターン認識手段４はフリーピッチ枠に書かれている文字列についての認識処理を行い、第３のパターン認識手段は枠接触文字についての認識処理を行い、第４のパターン認識手段はかすれ文字についての認識処理を行い、第５のパターン認識手段はつぶれ文字についての認識処理を行い、第６のパターン認識手段は訂正文字についての認識処理を行う。

そして、環境認識手段１が、入力画像から一文字枠を抽出した場合、その一文字枠に書かれている文字に対し、第１のパターン認識手段２により認識処理を実行させ、環境認識手段１が、入力画像からフリーピッチ枠を抽出した場合、そのフリーピッチ枠に書かれている文字に対し、第２のパターン認識手段４により認識処理を実行させ、環境認識手段１が、入力画像から枠接触文字を抽出した場合、その枠接触文字に対し、第３のパターン認識手段により認識処理を実行させ、環境認識手段１が、入力画像からかすれ文字を抽出した場合、そのかすれ文字に対し、第４のパターン認識手段により認識処理を実行させ、環境認識手段１が、入力画像からつぶれ文字を抽出した場合、そのつぶれ文字に対し、第５のパターン認識手段により認識処理を実行させ、環境認識手段１が、入力画像から訂正文字の候補を抽出した場合、その訂正文字の候補に対し、第６のパターン認識手段により認識処理を実行させる。

また、例えば、環境認識手段１が、入力画像からフリーピッチ枠に接触している枠接触文字を抽出した場合、そのフリーピッチ枠に接触している枠接触文字に対し、パターン認識手段２及びパターン認識手段３により認識処理を実行させ、入力画像からフリーピッチ枠に接触している消し線付きの枠接触文字を抽出した場合、そのフリーピッチ枠に接触している消し線付きの枠接触文字に対し、第２のパターン認識手段４、第３のパターン認識手段及び第６のパターン認識手段により認識処理を実行させる。

ここで、同一の処理対象についての複数の状態が入力画像から抽出され、それに対応して複数のパターン認識手段２、４、６が呼び出された場合、複数のパターン認識手段２、４、６をどの順序で呼び出すかを格納した処理順序テーブルに基づいて、複数のパターン認識手段２、４、６による認識処理の順序を決定する。そして、パターン認識手段２、４、６による認識処理により、所定のしきい値以上の信頼度が信頼度算出手段３、５、７により得られるまで、複数のパターン認識手段２、４、６による認識処理を呼び出し順序に従って順次に実行する。

例えば、環境認識手段１が、入力画像からフリーピッチ枠に接触している枠接触文字を抽出した場合、そのフリーピッチ枠に接触している枠接触文字に対し、パターン認識手段３による認識処理を実行してからパターン認識手段２による認識処理を実行し、入力画像からフリーピッチ枠に接触している消し線付きの枠接触文字を抽出した場合、そのフリーピッチ枠に接触している消し線付きの枠接触文字に対し、第３のパターン認識手段による認識処理を実行してから第６のパターン認識手段による認識処理を実行し、さらに、第２のパターン認識手段４による認識処理を実行させる。

図２は、図１の環境認識手段１の一実施例の構成を示すブロック図である。
図２において、状態抽出手段１ａは、第１〜第Ｎの状態を入力画像から抽出する。
認識処理制御手段１ｂは、状態抽出手段１ａにより抽出された第１〜第Ｎの状態に対応させて、図１の第１〜第Ｎのパターン認識手段２、４、６の中のいずれか１つ又は複数を呼び出して認識処理を行わせる。

処理順序テーブル１ｆは、第１〜第Ｎのパターン認識手段２、４、６の中から複数の認識手段が呼び出された際に、これらの第１〜第Ｎのパターン認識手段２、４、６をどのような順序で実行するかを示す処理順序を格納する。

処理順序制御ルール格納手段１ｄは、状態抽出手段１ａにより抽出された第１〜第Ｎの状態に基づいて、第１〜第Ｎのパターン認識手段２、４、６の中からどの認識手段を呼び出すかを示す呼び出し手順を格納する。

中間処理結果テーブル作成手段１ｃは、処理順序制御ルール格納手段１ｄに格納されている呼び出し手順及び処理順序テーブル１ｆに格納されている処理順序に基づいて、第１〜第Ｎのパターン認識手段２、４、６の実行順序を示す中間処理結果テーブルを作成する。

処理実行ルール格納手段１ｅは、中間処理結果テーブルに記入された認識処理の実行結果に基づいて、次の処理の実行を指示する手順を格納する。
図３は、本発明の一実施例によるパターン認識装置の具体的な構成を示すブロック図である。

図３において、環境認識系１１は、入力画像の状態を抽出し、この抽出された状態に基づいて、文字認識部１２の基本文字認識部１７、文字列認識部１５、接触文字認識部１３、かすれ文字認識部１９、つぶれ文字認識部２１又は非文字認識部２５の消し線認識部２６及び雑音認識部２８のいずれか１つ又は複数を呼び出す。ここで、入力画像の状態を抽出するために、入力画像のレイアウト解析、品質解析及び訂正解析を行う。

文字認識部１２は、入力画像の状態ごとに文字認識処理を行うもので、文字についての文字認識を行う基本文字認識部１７、文字列についての文字認識Ｂ及び文字切り出しＢを行う文字列認識部１５、枠に接触した文字についての文字認識Ａ及び文字切り出しＡを行う接触文字認識部１３、かすれ文字についての文字認識Ｃ及び文字切り出しＣを行うかすれ文字認識部１９、つぶれ文字についての文字認識Ｄ及び文字切り出しＤを行うつぶれ文字認識部２１及びくせ字についての文字認識Ｅ及び文字切り出しＥを行うくせ字認識部２３を備えている。

また、基本文字認識部１７、文字列認識部１５、接触文字認識部１３、かすれ文字認識部１９、つぶれ文字認識部２１及びくせ字認識部２３はそれぞれ、文字認識の手法についての知識を格納した知識テーブル１４、１６、１８、２０、２２、２４を備えている。知識テーブル１４には、例えば、枠接触状態と認識の信頼度に関する知識や重複の部分パターン法に関する知識が格納され、知識テーブル１６には、例えば、切り出しの信頼度に関する知識や切り出しと認識の融合法に関する知識が格納され、知識テーブル１８には、例えば、詳細識別法に関する知識が格納されている。

非文字認識部２５は、入力画像の状態ごとに非文字認識処理を行うもので、消し線についての非文字認識Ｆ及び非文字切り出しＦを行う消し線認識部２６、雑音についての非文字認識Ｇ及び非文字切り出しＧを行う雑音認識部２８を備えている。

また、消し線認識部２６及び雑音認識部２８はそれぞれ、非文字認識の手法についての知識を格納した知識テーブル２７、２９を備えている。
図４は、環境認識系１１の全体的な処理の一例を示すフローチャートである。

図４において、まず、ステップＳ１に示すように、入力画像の前処理を行う。この入力画像の前処理は、ファクシミリやスキャナなどにより２値化された入力画像に対しラベリングを行い、入力画像とラベル画像とを格納するものである。なお、入力画像とラベル画像とは、これ以降の処理でいつでもアクセスできるようにしておく。

図５は、図４の入力画像の前処理を示すフローチャートである。
図５において、ステップＳ１１に示すように、２値化された入力画像に対しラベリングを行うことにより、連結パターンを抽出してラベル付けを行い、抽出したラベル画像と入力画像とを格納する。この際、ラベル付けされた連結パターンを外接矩形の加減算で圧縮表現することにより、メモリ容量を削減する。このラベル付けされた連結パターンの圧縮表現によれば、例えば、４００ｄｐｉの高解像度のスキャナで入力したＡ４サイズ（約３０００×４０００）の文書／帳票に対し、、数百キロバイト以内で表すことができる。

次に、図４のステップＳ２に示すように、レイアウト解析を行う。このレイアウト解析は、ラベル付けされた連結パターンのサイズや配置状態などに基づいて、テキスト認識、罫線抽出、枠抽出、枠の種類及び表の判別、枠接触文字の有無の判断及び図認識を行う。

図６は、図４のレイアウト解析を示すフローチャートである。
図６において、まず、ステップＳ２１に示すように、テキスト認識を行う。このテキスト認識は、ラベル付けされた連結パターンのサイズを解析し、連結パターンのサイズが比較的小さいものを抽出し、これを文字の候補とみなす。そして、隣接する文字の候補を統合することにより、テキストを抽出する。

次に、ステップＳ２２に示すように、罫線抽出を行う。この罫線抽出は、ステップＳ２１でテキストと認識されなかった連結パターンを対象として、縦又は横方向のヒストグラム値が大きいものについての探索を行うことにより、罫線を抽出する。

次に、ステップＳ２３に示すように、枠抽出を行う。この枠抽出は、ステップＳ２２で抽出された罫線から４辺に相当する罫線を見つけて枠を抽出する。
次に、ステップＳ２４に示すように、枠の種類／表判別を行う。この枠の種類／表判別は、ステップＳ２３で抽出された枠に対し、その枠の種類を判別して枠の種類の属性を付与する。枠の種類の属性としては、一文字枠、ブロック枠、フリーピッチ枠、表などがある。

次に、ステップＳ２５に示すように、枠接触文字の有無の判断を行う。この枠接触文字の有無の判断は、枠内を枠線に沿って探索した際に、交差するパターンがあるかどうかを検出し、交差するパターンがある場合は、文字が枠に接触しているものと判断する。ここで、交差するパターンが存在していても、注目している枠の隣の枠から、文字がはみ出している場合があるので、交差するパターンが隣の枠からはみ出しているものについては、注目している枠に対し、接触文字でないとする。

次に、ステップＳ２６に示すように、図認識を行う。この図認識は、テキストや枠や表などの属性が付与されなかったサイズが比較的大きな連結パターンに対して、図の属性を付与する。

次に、図４のステップＳ３に示すように、品質解析を行う。この品質解析は、入力画像にかすれやつぶれがあるかどうかを検出するもので、大局的品質解析と局所的品質解析とがある。

この品質解析では、所定の領域について、（面積、縦／横の長さがそれぞれ所定のしきい値以下の連結領域の数）／（前記所定の領域の全ての連結領域の数）の値が、所定値よりも大きい時にかすれと判断する。

また、罫線抽出の際にかすれた罫線を部分的に統合した情報を用いることにより、所定の領域について、（かすれた罫線を補完した際の補完された部分の長さの合計）／（各罫線の長さの合計）の値が、所定値よりも大きい時にかすれと判断する。

さらに、所定の領域について、（黒画素密度が所定のしきい値より大きい連結領域の数）／（前記所定の領域の全ての連結領域の数）の値が、所定値よりも大きい時につぶれと判断する。

図７は、図４の品質解析を示すフローチャートである。
図７において、まず、ステップＳ３１に示すように、大局的品質解析を行う。この大局的品質解析は、文書／帳票全体に対して品質解析を行うもので、入力画像を２値化する際のしきい値が適切であったかどうか、ファクシミリで送られてきた文書／帳票に対してノイズが全体にのったため品質が不正常になっていないかどうか、かすれやつぶれが発生していないかを解析する。

次に、ステップＳ３２に示すように、局所的品質解析を行う。この局所的品質解析は、レイアウト解析により一文字枠やテキストやフリーピッチ枠や表などの属性が付与された領域ごとにかすれやつぶれが発生していないかを調べたり、ノイズが発生していないかを調べたりして品質解析を行うものである。

次に、図４のステップＳ４に示すように、訂正解析を行う。この訂正解析は、入力画像から消し線を抽出して、消し線で訂正された文字については、文字の認識処理を省略できるようにするものである。

図８は、図４の訂正解析を示すフローチャートである。
図８において、まず、ステップＳ４１に示すように、訂正特徴抽出を行う。この訂正特徴抽出は、訂正文字に有効な特徴を抽出するもので、訂正文字には、つぶれた文字、２重線で消した文字、斜線で消した文字及びばつで消した文字の大きく分けて４種類あり、各訂正文字の特徴を黒画素線密度、線密度、オイラー数、ヒストグラム値などを算出して抽出する。

次に、ステップＳ４２に示すように、訂正文字候補抽出を行う。この訂正文字候補抽出は、訂正文字の特徴を表す特徴空間で、訂正文字と訂正されていない通常文字との分布の違いから訂正文字の候補を抽出する。

次に、図４のステップＳ５に示すように、文字認識／非文字認識の制御を行う。この文字認識／非文字認識の制御は、図４のステップＳ２〜Ｓ４で抽出された入力画像の状態に基づいて、文字認識部１２の基本文字認識部１７、文字列認識部１５、接触文字認識部１３、かすれ文字認識部１９、つぶれ文字認識部２１又は非文字認識部２５の消し線認識部２６及び雑音認識部２８のいずれを呼び出すかを決定するもので、中間処理結果テーブルの読み込み／処理順序制御ルールの実行、終了判定や処理実行ルールによる処理の実行を行う。

ここで、処理順序制御ルールは、環境認識系１１が抽出した状態に基づいて、文字認識部１２の基本文字認識部１７、文字列認識部１５、接触文字認識部１３、かすれ文字認識部１９、つぶれ文字認識部２１又は非文字認識部２５の消し線認識部２６及び雑音認識部２８のいずれを呼び出すかの手順を示すものである。

また、処理実行ルールは、処理順序制御ルールにより呼ばれた認識処理の結果に基づいて、次にどのような処理を行うのかの手順を示すものである。
また、中間処理結果テーブルは、レイアウト解析により一文字枠やテキストやフリーピッチ枠や表などの属性が付与された領域ごとに、図４のステップＳ２〜Ｓ４で抽出された入力画像の状態を記入するとともに、入力処理順序制御ルールにより呼ばれた処理を処理順序テーブルに格納されている処理順序で記入するものである。

例えば、環境認識系１１が、文字を抽出した場合、この文字に対しては、基本文字認識部１７を呼び出して認識処理を実行し、環境認識系１１が、図６のステップＳ２１でテキストを抽出した場合、このテキストに対しては、文字列認識部１５を呼び出して認識処理を実行し、環境認識系１１が、図６のステップＳ２５で枠接触文字を抽出した場合、この枠接触文字に対しては、接触文字認識部１３を呼び出して認識処理を実行し、環境認識系１１が、図７のステップＳ３２で、（面積、縦／横の長さがそれぞれ所定のしきい値以下の連結領域の数）／（前記所定の領域の全ての連結領域の数）の値が所定値よりも大きいと判断した場合、この領域の文字に対しては、かすれ文字認識部１９を呼び出して認識処理を実行し、環境認識系１１が、図７のステップＳ３２で、（黒画素密度が所定のしきい値より大きい連結領域の数）／（前記所定の領域の全ての連結領域の数）の値が所定値よりも大きいと判断した場合、この領域の文字に対しては、つぶれ文字認識部２１を呼び出して認識処理を実行し、環境認識系１１が、図８のステップＳ４２で、訂正文字候補を抽出した場合、この訂正文字候補に対しては、消し線認識部２６を呼び出して認識処理を実行し、環境認識系１１が、図７のステップＳ３２で雑音を検出した場合、この雑音に対しては、雑音認識部２８を呼び出して認識処理を実行する。

図９は、図４の文字認識／非文字認識の制御を示すフローチャートである。
図９において、まず、ステップ５１に示すように、中間処理結果テーブルの読み込み／処理順序制御ルールの実行を行う。

次に、ステップ５２に示すように、終了判定を行う。この終了判定は、処理順序制御ルールに基づいて、中間処理結果テーブルの全ての処理が完了して中間処理結果テーブルの全ての処理指示欄に終了が記入された場合、終了と判定する。終了判定で未終了と判定された場合、ステップ５３に進んで、処理実行ルールによる処理を実行してステップ５１に戻り、ステップ５２の終了判定で終了と判定されるまで以上の処理を繰り返す。

図１０は、本発明の一実施例によるパターン認識装置のシステム構成を示すブロック図である。
図１０において、画像格納部４１は帳票画像を格納し、処理条件格納部４２は帳票のレイアウト構造や読み取り文字情報、例えば、枠の位置、種類、サイズ、文字種、文字数などの定義体を格納し、ラベル画像格納部４３はラベル付けされたラベル画像を圧縮表現により格納する。

環境認識系３０はレイアウト解析部３１及び訂正解析部３２を備え、環境認識系３８はくせ字解析部３９及び終了判定処理部４０を備え、文字認識系／非文字認識系３３は基本文字認識部３４、黒枠接触文字認識部３５、フリーピッチ文字列認識部３６及び消し線認識部３７を備えている。

レイアウト解析部３１は、ラベル画像格納部４３に格納されているラベル画像について、処理条件格納部４２に格納されている定義体を参照しながら、罫線抽出、枠抽出及び黒枠接触文字抽出を行う。ここで、枠の位置やサイズなどのフォーマット情報及び傾きに関する情報を予め帳票データとして格納しておき、この帳票データに基づいて、罫線抽出や枠抽出を行う方法は、例えば、特開昭６２−２１２８８号公報や特開平３−１２６１８６号公報に記載されている。

なお、例えば、特開平６−３０９４９８号公報や特開平７−２８９３７号公報に記載されているように、枠の位置やサイズなどのフォーマット情報の入力を必要とせずに、罫線抽出や枠抽出を行うようにしてもよい。

訂正解析部３２は消し線候補の抽出を行い、くせ字解析部３９は個人筆記特性によるくせ字の解析を行い、終了判定処理部４０は文字認識の終了判定を行い、終了判定で終了と判定された場合、文字認識結果の出力を行う。

基本文字認識部３４は、１文字ごとに切り出された文字の認識を行い、黒枠接触文字認識部３５は、黒枠接触文字から枠を除去し、その枠を除去することによりかすれた文字の補完を行ってから文字の認識を行い、フリーピッチ文字列認識部３６は、文字列から文字を切り出す際の切り出し信頼度を考慮しながら文字列についての文字認識を行い、消し線認識部３７は、訂正文字の黒画素線密度、線密度、オイラー数、ヒストグラムなどに基づいて、消し線の認識を行う。

中間処理結果テーブル４４は、環境認識系３０、３８により抽出された状態に基づいて、文字認識系／非文字認識系３３のいずれの処理を実行するかを示す処理順序やその処理結果を格納する。

図１１は、図１〜３のパターン認識装置が適用される文字認識システムの具体的な構成を示すブロック図である。
図１１において、５１は全体的な処理を行う中央演算処理ユニット（ＣＰＵ）、５２はＣＰＵ５１で実行されるプログラムを格納するプログラムメモリ、５３は画像データをビットマップ形式で格納する画像メモリ、５４は画像処理に使用するワークメモリ、５５は画像を光学的に読み取るスキャナ、５６はスキャナ５５により読み取られた情報を一時的に格納するメモリ、５７は各文字画像の特徴を格納した辞書ファイル、５８は認識結果を表示するディスプレイ、５９は認識結果を印刷するプリンタ、６０はディスプレイ５８及びプリンタ５９の入出力インターフェイス、６１はＣＰＵ５１、プログラムメモリ５２、画像メモリ５３、ワークメモリ５４、メモリ５６、辞書ファイル５７、入出力インターフェイス６０及びドライバ６４を接続しているバス、６２は通信ネットワーク６３を介してデータやプログラムの送受信を行う通信インターフェイス、６４はドライバ、６５はハードディスク、６６はＩＣメモリカード、６７は磁気テープ、６８はフロッピー（登録商標）ディスク、６９はＣＤ−ＲＯＭやＤＶＤ−ＲＯＭなどの光ディスクである。

この文字認識システムは、スキャナ５５により読み取った画像データをメモリ５６に一時的に格納し、その画像データをビットマップ形式で画像メモリ５３に展開する。そして、画像メモリ５３からワークメモリ５４にコピーされた２値画像データに対してパターン抽出処理を行う。その結果に基づいて、スキャナ５５により読み取った画像データから文字画像の切り出しを行い、切り出された文字画像の特徴と辞書ファイル５７に格納された特徴データとの比較を行い、文字の認識を行う。その後、その認識結果を、ディスプレイ５８又はプリンタ５９に出力する。

この文字認識システムにおいて、図１〜３のパターン抽出装置は、プログラムメモリ５２に格納されたプログラムに従って処理を行うＣＰＵ５１の機能として実現される。ここで、パターン抽出処理を行うプログラムは、プログラムメモリ５２のＲＯＭに予め格納しておくことが可能である。また、パターン抽出処理を行うプログラムを、ハードディスク６５、ＩＣメモリカード６６、磁気テープ６７、フロッピー（登録商標）ディスク６８または光ディスク６９などの記憶媒体からプログラムメモリ５２のＲＡＭにロードした後、このプログラムをＣＰＵ５１で実行させるようにしてもよい。

さらに、パターン抽出処理を行うプログラムを、通信インターフェイス６２を介して通信ネットワーク６３から取り出すこともできる。通信インターフェイス６２と接続される通信ネットワーク６３として、例えば、ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）、ＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）、インターネット、アナログ電話網、デジタル電話網（ＩＳＤＮ：ＩｎｔｅｇｒａｌＳｅｒｖｉｃｅＤｉｇｉｔａｌＮｅｔｗｏｒｋ）、ＰＨＳ（パーソナルハンディシステム）や衛星通信などの無線通信網などを用いることが可能である。

以下、図３の環境認識系１１、文字認識部１２及び非文字認識部２５の構成をより具体的に説明する。
図１２は、図５のステップＳ１１のラベリング処理を説明する図である。

図１２において、“０”と“１”とからなる２値画像がラベリング処理部７０に入力されると、ラベリング処理部７０は、連結した画素で構成される連結パターンを入力された２値画像から抽出し、各連結パターンごとにラベルを付したラベル画像を生成して、ラベル画像格納部７１に格納する。例えば、“０”と“１”とからなる２値画像７２が入力された場合、各連結パターンごとにラベル“１”、“２”、“３”を付してラベル画像７３を生成する。

ここで、例えば、２５５個の連結パターンが１画像内に存在する場合、２５５個のラベルが必要となるため、１画素当たり８ビットを必要とし、ラベル画像格納部７１に必要な記憶容量は、１画像全体の画素数の８倍となり、ラベル画像を格納するために多くの記憶容量が必要となる。

図１３は、図１２のラベル画像７３を圧縮表現することにより、ラベル画像格納部７１に必要な記憶容量を削減する方法を説明する図である。
図１３において、例えば、図１３（ａ）の連結パターンＡ₁及び連結パターンＡ₂のそれぞれに対し、図１３（ｂ）に示すように、ラベル“１”及びラベル“２”が付され、図１３（ｃ）に示すように、連結パターンＡ₁に外接する外接矩形Ｂ₁及び連結パターンＡ₂に外接する外接矩形Ｂ₂が生成されている。外接矩形Ｂ₁及び外接矩形Ｂ₂は、図１３（ｄ）に示すように、その外接矩形Ｂ₁及び外接矩形Ｂ₂の左上頂点の座標（ｘ₁、ｙ₁）及び右下頂点の座標（ｘ₂、ｙ₂）によって特定することができる。

そして、連結パターンＡ₁に外接する外接矩形Ｂ₁と連結パターンＡ₂に外接する外接矩形Ｂ₂とが重なっているかどうかを判定し、連結パターンＡ₁に外接する外接矩形Ｂ₁と連結パターンＡ₂に外接する外接矩形Ｂ₂とが重なっていない場合、それぞれの外接矩形Ｂ₁及び外接矩形Ｂ₂の左上頂点の座標（ｘ₁、ｙ₁）及び右下頂点の座標（ｘ₂、ｙ₂）を記憶する。

一方、連結パターンＡ₁に外接する外接矩形Ｂ₁と連結パターンＡ₂に外接する外接矩形Ｂ₂とが重なっている場合、他の外接矩形と重ならないようにより小さな矩形領域に外接矩形Ｂ₁及び外接矩形Ｂ₂を細分化し、細分化された矩形領域が元の外接矩形Ｂ₁及び外接矩形Ｂ₂のどちらに属するかを判定し、連結パターンＡ₁及び連結パターンＡ₂を、細分化された矩形領域の和や差などの演算で表現する。

例えば、図１３（ｃ）において、連結パターンＡ₁は、連結パターンＡ₁に属する最大の矩形領域（１−１）及び矩形領域（１−１）に含まれる矩形領域（１−２）を用いて、
Ａ₁＝（１−１）−（１−２）
のように矩形領域（１−１）と矩形領域（１−２）との差で表現することができる。

また、連結パターンＡ₂は、連結パターンＡ₂に属する最大の矩形領域（２−１）、矩形領域（２−１）に含まれる矩形領域（２−２）及び矩形領域（２−２）に含まれる矩形領域（２−３）を用いて、
Ａ₂＝（２−１）−（２−２）＋（２−３）
のように矩形領域（２−１）と矩形領域（２−２）との差及び矩形領域（２−３）との和で表現することができる。

このように、連結パターンを連結する画素の外接矩形で表現することにより、連結パターンを表現する情報量を減らして、ラベル画像を格納するために必要な記憶容量を削減することができる。

なお、このラベル画像の圧縮表現の方法については、例えば、特開平８−５５２１９号公報に記載されている。
図１４は、図６のステップＳ２１のテキスト認識処理の一実施例を示すフローチャートである。

図１４において、まず、ステップＳ６１に示すように、スキャナで文書を読み込み、読み込んだ文書の画像データをメモリに格納する。
次に、ステップＳ６２に示すように、ステップＳ６１で読み込んだ画像データのうち、横方向の特定の区間の短冊状の部分領域だけに注目し、その注目した部分領域の中でラベリングを行い、黒連結画素の外接矩形を求める。

例えば、処理対象として複数の文書Ａ、Ｂ、Ｃがあり、図１５（ａ）の文書Ａの文字列８１の領域が、図１５（ｄ）に示すように、区間Ａの範囲内にあり、図１５（ｂ）の文書Ｂの文字列８２の領域が、図１５（ｄ）に示すように、区間Ａの範囲内にあり、図１５（ｃ）の文書Ｃの文字列８３の領域が、図１５（ｄ）に示すように、区間Ｂの範囲内にある場合、この区間Ａ，Ｂの部分領域にのみ着目し、この部分領域の短冊状の中でのみラベリング処理を行って、黒連結画素の外接矩形を求める。

次に、ステップＳ６３に示すように、ステップＳ６２で求めた外接矩形の高さと、予め求めておいた矩形の高さｙｌｅｎとの差がしきい値ｔｈｙ以内で、かつステップＳ６２で求めた外接矩形の幅と、予め求めておいた矩形の幅ｘｌｅｎとの差がしきい値ｔｈｘ以内であるような外接矩形だけを抽出する。そして、その外接矩形が存在しているｙ方向（縦方向）の座標を求め、メモリに記憶する。

次に、ステップＳ６４に示すように、ステップＳ６３で求めたｙ方向の座標を中心として、ステップＳ６２で抽出した矩形を含む左右方向の長さが画像幅に等しい横長部分領域に注目する。

次に、ステップＳ６５に示すように、ステップＳ６４で求めた横長部分領域に対してラベリングを行うことにより、黒連結画素の外接矩形を求める。
次に、ステップＳ６６に示すように、ステップＳ６５で求めた外接矩形の高さと、予め求めておいた矩形の高さｙｌｅｎとの差がしきい値ｔｈｙ以内で、かつステップＳ６５で求めた外接矩形の幅と、予め求めておいた矩形の幅ｘｌｅｎとの差がしきい値ｔｈｘ以内であるような外接矩形だけを抽出し、メモリに記憶する。

次に、ステップＳ６７に示すように、ステップＳ６６で抽出した矩形を対象にｘ座標でソートし、抽出した矩形の中心線の間隔からピッチを計算し、この計算により求めたピッチと予め求めておいたピッチｐｉｔｃｈとの差がしきい値ｔｈｐｉｔｃｈ以内の矩形が横方向に所定の数ｔｈ個以上並んでいるものをテキストとして出力する。

なお、このテキスト抽出方法については、例えば、特開平８−１７１６０９号公報に記載されている。
次に、図６のステップＳ２２の罫線抽出処理の一実施例についてより具体的に説明する。

この罫線抽出処理は、ラベリングにより得られた連結パターンを横方向及び縦方向に複数に分割し、横方向及び縦方向に分割したそれぞれの範囲内で連結パターンの隣接投影値を算出し、ある一定の長さの線分又は直線の一部を矩形近似により検出することにより罫線を抽出するものである。

ここで、隣接投影とは、注目行又は注目列の投影値に周囲の行又は列の投影値を足し合わせたものである。また、注目行又は注目列の投影値は、その行又は列に存在する黒画素の総和をとったものである。

図１６は、この隣接投影処理を説明する図である。
図１６において、ｉ行の投影値をｐ（ｉ）とすると、隣接投影値Ｐ（ｉ）は、（１）式により算出することができる。

Ｐ（ｉ）＝ｐ（ｉ−ｊ）＋・・・＋ｐ（ｉ）＋・・・＋ｐ（ｉ＋ｊ）（１）
なお、図１６に示す例は、（１）式においてｊ＝１とおいたものである。
図１７は、部分パターンの投影値の例を示す図である。

図１７において、縦方向の長さがＬ_Y、横方向の長さがＬ_Xの矩形８４の水平方向ｊの投影値Ｐｈ（ｉ）をＨＰ（ｉ）、矩形８４の垂直方向ｉの投影値Ｐｖ（ｊ）をＶＰ（ｊ）とすると、ＨＰ（１）＝ＨＰ（ｎ）＝ｍ、ＨＰ（２）〜ＨＰ（ｎ−１）＝２、ＶＰ（１）＝ＶＰ（ｍ）＝ｎ、ＶＰ（２）〜ＶＰ（ｍ−１）＝２である。

このように、矩形８４を構成する直線が存在している部分は、その投影値が大きくなるので、この投影値を算出することにより、罫線を構成している直線を抽出することができる。

例えば、隣接投影値と縦横それぞれの分割長との比が所定の閾値以上である部分パターンを検出することにより、罫線を構成している直線の候補を抽出することができる。
図１８は、罫線抽出処理を示すフローチャートである。

図１８において、まず、ステップ６０１に示すように、隣接投影値と縦横それぞれの分割長との比が所定のしきい値以上であるかどうかを判定する。そして、隣接投影値と縦横それぞれの分割長との比が所定のしきい値以上でないと判断された場合、ステップＳ６０２に進み、罫線を構成している線分が存在しないものとみなす。

一方、ステップＳ６０１で隣接投影値と縦横それぞれの分割長との比が所定のしきい値以上であると判断された場合、ステップＳ６０３に進み、罫線を構成している線分が存在するものとみなす。

次に、ステップＳ６０４において、ステップＳ６０３で線分とみなされたパターンが、その上下に存在する線分と接しているかどうかを判断する。そして、上記パターンが上下に存在する線分と接していないと判断された場合、ステップＳ６０５に進み、そのパターンを矩形線分とする。

一方、ステップＳ６０４において、ステップＳ６０３で線分とみなされたパターンがその上下に存在する線分と接していると判断された場合、ステップＳ６０６に進み、上記パターンとその上下に存在する線分とを統合する。そして、ステップＳ６０７で、ステップＳ６０６で統合した線分を矩形線分として検出する。例えば、図１９（ａ）に示すような３つの矩形線分８５を統合し、図１９（ｂ）に示す１つの矩形線分８６を得る。この後、ステップＳ６０５又はステップＳ６０７で求めた矩形線分を対象として探索を行うことにより、罫線を抽出する。

なお、この罫線抽出処理については、例えば、特開平６−３０９４９８号公報に記載されている。
図２０は、図６のステップＳ２２の罫線抽出処理において、かすれ罫線の補完を行いながら、探索を行う方法を説明する図である。

このかすれ罫線の補完方法は、直線を構成するパターンの探索を行う際、探索の進行方向にパターンのない空白領域が存在しても、一定の画素数以下の空白領域に対してはパターンがあるとみなして探索を行うようにするものである。

例えば、図２０に示すように、直線９１に対して、この直線９１を構成する画素９２の検索を行う場合、一定の画素数以下の空白領域９３に対しては画素９２があるとみなして探索を行う。

図２１は、罫線抽出処理におけるかすれ罫線の補完方法を示すフローチャートである。
図２１において、まず、ステップＳ７１に示すように、所定の矩形範囲内のパターンのうち、最も細い部分のＸ座標を算出する。

次に、ステップＳ７２に示すように、ステップＳ７１で算出したＸ座標におけるパターンの中心点を算出する。そして、ステップＳ７３に示すように、ステップＳ７２で算出したパターンの中心点を探索の開始点とする。ここで、探索の開始点をパターンの最も細い部分とするのは、最も細い部分は文字である可能性が低いため、枠となる直線の探索をより確実に行うことができるからである。

次に、ステップＳ７４で直線の探索方向を右に設定する。
次に、ステップＳ７５に示すように、空白領域の長さをカウントする変数Ｋの初期値を０に設定する。

次に、ステップＳ７６に示すように、ステップＳ７３で求めた開始点をパターンの探索の現在地と設定する。
次に、ステップＳ７７に示すように、ステップＳ７６で設定した探索の現在地が、ステップＳ７１で注目した矩形範囲の内部であるかどうかの判定を行い、探索の現在地が、ステップＳ７１で注目した矩形範囲の内部でない場合、ステップＳ８６に進む。

一方、ステップＳ７７で探索の現在地が、ステップＳ７１で注目した矩形範囲の内部であると判定された場合、ステップＳ７８に進み、探索の現在地からみて探索方向隣にパターンがあるかどうか判定する。ここで、探索の現在地からみて探索方向隣にパターンがあるとは、図２２に示すように、パターン１０１からみて右方向隣の位置にパターン１０２が存在していることを意味している。そして、探索の現在地からみて探索方向隣にパターン１０２があると判定された場合、ステップＳ８１に進み、探索方向隣にあるパターン１０２を探索の現在地とする。

一方、ステップＳ７８で探索の現在地からみて探索方向隣にパターンがないと判定された場合、ステップＳ７９に進み、探索の現在地からみて探索方向斜め隣にパターンがあるかどうか判定する。

ここで、探索の現在地からみて探索方向斜め隣にパターンがあるとは、図２２に示すように、パターン１０３からみて右方向斜め隣の位置にパターン１０４ａ又はパターン１０４ｂが存在していることを意味している。そして、探索の現在地からみて探索方向斜め隣にパターン１０４ａ、１０４ｂがあると判定された場合、ステップＳ８３に進み、探索方向斜め隣にあるパターン１０４ａ、１０４ｂを探索の現在地とする。なお、探索方向斜め隣にあるパターン１０４ａ、１０４ｂが２つある場合はパターン１０４ａ、１０４ｂのどちらか一方を探索の現在地とする。一方、ステップＳ７９で探索の現在地からみて探索方向斜め隣にパターン１０４ａ、１０４ｂがないと判定された場合、ステップＳ８０に進み、空白領域の長さをカウントする変数Ｋがしきい値以下であるかどうかを判定する。そして、空白領域の長さをカウントする変数Ｋがしきい値以下である場合、ステップＳ８４に進み、探索の現在地からみて探索方向隣にありパターンを構成しない画素を現在地とする。例えば、図２０において、一定の画素数以下の空白領域９３に対してはパターンがあるとみなして探索を行う。

次に、ステップＳ８５に示すように、空白領域の長さをカウントする変数Ｋの値を１ドットだけ増やし、ステップＳ７７に戻る。
一方、ステップＳ８０で空白領域の長さをカウントする変数Ｋがしきい値以下でないと判定された場合、ステップＳ８６に進み、探索方向は右に設定されているかどうかを判定する。そして、探索方向は右に設定されていない場合、処理を終了する。

ステップＳ８６で探索方向は右に設定されている場合、ステップＳ８７に進み、探索方向を左に設定する。そして、探索方向を右に設定して行った処理と同様に、ステップＳ７５〜ステップＳ８５の処理を繰り返す。

ここで、探索方向を左に設定して処理を行う場合、探索の現在地からみて探索方向隣にパターンがあるとは、図２２に示すように、パターン１０５からみて左方向隣の位置にパターン１０６が存在していることを意味している。また、探索の現在地からみて探索方向斜め隣にパターンがあるとは、図２２に示すように、パターン１０７からみて左方向斜め隣の位置にパターン１０８ａ又はパターン１０８ｂが存在していることを意味している。

なお、このかすれ罫線の補完方法については、例えば、特願平８−１０７５６８号の明細書及び図面に記載されている。
次に、図６のステップＳ２３の枠抽出処理について説明する。

図２３は、一文字枠抽出処理の一実施例を示すフローチャートである。
図２３において、まず、ステップＳ９１に示すように、図１８の処理により矩形線分として検出されたパターンに対し探索を行う。この際、図２１のフローチャートに示すように、所定の長さの空白領域に対しては、パターンが存在するものとみなして探索を行い、かすれを補完する。

次に、ステップＳ９２に示すように、ステップＳ９１で探索を行った結果、パターンが所定の長さで途切れているかどうかを判断し、パターンが所定の長さで途切れていない場合、図２４のブロック枠抽出処理に進む。一方、パターンが所定の長さで途切れている場合、ステップＳ９３に進み、探索された線分を統合して直線を検出する。

次に、ステップＳ９４に示すように、ステップＳ９３で検出した直線のうち、４方を囲んでいる直線を抽出する。
次に、ステップＳ９５に示すように、４方を直線で囲まれた部分の大きさが、同一画像内の一文字枠の大きさの所定範囲内であるかどうかを判断し、４方を直線で囲まれた部分の大きさが、同一画像内の一文字枠の大きさの所定範囲内であるか場合、ステップＳ９６に進んで、４方を直線で囲まれた部分を一文字枠であるとみなし、４方を直線で囲まれた部分の大きさが、同一画像内の一文字枠の大きさの所定範囲内でない場合、ステップＳ９７に進んで、４方を直線で囲まれた部分を一文字枠でないとみなす。

図２４は、ブロック枠抽出処理の一実施例を示すフローチャートである。
図２４において、まず、ステップＳ１０１に示すように、探索により検出された横直線が所定値以上の長さを有するかどうかを判断し、探索により検出された横直線の長さが所定値より小さい場合、ステップＳ１０２に進んで、その横直線を横枠でないとみなす。一方、探索により検出された横直線の長さが所定値以上の場合、ステップＳ１０２に進み、探索により検出された横直線を横枠であるとみなす。

次に、ステップＳ１０４に示すように、ステップＳ１０３で抽出された横枠から、互いに隣接する２本の横枠を取り出す。
次に、ステップＳ１０５に示すように、ステップＳ１０４で取り出した２本の横枠の間に挟まれた範囲を１行のブロック枠とみなす。

次に、ステップＳ１０６に示すように、図１８の処理により検出された矩形線分のうち、縦方向の矩形線分を抽出して縦線を検出する。
次に、ステップＳ１０７に示すように、ステップＳ１０６で検出した縦線の探索を行い、ステップＳ１０８において、縦線がステップＳ１０４で取り出した上下の横枠に達したかどうかを判断する。そして、縦線が上下の横枠に達しない場合、ステップＳ１０９に進み、その縦線を縦枠の候補から除外する。一方、縦線が上下の横枠に達した場合、ステップＳ１１０に進み、その縦線を縦枠の候補とする。

次に、ステップＳ１１１に示すように、処理の対象が規則的な表形式のブロック枠であるか、不規則な表形式のブロック枠であるかを判断する。そして、処理の対象が規則的な表形式のブロック枠である場合、ステップＳ１１２に進み、ステップＳ１１０で縦枠の候補とみなされた縦線同士の間隔を算出するとともに、算出された縦線同士の間隔とその出現頻度との関係を示すヒストグラムを算出する。

次に、ステップＳ１１３に示すように、互いの隣接する２本の横枠の間に挟まれた範囲内の縦線のうち、他の縦線と異なる間隔を形成する縦線を縦枠の候補から除外し、残った縦線を縦枠として処理を終了する。

一方、ステップＳ１１１で処理の対象が不規則的な表形式のブロック枠であると判断された場合、ステップＳ１１０で縦枠の候補とされたものを全て縦枠として処理を終了する。

次に、図６のステップＳ２４の枠種類／表判別処理について説明する。
図２５は、図６のステップＳ２３の枠抽出処理により抽出された枠や表の一例を示す図である。

図２５において、図２５（ａ）は一文字枠、図２５（ｂ）はフリーピッチ枠、図２５（ｃ）はブロック枠、図２５（ｄ）は規則的な表、図２５（ｅ）は不規則な表を示している。そして、一文字枠には一文字枠の属性を付与し、フリーピッチ枠にはフリーピッチ枠の属性を付与し、ブロック枠にはブロック枠の属性を付与し、表には表の属性を付与する。

なお、枠抽出処理及び枠種類／表判別処理については、例えば、特開平７−２８９３７号公報に記載されている。
次に、図６のステップＳ２５の枠接触有無の判断処理について説明する。ここでは、元の入力画像をＯＲ処理により縮小率１／ｎで縮小してから、枠接触有無の判断処理を行う例について述べる。ここで、画像の各画素に対応して座標が設定され、画像の横方向にＸ座標、画像の縦方向にＹ座標を設定し、Ｘ座標は右向きに増加し、Ｙ座標は下向きに増加するものとしている。

図２６は、入力画像の縮小処理の一実施例を示すフローチャートである。
図２６において、まず、ステップＳ１２１に示すように、原画像を入力する。
次に、ステップＳ１２２に示すように、原画像の左上から横ｎ画素×縦ｎ画素の範囲（左上座標（１，１）、右下座標（Ｘ，Ｙ））を設定する。

次に、ステップＳ１２３に示すように、原画像の設定された範囲内に黒画素があるかどうかを判断し、原画像の設定された範囲内に黒画素がある場合、ステップＳ１２４に進み、縮小画像の座標（Ｘ／ｎ，Ｙ／ｎ）の画素を黒画素とし、原画像の設定された範囲内に黒画素がない場合、ステップＳ１２５に進み、縮小画像の座標（Ｘ／ｎ，Ｙ／ｎ）の画素を白画素とする。

次に、ステップＳ１２６に示すように、原画像の右下まで処理が終了したかどうかを判断し、原画像の右下まで処理が終了していない場合、ステップＳ１２７に進み、原画像の右端に達したかどうかを判断する。

そして、原画像の右端に達していない場合、処理した範囲の右隣に横ｎ画素×縦ｎ画素の範囲（左上座標（ｘ，ｙ）、右下座標（Ｘ，Ｙ））を設定し、原画像の右端に達した場合、処理した範囲の下側で、かつ、原画像の左端から横ｎ画素×縦ｎ画素の範囲（左上座標（ｘ，ｙ）、右下座標（Ｘ，Ｙ））を設定して、ステップＳ１２３に戻り、原画像の全ての範囲内について縮小処理が終了するまで以上の処理を繰り返す。

次に、入力画像の縮小処理により縮小された圧縮画像データにおける枠線の内側を枠に沿って探索することにより、文字が枠に接触しているかどうかの判定を行い、文字の接触している辺に関して、矩形領域を所定の距離だけ外側に拡大し、この拡大した矩形領域の座標を原画像データにおける座標に変換する。

例えば、図２７（ａ）に示すように、圧縮画像データの枠線の範囲１１０が抽出され、この枠線により囲まれた矩形領域内に「４」の文字１１２が存在し、この「４」の文字１１２が下側の枠線１１１に接触しているものとする。

次に、図２７（ｂ）に示すように、枠線の内側に沿って真っ直ぐに探索を行い、探索の途中でパターンと交差した場合、枠線の近辺に文字が存在し、この文字は枠線に接触している可能性が高いとみなして、この枠線により囲まれた矩形領域内に存在する「４」の文字１１２は枠と接触しているものとする。この例の場合、「４」の文字１１２は下側の枠１１１と接触しているものとされる。

次に、枠線１１１の内側に沿って探索を行い、文字１１２が枠線１１１に接触しているとみなされた結果、図２７（ｃ）に示すように、文字１１２が接触している枠線１１１から外側の方向へ枠線により囲まれた矩形領域を拡大し、この拡大した矩形領域１１３を文字１１２が存在する文字領域とする。なお、文字が枠線に接触していないとみなされた場合は、枠の内部をそのまま文字領域とする。

次に、圧縮画像データにおける文字領域から原画像データにおける文字領域を求めるため、図２７（ｃ）の矩形領域１１３の座標を原画像データにおける座標に変換する。このことにより、図２７（ｄ）に示すように、原画像データにおける矩形領域１１６を求めることができる。

次に、原画像データの矩形領域１１６における枠線１１４についての投影処理を行い、枠線１１４の枠座標を原画像データから算出する。この際、枠線１１４を所定の長さの短冊状の矩形によって表現する。そして、図２７（ｅ）に示すように、この矩形領域１１６に存在するパターンを文字補完処理に送り、原画像データから算出した枠線１１４の枠座標に基づいて、枠線１１４に接触している文字１１５の補完処理を行う。

図２８は、枠接触有無の判断処理の一実施例を示すフローチャートである。
図２８において、まず、ステップＳ１３１に示すように、圧縮画像データによる矩形表現を、例えば、図２６の処理により行う。

次に、ステップＳ１３２に示すように、縦横４本の直線に囲まれた矩形部分を抽出する。
次に、ステップＳ１３３に示すように、直線の内側を示す矩形の左上及び右下を示す座標をそれぞれ算出する。

次に、ステップＳ１３４に示すように、枠の内側を示す矩形の４辺（上側横枠、下側横枠、右側縦枠、左側縦枠）に沿って圧縮画像の探索を行う。
次に、ステップＳ１３５に示すように、探索の途中で画像パターンと交差した場合、探索を行っていた辺に文字が接触しているものとする。

次に、ステップＳ１３６に示すように、枠の内側を示す矩形の座標値を原画像上の座標値に変換することにより、圧縮画像データにおける矩形領域から原画像データにおける矩形領域を算出する。

次に、ステップＳ１３７に示すように、ステップＳ１３６で算出された矩形領域を原画像データにおける文字領域とする。
次に、ステップＳ１３８に示すように、ステップＳ１３５の処理により文字が枠に接触していたかどうかを判断し、文字が枠に接触している場合、ステップＳ１３９〜Ｓ１４３の接触文字範囲獲得処理を行う。

接触文字範囲獲得処理では、まず、ステップＳ１３９において、文字の接触している辺から外側方向に文字領域を拡大し、ステップＳ１３７で算出された文字領域位置より一定の距離だけ外側の位置を文字領域の端とする。

次に、ステップＳ１４０に示すように、ステップＳ１３９で算出された文字領域に含まれる枠線の位置座標を原画像上の座標値に変換することにより、圧縮画像データにおける枠線の位置座標から原画像データにおける枠線の位置座標を算出する。

次に、ステップＳ１４１に示すように、ステップＳ１４０で算出された原画像データにおける枠線の位置座標に基づいて獲得した原画像データの枠線領域について、横枠は横方向、縦枠は縦方向に投影処理を行う。

次に、ステップＳ１４２に示すように、投影値が一定値以上の領域を原画像上の枠座標とする。
次に、ステップＳ１４３に示すように、算出した原画像上の文字領域を示す座標値と文字領域内の枠線の位置を示す座標値とを文字補完処理へ渡す。

次に、ステップＳ１４４に示すように、算出した原画像上の文字領域を示す座標値を文字領域とする。
なお、枠接触有無の判断処理については、例えば、特願平８−１０７５６８号の明細書及び図面に記載されている。

次に、図８のステップＳ４１の訂正特徴抽出処理及びステップＳ４２の訂正文字候補抽出処理について説明する。
図２９は、訂正文字の一実施例を示す図である。

図２９において、訂正文字は、文字を消し線で消したものであり、訂正文字の形態として、図２９（ａ）に示すように、文字を“×”印により消したもの、図２９（ｂ）に示すように、文字を横二重線によりにより消したもの、図２９（ｃ）に示すように、文字を斜め線により消したもの、図２９（ｄ）に示すように、文字を波線により消したもの、図２９（ｅ）に示すように、文字を真っ黒に塗りつぶすことにより消したものなど様々なものがある。

このような訂正文字に対し、訂正文字に特有な特徴を抽出する。この訂正文字に特有な特徴として、「所定方向の線密度」、「オイラー数」、「黒画素密度」などがある。
「所定方向の線密度」は、矩形内の画像を所定の一定方向に沿って走査した際に、白画素から黒画素（又は黒画素から白画素）に変化する回数を計数した値である。また、所定方向は、消し線として想定された線分の方向と垂直方向に設定する。

例えば、図３０（ａ）は、「６」の文字について、縦方向の最大線密度を計数した例を示すもので、この場合の縦方向の最大線密度は３となっている。
訂正文字の「所定方向の線密度」は、通常文字の「所定方向の線密度」に比べて大きくなる傾向があり、この「所定方向の線密度」を算出することにより、訂正文字の候補を抽出することができる。

「オイラー数」Ｅは、画像中での互いに連結している連結成分の個数Ｃから、その画像が有する穴の個数Ｈを引いた値である。
例えば、図３０（ｂ）は、互いに連結している連結成分が画像中に２つだけ存在し、その画像中に穴が１つだけ存在する例を示すもので、この例の場合のオイラー数Ｅは、Ｅ＝Ｃ−Ｈ＝２−１＝１となる。

訂正文字の「オイラー数」は絶対値が大きな負の値となる傾向があり、通常文字の「オイラー数」は絶対値が小さな値（２〜−１）となる傾向がある。したがって、この「オイラー数」を算出することにより、訂正文字の候補を抽出することができる。

「黒画素密度」Ｄは、注目する画像自体の面積（黒画素数）Ｂと注目する画像の外接矩形の面積Ｓとの比である。
例えば、図３０（ｃ）は、「４」の文字について黒画素密度Ｄを算出した場合の例を示すもので、「４」の文字に外接している外接矩形の面積をＳ、「４」の文字の面積をＢとすると、Ｄ＝Ｂ／Ｓとなる。

訂正文字の「黒画素密度」は、通常文字の「黒画素密度」に比べて大きくなる傾向があり、この「黒画素密度」を算出することにより、訂正文字の候補を抽出することができる。

次に、図３の基本文字認識部１７について具体的に説明する。
図３１は、基本文字認識部１７の構成の一実施例を示すブロック図である。
図３１において、特徴抽出部１２１は、入力された未知の文字パターンから文字の特徴を抽出し、この抽出した特徴を特徴ベクトルにより表す。一方、基本辞書１２２には、各文字カテゴリの特徴ベクトルが格納されている。

そして、照合部１２３は、特徴抽出部１２１により抽出した未知の文字パターンの特徴ベクトルを、基本辞書１２２に格納されている各文字カテゴリの特徴ベクトルと照合し、特徴空間上での特徴ベクトル間の距離Ｄ_ij（ｉは未知文字の特徴ベクトル、ｊは基本辞書１２２のカテゴリの特徴ベクトル）を算出する。その結果、特徴ベクトル間の距離Ｄ_ijを最小とするカテゴリｊを未知文字ｉとして認識する。

ここで、特徴空間上での特徴ベクトル間の距離Ｄ_ijは、例えば、ユークリッド距離Σ（ｉ−ｊ）²、シティブロック距離Σ｜ｉ−ｊ｜、又は判別関数などの識別関数を用いて算出することができる。

なお、第１位のカテゴリとの距離をＤ_ij1、第２位のカテゴリとの距離をＤ_ij2とすると、第１位のカテゴリｊ１、第２位のカテゴリｊ２、カテゴリ間の距離（Ｄ_ij2−Ｄ_ij1）及び信頼度に関するテーブル１を予め作成しておく。また、第１位のカテゴリとの距離をＤ_ij1、第１位のカテゴリｊ１及び信頼度に関するテーブル２も予め作成しておく。そして、テーブル１とテーブル２とからそれぞれ得られる信頼度の小さい方を中間処理結果テーブルに格納する。

図３２は、特徴ベクトルの算出例を示す図である。
この例は、図３２（ａ）の縦５×横４の合計２０個の枡目に「２」の文字が書かれており、黒く塗りつぶされた枡目を“１”、白抜きの枡目を“０”として、枡目の左上から右下の順に枡目を見ていき、その時現れる“１”又は“０”の数値を順に並べたものを、特徴ベクトルとしたものである。

例えば、図３２（ｂ）の場合の特徴ベクトルｖｅｃｔｏｒＡは、ｖｅｃｔｏｒＡ＝（１、１、１、１、０、０、０、１、１、１、１、１、１、０、０、０、１、１、１、１、）となり、図３２（ｃ）の場合の特徴ベクトルｖｅｃｔｏｒＢは、ｖｅｃｔｏｒＢ＝（０、１、１、１、０、０、０、１、１、１、１、１、１、０、０、０、１、１、１、１、）となり、図３２（ｄ）の場合の特徴ベクトルｖｅｃｔｏｒＣは、ｖｅｃｔｏｒＣ＝（１、１、１、１、０、０、０、１、０、１、１、０、１、０、０、０、１、１、１、１、）となる。
図３３は、シティブロック距離ｄ（ｉ，ｊ）により特徴ベクトル間の距離Ｄ_ijを算出する例を示す図である。

ここで、シティブロック距離ｄ（ｉ，ｊ）は、特徴ベクトルの次元数をＮ、特徴ベクトルの番号をｉとすると、ｉ番目の特徴ベクトルｘ_iは、ｘ_i＝（ｘ_i1，ｘ_i2，ｘ_i3，・・・ｘ_iN）と表され、ｊ番目の特徴ベクトルｘ_jは、ｘ_j＝（ｘ_j1，ｘ_j2，ｘ_j3，・・・ｘ_jN）と表される。そして、ｉ番目の特徴ベクトルｘ_iとｊ番目の特徴ベクトルｘ_jとのシティブロック距離ｄ（ｉ，ｊ）は、
ｄ（ｉ，ｊ）＝｜ｘ_i−ｘ_j｜・・・（２）
と定義される。

例えば、図３３において、基本辞書１２２には、「１」、「２」、「３」、「４」の文字カテゴリの特徴ベクトルが登録されているものとする。ここで、「１」の文字カテゴリの特徴ベクトルｖｅｃｔｏｒ１は、ｖｅｃｔｏｒ１＝（０、１、１、０、０、１、１、０、０、１、１、０、０、１、１、０、０、１、１、０、）、「２」の文字カテゴリの特徴ベクトルｖｅｃｔｏｒ２は、ｖｅｃｔｏｒ２＝（１、１、１、１、０、０、０、１、１、１、１、１、１、０、０、０、１、１、１、１、）、「３」の文字カテゴリの特徴ベクトルｖｅｃｔｏｒ３は、ｖｅｃｔｏｒ３＝（１、１、１、１、０、０、０、１、１、１、１、１、０、０、０、１、１、１、１、１、）、「４」の文字カテゴリの特徴ベクトルｖｅｃｔｏｒ４は、ｖｅｃｔｏｒ４＝（１、０、１、０、１、０、１、０、１、１、１、１、０、０、１、０、０、０、１、０、）とする。

そして、特徴ベクトルｖｅｃｔｏｒが、ｖｅｃｔｏｒ＝（０、１、１、１、０、０、０、１、１、１、１、１、１、０、０、０、１、１、１、１、）である未知文字が入力された場合、この特徴ベクトルｖｅｃｔｏｒと、基本辞書１２２に登録されている「１」の文字カテゴリの特徴ベクトルｖｅｃｔｏｒ１、「２」の文字カテゴリの特徴ベクトルｖｅｃｔｏｒ２、「３」の文字カテゴリの特徴ベクトルｖｅｃｔｏｒ３、「４」の文字カテゴリの特徴ベクトルｖｅｃｔｏｒ４のそれぞれとの間のシティブロック距離ｄ（ｉ，ｊ）を（２）式により算出する。

すなわち、未知文字の特徴ベクトルｖｅｃｔｏｒと「１」の文字カテゴリの特徴ベクトルｖｅｃｔｏｒ１との間のシティブロック距離ｄ（ｉ，ｊ）は、ｄ（ｉ，ｊ）＝｜ｖｅｃｔｏｒ−ｖｅｃｔｏｒ１｜＝｜０−０｜＋｜１−１｜＋｜１−１｜＋｜１−０｜＋｜０−０｜＋｜０−１｜＋｜０−１｜＋｜１−０｜＋｜１−０｜＋｜１−１｜＋｜１−１｜＋｜１−０｜＋｜１−０｜＋｜０−１｜＋｜０−１｜＋｜０−０｜＋｜１−０｜＋｜１−１｜＋｜１−１｜＋｜１−０｜＝１１となる。

同様に、未知文字の特徴ベクトルｖｅｃｔｏｒと「２」の文字カテゴリの特徴ベクトルｖｅｃｔｏｒ２との間のシティブロック距離ｄ（ｉ，ｊ）は、ｄ（ｉ，ｊ）＝｜ｖｅｃｔｏｒ−ｖｅｃｔｏｒ２｜＝１、未知文字の特徴ベクトルｖｅｃｔｏｒと「３」の文字カテゴリの特徴ベクトルｖｅｃｔｏｒ３との間のシティブロック距離ｄ（ｉ，ｊ）は、ｄ（ｉ，ｊ）＝｜ｖｅｃｔｏｒ−ｖｅｃｔｏｒ３｜＝３、未知文字の特徴ベクトルｖｅｃｔｏｒと「４」の文字カテゴリの特徴ベクトルｖｅｃｔｏｒ４との間のシティブロック距離ｄ（ｉ，ｊ）は、ｄ（ｉ，ｊ）＝｜ｖｅｃｔｏｒ−ｖｅｃｔｏｒ４｜＝１１となる。

ここで、未知文字の特徴ベクトルｖｅｃｔｏｒと、「１」の文字カテゴリの特徴ベクトルｖｅｃｔｏｒ１、「２」の文字カテゴリの特徴ベクトルｖｅｃｔｏｒ２、「３」の文字カテゴリの特徴ベクトルｖｅｃｔｏｒ３、「４」の文字カテゴリの特徴ベクトルｖｅｃｔｏｒ４のそれぞれとの間のシティブロック距離ｄ（ｉ，ｊ）のうち、未知文字の特徴ベクトルｖｅｃｔｏｒと「２」の文字カテゴリの特徴ベクトルｖｅｃｔｏｒ２との間のシティブロック距離ｄ（ｉ，ｊ）が最小となっている。

従って、特徴ベクトルｖｅｃｔｏｒが、ｖｅｃｔｏｒ＝（０、１、１、１、０、０、０、１、１、１、１、１、１、０、０、０、１、１、１、１、）である未知文字は、「２」の文字カテゴリに属すると判定される。

次に、図３の基本文字認識部１７の知識テーブル１８に格納されている詳細識別法について説明する。この詳細識別法は、各文字カテゴリの局所的な部分パターンを文字セグメントとして取り出し、未知文字の文字セグメントの位置や角度変化量とセグメント辞書に予め格納してある文字セグメントの位置や角度変化量とを比較することにより、未知文字と文字カテゴリとの対応を取りながら文字を認識する。

図３４は、文字セグメントの抽出方法を説明する図である。
図３４（ａ）は、「２」の文字についての２値画像パターンを示しており、斜線部分が黒画素で表された文字部分を示している。

図３４（ｂ）は、図３４（ａ）の２値画像パターンから抽出された輪郭線を示しており、点線部分は元の２値画像パターンを示している。
図３４（ｃ）は、図３４（ｂ）の輪郭線を文字セグメントＳ１、Ｓ２と端点部分Ｔ１、２とに分割した状態を示している。この端点部分Ｔ１、２は、図３４（ａ）の「２」の文字の書き始め及び書き終わりに対応するものである。

図３５は、端点の検出方法を説明する図である。
図３５において、端点は輪郭線の傾きが急激に変化する場所として検出され、具体的には、一定間隔だけ離れた３点Ａ、Ｂ、Ｃを輪郭線Ｓ上にとり、その３点Ａ、Ｂ、Ｃを結んだ真ん中の点Ａを頂点としてなす角θが所定値以下となる輪郭線上の領域を、端点として検出する。

文字の輪郭線を端点で分割することにより、文字セグメントを２値画像パターンから抽出すると、例えば、文字セグメント上に代表点Ｘ、Ｙ、Ｚを一定の距離ごとにとる。そして、連続する代表点Ｘ、Ｙ、Ｚのなす角度を求め、各代表点Ｘ、Ｙ、Ｚでの特徴量として、文字セグメント上の最初の代表点から各代表点までの角度変化量の累積値を求める。

図３６は、角度変化の検出方法を説明する図である。
図３６において、任意の間隔だけ離れた代表点Ｘ、Ｙ、Ｚを輪郭線Ｓ上にとり、代表点Ｘから代表点Ｙに引いたベクトルＸＹと、代表点Ｙから代表点Ｚに引いたベクトルＹＺとを作り、ベクトルＸＹとベクトルＹＺとのなす角θ₂が代表点Ｙでの角度変化となる。

角度変化の初期値である輪郭線Ｓ上の代表点Ｘでの角度変化は、文字の重心Ｇから代表点Ｘに引いたベクトルＧＸとベクトルＸＹとのなす角θ₁を代表点Ｘでの角度変化とする。

各代表点Ｘ、Ｙ、Ｚでの特徴量は、角度変化の初期値を有する代表点Ｘから各代表点Ｙ、Ｚまでの角度変化を累積した値で表し、例えば、代表点Ｙでの特徴量は、θ₁＋θ₂の値となる。

未知文字の文字セグメント上の代表点での角度変化量の累積値を求めた後、この未知文字の文字セグメントについての代表点とセグメント辞書に格納してある文字セグメントの代表点との対応をとる。すなわち、未知文字の文字セグメントについての代表点の角度変化量の累積値と、セグメント辞書に格納してある文字セグメントの代表点の角度変化量の累積値との距離を算出し、この距離が最も小さくなるセグメント辞書の文字セグメントの代表点を未知文字の文字セグメントの代表点に対応させる。

図３７（ａ）は、未知文字の文字セグメントの代表点とセグメント辞書の文字セグメントの代表点との対応関係を示す図である。
図３７（ａ）において、代表点ａ₁〜ａ₈は、未知文字の文字セグメント上の代表点を表し、代表点ｂ₁〜ｂ₈は、セグメント辞書に格納されている文字セグメント上の代表点を表している。そして、未知文字の文字セグメントについての代表点ａ₁〜ａ₈はそれぞれ、セグメント辞書に格納されている文字セグメントの代表点ｂ₁〜ｂ₈に対応している。

未知文字の文字セグメントの代表点とセグメント辞書の文字セグメントの代表点との対応関係を求めた後、セグメント辞書に格納されている文字セグメント上の基準点に対応する未知文字の文字セグメントについての代表点を検査点とする。

図３７（ｂ）は、基準点と検査点との対応関係を示す図である。
図３７（ｂ）において、セグメント辞書に格納されている文字セグメントの基準点ｄ₁、ｄ₂はそれぞれ、未知文字の文字セグメントの検査点ｃ₁、ｃ₂に対応している。

基準点と検査点との対応関係を求めた後、未知文字の文字セグメントの検査点ｃ₁、ｃ₂についての検査情報を算出する。
この検査情報は、例えば、１つの検査点に対しては、その検査点が文字画像全体の中でどの位置に存在しているかという個々の検査点の絶対位置情報や、２つの検査点に対しては、それらの検査点間の距離や方向などの相対位置情報や、２つの以上の検査点に対しては、それらの検査点間の角度変化や直線性などの情報からなっている。

そして、検査点についての検査情報を算出した結果、所定の判定条件を満たす場合、判定条件を満たしたセグメント辞書に格納されている文字セグメントの文字カテゴリを未知文字の認識結果として出力する。

例えば、判定条件として、図３７（ｂ）の文字セグメント上の検査点ｃ₁から文字セグメントに沿って検査点ｃ₂までの角度変化を検査情報とした場合、この角度変化が６０度以上である文字セグメントの文字画像が、その文字セグメントに対応して格納されているセグメント辞書の「２」の文字カテゴリに属するとした場合、図３７（ｂ）の文字セグメント上の検査点ｃ₁から文字セグメントに沿って検査点ｃ₂までの角度変化を算出することにより、図３４（ａ）の文字パターンが「２」の文字カテゴリに属すると認識できる。

図３８は、詳細識別法による文字認識処理を示すフローチャートである。
図３８において、まず、ステップＳ１５０に示すように、文字認識の対象となる帳票などをスキャナで走査し、読み込んだ文字画像を白黒２値の画像に２値化する。

次に、ステップＳ１５１に示すように、ステップＳ１５０で得られた２値画像データから文字セグメントを抽出する。
次に、ステップＳ１５２に示すように、セグメント辞書に格納されている複数の文字セグメントから、未知文字の文字セグメントとの対応関係が付けられていない文字セグメントを取り出す。

次に、ステップＳ１５３に示すように、セグメント辞書から取り出した文字セグメントと未知文字の文字セグメントとの対応関係を付ける。
次に、ステップＳ１５４に示すように、未知文字の文字セグメント上にとった代表点の中から検査点を決定し、この検査点についての検査情報を算出する。

次に、ステップＳ１５５に示すように、ステップＳ１５４で算出した検査情報に基づいて、セグメント辞書から取り出した文字セグメントと未知文字の文字セグメントとを比較し、セグメント辞書から取り出した文字セグメントの検査情報と未知文字の文字セグメントの検査情報とが一致するかどうかを判定することにより、未知文字に対する文字候補の決定処理を行う。

次に、ステップＳ１５６に示すように、未知文字に対する文字候補の決定処理で、文字候補が決定した場合、ステップＳ１５３で取り出した文字セグメントに対応する文字カテゴリを認識結果として出力する。一方、文字候補が決定しない場合、ステップＳ１５７に進み、未知文字の文字セグメントとの対応関係が付けられていない未処理の文字セグメントがセグメント辞書にあるかどうかを判断し、未処理の文字セグメントがセグメント辞書にある場合、ステップＳ１５２に戻って、以上の処理を繰り返す。

一方、未知文字の文字セグメントとの対応関係が付けられていない未処理の文字セグメントがセグメント辞書にない場合、入力された未知文字は認識不能であると判断して、認識不能という認識結果を出力する。

なお、詳細識別法については、例えば、特開平６−３０９５０１号公報に記載されている。
次に、図３の接触文字認識部１３の一実施例について説明する。

図３９は、接触文字認識部１３の文字補完処理を説明する図である。
この文字補完処理では、枠接触文字の２値画像から枠だけを抽出してこの枠を除去する。この際、枠接触文字の枠に接触している文字線分の枠接触部分がかすれてしまい、文字線分が複数の部分に途切れてしまうので、途切れた文字線分について、各ラベルが付与された文字線分間の距離や方向性等の幾何学的構造を評価して、それを補完する。

例えば、図３９（ａ）に示すように、「３」を表している文字パターン１３１と枠１３２とが接触したために連結している２値画像にラベル“１”が付されている。そして、図３９（ａ）の２値画像から枠１３２を抽出し、この枠１３２を除去することにより、図３９（ｂ）に示すように、「３」を表している文字パターン１３１が３個に分割されて、ラベル“１”、ラベル“２”及びラベル“３”が付与された３個の文字線分が生成される。

このラベル“１”、ラベル“２”及びラベル“３”が付与された３個の文字線分について、各ラベルが付与された文字線分間の距離や方向性等の幾何学的構造を評価して、それを補完する。これにより、ラベル“１”、ラベル“２”及びラベル“３”が付与された３個の文字線分が連結されて、図３９（ｃ）に示すように、ラベル“１”が付された「３」を表している文字補完パターン１３２が生成される。

この文字補完処理により復元された文字は、認識文字の候補として認識処理が行われる。この認識処理では、文字カテゴリ辞書に登録されている標準パターンと照合して、相違度が最も小さい文字カテゴリのコードを出力する。

図４０は、接触文字認識部１３の再補完処理を説明する図である。
この再補完処理では、枠に平行な文字線分が枠に接触し、枠を除去したために枠に平行な文字線分が消滅した場合に、この文字線分を補完するもので、予め、枠接触文字をラベリングによる連結性を用いて抽出しておき、文字補完処理により補完された文字補完パターンと枠接触文字の連結性が一致することを検出することにより、枠に平行な文字線分を補完する。

例えば、図４０（ａ）に示すように、「７」を表している文字パターン１４１と枠１４２とが接触したために連結している２値画像にラベル“１”が付されている。そして、図４０（ａ）の２値画像から枠１４２を抽出し、この枠１４２を除去することにより、図４０（ｂ）に示すように、「７」を表している文字パターン１４１が３個に分割されて、ラベル“１”、ラベル“２”及びラベル“３”が付与された３個の文字線分が生成される。

このラベル“１”、ラベル“２”及びラベル“３”が付与された３個の文字線分について、各ラベルが付与された文字線分間の距離や方向性等の幾何学的構造を評価して、それを補完する。これにより、ラベル“１”及びラベル“２”が付与された２個の文字線分が連結されて、図４０（ｃ）に示すように、ラベル“１”及びラベル“２”が付与された２個の文字線分からなる文字補完パターン１４２が生成される。

この場合、文字補完処理で補完されるのは、図４０（ｂ）のラベル”１”が付与されていた部分とラベル”２”が付与されていた部分との間のみで、図４０（ｂ）のラベル”１”が付与されていた部分とラベル”３”が付与されていた部分については、補完することができない。この図４０（ｂ）のラベル”１”が付与されていた部分とラベル”３”が付与されていた部分の補完は、再補完処理により行う。

この再補完処理は、予め、枠接触文字をラベリングによる連結性を用いて抽出しておき、図４０（ｃ）のパターンと枠接触文字の連結性が一致することを検出することにより、枠に平行な文字線分を補完する。すなわち、図４０（ｃ）のラベル”１”が付与されたパターンとラベル”２”が付与されたパターンとは、図４０（ａ）に示すように、枠を除去する前は互いに連結していたので、図４０（ｃ）のラベル”１”が付与されたパターンとラベル”２”が付与されたパターンとを、枠に平行な線分を用いて互いに連結する。

これにより、図４０（ｃ）のラベル”１”とラベル”２”の２つの文字線分に分かれていた「７」の２値画像が補完され、図４０（ｄ）に示すように、ラベル“１”が付された「７」を表している再補完パターン１４３が生成される。

この再補完処理により復元された文字は、認識文字の候補として認識処理が行われる。この認識処理では、文字カテゴリ辞書に登録されている標準パターンと照合して、相違度が最も小さい文字カテゴリのコードを出力する。

すなわち、図４０に示す例では、図４０（ｃ）に示す文字補完パターン１４２は、「リ」の文字カテゴリに属すものと認識される。また、図４０（ｄ）に示す再補完パターン１４３は、「７」の文字カテゴリに属すものと認識される。そして、「リ」よりも「７」のほうが相違度が小さいと判断されて、最終的に「７」と認識され、その文字コードが出力される。

次に、図３の接触文字認識部１３が知識テーブル１４を参照しながら認識処理を行う場合について説明する。
図４１は、誤読文字対を学習し、知識テーブル１４に登録しておくことにより、枠接触文字を認識する例を説明する図である。

この例の場合、図４１（ａ）に示すように、「２」を表している文字パターン１５１と枠１５２とが接触したために連結している２値画像にラベル“１”が付されている。そして、図４１（ａ）の２値画像から枠１５２を抽出し、この枠１５２を除去することにより、図４１（ｂ）に示すように、「２」を表す文字１５１がラベル“１”とラベル“２”の２つの部分パターンに分離される。

次に、図４１（ｃ）に示すように、文字補完処理により、図４１（ｂ）のラベル“１”とラベル“２”の２つの部分パターンが連結され、文字補完パターン１５３が生成される。

この場合、「２」を表している文字パターン１５１の下線部分が枠１５２に接触し、その接触部分がほぼ完全に枠１５２に重なっている。このため、再補完処理を用いても、「２」を表している文字パターン１５１の下線部分を補完することができず、「２」の文字を、誤って「７」と認識してしまう可能性が高くなる。

このように、枠接触文字の一部が枠からはみ出すことなく、枠に完全に重なっているため、他の文字と誤って認識してしまう場合、誤読文字対を学習して登録しておくことにより、枠接触文字が正しく認識されるようにする。

以下、誤読文字対を学習して登録しておくことにより、枠接触文字を認識する方法について説明する。
図４２は、図３の接触文字認識部１３において、誤読文字対を学習する構成を示すブロック図である。

枠接触文字の自動生成部１６１は、入力された枠に未接触の学習文字を枠に重ね合わせて、枠接触文字を生成する。ここで、枠に対する学習文字の変動の方法により、同一の学習文字に対して複数の枠接触文字が生成される。図４２では、「２」を表している学習文字１６８が枠接触文字の自動生成部１６１に入力され、文字「２」の下辺と下枠とが重なった枠接触文字１６９を生成した例を示している。枠接触文字の自動生成部１６１により生成された情報は、知識テーブル１６７に登録される。

学習文字に枠を重ね合わせる際の変動の種類は、例えば、「文字枠に対する文字の変動」と「文字枠の変動」の２種類があり、「文字枠に対する文字の変動」には、例えば、「位置ずれ」、「サイズ変動」及び「傾き変動」などがあり、「文字枠の変動」には、例えば、「傾き変動」、「枠幅変動」、「サイズ変動」及び「枠の凹凸」などがある。

また、これらの変動についての変動量を表すパラメータとして以下のパラメータがある。なお、垂直方向にｘ軸を、水平方向にｙ軸を設定するものとする。
１．文字枠に対する文字の変動
位置ずれ：ｄｘ、ｄｙ、
ここで、ｄｘ（図４３で黒丸で示した位置）、ｄｙ（図４３で ×で示した位置）は、それぞれ、文字の重心と文字枠の重心の位置の差のｘ方向、ｙ方向の大きさを表す。

サイズ変動：ｄｓｘ、ｄｓｙ、
ここで、ｄｓｘ，ｄｓｙは、それぞれ、文字のｘ方向、ｙ方向の大きさを表す。
傾き変動：ｄα、
ここで、ｄαは、垂線に対する文字の傾き角度を表す。
２．文字枠の変動
傾き変動：ｆα、
ここで、垂線に対する文字枠の傾き角度を表す。

枠幅変動：ｗ、
ここで、ｗは、文字枠の幅を表す。
サイズ変動：ｆｓｘ、ｆｓｙ、
ここで、ｆｓｘ，ｆｓｙは、それぞれ、文字のｘ方向、ｙ方向の大きさを表す。

枠の凹凸：ｆδ、
ここで、ｆδは、例えば、ファクシミリなどに印刷された文字枠の品質劣化等を考慮した文字枠の凹凸を制御するパラメータである。例えば、文字枠の周囲長をＬとすると、ｆδは、このサイズＬの配列ｆδ〔Ｌ］として表現され、この配列の各要素ｆδ〔ｉ］（ｉ＝１、２、３，・・・）は、乱数発生により決定される−β〜＋βの範囲内の整数値をとる。
これらの変動の種類及び変動量に基づいて、学習文字に対して操作Ｆ（ｄｘ，ｄｙ，ｄｓｘ，ｄｓｙ，ｄα，ｗ，ｆｓｘ，ｆｓｙ，ｆα、ｆδ）を施すことにより、枠接触文字を生成する。

図４３は、「７」を表す学習文字１７１に対して枠１７２を合成することにより、枠接触文字を生成する例を示す図である。
図４３（ａ）に示すように、「７」を表す学習文字１７１に対して変換操作Ｆ（ｄｘ，ｄｙ，ｄｓｘ，ｄｓｙ，ｄα，ｗ，ｆｓｘ，ｆｓｙ，ｆα、ｆδ）を施すことにより、図４３（ｂ）に示すように、枠１７２に接触する「７］の枠接触文字を生成する。

すなわち、学習文字１７１及び枠１７２に対して変換操作Ｆ（ｄｘ，ｄｙ，ｄｓｘ，ｄｓｙ，ｄα，ｗ，ｆｓｘ，ｆｓｙ，ｆα、ｆδ）を施し、学習文字１７１と枠１７２とを重ね合わせることにより、枠接触文字を生成する。この場合、例えば、枠１７２の方の重心の位置を固定しながら変換操作Ｆ（ｄｘ，ｄｙ，ｄｓｘ，ｄｓｙ，ｄα，ｗ，ｆｓｘ，ｆｓｙ，ｆα、ｆδ）を実行する。

図４４は、ｘ方向のサイズ変動ｆｓｘ及びｙ方向のサイズ変動ｆｓｙを固定し、枠の大きさを固定した場合について、「３」の学習文字に対して生成した各種枠接触文字の例を示す図である。

図４４（ａ）は、変動の種類が“位置ずれ”の場合の例であり、変動量がｄｘ＝０、ｄｙ＞０の場合である。この場合、「３」の文字が枠の下にはみ出すことになる（下位置変動）。

図４４（ｂ）は、変動の種類が“サイズ変動”の場合の例であり、変動量がｄｓｘ＝ｆｓｘ，ｄｓｙ＝ｆｓｙの場合である。この場合、「３」の文字が枠の上下、左右に接触することになり、「３」の外接矩形が枠に等しくなる。

図４４（ｃ）は、変動の種類が“文字の傾き変動”の例であり、変動量がｄα＝１０度の場合である。
図４４（ｄ）は、変動の種類が“文字枠の傾き変動”の例であり、変動量がｆα＝−１０度の場合である。

図４４（ｅ）は、変動の種類が“枠幅変動”の例であり、変動量がｗ＝５の場合である。
図４４（ｆ）は、変動の種類が、“枠の凹凸”の例であり、変動量ｆδ〔Ｌ］の各要素ｆδ〔ｉ］を制御した場合である。

次に、図４２の枠除去部１６２は、枠接触文字の自動生成部１６１により生成された枠接触文字から枠のみを抽出し、この枠を除去して得られたかすれ文字についての画像データを、文字補完部１６３に出力する。

文字補完部１６３は、枠除去部１６２によって枠が除去された文字の画像データを、ラベルが付与された文字線分間の距離や方向性等の幾何学的構造を評価して補完する。図４２は、枠接触文字の自動生成部１６１により生成された枠接触文字１６９から枠を除去した後、文字補完部１６３により補完を行って文字補完パターン１７０を生成した例を示している。

再補完部１６４は、文字補完部１６３によって補完しきれなかった領域について、予め、枠接触文字をラベリングによる連結性を用いて抽出しておき、文字補完部１６３により補完されたパターンと枠接触文字の連結性が一致することを検出することにより、枠に平行な文字線分を補完する。

文字補完部１６３によって補完された文字補完パターンと再補完部１６４によって補完された再補完パターンとは、基本文字認識部１６５に入力される。
基本文字認識部１６５は、文字補完部１６３によって補完された文字補完パターンと再補完部１６４によって補完された再補完パターンについて、文字認識を実行する。そして、各学習文字についての認識結果を枠接触状態と認識の知識獲得部１６６に出力する。

枠接触状態と認識の知識獲得部１６６は、基本文字認識部１６５から出力される認識結果を予め与えられている正解データと比較して、全サンプルデータに対する認識率を得る。そして、この認識率を信頼度として、また、誤読文字（誤って認識した文字）と正解の文字との組み合わせを誤読文字対として、知識テーブル１６７に登録する。なお、上記誤読文字対は、例えば、文字コードにより登録される。また、枠接触状態と認識の知識獲得部１６６は、枠と文字の接触状態の特徴を示すパラメータを抽出して、これも知識テーブル１６７に登録する。

このようにして、知識テーブル１６７には、各文字カテゴリについて、枠と文字の様々な接触状態におけるその文字に対する認識率が、その誤読文字対とともに登録される。
図４５は、学習により生成された知識テーブル１６７の一例を示す図である。

図４５において、知識テーブル１６７には、例えば、誤読文字対（２、７）及び信頼度７７％が、“下位置ずれ変動”の変動量ｄｙ＝５、Ｗ＝５等と共に登録され、変動量が、ｄｙ＝５、Ｗ＝５の“下位置ずれ”の「２」の枠接触文字の場合、基本文字認識部１６５は、２３％の確率で、「２」を誤って「７」と認識してしまうことが示される。すなわち、この場合、基本文字認識部１６５が「７」と認識したとしても、その信頼度は７７％であり、実際の文字が「２」である可能性が２２％ある旨が知識テーブル１６７を参照することにより判断できる。

同様にして、他の誤読され易い文字対についても、“変動量”、“枠の線幅”、“誤読文字対”及び信頼度が、枠接触状態と認識の知識獲得部１６６によって知識テーブル１６７に登録される。

なお、誤読文字対（Ｌ１、Ｌ２）は、実際は、文字「Ｌ１」が文字「Ｌ２」に誤って認識されてしまう場合を示すものである。また、上記文字「Ｌ１」、「Ｌ２」には、例えば、該当する文字「Ｌ１」、「Ｌ２」の文字コードが登録される。

知識テーブル１６７には、図４５に示す変動量ｄｙ＝５，Ｗ＝５の“下位置ずれ変動”以外にも、図４６に示すように“文字枠に対する文字の傾き変動”（この場合、左枠接触）などの図４３に示す各種変動について、各文字カテゴリ毎に登録される。

すなわち、例えば、図４６に示すように、“下位置ずれ”変動については、例えば、ｄｘ＝「−３」〜「＋３」、ｄｙ＝５、ｗ＝５、ｄｓｙ＝１、ｄα＝「−１０」〜「＋１０」、ｆα＝「−１０」〜「＋１０」が登録される。このように、同じ”下位置ずれ”変動であっても、知識テーブル１６７に登録される変動量は、ｘ方向の位置ずれｄｘ、ｙ方向の位置ずれｄｙのみでなく、その他の変動量が登録される場合がある。また、“左枠接触の文字枠に対する文字の傾き変動”については、例えば、ｄｘ＝「−３」〜「＋３」、ｄｙ＝「−３」〜「＋３」、ｗ＝５，ｄｓｙ＝１，ｄα＝「−２０」〜「＋２０」、ｆα＝「−１０」〜「＋１０」が登録される。

また、信頼度が予め定められた所定のしきい値（例えば、９０％）以下の誤読文字対（Ｌ１，Ｌ２）について、信頼度がその所定のしきい値以上となるような文字認識方法を学習し、学習した文字認識方法を知識テーブル１６７に登録する。

例えば、図４５に示すように、ｄｙ＝５，ｗ＝５の”下位置ずれ”の状態の「２」の枠接触文字の文字認識の信頼度は７７％であり、「７」と誤って認識される確率が高いので、文字補完部１６３により補完された文字補完パターンまたは再補完部１６４により補完された再補完パターンを、例えば、領域強調の手法により再認識すれば認識率が向上することを学習して知識テーブル１６７に登録しておく。

この（２、７）の誤読文字対の場合における領域強調の手法を図４７を参照しながら説明する。
まず、図４７（ａ）に示すように、文字補完部１６３により補完された文字補完パターンまたは再補完部１６４により補完された再補完パターンの外接矩形１８０を、縦の行がｍ個、横の列がｎ個のｍ×ｎ個の分割領域に分割する。そして、図４７（ｂ）にハッチングで示すように、外接矩形１８０の上半分のｍ／２×ｎ個の領域を特に強調して、文字認識を再度行う。

すなわち、このｍ／２×ｎ個の領域の特徴パラメータを抽出して、文字補完部１６３により補完された文字補完パターンまたは再補完部１６４により補完された再補完パターンが「２」または「７」のいずれであるかを調べる。この領域強調の手法により、認識度が９５％まで向上する。図４５の知識テーブル１６７には、誤読文字対が（２、７）の行に、再認識方法として「領域強調」を、再認識領域として「ｍ／２×ｎ」を、さらに再認識信頼度として「９５％」を登録する。

この領域強調の手法は、図４８（ａ）に示すような枠接触文字の場合にも有効である。図４８（ａ）は、「２」を表している文字パターンの下部が文字枠１８２に接触している例である。

この場合、文字補完部１６３により、図４８（ｂ）に示すような「７」に類似する文字補完パターン１８３が得られる。この文字補完パターン１８３に対して図４８（ｃ）に示す外接矩形１８４を算出する。そして、この外接矩形１８４を、図４７に示すように、ｍ×ｎ個の領域に分割した後、上半分のｍ／２×ｎ個の部分領域１８５を特に強調して文字認識すれば、文字補完パターン１８３が「２」と認識される確率が高い、すなわち、正解率（信頼度）が高くなることを学習し、枠接触による誤読文字対（２、７）に対する再認識方法として、上記領域強調の手法を知識テーブル１６７に登録する。

図４９は、領域強調による文字パターンの再認識方法を示すフローチャートである。
図４９において、まず、ステップＳ６０１に示すように、知識テーブル１６７から信頼度の低い誤読文字対のデータを取り出す。そして、この誤読文字対の左側に登録されている文字について、２値の学習データとしての文字パターンと、文字補完部１６３により補完された文字補完パターンまたは再補完部１６４により補完された再補完パターンとを入力する。

この文字補完パターンまたは再補完パターンは、知識テーブル１６７に登録されている変動量パラメータによって規定されるパターンであり、同一カテゴリであっても複数の形状のパターンを取りうる。

次に、ステップＳ６０２に示すように、ステップＳ６０１で入力された学習データとしての文字パターンと、文字補完部１６３により補完された文字補完パターンまたは再補完部１６４により補完された再補完パターンとを、ｍ×ｎの領域に分割する。

そして、ステップＳ６０３に示すように、このｍ×ｎの領域内のＸ×Ｙの部分パターンについて文字認識を実行する。そして、この場合の認識率ｚを求める。
上記Ｘ×Ｙの部分パターンは、再認識領域である。このとき、Ｘ，Ｙは、それぞれ、ｍ×ｎの領域のＸ方向、Ｙ方向の長さを表す変数であり、Ｘ≦ｍ，Ｙ≦ｎである。また、上記認識率ｚは、上記Ｘ×Ｙの部分パターンを用いて文字認識を行った際の、正解となる確率である。

すなわち、学習データとしての文字パターンの部分パターンの文字認識結果を正解とみなす。そして、文字補完部１６３により補完された文字補完パターンまたは再補完部１６４により補完された再補完パターンについての複数の部分パターンに対する文字認識結果を、学習データとしての文字パターンの部分パターンの文字認識結果と比較していくことにより、文字補完部１６３により補完された文字補完パターンまたは再補完部１６４により補完された再補完パターンについての部分パターンの認識率ｚを求める。

続いて、ステップＳ６０４に示すように、認識率ｚが最大認識率ｍａｘよりも大きいか否かを判別する。この最大認識率ｍａｘは、Ｘ×Ｙの部分パターンを変化させていった場合における認識率ｚの最大値を記憶する変数であり、最初はある初期値（例えば、「０」）が設定される。

そして、認識率ｚが最大認識率ｍａｘよりも大きければ、ステップＳ６０５に進んで、この認識率ｚを最大認識率ｍａｘに代入し、続いて、ステップＳ６０６に進んで、長さＸ，Ｙを変更可能か否か調べる。一方、ステップＳ６０４で、認識率ｚが最大認識率ｍａｘ以下であれば、直ちに、このステップＳ６０６に移行する。

この長さＸ，Ｙの変更操作は、例えば、長さＸ，Ｙの大きさの変更である。また、Ｘ×Ｙの部分パターンのｍ×ｎの領域内での位置変更操作を含んでいてもよい。
ステップＳ６０６で、長さＸ，Ｙを変更可能であると判別すると、ステップＳ６０３に戻り、長さＸ，Ｙの変更操作を行い、新たなＸ×Ｙの部分パターンを決定し、この部分パターンに対して文字認識を行う。

以上述べたステップＳ６０３〜Ｓ６０６の処理を、上記ステップＳ５０６で長さＸ，Ｙを変更できないと判別するまで繰り返す。そして、ステップＳ６０６で長さＸ，Ｙを変更できないと判別すると、最大識別率ｍａｘとその最大識別率ｍａｘが得られたＸ×Ｙの部分パターンを、それぞれ、再認識信頼度、再認識領域として知識テーブル１６７に登録する。また、再認識方法として「領域強調」を知識テーブル１６７に登録する。

なお、図４９のフローチャートは、「領域強調」の手法を用いて再文字認識の方法を学習する例であるが、「領域強調」の手法以外についても、再文字認識の方法を学習するようにしてもよい。

図５０は、学習により得られた知識テーブル１６７を用いて枠接触文字の文字認識を行う構成を示すブロック図である。
図５０において、枠接触状態の検出部１９１は、入力された未知の枠接触文字について、枠と文字との接触状態を検出する。ここでは、図５０（ａ）の下枠が「２」の下辺と部分的に重なっている枠接触文字パターン２０１と、図５０（ｂ）の下枠が「２」の下辺と完全に重なっている枠接触文字パターン２０３とが入力された例について示している。そして、枠接触状態の検出部１９１は、枠接触文字パターン２０１及び枠接触文字パターン２０３を検出する。

枠除去部１９２は、枠接触状態の検出部１９１により検出された枠接触文字パターンから枠を除去する。
文字補完部１９３は、枠除去部１９２により枠が除去された文字パターンについて、ラベルが付与された文字線分間の距離や方向性等の幾何学的構造を評価して補完する。

再補完部１９４は、文字補完部１９３によって補完しきれなかった領域について、予め、枠接触文字をラベリングによる連結性を用いて抽出しておき、文字補完部１６３により補完されたパターンと枠接触文字の連結性が一致することを検出することにより、枠に平行な文字線分を補完する。ここで、再補完パターン２０２は、図５０（ａ）の枠接触文字パターン２０１に対し、再補完部１９４の再補完処理により補完されたパターンを示し、再補完パターン２０４は、図５０（ｂ）の枠接触文字パターン２０３に対し、再補完部１９４の再補完処理により補完することができなかったパターンを示している。

基本文字認識部１９５は、文字補完部１９３によって補完された文字補完パターンと再補完部１９４によって補完された再補完パターンとのそれぞれに対し、文字認識を実行する。この結果、例えば、図５０（ａ）の再補完パターン２０２に対しては、「２」の文字コードが出力され、図５０（ｂ）の再補完パターン２０４に対しては、「７」の文字コードが出力される。そして、その認識結果により得られた文字コードを、枠接触状態と認識の知識参照部１９６に出力する。

枠接触状態と認識の知識参照部１９６は、文字補完部１９３によって補完された文字補完パターン又は再補完部１９４によって補完された再補完パターンの外接矩形の位置情報及び図５０（ａ）の枠接触文字パターン２０１又は図５０（ｂ）の枠接触文字パターン２０３から抽出された文字枠の位置情報や幅情報などを基に、変動の種類を求める。

すなわち、図４３に示されているような”位置ずれ”、”サイズ変動”、”傾き変動”などの文字枠に対する文字の変動、または、”傾き変動”、枠幅変化”、”枠の凹凸”などの文字枠の変動を求める。さらに、求めた各変動の種類について、変動量ｄｘ，ｄｙ，ｄｓｘ，ｄｓｙ，ｄα、ｗ，ｆｓｘ，ｆｓｙ，ｆα、ｆδを算出する。

次に、算出した変動種類情報及び変動量情報と、基本文字認識部１９５から入力される文字コードとをキー項目として、知識テーブル１６７を検索し、このキー項目に一致する変動種類情報、変動量情報及び誤読文字対を有する行が知識テーブル１６７に登録されているか否か調べる。

そして、キー項目に一致する行が存在した場合には、この行に登録されている信頼度が所定のしきい値以上であるか否かを判別し、そのしきい値未満であれば、文字補完部１９３によって補完された文字補完パターン又は再補完部１９４によって補完された再補完パターンを再文字認識部１９７に出力し、その行に登録されている再認識方法に従って、文字認識を再度行う。

すなわち、文字補完部１９３によって補完された文字補完パターン又は再補完部１９４によって補完された再補完パターン、あるいは未知文字の２値画像データを用いて、基本文字認識部１９５による手法とは別の手法で未知画像データに含まれる枠接触文字の再認識を実行する。そして、再認識により得られた文字コードを出力する。

例えば、基本文字認識部１９５が、再補完部１９４によって補完された再補完パターン２０４の認識結果として、「７」の文字コードを出力した場合、枠接触状態と認識の知識参照部１９６は、再補完パターン２０４の外接矩形の位置情報と枠接触文字パターン２０３から抽出した文字枠の位置情報及び幅情報とを基に、変動の種類及び変動量を求める。この結果、変動の種類として“下位置ずれ”が算出され、この“下位置ずれ”の変動量として「ｄｙ＝５」が算出され、文字枠の幅として「ｗ＝５」が算出される。

そして、枠接触状態と認識の知識参照部１９６は、変動の種類として“下位置ずれ”、“下位置ずれ”の変動量として「ｄｙ＝５」、文字枠の幅として「ｗ＝５」、及び基本文字認識部１９５から入力された文字コード「７」をキー項目として、図４５の知識テーブル１６７を検索する。この検索の結果、これらのキー項目に対応する行には誤読文字対（２、７）が登録され、基本文字認識部１９５で認識された文字コード「７」の信頼度は７７％であり、２３％の確率で「２」を「７」と読み間違えていることを知る。

この場合、これらのキー項目に対応する行に登録されている信頼度は所定のしきい値よりも低いので、再文字認識部１９７は、基本文字認識部１９５による手法とは別の手法で未知画像データに含まれる枠接触文字パターン２０３の再認識を実行する。この際、再文字認識部１９７は、知識テーブル１６７のキー項目に対応する行を参照し、再認識方法を特定する。

すなわち、再文字認識部１９７は、再認識方法として、「領域強調」を行うことを教えられるとともに、「領域強調」を行う場合の再認識領域として、再補完パターン２０４の上半分のｍ／２×ｎの部分領域２０５だけを強調して再認識することを教えられる。また、この場合の再認識信頼度が９５％であることも教えられる。

再文字認識部１９７は、知識テーブル１６７に登録されている再認識方法に従って、再補完パターン２０４の上半分の部分領域２０５のみについての再認識を行う。そして、再補完パターン２０４の部分領域２０５は、文字コード「２」に対応する文字パターン２０６の部分領域２０７に９５％の確率で一致し、文字コード「７」に対応する文字パターン２０８の部分領域２０９に５％の確率で一致することを知り、未知の枠接触文字パターン２０３の枠に接触した文字の認識結果として、文字コード「２」を出力する。

図５１は、枠接触状態と認識の知識参照部１９６の動作を示すフローチャートである。
図５１において、まず、ステップＳ１７１に示すように、未知の枠接触文字パターンから抽出した枠と、枠接触文字パターンから分離した文字パターンとに基づいて、文字の枠に対する変動量を算出し、この変動量をキー項目として知識テーブル１６７を探索する。そして、この算出された変動量に一致する変動量を登録している行が知識テーブル１６７に存在するか否かを調べる。

これにより、例えば、下位置ずれ変動となっている「２」の文字について、その変動量としてｄｘ＝５，ｗ＝５が算出されると、図４５に示す知識テーブル１６７の最上位の行が検出される。

そして、変動量が一致する行が存在する場合、ステップＳ１７２に進み、基本文字認識部１９５から入力される文字コード（文字認識コード）を誤読文字対に含んでいる行が、変動量が一致する行の中に存在するか否かを調べる。

これにより、例えば、下位置ずれ変動となっている「２」の文字の場合、図４５に示す知識テーブル１６７の最上位の行が検出される。
そして、ステップＳ１７３に示すように、基本文字認識部１９５から入力される文字コードを誤読文字対に含んでいる行が、変動量が一致する行の中に存在する場合、知識テーブル１６７の該当する行に登録されている再認識信頼度と基本文字認識部１９５により算出された信頼度とを比較し、知識テーブル１６７の該当する行に登録されている再認識信頼度が基本文字認識部１９５により算出された信頼度よりも大きいか否か判別する。

これにより、例えば、下位置ずれ変動となっている「２」の文字の場合、図４５に示す知識テーブル１６７の最上位の行に登録されている再認識信頼度及び基本文字認識部１９５により算出された信頼度が、それぞれ、「９５％」及び「７７％」であり、知識テーブル１６７の該当する行に登録されている再認識信頼度が基本文字認識部１９５により算出された信頼度よりも大きいと判別される。

知識テーブル１６７の該当する行に登録されている再認識信頼度が基本文字認識部１９５により算出された信頼度よりも大きい場合、ステップＳ１７４に進み、知識テーブル１６７の該当する行に登録されている再認識信頼度が予め定められたしきい値ｔｈ１よりも大きいか否かを判別し、しきい値ｔｈ１よりも大きけば、ステップＳ１７５に進み、知識テーブル１６７のステップＳ１７２で検出した行に登録されている「再認識方法」及び「再認識領域」を参照する。

次に、ステップＳ１７６に示すように、文字補完部１９３によって補完された文字補完パターン又は再補完部１９４によって補完された再補完パターンから、知識テーブル１６７で示される「再認識領域」を切り出し、この切り出した領域について、知識テーブル１６７で示される「再認識方法」により文字認識を実行する。そして、その文字認識により得られた文字コードを出力する。

これにより、例えば、しきい値ｔｈ１が「９５％」よりも小さい場合、基本文字認識部１９５により入力される下位置ずれ変動となっている「２」の文字の補完パターンについて、上半分の「ｍ／２×ｎ」の領域を用いた「領域強調」手法により、文字認識が再度実行され、最終的に「２」の文字コードが出力される。

なお、枠接触文字の認識方法については、例えば、特願平７−２０５５６４号の明細書及び図面に記載されている。
次に、図３の文字列認識部１５の一実施例について説明する。

この文字列認識部１５は、図４のステップＳ２のレイアウト解析により抽出された文字列に対し、この文字列から文字を一文字ずつ切り出す際に用いる特性値としてのパラメータについて、文字の統合判定を行うの際の閾値をヒューリスティクに決定するのではなく、統計的に妥当な値を設定するようにしたものである。

具体的には、各パラメータ毎に、パラメータ値とそのパラメータ値に対する文字の統合の成功又は失敗に関する統計データをとる。そして、各パラメータを個別に評価するのではなく、全てのパラメータを多次元空間上の１点として捉え、多変量解析の手法を用いて、統合が成功した場合と統合が失敗した場合との２群を分離する判別面を上記多次元空間内で求めるようにする。

すなわち、パターンの特徴を示すＰ個の特性値からなるサンプルデータを、切り出し成功を示す第１の群と切り出し失敗を示す第２の群とに分類し、第１の群と第２の群との判別面をＰ次元空間において生成するものである。

この判別面は、例えば、判別分析法により求めることができる。すなわち、判別面を線形な判別関数により構成する場合、その判別関数の係数ベクトルは、
Σ^-1（μ₁−μ₂）・・・（３）
で与えられる。

ここで、
Σ ：第１の群及び第２の群の母分散共分散行列、
μ₁：第１の群の母平均ベクトル、
μ₂：第２の群の母平均ベクトル、
である。

（３）式の係数ベクトルを有する判別関数は、前記第１の群と前記第２の群の各重心から等距離となるように構成される。
なお、この判別関数の係数ベクトルは、第１の群と第２の群との間の群間変動の群内変動に対する比を最大にするという基準に基づいて、算出することもできる。

また、文字列から文字を切り出す処理は、パターンの外接矩形の位置、サイズ、並びなどからパターン同士を統合していく統計的処理と、文字列中の濁点、分離文字などを処理するためにパターン形状に着目する非統計的処理に分けて実行する。

統計的処理では、パターンの外接矩形の位置、縦横比、平均文字サイズに対するサイズ比、隣接するパターン同士の距離、統合したときのサイズ、パターン同士の重なり幅、文字列の粗密度などを切り出しパラメータとして用いる。

例えば、図５２に示すように、
１）外接矩形２１１の右枠と外接矩形２１２の左枠との距離ａ、
２）外接矩形２１１の左枠と外接矩形２１２の右枠との距離ｂ、
３）外接矩形２１１の右枠と外接矩形２１２の左枠との距離ａと外接矩形２１１の左枠と外接矩形２１２の右枠との距離ｂとの比ｃ、
４）外接矩形２１１の左枠と外接矩形２１２の右枠との距離ｂと外接矩形平均幅ＭＸとの比ｄ、
５）外接矩形２１３の下枠と外接矩形２１３の下枠の中点から外接矩形２１４の下枠の中点とを結ぶ直線とのなす角度ｅ、
６）外接矩形２１３の下枠と外接矩形２１３の右下の頂点から外接矩形２１４の左下の頂点とを結ぶ直線とのなす角度ｆ、
７）外接矩形２１５と外接矩形２１６とが重なっている場合、外接矩形２１５の右枠と外接矩形２１６の左枠との距離ｐと外接矩形２１５の左枠と外接矩形２１６の右枠との距離ｑとの比ｇ、
を切り出しパラメータとして用いる。

すなわち、
ｃ＝ａ／ｂ・・・（４）
ｄ＝ｂ／ＭＸ・・・（５）
ｇ＝ｐ／ｑ・・・（６）
である。

次に、統計的処理を図５３のフローチャートを参照しながら説明する。
まず、ステップＳ１８１に示すように、連結パターンの外接矩形を取り出す。
次に、ステップＳ１８２に示すように、ステップＳ１８１で取り出した外接矩形の右隣に他の外接矩形があるかどうか調べる。そして、ステップＳ１８１で取り出した外接矩形の右隣に他の外接矩形がない場合、ステップＳ１８１で取り出した外接矩形を統計的処理の対象から除外する。

一方、ステップＳ１８２において、ステップＳ１８１で取り出した外接矩形の右隣に他の外接矩形があると判断された場合、ステップＳ１８４に進む。
また、ステップＳ１８３に示すように、文字列の外接矩形の平均文字サイズを算出する。ここで、文字列の外接矩形の平均文字サイズを算出する場合、１文字ごとの切り出しがまだ行われていないので、厳密には、正確な平均文字サイズを算出することができない。

そこで、例えば、連結パターンの外接矩形を仮統合することにより、暫定的に平均文字サイズを算出する。仮統合の方法として、近接する連結パターンを統合した際の縦横比Ｐが、例えば、
Ｎ（＝０．８）＜Ｐ＜Ｍ（＝１．２）
を満たす場合、仮統合を行う。そして、仮統合を行った後の平均文字サイズを算出する。なお、文字列の外接矩形の平均文字サイズは、外接矩形のサイズ別の頻度ヒストグラムを生成して求めるようにしてもよい。

次に、ステップＳ１８４に示すように、図５２のパラメータａ〜ｇを算出する。
非統計的処理では、文字列中の濁点や分離文字などを対象にしており、分離文字処理と濁点処理とに分ける。

分離文字に対する処理では、パターンの傾き、線密度、隣接するパターン同士を統合したときのサイズ、パターン同士の距離を切り出しパラメータとして用いる。
例えば、図５４に示すように、
８）外接矩形２２１の右枠と外接矩形２２２の左枠との距離ａと外接矩形２２１の左枠と外接矩形２２２の右枠との距離ｂとの比ｐ、
９）外接矩形２２１の左枠と外接矩形２２２の右枠との距離ｂと外接矩形平均幅ＭＸとの比ｑ、
１０）外接矩形２１の面積ｃと外接矩形２２の面積ｄとの積と外接矩形平均幅ＭＸと外接矩形平均高さＭＹとの積の平方との比ｒ、
を切り出しパラメータとして用いる。

すなわち、
ｐ＝ａ／ｂ・・・（７）
ｑ＝ｂ／ＭＸ・・・（８）
ｒ＝（ｃ×ｄ）／（ＭＸ×ＭＹ）²・・・（９）
である。

次に、分離文字処理を図５５のフローチャートを参照しながら説明する。この分離文字処理は、例えば、“ハ”又は“ル”などのように２つ以上の連結パターンから構成される分離文字を検出するものである。

まず、ステップＳ１９１に示すように、連結パターンのうち、右上がりとなっているパターンがあるかどうか判断する。そして、右上がりとなっているパターンがない場合、分離文字処理の対象から除外する。

一方、ステップＳ１９１において、右上がりとなっているパターンであると判断された場合、ステップＳ１９２に進み、右上がりとなっているパターンの右隣に隣接し、且つ右下がりとなっているパターン、すなわち、例えば、“ハ”に対応するパターン、又は、右上がりとなっているパターンの右隣に隣接し、且つ直角方向に探索した場合のパターンと交差する回数（直角線密度）が２となるパターン、すなわち、例えば、“ル”に対応するパターンがあるかどうか判断する。そして、これらの“ハ”又は“ル”などのような形状のパターンでなければ、分離文字処理の対象から除外する。

一方、ステップＳ１９２において、“ハ”又は“ル”などのような形状のパターンであると判断した場合、ステップＳ１９４に進む。
また、上記ステップＳ１９１、Ｓ１９２とは別に、ステップＳ１９３で、文字列の外接矩形の平均文字サイズを算出する。

上記ステップＳ１９２とＳ１９３が終了した後、ステップＳ１９４で、図５４に示されたパラメータｐ〜ｒの値を算出する。
また、濁点処理では、濁点候補パターンに着目し、例えば、そのパターンとその隣接パターンを統合したときのサイズ、両パターン間の距離、及びそれらと平均文字サイズとの比を、切り出しパラメータとして用いる。

すなわち、図５６に示すように、
１１）外接矩形２３１の右枠と外接矩形２３２の左枠との距離ａと外接矩形２３１の左枠と外接矩形２３２の右枠との距離ｂとの比ｐ、
１２）外接矩形２３１の左枠と外接矩形２３２の右枠との距離ｂと外接矩形平均幅ＭＸとの比ｑ、
１３）外接矩形２３１の面積ｃと外接矩形２３２の面積ｄとの積と外接矩形平均幅ＭＸと外接矩形平均高さＭＹとの積の平方との比ｒを、
切り出しパラメータとして用いる。

すなわち、パラメータｐ〜ｒは、（７）〜（９）式と同様に表すことができる。
次に、濁点処理を図５７のフローチャートを参照しながら、説明する。
まず、ステップＳ２０１で、濁点候補となるパターンを抽出する。すなわち、例えば、連結パターン抽出手段１により抽出された連結パターンが２つ隣接して存在する場合で、且つそれらを統合した時のサイズと文字列の外接矩形の平均文字サイズとの比が所定のしきい値以下、例えば、１／４以下である場合、濁点候補となるパターンとして抽出する。

次に、ステップＳ２０２に示すように、濁点候補となるパターンの左隣に隣接する外接矩形があるかどうかを調べる。そして、濁点候補となるパターンの左隣に隣接する外接矩形がない場合、濁点候補となるパターンを濁点処理の対象から除外する。

一方、ステップＳ２０２において、濁点候補となるパターンの左隣に隣接する外接矩形があると判断された場合、ステップＳ２０４に進む。
また、上記ステップＳ２０１、Ｓ２０２とは別に、ステップＳ２０３で、文字列の外接矩形の平均文字サイズを算出する。そして、上記ステップＳ２０２、Ｓ２０３の処理が終了した後、ステップＳ２０４で、図５６に示されたパラメータｐ〜ｒの値を算出する。

次に、学習データを用いて、未知の手書き文字列に対する文字の切り出しの信頼度を算出するための判別面を設定し、パラメータ数がｎの場合、切り出しが成功した群と切り出しが失敗した群との２群をｎ次元の空間上に生成する。

図５８は、切り出しの成否データの算出方法を示すフローチャートである。
図５８において、まず、ステップＳ２１１で、事前に集めた学習データに対して、着目する外接矩形とそれに隣接する外接矩形とを統合して１文字になるかどうかを目視により判断する。そして、着目する外接矩形とそれに隣接する外接矩形とを統合して１文字になる場合、ステップＳ２１２に進み、着目する外接矩形とそれに隣接する外接矩形とを統合して１文字にならない場合、ステップＳ２１３に進む。

ステップＳ２１２では、着目する外接矩形とそれに隣接する外接矩形とを統合して１文字になる統合成功の場合について、その着目する外接矩形とそれに隣接する外接矩形におけるパラメータの値を記録する。ここで、着目する外接矩形とそれに隣接する外接矩形におけるパラメータは、統計的処理の場合、図４８のパラメータａ〜ｇを用いることができ、非統計的処理の場合、図５４、５６のパラメータｐ〜ｒを用いることができる。

また、ステップＳ２１３では、着目する外接矩形とそれに隣接する外接矩形とを統合して１文字にならない統合失敗の場合について、その着目する外接矩形とそれに隣接する外接矩形におけるパラメータの値を記録する。

次に、未知の文字列について、統計的処理における切り出しパラメータと非統計的処理における切り出しパラメータの値を算出し、このパラメータの値によって定まる多次元空間上の点に対し、学習データにより得られている判別面からの距離を求め、これを切り出しの信頼度として定量化する。

例えば、特徴量パラメータ数が３の場合、図５９に示すように、切り出し成功と切り出し失敗との２群を判別する判別面をＨ、判別面Ｈの単位法線ベクトルをｎとし、あるパラメータの値がｐのベクトル値をとるとき、そのパラメータの値に対応する３次元空間内の点ｐの判別面からの距離ｈは、
ｈ＝ＯＰ・ｎ・・・（１０）
と表される。ここで、ＯＰは、３次元空間内の原点Ｏから３次元空間内の点ｐに向けたベクトルである。

そして、判別面Ｈからの距離ｈが正をとるか負をとるかで、パラメータの値がどちらの群、すなわち、切り出しが成功した方の群または切り出しが失敗した方の群のいづれの群に属するか、また、パラメータの値が判別面Ｈからどの程度離れているかが分かる。

次に、図６０に示すように、多次元空間内の学習データの全パラメータに対して、判別面Ｈからの距離ｈに基づいて、切り出し成功のヒストグラム分布２４１と切り出し失敗のヒストグラム分布２４２をとる。一般的に、このヒストグラム分布２４１、２４２は正規分布になるので、ヒストグラム分布２４１、２４２を正規分布で近似する。これらの正規分布は、通常、部分的に重なる領域が生ずる。

本実施例では、この重なる領域に位置する切り出しパラメータを有する隣接パターンについての切り出しの信頼度に加え、文字認識の信頼度を加味してそれらを統合するか否かを判定する。

図６１は、切り出し信頼度の算出法の一例を示すフローチャートである。
図６１において、まず、ステップＳ２２１に示すように、複数のパラメータの値によって定まる多次元空間上の点に対する判別面Ｈからの距離ｈを、前記（１０）式により算出する。

次に、ステップＳ２２２に示すように、学習データにより得られた複数のパラメータの値のヒストグラム分布を正規分布で近似する。すなわち、例えば、図６２に示すように、切り出し成功のヒストグラム分布を正規分布２５１で近似し、切り出し失敗のヒストグラム分布を正規分布２５２で近似する。

次に、ステップＳ２２３で、２群の重なり領域を算出する。例えば、図６２に示すように、切り出し成功の正規分布２５１と切り出し失敗の正規分布２５２とが重なる領域を２群の重なり領域２５４として算出する。また、このとき、切り出し成功の正規分布２５１の内、上記２群の重なり領域２５４以外の領域２５３を切り出し成功領域と設定する。さらに、切り出し失敗の正規分布２５２の内、上記２群の重なり領域２５４以外の領域２５５を切り出し失敗領域と設定する。

次に、ステップＳ２２４に示すように、未知文字についての入力パラメータの値のヒストグラム分布上での位置を判定する。
次に、ステップＳ２２５に示すように、未知文字についての入力パラメータの値のヒストグラム分布上での位置を判定した結果、未知文字についての入力パラメータの値が２群の重なり領域２５４に含まれる場合、ステップＳ２２６に進む。そして、２群の重なり領域２５４での未知文字についての入力パラメータの値の位置に基づいて、切り出し信頼度を算出する。

一方、ステップＳ２２５において、未知文字についての入力パラメータの値が２群の重なり領域２５４に含まれないと判断された場合、ステップＳ２２６に進み、未知文字についての入力パラメータの値が切り出し成功領域２５３に含まれるかどうかを判断する。

そして、未知文字についての入力パラメータの値が切り出し成功領域２５３に含まれると判断された場合、ステップＳ２２８に進み、切り出し信頼度を“１”とし、未知文字についての入力パラメータの値が切り出し成功領域２５３に含まれないと判断された場合、ステップＳ２２９に進み、切り出し信頼度を“０”とする。

例えば、図６２において、未知文字についての入力パラメータの値に対する判別面からの距離を算出した結果、未知文字についての入力パラメータの値の判別面からの距離が重なり領域２５４に含まれる場合、未知文字についての入力パラメータの値の判別面からの距離に基づいて、切り出し信頼度を算出する。また、未知文字についての入力パラメータの値の判別面からの距離が切り出し成功領域２５３に含まれる場合、その切り出し信頼度を“１”とする。また、未知文字についての入力パラメータの値の判別面からの距離が切り出し失敗領域２５５に含まれる場合、その切り出し信頼度を“０”に設定する。

図６３は、２群の重なり領域算出方法の一例を示すフローチャートである。
図６３において、まず、ステップＳ２３１に示すように、学習データから得られた切り出し成功のヒストグラム分布と切り出し失敗のヒストグラム分布のそれぞれについて、ヒストグラム２６１の平均値ｍと分散値ｖとを算出する。

次に、ステップＳ２３２で、切り出し成功のヒストグラム分布と切り出し失敗のヒストグラム分布について、正規分布曲線２６２とヒストグラム２６１との２乗誤差の総和ｄを算出する。

次に、ステップＳ２３３で、適合度Ｔを下記の（１１）式により算出する。
Ｔ＝ｄ／Ｓ・・・（１１）
ここで、Ｓは正規分布曲線２６２の面積である。

次に、ステップＳ２３４で、正規分布曲線２６２の中心から端までの距離Ｌを下記の（１２）式により算出する。
Ｌ＝ｋ×（１＋Ｔ）×ｖ^1/2・・・（１２）
ここで、ｋは比例定数である。また、ｖ^1/2は、標準偏差に等しい。

次に、ステップＳ２３５で、正規分布曲線２６３の右端２６７から正規分布曲線２６４の左端２６６までの間の領域を、２群の重なり領域２６５として設定する。
次に、切り出し文字の候補に対し、図６１の処理により求めた切り出し信頼度に基づいて認識処理を行うかどうかを決定する。この場合、例えば、切り出し信頼度が高い切り出し文字の候補に対しては認識処理を行わず、切り出し信頼度が低い切り出し文字の候補に対してのみ認識処理を行うようにする。

ここで、複数の切り出し文字の候補に対して、それらに対する認識の信頼度だけでなく、切り出しの信頼度も考慮して切り出し文字を決定する。このことにより、部分的に見ると文字のように見えるが、文字列全体から見ると間違っているような候補文字を、切り出し文字から除外することができる。例えば、各隣接パターンまたは切り出し確定部の切り出し信頼度をα_i、認識信頼度をβ_i、重み係数をｊとすると、全体の信頼度Ｒは、
Ｒ＝Σ（ｊ・α_i＋β_i）・・・（１３）
と表せる。

そして、複数の切り出し文字の候補の中から全体の信頼度Ｒが最も大きいものを、最終的な切り出し文字として選択する。
図６４は、“グンマ”という文字列から文字を１文字ずつ切り出す場合を示す図である。ここで、“グンマ”という文字列の切り出しを行うのに先立ち、学習データを用いて、統計的処理と非統計的処理とに対する判別面とヒストグラム値の正規分布曲線を、それぞれ、個別に求める。

ここで、統計的処理では、文字列の切り出しの成功又は失敗を判定するためのパラメータとして、図５２のパラメータｃ、ｅ、ｆを用い、学習データにより得られた判別面の式は、
０．８４ｘ０＋０．４３ｘ１＋０．３３ｘ２−１４５．２５＝０・・・（１４）
であるものとする。

また、図６３に示す学習データの切り出し成功を示すヒストグラム分布の平均値ｍは１２８．９４２、標準偏差は３４．７７となり、適合度Ｔは（１１）式より０．１２となる。また、比例定数ｋを２とすると、分布中心から端までの距離Ｌは（１２）式より７７．８となる。

また、図６３に示す学習データの切り出し失敗を示すヒストグラム分布の平均値ｍは７１．１２９、標準偏差は３６．２６となり、適合度Ｔは（１１）式より０．３５となる。また、比例定数ｋを２とすると、分布中心から端までの距離Ｌは（１０）式より９２．２となる。

図６４において、まず、ステップＳ２４１に示すように、イメージ入力により未知文字についての入力パターンを読み込む。
次に、ステップＳ２４２で、ラベリングにより連結パターンを抽出し、抽出された各連結パターンに対して図６４に示すようにラベル番号（１）〜（６）を付す。

次に、ステップＳ２４５に示すように、ステップＳ２４３の統計的処理及びステップＳ２４４の非統計的処理に基づいて、切り出し信頼度の定量化を行う。
ステップＳ２４３の統計的処理では、互いに隣接する連結パターンを統合した場合の切り出し信頼度を、パラメータｃ、ｅ、ｆの値を有する３次元空間上の点に対する判別面からの距離ｈに基づいて算出する。この切り出し信頼度αは、例えば、
α＝（ｈ−ｗ₁）／（ｗ₂−ｗ₁）×１００・・・（１５）
で表すことができる。

ここで、
ｗ₁：２群の重なり領域の左端の位置
ｗ₂：２群の重なり領域の右端の位置
である。

例えば、ラベル番号（１）のパターンとラベル番号（２）のパターンとを統合した場合の切り出し信頼度は８０、ラベル番号（２）のパターンとラベル番号（３）のパターンとを統合した場合の切り出し信頼度は１２、ラベル番号（３）のパターンとラベル番号（４）のパターンとを統合した場合の切り出し信頼度は２８、ラベル番号（４）のパターンとラベル番号（５）のパターンとを統合した場合の切り出し信頼度は９２、ラベル番号（５）のパターンとラベル番号（６）のパターンとを統合した場合の切り出し信頼度は５となる。

また、ステップＳ２４４の非統計的処理では、濁点候補を有するパターン“グ”についての切り出し信頼度を、図５６のパラメータｐ〜ｒの値を有する３次元空間上の点に対する判別面からの距離ｈに基づいて算出する。

例えば、ラベル番号（１）のパターンと、ラベル番号（２）のパターン及びラベル番号（３）のパターンからなる切り出し確定部２７１の濁点パターンとを統合した場合の切り出し信頼度は８５となる。

このステップＳ２４４の非統計的処理における切り出し信頼度の算出方法を図６５に示す。
まず、ステップＳ２５１で、濁点候補となるパターン２７２を抽出する。例えば、連結パターンが２つ隣接して存在する場合で、且つ、それらを統合した時のサイズと文字列の外接矩形の平均文字サイズとの比が所定のしきい値以下である場合、濁点候補となるパターンとする。

次に、ステップＳ２５２で、濁点候補となるパターン２７２の左隣に隣接する外接矩形２８１があるかどうかを調べ、この場合、濁点候補となるパターン２７２の左隣に隣接する外接矩形２８１があると判断された結果、ステップＳ２５３に進み、図５６のパラメータｐ〜ｒの値を算出する。

図６５の例では、
ｐ＝ａ／ｂ＝０．１・・・（１６）
ｑ＝ｂ／ＭＸ＝１．３・・・（１７）
ｒ＝（ｃ×ｄ）／（ＭＸ×ＭＹ）²＝０．３・・・（１８）
となる。

ここで、
ａ：外接矩形２８１の右枠と外接矩形２７２の左枠との距離、
ｂ：外接矩形２８１の左枠と外接矩形２７２の右枠との距離、
ｃ：外接矩形２８１の面積、
ｄ：外接矩形２７２の面積、
ＭＸ：外接矩形平均幅、
ＭＹ：外接矩形平均高さ、
である。

次に、ステップＳ２５４に示すように、パラメータｐ〜ｒの値を有する３次元空間上の点に対する判別面２９３からの距離を算出する。
このパラメータｐ〜ｒの値を有する３次元空間上の点に対する判別面２９３からの距離を算出するために、学習パターンに基づいて判別面２９３を算出しておく。この判別面２９３は、例えば、学習パターンの文字列の切り出しの成功を示すヒストグラム分布２９２及び失敗を示すヒストグラム分布２９１に基づいて、（３）式により求めることができ、濁点抽出のパラメータｐ〜ｒを用いた場合の判別面２９３の式は、例えば、
０．１７ｘ０＋０．７５ｘ１＋０．６４ｘ２＋３０．４＝０・・・（１９）
で表され、３次元空間内の平面の方程式となる。

従って、判別面２９３からの距離ｈは、（１６）〜（１８）の値を（１９）式に代入して、
ｈ＝０．１７×０．１−０．７５×１．３＋０．６４×０．３＋３０．４
＝２９．６・・・（２０）
となる。

また、学習データの切り出し成功を示すヒストグラム分布２９２の平均値ｍは３８、標準偏差は２５となり、適合度Ｔは（１１）式より０．２となり、学習データの切り出し失敗を示すヒストグラム分布２９１の平均値ｍは−３４、標準偏差は２８となり、適合度Ｔは（１１）式より０．３となる。

また、学習データの切り出し成功を示すヒストグラム分布２９２の左端ｗ₁は、比例定数ｋを２とすると、（１２）式より、
ｗ₁＝３８−２×（１＋０．２）×２５＝−２２・・・（２１）
となる。

また、学習データの切り出し失敗を示すヒストグラム分布２９１の右端ｗ₂は、比例定数ｋを２とすると、（１２）式より、
ｗ₂＝−３４＋２×（１＋０．３）×２８＝３８．８・・・（２２）
となる。

従って、２群の重なり領域２９４は、判別面からの距離が−２２〜３８．８の間の領域となる。
次に、ステップＳ２５５で、切り出し信頼度αを求める。この切り出し信頼度αは、（２０）〜（２２）の値を（１５）式に代入して、
α＝（２９．６−（−２２））／（３８．８−（−２２））×１００
＝８５・・・（２３）
となる。

これにより、ラベル番号（２）とラベル番号（３）とが統合されて切り出し確定部２７１となる。
次に、図６４のステップＳ２４６で、統計的処理と非統計的処理の信頼度を合成する。このとき、切り出し確定部があれば、それを優先する。従って、切り出し確定部２７１の信頼度が優先して合成される。

この結果、ラベル番号（１）のパターンと切り出し確定部２７１のパターンとを統合した場合の切り出し信頼度は８５、切り出し確定部２７１のパターンとラベル番号（４）のパターンとを統合した場合の切り出し信頼度は３０、ラベル番号（４）のパターンとラベル番号（５）のパターンとを統合した場合の切り出し信頼度は９２、ラベル番号（５）のパターンとラベル番号（６）のパターンとを統合した場合の切り出し信頼度は５となる。

そして、例えば、切り出し信頼度が所定のしきい値（例えば、９０）より大きいか又は、切り出し信頼度が所定のしきい値（例えば、７０）より大きく且つ、その隣の切り出しパターンの切り出し信頼度との比が所定の値（例えば、５）より大きい場合、パターンの統合を行う。

また、切り出し信頼度が所定のしきい値（例えば、８）より小さい場合、パターンの統合を行わない。
例えば、ラベル番号（１）のパターンと切り出し確定部２７１のパターンとを統合した場合の切り出し信頼度は８５で、その隣のラベル番号（４）のパターンに対する切り出し信頼度の比は、８５／３０＝２．８であるので、ラベル番号（１）のパターンと切り出し確定部２７１のパターンとを統合しない。また、切り出し確定部２７１のパターンとラベル番号（４）のパターンとを統合した場合の切り出し信頼度は３０であり、切り出し確定部２７１のパターンとラベル番号（４）のパターンとを統合しない。

また、ラベル番号（４）のパターンとラベル番号（５）のパターンとを統合した場合の切り出し信頼度は９２であるので、ラベル番号（４）のパターンとラベル番号（５）のパターンとを統合する。また、ラベル番号（５）のパターンとラベル番号（６）のパターンとを統合した場合の切り出し信頼度は５であり、ラベル番号（５）のパターンとラベル番号（６）のパターンとを統合しない。

これにより、ラベル番号（４）のパターンとラベル番号（５）のパターンとを統合した切り出し確定部２７３に対応する外接矩形２７５、ラベル番号（６）のパターンに対応する外接矩形２７６が生成される。

また、新たに生成された切り出し確定部２７３のパターンと切り出し確定部２７１のパターンとを統合した場合の切り出し信頼度を求める。この切り出し信頼度は、図６４の例では、６０となる。

次に、ステップＳ２４７に示すように、切り出し信頼度によるパターンの統合が終了した時点で、切り出し候補１及び切り出し候補２を抽出する。そして、切り出し候補１及び切り出し候補２のそれぞれの文字に対して認識処理を行い、切り出し候補１及び切り出し候補２における文字内の切り出し信頼度αと認識信頼度βとをそれぞれの文字について求め、切り出し信頼度αと認識信頼度βとの総和をとったものを全体の信頼度Ｒとする。

例えば、切り出し候補１として、外接矩形２７５、２７６、２７８を切り出した場合、外接矩形２７８内のパターンに対して文字認識を行った場合の認識信頼度βは８０となり、外接矩形２７５内のパターンに対して文字認識を行った場合の認識信頼度βは９０となり、外接矩形２７６内のパターンに対して文字認識を行った場合の認識信頼度βは８５となる。

また、ラベル番号（１）のパターンと切り出し確定部２７１のパターンとを統合した場合の切り出し信頼度αは８５であるので、全体の信頼度Ｒは、重み係数ｊを１とすると、（１３）式により、３４５となる。

また、切り出し候補２として、外接矩形２７６、２８１、２８２を切り出した場合、外接矩形２８１内のパターンに対して文字認識を行った場合の認識信頼度βは８３となり、外接矩形２８２内のパターンに対して文字認識を行った場合の認識信頼度βは５５となり、外接矩形２７６内のパターンに対して文字認識を行った場合の認識信頼度βは８５となる。

また、切り出し確定部２７１のパターンと切り出し確定部２７３のパターンとを統合した場合の切り出し信頼度αは６０であり、全体の信頼度Ｒは２８３となる。
次に、ステップＳ２４８で、切り出し候補１又は切り出し候補２のうち、全体の信頼度Ｒが大きい方の切り出し候補１を切り出し成功の文字候補として選択する。この結果、“グンマ”という文字列から、“グ”、“ン”、“マ”の各文字を１文字ずつ正しく切り出すことができる。

なお、文字列からの切り出し信頼度を考慮しながら文字の認識処理を行う方法については、例えば、特願平７−２３４９８２号の明細書及び図面に記載されている。
次に、図３のかすれ文字認識部１９の動作について具体的に説明する。

図６６は、かすれ文字認識部１９の構成の一実施例を示すブロック図である。
図６６において、特徴抽出部３０１は、かすれ文字パターンから文字の特徴を抽出し、この抽出した特徴を特徴ベクトルにより表す。一方、かすれ辞書３０２には、かすれ文字についての各カテゴリの特徴ベクトルが格納されている。そして、照合部３０３は、特徴抽出部３０１により抽出した文字パターンの特徴ベクトルを、かすれ辞書３０２に格納されている各カテゴリの特徴ベクトルと照合し、特徴空間上での特徴ベクトル間の距離Ｄ_ij（ｉは未知文字の特徴ベクトル、ｊはかすれ辞書３０２のカテゴリの特徴ベクトル）を算出する。その結果、特徴ベクトル間の距離Ｄ_ijを最小とするカテゴリｊを未知文字ｉとして認識する。

ここで、特徴空間上での特徴ベクトル間の距離Ｄ_ijは、例えば、ユークリッド距離Σ（ｉ−ｊ）²、シティブロック距離Σ｜ｉ−ｊ｜、又は判別関数などの識別関数を用いて算出する。

図３のつぶれ文字認識部２１は、かすれ文字認識部１９のかすれ辞書３０２の代わりに、つぶれ文字についての各カテゴリの特徴ベクトルを格納したつぶれ辞書を用いることを除いて、かすれ文字認識部１９と同様の構成とすることができる。

次に、図３の消し線認識部２６の一実施例について説明する。この消し線認識部２６は、図４のステップＳ４の訂正解析により抽出された訂正文字の候補に対し、例えば、横方向の画素数の和をとったヒストグラムを作成し、このヒストグラム値が所定の値を越えた領域に横消し線が存在するものとして、この領域に存在している横線を除去する。

次に、この横線を除去することによりかすれた部分を補完し、この補完後のパターンについて辞書照合を行うことにより、文字認識を行う。この結果、文字と認識されたものについては、訂正文字の候補を消し線付き文字とみなし、リジェクトされたものについては、訂正文字の候補を通常文字とみなす。

例えば、図６７において、訂正文字の候補として、横二重線により訂正された状態の「５」が入力され、この横二重線を除去して補完したパターンが「５」のカテゴリとして認識された結果、入力されたパターンは訂正文字とみなされる。また、訂正文字の候補として、「５」が入力され、この「５」の横線を除去したパターンがリジェクトされた結果、入力されたパターンは訂正文字でないとみなされる。

次に、図３のくせ字解析部２３の一実施例について説明する。このくせ字解析部２３は、同一のカテゴリに属すると認識された手書き文字を所定のクラスタ数にクラスタリングし、異なるカテゴリに属するクラスタ間の距離の小さいものについては、要素数が少ない方のクラスタの文字カテゴリを要素数が多い方のクラスタの文字カテゴリに修正することにより、別のカテゴリに属するものと誤って認識された手書き文字を正読化する。

図６８は、「４」の文字カテゴリに属すると判定された手書き文字の特徴ベクトルによるクラスタリング処理を示す図である。
図６８には、認識辞書に格納されている「４」の文字カテゴリの特徴ベクトルとの距離が近いため、「４」の認識結果カテゴリに属すると判定された手書き文字が示されている。ここで、この認識処理では、「２」と手書きされた文字が「４」の認識結果カテゴリに属すると誤って認識されている。

そして、１回目のクラスタリング処理では、「４」の文字カテゴリに属すると判定された手書き文字をそれぞれ１つのクラスタとみなし、２回目のクラスタリング処理では、クラスタとみなされた手書き文字の間での特徴ベクトルの距離を算出し、特徴ベクトルの距離が最も近いものを１つのクラスタに統合する。この結果、図６８の例では、クラスタ数が１１から１つだけ減少して１０になっている。

３回目以降のクラスタリング処理においても、クラスタ間での特徴ベクトルの距離を算出し、特徴ベクトルの距離が最も近いものを統合することにより、クラスタ数を減少させ、１１回目のクラスタリング処理でクラスタ数は１となる。

ここで、クラスタ同士を統合する場合、要素数が１のクラスタ、すなわち、特徴ベクトル同士の距離の比較には、例えば、シティブロック距離を用いる。要素数が複数のクラスタ同士の場合、例えば、重心法を用いる。この重心法は、要素数がＭ個のクラスタのｉ番目（ｉ＝１、２、３、・・・、Ｍ）の要素の特徴ベクトルｘ_iをｘ_i＝（ｘ_i1、ｘ_i2、ｘ_i3、・・・、ｘ_iN）と表した時、そのクラスタを代表する代表ベクトルｘ_mを、そのクラスタの要素の特徴ベクトルｘ_iの平均で表し、

とする。
そして、代表ベクトルｘ_m同士についてのシティブロック距離を算出することにより、要素数が複数のクラスタ同士の距離の比較を行うものである。

なお、クラスタ数が１になるまでクラスタリング処理を続けると、「４」の文字カテゴリに属すると誤って認識された「２」の手書き文字も、「４」の文字カテゴリに属すると正しく認識された「４」の手書き文字と同一のクラスタに属するようになるので、クラスタリング処理を途中で打ち切るクラスタリング打ち切り条件を設定する。

このクラスタリング打ち切り条件としては、例えば、
（１）最終クラスタ数が所定の数（例えば、３）になった時、
（２）クラスタ統合時のクラスタ間距離が所定のしきい値以上になった時、
（３）クラスタ統合時のクラスタ間距離の増加率が所定のしきい値以上になった時、
のいずれかの条件を用いることができる。

図６９は、クラスタリング処理を示すフローチャートである。
図６９において、まず、ステップＳ２６１に示すように、ある文字カテゴリに属すると認識された手書き文字の特徴ベクトルだけを抽出し、抽出されたそれぞれの手書き文字の特徴ベクトルを１つのクラスタとみなす。

次に、ステップＳ２６２に示すように、クラスタリング処理を途中で打ち切るクラスタリング打ち切り条件を設定する。
次に、ステップＳ２６３に示すように、ある文字カテゴリについての全てのクラスタの中で、最も距離の近い２つのクラスタを選択する。

次に、ステップＳ２６４に示すように、ステップＳ２６２で設定したクラスタリング打ち切り条件を満たしているかどうかを判断し、クラスタリング打ち切り条件を満たしていない場合、ステップ２６５に進んで、ステップＳ２６３で選択した２つのクラスタ同士を統合し、ステップＳ２６３に戻り、クラスタを統合する処理を繰り返す。

そして、クラスタを統合する処理を繰り返した結果、ステップＳ２６４でクラスタリング打ち切り条件を満たすと判断された場合、ステップ２６６に進んで、全ての文字カテゴリに対してクラスタリング処理を行ったかどうかを判断し、全ての文字カテゴリに対してクラスタリング処理を行っていない場合、ステップ２６１に戻り、クラスタリング処理を行っていない文字カテゴリについてのクラスタリング処理を行う。

一方、ステップ２６６で全ての文字カテゴリに対してクラスタリング処理を行ったと判断された場合、ステップ２６７に進んで、クラスタリング結果をメモリに格納する。
次に、クラスタリング処理により得られたクラスタリング結果に基づいて、別のカテゴリに属するものと誤って認識された手書き文字を正読化する。

図７０は、「２」と手書きされた文字が「４」の文字カテゴリに属すると誤って認識された認識結果を、正しい文字カテゴリ「２」に正読化する処理を示す図である。
図７０には、「２」の認識結果カテゴリに属すると判定された手書き文字及び「４」の認識結果カテゴリに属すると判定された手書き文字が示されている。ここで、「３」と手書きされた文字が「２」の認識結果カテゴリに属すると誤って認識され、「２」と手書きされた文字が「４」の認識結果カテゴリに属すると誤って認識され、「４」と手書きされた文字がいずれの認識結果カテゴリにも属さないとしてリジェクトされている。

次に、クラスタリング打ち切り条件を、同一カテゴリ内における最終クラスタ数が３になった時に設定して、クラスタリング処理を行うことにより、「２」の認識結果カテゴリについてはクラスタａ、ｂ、ｃが生成され、「４」の認識結果カテゴリについてはクラスタｄ、ｅ、ｆが生成され、リジェクトされた３つの「４」の手書き文字についてはそれぞれクラスタｇ、ｈ、ｉが生成されている。

次に、「２」の認識結果カテゴリに属するクラスタａ、ｂ、ｃと「４」の認識結果カテゴリに属するクラスタｄ、ｅ、ｆとの中から、文字数の少ないクラスタａ、ｄを誤読候補クラスタとして抽出する。

次に、誤読候補クラスタａとそれ以外のクラスタｂ、ｃ、ｄ、ｅ、ｆのそれぞれとの距離及び誤読候補クラスタｄとそれ以外のクラスタａ、ｂ、ｃ、ｅ、ｆのそれぞれとの距離を算出する。そして、誤読候補クラスタａと最も距離が近いクラスタとしてクラスタｂを抽出し、誤読候補クラスタａとクラスタｂとの間の距離が所定の値以下であるかどうかを判定し、誤読候補クラスタａとクラスタｂとの間の距離は所定の値以下でないので、誤読候補クラスタａはリジェクト化される。

この結果、「２」の認識結果カテゴリに属すると誤って認識された「３」と手書きされた文字が、「２」の認識結果カテゴリから除外される。
また、誤読候補クラスタｄと最も距離が近いクラスタとしてクラスタｂを抽出し、誤読候補クラスタｄとクラスタｂとの間の距離が所定の値以下であるかどうかを判定し、誤読候補クラスタｄとクラスタｂとの間の距離は所定の値以下なので、誤読候補クラスタｄはクラスタｂと統合されクラスタｊが生成されるとともに、クラスタｊは、要素数が多い方のクラスタｂの属していた「２」の認識結果カテゴリに属すると判定されて、「４」と誤読されたために誤読候補クラスタｄに属するとされた「２」の手書き文字が正読化される。

さらに、いずれの認識結果カテゴリにも属さないとしてリジェクトされたクラスタｇ、ｈ、ｉとそれ以外のクラスタａ〜ｆとの距離を算出する。そして、クラスタｇと最も距離が近いクラスタとしてクラスタｅを抽出し、クラスタｇとクラスタｅとの間の距離が所定の値以下であるかどうかを判定し、クラスタｇとクラスタｅとの間の距離は所定の値以下なので、クラスタｇはクラスタｅと統合される。

また、クラスタｈと最も距離が近いクラスタとしてクラスタｅを抽出し、クラスタｈとクラスタｅとの間の距離が所定の値以下であるかどうかを判定し、クラスタｈとクラスタｅとの間の距離は所定の値以下なので、クラスタｈはクラスタｅと統合される。クラスタｇ及びクラスタｈがクラスタｅに統合された結果、クラスタｋが生成されるとともに、クラスタｋは、要素数が多い方のクラスタｅの属していた「４」の認識結果カテゴリに属すると判定されて、認識不能としてリジェクトされた「４」の手書き文字が正読化される。

また、クラスタｉと最も距離が近いクラスタとしてクラスタｅを抽出し、クラスタｉとクラスタｅとの間の距離が所定の値以下であるかどうかを判定し、クラスタｉとクラスタｅとの間の距離は所定の値以下でないので、クラスタｉはクラスタｅと統合しないようにする。

図７１は、文字カテゴリ認識結果修正処理を示すフローチャートである。
図７１において、まず、ステップＳ２７１に示すように、図６９のクラスタリング処理により得られたクラスタリング結果についてのデータをメモリから読み出す。

次に、ステップＳ２７２に示すように、図６９のクラスタリング処理により得られた全てのカテゴリの全てのクラスタについて、各クラスタ間での距離を算出し、各クラスタ間の距離を比較する。

次に、ステップＳ２７３に示すように、クラスタ間の距離がしきい値以下のクラスタが存在するかどうかを判断し、クラスタ間の距離がしきい値以下のクラスタが存在する場合、ステップＳ２７４に進んで、それらのクラスタ同士を統合し、クラスタ間の距離がしきい値以下のクラスタが存在しない場合、それらのクラスタをリジェクトする。

ここで、クラスタ統合時のクラスタ間の距離のしきい値として、例えば、２つのクラスタのうち、要素数が多い方のクラスタ内のベクトル間距離の定数倍を用いる。すなわち、要素数がＭ個のクラスタＡと要素数がＮ（Ｍ＞Ｎ）個のクラスタＢとを統合する場合、クラスタＡの代表ベクトルをｘａｍ、クラスタＢの代表ベクトルをｘｂｍ、クラスタＡ内の特徴ベクトルをｘａｉ（ｉ＝１、２、・・・、Ｍ）とすると、クラスタＡ内のベクトル間距離ｄ_tｈは、

で表される。

従って、クラスタ同士を統合する条件は、例えば、１．５に定数を設定すると、
｜ｘａｍ−ｘｂｍ｜＜１．５ｄ_tｈ
となる。

次に、ステップＳ２７５に示すように、ステップＳ２７４で統合された全てのクラスタについて、クラスタ内の文字カテゴリの判定を行う。
次に、ステップＳ２７６に示すように、統合されたクラスタ同士の文字カテゴリが異なるかどうかを判断し、クラスタ同士の文字カテゴリが異なる場合、ステップＳ２７７に進み、要素数が少ない方のクラスタの文字カテゴリを要素数が多い方のクラスタの文字カテゴリに修正してから、ステップＳ２７８に進む。一方、クラスタ同士の文字カテゴリが一致する場合、ステップＳ２７７をスキップしてステップＳ２７８に進む。

次に、ステップＳ２７８に示すように、クラスタ内の文字について、その文字カテゴリを出力する。
次に、本発明の一実施例によるパターン認識装置の動作について、図７２の帳票を処理する場合を例にとって、より具体的に説明する。

図７２は、本発明の一実施例によるパターン認識装置に入力される帳票の例を示す図である。
図７２の帳票には、枠番号１のフリーピッチ枠、枠番号２、３、４の一文字枠、枠番号５のブロック枠、枠番号６の不規則な表が設けられている。また、枠番号１のフリーピッチ枠には、枠に接触した状態で且つ横二重線により訂正されている「５」、枠に接触した状態の「３」、「２」、枠に接触した状態で且つかすれた状態の「７」、くせ字の「４」、「６」、枠からはみ出した状態で且つくせ字の「４」が記入されている。

枠番号２の一文字枠には「５」が記入され、枠番号３の一文字枠には「３」が記入され、枠番号４の一文字枠には枠からはみ出した状態で且つ横二重線により訂正されている「８」が記入されている。枠番号５のブロック枠のうち、枠番号５−１の枠には横二重線により訂正されているくせ字の「６」が記入され、枠番号５−２の枠には枠に接触した状態で「２」が記入され、枠番号５−３の枠にはくせ字の「４」が記入されている。

枠番号６の不規則な表のうち、枠番号６−１−１の枠には、枠からはみ出した状態の「３」、「２」、「１」が記入され、枠番号６−１−２の枠には、「６」、「３」、「８」が記入され、枠番号６−１−３の枠、枠番号６−１−４−１の枠、枠番号６−１−４−２の枠、枠番号６−１−４−３の枠、枠番号６−２−１の枠、枠番号６−２−２の枠及び枠番号６−２−３の枠はそれぞれ空欄となっており、枠番号６の不規則な表全体が×印により訂正されている。

次に、図３の環境認識系１１は、図７２の帳票に対し、図５〜図８の処理を行うことにより、入力画像の状態を図７２の帳票から抽出する。
例えば、図６のレイアウト解析により、図７２の帳票から、枠番号１のフリーピッチ枠、枠番号２、３、４の一文字枠、枠番号５のブロック枠及び枠番号６の不規則な表を抽出するとともに、枠番号１のフリーピッチ枠からは、８つのパターンが文字の候補として抽出され、枠番号２、３、４の一文字枠からは、それぞれ１つのパターンが文字の候補として抽出され、枠番号５のブロック枠からは、３つのパターンが文字の候補として抽出され、枠番号６−１−１の枠からは、３つのパターンが文字の候補として抽出され、枠番号６−１−２の枠からは、３つのパターンが文字の候補として抽出され、枠番号６−１−３の枠、枠番号６−１−４−１の枠、枠番号６−１−４−２の枠、枠番号６−１−４−３の枠、枠番号６−２−１の枠、枠番号６−２−２の枠及び枠番号６−２−３の枠からは、文字の候補は抽出されない。

ここで、図７２の帳票から文字列を抽出するには、例えば、図１４及び図１５に示したテキスト抽出方法を使用し、図７２の帳票から罫線を抽出するには、例えば、図１６〜図２２に示した罫線抽出方法を使用し、図７２の帳票から枠や表を抽出するには、例えば、図２３及び図２４に示した枠抽出方法を使用する。

さらに、枠番号１のフリーピッチ枠から抽出された第１番目のパターン、第２番目のパターン、第５番目のパターン、第８番目のパターンは、枠接触文字の候補とされる。また、枠番号４の一文字枠から抽出されたパターン、枠番号５−２の枠から抽出されたパターン、枠番号６−１−１の枠から抽出された第１番目のパターンも、枠接触文字の候補とされる。

ここで、図７２の帳票から枠接触文字の候補を抽出するには、例えば、図２７及び図２８に示した枠接触文字抽出方法を使用する。
また、図７の品質解析により、図７２の帳票から、かすれ状態やつぶれ状態や高品質文字などを検出する。この例では、画像の品質は正常で、かすれ状態やつぶれ状態や高品質文字などは検出されない。

また、図８の訂正解析により、図７２の帳票から訂正文字候補を抽出する。この例では、枠番号１のフリーピッチ枠から抽出された第１番目のパターン、枠番号２、４の一文字枠から抽出されたパターン、枠番号５−１の枠から抽出されたパターン及び枠番号６の不規則な表から抽出されたパターンは、訂正文字候補とされる。

ここで、図７２の帳票から訂正文字の候補を抽出するには、例えば、図３０に示した特徴量抽出方法を使用する。
次に、環境認識系１１は、入力画像から抽出した文字の候補ごとに、図５〜図８の処理により帳票から抽出した状態を記入した中間処理結果テーブルを作成する。

図７３は、図５〜図８の処理により帳票から抽出した状態を記入した中間処理結果テーブルを示す図である。
図７３において、枠番号１の欄には、「枠種類」として「フリーピッチ」、「文字数」として「８」が記入され、枠番号１の第１番目のパターンの欄には、「枠接触有無」として「有」、「消し線」として「有２」、「品質」として「正常」が記入され、枠番号１の第２番目のパターンの欄には、「枠接触有無」として「有」、「消し線」として「無」、「品質」として「正常」が記入され、枠番号１の第８番目のパターンの欄には、「枠接触有無」として「有」、「消し線」として「無」、「品質」として「正常」が記入されている。

ここで、「消し線」の欄の「有１」は複数文字に対して消し線候補が存在していることを示し、「消し線」の欄の「有２」は一文字に対して消し線候補が存在していることを示している。

枠番号２の欄には、「枠種類」として「一文字」、「枠接触有無」として「無」、「消し線」として「有２」、「品質」として「正常」、「文字数」として「１」が記入され、枠番号３の欄には、「枠種類」として「一文字」、「枠接触有無」として「無」、「消し線」として「無」、「品質」として「正常」、「文字数」として「１」が記入され、枠番号４の欄には、「枠種類」として「一文字」、「枠接触有無」として「有」、「消し線」として「有２」、「品質」として「正常」、「文字数」として「１」が記入されている。

枠番号５の欄には、「枠種類」として「はしご」、「文字数」として「３」が記入され、枠番号５−１の欄には、「枠接触有無」として「無」、「消し線」として「有２」、「品質」として「正常」、「文字数」として「１」が記入され、枠番号５−２の欄には、「枠接触有無」として「有」、「消し線」として「無」、「品質」として「正常」、「文字数」として「１」が記入され、枠番号５−３の欄には、「枠接触有無」として「無」、「消し線」として「無」、「品質」として「正常」、「文字数」として「１」が記入されている。

枠番号６の欄には、「枠種類」として「表」が記入され、枠番号６−１−１の欄には、「枠種類」として「フリーピッチ」、「枠接触有無」として「有」、「消し線」として「有１」、「品質」として「正常」が記入され、枠番号６−２−２の欄には、「枠種類」として「フリーピッチ」、「枠接触有無」として「無」、「消し線」として「有１」、「品質」として「正常」が記入されている。

次に、環境認識系１１は、図５〜図８の処理により帳票から抽出した状態に基づいて、図９の処理を行う。
すなわち、図７３の中間処理結果テーブルに記入された入力画像の状態に基づいて、図３の文字認識部１２の基本文字認識部１７、文字列認識部１５、接触文字認識部１３、かすれ文字認識部１９、つぶれ文字認識部２１、又は非文字認識部２５の消し線認識部２６及び雑音認識部２８のいずれの処理を呼び出すかを処理順序制御ルールを参照しながら決定し、決定した処理を図７３の中間処理結果テーブルの「処理呼出し」の欄に記入する。そして、図７３の中間処理結果テーブルの「処理呼出し」の欄に記入された処理をどのような順序で実行するかを、処理順序テーブルを参照しながら決定し、決定した順序を図７３の中間処理結果テーブルの「処理順序」の欄に記入する。

処理順序制御ルールの例としては、
（Ａ１）もし、ある処理対象に対し、中間処理結果テーブルの状態を示す欄が「有」で、その状態に対応する処理が実行されていないならば、その状態に対応する処理を中間処理結果テーブルの「処理呼出し」の欄に記入する、
（Ａ２）もし、ある処理対象に対し、中間処理結果テーブルの状態を示す全ての欄が「無」、または「正常」で、基本文字認識部１７の処理が実行されていないならば、中間処理結果テーブルの「処理呼出し」の欄に「基本」と記入する、
（Ａ３）もし、ある処理対象に対し、中間処理結果テーブルに記入された状態に対応する処理が複数個存在しているならば、複数個の処理の順序を決定している処理順序テーブルをアクセスして「処理呼出し」の欄の順序を並び替える、
（Ａ４）もし、ある処理対象に対し、中間処理結果テーブルに記入された状態に対応する処理が終了したならば、終了した処理を中間処理結果テーブルの「処理完了」の欄に記入するとともに、次に行うべき指示や処理の中断や終了を示す指示を中間処理結果テーブルの「処理指示」の欄に記入し、それらの情報に基づいて、中間処理結果テーブルの「処理呼出し」の欄の順序を並び替える、
などがある。

図７４は、処理順序テーブルの一例を示す図である。
図７４において、処理順序テーブルには、例えば、
（Ｂ１）ある処理対象に対し、中間処理結果テーブルの「処理呼出し」の欄に１つの処理しか記入されていない場合は、中間処理結果テーブルの「処理順序」の欄にその処理を記入する、
（Ｂ２）ある処理対象に対し、中間処理結果テーブルの「処理呼出し」の欄に「黒枠／フリーピッチ」と記入された場合は、中間処理結果テーブルの「処理順序」の欄に「黒枠→フリーピッチ」と記入する、
（Ｂ３）ある処理対象に対し、中間処理結果テーブルの「処理呼出し」の欄に「消し線（有２）／黒枠」と記入された場合は、「黒枠→一文字消し線」と記入する、
（Ｂ４）ある処理対象に対し、中間処理結果テーブルの「処理呼出し」の欄に「黒枠／フリーピッチ／消し線（有２）」と記入された場合は、中間処理結果テーブルの「処理順序」の欄に「黒枠→一文字消し線→フリーピッチ」と記入する、
（Ｂ５）ある処理対象に対し、中間処理結果テーブルの「処理呼出し」の欄に「黒枠／フリーピッチ／消し線（有１）」と記入された場合は、中間処理結果テーブルの「処理順序」の欄に複数文字の「消し線→黒枠→フリーピッチ」と記入する、
（Ｂ６）ある処理対象に対し、中間処理結果テーブルの「処理呼出し」の欄に「フリーピッチ／消し線（有１）」と記入された場合は、中間処理結果テーブルの「処理順序」の欄に「複数文字の消し線→フリーピッチ」と記入する、
（Ｂ７）ある処理対象に対し、中間処理結果テーブルの「処理呼出し」の欄に「処理Ａ、Ｂ、Ｃ」と記入され、中間処理結果テーブルの「処理順序」の欄に「処理Ｂ→処理Ａ→処理Ｃ」と記入されている場合で、中間処理結果テーブルの「処理完了」の欄に「処理Ｂ」と記入された場合、中間処理結果テーブルの「処理順序」の欄を「処理Ａ→処理Ｃ」に更新する、
（Ｂ８）ある処理対象に対し、中間処理結果テーブルの「処理呼出し」の欄に「処理Ａ、Ｂ、Ｃ」と記入され、中間処理結果テーブルの「処理順序」の欄に「処理Ｂ→処理Ａ→処理Ｃ」と記入されている場合で、中間処理結果テーブルの「処理完了」の欄に「処理Ｂ」と記入され、中間処理結果テーブルの「処理指示」の欄に「処理Ｃにスキップ」と記入された場合、中間処理結果テーブルの「処理順序」の欄を「処理Ｃ」に更新する、
（Ｂ９）ある処理対象に対し、中間処理結果テーブルの「処理呼出し」の欄に「処理Ａ、Ｂ、Ｃ」と記入され、中間処理結果テーブルの「処理順序」の欄に「処理Ｂ→処理Ａ→処理Ｃ」と記入されている場合で、中間処理結果テーブルの「処理完了」の欄に「処理Ｂ」と記入され、中間処理結果テーブルの「処理指示」の欄に「処理Ｃと処理Ａとの順序逆転」と記入された場合、中間処理結果テーブルの「処理順序」の欄を「処理Ｃ→処理Ａ」に更新する、
（Ｂ１０）ある処理対象に対し、中間処理結果テーブルの「処理呼出し」の欄に「処理Ｂ、Ａ」と記入され、中間処理結果テーブルの「処理完了」の欄に「処理Ａ」と記入され、中間処理結果テーブルの「処理指示」の欄に「終了」と記入された場合、中間処理結果テーブルの「処理順序」の欄を「終了」とする、
などの手順が格納されている。

図７５は、図７３の中間処理結果テーブルに記入された入力画像の状態に基づいて呼び出す処理を「処理呼出し」の欄に記入するとともに、「処理呼出し」の欄に記入された処理を実行する順序を「処理順序」の欄に記入した例を示す図である。

図７５において、枠番号１の欄には、「枠種類」として「フリーピッチ」が記入され、枠番号１の第１番目のパターンの欄には、「枠接触有無」として「有」、「消し線」として「有２」が記入されているので、処理順序制御ルールの（Ａ１）に従って「処理呼び出し」の欄に「黒枠／フリーピッチ／消し線（有２）」と記入するとともに、処理順序制御ルールの（Ａ３）に従って処理順序テーブルの（Ｂ４）を参照し、「処理順序」の欄に「黒枠→一文字消し線→フリーピッチ」と記入する。

枠番号１の第２番目のパターンの欄には、「枠接触有無」として「有」、「消し線」として「無」、「品質」として「正常」が記入されているので、処理順序制御ルールの（Ａ１）に従って「処理呼び出し」の欄に「黒枠／フリーピッチ」と記入するとともに、処理順序制御ルールの（Ａ３）に従って処理順序テーブルの（Ｂ２）を参照し、「処理順序」の欄に「黒枠→フリーピッチ」と記入する。

枠番号１の第８番目のパターンの欄には、「枠接触有無」として「有」、「消し線」として「無」、「品質」として「正常」が記入されているので、処理順序制御ルールの（Ａ１）に従って「処理呼び出し」の欄に「黒枠／フリーピッチ」と記入するとともに、処理順序制御ルールの（Ａ３）に従って処理順序テーブルの（Ｂ２）を参照し、「処理順序」の欄に「黒枠→フリーピッチ」と記入する。

枠番号２の欄には、「枠種類」として「一文字」、「枠接触有無」として「無」、「消し線」として「有２」、「品質」として「正常」が記入されているので、処理順序制御ルールの（Ａ１）に従って「処理呼び出し」の欄に「消し線（有２）」と記入するとともに、処理順序制御ルールの（Ａ１）に従って「処理順序」の欄に「一文字消し線」と記入する。

枠番号３の欄には、「枠種類」として「一文字」、「枠接触有無」として「無」、「消し線」として「無」、「品質」として「正常」が記入されているので、処理順序制御ルールの（Ａ２）に従って「処理呼び出し」の欄に「基本」と記入するとともに、処理順序制御ルールの（Ａ１）に従って「処理順序」の欄に「基本」と記入する。

枠番号４の欄には、「枠種類」として「一文字」、「枠接触有無」として「有」、「消し線」として「有２」、「品質」として「正常」が記入されているので、処理順序制御ルールの（Ａ１）に従って「処理呼び出し」の欄に「黒枠／消し線（有２）」と記入するとともに、処理順序制御ルールの（Ａ３）に従って処理順序テーブルの（Ｂ３）を参照し、「処理順序」の欄に「黒枠→一文字消し線」と記入する。

枠番号５の欄には、「枠種類」として「はしご」が記入され、枠番号５−１の欄には、「枠接触有無」として「無」、「消し線」として「有２」、「品質」として「正常」が記入されているので、処理順序制御ルールの（Ａ１）に従って「処理呼び出し」の欄に「消し線（有２）」と記入するとともに、処理順序制御ルールの（Ａ１）に従って「処理順序」の欄に「一文字消し線」と記入する。

枠番号５−２の欄には、「枠接触有無」として「有」、「消し線」として「無」、「品質」として「正常」が記入されているので、処理順序制御ルールの（Ａ１）に従って「処理呼び出し」の欄に「黒枠」と記入するとともに、処理順序制御ルールの（Ａ１）に従って「処理順序」の欄に「黒枠」と記入する。

枠番号５−３の欄には、「枠接触有無」として「無」、「消し線」として「無」、「品質」として「正常」が記入されているので、処理順序制御ルールの（Ａ２）に従って「処理呼び出し」の欄に「基本」と記入するとともに、処理順序制御ルールの（Ａ１）に従って「処理順序」の欄に「基本」と記入する。

枠番号６の欄には、「枠種類」として「表」が記入され、枠番号６−１−１の欄には、「枠種類」として「フリーピッチ」、「枠接触有無」として「有」、「消し線」として「有１」、「品質」として「正常」が記入されているので、処理順序制御ルールの（Ａ１）に従って「処理呼び出し」の欄に「黒枠／フリーピッチ／消し線（有１）」と記入するとともに、処理順序制御ルールの（Ａ３）に従って処理順序テーブルの（Ｂ５）を参照し、「処理順序」の欄に「複数文字の消し線→黒枠→フリーピッチ」と記入する。

枠番号６−２−２の欄には、「枠種類」として「フリーピッチ」、「枠接触有無」として「無」、「消し線」として「有１」、「品質」として「正常」が記入されているので、処理順序制御ルールの（Ａ１）に従って「処理呼び出し」の欄に「フリーピッチ／消し線（有１）」と記入するとともに、処理順序制御ルールの（Ａ３）に従って処理順序テーブルの（Ｂ６）を参照し、「処理順序」の欄に複数文字の「複数文字の消し線→フリーピッチ」と記入する。

次に、「処理呼出し」の欄及び「処理順序」の欄が記入された図７５の中間処理結果テーブルに基づいて、処理実行ルールを参照しながら最初の認識処理を実行する。そして、処理が完了した認識処理を中間処理結果テーブルの「処理完了」の欄に記入するとともに、その時の認識処理で得られた信頼度を中間処理結果テーブルの「信頼度」の欄に記入する。

また、中間処理結果テーブルの「処理順序」の欄を、図７４の処理順序テーブルの（Ｂ７）〜（Ｂ９）に従って更新するとともに、処理実行ルールによって指示される次の処理がある場合は、中間処理結果テーブルの「処理指示」の欄にその処理を記入する。

処理実行ルールとしては、例えば、
（Ｃ１）もし、ある処理対象に対し、中間処理結果テーブルの「処理順序」の欄に記入されている処理が存在するならば、優先順位の最も高い処理を実行する。そして、実行した処理が終了したならば、中間処理結果テーブルの「処理完了」の欄に終了した処理を記入し、中間処理結果テーブルの「処理順序」の欄からその処理を削除する。また、次に実行する処理を指示する場合は、中間処理結果テーブルの「処理指示」の欄にその処理を記入する、
（Ｃ２）もし、ある処理を実行した結果、あるパターンが非文字ではなく、文字であると判断され、その文字コードが所定の値以上の信頼度で算出されたならば、「個人筆記特性」による文字認識処理を呼び出すことを中間処理結果テーブルの「処理指示」の欄に記入する、
（Ｃ３）もし、ある処理を実行した結果、あるパターンが消し線であると判断され、その消し線が所定の値以上の信頼度で算出されたならば、中間処理結果テーブルの「処理指示」の欄に「終了」と記入し、中間処理結果テーブルの「処理順序」の欄に記入されているそれ以降の処理を打ち切って、処理を終了させる、
（Ｃ４）もし、中間処理結果テーブルの「処理順序」の欄の最初に「フリーピッチ」と記入され、同じ枠番号の他の処理対象についての「フリーピッチ」より前の処理が未処理であるならば、同じ枠番号の全て処理対象の「処理順序」の欄の最初に「フリーピッチ」と記入された後、同じ枠番号の全て処理対象の「フリーピッチ」の処理を同時に実行する、
（Ｃ５）もし、中間処理結果テーブルの「処理順序」の欄に記入された全ての処理が終了し、全ての処理対象について、中間処理結果テーブルの「処理指示」の欄に「終了」と記入されるか、又は「個人筆記特性」と記入されたならば、「処理指示」の欄に「個人筆記特性」と記入されている処理対象に対して、「個人筆記特性」による文字認識処理を呼び出してその処理を実行し、「個人筆記特性」による文字認識処理が終了したならば、中間処理結果テーブルの「処理指示」の欄に「終了」と記入する、
（Ｃ６）もし、全ての処理対象について、中間処理結果テーブルの「処理指示」の欄に終了と記入されたならば、全ての処理を終了して認識結果を出力する、
などがある。

図７６は、図７５の中間処理結果テーブルに基づいて、処理実行ルールを参照しながら認識処理を実行し、その時の認識処理で得られた信頼度を中間処理結果テーブルの「信頼度」の欄に記入し、処理実行ルールに基づいて中間処理結果テーブルの「処理順序」の欄を更新するとともに、中間処理結果テーブルの「処理指示」の欄に記入を行った例を示す図である。

まず、図７５の中間処理結果テーブルの枠番号１の第１番目のパターンの「処理順序」の欄において、最初に「黒枠」と指示されているので、処理実行ルールの（Ｃ１）に従って、図７２の枠番号１のフリーピッチ枠から抽出された第１番目のパターンに対し、「黒枠」に対応する図３の接触文字認識部１３の処理を実行する。

この接触文字認識部１３では、例えば、図３９及び図４０に示したように、枠を除去したパターンに対して文字補完や再補完を行うことにより、枠接触文字についての文字認識を行う。また、文字補完や再補完を用いても十分な信頼度が得られないパターンについては、知識テーブル１４を参照し、図４２〜図５１に示した学習文字に対する再文字認識を行うことにより、枠接触文字についての文字認識を行う。

接触文字認識部１３の文字認識処理により、図７２の枠番号１のフリーピッチ枠から抽出された第１番目のパターンの認識信頼度が２０％と算出された結果、図７２の枠番号１のフリーピッチ枠から抽出された第１番目のパターンは文字でないとみなされ、中間処理結果テーブルの「文字コード」の欄に「リジェクト」と記入されるとともに、中間処理結果テーブルの「信頼度」の欄に「２０％」と記入される。

また、中間処理結果テーブルの「処理完了」の欄に「黒枠」と記入され、中間処理結果テーブルの「処理順序」の欄が「一文字消し線→フリーピッチ」に更新される。
次に、図７５の中間処理結果テーブルの枠番号１の第２番目のパターンの「処理順序」の欄において、最初に「黒枠」と指示されているので、処理実行ルールの（Ｃ１）に従って、図７２の枠番号１のフリーピッチ枠から抽出された第２番目のパターンに対し、「黒枠」に対応する図３の接触文字認識部１３の処理を実行し、枠接触文字についての文字認識を行う。

接触文字認識部１３の文字認識処理により、図７２の枠番号１のフリーピッチ枠から抽出された第２番目のパターンは、認識信頼度が６０％の確率で文字カテゴリ「３」であると認識され、中間処理結果テーブルの「文字コード」の欄に「３」と記入されるとともに、中間処理結果テーブルの「信頼度」の欄に「６０％」と記入される。

また、中間処理結果テーブルの「処理完了」の欄に「黒枠」と記入され、中間処理結果テーブルの「処理順序」の欄が「フリーピッチ」に更新される。
次に、図７５の中間処理結果テーブルの枠番号１の第８番目のパターンの「処理順序」の欄において、最初に「黒枠」と指示されているので、処理実行ルールの（Ｃ１）に従って、図７２の枠番号１のフリーピッチ枠から抽出された第８番目のパターンに対し、「黒枠」に対応する図３の接触文字認識部１３の処理を実行し、枠接触文字についての文字認識を行う。

接触文字認識部１３の文字認識処理により、図７２の枠番号１のフリーピッチ枠から抽出された第８番目のパターンは、認識信頼度が９５％の確率で文字カテゴリ「４」であると認識され、中間処理結果テーブルの「文字コード」の欄に「４」と記入されるとともに、中間処理結果テーブルの「信頼度」の欄に「９５％」と記入される。

また、中間処理結果テーブルの「処理完了」の欄に「黒枠」と記入され、中間処理結果テーブルの「処理順序」の欄が「フリーピッチ」に更新される。
次に、図７５の中間処理結果テーブルの枠番号２の「処理順序」の欄において、「一文字消し線」と指示されているので、処理実行ルールの（Ｃ１）に従って、図７２の枠番号２の一文字枠から抽出されたパターンに対し、「一文字消し線」に対応する図３の消し線認識部２６の処理を実行する。

この消し線認識部２６では、例えば、図６７に示したように、訂正文字の候補として抽出されたパターンから所定値以上のヒストグラム値を有する横線を除去し、この横線を除去したパターンが、文字と認識された場合は、除去した横線を消し線とみなすことにより、訂正文字の候補として抽出されたパターンを訂正文字と認識し、所定値以上のヒストグラム値を有する横線を除去したパターンが、リジェクトされた場合は、除去した横線を消し線を文字に一部とみなして消し線でないとすることにより、訂正文字の候補として抽出されたパターンを通常文字と認識する。

消し線認識部２６の消し線認識処理により、図７２の枠番号２の一文字枠から抽出されたパターンの認識信頼度が１０％と算出された結果、図７２の枠番号２の一文字枠から抽出されたパターンは訂正文字でないとみなされ、中間処理結果テーブルの「信頼度」の欄に「１０％」と記入されるとともに、中間処理結果テーブルの「処理指示」の欄に「基本」と記入される。

また、中間処理結果テーブルの「処理完了」の欄に「消し線」と記入され、中間処理結果テーブルの「処理順序」の欄に「基本」と記入される。
次に、図７５の中間処理結果テーブルの枠番号３の「処理順序」の欄において、「基本」と指示されているので、処理実行ルールの（Ｃ１）に従って、図７２の枠番号３の一文字枠から抽出されたパターンに対し、「基本」に対応する図３の基本文字認識部１７の処理を実行する。

この基本文字認識部１７では、例えば、図３１に示したように、入力された未知文字の特徴を抽出し、この未知文字の特徴を特徴ベクトルにより表し、基本辞書に予め格納されている各カテゴリの特徴ベクトルと照合することにより、特徴空間上での特徴ベクトル間の距離を算出し、特徴ベクトル間の距離を最小とする文字カテゴリを未知文字として認識する。

また、基本文字認識部１７は、未知文字の輪郭の凹凸の個数を算出することにより、未知文字の変形度を算出する。そして、未知文字の変形度が大きくて、認識率が低下する場合は、知識テーブル１８を参照し、図３４〜図３８に示した詳細識別法を用いて文字認識を実行する。

基本文字認識部１７の文字認識処理により、図７２の枠番号３の一文字枠から抽出されたパターンは、認識信頼度が９５％の確率で文字カテゴリ「３」である１認識され、中間処理結果テーブルの「文字コード」の欄に「３」と記入されるとともに、中間処理結果テーブルの「信頼度」の欄に「９５％」と記入される。

また、中間処理結果テーブルの「処理完了」の欄に「基本」と記入され、中間処理結果テーブルの「処理順序」の欄は空欄となる。
次に、図７５の中間処理結果テーブルの枠番号４の「処理順序」の欄において、最初に「黒枠」と指示されているので、処理実行ルールの（Ｃ１）に従って、図７２の枠番号４の一文字枠から抽出されたパターンに対し、「黒枠」に対応する図３の接触文字認識部１３の処理を実行し、枠接触文字についての文字認識を行う。

接触文字認識部１３の文字認識処理により、図７２の枠番号４の一文字枠から抽出されたパターンの認識信頼度が１５％と算出された結果、図７２の枠番号４の一文字枠から抽出されたパターンは文字でないとみなされ、中間処理結果テーブルの「文字コード」の欄に「リジェクト」と記入されるとともに、中間処理結果テーブルの「信頼度」の欄に「１５％」と記入される。

また、中間処理結果テーブルの「処理完了」の欄に「黒枠」と記入され、中間処理結果テーブルの「処理順序」の欄が「一文字消し線」に更新される。
次に、図７５の中間処理結果テーブルの枠番号５−１の「処理順序」の欄において、「一文字消し線」と指示されているので、処理実行ルールの（Ｃ１）に従って、図７２の枠番号５−１の枠から抽出されたパターンに対し、「一文字消し線」に対応する図３の消し線認識部２６の処理を実行し、訂正文字の候補として抽出されたパターンの認識処理を行う。

消し線認識部２６の消し線認識処理により、図７２の枠番号５−１の枠から抽出されたパターンの認識信頼度が９５％と算出された結果、図７２の枠番号５−１の枠から抽出されたパターンは訂正文字とみなされ、中間処理結果テーブルの「信頼度」の欄に「９５％」と記入されるとともに、中間処理結果テーブルの「処理完了」の欄に「消し線」と記入される。

また、中間処理結果テーブルの「処理指示」の欄に「終了」と記入されるとともに、中間処理結果テーブルの「処理順序」の欄は空欄となる。
次に、図７５の中間処理結果テーブルの枠番号５−２の「処理順序」の欄において、「黒枠」と指示されているので、処理実行ルールの（Ｃ１）に従って、図７２の枠番号５−２の枠から抽出されたパターンに対し、「黒枠」に対応する図３の接触文字認識部１３の処理を実行し、枠接触文字についての文字認識を行う。

ここで、図７２の枠番号５−２の枠から抽出されたパターンは、下線部分が枠と接触し、図３９の文字補完や図４０の再補完による処理では十分な信頼度が得られないので、図５０（ｂ）に示したように、図４５の知識テーブル１６７を参照することにより、誤読文字対（２、７）を獲得し、図４７に示した領域強調の手法により、再文字認識を行う。

接触文字認識部１３の文字認識処理により、図７２の枠番号５−２の枠から抽出されたパターンは、認識信頼度が９５％の確率で文字カテゴリ「２」であると認識され、中間処理結果テーブルの「文字コード」の欄に「２」と記入されるとともに、中間処理結果テーブルの「信頼度」の欄に「９５％」と記入される。

また、中間処理結果テーブルの「処理完了」の欄に「黒枠」と記入され、中間処理結果テーブルの「処理順序」の欄は空欄となる。
次に、図７５の中間処理結果テーブルの枠番号５−３の「処理順序」の欄において、「基本」と指示されているので、処理実行ルールの（Ｃ１）に従って、図７２の枠番号５−３の枠から抽出されたパターンに対し、「基本」に対応する図３の基本文字認識部１７の処理を実行し、基本文字についての文字認識処理を行う。

基本文字認識部１７の文字認識処理により、図７２の枠番号５−３の枠から抽出されたパターンは、認識信頼度が９０％の確率で文字カテゴリ「６」であると認識され、中間処理結果テーブルの「文字コード」の欄に「６」と記入されるとともに、中間処理結果テーブルの「信頼度」の欄に「９０％」と記入される。

また、中間処理結果テーブルの「処理完了」の欄に「基本」と記入され、中間処理結果テーブルの「処理順序」の欄は空欄となる。
次に、図７５の中間処理結果テーブルの枠番号６−１−１の「処理順序」の欄において、最初に「複数文字の消し線」と指示されているので、処理実行ルールの（Ｃ１）に従って、「複数文字の消し線」に対応する図３の消し線認識部２６の処理を実行し、消し線の認識処理を行う。

消し線認識部２６の消し線認識処理により、枠番号６の表から消し線が抽出され、その消し線の認識信頼度が９８％と算出された結果、図７２の枠番号６−１−１の枠から抽出されたパターンは訂正文字とみなされ、中間処理結果テーブルの「文字コード」の欄に「消し線」と記入されるとともに、中間処理結果テーブルの「信頼度」の欄に「９８％」と記入され、中間処理結果テーブルの「処理完了」の欄に「消し線」と記入される。

また、処理実行ルールの（Ｃ３）に従って、中間処理結果テーブルの「処理指示」の欄に「終了」と記入されるとともに、中間処理結果テーブルの「処理順序」の欄は空欄となる。

次に、図７５の中間処理結果テーブルの枠番号６−２−２の「処理順序」の欄において、最初に「複数文字の消し線」と指示されているので、処理実行ルールの（Ｃ１）に従って、「複数文字の消し線」に対応する図３の消し線認識部２６の処理を実行し、消し線の認識処理を行う。

消し線認識部２６の消し線認識処理により、枠番号６の表から消し線が抽出され、その消し線の認識信頼度が９８％と算出された結果、図７２の枠番号６−２−２の枠から抽出されたパターンは訂正文字とみなされ、中間処理結果テーブルの「文字コード」の欄に「消し線」と記入されるとともに、中間処理結果テーブルの「信頼度」の欄に「９８％」と記入され、中間処理結果テーブルの「処理完了」の欄に「消し線」と記入される。

以上に処理により、図７６の中間処理結果テーブルが生成される。ここで、図７６の中間処理結果テーブルの「処理順序」の欄には、次に呼び出す処理が記入されているので、処理実行ルール（Ｃ１）に従って処理を続行する。

図７７は、図７６の中間処理結果テーブルに基づいて認識処理を続行し、その際に得られた結果を示す図である。
まず、図７６の中間処理結果テーブルの枠番号１の第１番目のパターンの「処理順序」の欄において、最初に「一文字消し線」と指示されているので、処理実行ルールの（Ｃ１）に従って、図７２の枠番号１のフリーピッチ枠から抽出された第１番目のパターンに対し、「一文字消し線」に対応する図３の消し線認識部２６の処理を実行し、訂正文字についての認識処理を行う。

消し線認識部２６の認識処理により、図７２の枠番号１のフリーピッチ枠から抽出された第１番目のパターンの認識信頼度が９６％と算出された結果、図７２の枠番号１のフリーピッチ枠から抽出された第１番目のパターンは訂正文字とみなされ、中間処理結果テーブルの「文字コード」の欄に「消し線」と記入されるとともに、中間処理結果テーブルの「信頼度」の欄に「９６％」と記入され、中間処理結果テーブルの「処理完了」の欄に「黒枠／消し線」と記入される。

また、中間処理結果テーブルの「処理指示」の欄に「終了」と記入されるとともに、中間処理結果テーブルの「処理順序」の欄は空欄となる。
次に、図７５の中間処理結果テーブルの枠番号１の第２番目のパターンの「処理順序」の欄において、「フリーピッチ」と指示されているので、処理実行ルールの（Ｃ４）に従って、図７２の枠番号１のフリーピッチ枠から抽出された第２番目のパターンに対し、同じ枠番号１の他の全てのパターンの「処理順序」の欄が「フリーピッチ」となるまで待機し、枠番号１の全てのパターンの「処理順序」の欄が「フリーピッチ」となった時に、枠番号１のフリーピッチ枠から抽出された全てのパターンを対象として、「フリーピッチ」に対応する図３の文字列認識部１５の処理を実行し、文字の切り出し信頼度を考慮しながら文字認識を行う。

次に、図７５の中間処理結果テーブルの枠番号１の第８番目のパターンの「処理順序」の欄において、「フリーピッチ」と指示されているので、処理実行ルールの（Ｃ４）に従って、図７２の枠番号１のフリーピッチ枠から抽出された第８番目のパターンに対し、同じ枠番号１の他の全てのパターンの「処理順序」の欄が「フリーピッチ」となるまで待機し、枠番号１の全てのパターンの「処理順序」の欄が「フリーピッチ」となった時に、枠番号１のフリーピッチ枠から抽出された全てのパターンを対象として、「フリーピッチ」に対応する図３の文字列認識部１５の処理を実行し、文字の切り出し信頼度を考慮しながら認識処理を行う。

そして、枠番号１の全てのパターンの「処理順序」の欄が「フリーピッチ」となった場合、図７２の枠番号１のフリーピッチ枠から抽出された全てのパターンを対象として、文字列認識部１５の文字認識処理を行う。

ここで、図７２の枠番号１のフリーピッチ枠から抽出された第１番目のパターンについては、図７７の中間処理結果テーブルの枠番号１の第１番目のパターンの「処理指示」の欄が「終了」となっているので、図７２の枠番号１のフリーピッチ枠から抽出された第１番目のパターンを文字列認識部１５の処理対象から除外し、図７２の枠番号１のフリーピッチ枠から抽出された第２番目のパターンから第８番目のパターンについて、文字列認識部１５の認識処理を実行する。

この文字列認識部１５では、例えば、図５２〜図６５に示したように、文字を切り出した際の信頼度を判別面からの距離に基づいて算出し、（文字切り出しの信頼度）と（文字認識の信頼度）との積が最大となるものを、切り出し文字とする。

文字列認識部１５の認識処理により、図７２の枠番号１のフリーピッチ枠から抽出された第２番目のパターンは、認識信頼度が９５％の確率で文字カテゴリ「３」であると認識され、中間処理結果テーブルの「文字コード」の欄に「３」と記入されるとともに、中間処理結果テーブルの「信頼度」の欄に「９５％」と記入される。

また、処理実行ルールの（Ｃ１）に従って、中間処理結果テーブルの「処理完了」の欄に「黒枠／フリーピッチ」と記入され、中間処理結果テーブルの「処理順序」の欄が空欄となり、処理実行ルールの（Ｃ４）に従って、中間処理結果テーブルの「処理指示」の欄に「個人筆記特性」と記入される。

図７２の枠番号１のフリーピッチ枠から抽出された第８番目のパターンは、認識信頼度が９８％の確率で文字カテゴリ「４」であると認識され、中間処理結果テーブルの「文字コード」の欄に「４」と記入されるとともに、中間処理結果テーブルの「信頼度」の欄に「９８％」と記入される。

また、図７２の枠番号１のフリーピッチ枠から抽出された第３番目のパターンは、文字カテゴリ「２」であると認識され、図７２の枠番号１のフリーピッチ枠から抽出された第４番目のパターンと図７２の枠番号１のフリーピッチ枠から抽出された第５番目のパターンとは、文字列認識部１５の認識処理により１つの文字に統合され、文字カテゴリ「７」であると認識され、図７２の枠番号１のフリーピッチ枠から抽出された第６番目のパターンは、文字カテゴリ「４」であると認識され、図７２の枠番号１のフリーピッチ枠から抽出された第７番目のパターンは、文字カテゴリ「６」であると認識される。

この結果、図７７の中間処理結果テーブルの「文字数」の欄は「７」に変更される。
次に、図７６の中間処理結果テーブルの枠番号２の「処理順序」の欄において、「基本」と指示されているので、処理実行ルールの（Ｃ１）に従って、図７２の枠番号２の一文字枠から抽出されたパターンに対し、「基本」に対応する図３の基本文字認識部１７の処理を実行し、基本文字についての文字認識処理を行う。

基本文字認識部１７の文字認識処理により、図７２の枠番号２の一文字枠から抽出されたパターンは、認識信頼度が９７％の確率で文字カテゴリ「５」であると認識され、中間処理結果テーブルの「文字コード」の欄に「５」と記入されるとともに、中間処理結果テーブルの「信頼度」の欄に「９７％」と記入される。

また、中間処理結果テーブルの「処理呼び出し」の欄に「消し線（有２）／基本」と記入され、中間処理結果テーブルの「処理完了」の欄に「消し線／基本」と記入され、中間処理結果テーブルの「処理順序」の欄は空欄となり、処理実行ルールの（Ｃ４）に従って、中間処理結果テーブルの「処理指示」の欄に「個人筆記特性」と記入される。

次に、図７６の中間処理結果テーブルの枠番号３の「処理順序」の欄は空欄となっているので、処理実行ルールの（Ｃ４）に従って、中間処理結果テーブルの「処理指示」の欄に「個人筆記特性」と記入される。

次に、図７６の中間処理結果テーブルの枠番号４の「処理順序」の欄において、「一文字消し線」と指示されているので、処理実行ルールの（Ｃ１）に従って、図７２の枠番号４の一文字枠から抽出されたパターンに対し、「一文字消し線」に対応する図３の消し線認識部２６の処理を実行し、訂正文字の候補として抽出されたパターンの認識処理を行う。

消し線認識部２６の消し線認識処理により、図７２の枠番号４の一文字枠から抽出されたパターンの認識信頼度が９５％と算出された結果、図７２の枠番号４の一文字枠から抽出されたパターンは訂正文字とみなされ、中間処理結果テーブルの「信頼度」の欄に「９５％」と記入されるとともに、中間処理結果テーブルの「処理完了」の欄に「黒枠／消し線」と記入される。

また、中間処理結果テーブルの「処理指示」の欄に「終了」と記入されるとともに、中間処理結果テーブルの「処理順序」の欄は空欄となる。
次に、図７６の中間処理結果テーブルの枠番号５−１の「処理指示」の欄に「終了」と記入されているので、図７２の枠番号５−１の枠から抽出されたパターンについては、処理を行わない。

次に、図７６の中間処理結果テーブルの枠番号５−２の「処理順序」の欄は空欄となっているので、処理実行ルールの（Ｃ４）に従って、中間処理結果テーブルの「処理指示」の欄に「個人筆記特性」と記入される。

次に、図７６の中間処理結果テーブルの枠番号５−３の「処理順序」の欄は空欄となっているので、処理実行ルールの（Ｃ４）に従って、中間処理結果テーブルの「処理指示」の欄に「個人筆記特性」と記入される。

次に、図７６の中間処理結果テーブルの枠番号６−１−１の「処理指示」の欄に「終了」と記入されているので、図７２の枠番号６−１−１の枠から抽出されたパターンについては、処理を行わない。

次に、図７６の中間処理結果テーブルの枠番号６−２−２の「処理指示」の欄に「終了」と記入されているので、図７２の枠番号６−１−１の枠から抽出されたパターンについては、処理を行わない。

以上に処理により、図７７の中間処理結果テーブルが生成される。ここで、図７７の中間処理結果テーブルの「処理指示」の欄には、「個人筆記特性」と記入されているものがあるので、処理実行ルール（Ｃ５）に従って処理を続行する。

図７８は、図７７の中間処理結果テーブルに基づいて認識処理を続行し、その際に得られた結果を示す図である。
まず、図７６の中間処理結果テーブルの枠番号１の第１番目のパターンの「処理指示」の欄に「終了」と記入されているので、図７２の枠番号１のフリーピッチ枠から抽出された第１番目のパターンについては、処理を行わない。

次に、図７５の中間処理結果テーブルの枠番号１の第２番目のパターンの「処理指示」の欄に「個人筆記特性」と記入されているので、処理実行ルールの（Ｃ５）に従って、図７２の枠番号１のフリーピッチ枠から抽出された第２番目のパターンに対し、「個人筆記特性」に対応する図３のくせ字解析部２３の処理を実行する。

このくせ字解析部２３は、例えば、図６８〜図７１に示したように、同一筆者が書いた手書き文字を各カテゴリごとにクラスタリングし、クラスタリングにより得られた手書き文字の第１のクラスタと距離が近く、且つ他のカテゴリに属する第２のクラスタで要素数が少ないものを第１のクラスタに統合することにより、第２のクラスタに属する手書き文字のカテゴリを第１のクラスタのカテゴリに修正する。

くせ字解析部２３の解析処理により、図７２の枠番号１のフリーピッチ枠から抽出された第２のパターンは、認識信頼度が９７％の確率で文字カテゴリ「３」であると認識され、中間処理結果テーブルの「文字コード」の欄に「３」と記入されるとともに、中間処理結果テーブルの「信頼度」の欄に「９７％」と記入される。

また、中間処理結果テーブルの「処理完了」の欄に「黒枠／フリーピッチ／個人筆記特性」と記入されるとともに、中間処理結果テーブルの「処理指示」の欄に「終了」と記入される。

次に、図７５の中間処理結果テーブルの枠番号１の第８番目のパターンの「処理指示」の欄に「個人筆記特性」と記入されているので、処理実行ルールの（Ｃ５）に従って、図７２の枠番号１のフリーピッチ枠から抽出された第８番目のパターンに対し、「個人筆記特性」に対応する図３のくせ字解析部２３の処理を実行する。

くせ字解析部２３の解析処理により、図７２の枠番号１のフリーピッチ枠から抽出された第８番目のパターンは、認識信頼度が９８％の確率で文字カテゴリ「４」であると認識され、中間処理結果テーブルの「文字コード」の欄に「４」と記入されるとともに、中間処理結果テーブルの「信頼度」の欄に「９８％」と記入される。

次に、図７６の中間処理結果テーブルの枠番号２の「処理指示」の欄に「個人筆記特性」と記入されているので、処理実行ルールの（Ｃ５）に従って、図７２の枠番号２の一文字枠から抽出されたパターンに対し、「個人筆記特性」に対応する図３のくせ字解析部２３の処理を実行する。

くせ字解析部２３の解析処理により、図７２の枠番号２の一文字枠から抽出されたパターンは、認識信頼度が９７％の確率で文字カテゴリ「５」であると認識され、中間処理結果テーブルの「文字コード」の欄に「５」と記入されるとともに、中間処理結果テーブルの「信頼度」の欄に「９７％」と記入される。

次に、図７６の中間処理結果テーブルの枠番号３の「処理指示」の欄に「個人筆記特性」と記入されているので、処理実行ルールの（Ｃ５）に従って、図７２の枠番号３の一文字枠から抽出されたパターンに対し、「個人筆記特性」に対応する図３のくせ字解析部２３の処理を実行する。

くせ字解析部２３の解析処理により、図７２の枠番号３の一文字枠から抽出されたパターンは、認識信頼度が９７％の確率で文字カテゴリ「３」であると認識され、中間処理結果テーブルの「文字コード」の欄に「３」と記入されるとともに、中間処理結果テーブルの「信頼度」の欄に「９７％」と記入される。

次に、図７６の中間処理結果テーブルの枠番号４の「処理指示」の欄に「終了」と記入されているので、図７２の枠番号４の一文字枠から抽出されたパターンについては、処理を行わない。

次に、図７６の中間処理結果テーブルの枠番号５−１の「処理指示」の欄に「終了」と記入されているので、図７２の枠番号５−１の枠から抽出されたパターンについては、処理を行わない。

次に、図７６の中間処理結果テーブルの枠番号５−２の「処理指示」の欄に「個人筆記特性」と記入されているので、処理実行ルールの（Ｃ５）に従って、図７２の枠番号５−２の枠から抽出されたパターンに対し、「個人筆記特性」に対応する図３のくせ字解析部２３の処理を実行する。

くせ字解析部２３の解析処理により、図７２の枠番号５−２の枠から抽出されたパターンは、認識信頼度が９７％の確率で文字カテゴリ「２」であると認識され、中間処理結果テーブルの「文字コード」の欄に「２」と記入されるとともに、中間処理結果テーブルの「信頼度」の欄に「９７％」と記入される。

次に、図７６の中間処理結果テーブルの枠番号５−３の「処理指示」の欄に「個人筆記特性」と記入されているので、処理実行ルールの（Ｃ５）に従って、図７２の枠番号５−３の枠から抽出されたパターンに対し、「個人筆記特性」に対応する図３のくせ字解析部２３の処理を実行する。

くせ字解析部２３の解析処理により、図７２の枠番号５−３の枠から抽出されたパターンは、認識信頼度が９６％の確率で文字カテゴリ「４」であると認識され、中間処理結果テーブルの「文字コード」の欄が「４」に変更されるとともに、中間処理結果テーブルの「信頼度」の欄に「９６％」と記入される。

以上に処理により、図７８の中間処理結果テーブルが生成される。ここで、図７８の中間処理結果テーブルの「処理指示」の欄は、全ての処理対象に対して「終了」と記入されているので、処理実行ルール（Ｃ６）に従って、全ての処理を終了する。

以上説明したように、本発明の実施例によれば、文字認識部１２及び非文字認識部２５では、環境認識系１１で認識された入力画像の状態を処理するために適合した認識処理を行う。

例えば、環境認識系１１が罫線に接触した文字を抽出した場合、罫線に接触した文字についての認識処理を専用に行う接触文字認識部１３を使用し、環境認識系１１がフリーピッチ文字列を抽出した場合、フリーピッチ文字列についての認識処理を専用に行う文字列認識部１５を使用し、環境認識系１１がかすれ文字を抽出した場合、かすれ文字についての認識処理を専用に行うかすれ文字認識部１９を使用し、環境認識系１１がつぶれ文字を抽出した場合、つぶれ文字についての認識処理を専用に行うつぶれ文字認識部２１を使用し、環境認識系１１が非文字を抽出した場合、非文字についての認識処理を専用に非文字認識部２５を使用する。

また、文字認識部１９又は非文字認識部２５の認識結果についての信頼度を算出し、信頼度が低い文字や非文字については、環境認識系１１、文字認識部１９及び非文字認識部２５の間で相互にフィードバックを行うようにして他の処理をやり直すようにし、信頼度が高くなるか、又は実行できる処理がなくなった場合に全体の処理を終了する。

このように、本発明の実施例によれば、文字が書かれている環境に応じて、文字を認識する際に使用する特徴及び識別法をアダプティブに変化させて認識処理を実行することができるので、文書や帳票の様々な環境に対応した高精度な文字認識が可能となる。

また、文字コードのみを認識結果として出力するだけでなく、環境認識系１１による環境認識結果を文字認識結果と同時に出力することができるとともに、環境認識結果と文字認識結果とが相互に一致した時に文字認識結果を出力することが可能となり、文字認識結果に対する確認機能及び信頼性を向上させることができる。

さらに、非文字認識部２５を専用に設け、非文字認識を文字認識と独立して行うことができるので、文字認識及び非文字認識の信頼性を向上させることができる。
さらにまた、各文字が書かれている環境に応じた独立な認識処理を行うことができるので、各認識処理における辞書や知識を増加させることにより、認識信頼度を向上させることができる。

本発明の一実施例によるパターン認識装置の機能的な構成を示すブロック図である。図１の環境認識手段のより具体的な構成の一実施例を示すブロック図である。図１のパターン認識装置のより具体的な構成の一実施例を示すブロック図である。図３の環境認識系の全体的な動作の一実施例を示すフローチャートである。図４の前処理部の動作の一実施例を示すフローチャートである。図４のレイアウト解析部の動作の一実施例を示すフローチャートである。図４の品質解析部の動作の一実施例を示すフローチャートである。図４の訂正解析部の動作の一実施例を示すフローチャートである。図４の文字認識／非文字認識への制御部の動作の一実施例を示すフローチャートである。本発明の一実施例によるパターン認識装置のシステム構成を示すブロック図である。本発明の一実施例によるパターン認識装置のより具体的なシステム構成を示すブロック図である。本発明の一実施例によるパターン認識装置のラベリング処理の一例を示す図である。本発明の一実施例によるパターン認識装置のラベリング処理の圧縮表現を示す図である。本発明の一実施例によるパターン認識装置のテキスト抽出処理の一例を示す図である。本発明の一実施例によるパターン認識装置のテキスト抽出処理における部分領域の一例を示す図である。本発明の一実施例によるパターン認識装置の罫線抽出処理における隣接投影法を説明する図である。本発明の一実施例によるパターン認識装置の罫線抽出処理におけるパターンの投影結果を示す図である。本発明の一実施例によるパターン認識装置の罫線抽出処理を示すフローチャートである。本発明の一実施例によるパターン認識装置の罫線抽出処理を示す図である。本発明の一実施例によるパターン認識装置の罫線抽出処理におけるかすれ罫線の補完方法を説明する図である。本発明の一実施例によるパターン認識装置のかすれ罫線の補完方法を示すフローチャートである。本発明の一実施例によるパターン認識装置のかすれ罫線の補完の際の探索方向を示す図である。本発明の一実施例によるパターン認識装置の一文字枠抽出処理を示すフローチャートである。本発明の一実施例によるパターン認識装置のブロック枠抽出処理を示すフローチャートである。本発明の一実施例によるパターン認識装置の枠及び表の種類を示す図である。本発明の一実施例によるパターン認識装置の画像縮小処理を示すフローチャートである。本発明の一実施例によるパターン認識装置の枠接触有無判断処理を説明する図である。本発明の一実施例によるパターン認識装置の枠接触有無判断処理を示すフローチャートである。本発明の一実施例によるパターン認識装置の消し線の種類を示す図である。本発明の一実施例によるパターン認識装置の訂正文字の特徴量の算出方法を説明する図である。図３の基本文字認識部の構成例を示すブロック図である。図３の基本文字認識部における特徴ベクトルの算出方法の一例を示す図である。図３の基本文字認識部における特徴ベクトル間の距離の算出方法の一例を示す図である。図３の基本文字認識部における詳細識別法の文字セグメントの抽出方法を説明する図である。図３の基本文字認識部における詳細識別法の端点の検出方法を説明する図である。図３の基本文字認識部における詳細識別法の角度変化の検出方法を説明する図である。図３の基本文字認識部における詳細識別法の文字セグメントの対応関係を説明する図である。図３の基本文字認識部における詳細識別法の処理を示すフローチャートである。図３の接触文字認識部における文字補完の方法を示す図である。図３の接触文字認識部における再補完の方法を示す図である。図３の接触文字認識部における補完誤読文字の例を示す図である。図３の接触文字認識部における文字の学習方法の一例を示すブロック図である。図３の接触文字認識部における枠接触文字の生成方法を説明する図である。図３の接触文字認識部における枠接触文字の生成例を示す図である。図３の接触文字認識部における知識テーブルの一例を示す図である。図３の接触文字認識部における知識テーブルに登録される変動種類及び変動量の一例を示す図である。図３の接触文字認識部の領域強調による再認識領域の一例を示す図である。図３の接触文字認識部の領域強調による再認識方法を説明する図である。図３の接触文字認識部の領域強調による再認識処理を示すフローチャートである。図３の接触文字認識部における文字の再認識方法の一例を示すブロック図である。図３の接触文字認識部における文字の再認識処理を示すフローチャートである。図３の文字列認識部の統計的処理によるパラメータの図形的意味を説明する図である。図３の文字列認識部の統計的処理を示すフローチャートである。図３の文字列認識部の分離文字処理によるパラメータの図形的意味を説明する図である。図３の文字列認識部の分離文字処理を示すフローチャートである。図３の文字列認識部の濁点処理によるパラメータの図形的意味を説明する図である。図３の文字列認識部の濁点処理を示すフローチャートである。図３の文字列認識部の文字切り出し成否データの算出処理を示すフローチャートである。図３の文字列認識部の文字切り出し信頼度の定量化方法を示す図である。図３の文字列認識部の度数分布の生成方法を示す図である。図３の文字列認識部の文字切り出し信頼度の算出方法を示すフローチャートである。図３の文字列認識部における文字の切り出し成功及び切り出し失敗のヒストグラム分布の一例を示す図である。図３の文字列認識部における文字の切り出し成功及び切り出し失敗の２群の重なり領域算出法を示す図である。図３の文字列認識部における文字の切り出し処理の流れを示す図である。図３の文字列認識部の非統計的処理における文字の切り出し処理の流れを示す図である。図３のかすれ文字認識部の構成例を示すブロック図である。図３の消し線認識部の処理の一例を示す図である。図３のくせ字解析部によるクラスタリング処理の流れを示す図である。図３のくせ字解析部によるクラスタリング処理を示すフローチャートである。図３のくせ字解析部による文字カテゴリ判定結果修正処理の流れを示す図である。図３のくせ字解析部による文字カテゴリ判定結果修正処理を示すフローチャートである。本発明の一実施例によるパターン認識装置の処理対象となる帳票の例を示す図である。本発明の一実施例によるパターン認識装置の中間処理結果テーブルの一例を示す図である。本発明の一実施例によるパターン認識装置の処理順序テーブルの一例を示す図である。本発明の一実施例によるパターン認識装置の中間処理結果テーブルの一例を示す図である。本発明の一実施例によるパターン認識装置の中間処理結果テーブルの一例を示す図である。本発明の一実施例によるパターン認識装置の中間処理結果テーブルの一例を示す図である。本発明の一実施例によるパターン認識装置の中間処理結果テーブルの一例を示す図である。従来のパターン認識装置の構成を示すブロック図である。

符号の説明

１環境認識手段
２第１のパターン認識手段
４第２のパターン認識手段
６第Ｎのパターン認識手段
３、５、７信頼度算出手段
１ａ状態抽出手段
１ｂ認識処理制御手段
１ｃ中間処理結果テーブル作成手段
１ｄ処理順序制御ルール格納手段
１ｅ処理実行ルール格納手段
１ｆ処理順序テーブル
１１環境認識系
１２文字認識部
１３接触文字認識部
１５文字列認識部
１７基本文字認識部
１９かすれ文字認識部
２１つぶれ文字認識部
２３くせ字解析部
２５非文字認識部
２６消し線認識部
２８雑音認識部
１４、１６、１８、２０、２２、２４、２７、２９知識テーブル
３０環境認識系
３１レイアウト解析部
３２訂正解析部
３３文字認識系／非文字認識系
３４基本文字認識部
３５黒枠接触文字認識部
３６フリーピッチ文字列認識部
３７消し線認識部
３８環境認識系
３９くせ字解析部
４０終了判定処理部
４１画像格納部
４２処理条件格納部
４３ラベル画像格納部
４４中間処理結果テーブル
５０プログラムメモリ
５１中央演算処理ユニット
５２画像メモリ
５３ワークメモリ
５４バス
５５インターフェイス回路
５６ディスプレイ
５７プリンタ
５８メモリ
５９スキャナ
６０辞書ファイル

Claims

入力画像から文字を抽出する文字抽出手段と、
入力画像から非文字を抽出する非文字抽出手段と、
文字についての認識処理を行う文字認識手段と、
非文字についての認識処理を行う非文字認識手段と、
前記文字抽出手段が文字を抽出した場合、前記文字認識手段により認識処理を行わせ、前記非文字抽出手段が非文字を抽出した場合、前記非文字認識手段により認識処理を行わせる環境認識手段とを備えることを特徴とするパターン認識装置。
前記環境認識手段は、
前記文字抽出手段が文字を抽出した場合、前記文字認識手段による認識結果についての確からしさを示す信頼度を算出し、前記文字認識手段による認識結果の信頼度が所定の値より小さい場合、前記文字抽出手段が抽出した文字を非文字とみなして前記非文字認識手段により認識処理を行わせることを特徴とする請求項１に記載のパターン認識装置。
前記環境認識手段は、
前記非文字抽出手段が非文字を抽出した場合、前記非文字認識手段による認識結果についての確からしさを示す信頼度を算出し、前記非文字認識手段による認識結果の信頼度が所定の値より小さい場合、前記非文字抽出手段が抽出した非文字を文字とみなして前記文字認識手段により認識処理を行わせることを特徴とする請求項１に記載のパターン認識装置。