JP4136316B2

JP4136316B2 - 文字列認識装置

Info

Publication number: JP4136316B2
Application number: JP2001015349A
Authority: JP
Inventors: 悦伸堀田; 克仁藤本; 聡直井; 美佐子諏訪
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2001-01-24
Filing date: 2001-01-24
Publication date: 2008-08-20
Anticipated expiration: 2021-01-24
Also published as: CN100474331C; JP2002216076A; US7136526B2; CN1367460A; US20020114515A1

Description

【０００１】
【発明の属する技術分野】
近年、文書入力磯器として文字認識装置ＯＣＲやソフトウェアＯＣＲの需要が増加している。本発明は、この文字認識装置における文字列認識装置に関し、特に手書き文字列を認識するのに有効な文字列認識装置に関するものである。
本発明が対象とする手書き文字列は、住所、氏名、大学名、銀行名など一般帳票において記入される種々の文字列であり、従来のように文字列先頭から１文字ずつ切り出して文字認識していくのではなく、文字列を複数の部分文字列に分解し、各部分文字列ごとに含まれる単語を一括して認識する。これにより、手書き文字列に特有の問題である文字同士の接触や、分離文字の存在に対応することが可能である。なお、本発明が対象とする文字認識装置は、上記した手書き用文字認識装置だけでなく、印刷文字認識装置、携帯情報端末における文字認識装置等、広い意味での文字認識装置に適用することができる。
【０００２】
【従来の技術】
手書き文字列に対して、文字列を部分文字列に分解して単語認識を行なう方式としては、これまでに、手書き住所を対象に都道府県市区郡といった住所の切れ目となる文字（キー文字）を見つけ、それらの文字間に挟まれた領域を単語認識していくものが提案されている（例えば特開平１１−１６１７４０号公報、特開平１１−３２８３１５号公報参照）。
しかし、上記従来のものは、手書き住所を対象にしたものであり、住所以外の一般の手書き文字列に対するものはこれまでになかった。また、住所では文字列の区切りとなる文字が１文字だけであり、キー文字が複数文字、すなわちキー単語になる場合は扱っていなかった。
【０００３】
【発明が解決しようとする課題】
従来の手書き住所認識におけるキー文字抽出方式では、予めキー文字が｛都，道，府，県，市，区，郡，町，村｝と決定されていた。しかし、対象が住所以外ではその都度キー文字を設定しなおす必要があった。
また、従来法では文字列中から文字数１のキー文字しか抽出していないため、文字数が複数のキー単語になると、キー単語内の文字同士の接触もあり、従来方式をそのまま適用しただけではキー単語抽出が失敗していた。
さらに、従来の単語認識では精度の高いリジェクト処理が行なわれていないため、正解と全く違う単語に誤読する場合があり、ユーザの印象を悪くしていた。本発明は、上記従来技術の問題点を解決するためになされたものであって、その目的とするところは、文字列中からキー単語の抽出を自動で行なうことができ、また、キー単語が複数文字から成る場合でも精度良くキー単語を抽出することができ、さらに、単語認識に際し、全く異なる単語に誤読することがない文字列認識装置を提供することである。
【０００４】
【課題を解決するための手段】
図１は本発明の概要を示す図である。
上記の課題を解決するため、本発明においては同図に示すように、キー文字コード抽出手段１により、認識対象とする文字列群（コード）からキー文字（キー単語）の自動抽出を行ない、それらを登録する。これにより、図１に示すように、県、市、区、町等の住所認識におけるキー文字に加え、例えば、信用組合、支店、農業協同組合、支所等のキー単語が登録される。また、相関を持って出現する文字列の組を抽出することにより、「信用組合」−「支店」等のように、共に現れる確率が高いキー単語が組が抽出される。
次に、キー単語抽出手段２により、文字列イメージから、個別文字を切り出して文字認識を行い、上記キー文字コード抽出手段１により抽出／登録されたキー単語に相当する文字列を言語処理と融合して精度よく抽出する。そして、文字列イメージから、キー単語で区切られた単語領域を抽出し単語認識手段３により単語認識を行う。さらに、検証手段４により単語認識結果を検証し、最終的な文字列認識結果を出力する。
【０００５】
【発明の実施の形態】
図２は本発明の実施例の文字列認識装置の全体の概略構成を示す図である。
同図において、キー文字コード自動抽出処理１１では、認識対象文字列群（文字コード群）から、キー文字コード、キー文字列コードを自動抽出する（以下では、文字コード、文字列コードを合わせて文字コードという）。ここで、認識対象とする文字列群、例えば、住所、氏名、大学名、金融機関名などは特定されているとする。
キー文字コード自動抽出処理１１では、それらの対象文字列群に対して、出現する文字コードを調べ、出現頻度の高い文字や、文字列単位で見たときに出現頻度の高い文字、文字列をキー文字コードとして登録する。
さらに、文字同士の出現の相関を調べる。相関とは、例えば、文字コードＡが出現したときは文字コードＢが出現する確率が高いとか、文字コードＣが出現したときは文字コードＤ、文字コードＥが同時に出現する確率が高い、などといった関係である。このように相関を持って出現する文字コードの組も同時にキー文字コードとして登録していく。
以上の処理により、例えば住所では、｛県，市，区，町｝｛県，郡，町｝｛都，区，町｝がキー文字として抽出でき、金融機関名では｛銀行，支店｝｛信用組合，営業部｝｛農業協同組合，支所｝などのキー文字が自動で抽出できる。住所の場合を例にとると、必ずしも住所階層の区切りとなっていない文字もキー文字として用いることができる。以上のようにして抽出された文字コードは、キー文字コードとして登録される。
【０００６】
キー文字／キー単語抽出処理１２では、後述するように手書き文字列（イメージデータ）から個別文字を切り出し、文字認識を行って上記キー文字コード自動抽出手段１１により抽出されたキー文字コードに相当したキー文字、キー単語を抽出し登録する。
単語領域抽出処理１３では、手書き文字列（イメージ）から、上記キー文字、キー単語により区切られた単語領域を抽出する。例えば、手書き文字列が「東京信用組合日比谷支店」の場合、「信用組合」、「支店」により区切られた「東京」、「日比谷」の領域を単語領域として抽出する。
単語認識処理１４では、上記抽出された単語領域の文字イメージを正規化して特徴抽出を行い、単語特徴辞書等の特徴データと照合して、単語認識を行う。なお、単語認識手法としては、例えば、前記した特開平１１−１６１７４０号公報、特開平１１−３２８３１５号公報で開示される手法や、本出願人が先に提案した特願２０００−３０４７５８号に開示される手法を用いることができる。
【０００７】
上記のように、キー単語間に挟まれた単語領域に対して、単語認識を行なうとともに、以下のようにして、単語認識結果の検証を行う。
(i) 文字切り出し／文字認識処理１５において、個別文字の切り出しを行って、文字認識処理も行う。そして、文字認識結果の上位ｎ位以内に単語認識された単語内の文字のうち閾値以上の割合が含まれている場合に、単語認識手段１４による単語認識結果を出力し、そうでない場合はリジェクトする。これにより、単語認識における極端な誤読を減らすことができる。
(ii)さらに、図２の点線に示すように、文字数推定処理１７により、文字数比較により単語認識結果を検証するようにしてもよい。
すなわち、単語領域を一括認識した際に、認識した単語内の文字数と単語イメージから推定される文字数の比較を行ない、両者の文字数が閾値以上異なる場合に単語認識結果をリジェクトする。文字数推定の方法としては、単語イメージに外接する矩形の高さと幅の比や単語イメージに対して周辺分布をとり、周辺分布の切れ目位置・外接矩形高さなどから算出される数を用いることができる。
(iii) 線密度／周辺分布による検証処理１６では、文字特徴の合成によって単語特徴を生成した場合、後述するように、文字特徴同士の合成位置を逆算し各位置で単語イメージ上を分割し、各分割領域内で算出された線密度や周辺分布と、単語認識された単語の各文字が予め持つ線密度や周辺分布とを比較する。そして、両者が異なる場合に単語認識結果をリジェクトすることにより、単語認識結果を検証する。
【０００８】
以下、上記キー文字コード自動抽出処理、キー文字／キー単語抽出処理、および線密度／周辺分布による検証処理について説明する。
（１）キー文字コード自動抽出処理、キー文字／キー単語抽出処理
図３は、上記キー文字コード自動抽出処理、キー文字／キー単語抽出処理の実施例を示す図である。
キー文字コード自動抽出処理１１において、まず、処理１１ａにおいて、認識対象文字列コードから出現頻度の高い文字や、文字列単位で見たときに出現頻度の高い文字、文字列をキー文字コードとして抽出する。さらに、処理１１ｂにおいて、前記したように、相関を持って出現する文字コードの組を抽出し、これらの文字の組をキー文字コードとして登録していく。
図４に認識対象文字列群と、そこから抽出されるキー文字コードの一例を示す。図４（ａ）の認識対象文字列群から出現頻度の高い文字コードを抽出すると、例えば図４（ｂ）に示すように、県、都、…等の住所認識における文字に加え、信用組合、商工信用組合等の金融機関名や農業協同組合名等のキー文字コードが抽出される。また、「……県信用組合」、「……県農業協同組合」等のように「県」等の文字が付された文字列の出現頻度が高ければ、これもキー文字コードとして抽出される。また、文字同士の出現の相関を調べると、図４（ｃ）に示すように相関の高い文字コードの組が抽出される。
なお、文字認識で誤読の生じにくい文字を予め登録しておき、上記キー文字コードを抽出する際、上記登録された文字をキー文字コードとして抽出しておけば、文字イメージからのキー単語抽出処理において、より確実にキー単語を抽出することが可能となる。
【０００９】
キー文字／キー単語抽出処理１２では、個別文字切り出し処理１２ａにおいて手書き文字列（イメージデータ）から個別文字を切り出し、前記したように文字認識を行って上記キー文字コード自動抽出手段１１により抽出されたキー文字コードに相当したキー文字、キー単語を抽出する。
以下、キー文字が複数文字から成るもの、すなわちキー単語の抽出について説明する。ここでは、例として、金融機関名を取り上げ、「○○信用組合△△支店」や「○○農業協同組合△△支所」などからキー単語として「信用組合」「農業協同組合」を抽出することを考える。なお、県，市，区，町等の１文字のキー文字は、以下に説明する文字認識・キー単語／文字抽出処理で、キー単語の抽出と同様に抽出することができる。
まず、一般的なキー単語の抽出について説明する。文字認識・キー文字／単語抽出処理１２ｂでは、切り出された個別文字について、文字認識を行なっていき、各文字ごとに認識結果の上位ｎ位候補の距離値を見ていく。距離値が閾値ＴＨ１以下の候補の中に予め登録されているキー単語中の文字が属していたら、それを着目文字のキー文字候補とする。
キー単語中の文字が複数属している場合は複数のキー文字候補を出しておく。文字列中のすべての文字についてこの処理を行ない、キー文字候補の文字並びの中にキー単語と同一の文字列が含まれている場合に、これらをキー単語として抽出する。
【００１０】
図５に上記個別文字切り出し、文字認識・キー文字／単語抽出処理のフローを示す。
ステップＳ１において個別文字を切り出し、ステップＳ２において切り出した文字の文字認識を行う。文字認識は、切り出した文字から特徴を抽出し、特徴データを格納した辞書との照合を行って候補文字を抽出し、切り出した文字と候補文字との距離値を求めることにより行う。
ステップＳ３において、以上のようにして求めた文字認識結果の上位ｎ位の候補文字を抽出する。ステップＳ４において、候補文字の距離値が閾値ＴＨ１より小さいかを調べる。候補文字の距離値が閾値ＴＨ１より小さければ、ステップＳ５において、上記候補文字が、キー文字コード自動抽出処理１１において登録されたキー単語中に含まれているかを調べる。含まれている場合には、ステップＳ６において、上記文字をキー文字候補として登録する。
以上の処理を全ての文字の処理が終わるまで繰り返し、全ての文字についての処理が終わったら、ステップＳ７からステップＳ８に行き、キー文字候補の文字並びの中に、キー文字コード自動抽出処理１１において登録されたキー単語と同一の文字列が含まれているものをキー単語として抽出する。
【００１１】
一方、上記文字認識と同時に、単語認識／キー単語抽出処理１２ｃにおいて、個別文字として切り出した文字について単語認識を行う。
例えば図６に示す「支店」ように、小さく書かれた文字同士が接触している場合、文字切り出しをした時点で、この接触文字を１文字として捉えてしまうことがある。
このような場合に備え、単語認識／キー単語抽出処理１２ｃにおいて、１文字として切り出された領域に対して文字特徴に加えて単語特徴でも照合を行なう。そして、単語特徴による照合で距離条件を満たした場合は、これをキー単語として抽出する。
【００１２】
上記文字認識・キー文字／単語抽出処理において、予め登録されたキー単語の一部の文字が抽出された場合には、次のように処理を行う。
(i) 多段閾値による２段階抽出
文字列中からキー単語の一部のみが抽出されたとき、前後のキー文字抽出処理１２ｄでは、その前後の文字認識結果に対してキー単語抽出の距離値条件を緩め、再度抽出処理を行なう。
つまり、通常はある文字に対する文字認識結果に対し、前記距離値ＴＨ１以上の認識結果候補の中にキー文字が含まれている場合にキー文字候補として抽出するが、抽出されたキー文字の前後の文字については、距離値ＴＨ２（ＴＨ２＞ＴＨ１）以上の認識結果候補の中からキー文字を抽出する。これにより、キー単語の一部の文字の字形変形が大きい場合でも、キー単語の一部として抽出することができる。
【００１３】
(ii)両端認識によるキー単語抽出
文字同士の接触の多い文字列では、キー単語に属す個々の文字を全て切り出して認識することが困難なことが多い。
例えば、「農業協同組合」というキー単語イメージの中で、「業協」の部分が複雑に接触していて、文字切り出しでうまく切り出せない場合が生じる。そこで、両端認識によるキー文字抽出処理１２ｅを行う。
キー文字抽出処理１２ｅでは、文字数がＮ文字以上のキー単語に関して、文字列の先頭と終端の文字が抽出され、さらに全文字数のＰ％以上の文字が抽出された時点で、キー単語が抽出されたものとみなす。上記Ｎ，Ｐについては実験により求めた値を用い、例えばＰ＝６０などとする。
「農業協同組合」を例にとると、「農業○○組合」や「農○○同組合」とキー文字候補が抽出された時点で、この文字列を「農業協同組合」と確定する。
(iii) 部分認識による部分キー単語抽出
キー単語の先頭の文字がその前の文字と接触していると、正しく抽出することができず、上記両端認識方式がうまく適用できない。そこで、部分認識によるキー単語抽出処理１２ｆを行う。
部分認識によるキー単語抽出処理１２ｆでは、キー単語のうち文字数がＭ文字以上のキー単語に関し、文字列前半の一部の文字と後半の一部の文字が認識できた時点で、それらの部分文字列両端に対して、上記(ii)の両端認識によるキー単語抽出を行い、条件を満たした時点でこの部分文字列を部分キー単語として抽出する。
「農業協同組合」を例にとると、「○○○業△△組合」が認識された時点で、この文字列に含まれるキー単語を「農業協同組合」と推定する。しかし「農」の位置が不明なので、「業」以降を「業協同組合」と確定する。
【００１４】
以上のようにしてキー単語が抽出されたら、単語認識によるキー単語検証処理１２ｇにおいて、抽出されたキー単語の検証を行う。
単語認識によるキー単語検証処理１２ｇにおいては、キー単語が抽出された時点で、キー単語に対する単語特徴を生成する。そして、上記キー単語抽出処理により抽出されたキー単語領域に対して、単語認識処理を行ない、距離条件を満たしたもののみをキー単語として抽出する。
また、単語イメージによってはキー単語でない文字の組合せに対して単語特徴による照合で誤読しやすい場合が存在する。
そこで、このような誤読しやすい単語イメージを類似単語特徴として単語特徴辞書に追加しておき、正しい単語特徴と詳細識別する際に用いることにより、キー単語の抽出精度を向上させることができる。
【００１５】
（２）線密度／周辺分布による検証処理
前記図２で説明したように、キー単語で区切られた単語領域を抽出し、キー単語で区切られた単語領域に対して、単語認識を行なうとともに、文字切り出し・文字認識による検証、文字数推定による単語認識結果の検証を行い、さらに、単語認識結果について、線密度／周辺分布による検証処理を行う。
以下、図７、図８により線密度／周辺分布による検証処理について説明する。ここでは、上記単語認識処理１４における単語認識処理が、文字特徴の合成によって単語特徴を生成し、該単語特徴と、抽出された単語領域の単語イメージの特徴とを照合して単語認識する場合について説明する。
前記単語認識処理１４により得られた単語認識結果について、文字特徴合成位置の算出処理１６ａにより、文字特徴同士の合成位置を逆算する。すなわち、単語特徴を生成して単語認識する方式で単語照合を行なったときに用いた単語テンプレートから文字特徴同士の合成位置を逆算する。
例えば、図８に示すように、「富士」という単語イメージの照合結果として「七十七」が得られたら、その単語テンプレートから、合成位置を逆算し、「七十七」の各文字の合成位置を求める。
合成位置は単語正規化イメージ上での位置となるので、単語領域の分割処理１６ｂでは、その位置を単語イメージ上の位置に変換し、変換された各位置で単語イメージ上を分割する。例えば図８に示すように「七十七」の各文字の合成位置を単語イメージ上の位置に変換し、「富士」という単語イメージを分割する。
【００１６】
そして、線密度、周辺分布算出処理１６ｃにおいて、分割領域ごとに線密度、あるいは、周辺分布を算出する。例えば図８の例では、「富士」という単語イメージについて、分割された各領域の線密度を算出する。
一方、線密度、周辺分布算出処理１６ｄにおいて、単語認識結果の各文字について、線密度辞書あるいは周辺分布辞書等を参照して、各文字が予め持つ線密度あるいは周辺分布を抽出する。例えば、図８の例では、「七十七」という単語の各文字の線密度を抽出する。
ついで、比較処理１６ｅにおいて、各分割領域内で算出された線密度や周辺分布と、単語認識された単語の各文字の線密度あるいは周辺分布とを比較する。そして、両者が異なる場合に単語認識結果をリジェクトする。
例えば、図８の例では、「富士」という単語イメージを分割した各領域内の線密度と、「七十七」という単語の各文字が持つ線密度は異なるので、単語認識結果である「七十七」はリジェクトされる。
【００１７】
（付記１）文字コードで表される認識対象とする文字列カテゴリから文字列の節となるキー単語のコード列を自動抽出するキー文字コード抽出手段と、
文字列イメージ中から、上記キー文字コード抽出手段により抽出されたキー単語、もしくは、その一部を抽出するキー単語抽出手段と、
抽出されたキー単語により決定される部分領域内の文字列に対して一括認識する認識手段と、
一括認識した結果を検証する検証手段とを備えた
ことを特徴とする文字列認識装置。
（付記２）上記キー単語抽出手段は、文字列イメージ中からキー単語を抽出する際に、キー単語を構成する文字の一部のみが抽出された場合に、その前後の文字についてキー文字としての抽出条件を緩め、再度文字抽出を行なう
ことを特徴とする付記１の文字列認識装置。
（付記３）上記キー単語抽出手段は、文字列イメージ中からキー単語を抽出する際に、キー単語を構成する文字のうち、その先頭文字と終端文字、およびキー単語に含まれる文字の一定の割合以上が抽出された場合に、その部分文字列をキー単語とみなす
ことを特徴とする付記１または付記２の文字列認識装置。
（付記４）上記キー単語抽出手段は、文字列イメージ中からキー単語を抽出する際に、キー単語を構成する文字のうち、離れた位置の２文字以上が抽出され、その文字間に挟まれた領域内の文字のうち、一定の割合以上が抽出された場合に、その部分文字列をキー単語の部分文字列として抽出する
ことを特徴とする付記１，２または付記３の文字列認識装置。
（付記５）上記キー単語抽出手段は、文字列イメージ中からキー単語を抽出する際に、抽出されたキー単語、もしくはその部分キー単語に対して、単語として一括認識を行ない、単語としての確からしさを検証する
ことを特徴とする付記１，２，３または付記４の文字列認識装置。
（付記６）上記キー単語抽出手段は、文字列イメージ中からキー単語を抽出する際に、１文字として切り出された領域に対して、文字特徴に加えて、単語特徴でも照合を行い、キー単語を構成する文字列、もしくはキー単語を抽出する
ことを特徴とする付記１，２，３，４または付記５の文字列認識装置。
（付記７）上記キー単語抽出手段は、文字列イメージ中からキー単語の単語特徴を用いて単語抽出を行なう際に、キー単語に誤読されやすい単語が類似単語として登録された辞書を参照して、単語認識における認識精度をあげる
ことを特徴とする付記５または付記６の文字列認識装置。
（付記８）上記キー文字コード抽出手段は、文字列カテゴリから文字列の節となるキー単語のコード列を抽出する際に、認識対象文字列全体の中で出現頻度の高い文字、文字列単位で見たときに出現頻度の高い文字、および／または、高い相関を持って出現する文字の組をキー単語として抽出する
ことを特徴とする付記１の文字列認識装置。
（付記９）文字認識で誤読の生じにくい文字を予め登録しておき、上記キー文字コード抽出手段は、文字列カテゴリから文字列の節となるキー単語のコード列を抽出する際に、上記登録された文字をキー文字として抽出する
ことを特徴とする付記１または付記８の文字列認識装置。
（付記１０）上記認識手段は、単語領域を一括認識する際、単語認識を行なうとともに、その領域に対し文字切り出しと文字認識も行ない、単語認識結果に含まれる文字が、上記文字認識結果中に、予め定められた上位ｎ位以内に閾値数以上含まれる場合に単語認識結果を確定する
ことを特徴とする付記１の文字列認識装置。
（付記１１）上記認識手段は、文字特徴を合成することにより生成した単語特徴を用いて単語領域を一括認識し、
上記検証手段は、マッチングしたテンプレートから単語イメージにおける各文字の分割位置を算出し、各分割位置で求めた単語イメージの線密度と、認識した単語の各文字が保持する線密度を比較し、両者の線密度の総和、もしくは、大小比率が閾値以上異なる場合に単語認識結果をリジェクトする
ことを特徴とする付記１または付記１０の文字列認識装置。
（付記１２）上記認識手段は、文字特徴を合成することにより生成した単語特徴を用いて、単語領域を一括認識し、
上記検証手段は、マッチングしたテンプレートから単語イメージににおける各文字の分割位置を算出し、各分割位置で求めた単語イメージの周辺分布と、認識した単語の各文字が保持する周辺分布を比較し、両者の周辺分布の総和、もしくは大小比率が閾値以上異なる場合に単語認識結果をリジェクトする
ことを特徴とする付記１または付記１０の文字列認識装置。
（付記１３）上記認識手段は、文字特徴を合成することにより生成した単語特徴を用いて単語領域を一括認識し、
上記検証手段は、認識した単語内の文字数と、単語イメージから推定される文字数の比較を行ない、両者の文字数が閾値以上異なる場合に単語認識結果をリジェクトする
ことを特徴とする付記１または付記１０の文字列認識装置。
（付記１４）文字列イメージを認識するプログラムを記録した記録媒体であって、
上記プログラムは、文字コードで表される認識対象とする文字列カテゴリから文字列の節となるキー単語のコード列を自動抽出し、
文字列イメージ中から、上記抽出されたキー単語、もしくは、その一部を抽出し、
抽出されたキー単語により決定される部分領域内の文字列に対して一括認識を行い、一括認識した結果を検証する
ことを特徴とする文字列イメージを認識するプログラムを記録した記録媒体。
【００１８】
【発明の効果】
以上説明したように本発明においては、以下の効果を得ることができる。
（１）文字コードで表される認識対象とする文字列カテゴリから文字列の節となるキー単語のコード列を自動抽出し、文字列イメージ中から、上記キー文字コード抽出手段により抽出されたキー単語、もしくは、その一部を抽出し、抽出されたキー単語により決定される部分領域内の文字列に対して一括認識し、一括認識した結果を検証するようにしたので、文字列中からキー単語の抽出を自動で行なうことができ、また、キー単語が複数文字から成る場合でも精度良くキー単語を抽出することができる。さらに、単語認識結果に対して検証処理を入れているため、単語認識で全く異なる単語に誤読することが減少する。
（２）キー単語を構成する文字の一部のみが抽出された場合に、その前後の文字についてキー文字としての抽出条件を緩め、再度文字抽出を行なうことにより、キー単語の一部の文字の字形変形が大きい場合でも、精度よくキー単語を抽出することができる。
（３）キー単語を構成する文字のうち、その先頭文字と終端文字、およびキー単語に含まれる文字の一定の割合以上が抽出された場合に、その部分文字列をキー単語とみなようにすることにより、キー単語の文字同士が接触していても、精度良くキー単語を抽出することができる。
（４）キー単語を構成する文字のうち、離れた位置の２文字以上が抽出され、その文字間に挟まれた領域内の文字のうち、一定の割合以上が抽出された場合に、その部分文字列をキー単語の部分文字列として抽出ことにより、キー単語の端の文字がその周辺の文字と接触していも、精度良くキー単語を抽出することができる。
（５）抽出されたキー単語、もしくはその部分キー単語に対して、単語として一括認識を行ない、単語としての確からしさを検証することにより、文字認識精度が低い場合でも、精度良くキー単語を抽出することができる。
（６）１文字として切り出された領域に対して、文字特徴に加えて、単語特徴でも照合を行い、キー単語を構成する文字列、もしくはキー単語を抽出することにより、文字数が少ないキー単語内の文字が接触している場合でも、キー単語を抽出することができる。
（７）キー単語に誤読されやすい単語が類似単語として登録された辞書を参照して、単語認識における認識精度をあげることにより、精度良くキー単語を抽出することができる。
（８）キー単語のコード列を抽出する際に、認識対象文字列全体の中で出現頻度の高い文字、文字列単位で見たときに出現頻度の高い文字、および／または、高い相関を持って出現する文字の組をキー単語として抽出することにより、認識対象文字列（コード）から自動的にキー単語を抽出することが可能となる。
（９）文字認識で誤読の生じにくい文字を予め登録しておき、文字列カテゴリから文字列の節となるキー単語のコード列を抽出する際に、上記登録された文字をキー文字として抽出することにより、より確実にキー単語を抽出することができる。
（１０）キー文字／キー単語で区切られた単語領域を一括認識する際、単語認識を行なうとともに、その領域に対し文字切り出しと文字認識も行ない、単語認識結果に含まれる文字が、上記文字認識結果中に、予め定められた上位ｎ位以内に閾値数以上含まれる場合に単語認識結果を確定することにより、極端な誤読を減らすことができる。
（１１）文字特徴を合成することにより生成した単語特徴を用いて単語領域を一括認識する場合、マッチングしたテンプレートから単語イメージにおける各文字の分割位置を算出し、各分割位置で求めた単語イメージの線密度もしくは周辺分布と、認識した単語の各文字が保持する線密度もしくは周辺分布を比較し、両者の線密度、周辺分布の総和、もしくは、大小比率が閾値以上異なる場合に単語認識結果をリジェクトすることにより、単語認識の誤読を減らすことができる。
（１２）文字特徴を合成することにより生成した単語特徴を用いて単語領域を一括認識する場合に、認識した単語内の文字数と、単語イメージから推定される文字数の比較を行ない、両者の文字数が閾値以上異なる場合に単語認識結果をリジェクトすることにより、上記と同様、単語認識の誤読を減らすことができる。
【図面の簡単な説明】
【図１】本発明の概要を説明する図である。
【図２】本発明の実施例の文字列認識装置の全体の概略構成を示す図である。
【図３】キー文字コード自動抽出処理、キー文字／キー単語抽出処理の実施例を示す図である。
【図４】認識対象文字群と抽出される文字、文字列の一例を示す図である。
【図５】個別文字切り出し、文字認識・キー単語抽出処理のフローを示す図である。
【図６】個別文字として切り出した文字の単語認識を行う場合を説明する図である。
【図７】線密度／周辺分布による検証処理を示す図である。
【図８】線密度／周辺分布による検証処理を説明する図である。
【符号の説明】
１キー文字コード抽出手段
２キー単語抽出手段
３単語認識手段
４検証手段
１１キー文字コード自動抽出処理
１２キー文字／キー単語抽出処理
１３単語領域抽出処理
１４単語認識処理
１５文字切り出し／文字認識処理
１６線密度／周辺分布による検証処理
１７文字数推定処理

Claims

認識対象文字列全体の中で出現頻度の高い文字、文字列単位で見たときに出現頻度の高い文字、および／または、同時に出現する確率が閾値より高い文字の組を、文字コードで表される認識対象とする文字列カテゴリから文字列の節となるキー単語のコード列として自動抽出するキー文字コード抽出手段と、
文字列イメージ中から、上記キー文字コード抽出手段により抽出されたキー単語、もしくは、その一部を抽出するキー単語抽出手段と、
抽出されたキー単語の前後の部分領域内の文字列に対して一括認識する認識手段と、
一括認識した結果を検証する検証手段とを備え、
上記キー単語抽出手段は、文字列イメージ中からキー単語を抽出する際に、下記（イ）〜（ニ）のいずれかの処理を行なう
（イ）キー単語を構成する文字のうち、その先頭文字と終端文字、およびキー単語に含まれる文字の一定の割合以上が抽出された場合に、その部分文字列をキー単語とみなす。
（ロ）キー単語を構成する文字のうち、離れた位置の２文字以上が抽出され、その文字間に挟まれた領域内の文字のうち、一定の割合以上が抽出された場合に、その部分文字列をキー単語の部分文字列として抽出する。
（ハ）抽出されたキー単語そのものに対して、単語として一括認識を行ない、単語としての確からしさを検証する。
（ニ）１文字として切り出された領域に対して、文字特徴に加えて、単語特徴でも照合を行い、キー単語を構成する文字列、もしくはキー単語を抽出する。
ことを特徴とする文字列認識装置。
上記認識手段は、単語領域を一括認識する際、単語認識を行なうとともに、その領域に対し文字切り出しと文字認識も行ない、単語認識結果に含まれる文字が、上記文字認識結果中に、予め定められた上位ｎ位以内に閾値数以上含まれる場合に単語認識結果を確定する
ことを特徴とする請求項１の文字列認識装置。
文字列イメージを認識する処理をコンピュータに実行させるプログラムを記録した記録媒体であって、
上記プログラムは、認識対象文字列全体の中で出現頻度の高い文字、文字列単位で見たときに出現頻度の高い文字、および／または、同時に出現する確率が閾値より高い文字の組を、文字コードで表される認識対象とする文字列カテゴリから文字列の節となるキー単語のコード列として自動抽出する処理と、
文字列イメージ中から、上記抽出されたキー単語、もしくは、その一部を抽出する処理と、
抽出されたキー単語の前後の部分領域内の文字列に対して一括認識する処理と、
一括認識した結果を検証する処理をコンピュータに実行させ、
上記文字列イメージ中からキー単語を抽出する際に、下記（イ）〜（ニ）のいずれかの処理をコンピュータに行なわせる
（イ）キー単語を構成する文字のうち、その先頭文字と終端文字、およびキー単語に含まれる文字の一定の割合以上が抽出された場合に、その部分文字列をキー単語とみなす。
（ロ）キー単語を構成する文字のうち、離れた位置の２文字以上が抽出され、その文字間に挟まれた領域内の文字のうち、一定の割合以上が抽出された場合に、その部分文字列をキー単語の部分文字列として抽出する。
（ハ）抽出されたキー単語そのものに対して、単語として一括認識を行ない、単語としての確からしさを検証する。
（ニ）１文字として切り出された領域に対して、文字特徴に加えて、単語特徴でも照合を行い、キー単語を構成する文字列、もしくはキー単語を抽出する。
ことを特徴とする文字列イメージを認識するプログラムを記録した記録媒体。
上記キー単語のコード列を自動抽出する処理において、文字列カテゴリから文字列の節となるキー単語のコード列を抽出する際に、認識対象文字列全体の中で出現頻度の高い文字、文字列単位で見たときに出現頻度の高い文字、および／または、同時に出現する確率が閾値より高い文字の組をキー単語として抽出する
ことを特徴とする請求項３の文字列イメージを認識するプログラムを記録した記録媒体。