JP4136316B2 - 文字列認識装置 - Google Patents
文字列認識装置 Download PDFInfo
- Publication number
- JP4136316B2 JP4136316B2 JP2001015349A JP2001015349A JP4136316B2 JP 4136316 B2 JP4136316 B2 JP 4136316B2 JP 2001015349 A JP2001015349 A JP 2001015349A JP 2001015349 A JP2001015349 A JP 2001015349A JP 4136316 B2 JP4136316 B2 JP 4136316B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- word
- key
- character string
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Description
【発明の属する技術分野】
近年、文書入力磯器として文字認識装置OCRやソフトウェアOCRの需要が増加している。本発明は、この文字認識装置における文字列認識装置に関し、特に手書き文字列を認識するのに有効な文字列認識装置に関するものである。
本発明が対象とする手書き文字列は、住所、氏名、大学名、銀行名など一般帳票において記入される種々の文字列であり、従来のように文字列先頭から1文字ずつ切り出して文字認識していくのではなく、文字列を複数の部分文字列に分解し、各部分文字列ごとに含まれる単語を一括して認識する。これにより、手書き文字列に特有の問題である文字同士の接触や、分離文字の存在に対応することが可能である。なお、本発明が対象とする文字認識装置は、上記した手書き用文字認識装置だけでなく、印刷文字認識装置、携帯情報端末における文字認識装置等、広い意味での文字認識装置に適用することができる。
【0002】
【従来の技術】
手書き文字列に対して、文字列を部分文字列に分解して単語認識を行なう方式としては、これまでに、手書き住所を対象に都道府県市区郡といった住所の切れ目となる文字(キー文字)を見つけ、それらの文字間に挟まれた領域を単語認識していくものが提案されている(例えば特開平11−161740号公報、特開平11−328315号公報参照)。
しかし、上記従来のものは、手書き住所を対象にしたものであり、住所以外の一般の手書き文字列に対するものはこれまでになかった。また、住所では文字列の区切りとなる文字が1文字だけであり、キー文字が複数文字、すなわちキー単語になる場合は扱っていなかった。
【0003】
【発明が解決しようとする課題】
従来の手書き住所認識におけるキー文字抽出方式では、予めキー文字が{都,道,府,県,市,区,郡,町,村}と決定されていた。しかし、対象が住所以外ではその都度キー文字を設定しなおす必要があった。
また、従来法では文字列中から文字数1のキー文字しか抽出していないため、文字数が複数のキー単語になると、キー単語内の文字同士の接触もあり、従来方式をそのまま適用しただけではキー単語抽出が失敗していた。
さらに、従来の単語認識では精度の高いリジェクト処理が行なわれていないため、正解と全く違う単語に誤読する場合があり、ユーザの印象を悪くしていた。本発明は、上記従来技術の問題点を解決するためになされたものであって、その目的とするところは、文字列中からキー単語の抽出を自動で行なうことができ、また、キー単語が複数文字から成る場合でも精度良くキー単語を抽出することができ、さらに、単語認識に際し、全く異なる単語に誤読することがない文字列認識装置を提供することである。
【0004】
【課題を解決するための手段】
図1は本発明の概要を示す図である。
上記の課題を解決するため、本発明においては同図に示すように、キー文字コード抽出手段1により、認識対象とする文字列群(コード)からキー文字(キー単語)の自動抽出を行ない、それらを登録する。これにより、図1に示すように、県、市、区、町等の住所認識におけるキー文字に加え、例えば、信用組合、支店、農業協同組合、支所等のキー単語が登録される。また、相関を持って出現する文字列の組を抽出することにより、「信用組合」−「支店」等のように、共に現れる確率が高いキー単語が組が抽出される。
次に、キー単語抽出手段2により、文字列イメージから、個別文字を切り出して文字認識を行い、上記キー文字コード抽出手段1により抽出/登録されたキー単語に相当する文字列を言語処理と融合して精度よく抽出する。そして、文字列イメージから、キー単語で区切られた単語領域を抽出し単語認識手段3により単語認識を行う。さらに、検証手段4により単語認識結果を検証し、最終的な文字列認識結果を出力する。
【0005】
【発明の実施の形態】
図2は本発明の実施例の文字列認識装置の全体の概略構成を示す図である。
同図において、キー文字コード自動抽出処理11では、認識対象文字列群(文字コード群)から、キー文字コード、キー文字列コードを自動抽出する(以下では、文字コード、文字列コードを合わせて文字コードという)。ここで、認識対象とする文字列群、例えば、住所、氏名、大学名、金融機関名などは特定されているとする。
キー文字コード自動抽出処理11では、それらの対象文字列群に対して、出現する文字コードを調べ、出現頻度の高い文字や、文字列単位で見たときに出現頻度の高い文字、文字列をキー文字コードとして登録する。
さらに、文字同士の出現の相関を調べる。相関とは、例えば、文字コードAが出現したときは文字コードBが出現する確率が高いとか、文字コードCが出現したときは文字コードD、文字コードEが同時に出現する確率が高い、などといった関係である。このように相関を持って出現する文字コードの組も同時にキー文字コードとして登録していく。
以上の処理により、例えば住所では、{県,市,区,町}{県,郡,町}{都,区,町}がキー文字として抽出でき、金融機関名では{銀行,支店}{信用組合,営業部}{農業協同組合,支所}などのキー文字が自動で抽出できる。住所の場合を例にとると、必ずしも住所階層の区切りとなっていない文字もキー文字として用いることができる。以上のようにして抽出された文字コードは、キー文字コードとして登録される。
【0006】
キー文字/キー単語抽出処理12では、後述するように手書き文字列(イメージデータ)から個別文字を切り出し、文字認識を行って上記キー文字コード自動抽出手段11により抽出されたキー文字コードに相当したキー文字、キー単語を抽出し登録する。
単語領域抽出処理13では、手書き文字列(イメージ)から、上記キー文字、キー単語により区切られた単語領域を抽出する。例えば、手書き文字列が「東京信用組合日比谷支店」の場合、「信用組合」、「支店」により区切られた「東京」、「日比谷」の領域を単語領域として抽出する。
単語認識処理14では、上記抽出された単語領域の文字イメージを正規化して特徴抽出を行い、単語特徴辞書等の特徴データと照合して、単語認識を行う。なお、単語認識手法としては、例えば、前記した 特開平11−161740号公報、特開平11−328315号公報で開示される手法や、本出願人が先に提案した特願2000−304758号に開示される手法を用いることができる。
【0007】
上記のように、キー単語間に挟まれた単語領域に対して、単語認識を行なうとともに、以下のようにして、単語認識結果の検証を行う。
(i) 文字切り出し/文字認識処理15において、個別文字の切り出しを行って、文字認識処理も行う。そして、文字認識結果の上位n位以内に単語認識された単語内の文字のうち閾値以上の割合が含まれている場合に、単語認識手段14による単語認識結果を出力し、そうでない場合はリジェクトする。これにより、単語認識における極端な誤読を減らすことができる。
(ii)さらに、図2の点線に示すように、文字数推定処理17により、文字数比較により単語認識結果を検証するようにしてもよい。
すなわち、単語領域を一括認識した際に、認識した単語内の文字数と単語イメージから推定される文字数の比較を行ない、両者の文字数が閾値以上異なる場合に単語認識結果をリジェクトする。文字数推定の方法としては、単語イメージに外接する矩形の高さと幅の比や単語イメージに対して周辺分布をとり、周辺分布の切れ目位置・外接矩形高さなどから算出される数を用いることができる。
(iii) 線密度/周辺分布による検証処理16では、文字特徴の合成によって単語特徴を生成した場合、後述するように、文字特徴同士の合成位置を逆算し各位置で単語イメージ上を分割し、各分割領域内で算出された線密度や周辺分布と、単語認識された単語の各文字が予め持つ線密度や周辺分布とを比較する。そして、両者が異なる場合に単語認識結果をリジェクトすることにより、単語認識結果を検証する。
【0008】
以下、上記キー文字コード自動抽出処理、キー文字/キー単語抽出処理、および線密度/周辺分布による検証処理について説明する。
(1)キー文字コード自動抽出処理、キー文字/キー単語抽出処理
図3は、上記キー文字コード自動抽出処理、キー文字/キー単語抽出処理の実施例を示す図である。
キー文字コード自動抽出処理11において、まず、処理11aにおいて、認識対象文字列コードから出現頻度の高い文字や、文字列単位で見たときに出現頻度の高い文字、文字列をキー文字コードとして抽出する。さらに、処理11bにおいて、前記したように、相関を持って出現する文字コードの組を抽出し、これらの文字の組をキー文字コードとして登録していく。
図4に認識対象文字列群と、そこから抽出されるキー文字コードの一例を示す。図4(a)の認識対象文字列群から出現頻度の高い文字コードを抽出すると、例えば図4(b)に示すように、県、都、…等の住所認識における文字に加え、信用組合、商工信用組合等の金融機関名や農業協同組合名等のキー文字コードが抽出される。また、「……県信用組合」、「……県農業協同組合」等のように「県」等の文字が付された文字列の出現頻度が高ければ、これもキー文字コードとして抽出される。また、文字同士の出現の相関を調べると、図4(c)に示すように相関の高い文字コードの組が抽出される。
なお、文字認識で誤読の生じにくい文字を予め登録しておき、上記キー文字コードを抽出する際、上記登録された文字をキー文字コードとして抽出しておけば、文字イメージからのキー単語抽出処理において、より確実にキー単語を抽出することが可能となる。
【0009】
キー文字/キー単語抽出処理12では、個別文字切り出し処理12aにおいて手書き文字列(イメージデータ)から個別文字を切り出し、前記したように文字認識を行って上記キー文字コード自動抽出手段11により抽出されたキー文字コードに相当したキー文字、キー単語を抽出する。
以下、キー文字が複数文字から成るもの、すなわちキー単語の抽出について説明する。ここでは、例として、金融機関名を取り上げ、「○○信用組合△△支店」や「○○農業協同組合△△支所」などからキー単語として「信用組合」「農業協同組合」を抽出することを考える。なお、県,市,区,町等の1文字のキー文字は、以下に説明する文字認識・キー単語/文字抽出処理で、キー単語の抽出と同様に抽出することができる。
まず、一般的なキー単語の抽出について説明する。文字認識・キー文字/単語抽出処理12bでは、切り出された個別文字について、文字認識を行なっていき、各文字ごとに認識結果の上位n位候補の距離値を見ていく。距離値が閾値TH1以下の候補の中に予め登録されているキー単語中の文字が属していたら、それを着目文字のキー文字候補とする。
キー単語中の文字が複数属している場合は複数のキー文字候補を出しておく。文字列中のすべての文字についてこの処理を行ない、キー文字候補の文字並びの中にキー単語と同一の文字列が含まれている場合に、これらをキー単語として抽出する。
【0010】
図5に上記個別文字切り出し、文字認識・キー文字/単語抽出処理のフローを示す。
ステップS1において個別文字を切り出し、ステップS2において切り出した文字の文字認識を行う。文字認識は、切り出した文字から特徴を抽出し、特徴データを格納した辞書との照合を行って候補文字を抽出し、切り出した文字と候補文字との距離値を求めることにより行う。
ステップS3において、以上のようにして求めた文字認識結果の上位n位の候補文字を抽出する。ステップS4において、候補文字の距離値が閾値TH1より小さいかを調べる。候補文字の距離値が閾値TH1より小さければ、ステップS5において、上記候補文字が、キー文字コード自動抽出処理11において登録されたキー単語中に含まれているかを調べる。含まれている場合には、ステップS6において、上記文字をキー文字候補として登録する。
以上の処理を全ての文字の処理が終わるまで繰り返し、全ての文字についての処理が終わったら、ステップS7からステップS8に行き、キー文字候補の文字並びの中に、キー文字コード自動抽出処理11において登録されたキー単語と同一の文字列が含まれているものをキー単語として抽出する。
【0011】
一方、上記文字認識と同時に、単語認識/キー単語抽出処理12cにおいて、個別文字として切り出した文字について単語認識を行う。
例えば図6に示す「支店」ように、小さく書かれた文字同士が接触している場合、文字切り出しをした時点で、この接触文字を1文字として捉えてしまうことがある。
このような場合に備え、単語認識/キー単語抽出処理12cにおいて、1文字として切り出された領域に対して文字特徴に加えて単語特徴でも照合を行なう。そして、単語特徴による照合で距離条件を満たした場合は、これをキー単語として抽出する。
【0012】
上記文字認識・キー文字/単語抽出処理において、予め登録されたキー単語の一部の文字が抽出された場合には、次のように処理を行う。
(i) 多段閾値による2段階抽出
文字列中からキー単語の一部のみが抽出されたとき、前後のキー文字抽出処理12dでは、その前後の文字認識結果に対してキー単語抽出の距離値条件を緩め、再度抽出処理を行なう。
つまり、通常はある文字に対する文字認識結果に対し、前記距離値TH1以上の認識結果候補の中にキー文字が含まれている場合にキー文字候補として抽出するが、抽出されたキー文字の前後の文字については、距離値TH2(TH2>TH1)以上の認識結果候補の中からキー文字を抽出する。これにより、キー単語の一部の文字の字形変形が大きい場合でも、キー単語の一部として抽出することができる。
【0013】
(ii)両端認識によるキー単語抽出
文字同士の接触の多い文字列では、キー単語に属す個々の文字を全て切り出して認識することが困難なことが多い。
例えば、「農業協同組合」というキー単語イメージの中で、「業協」の部分が複雑に接触していて、文字切り出しでうまく切り出せない場合が生じる。そこで、両端認識によるキー文字抽出処理12eを行う。
キー文字抽出処理12eでは、文字数がN文字以上のキー単語に関して、文字列の先頭と終端の文字が抽出され、さらに全文字数のP%以上の文字が抽出された時点で、キー単語が抽出されたものとみなす。上記N,Pについては実験により求めた値を用い、例えばP=60などとする。
「農業協同組合」を例にとると、「農業○○組合」や「農○○同組合」とキー文字候補が抽出された時点で、この文字列を「農業協同組合」と確定する。
(iii) 部分認識による部分キー単語抽出
キー単語の先頭の文字がその前の文字と接触していると、正しく抽出することができず、上記両端認識方式がうまく適用できない。そこで、部分認識によるキー単語抽出処理12fを行う。
部分認識によるキー単語抽出処理12fでは、キー単語のうち文字数がM文字以上のキー単語に関し、文字列前半の一部の文字と後半の一部の文字が認識できた時点で、それらの部分文字列両端に対して、上記(ii)の両端認識によるキー単語抽出を行い、条件を満たした時点でこの部分文字列を部分キー単語として抽出する。
「農業協同組合」を例にとると、「○○○業△△組合」が認識された時点で、この文字列に含まれるキー単語を「農業協同組合」と推定する。しかし「農」の位置が不明なので、「業」以降を「業協同組合」と確定する。
【0014】
以上のようにしてキー単語が抽出されたら、単語認識によるキー単語検証処理12gにおいて、抽出されたキー単語の検証を行う。
単語認識によるキー単語検証処理12gにおいては、キー単語が抽出された時点で、キー単語に対する単語特徴を生成する。そして、上記キー単語抽出処理により抽出されたキー単語領域に対して、単語認識処理を行ない、距離条件を満たしたもののみをキー単語として抽出する。
また、単語イメージによってはキー単語でない文字の組合せに対して単語特徴による照合で誤読しやすい場合が存在する。
そこで、このような誤読しやすい単語イメージを類似単語特徴として単語特徴辞書に追加しておき、正しい単語特徴と詳細識別する際に用いることにより、キー単語の抽出精度を向上させることができる。
【0015】
(2)線密度/周辺分布による検証処理
前記図2で説明したように、キー単語で区切られた単語領域を抽出し、キー単語で区切られた単語領域に対して、単語認識を行なうとともに、文字切り出し・文字認識による検証、文字数推定による単語認識結果の検証を行い、さらに、単語認識結果について、線密度/周辺分布による検証処理を行う。
以下、図7、図8により線密度/周辺分布による検証処理について説明する。ここでは、上記単語認識処理14における単語認識処理が、文字特徴の合成によって単語特徴を生成し、該単語特徴と、抽出された単語領域の単語イメージの特徴とを照合して単語認識する場合について説明する。
前記単語認識処理14により得られた単語認識結果について、文字特徴合成位置の算出処理16aにより、文字特徴同士の合成位置を逆算する。すなわち、単語特徴を生成して単語認識する方式で単語照合を行なったときに用いた単語テンプレートから文字特徴同士の合成位置を逆算する。
例えば、図8に示すように、「富士」という単語イメージの照合結果として「七十七」が得られたら、その単語テンプレートから、合成位置を逆算し、「七十七」の各文字の合成位置を求める。
合成位置は単語正規化イメージ上での位置となるので、単語領域の分割処理16bでは、その位置を単語イメージ上の位置に変換し、変換された各位置で単語イメージ上を分割する。例えば図8に示すように「七十七」の各文字の合成位置を単語イメージ上の位置に変換し、「富士」という単語イメージを分割する。
【0016】
そして、線密度、周辺分布算出処理16cにおいて、分割領域ごとに線密度、あるいは、周辺分布を算出する。例えば図8の例では、「富士」という単語イメージについて、分割された各領域の線密度を算出する。
一方、線密度、周辺分布算出処理16dにおいて、単語認識結果の各文字について、線密度辞書あるいは周辺分布辞書等を参照して、各文字が予め持つ線密度あるいは周辺分布を抽出する。例えば、図8の例では、「七十七」という単語の各文字の線密度を抽出する。
ついで、比較処理16eにおいて、各分割領域内で算出された線密度や周辺分布と、単語認識された単語の各文字の線密度あるいは周辺分布とを比較する。そして、両者が異なる場合に単語認識結果をリジェクトする。
例えば、図8の例では、「富士」という単語イメージを分割した各領域内の線密度と、「七十七」という単語の各文字が持つ線密度は異なるので、単語認識結果である「七十七」はリジェクトされる。
【0017】
(付記1) 文字コードで表される認識対象とする文字列カテゴリから文字列の節となるキー単語のコード列を自動抽出するキー文字コード抽出手段と、
文字列イメージ中から、上記キー文字コード抽出手段により抽出されたキー単語、もしくは、その一部を抽出するキー単語抽出手段と、
抽出されたキー単語により決定される部分領域内の文字列に対して一括認識する認識手段と、
一括認識した結果を検証する検証手段とを備えた
ことを特徴とする文字列認識装置。
(付記2) 上記キー単語抽出手段は、文字列イメージ中からキー単語を抽出する際に、キー単語を構成する文字の一部のみが抽出された場合に、その前後の文字についてキー文字としての抽出条件を緩め、再度文字抽出を行なう
ことを特徴とする付記1の文字列認識装置。
(付記3) 上記キー単語抽出手段は、文字列イメージ中からキー単語を抽出する際に、キー単語を構成する文字のうち、その先頭文字と終端文字、およびキー単語に含まれる文字の一定の割合以上が抽出された場合に、その部分文字列をキー単語とみなす
ことを特徴とする付記1または付記2の文字列認識装置。
(付記4) 上記キー単語抽出手段は、文字列イメージ中からキー単語を抽出する際に、キー単語を構成する文字のうち、離れた位置の2文字以上が抽出され、その文字間に挟まれた領域内の文字のうち、一定の割合以上が抽出された場合に、その部分文字列をキー単語の部分文字列として抽出する
ことを特徴とする付記1,2または付記3の文字列認識装置。
(付記5) 上記キー単語抽出手段は、文字列イメージ中からキー単語を抽出する際に、抽出されたキー単語、もしくはその部分キー単語に対して、単語として一括認識を行ない、単語としての確からしさを検証する
ことを特徴とする付記1,2,3または付記4の文字列認識装置。
(付記6) 上記キー単語抽出手段は、文字列イメージ中からキー単語を抽出する際に、1文字として切り出された領域に対して、文字特徴に加えて、単語特徴でも照合を行い、キー単語を構成する文字列、もしくはキー単語を抽出する
ことを特徴とする付記1,2,3,4または付記5の文字列認識装置。
(付記7) 上記キー単語抽出手段は、文字列イメージ中からキー単語の単語特徴を用いて単語抽出を行なう際に、キー単語に誤読されやすい単語が類似単語として登録された辞書を参照して、単語認識における認識精度をあげる
ことを特徴とする付記5または付記6の文字列認識装置。
(付記8) 上記キー文字コード抽出手段は、文字列カテゴリから文字列の節となるキー単語のコード列を抽出する際に、認識対象文字列全体の中で出現頻度の高い文字、文字列単位で見たときに出現頻度の高い文字、および/または、高い相関を持って出現する文字の組をキー単語として抽出する
ことを特徴とする付記1の文字列認識装置。
(付記9) 文字認識で誤読の生じにくい文字を予め登録しておき、上記キー文字コード抽出手段は、文字列カテゴリから文字列の節となるキー単語のコード列を抽出する際に、上記登録された文字をキー文字として抽出する
ことを特徴とする付記1または付記8の文字列認識装置。
(付記10) 上記認識手段は、単語領域を一括認識する際、単語認識を行なうとともに、その領域に対し文字切り出しと文字認識も行ない、単語認識結果に含まれる文字が、上記文字認識結果中に、予め定められた上位n位以内に閾値数以上含まれる場合に単語認識結果を確定する
ことを特徴とする付記1の文字列認識装置。
(付記11) 上記認識手段は、文字特徴を合成することにより生成した単語特徴を用いて単語領域を一括認識し、
上記検証手段は、マッチングしたテンプレートから単語イメージにおける各文字の分割位置を算出し、各分割位置で求めた単語イメージの線密度と、認識した単語の各文字が保持する線密度を比較し、両者の線密度の総和、もしくは、大小比率が閾値以上異なる場合に単語認識結果をリジェクトする
ことを特徴とする付記1または付記10の文字列認識装置。
(付記12) 上記認識手段は、文字特徴を合成することにより生成した単語特徴を用いて、単語領域を一括認識し、
上記検証手段は、マッチングしたテンプレートから単語イメージににおける各文字の分割位置を算出し、各分割位置で求めた単語イメージの周辺分布と、認識した単語の各文字が保持する周辺分布を比較し、両者の周辺分布の総和、もしくは大小比率が閾値以上異なる場合に単語認識結果をリジェクトする
ことを特徴とする付記1または付記10の文字列認識装置。
(付記13) 上記認識手段は、文字特徴を合成することにより生成した単語特徴を用いて単語領域を一括認識し、
上記検証手段は、認識した単語内の文字数と、単語イメージから推定される文字数の比較を行ない、両者の文字数が閾値以上異なる場合に単語認識結果をリジェクトする
ことを特徴とする付記1または付記10の文字列認識装置。
(付記14) 文字列イメージを認識するプログラムを記録した記録媒体であって、
上記プログラムは、文字コードで表される認識対象とする文字列カテゴリから文字列の節となるキー単語のコード列を自動抽出し、
文字列イメージ中から、上記抽出されたキー単語、もしくは、その一部を抽出し、
抽出されたキー単語により決定される部分領域内の文字列に対して一括認識を行い、一括認識した結果を検証する
ことを特徴とする文字列イメージを認識するプログラムを記録した記録媒体。
【0018】
【発明の効果】
以上説明したように本発明においては、以下の効果を得ることができる。
(1)文字コードで表される認識対象とする文字列カテゴリから文字列の節となるキー単語のコード列を自動抽出し、文字列イメージ中から、上記キー文字コード抽出手段により抽出されたキー単語、もしくは、その一部を抽出し、抽出されたキー単語により決定される部分領域内の文字列に対して一括認識し、一括認識した結果を検証するようにしたので、文字列中からキー単語の抽出を自動で行なうことができ、また、キー単語が複数文字から成る場合でも精度良くキー単語を抽出することができる。さらに、単語認識結果に対して検証処理を入れているため、単語認識で全く異なる単語に誤読することが減少する。
(2)キー単語を構成する文字の一部のみが抽出された場合に、その前後の文字についてキー文字としての抽出条件を緩め、再度文字抽出を行なうことにより、キー単語の一部の文字の字形変形が大きい場合でも、精度よくキー単語を抽出することができる。
(3)キー単語を構成する文字のうち、その先頭文字と終端文字、およびキー単語に含まれる文字の一定の割合以上が抽出された場合に、その部分文字列をキー単語とみなようにすることにより、キー単語の文字同士が接触していても、精度良くキー単語を抽出することができる。
(4)キー単語を構成する文字のうち、離れた位置の2文字以上が抽出され、その文字間に挟まれた領域内の文字のうち、一定の割合以上が抽出された場合に、その部分文字列をキー単語の部分文字列として抽出ことにより、キー単語の端の文字がその周辺の文字と接触していも、精度良くキー単語を抽出することができる。
(5)抽出されたキー単語、もしくはその部分キー単語に対して、単語として一括認識を行ない、単語としての確からしさを検証することにより、文字認識精度が低い場合でも、精度良くキー単語を抽出することができる。
(6)1文字として切り出された領域に対して、文字特徴に加えて、単語特徴でも照合を行い、キー単語を構成する文字列、もしくはキー単語を抽出することにより、文字数が少ないキー単語内の文字が接触している場合でも、キー単語を抽出することができる。
(7)キー単語に誤読されやすい単語が類似単語として登録された辞書を参照して、単語認識における認識精度をあげることにより、精度良くキー単語を抽出することができる。
(8)キー単語のコード列を抽出する際に、認識対象文字列全体の中で出現頻度の高い文字、文字列単位で見たときに出現頻度の高い文字、および/または、高い相関を持って出現する文字の組をキー単語として抽出することにより、認識対象文字列(コード)から自動的にキー単語を抽出することが可能となる。
(9)文字認識で誤読の生じにくい文字を予め登録しておき、文字列カテゴリから文字列の節となるキー単語のコード列を抽出する際に、上記登録された文字をキー文字として抽出することにより、より確実にキー単語を抽出することができる。
(10)キー文字/キー単語で区切られた単語領域を一括認識する際、単語認識を行なうとともに、その領域に対し文字切り出しと文字認識も行ない、単語認識結果に含まれる文字が、上記文字認識結果中に、予め定められた上位n位以内に閾値数以上含まれる場合に単語認識結果を確定することにより、極端な誤読を減らすことができる。
(11)文字特徴を合成することにより生成した単語特徴を用いて単語領域を一括認識する場合、マッチングしたテンプレートから単語イメージにおける各文字の分割位置を算出し、各分割位置で求めた単語イメージの線密度もしくは周辺分布と、認識した単語の各文字が保持する線密度もしくは周辺分布を比較し、両者の線密度、周辺分布の総和、もしくは、大小比率が閾値以上異なる場合に単語認識結果をリジェクトすることにより、単語認識の誤読を減らすことができる。
(12)文字特徴を合成することにより生成した単語特徴を用いて単語領域を一括認識する場合に、認識した単語内の文字数と、単語イメージから推定される文字数の比較を行ない、両者の文字数が閾値以上異なる場合に単語認識結果をリジェクトすることにより、上記と同様、単語認識の誤読を減らすことができる。
【図面の簡単な説明】
【図1】本発明の概要を説明する図である。
【図2】本発明の実施例の文字列認識装置の全体の概略構成を示す図である。
【図3】キー文字コード自動抽出処理、キー文字/キー単語抽出処理の実施例を示す図である。
【図4】認識対象文字群と抽出される文字、文字列の一例を示す図である。
【図5】個別文字切り出し、文字認識・キー単語抽出処理のフローを示す図である。
【図6】個別文字として切り出した文字の単語認識を行う場合を説明する図である。
【図7】線密度/周辺分布による検証処理を示す図である。
【図8】線密度/周辺分布による検証処理を説明する図である。
【符号の説明】
1 キー文字コード抽出手段
2 キー単語抽出手段
3 単語認識手段
4 検証手段
11 キー文字コード自動抽出処理
12 キー文字/キー単語抽出処理
13 単語領域抽出処理
14 単語認識処理
15 文字切り出し/文字認識処理
16 線密度/周辺分布による検証処理
17 文字数推定処理
Claims (4)
- 認識対象文字列全体の中で出現頻度の高い文字、文字列単位で見たときに出現頻度の高い文字、および/または、同時に出現する確率が閾値より高い文字の組を、文字コードで表される認識対象とする文字列カテゴリから文字列の節となるキー単語のコード列として自動抽出するキー文字コード抽出手段と、
文字列イメージ中から、上記キー文字コード抽出手段により抽出されたキー単語、もしくは、その一部を抽出するキー単語抽出手段と、
抽出されたキー単語の前後の部分領域内の文字列に対して一括認識する認識手段と、
一括認識した結果を検証する検証手段とを備え、
上記キー単語抽出手段は、文字列イメージ中からキー単語を抽出する際に、下記(イ)〜(ニ)のいずれかの処理を行なう
(イ)キー単語を構成する文字のうち、その先頭文字と終端文字、およびキー単語に含まれる文字の一定の割合以上が抽出された場合に、その部分文字列をキー単語とみなす。
(ロ)キー単語を構成する文字のうち、離れた位置の2文字以上が抽出され、その文字間に挟まれた領域内の文字のうち、一定の割合以上が抽出された場合に、その部分文字列をキー単語の部分文字列として抽出する。
(ハ)抽出されたキー単語そのものに対して、単語として一括認識を行ない、単語としての確からしさを検証する。
(ニ)1文字として切り出された領域に対して、文字特徴に加えて、単語特徴でも照合を行い、キー単語を構成する文字列、もしくはキー単語を抽出する。
ことを特徴とする文字列認識装置。 - 上記認識手段は、単語領域を一括認識する際、単語認識を行なうとともに、その領域に対し文字切り出しと文字認識も行ない、単語認識結果に含まれる文字が、上記文字認識結果中に、予め定められた上位n位以内に閾値数以上含まれる場合に単語認識結果を確定する
ことを特徴とする請求項1の文字列認識装置。 - 文字列イメージを認識する処理をコンピュータに実行させるプログラムを記録した記録媒体であって、
上記プログラムは、認識対象文字列全体の中で出現頻度の高い文字、文字列単位で見たときに出現頻度の高い文字、および/または、同時に出現する確率が閾値より高い文字の組を、文字コードで表される認識対象とする文字列カテゴリから文字列の節となるキー単語のコード列として自動抽出する処理と、
文字列イメージ中から、上記抽出されたキー単語、もしくは、その一部を抽出する処理と、
抽出されたキー単語の前後の部分領域内の文字列に対して一括認識する処理と、
一括認識した結果を検証する処理をコンピュータに実行させ、
上記文字列イメージ中からキー単語を抽出する際に、下記(イ)〜(ニ)のいずれかの処理をコンピュータに行なわせる
(イ)キー単語を構成する文字のうち、その先頭文字と終端文字、およびキー単語に含まれる文字の一定の割合以上が抽出された場合に、その部分文字列をキー単語とみなす。
(ロ)キー単語を構成する文字のうち、離れた位置の2文字以上が抽出され、その文字間に挟まれた領域内の文字のうち、一定の割合以上が抽出された場合に、その部分文字列をキー単語の部分文字列として抽出する。
(ハ)抽出されたキー単語そのものに対して、単語として一括認識を行ない、単語としての確からしさを検証する。
(ニ)1文字として切り出された領域に対して、文字特徴に加えて、単語特徴でも照合を行い、キー単語を構成する文字列、もしくはキー単語を抽出する。
ことを特徴とする文字列イメージを認識するプログラムを記録した記録媒体。 - 上記キー単語のコード列を自動抽出する処理において、文字列カテゴリから文字列の節となるキー単語のコード列を抽出する際に、認識対象文字列全体の中で出現頻度の高い文字、文字列単位で見たときに出現頻度の高い文字、および/または、同時に出現する確率が閾値より高い文字の組をキー単語として抽出する
ことを特徴とする請求項3の文字列イメージを認識するプログラムを記録した記録媒体。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001015349A JP4136316B2 (ja) | 2001-01-24 | 2001-01-24 | 文字列認識装置 |
US10/020,249 US7136526B2 (en) | 2001-01-24 | 2001-12-18 | Character string recognition apparatus, character string recognizing method, and storage medium therefor |
CNB021023530A CN100474331C (zh) | 2001-01-24 | 2002-01-23 | 字符串识别装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001015349A JP4136316B2 (ja) | 2001-01-24 | 2001-01-24 | 文字列認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002216076A JP2002216076A (ja) | 2002-08-02 |
JP4136316B2 true JP4136316B2 (ja) | 2008-08-20 |
Family
ID=18881913
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001015349A Expired - Fee Related JP4136316B2 (ja) | 2001-01-24 | 2001-01-24 | 文字列認識装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7136526B2 (ja) |
JP (1) | JP4136316B2 (ja) |
CN (1) | CN100474331C (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AUPR824601A0 (en) * | 2001-10-15 | 2001-11-08 | Silverbrook Research Pty. Ltd. | Methods and system (npw004) |
AUPR824501A0 (en) * | 2001-10-15 | 2001-11-08 | Silverbrook Research Pty. Ltd. | Methods and systems (npw003) |
CN101276327B (zh) * | 2007-03-27 | 2010-06-23 | 富士通株式会社 | 地址识别装置 |
US8245130B1 (en) * | 2007-05-31 | 2012-08-14 | Google Inc. | Performing an estimation on content to be presented |
US20080310721A1 (en) * | 2007-06-14 | 2008-12-18 | John Jinhwan Yang | Method And Apparatus For Recognizing Characters In A Document Image |
JP4898615B2 (ja) * | 2007-09-20 | 2012-03-21 | キヤノン株式会社 | 情報処理装置および符号化方法 |
CN101571921B (zh) * | 2008-04-28 | 2012-07-25 | 富士通株式会社 | 关键字识别方法和装置 |
CN101430680B (zh) | 2008-12-31 | 2011-01-19 | 阿里巴巴集团控股有限公司 | 一种无词边界标记语言文本的分词序列选择方法及*** |
JP5588213B2 (ja) * | 2010-04-13 | 2014-09-10 | 富士通フロンテック株式会社 | 帳票認識プログラム、帳票認識装置、および帳票認識方法 |
CN102402692B (zh) * | 2010-09-13 | 2014-06-04 | 中国科学院遥感应用研究所 | 一种特征字符串识别方法及*** |
TWI478074B (zh) * | 2010-12-01 | 2015-03-21 | Inst Information Industry | 文字辨識方法、裝置以及儲存其之電腦可讀取紀錄媒體 |
US8843493B1 (en) * | 2012-09-18 | 2014-09-23 | Narus, Inc. | Document fingerprint |
CN105308554B (zh) * | 2013-04-10 | 2019-08-06 | 惠普深蓝有限责任公司 | 数据传输***、传输数据的方法、以及*** |
JP6194781B2 (ja) * | 2013-12-11 | 2017-09-13 | 富士ゼロックス株式会社 | 画像処理装置及びプログラム |
US9984401B2 (en) * | 2014-02-25 | 2018-05-29 | Truecar, Inc. | Mobile price check systems, methods and computer program products |
JP6707825B2 (ja) * | 2015-09-14 | 2020-06-10 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
JP7234495B2 (ja) * | 2018-01-25 | 2023-03-08 | 富士フイルムビジネスイノベーション株式会社 | 画像処理装置及びプログラム |
CN113127637A (zh) * | 2019-12-31 | 2021-07-16 | 中兴通讯股份有限公司 | 一种字符的还原方法及装置、存储介质、电子装置 |
CN113837129B (zh) * | 2021-09-29 | 2023-10-03 | 平安科技(深圳)有限公司 | 手写签名错别字识别方法、装置、设备及存储介质 |
CN117312624B (zh) * | 2023-11-30 | 2024-02-20 | 北京睿企信息科技有限公司 | 一种获取目标数据列表的数据处理*** |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6338148B1 (en) * | 1993-11-10 | 2002-01-08 | Compaq Computer Corporation | Real-time test controller |
US6246794B1 (en) * | 1995-12-13 | 2001-06-12 | Hitachi, Ltd. | Method of reading characters and method of reading postal addresses |
JP3440793B2 (ja) | 1997-12-01 | 2003-08-25 | 富士通株式会社 | 単語認識装置 |
JP3639126B2 (ja) * | 1998-01-22 | 2005-04-20 | 富士通株式会社 | 住所認識装置及び住所認識方法 |
US6269188B1 (en) * | 1998-03-12 | 2001-07-31 | Canon Kabushiki Kaisha | Word grouping accuracy value generation |
JP3522106B2 (ja) | 1998-05-11 | 2004-04-26 | 富士通株式会社 | 文字認識装置 |
JP3622503B2 (ja) * | 1998-05-29 | 2005-02-23 | 株式会社日立製作所 | 特徴文字列抽出方法および装置とこれを用いた類似文書検索方法および装置並びに特徴文字列抽出プログラムを格納した記憶媒体および類似文書検索プログラムを格納した記憶媒体 |
US6249605B1 (en) * | 1998-09-14 | 2001-06-19 | International Business Machines Corporation | Key character extraction and lexicon reduction for cursive text recognition |
US6539118B1 (en) * | 1998-12-31 | 2003-03-25 | International Business Machines Corporation | System and method for evaluating character sets of a message containing a plurality of character sets |
JP2000353215A (ja) * | 1999-06-11 | 2000-12-19 | Nec Corp | 文字認識装置および文字認識プログラムを記録した記録媒体 |
-
2001
- 2001-01-24 JP JP2001015349A patent/JP4136316B2/ja not_active Expired - Fee Related
- 2001-12-18 US US10/020,249 patent/US7136526B2/en not_active Expired - Fee Related
-
2002
- 2002-01-23 CN CNB021023530A patent/CN100474331C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN100474331C (zh) | 2009-04-01 |
JP2002216076A (ja) | 2002-08-02 |
US7136526B2 (en) | 2006-11-14 |
CN1367460A (zh) | 2002-09-04 |
US20020114515A1 (en) | 2002-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4136316B2 (ja) | 文字列認識装置 | |
US7532758B2 (en) | Method and apparatus for generating handwriting recognition template | |
US8340429B2 (en) | Searching document images | |
US10133965B2 (en) | Method for text recognition and computer program product | |
JP3452774B2 (ja) | 文字認識方法 | |
JP2734386B2 (ja) | 文字列読み取り装置 | |
US20030208354A1 (en) | Method for named-entity recognition and verification | |
Sinha et al. | Hybrid contextural text recognition with string matching | |
CN112560842B (zh) | 一种信息识别方法、装置、设备和可读存储介质 | |
US20120213419A1 (en) | Pattern recognition method and apparatus using local binary pattern codes, and recording medium thereof | |
CN111145758A (zh) | 声纹识别方法、***、移动终端及存储介质 | |
Huang et al. | Mapping transcripts to handwritten text | |
US20140093173A1 (en) | Classifying a string formed from hand-written characters | |
Singh et al. | DS theory based fingerprint classifier fusion with update rule to minimize training time | |
JP3360030B2 (ja) | 文字認識装置および文字認識方法および文字認識方法をプログラムの形で記録した記録媒体 | |
JPH11328315A (ja) | 文字認識装置 | |
JP7174382B2 (ja) | 学習装置、照合装置、学習方法、照合方法及びプログラム | |
Alginahi et al. | An arabic script recognition system | |
JP2903779B2 (ja) | 文字列認識方法及びその装置 | |
JP3188154B2 (ja) | 文字認識処理方法 | |
Slavin et al. | Matching Digital Copies of Documents Based on OCR | |
JP2002259912A (ja) | オンライン文字列認識装置及びオンライン文字列認識方法 | |
US20210192317A1 (en) | Information processing device, information processing method, and program | |
JP3151866B2 (ja) | 英文字認識方法 | |
JP4805485B2 (ja) | 単語認識方法および単語認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040805 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071218 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080311 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080507 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080603 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080603 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110613 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120613 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120613 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130613 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140613 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |