JP3792759B2 - 文字認識方法とその装置 - Google Patents

文字認識方法とその装置 Download PDF

Info

Publication number
JP3792759B2
JP3792759B2 JP23533495A JP23533495A JP3792759B2 JP 3792759 B2 JP3792759 B2 JP 3792759B2 JP 23533495 A JP23533495 A JP 23533495A JP 23533495 A JP23533495 A JP 23533495A JP 3792759 B2 JP3792759 B2 JP 3792759B2
Authority
JP
Japan
Prior art keywords
character
group
candidate
patterns
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP23533495A
Other languages
English (en)
Other versions
JPH0981689A (ja
Inventor
一弘 松林
伸一 砂川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP23533495A priority Critical patent/JP3792759B2/ja
Publication of JPH0981689A publication Critical patent/JPH0981689A/ja
Application granted granted Critical
Publication of JP3792759B2 publication Critical patent/JP3792759B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、画像から抽出した文字を認識する文字認識方法とその装置に関する。
【0002】
【従来技術】
従来、画像から抽出した文字を認識して対応する文字コードを出力する装置が知られている。図13は、従来の文字認識手順を示すフローチャートであり、簡単に説明する
【0003】
まず、S1000で画像データ入力を行い、S1002でその画像データ記憶させる。S1003では、画像データから文字パターンを含む領域を抽出する。S1004では、文字認識辞書1005を探索して、文字認識処理を行ない、S1010では認識結果を記憶する。
【0004】
【発明が解決しようとする課題】
しかしながら、前記従来の文字認識方法では、充分な認識の確度が得られないという問題があった。
本発明の目的は、上記従来例に鑑みてなされたもので、より高い確信度で文字認識が可能な文字認識方法とその装置を提供することを目的とする。
【0005】
【課題を解決するための手段】
上記目的を達成するため、本発明の文字認識方法は以下の構成を備える。即ち、複数の異なる画像それぞれから複数の文字パターンを抽出して文字認識処理を行うことにより、当該抽出した文字パターンそれぞれに対応する複数の候補文字コードとその確信度を獲得する文字候補獲得工程と、前記複数の異なる画像の各々において、前記抽出した各文字パターンの位置に基づいて前記文字パターンをグループ化することにより、複数の文字グループを生成するグルーピング工程と、前記生成された文字グループそれぞれに含まれる各文字パターンに対応する複数の候補文字コードに基づいて、前記複数の異なる画像間で同一の文字グループを判定する文字グループ判定工程と、前記判定された同一の文字グループそれぞれに含まれる文字パターンに対応する候補文字コードの確信度を集計し、前記集計された確信度に基づき、前記同一の文字グループに含まれる文字パターンに対応する文字コードを決定する文字コード決定工程とを備える。
【0006】
上記文字認識方法において、前記複数の異なる画像が第1の画像と第2の画像であるとき、前記文字グループ判定工程では、前記第1の画像において生成された第1の文字グループに含まれる各文字パターンの候補文字コードと前記第2の画像において生成された第2の文字グループに含まれる各文字パターンの候補文字コードとを比較し、対応する全ての文字パターンの候補文字コードの中に同一の候補文字コードがある場合、前記第1の文字グループと前記第2の文字グループとが同一の文字グループであると判定することを特徴とする
【0007】
上記文字認識方法において、前記複数の異なる画像が動画像における異なるシーンの画像であり、且つ、前記抽出される文字パターンが当該動画像における動かないテロップであるという条件が加えられた場合、前記文字グループ判定工程では、前記生成された複数の文字グループに含まれる文字パターンの、文字数と座標と大きさとに基づいて、前記複数の異なる画像間で同一の文字グループを判定することを特徴とする
【0008】
上記文字認識方法において、前記文字候補獲得工程では、前記抽出された文字パターンから所定の特徴抽出を行って得られた特徴と、所定の辞書に格納されている各文字コードに対応する特徴とのマッチングに基づいて、前記候補文字コードとその確信度を獲得することを特徴とする
【0009】
上記目的を達成するため、本発明の文字認識装置は、以下の構成を備える。即ち、複数の異なる画像それぞれから複数の文字パターンを抽出して文字認識処理を行うことにより、当該抽出した文字パターンそれぞれに対応する複数の候補文字コードとその確信度を獲得する文字候補獲得手段と、前記複数の異なる画像の各々において、前記抽出した各文字パターンの位置に基づいて前記文字パターンをグループ化することにより、複数の文字グループを生成するグルーピング手段と、前記生成された複数の文字グループそれぞれに含まれる各文字パターンに対応する複数の候補文字コードに基づいて、前記複数の異なる画像間で同一の文字グループを判定する文字グループ判定手段と、前記判定された同一の文字グループそれぞれに含まれる文字パターンに対応する候補文字コードの確信度を集計し、前記集計された確信度に基づき、前記同一の文字グループに含まれる文字パターンに対応する文字コードを決定する文字コード決定手段とを備える
【0010】
上記目的を達成するため、本発明の装置は、以下の構成を備える。即ち、メモリに記憶されているコンピュータ実行可能なプログラムを読み出してCPUにおいて実行することにより、画像内の文字パターンに対応する文字コードを決定する装置であって、前記プログラムは、複数の異なる画像それぞれから複数の文字パターンを抽出して文字認識処理を行うことにより、当該抽出した文字パターンそれぞれに対応する複数の候補文字コードとその確信度を獲得する文字候補獲得ステップと、前記異なる複数の画像の各々において前記抽出した各文字パターンの位置に基づいて前記文字パターンをグループ化することにより、複数の文字グループを生成するグルーピングステップと、前記生成された複数の文字グループそれぞれに含まれる各文字パターンに対応する複数の候補文字コードに基づいて、前記複数の異なる画像間で同一の文字グループを判定する文字グループ判定ステップと、前記判定された同一の文字グループそれぞれに含まれる文字パターンに対応する候補文字コードの確信度を集計し、前記集計された確信度に基づき、前記同一の文字グループに含まれる文字パターンに対応する文字コードを決定する文字コード決定ステップとを、コンピュータに実行させるためのプログラムコードを含む。
【0011】
【発明の実施の形態】
はじめに、本発明に係る一実施の形態のポイントを要約した後に、その詳細な説明に入る。
本発明に係る文字認識方法の一実施の形態では、複数の画像から文字パターンを抽出し、抽出された文字パターンの認識処理を行って、文字パターンに対応する文字コードの候補とその確信度(得点)を求める。また、各文字パターンの位置関係で、互いに近いもの同士を1つのグループとしてグルーピングする。そして、上述の複数の画像間で、そのグループ単位で、選ばれた文字コードの候補に基づいて、文字パターンの対応をとり、グループ単位でのマッチングをとる。
【0012】
次に、マッチングが取られたグループに含まれる文字パターンについて、文字コード候補ごとの得点を集計する。そして、その得点集計結果に基づいて、最終的に、文字パターンに対する文字コードを確定する。
この様に、単独の画像単位で認識するのではなく、複数の画像間での文字グループのマッチングをとることに基づいて文字認識を行うことにより、より確度の高い文字認識が可能になった。
【0013】
即ち、複数の画像間で対応する文字が異なった認識結果が得られた場合でも、上述の得点集計結果に基づいて、単独の画像内での認識結果を修正できるため、より信頼性の高い文字認識を可能とした。
次に、本実施の形態に係る文字認識装置の詳細な説明を行う。
(第1の実施の形態)
図1は、本実施の形態の文字認識装置のハードウェア構成図である。
【0014】
21は画像入力装置であり、ビデオカメラやイメージスキャナから画像を取り込んだり、ハードディスクやCD−ROMから画像データを読み込んだり、通信機器から画像データを受信したりする。
22は画像メモリであり、入力された画像データを一時的に記憶する。
23はCPUであり、後述する各文字認識処理のフローチャートに対応するプログラムを格納しているプログラム記憶メモリ24から、プログラムを逐次読み出し、解釈し、実行する。
【0015】
25は辞書パターン記憶メモリであり、文字認識で用いる辞書パターンを記憶する。
26はデータメモリであり、文字認識処理の途中結果や最終結果のデータを記憶したり、CPUによる文字認識処理の実行に必要な作業領域として使われる。27は指示装置であり、キーボード、マウス、ペンなどを備え、本文字認識装置での各種動作の指示やデータ入力を行なう。
【0016】
28は表示装置であり、CRTやLCDなどを備え、処理対象の画像や各種データを画面に表示する。
次に、図2は、図1のハードウェア上で処理される文字認識処理手順を示すフローチャートである。
尚、以下に示すフローチャートに対応するプログラムは、プログラム記憶メモリ24に格納されており、CPU23によって実行される。
【0017】
ステップS1では、画像入力装置21から複数の静止画像または動画像を入力する。ステップS2では、入力された複数の画像データを画像メモリ22に記憶する。ステップS3では、画像データから各文字パターンを含む領域を抽出する処理を行なう。
【0018】
ステップS4では、辞書パターン記憶メモリ25の辞書パターンを参照して、文字認識処理を行なう。これは、通常行われている所定の文字特徴に関して、辞書パターンの特徴と認識対象の文字の特徴との距離によって行えばよい。この距離の近い順に認識候補の文字コードが辞書から抽出され、各抽出された認識候補の文字コードにはその距離、即ち、確信度(例えば、距離の小さいものには、高い確信度、即ち、より大きな数字を対応させる)の情報がアタッチされる。
【0019】
尚、後述する本ステップのさらに詳細な処理手順の一例を図15に示す。
ステップS5では、ステップS4の認識結果の認識候補の文字コードと確信度をデータメモリ26に格納する。また、各文字パターンの画像でのレイアウト位置の近く、また、同じサイズの文字パターンを同じグループとするグルーピングを行う。
【0020】
ステップS6では、複数の入力画像間でグループ単位で、グループ内の文字コードが一致するものを探索する。
ステップS7では、ステップS6で一致が検出されたグループ単位で、そのグループに属する各文字パターンの認識候補文字コードの確信度の集計を行う。例えば、同じ認識候補文字コードごとの合計を取る。
【0021】
ステップS8では、ステップS7での集計結果に基づいて、確信度の最も高い最適な候補を選択し、対応する文字パターンの認識結果として決定する。そして、その認識結果の文字を表示装置28に出力する。
ステップS9では、決定した認識結果をデータメモリ26に記憶する。
以上説明したように、単独の画像単位で認識するのではなく、複数の画像間での文字グループのマッチングをとることに基づいて文字認識を行うことにより、より確度の高い文字認識が可能になった。
(第2の実施の形態)
以上、第1の実施の形態の文字認識手順の概略を説明した。次に、第1の実施の形態での基本的処理コンセプトは、同じであるが、別の処理手順による実現方法をより詳細に説明する。
【0022】
まず、図3のフローチャートを用いて、本発明の第2の実施の形態について説明する。
ステップS31において、1枚分の画像データを画像メモリに入力する。例えば図4(a)のような地図の画像を入力する。
ステップS32において、画像データからグループごとの文字群を抽出し、辞書25を参照して、認識候補の文字コードとその確信度を得る。この結果を、データメモリ26に格納する。
【0023】
そして、例えば、その抽出され、認識された文字パターンに関して、図5のようなデータ構造を生成する。文字群のグループ分けは、各文字パターンが互いに近く配置されおり、サイズが同じものを集めことによっておこなう。
図5のデータ構造は、大きく3カテゴリに分類できる。第1のカテゴリは、500、501に示すような、各グループごとに有するグループテーブルである。第2のカテゴリは、そのグループテーブル(500、501)からアドレスポイントされ、各グループに含まれる各文字パターン(画像中の)のサイズに関する情報(x,y座標、幅、高さ、等)と文字パターンに対応する文字コードを格納している認識候補テーブル(503、504)へのアドレスポインタを有する文字パターン情報テーブル(502)である。最後の第3のカテゴリは、文字パターン情報テーブル(502)からアドレスポイントされ、各文字パターンに対応する認識結果である各認識候補の文字コードとその得点(即ち、確信度)を格納している認識候補テーブル(503、504)である。
【0024】
本処理によって、図4(a)の画像に関して処理した場合において、生成されたデータ構造が図5であり、この内容に関して以下説明する。
図5を参照して、グループテーブル(500)は、図4(a)の「宮沢町」に関するもので、他方、グループテーブル(501)は、図4(a)の「東区」に関するものである。グループテーブル(500、501)の左欄は、テーブル自体内での、各文字パターンに関する情報が格納されている位置のアドレスポインタ(右欄)を格納しているアドレスを示す。
【0025】
尚、各文字の位置や大きさの情報からこれらの5文字のうち“宮”、“沢”、“町”の3文字は“宮沢町”という語を構成するとみなし、1つの文字群としてグループ単位でグループテーブル(500)で管理している。同様に“東”、“区”の2文字の“東区”という語を構成する1つのグループとして、グループテーブル(501)で管理している。
【0026】
文字パターン情報テーブル(502)のアドレス2000Hから順に、“宮”、“沢”、“東”、“区”“町”の各文字の「x座標、y座標、幅、高さ」、と文字認識候補の情報が格納されている位置を示すアドレスポインタがそれぞれ格納される。尚、“東”、“区”、“町”の各パターンに対しては、記述を簡単にするため、アドレスポインタの行き先を示す矢印を省略している。
【0027】
認識候補テーブル(503)のアドレス3000Hからは、“宮”という文字パターンの認識候補として“宮”、“官”、“宜”の文字コードと得点が格納される。同様に、認識候補テーブル(504)のアドレス3010Hからは、“沢”という文字パターンの認識候補として“沢”、“況”という文字コードと得点が格納される。
【0028】
尚、図示していないが、“東”、“区”“町”の各文字についても、同様に候補の文字コードと得点が格納される。
次に、ステップS33において、上のステップで処理した画像が、1枚目の入力画像であるかチェックし、1枚目であれば、ステップS35へ進む。そして、ステップS35では、全画像について処理を終了したかチェックし、まだ、残りの画像があれば、ステップS31に戻り、次の画像の入力を行う。2枚目の入力画像の例を図4(b)に示す。以下、この画像に関して、上述のステップS32、ステップS33、ステップS34の処理を実行してゆく。
【0029】
そして、ステップS35の判定で、全画像について処理を終了すれば、ステップS36へ進み、全画像の全文字グループについて認識候補の中から、集計の確信度の高いものを選択して、文字コードを確定し、その結果を表示装置に表示する。尚、ステップS36の処理は、図9を参照して後述する。
上述のステップS33で、処理した画像が1枚目でなければ、ステップS34に進み、ステップS34では、1枚目の画像と2枚目の画像で、同一のグループ化された語があるかどうか判定する。本ステップでの詳細な処理は、図7を参照して後述するが、結果として、1枚目の画像で“宮沢町”と認識された文字グループと、2枚目の画像で“宮沢町”と認識された文字グループは、同一であると判定される。他方、1枚目の画像で“東区”と認識された文字グループと2枚目の画像で“西区”と認識された文字グループは同一でないと判定される。
【0030】
尚、図4(a),(b)の2枚の画像を入力して認識する例を示したが、2枚以上であってもよいことは言うまでもない。
次に、図6のフローチャートを用いて、図3のステップS32での画像データから文字群を抽出する詳細な処理手順を説明する。
ステップS41において、画像から文字を含む領域を抽出する。これには文字と背景の輝度や色の違いによって抽出する方法や、周波数成分の特徴の違いによって抽出する方法などを用いればよい。
【0031】
ステップS42において、文字を1文字ずつのパターンに分離する。これには特定の色の画素を連結したパターンについて形や大きさが所定の条件を満たすかどうかで判定する。
ステップS43において、分離されたパターンに対して、辞書パターン記憶メモリ25に格納されている辞書パターンを検索することで文字認識を行ない、候補の文字コード及び得点(認識の確からしさ:確信度)を得る。また、文字のx座標、y座標、幅、高さの情報も得る。
【0032】
ステップS44において、各文字の座標から所定の範囲内の距離にある文字を統合し、文字群としてグループ単位で管理する。例えば、注目する文字に対して上下左右1文字分の範囲内に他の文字があればその文字を同じ文字群に統合する。これにより、縦書き、横書き、斜め書きにかかわらず、1つの語を構成する文字をまとめる。
【0033】
次に、図7のフローチャートを用いて、図3のステップS34での処理、即ち、複数の画像間で、同一のグループ語があるかどうか判定する動作について説明する。
ステップS51において、ステップS32で選択された、認識文字コードの候補とその確信度を含む文字グループをデータメモリから取り込む。
【0034】
ステップS52において、ステップS51で取り込んだ文字グループと一致する文字グループが他の画像の文字グループにあるかをチェックするために、含まれる文字コード単位で比較する。そして、同一の文字でなければステップS56へ進み別の語と判定し、ステップS55へ進む。
逆に、同一の文字があれば、ステップS53へ進む。
【0035】
ステップS53では、文字グループ内の全文字について、比較が終了したかどうかをチェックする。そして、文字グループ内の全文字が一致すれば、ステップS54において同一文字グループとし、その結果をデータメモリ26に格納する。
ステップS55では、全文字グループの組み合わせにおいて、比較が終了したかどうかチェックし、終了していなければ、ステップS51に戻り、同様の処理を繰り返す。全文字グループの全組み合わせでの比較が終了すれば、本処理を終了する。
【0036】
尚、上述のステップS54やステップS56での判定は、図8に示す様なグループ一致判定テーブルを、データメモリ26上に作成して、一致マーク(図8では丸印)を格納しておくことで実現される。図8の表示で示されるように、画像1の文字グループと画像2の文字グループ2とは、文字1と文字1、文字2と文字2、文字3と文字3とがそれぞれ同じ候補を含むので同一の語とみなすことができる。また画像1の文字グループ2と画像2の文字グループ1とは、文字2と文字2は同じ候補を含むが文字1と文字1は同じ候補を含まないので別の語とみなす。
【0037】
次に、図9のフローチャートを用いて、図3のステップ36の文字コードの確定処理を説明する。
まず、ステップS61において、同一の文字グループの組をデータメモリ26から取り込む。
ステップS62において、ステップS61で取り込んだ文字グループ内の対応する同じ候補文字コードの得点を集計する。集計方法としては、各候補ごとの全画像の得点を加算してもよいし、また、各候補ごとの全画像中の最高点を取り出して得点としてもよい。
【0038】
ステップS63において、集計点が高い候補を選び出し、対応する文字の認識結果として確定し、表示装置に表示する。
図10(a)は、集計処理の一例を説明するための図であり、ここでは、5枚の入力画像での文字パターン「宮」に対する、“宮”、“官”、“宜”の候補文字の得点の例として加算する方法を用いた集計結果を示す。この結果、得点合計は、それぞれ250点、200点、40点となり、“宮”が最も集計点が高い。したがって1から5までのすべての画像において、この文字を“宮”として確定する。すなわち2枚目の画像と5枚目の画像の誤認識が修正されることになる。
【0039】
本実施の形態では、複数の画像の中に共通に含まれる語について共通の認識結果を出力するので、複数の画像のうち、ある画像の文字が誤認識しても、他の画像の認識結果によって自動的に修正することができ、結果として認識の確度を上げることができるという効果がある。
(第3の実施例)
本発明の第3の実施の形態においては、図11のように動画像内のテロップの認識方法について説明する。
【0040】
テロップは、背景画像の影響などで正しく認識されない場合がある。例えば、図10(b)の画像2のように、正しい文字“宮”の得点が0で、文字候補から漏れてしまう場合もあり得る。
そこで、背景画像が図11(a)から図11(b)のように変わってもテロップは動かないという条件を加えることで、文字グループの文字数及び各文字の座標、大きさが同じであれば同一の語とみなすことができる。
【0041】
図12のフローチャートを用いて、同一の語があるかどうか判定する動作について説明する。
ステップS121において、2つの画像から文字グループを1つずつ入力する。
ステップS122において、文字グループの文字数が等しいかどうか判定し、等しくなければステップS128へ進み、別の語と判定する。
【0042】
他方、文字数が等しいかどうかチェックし、等しければステップS123へ進む。
ステップS123では、文字の座標(x座標とy座標の双方)が等しいかどうか判定し、等しくなければステップS128へ進み別の語と判定する。等しければステップS124へ進む。
【0043】
ステップS124では、文字の大きさ(幅と高さの双方)が等しいかどうか判定し、等しくなければステップS128へ進み別の語と判定する。等しければステップS125へ進む。
ステップS125では、文字グループ内の全文字に関して処理が終了したかチェックし、終了していなければ、ステップS123に戻り、同様の処理を繰り返す。終了すれば、ステップS126に進み、文字グループ内の全文字について座標と大きさが等しい文字の組み合わせができたとして、同一文字グループと判定する。
【0044】
ステップS127では、全文字グループの組み合わせについて、上述の処理がが終了したかチェックし、終了していなければ、ステップS121に戻り、終了するまで繰り返す。
上述の処理を、同一文字グループの判定にさらに加えることで、例えば、図10(b)に示すように、“宮”の合計点が最も高い結果が得られ、1から5までのすべての画像において、この文字を“宮”として確定できる。
【0045】
尚、本実施の形態では、テロップのように文字が静止しているという条件をさらに加えることで、複数の画像のうち、ある画像が誤認識で候補から漏れても、他の画像の認識結果によって自動的に修正することができ、認識確度を上げることができるという効果がある。
尚、上述の説明では、複数の画像間での文字グループのマッチングに基づいて、文字パターンに対する文字コードの決定を行っている例を示したが、これは、複数の画像間ではなく、同じ画像内での文字グループのマッチングに基づいて、文字パターンに対する文字コードの決定を行ってもよいことは言うまでもない。
【0046】
次に、図14は、プログラム記憶メモリ24にアサインされた上述したフローチャートの各処理に対応する各プログラムのレイアウトの一例を示す。尚、このプログラムは、フロッピーディスクなどの可搬可能な媒体に格納され、実行時に、メモリ202にロードされて、CPU23によって実行されてもよいことは言うまでもない。
【0047】
140には、ステップS1−S2の画像入力/格納処理を行うプログラムが格納されている。
142には、ステップS3の文字パターン抽出処理を行うプログラムが格納されている。
143には、ステップS3で抽出された文字パターンに対応する候補文字パターンを辞書25から抽出し、確信度を求める処理を行う文字認識プログラムが格納されている。
【0048】
144には、ステップS3で抽出された文字パターンのグルーピング処理を行うプログラムが格納されている。
145には、ステップS7の得点(確信度)集計処理を行うプログラムが格納されている。
【0049】
146には、ステップS8での文字コード決定処理を行うプログラムが格納されている。
147には、ステップS8での文字コード決定処理を行った後、表示装置にその結果を表示するプログラムが格納されている。
尚、図14のレイアウトの順に、特別の意味はなく任意の順でよい。
【0050】
次に、図2のステップS4の文字認識処理の詳細な処理の一例を、図15を参照して説明する。
まず、図15を参照して、ステップS151では、ステップS3で切り出された各文字パターンを入力する。
ステップS152では、入力した文字パターンの幅と高さをそれぞれ拡大、または、縮小して、所定の大きさに正規化する。
【0051】
ステップS153では、正規化パターンを所定の閾値で2値化する。
ステップS154では、従来から知られている細線化の方法で2値化されたパターンを細線化処理する。
ステップS155では、細線化処理されたパターン、または、その所定の特徴量と文字認識辞書5とのマッチングを行う。
【0052】
ステップS156では、マッチング結果として、マッチング距離の近い、即ち、確信度の高い文字候補を選択する。
以上、ステップS4での詳細な処理の一例を示した。
尚、本発明は、ホストコンピュータ、インタフェース、表示装置等の複数の機器から構成されるシステムに適用しても、1つの機器からなる装置に適用しても良い。また、本発明はシステム或は装置にプログラムを供給することによって達成される場合にも適用できることはいうまでもない。この場合、本発明を達成するためのソフトウェアによって表されるプログラムを格納した記憶媒体から、該プログラムを該システム或は装置に読み出すことによって、そのシステム或は装置が、本発明の効果を享受することが可能となる。
【0053】
以上述べたように、画像から文字パターンを抽出する手段と、抽出された文字パターンを認識し文字コードの候補及び各候補の得点を出力する手段と、複数の画像間でグループ単位で文字パターンを対応させる手段と、対応するグループの文字パターンについて文字コードの候補ごとの得点を集計する手段と、得点集計結果に基づいて前記文字コードの候補及び各候補の得点を修正する手段とを設けたことにより、より確度の高い文字認識を行うことができる。
【0054】
【発明の効果】
以上説明したように本発明によれば、より高い確信度で文字認識が可能な文字認識をおこなうことができる。
【図面の簡単な説明】
【図1】本発明の文字認識装置のブロック図である。
【図2】本発明の文字認識処理手順を示すフローチャートである。
【図3】本発明の第2の実施の形態の文字認識処理手順を示すフローチャートである。
【図4】入力画像の一例を示す図である。
【図5】画像データから文字グループを抽出した結果得られるデータの例を示した図である。
【図6】画像データから文字グループを抽出する動作を示したフローチャートである。
【図7】同一グループ語を判定する動作を示したフローチャートである。
【図8】複数の画像間での文字の対応の例を示したグループ一致判定テーブルの図である。
【図9】判定認識候補の中から文字コードを確定する処理手順を示したフローチャートである。
【図10】複数の入力画像に対する各候補の得点の例を示す図である。
【図11】入力画像の例を示す図である。
【図12】同一語を判定する処理手順を示したフローチャートである。
【図13】従来の文字認識装置のフローチャートである。
【図14】本実施の形態に係る文字認識処理の各プログラムのレイアウトを示す図である。
【図15】図2のステップS4での文字認識処理の詳細な処理例を示すフローチャートである。
【符号の説明】
21 画像入力装置
22 画像メモリ
23 CPU
24 プログラム記憶メモリ
25 辞書パターン記憶メモリ

Claims (11)

  1. 複数の異なる画像それぞれから複数の文字パターンを抽出して文字認識処理を行うことにより、当該抽出した文字パターンそれぞれに対応する複数の候補文字コードとその確信度を獲得する文字候補獲得工程と、
    前記複数の異なる画像の各々において、前記抽出した各文字パターンの位置に基づいて前記文字パターンをグループ化することにより、複数の文字グループを生成するグルーピング工程と、
    前記生成された文字グループそれぞれに含まれる各文字パターンに対応する複数の候補文字コードに基づいて、前記複数の異なる画像間で同一の文字グループを判定する文字グループ判定工程と、
    前記判定された同一の文字グループそれぞれに含まれる文字パターンに対応する候補文字コードの確信度を集計し、前記集計された確信度に基づき、前記同一の文字グループに含まれる文字パターンに対応する文字コードを決定する文字コード決定工程と
    を備えることを特徴とする文字認識方法。
  2. 前記複数の異なる画像が第1の画像と第2の画像であるとき、
    前記文字グループ判定工程では、前記第1の画像において生成された第1の文字グループに含まれる各文字パターンの候補文字コードと前記第2の画像において生成された第2の文字グループに含まれる各文字パターンの候補文字コードとを比較し、対応する全ての文字パターンの候補文字コードの中に同一の候補文字コードがある場合、前記第1の文字グループと前記第2の文字グループとが同一の文字グループであると判定することを特徴とする請求項1に記載の文字認識方法。
  3. 前記複数の異なる画像が動画像における異なるシーンの画像であり、且つ、前記抽出される文字パターンが当該動画像における動かないテロップであるという条件が加えられた場合、
    前記文字グループ判定工程では、前記生成された複数の文字グループに含まれる文字パターンの、文字数と座標と大きさとに基づいて、前記複数の異なる画像間で同一の文字グループを判定することを特徴とする請求項に記載の文字認識方法。
  4. 前記文字候補獲得工程では、前記抽出された文字パターンから所定の特徴抽出を行って得られた特徴と、所定の辞書に格納されている各文字コードに対応する特徴とのマッチングに基づいて、前記候補文字コードとその確信度を獲得することを特徴とする請求項に記載の文字認識方法。
  5. 前記グルーピング工程は、前記複数の異なる画像の各々において、前記抽出した文字パターン間の距離が近い文字パターンを同じグループとしてグループ化することにより、複数の文字グループを生成することを特徴とする請求項に記載の文字認識方法。
  6. 前記グルーピング工程は、前記複数の異なる画像の各々において、前記抽出した文字パターン間の距離が近く、さらに、サイズが概同じ文字パターンを同じグループとしてグループ化することにより、複数の文字グループを生成することを特徴とする請求項に記載の文字認識方法。
  7. 前記文字コード決定工程では、前記同一の文字グループに含まれる文字パターンに対応する候補文字コードごとに確信度を合計した値を、該候補文字コードの前記集計された確信度とすることを特徴とする請求項に記載の文字認識方法。
  8. 前記文字コード決定工程では、前記同一の文字グループに含まれる文字パターンに対応する候補文字コードごとに求めた確信度の最大値を、該候補文字コードの前記集計された確信度とすることを特徴とする請求項に記載の文字認識方法。
  9. 前記複数の異なる画像は動画像における複数の異なるシーンの画像であることを特徴とする請求項に記載の文字認識方法。
  10. 複数の異なる画像それぞれから複数の文字パターンを抽出して文字認識処理を行うことにより、当該抽出した文字パターンそれぞれに対応する複数の候補文字コードとその確信度を獲得する文字候補獲得手段と、
    前記複数の異なる画像の各々において前記抽出した各文字パターンの位置に基づいて前記文字パターンをグループ化することにより、複数の文字グループを生成するグルーピング手段と、
    前記生成された複数の文字グループそれぞれに含まれる各文字パターンに対応する複数の候補文字コードに基づいて、前記複数の異なる画像間で同一の文字グループを判定する文字グループ判定手段と、
    前記判定された同一の文字グループそれぞれに含まれる文字パターンに対応する候補文字コードの確信度を集計し、前記集計された確信度に基づき、前記同一の文字グループに含まれる文字パターンに対応する文字コードを決定する文字コード決定手段と
    を備えることを特徴とする文字認識装置。
  11. メモリに記憶されているコンピュータ実行可能なプログラムを読み出してCPUにおいて実行することにより、画像内の文字パターンに対応する文字コードを決定する装置であって、
    前記プログラムは、複数の異なる画像それぞれから複数の文字パターンを抽出して文字認識処理を行うことにより、当該抽出した文字パターンそれぞれに対応する複数の候補文字コードとその確信度を獲得する文字候補獲得ステップと、前記異なる複数の画像の各々において前記抽出した各文字パターンの位置に基づいて前記文字パターンをグループ化することにより、複数の文字グループを生成するグルーピングステップと、前記生成された複数の文字グループそれぞれに含まれる各文字パターンに対応する複数の候補文字コードに基づいて、前記複数の異なる画像間で同一の文字グループを判定する文字グループ判定ステップと、前記判定された同一の文字グループそれぞれに含まれる文字パターンに対応する候補文字コードの確信度を集計し、前記集計された確信度に基づき、前記同一の文字グループに含まれる文字パターンに対応する文字コードを決定する文字コード決定ステップとを、コンピュータに実行させるためのプログラムコードを含むことを特徴とする装置。
JP23533495A 1995-09-13 1995-09-13 文字認識方法とその装置 Expired - Fee Related JP3792759B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23533495A JP3792759B2 (ja) 1995-09-13 1995-09-13 文字認識方法とその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23533495A JP3792759B2 (ja) 1995-09-13 1995-09-13 文字認識方法とその装置

Publications (2)

Publication Number Publication Date
JPH0981689A JPH0981689A (ja) 1997-03-28
JP3792759B2 true JP3792759B2 (ja) 2006-07-05

Family

ID=16984573

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23533495A Expired - Fee Related JP3792759B2 (ja) 1995-09-13 1995-09-13 文字認識方法とその装置

Country Status (1)

Country Link
JP (1) JP3792759B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101689328A (zh) * 2008-06-11 2010-03-31 松下电器产业株式会社 图案识别设备、图案识别方法、图像处理设备、以及图像处理方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4589159B2 (ja) * 2005-03-22 2010-12-01 三菱電機インフォメーションシステムズ株式会社 ラスタ地図検索装置
JP2006277121A (ja) * 2005-03-28 2006-10-12 Toshiba Corp 移動経路作成装置、移動ロボット、移動経路作成方法および移動経路作成プログラム
JP2009301179A (ja) * 2008-06-11 2009-12-24 Panasonic Corp パターン認識装置及びパターン認識方法、プログラム及び記録媒体
JP5339581B2 (ja) * 2008-07-11 2013-11-13 パナソニック株式会社 画像処理装置、画像処理方法及び画像処理プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101689328A (zh) * 2008-06-11 2010-03-31 松下电器产业株式会社 图案识别设备、图案识别方法、图像处理设备、以及图像处理方法
CN101689328B (zh) * 2008-06-11 2014-05-14 松下电器产业株式会社 图像处理设备以及图像处理方法

Also Published As

Publication number Publication date
JPH0981689A (ja) 1997-03-28

Similar Documents

Publication Publication Date Title
JP4366108B2 (ja) 文書検索装置、文書検索方法及びコンピュータプログラム
JP2865210B2 (ja) 文字認識装置
JPH08255236A (ja) 画像のファイリング装置及びファイリング方法
JP2007148677A (ja) 画像処理装置、画像処理方法
JP2004139484A (ja) 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
JP2003308480A (ja) オンライン手書き文字パターン認識編集装置及び方法並びに当該方法を実現するコンピュータ実行可能なプログラム
JP2000227941A (ja) 手書き情報処理システムおよび方法
US11321936B2 (en) Image processing device, image processing method, and storage medium storing program
JP2007179395A (ja) 媒体処理装置,媒体処理方法,媒体処理システム,及び媒体処理プログラムを記録したコンピュータ読取可能な記録媒体
JP2002203207A (ja) 文字認識方法,プログラム及び記録媒体
JP2012190434A (ja) 帳票定義装置、帳票定義方法、プログラム及び記録媒体
JP3792759B2 (ja) 文字認識方法とその装置
US6968501B2 (en) Document format identification apparatus and method
US20220392107A1 (en) Image processing apparatus, image processing method, image capturing apparatus, and non-transitory computer-readable storage medium
US20210042555A1 (en) Information Processing Apparatus and Table Recognition Method
JP2021152696A (ja) 情報処理装置及びプログラム
JP5051174B2 (ja) 帳票辞書生成装置、帳票識別装置、帳票辞書生成方法、及びプログラム
CN112685056A (zh) 脚本更新方法及装置
JP3977473B2 (ja) 手書き文字認識方法及び手書き文字認識装置
JP2013182459A (ja) 情報処理装置、情報処理方法及びプログラム
JP2000285237A (ja) 画像処理装置、画像処理方法及び画像処理プログラムを記録した記録媒体
CN116603238B (zh) 一种界面控制方法
JPH0589190A (ja) 図面情報のチエツク方式
JP2018112931A (ja) 文字認識装置、文字認識プログラム及び文字認識方法
JP3074691B2 (ja) 文字認識装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050916

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050922

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060324

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060406

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090414

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100414

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110414

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120414

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130414

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130414

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140414

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees