JPH1069494A

JPH1069494A - 画像検索方法とその装置

Info

Publication number: JPH1069494A
Application number: JP8228504A
Authority: JP
Inventors: Hirotaka Shiiyama; 弘隆椎山
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1996-08-29
Filing date: 1996-08-29
Publication date: 1998-03-10

Abstract

(57)【要約】【課題】高精度の文字列検索を安価にかつ高速に行う
ことができる画像検索方法とその装置を提供する。【解決手段】検索文字列を対応する文字列イメージに
展開し、展開された文字列イメージに所定のフィルタリ
ングを行う（Ｓ２）。そして、フィルタリングされた文
字列イメージのセグメンテーションを行い、セグメンテ
ーションされた各部分の文字認識を行い、前記検索文字
列を含む複数の認識文字候補を獲得する（Ｓ３）。そし
て、獲得された複数の認識文字候補を組み合わせて、可
能な別の認識文字列候補を生成する（Ｓ４）。それらの
認識文字列候補のＯＲ条件で、文字列認識を行う（Ｓ
５）。

Description

【発明の詳細な説明】

【発明の属する技術分野】本発明は、画像検索方法とそ
の装置、特に、所定の文字列を対象画像から検索する画
像検索方法とその装置に関する。

【従来の技術】従来、ＯＣＲを行なう場合には、誤認識
対策のため、認識率がある程度低い認識候補までを明示
して、人がそれを手入力で選択、あるいは、訂正してい
た。

【発明が解決しようとする課題】しかしながら、この手
作業が必要であるが故に、文字の全自動認識処理化を難
しいものとしていた。これを解決すべく、この作業を機
械的に行なう研究も行われており、単語辞書や知識ベー
スを用いた誤認識訂正の例があるが、これを実現するに
は高い計算能力を有するコンピュータを用いなければ、
実用化に耐えない等の多くの障壁がある。また、認識候
補を１つに絞るために、一旦、誤訂正をしてしまうと元
に戻す手続きが面倒になる問題をはらんでいる。本発明
は、上記従来例に鑑みてなされたもので、高精度の文字
列検索を安価に行うことができる画像検索方法とその装
置を提供することを目的とする。

【課題を解決するための手段】上記目的を達成するた
め、本発明の画像検索方法とその装置は以下の構成を備
える。即ち、検索文字列を対応する文字列イメージに展
開する展開工程と、前記展開工程で展開された文字列イ
メージに所定のフィルタリングを行うフィルタリング工
程と、前記フィルタリング工程でフィルタリングされた
文字列イメージを独立部分にセグメンテーションし、セ
グメンテーションされた各部分の文字認識を行い、認識
文字列候補を獲得する認識工程と、前記認識工程で獲得
された認識文字列候補の違いに基づいて、組み合わせ可
能な別の認識文字列候補を生成する生成工程と、前記生
成工程で生成された前記組み合わせ可能な別の認識文字
列候補と前記認識工程で獲得された認識文字列候補の論
理和条件で所定の文字列の検索を行う文字列検索工程と
を備える。また、別の発明は、検索文字列を対応する文
字列イメージに展開する展開手段と、前記展開手段で展
開された文字列イメージに所定のフィルタリングを行う
フィルタリング手段と、前記フィルタリング手段でフィ
ルタリングされた文字列イメージを独立部分にセグメン
テーションし、セグメンテーションされた各部分の文字
認識を行い、認識文字列候補を獲得する認識手段と、前
記認識手段で獲得された認識文字列候補の違いに基づい
て、組み合わせ可能な別の認識文字列候補を生成する生
成手段と、前記生成手段で生成された前記組み合わせ可
能な別の認識文字列候補と前記認識手段で獲得された認
識文字列候補の論理和条件で所定の文字列の検索を行う
文字列検索手段とを備える。また、別の発明は、コンピ
ュータプログラム製品であって、コンピュータ読み取り
可能なプログラムコード手段を有するコンピュータ使用
可能な媒体を備え、前記コンピュータプログラム製品
は、検索文字列を対応する文字列イメージに展開する、
コンピュータ読み取り可能な第１プログラムコード手段
と、前記第１プログラムコード手段で展開された文字列
イメージに所定のフィルタリングを行う、コンピュータ
読み取り可能な第２プログラムコード手段と、前記第２
プログラムコード手段でフィルタリングされた文字列イ
メージを独立部分にセグメンテーションし、セグメンテ
ーションされた各部分の文字認識を行い、認識文字列候
補を獲得する、コンピュータ読み取り可能な第３プログ
ラムコード手段と、前記第３プログラムコード手段で獲
得された認識文字列候補の違いに基づいて、組み合わせ
可能な別の認識文字列候補を生成する、コンピュータ読
み取り可能な第４プログラムコード手段と、第４プログ
ラムコード手段で生成された前記組み合わせ可能な別の
認識文字列候補と第３プログラムコード手段で獲得され
た認識文字列候補の論理和条件で所定の文字列の検索を
行う第５プログラムコード手段とを備える。

【発明の実施の形態】以下、本発明の実施の形態の文字
認識／文字列検索処理構成の詳細な説明を図１を参照し
て行う。図１を参照して、本発明の実施の形態の文字認
識／文字列検索処理構成は、情報処理装置８、外部記憶
装置４、キーボード／マウス５、表示装置６、イメージ
スキャナ１を備える。情報処理装置８は、ＣＰＵ７がそ
の全体の制御を行う。ＣＰＵ７は、外部記憶装置４に格
納された各種処理ソフトウエアを予めＲＡＭにロードし
ておき、それを順次読み出し、解釈し、実行する。この
各種処理ソフトウエアには、ＯＣＲ処理ソフトウェア
２、文書検索ソフトウェア３を含む。イメージスキャナ
１は、文書９をスキャンしてイメージ情報を獲得し、情
報処理装置８に転送する。表示装置１は、情報処理装置
８で処理された各種の結果や、キーボード／マウス５か
ら入力されたコマンド／データを表示する。キーボード
／マウス５は、各種コマンドや、検索語・検索条件など
のデータを入力する。外部記憶装置４は、ＲＡＭにロー
ドされてＣＰＵ７によって実行されるＯＣＲ処理ソフト
ウエアと文書検索ソフトウエアの各プログラム（１
０）、その文字認識／文書検索処理のための認識辞書１
５を格納している。また、外部記憶装置４は、イメージ
スキャナ１から取り込まれた入力イメージデータ（１
１）、ＯＣＲソフトウエア２による認識結果のテキスト
情報（１３）、また、文書検索ソフトウエア３の実行に
よる検索用ファイル（１４）を格納する。この検索用フ
ァイル（１４）は、テキスト情報に基づいて作成され
る。また、外部記憶装置４には、キーボード５から入力
する検索指示文字列の各文字に対応する基準イメージパ
タンである辞書イメージデータ（１２）を格納してい
る。図２Ａは、本実施の形態の情報処理装置８での文書
検索のためのインデックス情報作成のための処理手順を
示すフローチャートである。また、図２Ｂは、作成され
たインデックス情報を用いて文字検索を行う文字検索処
理手順を示すフローチャートである。まず、図２Ａを参
照して、文書検索のためのインデックス情報作成のため
の処理手順を説明する。ステップＳ１１では、検索対象
画像をイメージスキャナ１から入力し、外部記憶装置４
に格納された後、情報処理装置８のＲＡＭにロードす
る。ステップＳ１２では、ＲＡＭにロードされた検索対
象画像について、文字認識を行う。そして、最も確から
しい認識文字列を得る。ステップＳ１３では、ステップ
Ｓ１１で入力した入力画像とこれに含まれるステップＳ
１２で認識された文字列と、その入力画像とその認識さ
れた文字列の関係を記述した目次データを検索用ファイ
ル（図１、１４）に格納する。この目次データは例え
ば、「画像」という文字列がどの登録文書画像群にはい
っていたかを検索するためのデータであり、これを用い
ることである文字列を含む文書画像を高速に知ることが
できる。以上で、登録時の処理の説明を終了する。次
に、図２Ｂを参照して、作成されたインデックス情報を
用いて文字検索を行う文字検索処理を説明する。ステッ
プ１からステップＳ４までの処理は、入力した検索文字
列に基づいて、ステップ５での文字列検索処理のための
検索論理和条件を求めるための処理手順を示す。そし
て、ステップＳ５とステップＳ６では、求められた検索
論理和条件に基づいて、入力検索文字列に最も近い文字
列を確定し、図２Ａのフローチャートで生成したインデ
ックス情報を検索して、対応する文書画像を表示する。
尚、ＯＣＲ処理ソフトウエア２は、ステップ１からステ
ップＳ４と、ステップ１１からステップ１２の処理手順
を記述している。また、文書検索ソフトウエア１は、ス
テップ５からステップＳ６の処理手順を記述している。
以下、図２の処理手順を各ステップ毎に説明する。ステ
ップＳ１では、キーボード５から、検索指示文字列を入
力する。ステップＳ２では、入力した検索指示文字列の
各文字に対応する基準のイメージパタンデータを辞書イ
メージデータ１２から抽出して、入力した検索指示文字
列に対応する文字列イメージパターンを生成する。尚、
ここでは、各文字イメージ間隔や画像のぼかし処理のぼ
かし量などの画像処理パラメータは、所定の値を用いた
り、キーボード５から入力することで決定する。ステッ
プＳ３では、ステップＳ２で生成された文字列イメージ
を各文字に分割処理を行う。そして、分割された文字単
位に、所定の特徴の特徴量を抽出し、その特徴量に基づ
いて、認識辞書を検索し、認識候補を抽出する。尚、こ
のステップでは、入力した検索指示文字列を少なくとも
認識候補の１つとして含ませる。尚、ここで、特徴の種
類は、例えば、方向特徴や濃淡特徴などが考えられる
が、本発明は、この特徴に制限されるものではない。ス
テップＳ４は、ステップＳ３で生成された認識候補に基
づいて、考えられる各文字を組み合わせて、認識候補と
しての複数の文字列を生成する。そして、ステップＳ５
での検索処理のための、文字列のＯＲ条件を生成する。
以上の処理が、ＯＣＲソフトウエア２での処理である。
次に、文書検索ソフトウエア３での処理であるステップ
Ｓ５、Ｓ６を説明する。ステップＳ５では、ステップＳ
４で生成された文字列のＯＲ条件で、それら文字列に近
い文字列をステップＳ１３までの処理で生成された、文
書画像とそれに含まれる文字列を含むインデックス情報
のうちの文字列からサーチする。そして、その検索結果
（文書画像、文字列など）を表示装置６に表示する。例
えば、入力した検索対象画像とその検索結果に対応する
文字列の位置にアンダーラインを引くなどで、検索され
た位置を表示する。次に、図３を参照して、ステップＳ
１からステップＳ４での検索ＯＲ条件生成処理でのポイ
ントを具体的に説明する。まず、キーボード５から、検
索指示文字列として、例えば、 "マルチ" を入力する（参照番号１０００）。次に、この検索指示
文字列の各文字に対応するイメージパタンを辞書イメー
ジデータから取り込み、その文字列のイメージパタンを
生成する。ここで生成する文字列イメージパタンを生成
するための複数のパラメータが用意されており、それら
を、辞書イメージデータから取り込んだイメージパタン
に作用させて、文字列イメージパタンを生成する。その
パラメータには、各文字イメージ間隔や画像のぼかし処
理のぼかし量などの画像処理パラメータを含む。これら
のパラメータには、外部記憶装置４に予め格納された所
定の値を用いたり、キーボード５から入力することで決
定する。次に、ステップＳ３で、ＲＡＭに格納された文
書イメージの一連の文字認識処理（１００２）を開始す
る。そして、“ル”の位置に関して、文字領域の切り出
し、続いて、切り出された領域での文字認識をおこなっ
たところ、 “ノ”、“レ” の２文字として、認識されたとする。“ル”の様な文字
に関しては、文字の切り出しエラーが起き易く、例え
ば、“ル”を“ノ”“レ”に誤認識し易い。この認識処
理で、第１の認識候補：マノレチまた、第２の認識候補：アノＬチの認識候補（１００３）が得られたとする。次に、ステ
ップＳ４では、得られた第１と第２の認識文字を比較し
て、異なっている文字部分を検出し、その文字部分を入
れ替えることにより、別の認識候補文字列を生成する。
上述の例では、第１と第３文字の２文字が異なっている
ため、可能な文字列の組み合わせは４通りとなり、上述
の２つの候補プラス２つの文字列の組み合わせが可能で
ある。即ち、ａ．マノレチｂ．アノＬチｃ．アノレチｄ．アノＬチである。これら４通りの文字列（１００４）は、期待の
文字列が「マルチ」であったので、いずれも誤認識文字
列候補となる。しかし、文字認識の過程では、これらの
認識候補が選択されることはさけられなく、正しい認識
は難しくなる。そこで、本発明の実施の形態では、逆の
発想で、文字認識の過程で選択される可能性のある誤認
識候補文字列も、期待認識候補である「マルチ」に対す
る認識候補として認め、これら誤認識候補文字列と期待
認識候補の論理和条件を取る（１００５）ことによっ
て、総合的な認識を行う方法を提供する。従って、通常
の全文検索では、「マルチ」のような他の文字分離の可
能性がある検索指定文字列に対しては、文書画像の検索
で誤検索を起こしやすかったが、上述の誤認識候補文字
列を含む総合的な認識を行うことにより、「マルチ」の
文字列を認識結果として選択できる。ステップＳ４まで
の処理で、入力文字列に対応する検索ＯＲ条件が生成さ
れた。この検索ＯＲ条件を満足する文字列をステップＳ
１３までの処理で生成された、文書画像とそれに含まれ
る文字列を含むインデックス情報のうちの文字列からサ
ーチし、その検索結果（文書画像、文字列など）を表示
装置６に表示することができる。次に、図４を参照し
て、ステップＳ２の詳細な処理手順を説明する。ステッ
プＳ２０では、入力した検索指示文字列に対応する文字
列イメージパターンを生成するための１つのパラメータ
として、曖昧度を設定する。この曖昧度は、外部記憶装
置に予め格納されている曖昧度のディフォルト値でもよ
いし、また、キーボード５から入力してもよい。ここ
で、この曖昧度は、検索対象の文書画像の解像度が悪か
ったり、ノイズをおおく含んでいる場合に予想される文
字認識処理の精度の低下を助けるために導入する。即
ち、検索対象の文書画像の質が悪い時は、曖昧度が高い
とし、質がよい場合は、曖昧度が低いとする。ユーザ
は、検索対象の文書画像の質をおおよそ判断して、対応
する曖昧度を設定する。設定された曖昧度に応じて、入
力した検索指示文字列の各文字に対応する文字イメージ
パターン（フォント）のサイズや文字ピッチサイズを設
定する。この設定は、曖昧度が大きくなれば、文字フォ
ントを小さくし、また、文字ピッチを狭める。また、曖
昧度が小さくなれば、文字フォントを大きくし、文字ピ
ッチを広くする。次に、ステップＳ２１では、入力した
検索指示文字列の各文字に対応する基準のイメージパタ
ンデータを辞書イメージデータ１２から抽出して、ステ
ップＳ２０で設定された文字フォントサイズと文字ピッ
チに対応する文字列パターンを生成する。この場合、基
準のイメージパタンデータ（フォント）は、認識が不得
意な文字フォントを用いる。ステップＳ２２では、ステ
ップＳ２１で生成した文字列イメージパターンに対し
て、曖昧度に対応するノイズを重畳する。即ち、曖昧度
が大きければ、強いノイズとし、逆に、曖昧度が小さけ
れば、弱いノイズとする。このノイズの強度は、例え
ば、強いノイズとしては、多くのノイズドットを用い
て、文字列イメージパターンに対してランダムに重畳す
る。逆に、弱いノイズとしては、少ないノイズドットを
用いて、文字列イメージパターンに対してランダムに重
畳することで、文字列イメージパターンに対するノイズ
のレベルを調整可能である。ステップＳ２３では、ステ
ップＳ２２で処理された文字列イメージパターンに対し
て、ぼかし処理を施す。このぼかし量も、ステップＳ２
２と同様、曖昧度が大きいときは、ぼかし量を大きく、
逆に、曖昧度が小さい時は、ぼかし量を小さくすればよ
い。以上の手順で、ステップＳ２での、入力した検索指
示文字列の各文字に対応する文字列イメージパターンを
生成する処理が実現可能となる。以上説明したように、
本発明の実施の形態では、検索文字列、例えば、「マル
チメ」をＯＣＲが誤認識を起こし易い状態になるように
ビットマップ展開し、これをＯＣＲすることにより、
「マノレチ」という文字列が誤認識傾向文字列群の中の
一つに得られ、検索指定文字列とこれらの誤認識傾向文
字列群をＯＲの関係で、入力文書画像を検索することに
より、検索性能を上げることができる。尚、本発明の実
施の形態では、先に示した文書画像検索以外にも、デー
タベースを用いた検索にも応用できる。更に、ＯＭＲや
バーコードによる光学読み取り装置の一部情報の認識尤
度が低い場合への応用も同様の手法で行なえる。本発明
に係る実施の形態では、ＯＣＲ固有の癖を、検索指定文
字列をビットマップ展開しこれをＯＣＲすることによっ
て得たが、誤認識を行ない易い文字、文字列の正解−誤
認識テーブルを用いて、ＯＣＲ固有の癖を誤認識傾向文
字列に反映させてもよいことは言うまでもない。なお、
本発明は、複数の機器（例えばホストコンピュータ，イ
ンタフェイス機器，リーダ，プリンタなど）から構成さ
れるシステムに適用しても、一つの機器からなる装置
（例えば、複写機，ファクシミリ装置など）に適用して
もよい。また、本発明の目的は、前述した実施形態の機
能を実現するソフトウェアのプログラムコードを記録し
た記憶媒体を、システムあるいは装置に供給し、そのシ
ステムあるいは装置のコンピュータ（または、ＣＰＵや
ＭＰＵ）が記憶媒体に格納されたプログラムコードを読
出し実行することによっても、達成されることは言うま
でもない。この場合、記憶媒体から読出されたプログラ
ムコード自体が前述した実施形態の機能を実現すること
になり、そのプログラムコードを記憶した記憶媒体は本
発明を構成することになる。プログラムコードを供給す
るための記憶媒体としては、例えば、フロッピディス
ク，ハードディスク，光ディスク，光磁気ディスク，Ｃ
Ｄ−ＲＯＭ，ＣＤ−Ｒ，磁気テープ，不揮発性のメモリ
カード，ＲＯＭなどを用いることができる。また、コン
ピュータが読出したプログラムコードを実行することに
より、前述した実施形態の機能が実現されるだけでな
く、そのプログラムコードの指示に基づき、コンピュー
タ上で稼働しているＯＳ（オペレーティングシステム）
などが実際の処理の一部または全部を行い、その処理に
よって前述した実施形態の機能が実現される場合も含ま
れることは言うまでもない。さらに、記憶媒体から読出
されたプログラムコードが、コンピュータに挿入された
機能拡張ボードやコンピュータに接続された機能拡張ユ
ニットに備わるメモリに書込まれた後、そのプログラム
コードの指示に基づき、その機能拡張ボードや機能拡張
ユニットに備わるＣＰＵなどが実際の処理の一部または
全部を行い、その処理によって前述した実施形態の機能
が実現される場合も含まれることは言うまでもない。本
発明を上記記憶媒体に適用する場合、その記憶媒体に
は、先に説明したフローチャートに対応するプログラム
コードを格納することになるが、簡単に説明すると、図
５のメモリマップ例に示す各モジュールを記憶媒体に格
納することになる。すなわち、少なくとも、検索文字列
を入力する「検索文字列入力モジュール」、入力した検
索文字列に基づいて、検索ＯＲ条件を生成する「検索Ｏ
Ｒ条件生成モジュール」、検索対象文書画像を入力する
「検索対象画像入力モジュール」、検索文字列に基づい
て生成された文字列イメージパタンと入力した検索対象
文書画像の文字認識を行う「文字認識モジュール」、生
成された検索ＯＲ条件を満足する文字列を検索対象文書
画像の文字列から獲得する「文字列検索モジュール」、
検索結果を表示する「表示モジュール」の各モジュール
のプログラムコードを記憶媒体に格納すればよい。以上
説明したように、本発明の実施の形態によれば、ＯＣＲ
の誤認識が系統的な場合に、検索指定文字列の文字並び
に即した誤認識の傾向を表す文字列群を得て、これを、
本来の検索指定文字列とＯＲの関係にして検索すること
により、ＯＣＲの認識率が低い場合にでも、検索漏れの
少ない文書画像検索が行なえる。また、前もって誤認識
を行ない易い文字、文字列の正解−誤認識テーブルを作
成する必要が無く、また、検索指定文字列の文字の並び
に即した誤認識傾向が得られるため、個々の文字に対し
て、正解−誤認識テーブルを適応する場合よりも精度の
高い誤認識傾向が得られる。本実施の形態は、検索指定
語に関する技術拡張であるため、従来から存在するＯＣ
Ｒを用いた文書画像検索システムに対して、検索条件入
力段の前に本発明に係る実施の形態を適応するだけで、
ＯＣＲの誤認識に強い検索が可能となる。これらのメリ
ットにより、人手によるＯＣＲ誤認識訂正作業をなく
し、文書画像入力からＯＣＲを経てイメージデータ・テ
キストデータ蓄積まで無人で行なえるシステムを構築で
き、且つ、コンピュータに対し負荷を掛けず、処理速度
の低下の心配が無く、比較的安価なシステムを実現でき
る。 [第２の実施の形態]上述の検索ＯＲ条件に基づいて全体
として確からしい文字列を検索する一例を示したが、こ
れに限定されることはなく、検索ＯＲ条件のいづれか１
つを満足する文字列を検索して、その文字列が含まれる
文書画像を検索結果としてもよい。

【発明の効果】以上説明したように本発明によれば、高
精度の文字列検索を高速、かつ、安価に行うことができ
る。

【図面の簡単な説明】

【図１】本発明の実施の形態のハードウエア構成図であ
る。

【図２Ａ】本発明の実施の形態の文書画像とそれに含ま
れる文字列情報を獲得する処理手順を示すフローチャー
トである。

【図２Ｂ】本発明の実施の形態の文字列検索処理手順を
示すフローチャートである。

【図３】本発明の実施の形態の検索ＯＲ条件生成工程を
説明するための図である。

【図４】ステップＳ２の詳細な処理手順を示したフロー
チャートである。

【図５】コンピュータ読み取り可能な所定の記録媒体に
格納された各プログラムモジュールのレイアウトを示す
図である。

【符号の説明】

１イメージスキャナ２ＲＡＭ（ＯＣＲ処理ソフトウェア）３ＲＡＭ（文書検索ソフトウェア）４外部記憶装置５キーボード６表示装置７ＣＰＵ

─────────────────────────────────────────────────────

【手続補正書】

【提出日】平成８年９月９日

【手続補正１】

【補正対象書類名】明細書

【補正対象項目名】発明の詳細な説明

【補正方法】変更

【補正内容】

【発明の詳細な説明】

【０００１】

【０００２】

【０００３】

【発明が解決しようとする課題】しかしながら、この手
作業が必要であるが故に、文字の全自動認識処理化を難
しいものとしていた。これを解決すべく、この作業を機
械的に行なう研究も行われており、単語辞書や知識ベー
スを用いた誤認識訂正の例があるが、これを実現するに
は高い計算能力を有するコンピュータを用いなければ、
実用化に耐えない等の多くの障壁がある。

【０００４】また、認識候補を１つに絞るために、一
旦、誤訂正をしてしまうと元に戻す手続きが面倒になる
問題をはらんでいる。本発明は、上記従来例に鑑みてな
されたもので、高精度の文字列検索を安価に行うことが
できる画像検索方法とその装置を提供することを目的と
する。

【０００５】

【課題を解決するための手段】上記目的を達成するた
め、本発明の画像検索方法とその装置は以下の構成を備
える。即ち、検索文字列を対応する文字列イメージに展
開する展開工程と、前記展開工程で展開された文字列イ
メージに所定のフィルタリングを行うフィルタリング工
程と、前記フィルタリング工程でフィルタリングされた
文字列イメージを独立部分にセグメンテーションし、セ
グメンテーションされた各部分の文字認識を行い、認識
文字列候補を獲得する認識工程と、前記認識工程で獲得
された認識文字列候補の違いに基づいて、組み合わせ可
能な別の認識文字列候補を生成する生成工程と、前記生
成工程で生成された前記組み合わせ可能な別の認識文字
列候補と前記認識工程で獲得された認識文字列候補の論
理和条件で所定の文字列の検索を行う文字列検索工程と
を備える。

【０００６】また、別の発明は、検索文字列を対応する
文字列イメージに展開する展開手段と、前記展開手段で
展開された文字列イメージに所定のフィルタリングを行
うフィルタリング手段と、前記フィルタリング手段でフ
ィルタリングされた文字列イメージを独立部分にセグメ
ンテーションし、セグメンテーションされた各部分の文
字認識を行い、認識文字列候補を獲得する認識手段と、
前記認識手段で獲得された認識文字列候補の違いに基づ
いて、組み合わせ可能な別の認識文字列候補を生成する
生成手段と、前記生成手段で生成された前記組み合わせ
可能な別の認識文字列候補と前記認識手段で獲得された
認識文字列候補の論理和条件で所定の文字列の検索を行
う文字列検索手段とを備える。

【０００７】また、別の発明は、コンピュータプログラ
ム製品であって、コンピュータ読み取り可能なプログラ
ムコード手段を有するコンピュータ使用可能な媒体を備
え、前記コンピュータプログラム製品は、検索文字列を
対応する文字列イメージに展開する、コンピュータ読み
取り可能な第１プログラムコード手段と、前記第１プロ
グラムコード手段で展開された文字列イメージに所定の
フィルタリングを行う、コンピュータ読み取り可能な第
２プログラムコード手段と、前記第２プログラムコード
手段でフィルタリングされた文字列イメージを独立部分
にセグメンテーションし、セグメンテーションされた各
部分の文字認識を行い、認識文字列候補を獲得する、コ
ンピュータ読み取り可能な第３プログラムコード手段
と、前記第３プログラムコード手段で獲得された認識文
字列候補の違いに基づいて、組み合わせ可能な別の認識
文字列候補を生成する、コンピュータ読み取り可能な第
４プログラムコード手段と、第４プログラムコード手段
で生成された前記組み合わせ可能な別の認識文字列候補
と第３プログラムコード手段で獲得された認識文字列候
補の論理和条件で所定の文字列の検索を行う第５プログ
ラムコード手段とを備える。

【０００８】

【発明の実施の形態】以下、本発明の実施の形態の文字
認識／文字列検索処理構成の詳細な説明を図１を参照し
て行う。図１を参照して、本発明の実施の形態の文字認
識／文字列検索処理構成は、情報処理装置８、外部記憶
装置４、キーボード／マウス５、表示装置６、イメージ
スキャナ１を備える。

【０００９】情報処理装置８は、ＣＰＵ７がその全体の
制御を行う。ＣＰＵ７は、外部記憶装置４に格納された
各種処理ソフトウエアを予めＲＡＭにロードしておき、
それを順次読み出し、解釈し、実行する。この各種処理
ソフトウエアには、ＯＣＲ処理ソフトウェア２、文書検
索ソフトウェア３を含む。イメージスキャナ１は、文書
９をスキャンしてイメージ情報を獲得し、情報処理装置
８に転送する。

【００１０】表示装置１は、情報処理装置８で処理され
た各種の結果や、キーボード／マウス５から入力された
コマンド／データを表示する。キーボード／マウス５
は、各種コマンドや、検索語・検索条件などのデータを
入力する。外部記憶装置４は、ＲＡＭにロードされてＣ
ＰＵ７によって実行されるＯＣＲ処理ソフトウエアと文
書検索ソフトウエアの各プログラム（１０）、その文字
認識／文書検索処理のための認識辞書１５を格納してい
る。

【００１１】また、外部記憶装置４は、イメージスキャ
ナ１から取り込まれた入力イメージデータ（１１）、Ｏ
ＣＲソフトウエア２による認識結果のテキスト情報（１
３）、また、文書検索ソフトウエア３の実行による検索
用ファイル（１４）を格納する。この検索用ファイル
（１４）は、テキスト情報に基づいて作成される。ま
た、外部記憶装置４には、キーボード５から入力する検
索指示文字列の各文字に対応する基準イメージパタンで
ある辞書イメージデータ（１２）を格納している。

【００１２】図２Ａは、本実施の形態の情報処理装置８
での文書検索のためのインデックス情報作成のための処
理手順を示すフローチャートである。また、図２Ｂは、
作成されたインデックス情報を用いて文字検索を行う文
字検索処理手順を示すフローチャートである。まず、図
２Ａを参照して、文書検索のためのインデックス情報作
成のための処理手順を説明する。

【００１３】ステップＳ１１では、検索対象画像をイメ
ージスキャナ１から入力し、外部記憶装置４に格納され
た後、情報処理装置８のＲＡＭにロードする。ステップ
Ｓ１２では、ＲＡＭにロードされた検索対象画像につい
て、文字認識を行う。そして、最も確からしい認識文字
列を得る。ステップＳ１３では、ステップＳ１１で入力
した入力画像とこれに含まれるステップＳ１２で認識さ
れた文字列と、その入力画像とその認識された文字列の
関係を記述した目次データを検索用ファイル（図１、１
４）に格納する。この目次データは例えば、「画像」と
いう文字列がどの登録文書画像群にはいっていたかを検
索するためのデータであり、これを用いることである文
字列を含む文書画像を高速に知ることができる。

【００１４】以上で、登録時の処理の説明を終了する。
次に、図２Ｂを参照して、作成されたインデックス情報
を用いて文字検索を行う文字検索処理を説明する。ステ
ップ１からステップＳ４までの処理は、入力した検索文
字列に基づいて、ステップ５での文字列検索処理のため
の検索論理和条件を求めるための処理手順を示す。そし
て、ステップＳ５とステップＳ６では、求められた検索
論理和条件に基づいて、入力検索文字列に最も近い文字
列を確定し、図２Ａのフローチャートで生成したインデ
ックス情報を検索して、対応する文書画像を表示する。

【００１５】尚、ＯＣＲ処理ソフトウエア２は、ステッ
プ１からステップＳ４と、ステップ１１からステップ１
２の処理手順を記述している。また、文書検索ソフトウ
エア１は、ステップ５からステップＳ６の処理手順を記
述している。以下、図２の処理手順を各ステップ毎に説
明する。ステップＳ１では、キーボード５から、検索指
示文字列を入力する。

【００１６】ステップＳ２では、入力した検索指示文字
列の各文字に対応する基準のイメージパタンデータを辞
書イメージデータ１２から抽出して、入力した検索指示
文字列に対応する文字列イメージパターンを生成する。
尚、ここでは、各文字イメージ間隔や画像のぼかし処理
のぼかし量などの画像処理パラメータは、所定の値を用
いたり、キーボード５から入力することで決定する。

【００１７】ステップＳ３では、ステップＳ２で生成さ
れた文字列イメージを各文字に分割処理を行う。そし
て、分割された文字単位に、所定の特徴の特徴量を抽出
し、その特徴量に基づいて、認識辞書を検索し、認識候
補を抽出する。尚、このステップでは、入力した検索指
示文字列を少なくとも認識候補の１つとして含ませる。
尚、ここで、特徴の種類は、例えば、方向特徴や濃淡特
徴などが考えられるが、本発明は、この特徴に制限され
るものではない。

【００１８】ステップＳ４は、ステップＳ３で生成され
た認識候補に基づいて、考えられる各文字を組み合わせ
て、認識候補としての複数の文字列を生成する。そし
て、ステップＳ５での検索処理のための、文字列のＯＲ
条件を生成する。以上の処理が、ＯＣＲソフトウエア２
での処理である。次に、文書検索ソフトウエア３での処
理であるステップＳ５、Ｓ６を説明する。

【００１９】ステップＳ５では、ステップＳ４で生成さ
れた文字列のＯＲ条件で、それら文字列に近い文字列を
ステップＳ１３までの処理で生成された、文書画像とそ
れに含まれる文字列を含むインデックス情報のうちの文
字列からサーチする。そして、その検索結果（文書画
像、文字列など）を表示装置６に表示する。例えば、入
力した検索対象画像とその検索結果に対応する文字列の
位置にアンダーラインを引くなどで、検索された位置を
表示する。

【００２０】次に、図３を参照して、ステップＳ１から
ステップＳ４での検索ＯＲ条件生成処理でのポイントを
具体的に説明する。まず、キーボード５から、検索指示
文字列として、例えば、 "マルチ" を入力する（参照番号１０００）。

【００２１】次に、この検索指示文字列の各文字に対応
するイメージパタンを辞書イメージデータから取り込
み、その文字列のイメージパタンを生成する。ここで生
成する文字列イメージパタンを生成するための複数のパ
ラメータが用意されており、それらを、辞書イメージデ
ータから取り込んだイメージパタンに作用させて、文字
列イメージパタンを生成する。そのパラメータには、各
文字イメージ間隔や画像のぼかし処理のぼかし量などの
画像処理パラメータを含む。これらのパラメータには、
外部記憶装置４に予め格納された所定の値を用いたり、
キーボード５から入力することで決定する。

【００２２】次に、ステップＳ３で、ＲＡＭに格納され
た文書イメージの一連の文字認識処理（１００２）を開
始する。そして、“ル”の位置に関して、文字領域の切
り出し、続いて、切り出された領域での文字認識をおこ
なったところ、 “ノ”、“レ” の２文字として、認識されたとする。“ル”の様な文字
に関しては、文字の切り出しエラーが起き易く、例え
ば、“ル”を“ノ”“レ”に誤認識し易い。

【００２３】この認識処理で、第１の認識候補：マノレチまた、第２の認識候補：アノＬチの認識候補（１００３）が得られたとする。

【００２４】次に、ステップＳ４では、得られた第１と
第２の認識文字を比較して、異なっている文字部分を検
出し、その文字部分を入れ替えることにより、別の認識
候補文字列を生成する。上述の例では、第１と第３文字
の２文字が異なっているため、可能な文字列の組み合わ
せは４通りとなり、上述の２つの候補プラス２つの文字
列の組み合わせが可能である。即ち、ａ．マノレチｂ．アノＬチｃ．アノレチｄ．アノＬチである。

【００２５】これら４通りの文字列（１００４）は、期
待の文字列が「マルチ」であったので、いずれも誤認識
文字列候補となる。しかし、文字認識の過程では、これ
らの認識候補が選択されることはさけられなく、正しい
認識は難しくなる。そこで、本発明の実施の形態では、
逆の発想で、文字認識の過程で選択される可能性のある
誤認識候補文字列も、期待認識候補である「マルチ」に
対する認識候補として認め、これら誤認識候補文字列と
期待認識候補の論理和条件を取る（１００５）ことによ
って、総合的な認識を行う方法を提供する。

【００２６】従って、通常の全文検索では、「マルチ」
のような他の文字分離の可能性がある検索指定文字列に
対しては、文書画像の検索で誤検索を起こしやすかった
が、上述の誤認識候補文字列を含む総合的な認識を行う
ことにより、「マルチ」の文字列を認識結果として選択
できる。ステップＳ４までの処理で、入力文字列に対応
する検索ＯＲ条件が生成された。

【００２７】この検索ＯＲ条件を満足する文字列をステ
ップＳ１３までの処理で生成された、文書画像とそれに
含まれる文字列を含むインデックス情報のうちの文字列
からサーチし、その検索結果（文書画像、文字列など）
を表示装置６に表示することができる。次に、図４を参
照して、ステップＳ２の詳細な処理手順を説明する。

【００２８】ステップＳ２０では、入力した検索指示文
字列に対応する文字列イメージパターンを生成するため
の１つのパラメータとして、曖昧度を設定する。この曖
昧度は、外部記憶装置に予め格納されている曖昧度のデ
ィフォルト値でもよいし、また、キーボード５から入力
してもよい。ここで、この曖昧度は、検索対象の文書画
像の解像度が悪かったり、ノイズをおおく含んでいる場
合に予想される文字認識処理の精度の低下を助けるため
に導入する。即ち、検索対象の文書画像の質が悪い時
は、曖昧度が高いとし、質がよい場合は、曖昧度が低い
とする。

【００２９】ユーザは、検索対象の文書画像の質をおお
よそ判断して、対応する曖昧度を設定する。設定された
曖昧度に応じて、入力した検索指示文字列の各文字に対
応する文字イメージパターン（フォント）のサイズや文
字ピッチサイズを設定する。この設定は、曖昧度が大き
くなれば、文字フォントを小さくし、また、文字ピッチ
を狭める。また、曖昧度が小さくなれば、文字フォント
を大きくし、文字ピッチを広くする。

【００３０】次に、ステップＳ２１では、入力した検索
指示文字列の各文字に対応する基準のイメージパタンデ
ータを辞書イメージデータ１２から抽出して、ステップ
Ｓ２０で設定された文字フォントサイズと文字ピッチに
対応する文字列パターンを生成する。この場合、基準の
イメージパタンデータ（フォント）は、認識が不得意な
文字フォントを用いる。

【００３１】ステップＳ２２では、ステップＳ２１で生
成した文字列イメージパターンに対して、曖昧度に対応
するノイズを重畳する。即ち、曖昧度が大きければ、強
いノイズとし、逆に、曖昧度が小さければ、弱いノイズ
とする。このノイズの強度は、例えば、強いノイズとし
ては、多くのノイズドットを用いて、文字列イメージパ
ターンに対してランダムに重畳する。逆に、弱いノイズ
としては、少ないノイズドットを用いて、文字列イメー
ジパターンに対してランダムに重畳することで、文字列
イメージパターンに対するノイズのレベルを調整可能で
ある。

【００３２】ステップＳ２３では、ステップＳ２２で処
理された文字列イメージパターンに対して、ぼかし処理
を施す。このぼかし量も、ステップＳ２２と同様、曖昧
度が大きいときは、ぼかし量を大きく、逆に、曖昧度が
小さい時は、ぼかし量を小さくすればよい。以上の手順
で、ステップＳ２での、入力した検索指示文字列の各文
字に対応する文字列イメージパターンを生成する処理が
実現可能となる。

【００３３】以上説明したように、本発明の実施の形態
では、検索文字列、例えば、「マルチメ」をＯＣＲが誤
認識を起こし易い状態になるようにビットマップ展開
し、これをＯＣＲすることにより、「マノレチ」という
文字列が誤認識傾向文字列群の中の一つに得られ、検索
指定文字列とこれらの誤認識傾向文字列群をＯＲの関係
で、入力文書画像を検索することにより、検索性能を上
げることができる。

【００３４】尚、本発明の実施の形態では、先に示した
文書画像検索以外にも、データベースを用いた検索にも
応用できる。更に、ＯＭＲやバーコードによる光学読み
取り装置の一部情報の認識尤度が低い場合への応用も同
様の手法で行なえる。本発明に係る実施の形態では、Ｏ
ＣＲ固有の癖を、検索指定文字列をビットマップ展開し
これをＯＣＲすることによって得たが、誤認識を行ない
易い文字、文字列の正解−誤認識テーブルを用いて、Ｏ
ＣＲ固有の癖を誤認識傾向文字列に反映させてもよいこ
とは言うまでもない。

【００３５】なお、本発明は、複数の機器（例えばホス
トコンピュータ，インタフェイス機器，リーダ，プリン
タなど）から構成されるシステムに適用しても、一つの
機器からなる装置（例えば、複写機，ファクシミリ装置
など）に適用してもよい。また、本発明の目的は、前述
した実施形態の機能を実現するソフトウェアのプログラ
ムコードを記録した記憶媒体を、システムあるいは装置
に供給し、そのシステムあるいは装置のコンピュータ
（または、ＣＰＵやＭＰＵ）が記憶媒体に格納されたプ
ログラムコードを読出し実行することによっても、達成
されることは言うまでもない。

【００３６】この場合、記憶媒体から読出されたプログ
ラムコード自体が前述した実施形態の機能を実現するこ
とになり、そのプログラムコードを記憶した記憶媒体は
本発明を構成することになる。プログラムコードを供給
するための記憶媒体としては、例えば、フロッピディス
ク，ハードディスク，光ディスク，光磁気ディスク，Ｃ
Ｄ−ＲＯＭ，ＣＤ−Ｒ，磁気テープ，不揮発性のメモリ
カード，ＲＯＭなどを用いることができる。

【００３７】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているＯＳ（オペレ
ーティングシステム）などが実際の処理の一部または全
部を行い、その処理によって前述した実施形態の機能が
実現される場合も含まれることは言うまでもない。

【００３８】さらに、記憶媒体から読出されたプログラ
ムコードが、コンピュータに挿入された機能拡張ボード
やコンピュータに接続された機能拡張ユニットに備わる
メモリに書込まれた後、そのプログラムコードの指示に
基づき、その機能拡張ボードや機能拡張ユニットに備わ
るＣＰＵなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。

【００３９】本発明を上記記憶媒体に適用する場合、そ
の記憶媒体には、先に説明したフローチャートに対応す
るプログラムコードを格納することになるが、簡単に説
明すると、図５のメモリマップ例に示す各モジュールを
記憶媒体に格納することになる。すなわち、少なくと
も、検索文字列を入力する「検索文字列入力モジュー
ル」、入力した検索文字列に基づいて、検索ＯＲ条件を
生成する「検索ＯＲ条件生成モジュール」、検索対象文
書画像を入力する「検索対象画像入力モジュール」、検
索文字列に基づいて生成された文字列イメージパタンと
入力した検索対象文書画像の文字認識を行う「文字認識
モジュール」、生成された検索ＯＲ条件を満足する文字
列を検索対象文書画像の文字列から獲得する「文字列検
索モジュール」、検索結果を表示する「表示モジュー
ル」の各モジュールのプログラムコードを記憶媒体に格
納すればよい。

【００４０】以上説明したように、本発明の実施の形態
によれば、ＯＣＲの誤認識が系統的な場合に、検索指定
文字列の文字並びに即した誤認識の傾向を表す文字列群
を得て、これを、本来の検索指定文字列とＯＲの関係に
して検索することにより、ＯＣＲの認識率が低い場合に
でも、検索漏れの少ない文書画像検索が行なえる。ま
た、前もって誤認識を行ない易い文字、文字列の正解−
誤認識テーブルを作成する必要が無く、また、検索指定
文字列の文字の並びに即した誤認識傾向が得られるた
め、個々の文字に対して、正解−誤認識テーブルを適応
する場合よりも精度の高い誤認識傾向が得られる。

【００４１】本実施の形態は、検索指定語に関する技術
拡張であるため、従来から存在するＯＣＲを用いた文書
画像検索システムに対して、検索条件入力段の前に本発
明に係る実施の形態を適応するだけで、ＯＣＲの誤認識
に強い検索が可能となる。これらのメリットにより、人
手によるＯＣＲ誤認識訂正作業をなくし、文書画像入力
からＯＣＲを経てイメージデータ・テキストデータ蓄積
まで無人で行なえるシステムを構築でき、且つ、コンピ
ュータに対し負荷を掛けず、処理速度の低下の心配が無
く、比較的安価なシステムを実現できる。 [第２の実施の形態]上述の検索ＯＲ条件に基づいて全体
として確からしい文字列を検索する一例を示したが、こ
れに限定されることはなく、検索ＯＲ条件のいづれか１
つを満足する文字列を検索して、その文字列が含まれる
文書画像を検索結果としてもよい。

【００４２】

Claims

【特許請求の範囲】

【請求項１】検索文字列を対応する文字列イメージに
展開する展開工程と、前記展開工程で展開された文字列イメージに所定のフィ
ルタリングを行うフィルタリング工程と、前記フィルタリング工程でフィルタリングされた文字列
イメージを独立部分にセグメンテーションし、セグメン
テーションされた各部分の文字認識を行い、認識文字列
候補を獲得する認識工程と、前記認識工程で獲得された認識文字列候補の違いに基づ
いて、組み合わせ可能な別の認識文字列候補を生成する
生成工程と、前記生成工程で生成された前記組み合わせ可能な別の認
識文字列候補と前記認識工程で獲得された認識文字列候
補の論理和条件で所定の文字列の検索を行う文字列検索
工程とを備えることを特徴とする画像検索方法。
【請求項２】前記検索文字列に対応する文字列イメー
ジは、認識率が比較的悪い文字列イメージであることを
特徴とする請求項１に記載の画像検索方法。
【請求項３】前記所定の文字列は、検索対象画像に含
まれるものであり、前記所定のフィルタリングの種類
は、前記検索対象画像の曖昧度に基づいて決定されるこ
とを特徴とする請求項１に記載の画像検索方法。
【請求項４】前記検索対象画像の曖昧度は、前記検索
対象画像の画質が悪ければ曖昧度が高く、画質が良けれ
ば曖昧度が低いことを特徴とする請求項３に記載の画像
検索方法。
【請求項５】前記展開工程は、前記曖昧度に基づく前
記検索文字列に対応する文字列イメージの文字ピッチと
文字サイズの文字列イメージに展開することを特徴とす
る請求項４に記載の画像検索方法。
【請求項６】前記展開工程は、前記曖昧度が大きけれ
ば、前記検索文字列に対応する文字列イメージの文字ピ
ッチが狭く、文字サイズが小さい文字列イメージに展開
することを特徴とする請求項５に記載の画像検索方法。
【請求項７】前記所定のフィルタリングの種類は、前
記検索対象画像の曖昧度が大きければ、強いノイズを重
畳するフィルタが用いられることを特徴とする請求項１
に記載の画像検索方法。
【請求項８】前記所定のフィルタリングの種類は、前
記検索対象画像の曖昧度が大きければ、ぼけを強くする
フィルタが用いられることを特徴とする請求項１に記載
の画像検索方法。
【請求項９】検索文字列を対応する文字列イメージに
展開する展開手段と、前記展開手段で展開された文字列イメージに所定のフィ
ルタリングを行うフィルタリング手段と、前記フィルタリング手段でフィルタリングされた文字列
イメージを独立部分にセグメンテーションし、セグメン
テーションされた各部分の文字認識を行い、認識文字列
候補を獲得する認識手段と、前記認識手段で獲得された認識文字列候補の違いに基づ
いて、組み合わせ可能な別の認識文字列候補を生成する
生成手段と、前記生成手段で生成された前記組み合わせ可能な別の認
識文字列候補と前記認識手段で獲得された認識文字列候
補の論理和条件で所定の文字列の検索を行う文字列検索
手段とを備えることを特徴とする画像検索装置。
【請求項１０】前記検索文字列に対応する文字列イメ
ージは、認識率が比較的悪い文字列イメージであること
を特徴とする請求項９に記載の画像検索装置。
【請求項１１】前記所定の文字列は、検索対象画像に
含まれるものであり、前記所定のフィルタリングの種類
は、前記検索対象画像の曖昧度に基づいて決定されるこ
とを特徴とする請求項９に記載の画像検索装置。
【請求項１２】前記検索対象画像の曖昧度は、前記検
索対象画像の画質が悪ければ曖昧度が高く、画質が良け
れば曖昧度が低いことを特徴とする請求項１１に記載の
画像検索装置。
【請求項１３】前記展開手段は、前記曖昧度に基づく
前記検索文字列に対応する文字列イメージの文字ピッチ
と文字サイズの文字列イメージに展開することを特徴と
する請求項１２に記載の画像検索装置。
【請求項１４】前記展開手段は、前記曖昧度が大きけ
れば、前記検索文字列に対応する文字列イメージの文字
ピッチが狭く、文字サイズが小さい文字列イメージに展
開することを特徴とする請求項１３に記載の画像検索装
置。
【請求項１５】前記所定のフィルタリングの種類は、
前記検索対象画像の曖昧度が大きければ、強いノイズを
重畳するフィルタが用いられることを特徴とする請求項
９に記載の画像検索装置。
【請求項１６】前記所定のフィルタリングの種類は、
前記検索対象画像の曖昧度が大きければ、ぼけを強くす
るフィルタが用いられることを特徴とする請求項９に記
載の画像検索装置。
【請求項１７】コンピュータプログラム製品であっ
て、コンピュータ読み取り可能なプログラムコード手段
を有するコンピュータ使用可能な媒体を備え、前記コン
ピュータプログラム製品は、検索文字列を対応する文字列イメージに展開する、コン
ピュータ読み取り可能な第１プログラムコード手段と、前記第１プログラムコード手段で展開された文字列イメ
ージに所定のフィルタリングを行う、コンピュータ読み
取り可能な第２プログラムコード手段と、前記第２プログラムコード手段でフィルタリングされた
文字列イメージを独立部分にセグメンテーションし、セ
グメンテーションされた各部分の文字認識を行い、認識
文字列候補を獲得する、コンピュータ読み取り可能な第
３プログラムコード手段と、前記第３プログラムコード手段で獲得された認識文字列
候補の違いに基づいて、組み合わせ可能な別の認識文字
列候補を生成する、コンピュータ読み取り可能な第４プ
ログラムコード手段と、第４プログラムコード手段で生成された前記組み合わせ
可能な別の認識文字列候補と第３プログラムコード手段
で獲得された認識文字列候補の論理和条件で所定の文字
列の検索を行う第５プログラムコード手段とを備えるこ
とを特徴とするコンピュータプログラム製品。
【請求項１８】前記認識工程は、獲得した認識文字列
候補の中に、少なくとも前記検索文字列を含むことを特
徴とする請求項１に記載の画像検索方法。
【請求項１９】前記認識手段は、獲得した認識文字列
候補の中に、少なくとも前記検索文字列を含むことを特
徴とする請求項９に記載の画像検索装置。