JP3486168B2 - 検索システム、ファイリングシステム、記録媒体 - Google Patents

検索システム、ファイリングシステム、記録媒体

Info

Publication number
JP3486168B2
JP3486168B2 JP2000362901A JP2000362901A JP3486168B2 JP 3486168 B2 JP3486168 B2 JP 3486168B2 JP 2000362901 A JP2000362901 A JP 2000362901A JP 2000362901 A JP2000362901 A JP 2000362901A JP 3486168 B2 JP3486168 B2 JP 3486168B2
Authority
JP
Japan
Prior art keywords
image information
search
recognition
keyword
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000362901A
Other languages
English (en)
Other versions
JP2002163282A (ja
Inventor
義時 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kitagawa Industries Co Ltd
Original Assignee
Kitagawa Industries Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kitagawa Industries Co Ltd filed Critical Kitagawa Industries Co Ltd
Priority to JP2000362901A priority Critical patent/JP3486168B2/ja
Publication of JP2002163282A publication Critical patent/JP2002163282A/ja
Application granted granted Critical
Publication of JP3486168B2 publication Critical patent/JP3486168B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】イメージ情報に含まれる文字
列を検索するための検索システム及び該検索システムを
備えたファイリングシステムに関する。
【0002】
【従来の技術及び発明が解決しようとする課題】従来よ
り、紙等に印刷された文書等をスキャナで読み取って、
イメージ情報(画像情報)として記憶しておき、必要に
応じて記憶したイメージ情報を表示させたり、印刷させ
たりすることのできるファイリングシステムが知られて
いる。
【0003】このようなファイリングシステムでは、記
憶したイメージ情報の中から所望の文書に対応するイメ
ージ情報を取り出しやすくするために、キーワードによ
って、イメージ情報の検索を行えるようにしたものがあ
る。こうしたシステムでは、紙等に印刷された文書を含
むイメージをコンピュータに取り込んで記憶させる際
に、読み取った文書の内容を示す検索用キーワードをキ
ーボード等から入力し、入力された検索用キーワードを
イメージ情報に対応付けて記憶しておく。そして、利用
者が必要な文書のイメージ情報を検索する際には、検索
したい文書の内容等を示すキーワードを入力し、システ
ムはそのキーワードと記憶されている検索用キーワード
とを比較して、キーワードに一致する検索用キーワード
の付けられたイメージ情報を出力する。したがって、文
書のイメージ情報を記憶させる際に入力した検索用キー
ワードが、その文書を示す情報として不十分なものしか
入力されていない場合には、キーワードと検索用キーワ
ードとが一致せず、所望の文書のイメージ情報を抽出す
ることができない。このように文書の内容を示す的確な
検索用キーワードを入力しておかないと、検索用キーワ
ードと利用者の入力したキーワードとが一致せず、イメ
ージ情報が蓄積されたまま利用されないといった事態が
発生する。また、こうした検索用キーワードを各文書の
イメージ情報毎に入力するのは非常に手間がかかるとい
った問題がある。
【0004】一方、文書をイメージ情報として読み取
り、そのイメージ情報をテキスト情報に変換して記憶し
ておくOCR(光学文字読取装置)が知られており、こ
のようなOCRでイメージ情報をすべてテキスト情報に
変換して保存することも行われている。このような方法
であれば、予めキーワードを登録する必要がなく、また
自由なキーワードで文書を検索することができる。しか
し、OCRは、一般的に認識率が95%から99%程度
であり、変換後のテキスト情報のみを記憶するため、文
書の内容を保持するためには、変換後のテキスト情報が
文書の内容と一致するように、変換後のテキスト情報を
利用者が見て確認し修正しておかなければならないとい
った問題がある。このような手間は、取り込む文書の数
が増えるにつれ、膨大なものとなってしまう。
【0005】そこで本発明は、入力の手間がかからず、
所望の文書を取り出すことのできるイメージ情報の検索
システム及びその検索システムを備えたファイリングシ
ステムを提供することを目的とする。
【0006】
【課題を解決するための手段及び発明の効果】上述した
問題点を解決するためになされた請求項1に記載の検索
システムによれば、キーワード検索時に認識処理を行
い、入力した検索キーワードを含むイメージ情報または
そのイメージ情報を特定するための情報が出力される。
したがって、検索用キーワードを各書類毎に予め入力す
る必要がなく、また、書類を予めOCRによってテキス
ト情報に変換する必要もない。すなわち、記憶されたイ
メージ情報に含まれる文字を、直接キーワード検索する
ことができる。つまり、イメージ情報に対応する検索用
キーワードを予め入力しておいたり、OCRで変換され
たテキストを修正したりする手間をかけずに、所望の文
書をイメージ情報として取り出すことができる。
【0007】また、認識中のイメージ情報に対する認識
処理は、検索キーワードが含まれていると判定された際
に中止される。つまり、認識中のイメージ情報に対する
それ以降の認識処理を行わない。したがってその時点
で、例えば別のイメージ情報を読み込んで検索処理を行
うなどの他の処理に移ることができる。なお、イメージ
情報を特定する情報としては、例えば、そのイメージ情
報の格納された場所を示す情報やファイル名、認識が完
了した時点までの文字情報等を含む。
【0008】また、イメージ情報からテキスト情報に変
換できない部分があれば、請求項2に示すようにして、
その部分は無視して認識処理を進めるようにするとよ
い。このようにすれば、認識できない部分のあるイメー
ジ情報があっても検索を続行することができる。なお、
認識できなかった部分のあるイメージ情報は、認識でき
ない部分があった旨とともに表示装置等に出力するよう
にしてもよい。
【0009】なおイメージ情報は、例えば、1のイメー
ジファイルから構成されていてもよいし、複数のイメー
ジファイルから構成されていてもよい。また、1のイメ
ージファイルは、例えば、1枚の紙(書類)をスキャナ
で取り込んだものでもよいし、複数の紙を1のイメージ
ファイルとして取り込んだものでもよい。
【0010】複数の関連性のあるイメージ情報は、請求
項3のようにイメージ情報をセットとして記憶してお
き、そのイメージ情報のセット単位で読み出して検索を
行うようにするとよい。すなわち、例えば検索を行う際
に、第1の書類群のイメージ情報のセット、第2の書類
群のイメージ情報のセット、第3の書類群のイメージ情
報のセット、…、第nの書類群のイメージ情報のセット
がイメージ情報記憶手段に記憶されている場合に、それ
ぞれの書類群のイメージ情報のセット毎に読み出して検
索を行う。つまり、第1の書類群のイメージ情報のセッ
トの中から例えば1枚目の書類のイメージ情報、2枚目
の書類のイメージ情報、…、m枚目の書類のイメージ情
報と検索し、キーワードが見つかった段階等で第2の書
類群のイメージ情報のセットの検索を行う。すなわち、
イメージ情報のセット単位でキーワードが含まれるか否
かを検索することができる。よって、例えば、第1の書
類群の1枚目の書類のイメージ情報でキーワードがあっ
た場合に、その後、第1の書類群の2枚目のイメージ情
報、3枚目のイメージ情報、…、と重複して検索を行っ
てしまうこと防ぐことができる。つまり、キーワードが
含まれると判定されたイメージ情報のセットに含まれる
未認識のイメージ情報を検索してしまうことがなく高速
に検索を行うことができる。また、このようにすること
で例えば請求項4のように並列処理を行った際に、それ
ぞれの書類群のイメージ情報を同時に検索でき、1の書
類群のイメージ情報の中の複数のイメージ情報を同時に
検索してしまうといった無駄が発生しなくなる。
【0011】請求項4は、異なる手段の処理を並行(並
列)して行ってもよく、同一の手段の処理を複数並行
(並列)して行ってもよいことを示す。例えば、認識対
象イメージ読出手段が、複数のイメージ情報を並行して
読み出して、文字認識手段がその複数のイメージ情報を
並行して文字認識しつつ、検索手段がそれぞれのイメー
ジ情報の認識結果の文字とキーワードを並行して比較し
て、一致するか否かを判定して検索結果を得るようにし
たり、例えば、文字認識手段が認識対象の1のイメージ
情報を複数領域の分割して並列して認識を行うようにす
るとよい。このようにすれば、認識や検索を同時並行で
行うことができるため、より高速に検索結果を得ること
ができる。
【0012】なお、イメージ情報記憶手段と認識対象イ
メージ読出手段と文字認識手段を備えた第1のシステム
群と、検索キーワード入力手段と検索手段を備えた第2
のシステムを備え、第1のシステム群と第2のシステム
とをそれぞれネットワークで接続して分散処理(並列処
理)するようにしてもよい。また第1のシステム群に第
2のシステムの機能を備えるようにしてもよい。このよ
うにすれば、負荷が分散されてより高速に検索を行うこ
とができる。
【0013】そしてさらに請求項5に示すようにして、
一度認識した認識結果は記憶しておき、その記憶した認
識結果を利用して検索を行うようにするとよい。このよ
うにすれば、一度文字認識を行ったイメージ情報は再度
文字認識を行う必要がなくなるので、検索を行えば行う
ほど高速に検索を行うことができるようになる。
【0014】なお、イメージ情報と関連付けて記憶する
とは、その認識の完了した位置の情報も含んで記憶する
場合も含む。このようにした場合には、次に同一のイメ
ージ情報からキーワード検索を行う際に、検索手段は、
まず認識の完了した位置までは記憶された認識結果を検
索し、その位置以降の部分については認識手段が認識を
行ってその認識結果を検索する。これらの処理は並列し
て行ってもよい。すなわち、文字認識手段が認識を行い
つつ、検索手段が認識結果記憶手段に記憶された文字と
文字認識手段が認識した文字を並行して検索するように
してもよい。
【0015】さて、このようなシステムでは、請求項6
に示すようにして、随時、性能のよい文字認識手段に換
えて検索を行うようにしてもよい。例えば文字認識手段
がハードウェアで構成される場合にはそのハードウェア
を取り替え可能にし、文字認識手段がソフトウェアによ
る処理で実現される場合にはそのソフトウェアを取り替
え可能とする。こうして、例えば、認識対象のイメージ
情報によって認識率のよい文字認識手段に変更すること
ができる。例えば、法律文書を検索する際には、法律文
書の認識率の高い文字認識手段に切り替えるようにした
り、手書き文字の場合には、手書き文字の認識率の高い
文字認識手段に切り替える。また、文字認識手段は、例
えばネットワークを介して更新や変更ができるようにす
るとよい。特に本システムは、検索時に文字認識を行う
ので、このようにすれば、検索を行う時点で最適の文字
認識手段を利用して検索を行うことができる。文字認識
手段の認識率は年々向上することが期待できるので、従
来のOCRのように予めイメージ情報の取り込み時点で
テキスト情報に変換するよりも認識精度が高くなり、検
索の精度を上げることができる。
【0016】以上のような検索システムは、例えば、ネ
ットワークや記録媒体から入力したイメージ情報につい
ても検索を行うことができる。また、請求項7のように
することで、紙に記載された文書をイメージ情報として
取り込み、そのイメージ情報に対して検索を行った結果
を表示させるファイリングシステムとすることができ
る。なお、検索結果は表示せずにネットワークを介して
送信するようにしてもよい。またプリンタ等で印刷する
ようにしてもよい。また、検索キーワード入力手段は、
このようなシステムに備えたキーボード等でもよいし、
ネットワークを介して入力するものでもよい。
【0017】なお、請求項8に示すように、請求項1〜
7に記載の各手段をコンピュータにて実現する機能は、
例えば、コンピュータで起動するプログラムとして備え
ることができる。このようなプログラムの場合、例え
ば、フロッピー(登録商標)ディスク、光磁気ディス
ク、CD−ROM、ハードディスク等のコンピュータ読
み取り可能な記録媒体に記録し、必要に応じてコンピュ
ータシステムにロードして起動することにより用いるこ
とができる。また、各手段は、全体として検索システム
やファイリングシステムを構成すればよいので、複数の
コンピュータで各手段を実現するようにしてもよい。例
えば、各手段はそれぞれ異なるコンピュータで実現して
もよい。
【0018】
【発明の実施の形態】以下、本発明が適用された実施例
について図面を用いて説明する。なお、本発明の実施の
形態は、下記の実施例に何ら限定されることなく、本発
明の技術的範囲に属する限り種々の形態を採りうること
は言うまでもない。
【0019】図1に本実施例のファイリングシステム1
の構成を示す。ファイリングシステム1は、パソコン1
1と、パソコン11に接続されたディスプレイ12・キ
ーボード13・マウス14・スキャナ15・プリンタ1
6を備えるコンピュータシステムであり、パソコン11
は、ネットワーク50に接続可能な通信インターフェー
スと、データを記録するためのハードディスク、RO
M、RAM、I/O等を備え、ディスプレイ12、キー
ボード13、マウス14、スキャナ15、プリンタ16
等を制御する。
【0020】スキャナ15はADF(オートドキュメン
トフィーダー)を備えており、セットされた書類を連続
的に読み取り、イメージデータとしてパソコン11へ出
力することができる。スキャナ15に読取対象の書類が
セットされ、スキャナ15のスキャン開始ボタンが押さ
れると、スキャナ15はパソコン11に読み取り指示が
入力された旨を送信する。すると、パソコン11は、ス
キャナ15に対してイメージの読み取り指示を出力す
る。そして、スキャナ15は、セットされた書類をセン
サで次々にスキャンして書類のイメージデータを生成
し、そのイメージデータをパソコン11へ送信する。パ
ソコン11は、スキャナ15から送信されたイメージデ
ータを所定の形式(例えばJPEG、PNG等の圧縮形
式)のイメージファイルとしてハードディスクに記憶す
る。なお、書類一枚毎に1のイメージファイルを記憶す
る。
【0021】このようにして記録されたイメージファイ
ルから、検索キーワードを含む書類のイメージファイル
を検索することができる。この検索処理は、キーボード
13やネットワーク50等を介して入力されたキーワー
ドの文字を含むイメージファイルをハードディスクから
検索する処理である。このキーワード検索処理の流れを
図2のフローチャートに示して説明する。
【0022】図2のS110では、イメージファイルを
ハードディスクから読み込み、イメージとして展開して
メモリ上に読み込む。S120では、メモリ上のイメー
ジ内の文字を公知の認識アルゴリズムによって認識して
キャッシュへ認識結果の文字を書き込む。
【0023】S130では、検索キーワードに一致する
文字列がキャッシュ内にあるかを検索する。S140で
は、検索の結果、キーワードに一致する文字列があった
か否かを判定し、キーワードに一致する文字列があった
場合には(S140:YES)、S150へ移行し、キ
ーワードに一致する文字列がない場合には(S140:
NO)、S145へ移行する。
【0024】S145では、処理中のイメージファイル
内の文字認識と検索処理がすべて終了したか否かを判定
し、終了した場合には(S145:YES)、S160
へ移行し、終了していない場合には(S145:N
O)、次の文字を認識するため、S120へ移行する。
【0025】S150では、S140でキーワードに一
致する文字列を含むと判定されたイメージをディスプレ
イ12に表示させる。S160では、利用者の終了指示
の入力があったかと、ハードディスクに記憶された検索
対象のイメージファイルのすべてについてS110で読
み込みを行ったかを判定し、利用者の終了指示があった
場合またはイメージファイルのすべてについて読み込み
を行った場合(以下処理が完了した場合と称する)には
(S160:YES)、検索処理を終了する。一方、利
用者の終了指示の入力がなく、イメージファイルの処理
が完了していない場合には、読み込み対象を次のイメー
ジファイルにセットして、S110へ戻り同様に検索処
理を行う。
【0026】なお、文字の認識は文書(イメージ)の先
頭(公知の手法で先頭を判定する)から1文字ずつ行っ
て、認識結果の文字をキャッシュに書き込み、続く文字
を認識して、続けてその文字をキャッシュに書き込むこ
とを繰り返して文字列をキャッシュ内に形成する。そし
て、その文字列に対してキーワードに一致する文字列が
あるか否かを判定し、一致した場合にはその時点で認識
を終了して、対応するイメージファイルを読み込んで表
示する。なお、認識できない文字があった場合にはその
部分を無視して認識と検索を続行する。このようにキー
ワードに一致する文字列があった場合には認識処理を中
止するので、例えば、イメージの先頭から10%の位置
でキーワードに一致する文字列があった場合には残りの
90%の認識処理をしない。したがって、イメージ全体
の認識を行うよりも高速に検索を行うことができる。
【0027】このようにして、検索時にイメージファイ
ルを読み込んで文字認識を行いながらキーワード検索を
行うことができる。したがって、従来のように検索用キ
ーワードの入力やOCR後の修正の手間がかからず、所
望の文書のイメージファイルを任意の文字列をキーワー
ドとして検索して取り出すことができる。よって、取り
込んで記憶したイメージファイルは有効に利用される。
【0028】なお、実施例において、キーボード13が
検索キーワード入力手段に相当し、パソコン11のハー
ドディスクがイメージ情報記憶手段に相当する。また、
イメージファイルがイメージ情報に相当し、図2のS1
10の処理が認識対象イメージ読出手段としての処理に
相当し、S120の処理が文字認識手段としての処理に
相当し、S130の処理が検索手段としての処理に相当
する。そしてスキャナ15が読取手段に相当し、ディス
プレイ12が表示手段に相当する。 [別実施例] (1)上記実施例では、イメージファイルをスキャナ1
5から入力して生成することとしたが、例えばネットワ
ーク50を介して入力してもよいし、CDROMやDV
D等の記録媒体から入力するようにしてもよい。また、
検索結果のイメージはディスプレイ12に表示すること
としたが、プリンタ16に出力するようにしてもよい。 (2)上記実施例では、検索キーワードをキーボード1
3から入力することとしたが、ネットワーク50を介し
て入力するようにしてもよい。例えば、パソコン11を
検索サーバとして機能させ、ネットワーク50に接続さ
れたクライアントパソコンから検索キーワードを入力
し、検索結果を、そのクライアントパソコンに送信す
る。このようにすれば、ネットワーク50に接続された
パソコンから所望の書類のイメージファイルを検索する
ことができる。 (3)イメージ内の文字の認識処理(図2のS120)
と、キャッシュ内の文字列のキーワードの検索処理(図
2のS130)は、並列(並行)して行うようにすると
よい。例えば、認識処理を行う認識処理スレッドと、キ
ーワード検索を行うキーワード検索スレッドを並行して
実行し、キーワード検索処理のスレッドがキーワード一
致と判定した場合には、認識処理スレッドに終了メッセ
ージを送り、認識処理スレッドは終了メッセージを受信
した場合に、認識処理を終了する。 (4)上記(3)に加えさらに、図2の処理全体を並列
に(例えばマルチスレッドで)実行するようにするとよ
い。すなわち、複数のイメージファイルに対して同時に
キーワード検索処理を行うようにする。このようにすれ
ば、キーワードに一致するイメージファイルから順に出
力されるようになる。またこれらのスレッドを異なる複
数のCPUで実行するようにすれば、処理が高速化され
る。また、図3に示すように、複数のサーバ20で、ネ
ットワークを介してパソコン11に記憶されたイメージ
ファイルの読み込みと(S110に相当)、S120の
認識処理を実行するようにし、パソコン11のキャッシ
ュへネットワーク50を介して認識結果の文字を送るよ
うにして、パソコン11でS130〜S160の処理を
実行するようにして検索を行うようにしてもよい。一般
的にS120の認識処理は処理時間がかかるので、この
ように複数のサーバ20に処理を分散させることで、さ
らに高速な検索を実現することができる。 (5)上記実施例においては、書類一枚につき1のファ
イルとしたが、関連ある書類のセット(例えば、1冊の
書籍、1の報告書等)を1のイメージにまとめて記憶し
ておき、検索を行うようにしてもよい。このようにすれ
ば、書類のセット毎に先頭から検索が行われる。特に上
記(3)(4)の場合のように、並列して検索する場合
には、書類のセット毎に並列して検索処理がなされる。
【0029】一方、書類一枚に対して1のイメージファ
イルを生成し、書類のセット毎にセットIDを付与して
各イメージファイルに記録しておくようにしてもよい。
このセットIDは例えば一冊の本や、報告書のように複
数の書類からなる関連性のある書類を示す情報であり、
例えばスキャナに1度にセットされた書類をスキャンし
た場合、そのスキャンによって生成されたイメージファ
イルに自動的に同一のセットIDを記録してもよいし、
ディスプレイ12にスキャンしたイメージデータを表示
し、その中から利用者がマウス14等を用いてイメージ
のセットを選択し、イメージファイルのセットとして同
一のセットIDを記録するようにしてもよい。こうし
て、セットIDが記録された複数のイメージファイルが
ハードディスクに記録される。そして並列して検索処理
を行う場合には、このセットIDが異なるイメージファ
イルを同時に検索するようにする。このようにすれば、
複数の書類のセットを同時並行的に検索することができ
る。 (6)上記実施例においては、ハードディスクに記憶さ
れたイメージファイルを検索処理において毎回認識処理
(S120の処理)を行うこととしたが、一度認識を行
ったイメージファイルについては、認識結果の文字をそ
のイメージファイルと関連づけて認識結果記憶手段とし
てのハードディスクに記憶しておき、次に検索を行う場
合にそのハードディスクに記憶した文字を検索するよう
にするとよい。すなわち、図4に示すように、図2のキ
ーワード検索処理にS147の認識済のテキストを記憶
する処理を加えて、その認識した文字(テキスト)をハ
ードディスクに記憶しておく。こうして関連付けて記憶
されたイメージファイルと同一イメージファイルに対し
て検索を行うと、S101で検索対象のイメージファイ
ルに対応するテキストは記憶済と判断され(S101:
YES)、S103で記憶済のテキストをキーワード検
索する。そして、S105でキーワードと一致したか否
かを判定し、一致した場合には(S105:YES)、
S150へ移行して対応するイメージを表示する。一致
しない場合には(S105:NO)、S160へ移行す
る。このようにすれば、一度認識したイメージファイル
は再度認識する必要がなくなり、キーワード検索を高速
に行うことができる。
【0030】なお、さらに認識途中でキーワードが見つ
かった場合、すなわち図5のS140:YESの場合
に、その認識済の位置までのテキストとそのイメージフ
ァイルの認識が完了している位置の情報と共に記憶する
ようにしてもよい。この場合には、次に同一のイメージ
ファイルに対して検索を行う際に、その位置までは、記
憶したテキストから検索し、それ以降の位置からは、認
識処理を行って検索するようにしてもよい。このように
すれば、一度認識を行った部分については再度認識を行
う必要がなくなり、さらに高速に検索を行うことができ
る。 (7)上記実施例において、さらにキーワード検索処理
は、ユーザーからの中止指示が入力された際に、その処
理を中止するとよい。このようにすれば、例えば、検索
キーワードを利用者が間違えて入力してしまった場合
や、検索キーワードを含むいくつかのイメージファイル
が見つかればよい場合などに、最後まで検索処理を行っ
てしまうことを防止でき、使い勝手のよいシステムとな
る。 (8)上記実施例において、さらに、図2のS120の
認識処理を行うプログラムは、インターネットに接続さ
れたネットワーク50を介して、図示しないセンターか
らダウンロードするようにするとよい。そしてセンター
では、常にこの認識処理を行うプログラムの性能を向上
させるようにする。このようにすれば、検索時点におけ
る最新の認識処理プログラムを利用して検索することが
できる。
【図面の簡単な説明】
【図1】実施例のファイリングシステムの構成を示す図
である。
【図2】実施例のキーワード検索処理を示すフローチャ
ートである。
【図3】別実施例のファイリングシステムの構成を示す
図である。
【図4】別実施例のキーワード検索処理を示すフローチ
ャートである。
【符号の説明】
1…ファイリングシステム 11…パソコン 12…ディスプレイ 13…キーボード 14…マウス 15…スキャナ 16…プリンタ 20…サーバ 50…ネットワーク
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 G06T 1/00

Claims (9)

    (57)【特許請求の範囲】
  1. 【請求項1】 検索キーワードを入力する検索キーワー
    ド入力手段と、 複数のイメージ情報を記憶するイメージ情報記憶手段
    と、 前記イメージ情報記憶手段に記憶された複数のイメージ
    情報のうち認識対象となるイメージ情報を読み出す認識
    対象イメージ読出手段と、 前記認識対象イメージ読出手段の読み出したイメージ情
    報に含まれる文字を逐次認識する文字認識手段と、 前記文字認識手段の認識結果に、前記検索キーワード入
    力手段によって入力された検索キーワードが含まれる場
    合には、前記文字認識手段の逐次認識を中止させるとと
    もに、前記認識対象イメージ読出手段の読み出したイメ
    ージ情報または該イメージ情報を特定するための情報を
    出力する検索手段とを備えることを特徴とする検索シス
    テム。
  2. 【請求項2】 請求項1に記載の検索システムにおい
    て、 前記文字認識手段は、前記イメージ情報から前記文字に
    変換できない部分があれば、その部分を無視して認識を
    続行することを特徴とする検索システム。
  3. 【請求項3】 請求項1または2に記載の検索システム
    において、 前記イメージ情報記憶手段は、関連性のある複数のイメ
    ージ情報をセットとして記憶しており、前記認識対象イ
    メージ読出手段は、前記認識対象となるイメージ情報と
    して前記イメージ情報をセット単位で読み出すことを特
    徴とする検索システム。
  4. 【請求項4】 請求項1〜3のいずれかに記載の検索シ
    ステムにおいて、 前記認識対象イメージ読出手段、前記文字認識手段及び
    前記検索手段のうち少なくともいずれか2以上の手段に
    よる処理を並行して実行すること、または、前記認識対
    象イメージ読出手段、前記文字認識手段及び前記検索手
    段のうち少なくともいずれか1の手段が当該手段として
    の処理を並行して実行すること、の少なくともいずれか
    一方を行うことを特徴とする検索システム。
  5. 【請求項5】 請求項1〜4のいずれかに記載の検索シ
    ステムにおいて、 さらに、前記文字認識手段の認識結果を認識対象のイメ
    ージ情報と関連付けて記憶する認識結果記憶手段を備
    え、 前記検索手段は、前記認識結果記憶手段に記憶された認
    識結果を優先して検索することを特徴とする検索システ
    ム。
  6. 【請求項6】 請求項1〜5のいずれかに記載の検索シ
    ステムにおいて、 前記文字認識手段は、取り替え可能であることを特徴と
    する検索システム。
  7. 【請求項7】 請求項1〜6のいずれかに記載の検索シ
    ステムを備えるファイリングシステムであって、 紙面をセンサで読み取ってイメージ情報を生成し、生成
    したイメージ情報を前記イメージ情報記憶手段に記憶す
    る読取手段と、 前記検索手段によって出力されたイメージ情報または該
    イメージ情報を特定するための情報を表示する表示手段
    とを備えることを特徴とするファイリングシステム。
  8. 【請求項8】 請求項1〜のいずれかに記載の検索シ
    ステムにおける各手段としてコンピュータを機能させる
    ためのプログラムを記録したコンピュータ読み取り可能
    な記録媒体。
  9. 【請求項9】 請求項7に記載のファイリングシステム
    における各手段としてコンピュータを機能させるための
    プログラムを記録したコンピュータ読み取り可能な記録
    媒体。
JP2000362901A 2000-11-29 2000-11-29 検索システム、ファイリングシステム、記録媒体 Expired - Fee Related JP3486168B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000362901A JP3486168B2 (ja) 2000-11-29 2000-11-29 検索システム、ファイリングシステム、記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000362901A JP3486168B2 (ja) 2000-11-29 2000-11-29 検索システム、ファイリングシステム、記録媒体

Publications (2)

Publication Number Publication Date
JP2002163282A JP2002163282A (ja) 2002-06-07
JP3486168B2 true JP3486168B2 (ja) 2004-01-13

Family

ID=18834099

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000362901A Expired - Fee Related JP3486168B2 (ja) 2000-11-29 2000-11-29 検索システム、ファイリングシステム、記録媒体

Country Status (1)

Country Link
JP (1) JP3486168B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006331222A (ja) * 2005-05-27 2006-12-07 Murata Mach Ltd 画像読取装置及び情報処理装置
JP2007058448A (ja) * 2005-08-23 2007-03-08 National Institute Of Advanced Industrial & Technology 電子ファイリング方法及び装置並びにプログラム

Also Published As

Publication number Publication date
JP2002163282A (ja) 2002-06-07

Similar Documents

Publication Publication Date Title
KR102403964B1 (ko) 화상 처리 장치, 화상 처리 방법, 및 저장 매체
JP3689455B2 (ja) 情報処理方法及び装置
US6671684B1 (en) Method and apparatus for simultaneous highlighting of a physical version of a document and an electronic version of a document
US6766069B1 (en) Text selection from images of documents using auto-completion
US6289121B1 (en) Method and system for automatically inputting text image
US20080162602A1 (en) Document archiving system
US20060285748A1 (en) Document processing device
JP4785655B2 (ja) 文書処理装置及び文書処理方法
JP2006202081A (ja) メタデータ生成装置
JP2007041709A (ja) 文書処理システム、文書処理システムの制御方法、文書処理装置、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP3486168B2 (ja) 検索システム、ファイリングシステム、記録媒体
CN101872344A (zh) 一种图像扫描的控制方法
KR20060116114A (ko) 광학 문자 판독을 이용한 문서 검색 및 텍스트 정보 추출시스템 및 그 방법
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JPH0934903A (ja) ファイル検索装置
JPH1173415A (ja) 類似文書検索装置及び類似文書検索方法
JP2007328432A (ja) 帳票処理装置、帳票処理方法及びプログラム
CN112905733A (zh) 一种基于ocr识别技术的图书保存方法、***及装置
CN112446373A (zh) 识别转换图像文件的方法、***、计算机设备及存储介质
EP3940628A1 (en) Image processing device, image reading device, image processing method, and program
JP2009163475A (ja) 情報処理装置、情報処理システム、および情報処理プログラム
JP2006004050A (ja) 画像処理装置、画像読み取り装置およびプログラム
US20220075930A1 (en) Document search system and document search method
JPH04348475A (ja) 画像情報検索方法及びその装置
JP4298138B2 (ja) 情報検索方法及びその実施装置並びにその処理プログラムを記録した記録媒体

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071024

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081024

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091024

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees