JP3325326B2 - 電子ファイリング装置 - Google Patents

電子ファイリング装置

Info

Publication number
JP3325326B2
JP3325326B2 JP03776193A JP3776193A JP3325326B2 JP 3325326 B2 JP3325326 B2 JP 3325326B2 JP 03776193 A JP03776193 A JP 03776193A JP 3776193 A JP3776193 A JP 3776193A JP 3325326 B2 JP3325326 B2 JP 3325326B2
Authority
JP
Japan
Prior art keywords
keyword
image
search
group
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03776193A
Other languages
English (en)
Other versions
JPH06251084A (ja
Inventor
志郎 高木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP03776193A priority Critical patent/JP3325326B2/ja
Publication of JPH06251084A publication Critical patent/JPH06251084A/ja
Application granted granted Critical
Publication of JP3325326B2 publication Critical patent/JP3325326B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、光ディスク等の外部
記憶装置に画像情報等をキーワードや概要を示す文章
(タイトル)等を付加して蓄積し、キーワードを指定し
て画像情報を検索する電子ファイリング装置に関する。
【0002】
【従来の技術】電子ファイリング装置においては、目的
とする画像データ(画像情報)を捜し出す場合は、検索
用のキーワードを入力し、このキーワードが付加されて
いる画像データを選択するキーワード検索、あるいは検
索用の文字列を入力し、この文字列を含むタイトルが付
加されている画像データを選択するフリーテキスト検索
等の方法がある。
【0003】電子ファイリング装置では、管理する画像
データ毎に付加されているキーワードやタイトルを画像
データの記録先である同じ光ディスク上に記録したり、
別のハードディスク上に記録している。電子ファイリン
グ装置で上記の検索を行なう場合は、管理されている全
ての画像データに付加されているキーワードとタイトル
を光ディスクまたはハードディスクから読出し、入力さ
れた検索キーワードや検索文字列と比較して検索処理を
行っている。通常、画像データに付加されているキーワ
ードにはキーワード番号が割り当てられており、このキ
ーワード番号が画像データ毎に記録されている。
【0004】例えば、管理されている総画像データ数が
1000件とし、各画像データに平均5個のキーワード
が付加され、キーワード番号が2バイトで表現されてい
るとすると1画像データ当り10バイトとなる。従っ
て、全部で10000バイト(10KB)のデータを読
出し、検索キーワードと比較することになる。
【0005】また、画像データに付加されているタイト
ルの文字列長が100バイトであるとすると、全部で1
00000バイト(100KB)のデータを読出し、検
索文字列と比較することになる。
【0006】管理される画像データ数が多くなったり、
画像データに付加されているキーワードの数が増えた
り、付加されているタイトル文字列長が長くなると、検
索キーワードや検索文字列との比較するデータ量が膨大
となり、検索処理に時間がかかるという問題があった。
【0007】なお、特開平4−86947号で明らかに
されている画像情報検索装置は、既に記憶された画像に
付加されている分類情報の再見直しを行うものであり、
検索速度向上を目的としたものではない。
【0008】そこで、特開平4−90054号のように
キーワードを番号順にいくつかのグループに分け、検索
情報より少ないビット数のグループキーワードを用いて
検索速度の向上を図るものがあるが、キーワードをグル
ープ化する際、単にキーワード番号のみを用いているた
め、グループキーワードを用いた第1次検索結果は、第
2次検索対象となる画像数を絞り込むためにしか利用で
きなかった。
【0009】
【発明が解決しようとする課題】上記したように、従来
は管理される画像データ数が多くなったり、画像データ
に付加されているキーワードの数が増えたり、付加され
ているタイトル文字列長が長くなると、検索キーワード
や検索文字列との比較するデータ量が膨大となり、検索
処理に時間がかかるという問題があった。また、検索速
度の向上を図る目的でキーワードをグループ化する場
合、キーワード番号のみを用いるグループキーワードを
用いた第1次検索結果は、第2次検索対象となる画像数
を絞り込むためにしか利用できないという問題があっ
た。そこで、この発明は、検索処理の高速化を図り、効
率の良い画像情報の検索を行うことのできる電子ファイ
リング装置を提供することを目的とする。
【0010】
【課題を解決するための手段】この発明の電子ファイリ
ング装置は、画像個々に対応した各画像を検索するため
の複数のキーワードからなる検索情報を記憶する第1の
記憶手段と、この第1の記憶手段に記憶された検索情報
のキーワード間の類似度を算出する類似度算出手段と、
この類似度算出手段で算出された類似度の高いキーワー
ドを同じグループにグループ化するグループ分割手段
と、このグループ分割手段でグループ化された各グルー
プに対してグループキーワードを生成する生成手段と、
上記第1の記憶手段に記憶されている検索情報の複数の
キーワードから、上記生成手段を用いて生成されるグル
ープキーワードを各画像に対応して記憶する第2の記憶
手段と、検索用のキーワードを入力する入力手段と、こ
の入力手段により入力されたキーワードから上記生成手
段を用いて生成されるグループキーワードで、上記第2
の記憶手段に記憶されている各グループキーワードを順
次比較することにより、グループを単位としたキーワー
ドが含まれる画像を抽出する第1の抽出手段と、この第
1の抽出手段により抽出された画像に対応して上記第1
の記憶手段に記憶されているキーワードを上記入力手段
により入力されたキーワードで順次比較することによ
り、そのキーワードが一致する画像を抽出する第2の抽
出手段と、この第2の抽出手段により抽出された画像、
または上記第1の抽出手段により抽出された画像のなか
から所望の画像を選択する選択手段とから構成されてい
る。
【0011】
【作用】この発明は、画像個々に対応した各画像を検索
するための複数のキーワードからなる検索情報を第1の
記憶手段に記憶し、記憶された検索情報のキーワード間
の類似度を算出し、算出された類似度の高いキーワード
を同じグループにグループ化し、グループ化された各グ
ループに対してグループキーワードを生成手段で生成
し、上記第1の記憶手段に記憶されている検索情報の複
数のキーワードから、上記生成手段を用いて生成される
グループキーワードを各画像に対応して第2の記憶手段
に記憶し、検索用のキーワードを入力し、入力されたキ
ーワードから上記生成手段を用いて生成されるグループ
キーワードで、上記第2の記憶手段に記憶されている各
グループキーワードを順次比較することにより、グルー
プを単位としたキーワードが含まれる画像を第1の抽出
手段で抽出し、抽出された画像に対応して上記第1の記
憶手段に記憶されているキーワードを上記入力手段によ
り入力されたキーワードで順次比較することにより、そ
のキーワードが一致する画像を第2の抽出手段で抽出
し、この第2の抽出手段により抽出された画像、または
上記第1の抽出手段により抽出された画像のなかから所
望の画像を選択するようにしたものである。
【0012】
【実施例】以下、この発明の一実施例について図面を参
照して説明する。
【0013】図1は、この発明の電子ファイリング装置
の構成例を示すものである。すなわち、電子ファイリン
グ装置は、制御モジュール10、メモリモジュール1
2、画像処理モジュール14、通信制御モジュール1
6、スキャナ装置18、光ディスク19並びに光ディス
ク装置20、キーボード23、CRTディスプレイ装置
24、プリンタ装置25、磁気ディスク26並びに磁気
ディスク装置27、マウス29、システムバス30、お
よび画像バス32によって構成されている。
【0014】制御モジュール10は、画像の記憶、検索
および編集処理等のための各種制御を行うCPU34、
および光ディスク装置20、磁気ディスク装置27とC
PU34を接続するインターフェース回路36から構成
されている。また、CPU34には、キーボード23お
よびマウス29が接続されている。
【0015】メモリモジュール12は、画像の記憶、検
索、編集等の各種制御プログラムおよび管理情報等を記
憶するメインメモリ38、画像の文字を認識する文字認
識部39、A4サイズの原稿数頁分の画像に対応する記
憶容量を有する画像メモリとしてのページメモリ40、
表示用インターフェースとしての表示メモリ42、およ
び表示制御部44などから構成されている。ページメモ
リ40の一部には、バッファメモリ領域40aが設けら
れている。ページメモリ40は、例えば光ディスク19
に記憶する画像や光ディスク19から読出された画像を
一時記憶するメモリである。
【0016】表示メモリ42は、CRTディスプレイ装
置24によって表示される画像を一時記憶するためのも
のである。この表示メモリ42には、CRTディスプレ
イ装置24における表示ウインドウ内に実際に表示され
る画像、たとえばページメモリ40からの画像、あるい
はバッファメモリ40aからの画像に対して、拡大、縮
小、回転、挿入または白黒反転等を施された画像が記憶
されるものである。表示制御部44は、CRTディスプ
レイ装置24の表示処理の制御等を行うものである。
【0017】上記画像処理モジュール14は、画像の拡
大、縮小処理を施す拡大縮小回路46、画像の回転処理
を行う縦横変換回路48、画像の圧縮(冗長度を少なく
する)を行う符号化処理を施しおよび伸長(少なくされ
た冗長度を元に戻す)を行う復号化処理を施す圧縮伸長
回路(CODEC)50、スキャナ装置18用のスキャ
ナインターフェース52、プリンタ装置25用のプリン
タインターフェース54、および拡大縮小回路46並び
に縦横変換回路48と、圧縮伸長回路50、スキャナイ
ンターフェース52、プリンタインターフェース54と
を接続する内部バス56によって構成されている。圧縮
伸長回路50は、MH(Modified Huffman)方式、あるい
はMR(ModifiedRead) 方式などを用いて、帯域圧縮、
あるいは帯域伸長が行われるものである。
【0018】通信制御モジュール16は、たとえばロー
カルエリアネットワーク(Local Area Network)に接続
されるBCP(Bus Communication Processor)等の通信イン
ターフェース58によって構成されている。また、通信
制御モジュール16には、FCP(ファクシミリ接続機
構)、パソコン等の外部機器とインターフェースを介し
て接続されるUCP (Universal Communication Processo
r) が設けられたものであってもよい。
【0019】システムバス30は、各種装置の制御信号
用のバスであり、制御モジュール10とメモリモジュー
ル12、画像処理モジュール14、通信制御モジュール
16とを接続するものである。また、画像バス32は画
像用のバスであり、メモリモジュール12と画像処理モ
ジュール14、通信制御モジュール16とを接続するも
のである。
【0020】スキャナ装置18はたとえば2次元走査装
置で、原稿(文書)上をレーザビーム光で2次元走査す
ることにより、原稿上の画像に応じた電気信号を得るも
のである。
【0021】光ディスク装置20は、スキャナ装置18
で読取られた画像を光ディスク19に順次記憶するもの
である。また、キーボード23等によって指定される検
索コードに対応した画像を光ディスク19から検索する
ものである。
【0022】キーボード23は、光ディスク19に記憶
する画像に対応する固有の検索コードおよび記憶、検
索、編集処理等の各種動作指令などを入力するものであ
る。またマウス29は、たとえばCRTディスプレイ装
置24の表示ウインドウ上に表示されるカーソル(図示
せず)を上下、左右方向に任意に移動させ、所望の位置
で指示を与えることにより、カーソルが位置している表
示内容(種々の動作モード、タイトルあるいは画像編集
のための領域指定またはアイコン等)を選択または指示
するものである。
【0023】CRTディスプレイ装置(陰極線管表示装
置)24は、スキャナ装置18で読取られた画像並びに
光ディスク19から検索された画像を表示するものであ
る。このCRTディスプレイ装置24の表示ウインドウ
上の上端、下端、右端にアイコン等が表示される。
【0024】プリンタ装置25は、スキャナ装置18で
読取られた画像、光ディスク19から検索された画像ま
たはCRTディスプレイ装置24で表示している画像を
印字出力(ハードコピー)するものである。
【0025】磁気ディスク装置27は、この磁気ディス
ク装置27に装着された磁気ディスク26に各種制御プ
ログラムを記憶するとともに、キーボード23から入力
された検索コードとこの検索コードに対応する画像が記
憶される光ディスク19上の記憶アドレス、画像サイ
ズ、検索頻度等からなる検索データ(検索情報)を記憶
するものである。
【0026】本実施例において、光ディスク19上に記
録されている画像データ(画像情報)は、図2に示す画
像管理テーブル1、図3に示す画像管理テーブル2、図
4に示すキーワード対応テーブル3、図5に示すキーワ
ード対応テーブル4とから管理されている。これらのテ
ーブルは、管理する光ディスク19毎に磁気ディスク2
6上に記録されている。
【0027】画像管理テーブル1は、画像データが記録
されている光ディスク19の名前と、記録されている総
画像データ数が記憶されている。図2に示される光ディ
スク19の名前は「1990年特許データ」であり、総
画像数は100件である。
【0028】図3に示す画像管理テーブル2は、画像デ
ータ(画像情報)毎に、画像No(画像番号)、画像サ
イズ、光ディスク19上のどこから画像が記録されてい
るかを示す光ディスク19上の先頭アドレスと、この画
像データに付加されているタイトル、10個のキーワー
ドNo、グループキーワードが記憶されている。
【0029】画像管理テーブル2のタイトルは、SJI
Sコードで表現し、100バイト分の領域が確保されて
おり、漢字2バイトコードの場合は最大50桁、ANK
1バイトコードの場合は最大100桁記憶することが可
能である。
【0030】画像管理テーブル2のキーワードNoは、
2バイト(16ビット)で表現され、「0」が設定され
ている場合はキーワードが設定されていないことを意味
することとする。最大で65535(2の16乗−1)
種類のキーワードを設定することが可能である。
【0031】画像管理テーブル2のグループキーワード
は、画像に付加されているキーワードのキーワードNo
から後述するグループキーワード計算処理により求めら
れる。グループキーワードは2バイト(16ビット)で
構成され、この画像データにどのグループのキーワード
が付加されているかを示している。
【0032】例えば、図3における画像No.1の画像
データは、画像のサイズがA4であり、光ディスク上の
0番地目から画像データが記憶されており、タイトルは
「電子ファイリング装置」なるSJIS文字列が付加さ
れており、キーワードはキーワードNo.1と2で示さ
れるものが付加されており、グループキーワードは「0
x0003」(16進数)となっている。図4に示すキ
ーワード対応テーブル3は、画像データに付加されてい
るキーワードの総種類数が記憶されている。
【0033】図5に示すキーワード対応テーブル4は、
キーワードNoと、これに対応するキーワード名と、こ
のキーワードが属するグループNoがキーワードNoの
総種類数分記憶されている。図4,図5において、キー
ワードの総種類数は50で、例えば、キーワードNo.
1のキーワード名は「光ディスク」、グループNoは
「0」である。
【0034】図6は、グループキーワードの構成を示し
たものである。本実施例ではキーワードを16個のグル
ープに分類してあり、グループキーワードは16ビット
(2バイト)長となり、グループNoは「0」から「1
5」までとしてグループNoをビット位置と対応させて
いる。なお、本発明は16個のグループに限定されるも
のではなく、要はグループキーワードを構成すれば良
い。次に、新たに画像データを登録する場合の処理につ
いて図7に示すフローチャートを参照して説明する。
【0035】まず、登録しようとする書類(文書)の原
稿をスキャナ装置18にセットし、キーボード23から
タイトルといくつかのキーワードを入力して登録を指示
する。CPU34は、メインメモリ38内にロードされ
ているプログラムに従って以下の処理を行なう。
【0036】スキャナ装置18で原稿を読取った画像デ
ータを、光ディスク装置20の光ディスク19の空領域
に書込む。次に、画像管理テーブル1内の総画像数に
「1」を加え、画像管理テーブル2に1行追加し、新た
に画像Noを割り当て、光ディスク19に書込んだ画像
サイズと書込んだ先頭アドレスをセットする。また、オ
ペレータから入力されたタイトルは画像管理テーブル2
にセットし、キーワード対応テーブル3,4を用いてオ
ペレータから入力されたキーワード名からキーワードN
oを求めて画像管理テーブル2にセットする。次に、オ
ペレータから入力されたキーワード名が新規のものであ
れば、CPU34は、以下の処理を行う。
【0037】キーワード対応テーブル3のキーワード総
種類数に「1」加え、キーワード対応テーブル4に1行
追加し、新しいキーワードNoを割り当て、キーワード
名をセットする。さらに、キーワード間の類似度を計算
し、グループ分割して各キーワードがどのグループに属
するかを決定する(グループ分割処理)。また、画像管
理テーブル2にセットされたキーワードNoからグルー
プキーワードを生成(後述するグループキーワード生成
処理)し、画像管理テーブル2にセットする。次に、C
PU34による新しいキーワードを追加する場合のグル
ープ分割処理について図8のフローチャートを参照して
説明する。
【0038】まず、図3に示す画像管理テーブル2を用
いて、すべての2個のキーワードの組合わせに対する共
出現頻度数を求め、最大である共出現度数を100とし
て度数を正規化する。共出現頻度数とは2個のキーワー
ドが共に付加されている画像数である。
【0039】図9は、すべての2個のキーワードの組合
わせに対する共出現頻度数を正規化した正規化共出現頻
度数テーブル5である。図9において、例えば、キーワ
ードNo.1と3の正規化共出現頻度数は70となって
いる。
【0040】次に、正規化共出現度数テーブル5の1行
目(キーワード1と類似度の高いもの)の値の中からあ
る値(たとえば50)を越える箇所を選択し、これらを
キーワード1と同じグループとして、キーワード対応テ
ーブル4を更新する。図9に示す例ではキーワード1と
キーワード3が同じグループとして設定される。上記処
理を各行に対して行い、キーワード対応テーブル4を更
新する。この際、グループ数が15を越える場合は、残
ったすべてのキーワードをグループ15とする。
【0041】なお、本発明は上記キーワード間の類似度
を求める方法に限らず、類義語辞書を用いたり、または
同じ単語がそれぞれ含まれるかどうかを調べて計算する
方法等を用いても良い。次に、CPU34によるグルー
プキーワード生成処理について図10のフローチャート
を参照して説明する。
【0042】まず、グループキーワードの全ビットをオ
フとし、入力された各キーワードNoに対応するキーワ
ード対応テーブル内のグループNoを求め、求められた
グループNoに対応するグループキーワード上のビット
をオンとする。
【0043】例えば、図2に示す画像管理テーブル2の
画像No1の画像データには、キーワードNo1、2が
付加されており、図5に示すキーワード対応テーブル4
からそれぞれグループNoは「0」と「1」であるの
で、前記グループキーワード生成処理により求められた
グループキーワード0x0003(16進数)がセット
される。
【0044】また、画像No3の画像データには、キー
ワードNo3、4が付加されており、キーワード対応テ
ーブル4からそれぞれグループNoは「0」と「1」で
あり、それぞれキーワードNo1、2と同じグループに
属するため、画像No1と同じグループキーワード0x
0003がセットされる。次に、本実施例における検索
時の処理について図11のフローチャートを参照して説
明する。
【0045】オペレータは、検索用のいくつかのキーワ
ードを入力し、キーワード検索を指示する。CPU34
は、メインメモリ38内にロードされているプログラム
に従って以下の処理を行なう。
【0046】まず、オペレータが入力したいくつかの検
索用のキーワード名からキーワード対応テーブル4を用
いてそれぞれキーワードNoを求め、これらのキーワー
ドNoから検索用のグループキーワードを求める。この
処理は上述したグループキーワード生成処理と同様であ
る。
【0047】ここで求めた検索用のグループキーワード
と画像管理テーブル2内の各画像データ毎のグループキ
ーワードとの論理積を求め、この結果が検索用のグルー
プキーワードと同じ値となる全ての画像データの画像N
oを一時的に記憶する。(第1次検索)
【0048】次に、一時的に記憶された画像Noに対し
て、画像管理テーブル2内のキーワードNoを読みだ
し、上記検索用のキーワードNoと一致するものが全て
含まれる画像データを選択する。(第2次検索) その後、オペレータの指示に従い、第1次または、第2
次検索処理で検索された画像をCRTディスプレイ装置
24に表示する。
【0049】例えば、オペレータが検索用のキーワード
として、「光ディスク」と「スキャナ」を入力した場
合、第1次検索時には画像No1、3の画像が検索さ
れ、第2次検索時には更に絞りこまれ、画像No1の画
像のみが検索される。この場合は、「光ディスク」と
「光ディスク装置」、「スキャナ」と「スキャナ装置」
がそれぞれ同じグループに属しているキーワード名だか
らである。次に、本実施例における検索処理時のCRT
ディスプレイ装置24の画面表示について説明する。
【0050】図12は、CRTディスプレイ装置24に
表示される検索処理時の初期画面を示すものである。初
期画面における左側は、検索条件設定領域61と、検索
結果の該当件数表示領域62,63とから構成される。
検索条件設定領域61にはキーボード23から設定され
たキーワードを表示し、該当件数表示領域62には第1
次検索結果の該当件数、該当件数表示領域63には第2
次検索結果の該当件数とが表示される。図12に示す例
では5個のキーワードが設定可能で、キーワード検索の
項目間and結果の件数が最後の行である領域62a,
63aにそれぞれ表示される。
【0051】初期画面における右側は、文書画像が表示
される領域64である。また、初期画面における下側
は、キーボード23のファンクションキーに対応した機
能キーで、F1キー65,F2キー66,F4キー6
7,F9キー68である。例えば、F1キー65を押し
た場合は、検索条件に設定されているキーワードから第
1次検索処理が実行され、その結果が該当件数表示領域
62に表示される。F2キー66を押した場合は、第1
次検索結果に対して第2次検索処理を実行し、該当件数
表示領域63に結果が表示される。F4キー67を押し
た場合は、図14または図15に示す検索結果画面に切
り替わる。F9キー68を押した場合は、検索処理が終
了する。
【0052】図13は、検索用のキーワードがオペレー
タにより設定され、第1次と第2次の検索処理が実行さ
れた後の検索条件の表示画面を示すものである。第1キ
ーワードとして「光ディスク」が設定され、キーワード
対応テーブル4を用いて求められた「光ディスク」のキ
ーワードの属するグループキーワードNoによる第1次
検索処理結果として「10」件が表示されている。第2
キーワード「スキャナ」に関しても同様に第1次検索結
果として「8」件が表示されている。
【0053】「光ディスク」のキーワードを設定した場
合は、同じグループに属する「光ディスク装置」のキー
ワードが付加されている文書も第1次検索で該当文書と
して抽出される。「スキャナ」に関しても同様に「スキ
ャナ装置」のキーワードの付加された文書も抽出され
る。そして「光ディスク」と「スキャナ」に対応するグ
ループキーワードがともに付加されている文書件数が項
目間and結果の領域62aに「4」件と表示されてい
る。これらの件数は各キーワードを設定し、F1キー6
5の入力後に処理されて表示される。
【0054】次にF2キー66を入力すると、第2次の
該当件数表示領域63に結果件数が表示される。この例
では、「光ディスク」のキーワードの付加されている文
書件数は「5」件で、「スキャナ」のキーワードの付加
されている文書件数は「3」件である。そして「光ディ
スク」と「スキャナ」のキーワードがともに付加されて
いる文書件数が項目間and結果の領域63aに「2」
件と表示される。
【0055】図14は、第1次検索結果の表示画面を示
すものである。左側の領域71には、第1次検索結果で
ある各文書画像のNo、タイトル、キーワードが表示さ
れている。右側の領域72は文書画像表示エリアであ
り、領域71の斜線部の「No.1」に対応する文書画
像が表示されている。
【0056】第1次検索結果の表示画面において、F1
キー73は第1次と第2次検索結果画面切り替え用のキ
ー、F2キー74とF3キー75は表示する文書画像選
択用のキー、F4キー76は検索条件画面に戻るための
キー、F5キー77は表示されている文書画像を印刷す
るためのキー、F9キー78は検索処理終了用のキーで
ある。
【0057】第1次検索結果の表示画面には、第1次検
索で抽出された4件の文書画像情報、つまり「光ディス
ク」または「光ディスク装置」のキーワードがついてい
て、かつ「スキャナ」または「スキャナ装置」のキーワ
ードがついている文書画像が表示されている。
【0058】図15は、第2次検索結果の表示画面を示
すものである。ここでは第1次検索で抽出された文書画
像の中から、「光ディスク」と「スキャナ」のキーワー
ドがついているもののみの2件の文書画像情報が表示さ
れている。
【0059】このようにグループキーワードによる第1
次検索結果およびキーワードによる第2次検索結果を表
示することにより、緩い条件での検索結果と指定キーワ
ードのみのついたきつい条件での検索結果を見比べるこ
とができ、オペレータの目的とする文書画像をより効率
的に検索することが可能となる。
【0060】例えば、第2次検索結果に目的とする文書
画像が含まれていない場合は、第1次検索結果を参照す
ることで目的とする文書画像を得ることができ、さらに
第1次検索結果で抽出された文書画像に付加されている
キーワードを用いて、より正確な検索条件を設定するこ
とも可能となる。
【0061】上記したように、キーワード間の類似度を
求め、この類似度の高いキーワードを同じグループに分
類し、画像を登録する際につけた個々のキーワードに対
応するグループを求め、グループに対応する位置のビッ
トをオンとし、他のビットはオフとした値を作成し、こ
れを画像のグループキーワードとして登録画像とペアで
記憶する。
【0062】キーワードを指定して検索する際、検索用
に指定した個々のキーワードからグループに対応するビ
ットをオンとした検索用のグループキーワードを求め、
画像記憶時に作成してある画像のグループキーワードと
検索用のグループキーワードとを比較し、グループ化さ
れた複数のキーワードを単位として検索対象となる候補
画像を抽出する(第1次検索処理)。
【0063】更に、抽出された候補画像に対して、従来
から行われているキーワードそのものを単位とした検索
(第2次検索処理)を行い、候補画像の中から所望する
画像を抽出するようにしたものである。すなわち、上記
実施例で説明したようにグループキーワードを2バイト
(16ビット)で表現した場合、キーワードは16のグ
ループに分類することになる。
【0064】例えば、総画像数を1000件とし、各画
像データに平均5個のキーワードが付加されているとす
ると、従来では1000件×5個×2バイトの1000
0バイト(約10KB)のデータを読みだし、比較しな
ければならなかった。
【0065】しかしながら本発明を適用した場合は、ま
ず1000件×2バイトの2000バイト(約2KB)
のデータを読みだし、グループキーワードによる第1次
の検索処理を行い、この処理で選択された画像データに
対してのみ、第2次のキーワード検索を行う。
【0066】ここで、第1次の検索処理でどの位の画像
データが選択されるかは、記録されている画像データの
キーワードのつきかた及び、キーワードがどのグループ
に分類されているかによって異なるが、上記の例では第
1次の検索で全体の80%以下の画像データが選択され
る場合、第1次,第2次での全比較データ量は従来のキ
ーワード検索より少なくなる。
【0067】例えば、第1次の検索で10%の画像デー
タが選択された場合、2000バイト(第1次検索)+
100件×5個×2バイト(第2次検索)の合計300
0バイトのデータを比較することになり、従来にくらべ
て比較データ量は約30%に減少することとなる。
【0068】このように、グループキーワードを用いて
粗く検索する処理をすることで、通常のキーワード検索
を行なう画像データ数を大幅に減少させることができ、
キーワード検索を高速化することが可能となる。
【0069】また、類似度の高いキーワードを同じグル
ープとして分類してあるので、第1次検索処理で得られ
る画像データは、オペレータが入力したキーワードと関
連の大きいキーワードが付加されているものとなり、第
1次及び第2次検索結果を使い分けることで、効率よく
希望する画像データを抽出することができる。
【0070】以上説明したように上記実施例によれば、
グループキーワードを用いて粗く検索する処理をするこ
とで、通常のキーワード検索を行なう画像データ数を大
幅に減少させることができ、キーワード検索を高速化す
ることが可能となる。
【0071】また、類似度の高いキーワードを同じグル
ープとして分類してあるので、第1次検索処理で得られ
る画像データは、オペレータが入力したキーワードと関
連の大きいキーワードが付加されているものとなり、第
1次及び第2次検索結果を使い分けることで効率よく希
望する画像データが抽出できるようになる。
【0072】
【発明の効果】以上詳述したようにこの発明によれば、
検索処理の高速化を図り、効率の良い画像情報の検索を
行うことのできる電子ファイリング装置を提供すること
ができる。
【図面の簡単な説明】
【図1】本発明の一実施例に係る電子ファイリング装置
の構成を概略的に示すブロック図。
【図2】画像管理テーブルを説明するための図。
【図3】画像管理テーブルを説明するための図。
【図4】キーワード対応テーブルを説明するための図。
【図5】キーワード対応テーブルを説明するための図。
【図6】グループキーワードの構成を説明するための
図。
【図7】画像データを登録する動作を説明するためのフ
ローチャート。
【図8】グループ分割処理の動作を説明するためのフロ
ーチャート。
【図9】正規化共出現頻度数テーブルを説明するための
図。
【図10】グループキーワード生成処理の動作を説明す
るためのフローチャート。
【図11】検索時の処理動作を説明するためのフローチ
ャート。
【図12】検索処理時の初期画面を説明するための図。
【図13】検索処理が実行された後の検索条件の表示画
面を説明するための図。
【図14】第1次検索結果の表示画面を説明するための
図。
【図15】第2次検索結果の表示画面を説明するための
図。
【符号の説明】
1,2…画像管理テーブル 3,4…キーワード対応テーブル 5…正規化共出現頻度数テーブル 18…スキャナ装置 19…光ディスク 23…キーボード 24…CRTディスプレイ装置 26…磁気ディスク 34…CPU 38…メインメモリ
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 210 G06F 17/30 170 G06F 17/30 320 JICSTファイル(JOIS)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 画像個々に対応した各画像を検索するた
    めの複数のキーワードからなる検索情報を記憶する第1
    の記憶手段と、 この第1の記憶手段に記憶された検索情報のキーワード
    間の類似度を算出する類似度算出手段と、 この類似度算出手段で算出された類似度の高いキーワー
    ドを同じグループにグループ化するグループ分割手段
    と、 このグループ分割手段でグループ化された各グループに
    対してグループキーワードを生成する生成手段と、 上記第1の記憶手段に記憶されている検索情報の複数の
    キーワードから、上記生成手段を用いて生成されるグル
    ープキーワードを各画像に対応して記憶する第2の記憶
    手段と、 検索用のキーワードを入力する入力手段と、 この入力手段により入力されたキーワードから上記生成
    手段を用いて生成されるグループキーワードで、上記第
    2の記憶手段に記憶されている各グループキーワードを
    順次比較することにより、グループを単位としたキーワ
    ードが含まれる画像を抽出する第1の抽出手段と、 この第1の抽出手段により抽出された画像に対応して上
    記第1の記憶手段に記憶されているキーワードを上記入
    力手段により入力されたキーワードで順次比較すること
    により、そのキーワードが一致する画像を抽出する第2
    の抽出手段と、 この第2の抽出手段により抽出された画像、または上記
    第1の抽出手段により抽出された画像のなかから所望の
    画像を選択する選択手段と、 を具備することを特徴とする電子ファイリング装置
JP03776193A 1993-02-26 1993-02-26 電子ファイリング装置 Expired - Fee Related JP3325326B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03776193A JP3325326B2 (ja) 1993-02-26 1993-02-26 電子ファイリング装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03776193A JP3325326B2 (ja) 1993-02-26 1993-02-26 電子ファイリング装置

Publications (2)

Publication Number Publication Date
JPH06251084A JPH06251084A (ja) 1994-09-09
JP3325326B2 true JP3325326B2 (ja) 2002-09-17

Family

ID=12506460

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03776193A Expired - Fee Related JP3325326B2 (ja) 1993-02-26 1993-02-26 電子ファイリング装置

Country Status (1)

Country Link
JP (1) JP3325326B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101174216B1 (ko) 2010-10-25 2012-08-14 엔에이치엔(주) 지역기반의 검색어를 추천하는 시스템 및 그 방법

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS613245A (ja) * 1984-06-15 1986-01-09 Toshiba Corp 情報整理装置
JPS6450167A (en) * 1987-08-19 1989-02-27 Nippon Telegraph & Telephone Simple sentence classifying system by semantic contents
JP2624969B2 (ja) * 1987-09-16 1997-06-25 マツダ株式会社 画像検索装置
JPH01239631A (ja) * 1988-03-18 1989-09-25 Nec Corp 電子化文書検索装置
JPH02235176A (ja) * 1989-03-09 1990-09-18 Ricoh Co Ltd 概念検索装置
JP2735866B2 (ja) * 1989-03-22 1998-04-02 日本放送協会 データベースのデータ検索方法

Also Published As

Publication number Publication date
JPH06251084A (ja) 1994-09-09

Similar Documents

Publication Publication Date Title
EP0293161B1 (en) Character processing system with spelling check function
US5546578A (en) Data base retrieval system utilizing stored vicinity feature values
JP2758826B2 (ja) 文書検索装置
US5367672A (en) Apparatus for retrieving data using the remainder of a hashed search key to identify a group of keys and comparing the key to the group of keys
JPH0512345A (ja) 画像記憶装置
JP3333549B2 (ja) 文書検索方式
KR20000069633A (ko) 파일 처리 방법, 데이터 처리 장치 및 기억 매체
US5588149A (en) Document classification and retrieval with title-based on-the-fly class merge
JP3325326B2 (ja) 電子ファイリング装置
JPH05101102A (ja) 検索装置
JPH09198404A (ja) 文書処理方法及び装置
US5265076A (en) Image retrieval apparatus using combination retrieval items
JPH0535801A (ja) 画像記憶検索装置
JP2865446B2 (ja) 文章処理装置
JPH05298368A (ja) 電子ファイリングシステムの検索語入力方法
JPH09114854A (ja) 文書検索システム
JPH07168849A (ja) 画像情報処理装置
JPH09265472A (ja) 画像データベースシステム
JPH0525139B2 (ja)
JPH0535840A (ja) 画像記憶装置
JP3312977B2 (ja) 画像記憶装置および画像記憶検索装置
JPH05274374A (ja) 画像検索装置
JPH07168844A (ja) 画像検索装置
JPH05274368A (ja) 画像記憶装置
JPH06149897A (ja) 電子ファイル装置の文書画像検索方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080705

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees