JPH0728835A - 文書検索装置及びその方法 - Google Patents

文書検索装置及びその方法

Info

Publication number
JPH0728835A
JPH0728835A JP5173120A JP17312093A JPH0728835A JP H0728835 A JPH0728835 A JP H0728835A JP 5173120 A JP5173120 A JP 5173120A JP 17312093 A JP17312093 A JP 17312093A JP H0728835 A JPH0728835 A JP H0728835A
Authority
JP
Japan
Prior art keywords
search
document
character
sorting
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5173120A
Other languages
English (en)
Inventor
Yasuo Okuya
泰夫 奥谷
Shiro Ito
史朗 伊藤
Takanari Ueda
隆也 上田
Minoru Fujita
稔 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP5173120A priority Critical patent/JPH0728835A/ja
Publication of JPH0728835A publication Critical patent/JPH0728835A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 検索結果により、目的の文書を得やすくす
る。 【構成】 文書検索装置に、文書を記憶する対象文書保
持部2と、該対象文書保持部2に記憶された文書より検
索語を含む文書を検索するマッチング処理部3と、該マ
ッチング処理部3により検索された前記検索語を含む文
書より、該検索語に隣接する文字または文字列を抽出す
る接続文字獲得処理部4と、該接続文字獲得処理部4に
より抽出された文字または文字列に基づいて、前記マッ
チング処理部3による検索結果をソートするソーティン
グ処理部6と、該ソーティング処理部6によってソート
された検索結果を表示する検索結果表示部8とを具え
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書検索装置に関する
ものである。
【0002】
【従来の技術】一般に、文書検索装置では検索結果をデ
ィスプレイ上に表示することが通常である。しかしなが
ら従来のこの種の装置では、表示の際に全件数を羅列す
るようにしていた。
【0003】
【発明が解決しようとする課題】しかしながら、上記従
来の装置では、本当に検索意図に合致する文書を取り出
すためには、検索の結果得られた検索語を含む文書を検
索者が全て読む必要があるので、検索結果が多い場合
は、かなりの労力を要するという欠点があった。
【0004】
【課題を解決するための手段】上記課題を解決するため
に、本発明の文書検索装置は、文書を記憶する文書記憶
手段と、該文書記憶手段に記憶された文書より検索語を
含む文書を検索する検索手段と、該検索手段により検索
された前記検索語を含む文書より、該検索語に隣接する
文字または文字列を抽出する抽出手段と、該抽出手段に
より抽出された文字または文字列に基づいて、前記検索
手段により検索結果をソートするソート手段と、該ソー
ト手段によってソートされた検索結果を表示する表示手
段とを具える。
【0005】また、本発明の他の態様によれば、文書フ
ァイルに記憶された文書より検索語を含む文書を検索
し、該検索により検索された前記検索語を含む文書よ
り、該検索語に隣接する文字または文字列を抽出し、該
抽出により抽出された文字または文字列に基づいて、前
記検索による検索結果をソートし、該ソートによってソ
ートされた検索結果を表示することを特徴とする。
【0006】
【作用】上記文書検索装置は、文書記憶手段に記憶され
た文書より検索語を含む文書を検索手段により検索し、
該検索手段により検索された前記検索語を含む文書よ
り、該検索語に隣接する文字または文字列を抽出手段に
より抽出し、該抽出手段により抽出された文字または文
字列に基づいて、前記検索手段による検索結果をソート
手段によってソートし、ソートされた検索結果を表示手
段で表示する。
【0007】また、上記文書検索方法によれば、文書フ
ァイルに記憶された文書より検索語を含む文書を検索
し、該検索により検索された前記検索語を含む文書よ
り、該検索語に隣接する文字または文字列を抽出し、該
抽出により抽出された文字または文字列に基づいて、前
記検索による検索結果をソートし、該ソートによってソ
ートされた検索結果を表示する。
【0008】
【実施例】以下、図面を参照して本発明を詳細に説明す
る。
【0009】図1は、本発明の一実施例に係る装置の構
成を示すブロック図である。同図において1は検索語を
保持する検索語保持部、2は全文検索の対象となる対象
文書を保持する対象文書保持部、3は検索語が文書に含
まれるかどうかのマッチングを行なうマッチング処理部
である。4はマッチングした時に文書から検索語に接続
する文字を獲得するための接続文字獲得処理部である。
5はマッチングした文書と接続文字を保持する文書・接
続文字保持部である。6は検索結果を接続文字について
ソーティングするソーティング処理部である。7はソー
ティング結果を保持するソーティング結果保持部であ
る。8はソーティング結果に従って検索結果を表示する
検索結果表示部である。
【0010】図2は本発明の実施例の構成を示す。ここ
で、21は制御メモリであり、図3のフローチャートに
示すような制御手順に従って制御プログラムを記憶す
る。22は制御メモリ21に保持されている制御手順に
従って判断・演算などを行なう中央処理装置である。2
3はメモリであり、検索語保持部1、文書・接続文字保
持部5、ソーティング結果保持部7を有している。24
はディスク装置であり、対象文書保持部2を有してい
る。25は検索語を入力したり、各種処理の実行を指示
するためのキーボード、26は検索結果表示部8となる
表示部である。27はバスである。
【0011】次に図3に示すフローチャートを参照し
て、本装置の動作を説明する。まず、ステップS1で
は、検索語が検索語保持部1に設定されているかどうか
の判定を行なう。検索語が設定されるまでステップS1
が繰り返される。検索語が検索語保持部1に設定される
とステップS2に移る。ステップS2では、マッチング
処理部3で対象文書保持部2から文書を取り出し、検索
語保持部1にある検索語と文書中の文字列とのマッチン
グを行なう。ステップS3では、マッチングの対象とな
る文書が残っているかどうかの判定を行なう。文書が残
っている場合には、次の文書と検索語のマッチングを行
なうためにステップS2が繰り返される。文書が残って
いない場合は、ステップS4に移る。ステップS4で
は、マッチした文書に対して、接続文字獲得処理部4で
検索語に続く接続文字の獲得を行なう。このとき、1つ
の文書の複数の位置に検索語が存在する場合は、そのす
べての接続文字を獲得する。獲得した接続文字とその文
書を文書・接続文字保持部5に保持して、ステップS5
に移る。ステップS5では、接続文字についてソーティ
ング処理部6を使って、検索結果のソーティングを行な
い、ソーティング結果をソーティング結果保持部7に保
持して、ステップS6に移る。結果のソーティングとは
接続文字ごとに検索結果を分類し、分類結果を件数が多
い順に並べる作業を指す。ステップS6では、検索結果
表示部8で、ソーティング結果に従って検索結果の表示
を行なう。例えば、検索語が対象文書に100回出現す
る場合、図6に示すように接続文字ごとに分類した表示
を行なう。検索結果の表示を行なったら終了する。
【0012】(他の実施例) 1.上記実施例では、マッチング処理部3と接続文字獲
得処理部4とが分離されている場合について説明した
が、これに限定されるものでなく、マッチング処理と同
時に接続文字の獲得処理を行なってもよいものである。
【0013】2.上記実施例では、検索語に後続する接
続文字について検索結果をソーティングする場合につい
て説明したが、これに限定されるものでなく、検索語の
前方に接続する文字などについて検索結果のソーティン
グを行なってもよいものである。
【0014】3.上記実施例では、接続文字を1文字と
した場合について説明したが、これに限定されるもので
なく、2文字以上の文字列や単語などについて検索結果
のソーティングを行なってもよいものである。
【0015】4.上記実施例では、1階の分類によって
表示をする場合について説明したが、これに限定される
ものでなく、ソーティング後もなお件数が多い場合に
は、あるしきい値を設定して、そのしきい値を越える場
合には他の分類要素を獲得することによりさらにソーテ
ィングを行ない細分類するのもよいものである。すなわ
ち、上記の他の実施例2や3を複数組み合わせることな
どにより、細分類するのもよいものである。この場合の
処理の流れを図4に示す。すなわち、図3のステップS
5までと同様にステップS23までを実行し、しきい値
を越えた分類については、ステップS25で再度文書に
戻るか、あるいはステップS22で獲得してあって未使
用の接続文字を取り出すことで、分類要素を獲得し、ス
テップS27で新たな分類要素についてソーティングし
た上で、ステップS27で結果を表示する。
【0016】5.上記実施例では、1種類についてのソ
ーティングを行なう場合について説明したが、これに限
定されるものでなく、数種類の分類要素による並列ソー
ティングなどをしてもよいものである。例えば図5のよ
うに、接続文字獲得処理部4に相当する分類要素獲得処
理部35、36を複数並べ、それぞれ並列に処理を行な
い、そして、各分類要素についてソーティング処理部3
7、38でソーティングを行ない、ソーティング結果統
合処理部41でソーティング結果の統合を行なう。図5
には、2つの分類要素を用いた場合のシステムの構成図
を示したが、3以上の分類要素について行なってもよ
い。
【0017】6.上記実施例では、ソーティング結果を
全て表示する場合について説明したが、これに限定され
るものでなく、分類結果が少数の場合はその他という項
目を別途設けてそこにまとめるなどもよいものである。
【0018】7.上記実施例では、ソーティング結果を
全て表示する場合について説明したが、これに限定され
るものでなく、上位数種をそれぞれ表示して、残りをそ
の他という項目を設けてそこにまとめるなどもよいもの
である。
【0019】8.上記実施例では、ソーティングが終わ
ってから結果の表示に移る場合について説明したが、こ
れに限定されるものでなく、ソーティング処理部6と検
索結果表示部8とを並列処理してもよいものである。
【0020】9.上記実施例では、マッチングとソーテ
ィングを逐次処理する場合について説明したが、これに
限定されるものでなく、マッチングとソーティングを並
列に処理することもよいものとする。
【0021】10.上記実施例では、全文をサーチして
検索を行なう場合について説明したが、これに限定され
るものでなく、文字列の位置を持ったインデックスを用
いた文書検索などの場合にもよいものとする。
【0022】
【発明の効果】以上説明したように、本発明によれば、
検索結果を検索語に続く接続文字についてソーティング
し、ソーティング結果に従って検索結果を表示するよう
にしたので、検索結果から検索意図に本当に合致する文
書を検索者が効率よく取り出すことができるという効果
が得られる。
【図面の簡単な説明】
【図1】本発明に係る文書処理装置の基本構成図であ
る。
【図2】本発明の実施例のシステム構成を示すブロック
図である。
【図3】本発明の実施例の検索処理手順を示す動作フロ
ーチャートである。
【図4】他の実施例の検索処理手順を示す動作フローチ
ャートである。
【図5】他の実施例のシステム構成を示すブロック図で
ある。
【図6】検索結果表示部の表示内容を説明する図であ
る。
【符号の説明】
1 検索語保持部 2 対象文書保持部 3 マッチング処理部 4 接続文字獲得処理部 5 文書・検索文字保持部 6 ソーティング処理部 7 ソーティング結果保持部 8 検索結果表示部 21 制御メモリ 22 中央処理装置 23 メモリ 24 ディスク装置 25 キーボード 26 表示部 27 バス 31 検索語保持部 32 対象文書保持部 33 マッチング処理部 34 マッチング結果保持部 35 分類要素1獲得処理部 36 分類要素2獲得処理部 37 ソーティング1処理部 38 ソーティング2処理部 39 ソーティング結果1保持部 40 ソーティング結果2保持部 41 ソーティング結果統合処理部 42 統合結果保持部 43 検索結果表示部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 藤田 稔 東京都大田区下丸子3丁目30番2号キヤノ ン株式会社内

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 文書を記憶する文書記憶手段と、 該文書記憶手段に記憶された文書より検索語を含む文書
    を検索する検索手段と、 該検索手段により検索された前記検索語を含む文書よ
    り、該検索語に隣接する文字または文字列を抽出する抽
    出手段と、 該抽出手段により抽出された文字または文字列に基づい
    て、前記検索手段により検索結果をソートするソート手
    段と、 該ソート手段によってソートされた検索結果を表示する
    表示手段とを具えたことを特徴とする情報検索装置。
  2. 【請求項2】 前記ソート手段によってソートされた特
    定の分類の件数が所定値を越える場合に、該特定の分類
    を、前記抽出手段により抽出される、前記ソートに用い
    た以外の文字または文字列に基づいて、再度ソートする
    ことを特徴とする請求項1記載の文書検索装置。
  3. 【請求項3】 文書ファイルに記憶された文書より検索
    語を含む文書を検索し、 該検索により検索された前記検索語を含む文書より、該
    検索語に隣接する文字または文字列を抽出し、 該抽出により抽出された文字または文字列に基づいて、
    前記検索による検索結果をソートし、 該ソートによってソートされた検索結果を表示すること
    を特徴とする文書検索方法。
JP5173120A 1993-07-13 1993-07-13 文書検索装置及びその方法 Pending JPH0728835A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5173120A JPH0728835A (ja) 1993-07-13 1993-07-13 文書検索装置及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5173120A JPH0728835A (ja) 1993-07-13 1993-07-13 文書検索装置及びその方法

Publications (1)

Publication Number Publication Date
JPH0728835A true JPH0728835A (ja) 1995-01-31

Family

ID=15954514

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5173120A Pending JPH0728835A (ja) 1993-07-13 1993-07-13 文書検索装置及びその方法

Country Status (1)

Country Link
JP (1) JPH0728835A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008518345A (ja) 2004-10-28 2008-05-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ データ処理システム及びデータ処理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008518345A (ja) 2004-10-28 2008-05-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ データ処理システム及びデータ処理方法

Similar Documents

Publication Publication Date Title
US20030227468A1 (en) Image processing apparatus, image processing method and program
US6308176B1 (en) Associating files of data
JPH04296989A (ja) 文字認識方法及び装置
JPH04281559A (ja) 文書検索装置
JPH08287086A (ja) 適合度順画像強調表示方法及び装置
JP2000020538A (ja) 情報検索方法、情報検索装置および情報検索プログラム記憶媒体
JPH0728835A (ja) 文書検索装置及びその方法
JP2005128872A (ja) 文書検索システム及び文書検索プログラム
JPH06124308A (ja) 情報整理処理装置
JPH1185794A (ja) 検索語入力装置および検索語入力プログラムを記録した記録媒体
JP3264252B2 (ja) 文書処理装置及び処理方法並びに制御プログラムを記録した記録媒体
JPH08305726A (ja) 情報検索装置
JP3678615B2 (ja) 文書検索装置及び文書検索方法
JP2735866B2 (ja) データベースのデータ検索方法
JPH10124524A (ja) 文書検索装置及び文書検索方法
JPH08305710A (ja) 文書のキーワード抽出方法及び文書検索装置
JPH07262199A (ja) 検索結果分類装置
JPH0514304B2 (ja)
JPH06348756A (ja) 索引作成装置及び索引利用装置
JP2006039811A (ja) ドキュメント管理プログラム、ドキュメント管理方法、及びドキュメント管理装置
JPH022458A (ja) 類似文書検索装置
JPH06309369A (ja) 情報検索装置
JP2003022276A (ja) 文書検索装置及び文書検索方法
JP2001306583A (ja) 生物分類学に基いて分類された生物種の同定を行なう同定システム及び、コンピュータシステムに生物分類学に基いて分類された生物種の同定を行なわせるためのコンピュータソフトウエアプログラム製品
JPH0528197A (ja) データベース処理装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20020402