JPH1145252A - 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Info

Publication number
JPH1145252A
JPH1145252A JP9199612A JP19961297A JPH1145252A JP H1145252 A JPH1145252 A JP H1145252A JP 9199612 A JP9199612 A JP 9199612A JP 19961297 A JP19961297 A JP 19961297A JP H1145252 A JPH1145252 A JP H1145252A
Authority
JP
Japan
Prior art keywords
search
document
information
weight
range
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9199612A
Other languages
English (en)
Inventor
Atsushi Takato
淳 高藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JustSystems Corp
Original Assignee
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JustSystems Corp filed Critical JustSystems Corp
Priority to JP9199612A priority Critical patent/JPH1145252A/ja
Publication of JPH1145252A publication Critical patent/JPH1145252A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 文書の編集中にリアルタイムで必要な情報を
検索することができるようにし、検索処理の利便性の向
上を図ること。 【解決手段】 予め用意した文書の任意の範囲を指定
し、指定した範囲の文字列の構造を解析し、解析結果に
基づいて、指定された範囲の文字列を用いて検索条件を
生成して出力するクライアント100と、クライアント
100から検索条件を入力し、入力した検索条件に基づ
いて、転置ファイル102を用いた検索処理を実行し、
文書DB101中の該当する文書を検索する検索サーバ
103と、を備えている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書の編集中にリ
アルタイムで必要な情報を検索することができるように
し、検索処理の利便性の向上を図った情報検索装置およ
びその装置としてコンピュータを機能させるためのプロ
グラムを記録したコンピュータ読み取り可能な記録媒体
に関する。
【0002】
【従来の技術】コンピュータの発達に伴って、紙を媒体
として記録され、また保存されていた文書についても、
電子化された情報として取り扱うことが一般的となり、
大量の電子化された文書がデータベースに蓄積されるこ
ととなっている。
【0003】ところで、大量の電子化された文書が蓄積
されていくに従って、大量の文書の中から所望の文書を
容易に探し出すことができる検索技術が重要となってく
る。特に、誰もがコンピュータを用いて作業を行う今日
にあっては、特殊な手法を用いることなく、コンピュー
タの初心者であっても簡単に所望の文書を検索できるよ
うな検索システムを構築することが重要なポイントとな
る。
【0004】検索の容易化を図るための1つの手法とし
て、人間が通常用いる自然言語を用いてクエリー(Qu
ery)と呼ばれる検索文を入力することができるよう
にする技術を挙げることができる。この技術は、近年の
自然言語処理技術の発達に伴って、多くの検索システム
に取り入れられつつある。
【0005】
【発明が解決しようとする課題】しかしながら、従来の
検索システムによれば、自然言語でクエリーを入力でき
るようにして入力作業の容易化を図ることができるが、
ワードプロセッサ等で編集を行っている文書に関連する
情報を検索して参照したいような場合にあっては、検索
ソフトを別に起動させた後、クエリーを入力して検索処
理を行う必要があるため、操作が煩わしく、利便性に欠
けるという問題点があった。
【0006】本発明は上記に鑑みてなされたものであっ
て、文書の編集中にリアルタイムで必要な情報を検索す
ることができるようにし、検索処理の利便性の向上を図
ることを目的とする。
【0007】
【課題を解決するための手段】上記目的を達成するた
め、請求項1の情報検索装置は、任意の情報を検索する
ための検索条件に基づいて、該当する情報の検索処理を
行う検索手段を備えた情報検索装置において、画面表示
されている文書の任意の範囲を指定する範囲指定手段
と、前記範囲指定手段で指定された範囲の文字列の構造
を解析する解析手段と、前記解析手段による解析結果に
基づいて、前記指定された範囲の文字列を用いて前記検
索条件を生成する検索条件生成手段と、を備え、前記検
索手段が、前記検索条件生成手段で生成された検索条件
を入力し、前記検索処理を実行するものである。
【0008】また、請求項2の情報検索装置は、請求項
1に記載の情報検索装置において、前記範囲指定手段
が、前記文書の複数の範囲を指定することが可能である
ものである。
【0009】また、請求項3の情報検索装置は、請求項
2に記載の情報検索装置において、さらに、前記複数の
範囲に対して正または負の重み付けを指定する重み指定
手段を備えたものである。
【0010】また、請求項4の情報検索装置は、請求項
1〜3のいずれか1つに記載の情報検索装置において、
さらに、前記検索手段による検索結果を入力し、入力し
た検索結果から任意の情報を選択し、選択した情報に対
して正の重みまたは負の重みを指定する重み指定手段
と、前記重み指定手段を介して入力した重みの指定に基
づいて、該当する情報に正の重み付けまたは負の重み付
けを行う重み付け手段と、を備えたものである。
【0011】さらに、請求項5のコンピュータ読み取り
可能な記録媒体は、前記請求項1〜4のいずれか1つに
記載の情報検索装置の各手段としてコンピュータを機能
させるためのプログラムを記録したものである。
【0012】
【発明の実施の形態】以下、本発明の情報検索装置およ
びその装置としてコンピュータを機能させるためのプロ
グラムを記録したコンピュータ読み取り可能な記録媒体
の実施の形態について、添付の図面を参照しつつ詳細に
説明する。
【0013】〔実施の形態1〕図1は、実施の形態1の
情報検索装置のシステム構成図である。図1に示す情報
検索装置は、所望の文書を検索するための検索条件を出
力する複数のクライアント100と、文書DB(データ
ベース)101から転置ファイル102を生成すると共
に、ベクトル空間検索を行うことができる検索エンジン
(例えば、CLARITECH社のCLARIT等)を
備え、クライアント100から検索条件を入力し、入力
した検索条件に基づいて、転置ファイル102を用いて
該当する文書を検索する検索サーバ103と、上記クラ
イアント100や検索サーバ103等を接続するネット
ワーク104と、から構成されている。
【0014】図1において、文書DB101は、クライ
アント100等で作成された複数の文書(情報)を格納
したものであり、格納される文書は、ワープロ文書や、
SGML,HTML等の構造化文書等、いかなる種類の
文書であっても良い。実施の形態1においては、この文
書DB101中の文書を検索対象とするが、検索対象を
文書DB101中の文書に限定するものではない。
【0015】転置ファイル102は、文書DB101中
の複数の文書と、これら複数の文書それぞれから後述す
る方法で抽出した複数の索引語との関係を規定し、ある
索引語が各文書それぞれにおいてどの程度重要な語彙で
あるかをベクター表現を用いて示したものであって、こ
の索引語を用いて該当する文書を検索することができる
ようにしたものである。
【0016】具体的には、1つの文書を予め複数のセン
テンスからなるサブドキュメント単位に区切り、サブド
キュメントから上記索引語となる名詞句を抽出して、抽
出した名詞句それぞれについて、サブドキュメント中の
出現頻度,文書DB101全体における分布等の統計情
報を求め、求めた名詞句毎の統計情報を用いて各サブド
キュメントをベクター表現に変換する。そして、変換し
たサブドキュメントのベクター表現に基づいて、文書の
ベクター表現を生成する。転置ファイル102は、この
ようにしてベクター表現された文書DB101中の文書
を格納したものである。
【0017】なお、各索引語には、対応する文書中の重
要度に応じた重み付けを行うことができる。また、文書
のベクター表現については、実際の検索を行う際に、サ
ブドキュメントのベクター表現に基づいて生成すること
にしても良い。
【0018】クライアント100および検索サーバ10
3は、パーソナルコンピュータやワークステーション等
によって構成される。図2は、クライアント100の処
理を示す概略ブロック図である。クライアント100
は、ワードプロセッサ,表計算ソフト等のアプリケーシ
ョンプログラムで編集作業中の文書において、任意の範
囲を指定し、指定した範囲の文字列をクエリー200と
して検索の開始を指定するマウス等の入力装置207
と、クエリー200を入力し、入力したクエリー200
について、品詞情報等を格納した辞書202および各単
語の係り受け等を解析するための文法辞書203を用い
て形態素解析,構文解析等の解析処理を行い、上記転置
ファイル102の索引語に対応する名詞句からなる検索
条件206を生成し、生成した検索条件206を検索サ
ーバ103に出力する自然言語処理モジュール201を
備えている。
【0019】また、図3は、検索サーバ103の処理を
示す概略ブロック図である。検索サーバ103は、文書
DB101中の文書を転置ファイル102に登録する処
理と、ベクトル空間検索を利用した検索処理とを行うも
のである。
【0020】この検索サーバ103は、文書DB101
から文書を入力し、文書のフォーマットの認識処理や、
品詞情報等を格納した辞書301および各単語の係り受
け等を解析するための文法辞書302を用いて形態素解
析,構文解析,名詞句抽出等の解析処理を行い、上述し
たサブドキュメント毎の名詞句リストを含むドキュメン
ト・セット303を生成する自然言語処理モジュール3
00と、自然言語処理モジュール300で生成したドキ
ュメント・セット303を入力し、入力したドキュメン
ト・セット303中の各サブドキュメントをベクター表
現に変換すると共に、サブドキュメントのベクター表現
に基づいて、文書のベクター表現を生成して転置ファイ
ル102に登録するデータベース・ビルド・コンポーネ
ント304と、クライアント100から検索条件206
を入力し、入力した検索条件206を構成する各名詞句
について、クエリー200中の出現頻度,文書DB10
1全体における分布等の統計情報を求め、求めた統計情
報を用いて検索条件206をベクター表現に変換したク
エリー・ドキュメント306を生成するクエリー・ビル
ド・コンポーネント305と、クエリー・ビルド・コン
ポーネント305で生成したクエリー・ドキュメント3
06を入力し、転置ファイル102中の各文書のベクト
ルとクエリー・ドキュメント306のベクトルとを比較
して、クエリー・ドキュメント306との類似度に応じ
たスコアを各文書に付与し、所定の閾値を超えるスコア
が付与された文書リスト308を検索結果として出力す
る検索エンジン307と、を備えている。
【0021】なお、図1においては、文書DB101お
よび転置ファイル102をネットワーク104に単独に
接続した構成を示したが、これらを検索サーバ103に
直接接続する構成としても良い。また、図1において
は、実施の形態1の情報検索装置をネットワーク104
を介したシステムで構成するように示したが、図2に示
したクライアント100の処理を図3に示した検索サー
バ103の自然言語処理モジュール300に行わせるよ
うに構成することにより、1台のコンピュータで実施の
形態1の情報検索装置を構成することができる。
【0022】次に、上述した構成を備えた情報検索装置
の動作について、(1)転置ファイルの生成処理,
(2)文書検索処理の順で詳細に説明する。
【0023】(1)転置ファイルの生成処理 図4は、転置ファイルの生成処理を示すフローチャート
である。検索サーバ103は、クライアント100等に
よって作成された新たな文書が文書DB101に登録さ
れた場合(S401)、この文書を入力して転置ファイ
ル102に登録するための処理を開始する(S40
2)。
【0024】検索サーバ103において、自然言語処理
モジュール300は、ステップS402で入力した文書
を解析する処理を行う(S403)。具体的には、入力
した文書がワープロ文書,HTML等の構造化文書等、
いかなるフォーマットの文書であるかを判定する処理を
行う。その後、辞書301および文法辞書302を用い
て形態素解析,係り受け等の構文解析を行い、文書を複
数のサブドキュメントに区分すると共に、区分したサブ
ドキュメントから名詞句を抽出する等の処理を行う。
【0025】そして、自然言語処理モジュール300
は、ステップS403における処理の結果に基づいて、
サブドキュメント毎に名詞句リストを生成し、生成した
名詞句リストを含むドキュメント・セット303を生成
する(S404)。
【0026】その後、データベース・ビルド・コンポー
ネント304は、自然言語処理モジュール300で生成
したドキュメント・セット303を入力し、文書のベク
ター表現を生成して転置ファイル102に登録する処理
を行う(S405)。
【0027】具体的には、ドキュメント・セット303
中のサブドキュメントの各名詞句を転置ファイル102
の索引語として、サブドキュメント中の出現頻度,文書
DB101全体における分布等の統計情報を求め、求め
た名詞句毎の統計情報を用いてサブドキュメントをベク
ター表現に変換する。この処理をドキュメント・セット
303中の全てのサブドキュメントについて行い、変換
したサブドキュメントのベクター表現に基づいて、文書
のベクター表現を生成して転置ファイル102に登録す
る。
【0028】(2)文書検索処理 続いて、文書検索処理について説明する。図5は、文書
検索処理を示すフローチャートである。ユーザは、現在
ワードプロセッサ等で編集中の文書において、クライア
ント100の入力装置207を用いて任意の範囲を指定
し(S501)、指定した範囲の文字列をクエリー20
0とする検索処理の実行を指定する(S502)。
【0029】図6(a)は、ステップS501におい
て、クエリー200とする範囲の指定を行った様子を、
図6(b)は、検索処理の実行を指定する様子をそれぞ
れ示す説明図である。図6(a)に示すように、ユーザ
は、入力装置207としてのマウス等を用いて、文書6
00中の任意の範囲601を指定する。クエリー200
となる範囲601は、図6に示すように段落を単位とし
たもの以外に、全文書,ページ全体,エンベット,オブ
ジェクト,編集中の文書に関連づけられた文書,URL
等、いかなるものであっても良い。また、範囲601
は、1つだけではなく、複数の範囲を指定することがで
きる。複数の範囲が指定された場合には、指定された複
数の範囲を1つのクエリー200として扱うことにな
る。さらに、クエリー200となる範囲601を指定す
る際に、ユーザは、検索結果に反映して欲しい重要な事
項が記述された範囲601に正の重み付けを行うための
指定を行うことができ、また、検索結果に反映して欲し
くない不必要な事項が記述された範囲601に負の重み
付けを行うための指定を行うことができる。
【0030】そして、ユーザは、図6(b)に示すよう
に、入力装置207であるマウスの右ボタンをクリック
してメニュー602を開き、「検索」を選択することに
よって検索処理の実行を指定する。ここでは、図6
(b)に示すようにメニュー602を開いて検索処理の
実行を指定することにしたが、検索処理の実行を指定す
るためのアイコンを用意しておくことにしても良い。
【0031】図5に戻り、ステップS502で検索処理
の実行が指定されると、自然言語処理モジュール201
は、指定された範囲601の文字列をクエリー200と
して入力し、入力したクエリー200の解析処理を行う
(S503)。具体的には、辞書202および文法辞書
203を用いて形態素解析,係り受け等の構文解析処理
を行う。
【0032】自然言語処理モジュール201は、ステッ
プS503における解析結果に基づいて、クエリー20
0から検索条件を生成する(S504)。すなわち、自
然言語モジュール201は、指定された範囲601の文
字列から、転置ファイル102中の索引語に対応する名
詞句を抽出し、名詞句からなる検索条件206を生成す
る。
【0033】上述したようにしてクエリー200から検
索条件206が生成され、生成された検索条件206
は、クライアント100から検索サーバ103に出力さ
れる。また、上述したように、選択した範囲601に重
みの指定がなされた場合には、その重み指定情報につい
ても、検索サーバ103に出力される。
【0034】その後、検索サーバ103のクエリー・ビ
ルド・コンポーネント305は、クライアント100か
ら検索条件206を入力し、入力した検索条件206を
構成する各名詞句について、クエリー200中の出現頻
度,文書DB101全体における分布等の統計情報を求
め、求めた統計情報を用いて検索条件206をベクター
表現に変換したクエリー・ドキュメント306を生成す
る(S505)。なお、重み付けの指定がなされている
場合には、該当する名詞句に正の重みまたは負の重みを
付加して上記クエリー・ドキュメント306を生成す
る。
【0035】検索エンジン307は、クエリー・ビルド
・コンポーネント305で生成したクエリー・ドキュメ
ント306を入力し、転置ファイル102中の各文書の
ベクトルとクエリー・ドキュメント306のベクトルを
比較して、クエリー・ドキュメント306との類似度に
応じたスコアを各文書に付与する(S506)。
【0036】なお、類似度に応じたスコアは、各文書と
クエリー・ドキュメント306との類似度を余弦距離に
基づいて表現したものであり、スコアが大きい文書がよ
りクエリー・ドキュメント306と類似していることを
表している。また、ユーザによって指定された重みは、
この検索処理で利用され、スコアの値に反映されること
になる。
【0037】そして、検索エンジン307は、予め設定
されたスコアの閾値に基づいて、閾値を超えるスコアが
付与された文書を選択すると共に、選択した文書に基づ
いて、文書リスト308を生成して検索結果として出力
する(S507)。なお、この文書リスト308は、ク
エリー・ドキュメント306との類似度、即ちスコアが
大きい文書から順に並べたものである。
【0038】その後、検索エンジン307から出力され
た文書リスト308は、クライアント100に画面表示
される。クライアント100のユーザは、画面表示され
た文書リスト308から任意の文書を選択することによ
り、文書DB101中の該当する文書を画面表示させる
ことができる。そして、ユーザは、この文書から必要な
記載を編集中の文書にコピーしたりすることができる。
したがって、編集中の文書に引用文や注釈文を挿入した
いような場合に、実施の形態1の情報検索装置を便利に
利用することができる。
【0039】また、クライアント100は、文書リスト
308を入力すると、アプリケーションプログラムを起
動させて、文書リスト308に挙げられた文書を画面表
示することもできる。すなわち、クライアント100
は、文書リスト308中の文書の形式に適応するアプリ
ケーションプログラム(該当する文書を作成する際に用
いたアプリケーションプログラム)を選択し、選択した
アプリケーションプログラムを用いて該当する文書を画
面表示する。
【0040】図7は、検索された文書をアプリケーショ
ンプログラムを起動させて表示した様子を示す説明図で
ある。図7において、700はフローティングボタンを
示し、このフローティングボタン700には、次の文書
を表示するための次文書ボタン701,前の文書を表示
するための前文書ボタン702および前述した検索処理
の実行を指定するための検索実行ボタン703が設けら
れている。
【0041】検索エンジン103から出力された文書リ
スト308は、ユーザがクエリー200として指定した
範囲の文字列に最も類似した文書から順に並べたもので
あるため、次文書ボタン701をマウス等でクリックす
ると、現在表示されている文書の次に類似度の高い文書
を表示することができる。一方、前文書ボタン702を
マウス等でクリックすると、現在表示されている文書よ
り類似度の高い文書を表示することができる。
【0042】なお、図7に示すフローティングボタン7
00を表示した状態で文書中の任意の範囲を指定し、検
索実行ボタン703をクリックすることにより、上述し
た検索処理,アプリケーションプログラムによる文書の
表示処理が自動的に実行される。
【0043】このように、実施の形態1の情報検索装置
によれば、編集中の文書の任意の範囲601を選択し、
選択した範囲601をクエリー200として検索処理を
行うことができるため、検索ソフトを起動させ、クエリ
ー200を新たに入力するという手間を省くことがで
き、検索処理の利便性の向上を図ることができる。ま
た、編集作業中の文書に関連する事項を検索して参照し
たい場合に、文書中の該当する範囲を指定し、検索処理
の実行を指定するだけで、容易に参照文献を得ることが
できる。さらに、画面表示されている文書を直接クエリ
ー200として用いることができるため、検索のための
操作を直感的にかつ容易に行うことができる。
【0044】なお、図5を用いて説明したようにして検
索した結果をさらなる検索対象とし、文書600中の任
意の範囲を指定して、検索結果の絞り込みを行うことが
できる。
【0045】また、マウス等で文書600をドラッグし
ながらクエリー200となる範囲601を増加させつつ
検索処理を行うこともできる。すなわち、検索結果を参
照しつつ、クエリー200を変化させ、変更されたクエ
リー200に対する検索結果をリアルタイムで得ること
ができるように構成することもできる。
【0046】さらに、実施の形態1においては、ベクト
ル空間法による検索を例にとって説明したが、クエリー
200を解析した結果を用いて、ANDやORで検索条
件206を表現することにより、ブーリアン検索も行う
ことができる。
【0047】〔実施の形態2〕上述した実施の形態1の
情報検索装置で得た検索結果である文書リスト308に
おいて、ユーザが検索結果としてふさわしいと思う文書
やふさわしくないと思う文書については、その結果を検
索サーバ103にフィードバックすることができる。こ
の処理を適合性フィードバックと定義する。
【0048】図8は、この適合性フィードバックを説明
する説明図であり、この図8は、図2および図3にそれ
ぞれ示したクライアント100および検索サーバ103
の構成を一つの図にまとめて示したものである。
【0049】実施の形態1で説明したように、ユーザか
らの検索要求であるクエリー200に応じて、検索エン
ジン307で検索処理を行った結果が文書リスト308
という形で出力される。ユーザは、検索結果の評価とし
て、文書リスト308から任意の文書を選択し、選択し
た文書に対して正の重み付けまたは負の重みを付与する
ための指示を入力装置207を介して入力する。
【0050】すなわち、ユーザは、検索結果としてふさ
わしいと思う文書に対して、正の重み、例えば「+」を
指定することができ、検索結果としてふさわしくないと
思う文書に対して負の重み、例えば「−」を指定するこ
とができる。
【0051】ユーザによって指定された重みは、入力装
置207を介してデータベース・ビルド・コンポーネン
ト304に入力される。データベース・ビルド・コンポ
ーネント304は、入力した重みが正の指定である場合
には、転置ファイル102中の該当する文書の重みを強
化し、入力した重みが負の指定である場合には、文書の
重みを弱める処理を行う。
【0052】ユーザの評価に基づいて、転置ファイル1
02中の文書の重みを変更した結果は、次回からの検索
処理に反映される。このように、ユーザの検索結果に対
する評価をフィードバックする適合性フィードバック処
理を行うように構成することにより、ユーザの検索結果
に対する評価を次回からの検索処理に反映することがで
きるため、検索処理を重ねる毎に、より適切な検索結果
を得ることができるようになる。
【0053】なお、実施の形態2で説明した適合性フィ
ードバック処理は、実施の形態1で説明した情報検索装
置、即ち、文書中の指定した範囲をクエリー200とす
る情報検索装置に限らず、クエリー200をユーザが直
接入力するタイプの情報検索装置にも適用可能であるこ
とはいうまでもない。
【0054】さらに、実施の形態1および2で説明した
情報検索装置は、予め用意されたプログラムをコンピュ
ータやワークステーションで実行することによって実現
される。このプログラムは、ハードディスク,フロッピ
ーディスク,CD−ROM,MO,DVD等のコンピュ
ータで読み取り可能な記録媒体に記録され、コンピュー
タによって記録媒体から読み出されることによって実行
される。また、このプログラムは、上記記録媒体を介し
て、またはネットワークを介して配布することができ
る。
【0055】
【発明の効果】以上説明したように、本発明の情報検索
装置(請求項1)によれば、予め用意した文書の任意の
範囲を指定する範囲指定手段と、範囲指定手段で指定さ
れた範囲の文字列の構造を解析する解析手段と、解析手
段による解析結果に基づいて、指定された範囲の文字列
を用いて検索条件を生成する検索条件生成手段と、を備
え、検索手段は、検索条件生成手段で生成された検索条
件を入力し、検索処理を実行するため、ワードプロセッ
サ等で編集中の文書の任意の範囲を指定し、指定した範
囲をクエリーとして検索処理を実行することができる。
したがって、編集中の文書に関連する情報をリアルタイ
ムで検索することができるため、検索処理の利便性の向
上を図ることができる。
【0056】また、本発明の情報検索装置(請求項2)
によれば、請求項1に記載の情報検索装置において、範
囲指定手段は、文書の複数の範囲を指定することが可能
であるため、ユーザが希望する条件で検索処理を行うこ
とができる。
【0057】また、本発明の情報検索装置(請求項3)
によれば、請求項2に記載の情報検索装置において、さ
らに、複数の範囲に対して正または負の重み付けを指定
する重み指定手段を備えたため、ユーザが希望する検索
結果を容易に得ることができる。
【0058】また、本発明の情報検索装置(請求項4)
によれば、請求項1〜3のいずれか1つに記載の情報検
索装置において、さらに、前記検索手段による検索結果
を入力し、入力した検索結果から任意の情報を選択し、
選択した情報に対して正の重みまたは負の重みを指定す
る重み指定手段と、前記重み指定手段を介して入力した
重みの指定に基づいて、該当する情報に正の重み付けま
たは負の重み付けを行う重み付け手段と、を備えたた
め、ユーザの検索結果に対する評価を次回からの検索処
理に反映することができ、検索処理を重ねる毎に、より
適切な検索結果を得ることができるようにすることがで
きる。
【0059】さらに、本発明のコンピュータ読み取り可
能な記録媒体(請求項5)によれば、請求項1〜4のい
ずれか1つに記載の情報検索装置の各手段としてコンピ
ュータを機能させるためのプログラムを記録したため、
記録したプログラムをコンピュータに実行させることに
より、ワードプロセッサ等で編集中の文書の任意の範囲
を指定し、指定した範囲をクエリーとして検索処理を実
行することができる情報検索装置を得ることができる。
したがって、編集中の文書に関連する情報を検索する場
合等における検索処理の利便性の向上を図ることができ
る。
【図面の簡単な説明】
【図1】実施の形態1の情報検索装置のシステム構成図
である。
【図2】図1に示したクライアントの処理を示す概略ブ
ロック図である。
【図3】図1に示した検索サーバの処理を示す概略ブロ
ック図である。
【図4】実施の形態1の情報検索装置において、転置フ
ァイルの生成処理を示すフローチャートである。
【図5】実施の形態1の情報検索装置において、文書検
索処理を示すフローチャートである。
【図6】実施の形態1の情報検索装置において、(a)
は、クエリーとする範囲の指定を行った様子を、(b)
は、検索処理の実行を指定する様子をそれぞれ示す説明
図である。
【図7】実施の形態1の情報検索装置において、検索さ
れた文書をアプリケーションプログラムを起動させて表
示した様子を示す説明図である。
【図8】実施の形態2の情報検索装置において、適合性
フィードバックを説明する説明図である。
【符号の説明】
100 クライアント 101 文書DB 102 転置ファイル 103 検索サーバ 104 ネットワーク 200 クエリー 201,300 自然言語処理モジュール 202,301 辞書 203,302 文法辞書 206 検索条件 207 入力装置 303 ドキュメント・セット 304 データベース・ビルド・コンポーネント 305 クエリー・ビルド・コンポーネント 306 クエリー・ドキュメント 307 検索エンジン 308 文書リスト 600 文書 601 範囲 602 メニュー 700 フローティングボタン 701 次文書ボタン 702 前文書ボタン 703 検索実行ボタン

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 任意の情報を検索するための検索条件に
    基づいて、該当する情報の検索処理を行う検索手段を備
    えた情報検索装置において、 画面表示されている文書の任意の範囲を指定する範囲指
    定手段と、 前記範囲指定手段で指定された範囲の文字列の構造を解
    析する解析手段と、 前記解析手段による解析結果に基づいて、前記指定され
    た範囲の文字列を用いて前記検索条件を生成する検索条
    件生成手段と、を備え、 前記検索手段は、前記検索条件生成手段で生成された検
    索条件を入力し、前記検索処理を実行することを特徴と
    する情報検索装置。
  2. 【請求項2】 前記範囲指定手段は、前記文書の複数の
    範囲を指定することが可能であることを特徴とする請求
    項1に記載の情報検索装置。
  3. 【請求項3】 さらに、前記複数の範囲に対して正また
    は負の重み付けを指定する重み指定手段を備えたことを
    特徴とする請求項2に記載の情報検索装置。
  4. 【請求項4】 さらに、前記検索手段による検索結果を
    入力し、入力した検索結果から任意の情報を選択し、選
    択した情報に対して正の重みまたは負の重みを指定する
    重み指定手段と、 前記重み指定手段を介して入力した重みの指定に基づい
    て、該当する情報に正の重み付けまたは負の重み付けを
    行う重み付け手段と、 を備えたことを特徴とする請求項1〜3のいずれか1つ
    に記載の情報検索装置。
  5. 【請求項5】 前記請求項1〜4のいずれか1つに記載
    の情報検索装置の各手段としてコンピュータを機能させ
    るためのプログラムを記録したことを特徴とするコンピ
    ュータ読み取り可能な記録媒体。
JP9199612A 1997-07-25 1997-07-25 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 Pending JPH1145252A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9199612A JPH1145252A (ja) 1997-07-25 1997-07-25 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9199612A JPH1145252A (ja) 1997-07-25 1997-07-25 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (1)

Publication Number Publication Date
JPH1145252A true JPH1145252A (ja) 1999-02-16

Family

ID=16410761

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9199612A Pending JPH1145252A (ja) 1997-07-25 1997-07-25 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JPH1145252A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002197104A (ja) * 2000-12-27 2002-07-12 Communication Research Laboratory 情報検索処理装置,情報検索処理方法および情報検索処理プログラムを記録した記録媒体
JP2007102767A (ja) * 2005-09-07 2007-04-19 Ricoh Co Ltd 情報処理装置
JP2007164788A (ja) * 2005-12-12 2007-06-28 Fuji Xerox Co Ltd 関連情報決定方法及び装置並びにプログラム
JP2010211664A (ja) * 2009-03-12 2010-09-24 Toshiba Corp 検索を支援する装置、方法およびプログラム
JP2011138242A (ja) * 2009-12-28 2011-07-14 Hitachi-Ge Nuclear Energy Ltd 情報参照支援システム
JP2012038333A (ja) * 2005-09-07 2012-02-23 Ricoh Co Ltd 情報処理装置
JP2013200800A (ja) * 2012-03-26 2013-10-03 Dainippon Printing Co Ltd 関連情報提示装置、関連情報提示システム、関連情報提示方法、およびプログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS617936A (ja) * 1984-06-22 1986-01-14 Hitachi Ltd 情報検索方式
JPH05257986A (ja) * 1992-03-13 1993-10-08 Matsushita Electric Ind Co Ltd 文字列検索装置
JPH08263517A (ja) * 1995-03-28 1996-10-11 Atr Onsei Honyaku Tsushin Kenkyusho:Kk 並列テキスト検索システム
JPH09101969A (ja) * 1995-10-06 1997-04-15 Nippon Telegr & Teleph Corp <Ntt> 適合フィードバックを用いた全文検索方法および装置
JPH09153061A (ja) * 1995-11-30 1997-06-10 Fujitsu Ltd 文書検索装置および方法
JPH09153060A (ja) * 1995-11-30 1997-06-10 Matsushita Electric Ind Co Ltd 情報検索方法およびその装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS617936A (ja) * 1984-06-22 1986-01-14 Hitachi Ltd 情報検索方式
JPH05257986A (ja) * 1992-03-13 1993-10-08 Matsushita Electric Ind Co Ltd 文字列検索装置
JPH08263517A (ja) * 1995-03-28 1996-10-11 Atr Onsei Honyaku Tsushin Kenkyusho:Kk 並列テキスト検索システム
JPH09101969A (ja) * 1995-10-06 1997-04-15 Nippon Telegr & Teleph Corp <Ntt> 適合フィードバックを用いた全文検索方法および装置
JPH09153061A (ja) * 1995-11-30 1997-06-10 Fujitsu Ltd 文書検索装置および方法
JPH09153060A (ja) * 1995-11-30 1997-06-10 Matsushita Electric Ind Co Ltd 情報検索方法およびその装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002197104A (ja) * 2000-12-27 2002-07-12 Communication Research Laboratory 情報検索処理装置,情報検索処理方法および情報検索処理プログラムを記録した記録媒体
JP2007102767A (ja) * 2005-09-07 2007-04-19 Ricoh Co Ltd 情報処理装置
JP2012038333A (ja) * 2005-09-07 2012-02-23 Ricoh Co Ltd 情報処理装置
JP2007164788A (ja) * 2005-12-12 2007-06-28 Fuji Xerox Co Ltd 関連情報決定方法及び装置並びにプログラム
JP2010211664A (ja) * 2009-03-12 2010-09-24 Toshiba Corp 検索を支援する装置、方法およびプログラム
JP2011138242A (ja) * 2009-12-28 2011-07-14 Hitachi-Ge Nuclear Energy Ltd 情報参照支援システム
JP2013200800A (ja) * 2012-03-26 2013-10-03 Dainippon Printing Co Ltd 関連情報提示装置、関連情報提示システム、関連情報提示方法、およびプログラム

Similar Documents

Publication Publication Date Title
JP3691844B2 (ja) 文書処理方法
JP5744873B2 (ja) トラステッドクエリのシステムおよび方法
JP3266586B2 (ja) データ分析システム
JP2000029906A (ja) 文書情報管理システム
KR100403947B1 (ko) 개인용 전자문서를 생성하는 방법, 시스템 및 컴퓨터프로그램 제조물
JPH1145267A (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4065346B2 (ja) 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3767763B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1145252A (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4138048B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2003108584A (ja) 情報検索システム及びプログラム
JP4000332B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1145255A (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3851712B2 (ja) 文書管理システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1145254A (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1145269A (ja) 文書管理支援システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4384736B2 (ja) 画像検索装置およびその装置の各手段としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4426893B2 (ja) 文書検索方法、文書検索プログラムおよびこれを実行する文書検索装置
JPH1145249A (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4497337B2 (ja) 概念検索装置およびコンピュータプログラムを記録した記録媒体
JP2004220226A (ja) 検索文書のための文書分類方法及び装置
JP4085568B2 (ja) テキストマイニング方法およびテキストマイニング装置並びにコンピュータ読み取り可能な記憶媒体
JP4074687B2 (ja) 要約文作成支援システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH11126204A (ja) 速読支援方法、文書検索方法およびその装置
JP2006163645A (ja) 情報検索方法、情報検索装置、情報検索プログラム及びコンピュータで読み取り可能な記録媒体並びに記録した機器

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040721

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070704

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070724

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070925

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071106