JPH11110415A - 情報検索方法,情報検索システムおよび一組の文書から情報を検索するための命令を記録したコンピュータ読み取り可能な記録媒体 - Google Patents

情報検索方法,情報検索システムおよび一組の文書から情報を検索するための命令を記録したコンピュータ読み取り可能な記録媒体

Info

Publication number
JPH11110415A
JPH11110415A JP10140773A JP14077398A JPH11110415A JP H11110415 A JPH11110415 A JP H11110415A JP 10140773 A JP10140773 A JP 10140773A JP 14077398 A JP14077398 A JP 14077398A JP H11110415 A JPH11110415 A JP H11110415A
Authority
JP
Japan
Prior art keywords
sub
document
documents
query
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10140773A
Other languages
English (en)
Inventor
A Evans David
エイ.エバンズ デビッド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KURARITEC CORP
Original Assignee
KURARITEC CORP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KURARITEC CORP filed Critical KURARITEC CORP
Publication of JPH11110415A publication Critical patent/JPH11110415A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 文書の特定の部分を容易に検索することを可
能にすること。 【解決手段】 一組の文書に基づいて一組の副文書が設
定される(S102)。一組の副文書を対象として作用
するクエリーが処理され、各副文書に対してスコアを生
成する(S104)。各副文書のスコアは対応する副文
書のクエリーに対する関連性を示すものである。スコア
が検討され(S106)、最適な副文書が検索される
(S108)。最適な副文書はクエリーに対して最も高
い関連性を示すスコアを有している。ユーザの選択によ
り次に最適な副文書が検索される。副文書はスコア順で
ユーザに示される。また、最適なスコアの副文書を含ん
だ文書が表示され、その副文書の位置に自動的にスクロ
ールされる。ユーザの入力に基づいて文書は次に最適な
副文書の位置に自動的にスクロールされる。次に最適な
副文書が別の文書に含まれている場合は、その文書が自
動的にロードされる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は情報検索に関し、よ
り詳細には、ユーザのクエリー(query )に適合する副
文書(サブドキュメント:subdocument )を用いて情報
を検索する新規な方法および装置に関する。
【0002】
【従来の技術】特に分散型データベース上におけるコン
ピュータ・システムによってアクセス可能な大量の情報
が存在している今日、多くの情報検索システムは高度な
検索ツールを提供している。ある検索ツールは、ユーザ
に一組の目標文書上で動作するクエリーを条件として指
定することを可能にする。多くの場合、ユーザは一つま
たは複数の検索ターム(term)をAND,ORおよびN
OTのような論理演算子と組み合わせることによってク
エリーを構築する。そして、そのクエリーは、クエリー
を処理し、通常データベース上に蓄積されている一組の
目標文書上でクエリーを機能させるサーチエンジンと通
常呼ばれる検索プロセスに送られる。
【0003】クエリーが処理されると、通常「ヒット」
と呼ばれ、クエリーを満足する全文書がサーチエンジン
によって特定されてユーザに提示される。多数の文書が
クエリーを満足する場合、一般に追加的タームがクエリ
ーに追加され、扱いやすい数になるようにヒットした文
書の数を減らす処理が行われる。そして、ユーザは、検
索されて読み出されるべき一つまたは複数の特定された
文書を選択する。
【0004】選択された文書が検索されて読み出される
と、ユーザは、検索クエリーにおいて指定された情報の
場所を見つけるために文書を再検討することになる。多
数の文書が選択された場合または選択された1以上の文
書が大きい場合、それらの文書中のヒット個所を見つけ
るのはやっかいな作業となる場合がある。この問題を解
決するために、ある情報検索システムは、クエリーを再
実行して選択された文書中のヒット個所を含む部分を見
つけるためのローカル・サーチ・ユーティリティ(loca
l search utility)を提供している。
【0005】
【発明が解決しようとする課題】しかしながら、ローカ
ル・サーチ・ユーティリティは、選択された文書につい
て余分な検索を要求するものである。したがって、情報
を自動的に検索する必要性および文書レベルで情報を検
索することについての先行技術に基づく制約に鑑み、自
動的に情報を検索するための代替的手法の開発が強く望
まれている。
【0006】本発明は上記に鑑みてなされたものであっ
て、文書の特定の部分を容易に検索可能にすることを目
的とする。
【0007】
【課題を解決するための手段】副文書を用いて情報を検
索する手法について以下に説明する。最初に、一組の文
書に基づいて一組の副文書が設定される。つぎに、一組
の副文書を対象として作用するクエリーが処理され、各
副文書に関するスコアが生成される。各副文書に関する
スコアは、対応する副文書のクエリーとの関連性を示す
ものである。スコアが検討され、副文書およびクエリー
間の最も高い関連性を示すスコアを有する副文書が検索
される。
【0008】発明の別の側面によると、ユーザの選択に
応じて、副文書およびクエリー間でつぎに高い関連性を
示すスコアを有する副文書が検索される。それらの副文
書は、スコアに応じた順序でユーザに提示され得る。
【0009】発明の別の側面によると、副文書およびク
エリー間の最も高い関連性を示すスコアを有する副文書
を含む文書が表示され、副文書の位置に自動的にスクロ
ールされる。ユーザの入力に基づいて、文書は、副文書
のスコアに基づいて他の副文書に自動的にスクロールさ
れる。それらの副文書のいずれかが別の文書内に含まれ
ている場合、その文書が自動的にロードされる。
【0010】すなわち、上記目的を達成するため、請求
項1の情報検索方法は、一組の文書から情報を検索する
ための情報検索方法において、a)一組の文書に基づい
て、各副文書が一組の文書中の一文書全体より小さい部
分に相当するように一組の副文書を決定する工程と、
b)一組の副文書を対象として作用するクエリーを処理
し、各副文書に対するスコアを生成して、各スコアによ
り対応する副文書のクエリーに対する関連性を表現する
工程と、c)各副文書のスコアに基づいて1以上の副文
書を検索する工程と、を含むものである。
【0011】また、請求項2の情報検索方法は、請求項
1に記載の情報検索方法において、各副文書のスコアに
基づいて1以上の副文書を検索する工程が、第1の副文
書およびクエリー間の関連性が他の副文書およびクエリ
ー間の関連性より高いことを示す対応スコアを有する第
1の副文書を検索する工程を含むものである。
【0012】また、請求項3の情報検索方法は、請求項
2に記載の情報検索方法において、さらに、第2の副文
書およびクエリー間の関連性が第1の副文書およびクエ
リー間の関連性より低いこと,ならびに第2の副文書お
よびクエリー間の関連性が他の副文書およびクエリー間
の関連性より高いことの両方を示す対応スコアを有する
第2の副文書を検索する工程を含むものである。
【0013】また、請求項4の情報検索システムは、一
組の文書から情報を検索するコンピュータ・システムか
らなる情報検索システムにおいて、a)メモリと、b)
メモリに接続された1以上のプロセッサと、を備え、メ
モリが一組のコンピュータ命令を記憶し、一組のコンピ
ュータ命令が、1以上のプロセッサによって実行された
場合に、i)一組の文書に基づいて、各副文書が一組の
文書における一文書の少なくとも一部分に相当するよう
に一組の副文書を決定する工程と、ii)一組の副文書
を対象として作用するクエリーを処理し、各副文書に対
するスコアを生成して、各スコアにより対応する副文書
のクエリーに対する関連性を表現する工程と、iii)
各副文書のスコアに基づいて1以上の副文書を検索する
工程と、を1以上のプロセッサに実行させるものであ
る。
【0014】また、請求項5の情報検索システムは、請
求項4に記載の情報検索システムにおいて、各副文書の
スコアに基づいて1以上の副文書を検索する工程を実行
するためのコンピュータ命令が、第1の副文書およびク
エリー間の関連性が他の副文書およびクエリー間の関連
性より高いことを示す対応スコアを有する第1の副文書
を検索する工程を実行するためのコンピュータ命令を含
むものである。
【0015】また、請求項6の情報検索システムは、請
求項4に記載の情報検索システムにおいて、一組のコン
ピュータ命令が、さらに、第2の副文書およびクエリー
間の関連性が第1の副文書およびクエリー間の関連性よ
り低いこと,ならびに第2の副文書およびクエリー間の
関連性が他の副文書およびクエリー間の関連性より高い
ことの両方を示す対応スコアを有する第2の副文書を検
索する工程を実行するためのコンピュータ命令を含むも
のである。
【0016】また、請求項7の一組の文書から情報を検
索するための命令を記録したコンピュータ読み取り可能
な記録媒体は、一組の文書から情報を検索するための複
数の一連の命令を記録したコンピュータ読み取り可能な
記録媒体であって、複数の一連の命令は、1以上のプロ
セッサによって実行された場合に、a)一組の文書に基
づいて、各副文書が一組の文書中の一文書全体より小さ
い部分に相当するように一組の副文書を決定する工程
と、b)一組の副文書を対象として作用するクエリーを
処理し、各副文書に対するスコアを生成して、各スコア
により対応する副文書のクエリーに対する関連性を表現
する工程と、c)各副文書のスコアに基づいて1以上の
副文書を検索する工程と、を1以上のプロセッサに実行
させる一連の命令を含むものである。
【0017】また、請求項8の一組の文書から情報を検
索するための命令を記録したコンピュータ読み取り可能
な記録媒体は、請求項7に記載の一組の文書から情報を
検索するための命令を記録したコンピュータ読み取り可
能な記録媒体において、各副文書のスコアに基づいて1
以上の副文書を検索する工程が、第1の副文書およびク
エリー間の関連性が他の副文書およびクエリー間の関連
性より高いことを示す対応スコアを有する第1の副文書
を検索する工程を含むものである。
【0018】さらに、請求項9の一組の文書から情報を
検索するための命令を記録したコンピュータ読み取り可
能な記録媒体は、請求項8に記載の一組の文書から情報
を検索するための命令を記録したコンピュータ読み取り
可能な記録媒体において、コンピュータ読み取り可能な
記録媒体が、さらに、第2の副文書およびクエリー間の
関連性が第1の副文書およびクエリー間の関連性より低
いこと,ならびに第2の副文書およびクエリー間の関連
性が他の副文書およびクエリー間の関連性より高いこと
の両方を示す対応スコアを有する第2の副文書を検索す
る工程を実行するための命令を含むものである。
【0019】
【発明の実施の形態】以下、副文書を用いた本発明の情
報検索方法,情報検索システムおよび一組の文書から情
報を検索するための命令を記録したコンピュータ読み取
り可能な記録媒体の実施の形態について、添付の図面を
参照しつつ詳細に説明する。なお、ここでは、限定のた
めではなく例示のために本発明の実施の形態を図で示す
ことにし、これらの図において同一の構成要素には同一
の符号を付することにする。
【0020】また、説明のために行われる以下の説明に
おいては、本発明を完全に理解できるように具体的な詳
細について述べることにする。しかしながら、本発明が
これら特定詳細事項なしでも実施できることは明白であ
ろう。他の例は、不必要に発明を曖昧にすることを避け
るため、良く知られた構造および装置をブロック図の形
式で示すことにする。
【0021】(1)機能的概要 一般に、本発明による情報検索のための方法は、一組の
副文書を対象として作用し、クエリーとどの程度関連し
ているかに基づいて各副文書にスコアをつけるクエリー
を処理するステップを含んでいる。各副文書は、ある文
書の少なくとも一部分を示すものである。
【0022】この方法は、図1の概略フローチャートに
示されている。ステップS100においてスタートした
後、ステップS102において、照会される一組の文書
内の各文書について一組の副文書が決定される。つぎ
に、ステップS104において、一組の副文書に作用し
て各副文書にスコアをつけるクエリーが処理される。す
なわち、クエリーを処理することにより、クエリーを一
組の副文書に作用させ、各副文書にスコア付けを行う処
理が実行される。各副文書のスコアは、クエリーに対す
る副文書の関連性を示すものである。
【0023】ステップS106において、副文書につい
てのスコアが調査される。ステップS108において、
「ベスト」スコアを有している副文書が検索される。
「ベスト」スコアを決定することは、クエリーが処理さ
れるコンテクスト(文脈:context )に依存するもので
ある。例えば、ある状況では、クエリーに対して最も関
連性の高い副文書を検索することが望ましいであろう。
一方、別の状況では、クエリーに対して最も関連性の低
い副文書を特定することが望ましい場合もある。
【0024】(2)詳細な説明 本発明の一実施の形態による副文書を用いた情報検索方
法について、図2〜図5を参照しつつより詳細に説明す
る。図2は、三つの文書202,204および206を
含む一組の文書200を示している。本発明の一実施の
形態によれば、ある文書は1以上の文字列またはより複
雑な言語要素を構成するために用いられる他の記号を含
むテキスト・ファイルである。例えば、文字列は、ワー
ド(word),フレーズ(phrase),センテンス(senten
ce)およびパラグラフ(paragraph )を構成し得る。文
書に含まれる言語要素は、いずれの特定の言語に関連し
た言語要素または形式に限定されることはない。
【0025】 一組の副文書の決定 一組の副文書が各文書202,204,206ついて決
定される。ここで、各副文書はある文書の少なくともあ
る部分に相当するものである。例えば、テキストに基づ
く文書の文脈中において、副文書は、一文字(single c
haracter),いくつかのワード,センテンスまたは文書
全体に相当するものである。一組の副文書が複数の副文
書を含む場合、複数の副文書は、対応する文書の異なる
部分に相当し、かつ、いくつかの共通の情報に相当し得
る。加えて、副文書の境界の位置が、センテンスまたは
パラグラフの終わりのような文書属性の境界に対応して
いる必要はない。
【0026】例えば、再び図2を参照すると、一組の副
文書208は文書202に基づいて決定され、副文書2
10,212,214,216,218および220を
含んでいる。図に示されているように、副文書212
は、副文書210と共通したいくつかの文書情報を含
み、また、副文書214と共通した他の文書情報を含ん
でいる。しかしながら、副文書212は、副文書210
および副文書214のいずれにも含まれていない情報を
含んでいる。
【0027】 一組の副文書を対象としてクエリーを
処理 前述したように、照会される一組の文書中の各文書に対
して一組の副文書が決定されると、クエリーが処理され
て、一組の副文書上でクエリーが機能するようになる。
すなわち、各副文書にスコア付けするため、クエリーが
一組の副文書を対象として作用する。クエリーが一組の
副文書上で機能すると、各副文書に対してスコアが生成
される。本発明の一実施の形態によれば、各副文書のス
コアは、クエリーに対する副文書の関連性を示すもので
ある。クエリーに基づいて目標文書にスコアリングする
いずれの周知の方法においても適用し得る。
【0028】図3の表(説明図)に示されているよう
に、図2の副文書210〜220は、それぞれ副文書2
08に対するクエリーの処理に基づいて生成された対応
するスコアと共に示されている。図3に示す表におい
て、より高いスコアは、対応する副文書のクエリーに対
する関連性がより高いという見込みを示すものである。
しかしながら、他のスコアリング方法を用いることも可
能である。
【0029】 副文書のスコアの検討 副文書にスコアが付けられると、「ベスト」スコアを有
する副文書が検索される。前述したように、「ベスト」
スコアは、副文書およびクエリー間の関連性が最も高い
という見込みを示すものである。しかしながら、「ベス
ト」スコアは、特定の要求に基づいて、副文書およびク
エリー間の最も低い関連性を示す場合もある。例えば、
クエリーに対して比較的低い関連性を有する副文書を続
くクエリーの処理における考慮対象から排除できるよう
にするため、クエリーに対して比較的低い関連性を有す
る副文書を特定することが好ましいこともある。図3に
示すように、副文書218は0.47のスコアを有して
おり、0.91のスコアを有する副文書220よりクエ
リーに対する関連性が低いことを示している。0.75
のような予め設定された閾値より低いスコアを有するそ
れらの副文書は、考慮の対象から除外され得る。これに
より、副文書218および214が除外される。
【0030】 副文書の検索 本発明の一実施の形態によれば、全ての副文書のスコア
を検討した後、ベストスコアを有する副文書が検索さ
れ、ユーザ・インターフェイスにおいてユーザに対して
表示される。図3に示した具体的なスコアにおいて、副
文書212が最も高いスコアを有している。したがっ
て、図4に示すように、副文書212が検索され、ユー
ザ・インターフェイス400上に表示される。
【0031】本発明の他の実施の形態によれば、ベスト
スコアを有する副文書が表示された後、ユーザはユーザ
・インターフェイス400を操作することにより、つぎ
のベストスコアを有する副文書を検索させ、表示させる
ことができる。例えば、ユーザ・インターフェイス「ボ
タン」をクリックまたは選択することにより、0.93
というつぎに高いスコアを有する副文書216が検索さ
れ、ユーザ・インターフェイス400上に表示される。
【0032】本発明の、さらに他の実施の形態によれ
ば、複数の副文書は、それらのスコアに基づく順序でユ
ーザ・インターフェイス上に表示される。図5に示すよ
うに、0.98のスコアを有する副文書212がユーザ
・インターフェイス400の先頭近くで表示され、つぎ
に0.93のスコアを有する副文書216が表示され、
最後に0.91のスコアを有する副文書220が表示さ
れる。
【0033】本発明の、さらに別の実施の形態によれ
ば、最も適切な副文書を含む文書が表示され、そして最
も適切な副文書の位置にスクロールされて最適な副文書
を表示する。図6に示すように、文書202はユーザ・
インターフェイス400上に表示されてスクロールされ
るため、副文書212がユーザ・インターフェイス40
0の上部(top )に現れることになる。加えて、ユーザ
の入力に応じて、文書202が自動的にスクロールさ
れ、つぎに最適な副文書がユーザ・インターフェイス4
00の上部に表示される。この例において、ユーザがつ
ぎに適切な副文書を要求する場合、文書202がスクロ
ールされ、副文書216がユーザ・インターフェイス4
00の上部に配置される。この機能は、ユーザに対し各
副文書のスコアに基づいて一組の副文書をたどって行く
ことを可能にする。これに代え、副文書を他の順序で表
示することもできる。例えば、前述したように、最低の
スコアを有する副文書、即ち最も関連性の低い副文書を
含む文書が表示される。そして、ユーザはスコアの昇順
に副文書をたどって行くことができる。
【0034】本発明の他の実施の形態によれば、(複数
の)副文書が必ずしも一つの文書に含められる必要はな
い。それどころか、つぎに適切な副文書が他の文書に含
まれる場合であっても、ユーザの選択により(他の文書
に含まれる)つぎに適切な副文書が自動的に表示される
ことになる。例えば、図6に示したように、副文書21
2は最も高いスコアを有し、文書202内に含まれてい
る。ユーザは、この例において0.93のスコアを有す
る副文書216であるつぎに適切な副文書を見ることを
選択することができる。副文書216が他の文書に含ま
れている場合、その文書が自動的に表示されてスクロー
ルされ、その結果、副文書216がユーザ・インターフ
ェイス400の上部に表示されることになる。
【0035】一つの文書のある部分に相当する副文書に
ついて本発明の実施の形態を説明したが、本発明はま
た、複数の文書の部分に相当する副文書にも適用するこ
とができる。例えば、ある副文書が第1の文書の終わり
の部分と第2文書の冒頭の部分に相当することもある。
【0036】(3)ハードウエアの概要 図7は、本発明の一実施の形態を実現するコンピュータ
・システム(情報検索システム)500のブロック構成
図である。コンピュータ・システム500は、バス50
2または情報通信のための他の通信メカニズムと、情報
を処理するためにバス502に接続されたプロセッサ5
04と、を備えている。また、コンピュータ・システム
500は、情報およびプロセッサ504によって実行さ
れる命令を記憶できるようにバス502に接続されたラ
ンダム・アクセス・メモリ(RAM)または他の動的記
憶装置(dynamic storage device)のような主記憶装置
506を備えている。
【0037】また、主記憶装置506は、プロセッサ5
04によって実行される命令の実行中に、一時的な変数
または他の中間的な情報を記憶するためにも使用し得
る。さらに、コンピュータ・システム500は、静的情
報およびプロセッサ504に対する命令を記憶するため
にバス502に接続されたリード・オンリー・メモリ
(ROM)508または他の静的記憶装置(static sto
rage device )を備えている。また、磁気ディスクまた
は光ディスクのような記憶装置510が設けられてお
り、バス502に接続されて情報および命令を記憶す
る。
【0038】コンピュータ・システム500はバス50
2を介してブラウン管(CRT)のようなディスプレイ
512に接続され、コンピュータ・ユーザに対して情報
を表示する。英数字および他のキーを含む入力装置51
4はバス502に接続され、情報およびコマンドの選択
をプロセッサ504に伝える。他の種類のユーザ入力装
置として、マウス,トラックボールまたはカーソル方向
キーのようなカーソル・コントロール(カーソル制御装
置)516があり、指示情報およびコマンドの選択をプ
ロセッサ504に伝え、ディスプレイ512上における
カーソルの移動を制御する。この入力装置は、一般に、
二つの軸、即ち第1の軸(例えばx)および第2の軸
(例えばy)において2自由度を有し、平面上で位置を
指定することを可能にしている。
【0039】本発明は、コンピュータ・システム500
を使用し、副文書を用いて情報を検索することに関する
ものである。本発明の一実施の形態によれば、副文書を
用いた情報検索は、主記憶装置506に記憶された一連
の命令を実行するプロセッサ504に応じて、コンピュ
ータ・システム500によって提供される。このような
命令は、記憶装置510のような他のコンピュータ読み
取り可能な媒体から主記憶装置506に読み込むことが
できる。しかしながら、コンピューター読み取り可能な
媒体は、記憶装置510のような装置に限定されるもの
ではない。例えば、コンピューター読み取り可能な媒体
には、フロッピー・ディスク,フレキシブル・ディス
ク,ハード・ディスク,磁気テープ,もしくは他のあら
ゆる磁気媒体,CD−ROM,他のあらゆる光学媒体,
RAM,PROM,EPROM、FLASH−EPRO
M,他のいずれのメモリ・チップもしくはカートリッ
ジ、またはコンピュータが読み取り可能なあらゆる媒体
が含まれる。
【0040】主記憶装置506に記憶された一連の命令
を実行することは、プロセッサ504が前述した処理ス
テップを実行することである。他の実施の形態において
は、ソフトウエアの命令に代え、またはその命令と組み
合わせてハードワイヤード回路を使用することによって
本発明を実現することもできる。したがって、本発明の
実施の形態は、ハードウエア回路およびソフトウエアに
よるどのような特定の組合せにも限定されるものではな
い。
【0041】また、コンピュータ・システム500は、
バス502に接続された通信インターフェイス518を
備えている。通信インターフェイス518は、ローカル
・ネット・ワーク522に接続されたネットワーク・リ
ンク520に接続し、双方向データ通信を提供する。例
えば、通信インターフェイス518として総合ディジタ
ル通信網(ISDN)カードまたはモデム等を用いるこ
とができ、対応する種類の電話線に対するデータ通信接
続を提供する。
【0042】他の例としては、通信インターフェイス5
18としてローカル・エリア・ネットワーク(LAN)
カードを用いることができ、互換性のあるLANに対す
るデータ通信接続を提供する。また、無線リンクでも実
現することができる。このようないずれのインプリメン
テーションにおいても、通信インターフェイス518
は、種々の情報を表すディジタル・データ・ストリーム
を伝送する電気的,電磁気的または光学的信号を送受信
する。
【0043】ネットワーク・リンク520は、一般に、
1以上のネットワークを介して他のデータ装置とデータ
通信を行う。例えば、ネットワーク・リンク520は、
ローカル・ネットワーク522を介してホスト・コンピ
ュータ524またはインターネット・サービス・プロバ
イダ(ISP)526によって操作されるデータ装置に
対する接続を提供し得る。
【0044】そして、ISP526はつぎに、現在一般
に「インターネット」528と呼ばれる世界的なパケッ
ト・データ通信網を介して、データ通信サービスを提供
する。ローカル・ネットワーク522およびインターネ
ット528は、両方ともディジタル・データ・ストリー
ムを伝送する電気的,電磁気的または光学的信号を利用
する。ディジタル・データをコンピュータ・システム5
00におよびコンピュータ・システム500から搬送す
る様々なネットワークを介した信号ならびにネットワー
ク・リンク520上および通信インターフェイス518
を介した信号は、情報を搬送する搬送波の典型的な形式
である。
【0045】コンピュータ・システム500は、ネット
ワーク,ネットワーク・リンク520および通信インタ
ーフェイス518を介して、プログラム・コードを含む
メッセージを送信すると共に、データを受信することが
できる。インターネットの例において、サーバ530
は、インターネット528,ISP526,ローカル・
ネットワーク522および通信インターフェイス518
を介し、アプリケーション・プログラムのために要求さ
れたコードを送信するかもしれない。本発明によれば、
このようなダウンロードされたアプリケーションは、こ
こで説明された副文書を利用した情報検索を提供する。
【0046】受信したコードは、受信されるとプロセッ
サ504によって処理され、かつ/または記憶装置51
0もしくは他の不揮発性記憶装置内に後の実行に備えて
記憶される。このように、コンピュータ・システム50
0は、搬送波の形でアプリケーション・コードを得るこ
とができる。
【0047】本発明は、従来の情報検索方法と比較して
いくつかの利点を提供する。副文書を使用することは、
全文書を検索する代わりに、副文書のスコアに基づいて
文書の特定の部分(副文書)を検索することを可能にす
る。そして、ユーザは、副文書のスコアに基づいて各副
文書をたどって行くことができる。これに代え、一定の
検索基準を満たすスコアを有する副文書を含む文書が表
示され、自動的にスクロールされて最も適切な副文書が
表示されるようにすることができる。そして、ユーザ
は、ユーザ・インターフェイスに対して要求を出すこと
により、つぎの副文書に進んで操作することができる。
これによってユーザは、クエリーが処理される1以上の
文書の最も関連性の高いある部分(副文書)を迅速に見
ることができる。
【0048】前述した明細書においては、本発明につい
てその特定の実施の形態に関連して説明した。しかしな
がら、本発明の幅広い精神および範囲から逸脱すること
なく、本発明について様々な修正および変更が可能であ
ることは明白であろう。したがって、本明細書および図
面は、限定的なものではなく例示のためのものであると
みなされるべきである。
【0049】
【発明の効果】以上説明したように、本発明の情報検索
方法,情報検索システムおよび一組の文書から情報を検
索するための命令を記録したコンピュータ読み取り可能
な記録媒体によれば、副文書を使用することにより、全
文書を検索する代わりに、副文書のスコアに基づいて文
書の特定の部分(副文書)を検索することができる。そ
の結果、ユーザは、副文書のスコアに基づいて各副文書
をたどって行くことができる。また、一定の検索基準を
満たすスコアを有する副文書を含む文書が表示され、自
動的にスクロールされて最も適切な副文書が表示される
ようにすることができる。その結果、ユーザは、ユーザ
・インターフェイスに対して要求を出すことにより、つ
ぎの副文書に進んで操作することができる。このよう
に、本発明によれば、ユーザは、クエリーが処理される
1以上の文書の最も関連性の高いある部分(副文書)を
迅速に見ることができる。
【図面の簡単な説明】
【図1】本発明に係る一実施の形態の副文書を用いた情
報検索方法を示すフロー・チャートである。
【図2】本発明に係る一実施の形態において、一組の副
文書および一組の文書を示す説明図である。
【図3】本発明に係る一実施の形態において、図2に示
した一組の副文書と関連する一組のスコアを示す説明図
である。
【図4】本発明に係る一実施の形態において、一組の副
文書からの一つの副文書を検索する処理を示す説明図で
ある。
【図5】本発明に係る一実施の形態において、一組の副
文書から1以上の副文書を検索する処理を示す説明図で
ある。
【図6】本発明に係る他の実施の形態において、一組の
副文書から1以上の副文書を検索する処理を示す説明図
である。
【図7】本発明に係る一実施の形態を実現するコンピュ
ータ・システムのブロック構成図である。
【符号の説明】
200 一組の文書 202,204,206 文書 208 一組の副文書 210,212,214,216,218,220 副
文書 400 ユーザ・インターフェイス 500 コンピュータ・システム 502 バス 504 プロセッサ 506 主記憶装置 508 ROM 510 記憶装置 512 ディスプレイ 514 入力装置 516 カーソル・コントロール 518 通信インターフェイス 520 ネットワーク・リンク 522 ローカル・ネットワーク 524 ホスト・コンピュータ 526 インターネット・サービス・プロバイダ(IS
P) 528 インターネット 530 サーバ

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 一組の文書から情報を検索するための情
    報検索方法において、 一組の文書に基づいて、各副文書が一組の文書中の一文
    書全体より小さい部分に相当するように一組の副文書を
    決定する工程と、 一組の副文書を対象として作用するクエリーを処理し、
    各副文書に対するスコアを生成して、各スコアにより対
    応する副文書のクエリーに対する関連性を表現する工程
    と、 各副文書のスコアに基づいて1以上の副文書を検索する
    工程と、 を含むことを特徴とする情報検索方法。
  2. 【請求項2】 各副文書のスコアに基づいて1以上の副
    文書を検索する工程は、第1の副文書およびクエリー間
    の関連性が他の副文書およびクエリー間の関連性より高
    いことを示す対応スコアを有する第1の副文書を検索す
    る工程を含むことを特徴とする請求項1に記載の情報検
    索方法。
  3. 【請求項3】 さらに、第2の副文書およびクエリー間
    の関連性が第1の副文書およびクエリー間の関連性より
    低いこと,ならびに第2の副文書およびクエリー間の関
    連性が他の副文書およびクエリー間の関連性より高いこ
    との両方を示す対応スコアを有する第2の副文書を検索
    する工程を含むことを特徴とする請求項2に記載の情報
    検索方法。
  4. 【請求項4】 一組の文書から情報を検索するコンピュ
    ータ・システムからなる情報検索システムにおいて、 メモリと、 メモリに接続された1以上のプロセッサと、 を備え、 メモリは一組のコンピュータ命令を記憶し、一組のコン
    ピュータ命令は、1以上のプロセッサによって実行され
    た場合に、 一組の文書に基づいて、各副文書が一組の文書における
    一文書の少なくとも一部分に相当するように一組の副文
    書を決定する工程と、 一組の副文書を対象として作用するクエリーを処理し、
    各副文書に対するスコアを生成して、各スコアにより対
    応する副文書のクエリーに対する関連性を表現する工程
    と、 各副文書のスコアに基づいて1以上の副文書を検索する
    工程と、 を1以上のプロセッサに実行させることを特徴とする情
    報検索システム。
  5. 【請求項5】 各副文書のスコアに基づいて1以上の副
    文書を検索する工程を実行するためのコンピュータ命令
    は、第1の副文書およびクエリー間の関連性が他の副文
    書およびクエリー間の関連性より高いことを示す対応ス
    コアを有する第1の副文書を検索する工程を実行するた
    めのコンピュータ命令を含むことを特徴とする請求項4
    に記載の情報検索システム。
  6. 【請求項6】 一組のコンピュータ命令は、さらに、第
    2の副文書およびクエリー間の関連性が第1の副文書お
    よびクエリー間の関連性より低いこと,ならびに第2の
    副文書およびクエリー間の関連性が他の副文書およびク
    エリー間の関連性より高いことの両方を示す対応スコア
    を有する第2の副文書を検索する工程を実行するための
    コンピュータ命令を含むことを特徴とする請求項4に記
    載の情報検索システム。
  7. 【請求項7】 一組の文書から情報を検索するための複
    数の一連の命令を記録したコンピュータ読み取り可能な
    記録媒体であって、複数の一連の命令は、1以上のプロ
    セッサによって実行された場合に、 一組の文書に基づいて、各副文書が一組の文書中の一文
    書全体より小さい部分に相当するように一組の副文書を
    決定する工程と、 一組の副文書を対象として作用するクエリーを処理し、
    各副文書に対するスコアを生成して、各スコアにより対
    応する副文書のクエリーに対する関連性を表現する工程
    と、 各副文書のスコアに基づいて1以上の副文書を検索する
    工程と、 を1以上のプロセッサに実行させる一連の命令を含むこ
    とを特徴とする一組の文書から情報を検索するための命
    令を記録したコンピュータ読み取り可能な記録媒体。
  8. 【請求項8】 各副文書のスコアに基づいて1以上の副
    文書を検索する工程は、第1の副文書およびクエリー間
    の関連性が他の副文書およびクエリー間の関連性より高
    いことを示す対応スコアを有する第1の副文書を検索す
    る工程を含むことを特徴とする請求項7に記載の一組の
    文書から情報を検索するための命令を記録したコンピュ
    ータ読み取り可能な記録媒体。
  9. 【請求項9】 コンピュータ読み取り可能な記録媒体
    は、さらに、第2の副文書およびクエリー間の関連性が
    第1の副文書およびクエリー間の関連性より低いこと,
    ならびに第2の副文書およびクエリー間の関連性が他の
    副文書およびクエリー間の関連性より高いことの両方を
    示す対応スコアを有する第2の副文書を検索する工程を
    実行するための命令を含むことを特徴とする請求項8に
    記載の一組の文書から情報を検索するための命令を記録
    したコンピュータ読み取り可能な記録媒体。
JP10140773A 1997-07-25 1998-05-22 情報検索方法,情報検索システムおよび一組の文書から情報を検索するための命令を記録したコンピュータ読み取り可能な記録媒体 Pending JPH11110415A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/900641 1997-07-25
US08/900,641 US5999925A (en) 1997-07-25 1997-07-25 Information retrieval based on use of sub-documents

Publications (1)

Publication Number Publication Date
JPH11110415A true JPH11110415A (ja) 1999-04-23

Family

ID=25412859

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10140773A Pending JPH11110415A (ja) 1997-07-25 1998-05-22 情報検索方法,情報検索システムおよび一組の文書から情報を検索するための命令を記録したコンピュータ読み取り可能な記録媒体

Country Status (2)

Country Link
US (3) US5999925A (ja)
JP (1) JPH11110415A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1210675A4 (en) * 1999-05-20 2005-03-23 Evres Ltd INFORMATION MANAGEMENT, REPEATING AND DISPLAY SYSTEM AND RELATED METHOD

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3597370B2 (ja) * 1998-03-10 2004-12-08 富士通株式会社 文書処理装置および記録媒体
WO1999057654A1 (fr) * 1998-05-06 1999-11-11 Matsushita Electric Industrial Co., Ltd. Procede et systeme d'emission/reception de donnees numeriques
US6366658B1 (en) 1998-05-07 2002-04-02 Mci Communications Corporation Telecommunications architecture for call center services using advanced interactive voice responsive service node
WO2000016215A1 (fr) * 1998-09-10 2000-03-23 Fujitsu Limited Appareil d'examen de documents, systeme d'examen de documents et support d'enregistrement exploitable par ordinateur et servant a memoriser des programmes permettant d'exploiter des ordinateurs en tant qu'appareils d'examen de documents
US7219073B1 (en) * 1999-08-03 2007-05-15 Brandnamestores.Com Method for extracting information utilizing a user-context-based search engine
US7013300B1 (en) 1999-08-03 2006-03-14 Taylor David C Locating, filtering, matching macro-context from indexed database for searching context where micro-context relevant to textual input by user
US6775665B1 (en) * 1999-09-30 2004-08-10 Ricoh Co., Ltd. System for treating saved queries as searchable documents in a document management system
US6651058B1 (en) * 1999-11-15 2003-11-18 International Business Machines Corporation System and method of automatic discovery of terms in a document that are relevant to a given target topic
US8321496B2 (en) * 1999-12-13 2012-11-27 Half.Com, Inc. User evaluation of content on distributed communication network
US7356604B1 (en) * 2000-04-18 2008-04-08 Claritech Corporation Method and apparatus for comparing scores in a vector space retrieval process
US7139977B1 (en) * 2001-01-24 2006-11-21 Oracle International Corporation System and method for producing a virtual online book
US20040003028A1 (en) * 2002-05-08 2004-01-01 David Emmett Automatic display of web content to smaller display devices: improved summarization and navigation
US6738764B2 (en) * 2001-05-08 2004-05-18 Verity, Inc. Apparatus and method for adaptively ranking search results
EP1276061A1 (en) * 2001-07-09 2003-01-15 Accenture Computer based system and method of determining a satisfaction index of a text
US7426509B2 (en) * 2002-11-15 2008-09-16 Justsystems Evans Research, Inc. Method and apparatus for document filtering using ensemble filters
US7356187B2 (en) * 2004-04-12 2008-04-08 Clairvoyance Corporation Method and apparatus for adjusting the model threshold of a support vector machine for text classification and filtering
WO2005103950A1 (en) * 2004-04-20 2005-11-03 Newsouth Innovations Pty Limited A method and apparatus for indexing documents
US8799107B1 (en) * 2004-09-30 2014-08-05 Google Inc. Systems and methods for scoring documents
US20060149710A1 (en) 2004-12-30 2006-07-06 Ross Koningstein Associating features with entities, such as categories of web page documents, and/or weighting such features
US8429167B2 (en) 2005-08-08 2013-04-23 Google Inc. User-context-based search engine
US8027876B2 (en) 2005-08-08 2011-09-27 Yoogli, Inc. Online advertising valuation apparatus and method
US20070112898A1 (en) * 2005-11-15 2007-05-17 Clairvoyance Corporation Methods and apparatus for probe-based clustering
US7902542B2 (en) * 2006-06-14 2011-03-08 3M Innovative Properties Company Adapted LED device with re-emitting semiconductor construction
US20080222168A1 (en) * 2007-03-07 2008-09-11 Altep, Inc. Method and System for Hierarchical Document Management in a Document Review System
US20080222513A1 (en) * 2007-03-07 2008-09-11 Altep, Inc. Method and System for Rules-Based Tag Management in a Document Review System
US7895197B2 (en) 2007-04-30 2011-02-22 Sap Ag Hierarchical metadata generator for retrieval systems
US7937663B2 (en) * 2007-06-29 2011-05-03 Microsoft Corporation Integrated collaborative user interface for a document editor program
US20090287668A1 (en) * 2008-05-16 2009-11-19 Justsystems Evans Research, Inc. Methods and apparatus for interactive document clustering
US9081831B2 (en) * 2012-03-30 2015-07-14 Google Inc. Methods and systems for presenting document-specific snippets
US20140075299A1 (en) * 2012-09-13 2014-03-13 Google Inc. Systems and methods for generating extraction models
US9607038B2 (en) * 2013-03-15 2017-03-28 International Business Machines Corporation Determining linkage metadata of content of a target document to source documents
CN107072264A (zh) 2014-11-10 2017-08-18 史密斯菲尔德食品股份有限公司 用于加工具有煎制培根特性的即食培根的方法和***

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2790466B2 (ja) * 1988-10-18 1998-08-27 株式会社日立製作所 文字列検索方法及び装置
US5325298A (en) * 1990-11-07 1994-06-28 Hnc, Inc. Methods for generating or revising context vectors for a plurality of word stems
US5559940A (en) * 1990-12-14 1996-09-24 Hutson; William H. Method and system for real-time information analysis of textual material
US5293552A (en) * 1991-04-08 1994-03-08 U.S. Philips Corporation Method for storing bibliometric information on items from a finite source of text, and in particular document postings for use in a full-text document retrieval system
US5267156A (en) * 1991-12-05 1993-11-30 International Business Machines Corporation Method for constructing a knowledge base, knowledge base system, machine translation method and system therefor
US5325296A (en) * 1992-12-18 1994-06-28 General Electric Company Step size in complete data scanning path for three dimensional computerized tomography
US5331556A (en) * 1993-06-28 1994-07-19 General Electric Company Method for natural language data processing using morphological and part-of-speech information
US5384703A (en) * 1993-07-02 1995-01-24 Xerox Corporation Method and apparatus for summarizing documents according to theme
DE69424902T2 (de) * 1993-08-20 2000-11-09 Canon Kk Gerät und Verfahren zur anpassungsfähigen nicht-buchstäblichen Textsuche
US5692176A (en) * 1993-11-22 1997-11-25 Reed Elsevier Inc. Associative text search and retrieval system
US5642502A (en) * 1994-12-06 1997-06-24 University Of Central Florida Method and system for searching for relevant documents from a text database collection, using statistical ranking, relevancy feedback and small pieces of text
US5724571A (en) * 1995-07-07 1998-03-03 Sun Microsystems, Inc. Method and apparatus for generating query responses in a computer-based document retrieval system
US6026388A (en) * 1995-08-16 2000-02-15 Textwise, Llc User interface and other enhancements for natural language information retrieval system and method
US5675788A (en) * 1995-09-15 1997-10-07 Infonautics Corp. Method and apparatus for generating a composite document on a selected topic from a plurality of information sources

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1210675A4 (en) * 1999-05-20 2005-03-23 Evres Ltd INFORMATION MANAGEMENT, REPEATING AND DISPLAY SYSTEM AND RELATED METHOD

Also Published As

Publication number Publication date
US6377947B1 (en) 2002-04-23
US6115706A (en) 2000-09-05
US5999925A (en) 1999-12-07

Similar Documents

Publication Publication Date Title
JPH11110415A (ja) 情報検索方法,情報検索システムおよび一組の文書から情報を検索するための命令を記録したコンピュータ読み取り可能な記録媒体
US7096218B2 (en) Search refinement graphical user interface
US8825694B2 (en) Mobile device retrieval and navigation
US6832350B1 (en) Organizing and categorizing hypertext document bookmarks by mutual affinity based on predetermined affinity criteria
JP5237335B2 (ja) 対話形サーチクエリー改良のためのシステム及び方法
KR100672277B1 (ko) 개인화 검색 방법 및 검색 서버
US20020059297A1 (en) Search formulation user interface
JPH11102376A (ja) 検索照会に関係のあるデータベースから抽出されたテキストを自動表示する方法および装置
US20050044065A1 (en) Method and apparatus for enabling national language support of a database engine
US7089233B2 (en) Method and system for searching for web content
US20040249632A1 (en) Method and system for natural language recognition command interface and data management
JP4237813B2 (ja) 構造化文書管理システム
JPH11272683A (ja) 検察処理装置および記憶媒体
JP3767763B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4091586B2 (ja) 構造化文書管理システム、索引構築方法及びプログラム
JP4000332B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3415214B2 (ja) 文書検索装置
JP2006163645A (ja) 情報検索方法、情報検索装置、情報検索プログラム及びコンピュータで読み取り可能な記録媒体並びに記録した機器
JP3195183B2 (ja) 情報検索方法及びその装置
JP2001344246A (ja) 用語集データベース作成方法および電子文書検索方法
JP2007025831A (ja) コンテンツ検索装置及びその方法
JP2002099573A (ja) 類似文書検索装置、類似文書検索方法及び記録媒体
JPH08249356A (ja) データベース検索システム
JPH10254892A (ja) 文書検索・利用方法
JP2008077673A (ja) 構造化文書管理システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050420

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080430

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080724

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080729

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081104