JPH1091645A - 情報検索方法 - Google Patents

情報検索方法

Info

Publication number
JPH1091645A
JPH1091645A JP8261275A JP26127596A JPH1091645A JP H1091645 A JPH1091645 A JP H1091645A JP 8261275 A JP8261275 A JP 8261275A JP 26127596 A JP26127596 A JP 26127596A JP H1091645 A JPH1091645 A JP H1091645A
Authority
JP
Japan
Prior art keywords
word
words
keyword
importance
relative importance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8261275A
Other languages
English (en)
Inventor
Hiromi Haniyuda
博美 羽生田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP8261275A priority Critical patent/JPH1091645A/ja
Publication of JPH1091645A publication Critical patent/JPH1091645A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 キーワードと、そのキーワードに関連する或
いは重要であるとして抽出された単語とを使ってデータ
ベースから所望の情報を検索する場合に、キーワードに
対し深い関連があるにも拘わらず、一般的には重要でな
いことを理由に検索するための単語として抽出されない
でしまうという事態を回避する。 【解決手段】 入力されたキーワード(S10)から一
定の距離の範囲内にある単語について、その単語の絶対
重要度を単に用いずに、その単語の絶対重要度と、その
単語に隣接する単語の絶対重要度とから、その単語の相
対重要度を算出し(S12)、その相対重要度を用いて
その単語を検索に用いるか否かを決定する(S13)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、データベースから
所望の情報を検索する方法に関し、特に、所望の情報を
検索するためのキーワードのみに基づくだけでなく、そ
のキーワードに関連する単語にも基づいて情報を検索す
る方法に関する。
【0002】
【従来の技術】昨今、文献等からなるデータベースから
所望の情報を検索する方法として、検索のためのキーワ
ードとそのキーワードに関連する単語とを併用すること
が広く行われている。この検索方法では、最初に検索者
がキーワードを選択する。次に、単語、単語自身の重要
度、単語同士の遠近度等が格納されたシソーラス・ファ
イルから、一定以上の重要度を有する単語や一定以上の
近さにある単語を抽出する。そして、そのキーワードと
抽出された単語に基づきデータベースから所望する情報
を検索している。
【0003】
【発明が解決しようとする課題】しかしながら、このよ
うな情報検索方法では、シソーラス・ファイルに格納さ
れている単語自身の重要度や単語同士の遠近度等は、単
語の意味や使用頻度、単語同士の文法的な位置関係等、
単語が本来的に有する言語的意味の観点から予め定めら
れており、固定されている。従って、例えば、ある単語
が、一般的には重要度が低いが、選択されたキーワード
との関係で関連が強い場合には、キーワードとの関連が
強いために、一度はシソーラス・ファイルから抽出され
ようとするが、その単語自身があまり重要でないため
に、結果的には抽出されないという事態を生じてしまっ
ていた。これにより、検索の拠り所となる単語群に、検
索者の意図を充分に反映させることができないという問
題があった。
【0004】
【課題を解決するための手段】上述した課題を解決する
ために、本発明に係る情報検索方法では、まず、データ
ベースから所望する情報を検索するのに用いる単語、即
ち、キーワードを選択して入力する。次に、単語と、単
語同士が近いか遠いかを示す遠近度と、単語が一般的に
どの程度重要であるかを示す絶対重要度とを格納するシ
ソーラス・ファイルの中から、遠近度に基づき、そのキ
ーワードから一定の距離の範囲内になる単語を検出す
る。その次に、その検出された単語がキーワードとの関
係においてどの程度重要であるかを示す相対重要度を、
その検出された単語自身の絶対重要度とその単語の周辺
に位置する単語の絶対重要度に基づき算出する。そし
て、検出された単語の中から、相対重要度が一定の閾値
を越える単語を抽出する。最後に、その抽出された単語
とキーワードとを用いて、データベースから所望する情
報を検索する。
【0005】このように、本発明に係る情報検索方法で
は、単語の相対重要度を使って、検索に用いるべき単語
を抽出するようにしている。このような手段により、一
般的にはあまり重要ではないが、選択されたキーワード
との関係、より正確には、選択されたキーワードに関連
する単語との関係において重要であると認定されるべき
単語を漏れることなく抽出できることになる。その結
果、検索者の検索の意図を充分に反映させることが可能
となる。
【0006】
【発明の実施の形態】本発明の情報検索方法について、
実施の形態に沿って説明する。実施の形態として、具体
例1、具体例2、具体例3を挙げる。具体例1の主な特
徴点は、入力されたキーワードに関連する単語をシソー
ラス・ファイルから抽出する場合に、そのキーワードと
の関係において、遠近度が一定値の範囲にあり、かつ、
相対重要度が一定値を超える単語を抽出することであ
る。具体例1をより望ましい形態にした具体例2の主な
特徴点は、相対重要度を算出するときに、遠近度に依存
する重み付けを行うことである。同様に具体例1をより
望ましい形態にした具体例3の主な特徴点は、相対重要
度を算出するときに、過去の検索における相対重要度を
参照することである。
【0007】〈具体例1の構成〉図1は、具体例1の検
索フローチャートであり、また、図2は、具体例1の情
報検索方法を実現するための情報検索装置のブロック図
である。最初に、図2に沿って構成について説明した後
に、図1に沿って検索手順について説明する。
【0008】〈情報検索装置の構成〉図2に示すよう
に、この情報検索装置は、表示操作部1、シソーラス・
ファイル部2、データベース部3、制御部4から構成さ
れている。表示操作部1は、検索者が所望する情報を検
索するのに必要な単語であるキーワードを入力したり、
その検索の結果を表示したりする機能を有する。
【0009】シソーラス・ファイル部2には、複数の単
語、単語の絶対重要度、単語同士の遠近度等のデータが
格納されている。ここで、「単語」とは、例えば、コン
ピュータ、IC、真空管、歯車等を始めとする用語であ
る。また、「単語の絶対重要度」とは、その単語の持つ
意味や出現頻度等に基づき算定される、その単語の重要
性であり、例えば、使用頻度が高い単語「IC」の絶対
重要度は、やや使用頻度が低い単語「真空管」の絶対重
要度よりも大きくなる。さらに、「単語同士の遠近度」
とは、各単語の持つ一般的な意味に基づき算定される、
単語同士の結び付きの程度をいい、例えば、単語「コン
ピュータ」と単語「IC」とは近い一方で、単語「コン
ピュータ」と単語「歯車」とは遠い等である(以下、距
離が近い場合に「遠近度が小さい」といい、距離が遠い
場合に「遠近度が大きい」という)。なお、単語同士の
遠近度は、電気関係、化学関係等の特定分野において、
単語同士が同時に使用されるか否かという共起度にも基
づき算定されることが望ましい。例えば、分野を「初期
のコンピュータ」に限定した場合に、単語「コンピュー
タ」と単語「歯車」とは、同時に出現する頻度が高くな
る、即ち、共起度が大きくなるので、両単語の遠近度は
小さくなる。
【0010】データベース部3には、学術誌や学界誌等
を始めとする文献のデータが、JISコード等のコード
形式で格納されている。情報検索において中心的な役割
りを担う制御部4は、検出部4A、算出部4B、抽出部
4C、検索部4Dから構成されている。検出部4Aは、
入力されたキーワードに基づきシソーラス・ファイル部
2から関連する単語を検出する。算出部4Bは、後述す
るように、検出された単語の相対重要度を算出する。抽
出部4Cは、検出された単語の中から、一定以上の相対
重要度を持つ単語を抽出する。検索部4Dは、データベ
ース部3から、キーワードと抽出された単語を含む文献
を検索する。
【0011】〈シソーラス・ファイルの構成〉図3は、
シソーラス・ファイル部のデータ構造を示す図である。
この図において、各ノードは、単語(k1、k2、…
…)とその単語の絶対重要度(0.8、0.5、……)
とを表している。また、リンクは、単語同士の間におけ
る上位・下位関係、同義・類義関係、共起度等を表して
おり、従って、リンクを縦続接続した場合におけるリン
クの本数は、単語同士の遠近度を表している。以下、単
語をkiで表記し、単語kiと特定の単語Kとの遠近度
をD(ki、K)で表記し、特定の単語Kに対する単語
kiの相対重要度をR(ki、K)で表記する(但し、
iは任意の整数)。このように構成されるシソーラス・
ファイル部2では、遠近度の閾値や相対重要度の閾値を
基準として、入力されたキーワードに対し、一定の範囲
内に位置し、かつ、一定以上の重要度を有する単語が抽
出される。
【0012】〈具体例の動作〉図1に示すように、検索
手順は、入力ステップ、検出ステップ、算出ステップ、
抽出ステップ、検索ステップ、回答ステップから構成さ
れる。以下、それらのステップについて詳述する。な
お、以下の説明中では、入力されたキーワードをKと
し、遠近度の閾値を2とし、相対重要度の閾値を0.6
とする。また、Kとk1は同一の単語であったとする。
【0013】〈入力ステップ〉 ステップS10: 検索者は、所望する文書を得るのに
必要であろうと予想するキーワードKを表示操作部1か
ら入力する。そして、入力されたキーワードKは、制御
部4内の検出部4Aへ送出される。
【0014】〈検出ステップ〉 ステップS11: 検出部4Aは、シソーラス・ファイ
ル部2において、そのキーワードKに対し遠近度が2以
下である単語を検出する。より具体的には、キーワード
Kを起点として縦続接続されるリンクの数が2本以下の
範囲にある単語を検出する。図4は、検出された単語の
範囲を示す図である。ここで、検出された単語の集合を
PR(K)で表記すると、PR(K)={k1、k2、
k3、k4、k5、k6、k7、k8、k9、k10、
k11}となる。ただし、k1とKは同一の単語なの
で、図中ではk1をKと表記している。
【0015】〈算出ステップ〉 ステップS12: 算出部4Bは、検出された各単語に
ついて、相対重要度を算出する。ここで、相対重要度R
(ki、K)は、絶対重要度が相対重要度の閾値0.6
よりも大きい単語kiについては、その絶対重要度を相
対重要度とみなす。一方、絶対重要度が相対重要度の閾
値0.6よりも小さい単語kiについては、図12(a
1)に示すように、集合PR(K)に属する単語であっ
て、単語kiに隣接する単語kjの集合をA(ki)で
表記すると、集合A(ki)の単語の絶対重要度と相対
重要度の閾値0.6との差の平均値を、その単語kiの
絶対重要度に加算することにより、相対重要度とする。
なお、図12(a2)に示すように、必要な場合には、
隣接する単語kjの絶対重要度をどの位反映させるかを
示す反映係数εを掛けることにより、隣接する単語kj
の絶対重要度の影響を大きくしたり、小さくしたりす
る。
【0016】〈抽出ステップ〉 ステップS13: 抽出部4Cは、集合PR(K)の中
から、算出された相対重要度が相対重要度の閾値よりも
大きい単語を抽出する。図5は、抽出された単語の範囲
を示す図である。ここで、抽出される単語の集合をRW
(K)で表記すると、RW(K)={K、k2、k3、
k4、k5、k6、k8、k9、k10、k11}とな
る。
【0017】〈検索ステップ〉 ステップS14: 検索部4Dは、抽出された単語と、
最初に入力されたキーワードKとの論理和ORを使っ
て、データベース部3において、それらの単語やキーワ
ードを含む文書を検索する。 〈回答ステップ〉 ステップS15: 表示操作部1は、検索された文書の
内容を検索者に対し表示する。
【0018】〈具体例1の効果〉上述したように、具体
例1の情報検索方法では、最初に、情報を検索するため
のキーワードを入力する。次に、その入力されたキーワ
ードに対し一定の遠近度を有する、即ち、そのキーワー
ドを中心として一定の距離の範囲内に位置する単語を検
出する。そして、キーワードに対する検出された単語の
相対重要度を、その単語自身が本来的に有する絶対重要
度と、その単語に隣接する一または二以上の単語自身が
本来的に有する絶対重要度とを用いて算出する。さら
に、それら検出された単語の中から、その算出された相
対重要度が、予め定めた閾値よりも大きい、即ち、ある
一定の水準よりも重要である単語のみを抽出する。最後
に、キーワードとその抽出された単語とを使って、それ
らのキーワードや単語を含む文書等を検索する。
【0019】このように、入力されたキーワードに対し
近い関係にある単語が、検索に有用であるか否かを決定
するという、単語の抽出の段階において、従来の情報検
索方法とは異なり、それらの単語自身の絶対重要度を用
いずに、その単語に隣接する単語の絶対重要度等から算
出した相対重要度を用いている。これにより、従来の情
報検索方法では抽出されなかった、周辺に存在する単語
との関係で重要であると認定されるべき単語を抽出する
ことが可能となる。その結果、従来の情報検索方法に比
べて、検索の意図をより明確にすることができるため、
より精度高く情報を検索することができることになる。
【0020】また、検出された単語自身の絶対重要度
が、もともと閾値よりも大きい場合、即ち、その単語が
常に極めて重要である場合には、改めて相対重要度を算
出することをせず、一方、単語自身の絶対重要度が閾値
よりも小さい場合にのみ、相対重要度を算出する。これ
により、その単語が検索に有用であるか否かを迅速に判
断することが可能となる。
【0021】また、検出された単語の相対重要度を算出
する際に、その単語に隣接する単語の絶対重要度をどの
くらい反映させるかを示す反映係数を用いている。これ
により、ある検出された単語に対し及ぼす、隣接する単
語の絶対重要度の影響の大きさを任意に調整することが
可能となるので、検索の意図をより明確にすることが可
能となる。
【0022】なお、単語同士の遠近度を、単語が持つ意
味に基づき定めている。これにより、単語がもともと有
する一般的な意味の観点から、キーワードに近い単語を
検出することが可能となる。また、単語同士の遠近度
を、単語同士が特定の分野において同時に一緒に存在す
るか否かの程度を示す共起度に基づき定めている。これ
により、選択されたキーワードに対し一般的には結び付
きが希薄であるが、特定の分野においては結び付きが強
いような単語をも検出することが可能となる。
【0023】〈具体例2の構成〉具体例2の情報検索方
法について説明する。具体例2を実現するための情報検
索装置の構成は、概ね具体例1の情報検索装置と同一で
ある。主な相違点は、制御部4の構成である。図6は、
具体例2における制御部のブロック図である。この制御
部4は、具体例1の制御部4に重み付け部4Eを追加し
た構成となっている。
【0024】〈具体例2の動作〉具体例2の情報検索方
法の検索手順は、概ね具体例1の情報検索方法の検索手
順と同一である。主な追加点は、相対重要度を算出する
算出ステップにおいて、遠近度に依存する重み付けを行
うことである。図7は、具体例2の検索フローチャート
である。以下、このフローチャートに沿いながらも、特
に、重み付けステップについて詳述する。なお、遠近度
の閾値や相対重要度の閾値は、具体例1の場合と同様で
あるとする(遠近度の閾値は2であり、相対重要度の閾
値は0.6である)。
【0025】〈入力ステップ〜検出ステップ〉 ステップS20〜21: 検索者は、キーワードKを入
力し、そのキーワードKは、制御部4内の検出部4Aへ
引き渡される。次に、検出部4Aは、シソーラス・ファ
イル部2において、そのキーワードKに対し遠近度が2
以下である単語を検出することにより、集合PR(K)
を生成する。
【0026】〈算出ステップ〉 ステップS22a: 算出部4Bは、集合PR(K)中
の各単語について、相対重要度R(ki、K)を算出す
る。 ステップS22b: 重み付け部4Eは、相対重要度R
(ki、K)と、遠近度の関数である重み付け係数δ
(D(ki、K))とを使って、重み付き相対重要度を
算出する。ここで、重み付き相対重要度をRp(ki、
K)で表記すると、図13(b1)に示す式によって算
出される。特に、遠近度が大きいほど、即ち、キーワー
ドKから離れれば離れるほど、重み付けの程度を小さく
しようとする場合には、図13(b2)(b3)に示す
ように、固定値である重み付け係数δと遠近度D(k
i、K)とを用いることにより算出することができる。
なお、ここでは、図13(b2)の式に従い、かつ、δ
=0.1であると想定する。
【0027】〈抽出ステップ〉 ステップS23: 抽出部4Cは、集合PR(K)の単
語の中から、算出された重み付き相対重要度Rp(k
i、K)が相対重要度の閾値0.6よりも大きい単語を
抽出する。図8は、抽出された単語の範囲を示す図であ
る。ここで、抽出される単語の集合をRpW(K)で表
記すると、RpW(K)={k2、k3、k4、k5、
k8、k9、k11}となる。
【0028】〈検索ステップ〜回答ステップ〉 ステップS24〜25: 検索部4Dは、抽出された単
語と、最初に入力されたキーワードKとを使って、デー
タベース部3で、該当する文書を検索する。そして、表
示操作部1は、検索された文書の内容を回答する。
【0029】〈具体例2の効果〉上述したように、具体
例2の情報検索方法では、具体例1の情報検索方法とは
異なり、検出された単語が検索に有用であるか否かを決
定する単語の抽出段階において、算出された相対重要度
をそのまま用いることなく、算出された相対重要度をキ
ーワードとその単語自身との遠近度に基づき修正してい
る。これにより、キーワードと単語とが本来的な意味や
共起度等の観点から互いに近いか遠いかという関係を、
相対重要度へ反映させることが可能となる。
【0030】さらには、遠近度が大きいほど、即ち、キ
ーワードと検出された単語とが離れているほど、算出さ
れた相対重要度を小さくするように修正している。これ
により、入力されたキーワードから遠い単語であるにも
拘わらず、隣接する単語の絶対重要度が大きいために相
対重要度が大きくなり、その結果、検索に有用であると
して抽出されてしまうと事態を回避することが可能とな
る。
【0031】〈具体例3の構成〉具体例3の情報検索方
法について説明する。具体例3を実現するための情報検
索装置の構成も、概ね具体例1の情報検索装置の構成と
同一である。主な相違点は、制御部4の構成である。図
9は、具体例3の情報検索装置における特徴的な部分の
ブロック図である。この情報検索装置は、具体例1の情
報検索装置に、過去の検索の履歴を参照する履歴参照部
4Fと、過去の検索の履歴を記憶する履歴記憶部5とを
追加した構成となっている。
【0032】〈具体例3の動作〉具体例3の情報検索方
法の検索手順は、概ね具体例1の情報検索方法の検索手
順と同一である。主な追加点は、相対重要度を算出する
算出ステップにおいて、過去の検索での相対重要度を参
照することである。図10は、具体例3の検索フローチ
ャートである。以下、このフローチャートに沿いながら
も、特に、算出ステップについて詳述する。なお、過去
において、キーワードをKs、Kt、Kuとする検索
S、T、Uがその順番で実行され、それら各検索で検出
された単語とその相対重要度との履歴が、図11に示す
ような形で履歴記憶部5に蓄積されていると想定する。
【0033】〈入力ステップ〜検出ステップ〉 ステップS30〜31: 検索S、T、Uを終えた検索
者は、さらにキーワードKを入力し、そのキーワードK
は、制御部4内の検出部4Aへ受け渡される。次に、検
出部4Aは、シソーラス・ファイル部2において、その
キーワードKに対し遠近度が2以下である単語を検出す
ることにより、集合PR(K)を作成する。
【0034】〈算出ステップ〉 ステップS32a: 算出部4Bは、集合PR(K)中
の各単語について、相対重要度R(ki、K)を算出す
る。 ステップS32b: 履歴参照部4Fは、算出された相
対重要度R(ki、K)と、履歴記憶部5に蓄積されれ
ている過去の検索S、T、Uで検出された単語kiとそ
の単語kiの相対重要度R(ki、Ks)、R(ki、
Kt)、R(ki、Ku)とを使って、履歴付き相対重
要度を算出する。
【0035】ここで、履歴付き相対重要度をRh(k
i、K)で表記すると、図14(c1)に示すように、
各検索での相対重要度Rとその検索をどの程度反映させ
るかを示す、検索時刻の関数である履歴反映係数αの積
の平均値して算出される。より具体的には、キーワード
が時刻をも表すとすると、例えば、キーワードKに基づ
き時刻Kにおいて検索した場合における単語kiの履歴
付き相対重要度Rh(ki、K)は、{R(ki、K)
*α(K)+R(ki、Ks)*α(Ks)+R(k
i、Kt)*α(Kt)+R(ki、Ku)*α(K
u)}/4として求めることができる。
【0036】なお、この式(c1)は、本来の相対重要
度R(ki、K)が相対重要度の閾値よりも大きい場合
には、その本来の相対重要度R(ki、K)をそのまま
履歴付き相対重要度Rh(ki、K)であるとみなす。
一方、本来の相対重要度R(ki、K)が相対重要度の
閾値よりも小さい場合には、過去の検索での相対重要度
R(ki、Ks)等の平均値を算出することにより、履
歴付き相対重要度Rh(ki、K)としている。特に、
現在により近い時点での検索であればあるほど、より多
くの重きをその相対重要度Rに置くようにする場合に
は、図14(c2)(c3)に示すように、固定値であ
る履歴反映係数αと、検索時刻がどの程度新しいかある
いは古いかを示す検索新旧度t(tは、大きいほど古い
ことを示す)を用いて求めることができる。
【0037】〈抽出ステップ〉 ステップS33: 抽出部4Cは、集合PR(K)の単
語の中から、算出された履歴付き相対重要度Rh(k
i、K)が相対重要度の閾値0.6よりも大きい単語を
抽出する。 〈検索ステップ〜回答ステップ〉 ステップS34〜35: 検索部4Dは、抽出された単
語と、キーワードKとを使って、データベース部3にお
いて文書を検索する。そして、表示操作部1は、検索さ
れた文書の内容を表示する。
【0038】〈具体例3の効果〉上述したように、具体
例3の情報検索方法では、具体例1の情報検索方法とは
異なり、検出された単語が検索に有用であるか否かを決
める単語の抽出段階において、現時点で算出された相対
重要度を単に用いずに、過去の検索における相対重要度
をも参照して、現時点で算出された相対重要度を修正し
た後に用いている。これにより、検索の意図をより明確
にする足跡であると位置付けられる、過去の一連の検索
での入力キーワードに基づく相対重要度を反映させるこ
とができるので、検索の意図をより明確にすることが可
能となる。なお、現時点での相対重要度が閾値よりも小
さい場合のみに、過去の検索での相対重要度を参照し、
一方、大きい場合には、過去の検索での相対重要度を参
照することなしに、現時点での相対重要度をそのまま用
いている。これにより、単語が検索に有用であるか否か
を迅速に決定することが可能となる。
【0039】また、検索を行った時点がいつであるか、
即ち、その検索が行われた時点が、現時点に近いか遠い
かによって、その検索の際に算出された相対重要度に重
み付けをしている。これにより、検索した時期に合わせ
て、その検索での相対重要度を参照する度合いを調整す
ることができるので、検索の意図をより一層明確にする
ことが可能となる。
【0040】さらに、検索した時点が、現時点に近けれ
ば近いほど、その検索において算出された相対重要度を
参照する程度をより大きくしている。一般に、検索の意
図は現時点に近い程より明確になるので、このようにす
ることにより、検索の意図がより反映された単語を抽出
することが可能となる。
【図面の簡単な説明】
【図1】具体例1の検索フローチャートである。
【図2】具体例1の情報検索装置のブロック図である。
【図3】シソーラス・ファイル部のデータ構造を示す図
である。
【図4】具体例1で検出された単語の範囲を示す図であ
る。
【図5】具体例1で抽出された単語の範囲を示す図であ
る。
【図6】具体例2における制御部のブロック図である。
【図7】具体例2の検索フローチャートである。
【図8】具体例2で抽出された単語の範囲を示す図であ
る。
【図9】具体例3の情報検索装置の特徴的な部分のブロ
ック図である。
【図10】具体例3の検索フローチャートである。
【図11】具体例3の履歴記憶部に記憶されている履歴
を示す図である。
【図12】算出ステップで用いられる式を示す図(その
1)である。
【図13】算出ステップで用いられる式を示す図(その
2)である。
【図14】算出ステップで用いられる式を示す図(その
3)である。
【符号の説明】
S10 入力ステップ S11 検出ステップ S12 算出ステップ S13 抽出ステップ S14 検索ステップ S15 回答ステップ

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 データベースから所望する情報を検索す
    るために用いるキーワードを入力するステップと、 複数の単語と、単語同士の遠近度と、単語自身の絶対重
    要度とを対応付けて格納したシソーラス・ファイルか
    ら、キーワードから一定の遠近度の範囲にある単語を検
    出する検出するステップと、 キーワードに対するその検出された単語の相対重要度
    を、その単語自身の絶対重要度とその単語に隣接する単
    語の絶対重要度とに基づき算出するステップと、 検出された単語の中から、相対重要度が所定の閾値より
    も大きい単語を抽出するステップと、 キーワード並びに抽出された単語を元に、データベース
    から所望する情報を検索するステップとからなることを
    特徴とする情報検索方法。
  2. 【請求項2】 請求項1での算出するステップにおい
    て、 キーワードに対する検出された単語の相対重要度を、そ
    の単語自身の絶対重要度と、その単語に隣接する単語の
    絶対重要度と、その単語に隣接する単語の絶対重要度を
    反映させる度合いを示す反映係数とに基づき算出するこ
    とを特徴とする情報検索方法。
  3. 【請求項3】 請求項1での算出するステップにおい
    て、 検出された単語自身の絶対重要度が所定の閾値を越える
    場合には、キーワードに対する検出された単語の相対重
    要度を、その単語自身の絶対重要度とその単語に隣接す
    る単語の絶対重要度とに基づき算出し、また、検出され
    た各単語自身の絶対重要度が所定の閾値を越える場合に
    は、キーワードに対する検出された単語の相対重要度
    を、その検出された単語自身の絶対重要度によって代表
    させることを特徴とする情報検索方法。
  4. 【請求項4】 データベースから所望する情報を検索す
    るために用いるキーワードを入力するステップと、 複数の単語、単語同士の遠近度、単語自身の絶対重要度
    を格納したシソーラス・ファイルから、キーワードから
    一定の遠近度の範囲にある単語を検出するステップと、 キーワードに対する検出された単語の相対重要度を、そ
    の単語自身の絶対重要度と、その単語に隣接する単語の
    絶対重要度と、その単語とキーワードと間の遠近度に依
    存する相対重要度の重み付けとに基づき算出するステッ
    プと、 検出された単語の中から、相対重要度が所定の閾値を越
    える単語を抽出するステップと、 キーワード並びに抽出された単語を元に、データベース
    から所望する情報を検索するステップとからなることを
    特徴とする情報検索方法。
  5. 【請求項5】 請求項4の算出するステップにおいて、 検出された単語がキーワードから遠いほど、その単語の
    相対重要度の重み付けが小さくなることを特徴とする情
    報検索方法。
  6. 【請求項6】 請求項1において、 算出するステップと抽出するステップとの間に、 算出された相対重要度度を、過去に行った検索でのキー
    ワードに対するその単語の相対重要度を用いて修正する
    ステップを有することを特徴とする情報検索方法。
  7. 【請求項7】 請求項6での修正するステップにおい
    て、 検索を行った時点に依存する相対重要度の重み付けを用
    いて修正することを特徴とする情報検索方法。
  8. 【請求項8】 請求項7での修正するステップにおい
    て、 検索を行った時点が現在に近いほど、その検索でのキー
    ワードに対する単語の相対重要度度の重み付けを大きく
    することを特徴とする情報検索方法。
  9. 【請求項9】 請求項6での修正するステップにおい
    て、 検出された単語自身の絶対重要度が所定の閾値を越えな
    い場合には、キーワードに対する単語の相対重要度を、
    その単語自身の過去における相対重要度を用いて修正
    し、また、検出された各単語自身の相対重要度が所定の
    閾値に越える場合には、キーワードに対する単語の相対
    重要度をそのまま用いることを特徴とする情報検索方
    法。
  10. 【請求項10】 請求項1、4において、 単語同士の遠近度を、単語が本来的に有する通常の意味
    に基づいて定めることを特徴とする情報検索方法。
  11. 【請求項11】 請求項10において、 単語同士の遠近度を、特定の分野において単語同士が同
    時に発生する度合いを示す共起度に基づいて定めること
    を特徴とする情報検索方法。
JP8261275A 1996-09-10 1996-09-10 情報検索方法 Pending JPH1091645A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8261275A JPH1091645A (ja) 1996-09-10 1996-09-10 情報検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8261275A JPH1091645A (ja) 1996-09-10 1996-09-10 情報検索方法

Publications (1)

Publication Number Publication Date
JPH1091645A true JPH1091645A (ja) 1998-04-10

Family

ID=17359564

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8261275A Pending JPH1091645A (ja) 1996-09-10 1996-09-10 情報検索方法

Country Status (1)

Country Link
JP (1) JPH1091645A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009026083A (ja) * 2007-07-19 2009-02-05 Fujifilm Corp コンテンツ検索装置
JP2012141756A (ja) * 2010-12-28 2012-07-26 Yahoo Japan Corp 関連語グラフ作成装置、関連語グラフ作成方法、関連語提供装置、関連語提供方法及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009026083A (ja) * 2007-07-19 2009-02-05 Fujifilm Corp コンテンツ検索装置
JP2012141756A (ja) * 2010-12-28 2012-07-26 Yahoo Japan Corp 関連語グラフ作成装置、関連語グラフ作成方法、関連語提供装置、関連語提供方法及びプログラム

Similar Documents

Publication Publication Date Title
US9639579B2 (en) Determination of a desired repository for retrieving search results
JP4467791B2 (ja) 情報管理及び検索
JP3170400B2 (ja) 意味パターン認識による文字列検索方法及びその装置
JP3820242B2 (ja) 質問応答型文書検索システム及び質問応答型文書検索プログラム
EP1225517B1 (en) System and methods for computer based searching for relevant texts
US20030135725A1 (en) Search refinement graphical user interface
US20060248458A1 (en) Method and apparatus for storing and retrieving data using ontologies
JPH11282876A (ja) 文書検索装置
JP2004326216A (ja) 文書検索装置、方法、プログラム、及び記録媒体
JP4969554B2 (ja) トピックグラフを利用したドキュメント検索サーバ及び方法
JP2000200281A (ja) 情報検索装置および情報検索方法ならびに情報検索プログラムを記録した記録媒体
EP2702509A1 (en) Alternative market search result toggle
JP2003091552A (ja) 検索要求情報抽出方法及びその実施システム並びにその処理プログラム
JP2962264B2 (ja) ユーザ嗜好自動学習方式
JPH1091645A (ja) 情報検索方法
US10108716B1 (en) Systems and methods for providing stock ticker information
JP5041802B2 (ja) クエリ分析サーバ、評価観点語データベース及び語句データベース生成方法
JP3558854B2 (ja) データ検索装置及びコンピュータ読み取り可能な記録媒体
JPH11110395A (ja) 類似文書検索装置および類似文書検索方法
JP2002117043A (ja) 文書検索装置、文書検索方法およびその方法を実施するためのプログラムを記録した記録媒体
JPH08305695A (ja) 文書処理装置
JP2002123541A (ja) 問題解決データベース検索システム及び問題解決データベース検索プログラムを記録したコンピュータ読み取り可能な記憶媒体
JPH10105578A (ja) 点数を利用した類似単語検索方法
CN115510306A (zh) 用于电力客服中的数据检索方法
JPH1091493A (ja) データベースの構築方法