JP4073989B2 - 自然言語検索入力装置 - Google Patents

自然言語検索入力装置 Download PDF

Info

Publication number
JP4073989B2
JP4073989B2 JP33876797A JP33876797A JP4073989B2 JP 4073989 B2 JP4073989 B2 JP 4073989B2 JP 33876797 A JP33876797 A JP 33876797A JP 33876797 A JP33876797 A JP 33876797A JP 4073989 B2 JP4073989 B2 JP 4073989B2
Authority
JP
Japan
Prior art keywords
search
natural language
priority
logical
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP33876797A
Other languages
English (en)
Other versions
JPH11175541A (ja
Inventor
善昭 鈴木
明良 片山
良子 北川
直裕 白井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP33876797A priority Critical patent/JP4073989B2/ja
Publication of JPH11175541A publication Critical patent/JPH11175541A/ja
Application granted granted Critical
Publication of JP4073989B2 publication Critical patent/JP4073989B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、外部から入力された自然言語からこの入力自然言語に対応する論理検索式を作成して、作成した論理検索式を情報検索装置へ送出する自然言語検索入力装置に関する。
【0002】
【従来の技術】
一般に、情報検索装置においては、データベースに多数のキーワード及び該当キーワードが記載された検索対象の文書を特定する情報が登録されている。そして、検索者は自己が必要とする情報に関するキーワードを入力すると、このキーワードでデータベースを調べて、該当キーワードが記載された文書を特定する文書名、著者名、発行所、収納場所等の情報が検索結果として出力される。
【0003】
また、情報検索装置のなかには、入力するキーワードの長さに制限を設けずに複数単語からなる比較的長い文字列もキーワードとして検索可能とした全文検索装置も実用化されている。
【0004】
一方、複数のキーワードを同時に含む文書を検索する必要が生じた場合(AND条件)や、複数のキーワードのうち少なくともいずれか一方を含む文書を検索する必要が生じた場合(OR条件)や、複数のキーワードのうちの一方のみを含む文書を検索する必要が生じた場合(NOR条件)の要求を満たすために、検索者は論理検索式を作成して検索指示を出すことが可能である。
【0005】
例えば、「犬」のキーワードと「猫」のキーワードとを同時に含む文書を検索する場合の論理検索式は
[犬 AND 猫]
となる。
【0006】
さらに、近年、検索者が上述した論理検索式を作成する手間を省くために、検索者が「犬と猫を探す」等の通常の話し言葉や書き言葉等の自然言語をそのまま入力すると、この自然言語を品詞分解して、犬のキーワードと猫のキーワードとを自動的に抽出して、前述した[犬 AND 猫]の論理検索式を作成して、情報検索装置へ入力する自然言語検索入力装置が提唱されている。
【0007】
よって、この自然言語検索入力装置を用いることによって、検索者は煩雑な論理検索式を作成しなくても、自己の意図した条件で情報検索を実施できるので、検索作業能率を向上できるとともに、たとえ不慣れな検索者であっても簡単に意図した検索を実施できる。
【0008】
【発明が解決しようとする課題】
しかしながら、上述した自然言語検索入力装置においても、まだ改良すべき次のような課題があった。
すなわち、前述したような「犬と猫を探す」のような入力された自然言語に名詞と定型的な「探す」の動詞のみを含む場合は、作成される論理検索式は[犬 AND 猫]にほぼ一義的に定まる。
【0009】
しかし、入力された自然言語が「とてもかわいい犬とこわい猫を探す」等のように、名詞と「探す」の定型動詞の他に、「かわいい」や「こわい」等の形容詞や「とても」等の副詞が含まれている場合は、自然言語検索入力装置としては、形容詞や副詞を無視して、一義的に[犬 AND 猫]の一つの論理検索式を作成して検索していた。
【0010】
しかしながら、このように形容詞や副詞を無視して強制的に一つの論理検索式で検索した場合、「かわいい犬」や「こわい猫」のニュアンスを有して検索ができないので、検索者は[犬 AND 猫]の論理検索式で検索した場合の検索結果のなかから、人間(検索者)の判断で、「かわいい犬」や「こわい猫」の情報が記載された文書を再度調べる必要がある。
【0011】
さらに、仮に、自然言語検索入力装置が形容詞も名詞と同様に一つのキーワードとして認めた場合であっても、自然言語検索入力装置としては、検索者が意図した論理検索式が[犬 AND 猫]なのか、[かわいい犬 AND 猫]なのか、[かわいい犬 AND こわい猫]なのか、[とてもかわいい犬 AND 猫]なのか、[とてもかわいい犬 AND こわい猫]なのかが判断できない。
【0012】
よって、仮に検索者が[犬 AND 猫]を意図した場合においても、[かわいい犬 AND こわい猫]で検索される懸念がある。
本発明は、このような事情に鑑みてなされたものであり、入力された自然言語から可能な限り多くの論理検索式を作成可能とすることによって、検索者は作成された複数の論理検索式から自己の意図する論理検索式を簡単に指定でき、たとえ複雑な論理検索式を必要とする複雑な条件の検索を実施する場合においても、普段用いている自然言語を入力したとしても、正確に検索者の意図した情報検索を実施でき、高い操作性と高い検索精度を実現できる自然言語検索入力装置を提供することを目的とする。
【0013】
【課題を解決するための手段】
本発明は、外部から入力された自然言語からこの入力自然言語に対応する論理検索式を作成して、作成した論理検索式を情報検索装置へ送出する自然言語検索入力装置に適用される。
【0014】
そして、上述した課題を解消するために、本発明においては、入力された自然言語をそれぞれ意味を有する複数のキーワードに分解し、かつ各キーワードの品詞を特定する品詞分解処理手段と、この品詞分解された入力自然言語から1種類又は複数種類の論理検索式を作成する論理検索式作成手段と、各キーワード毎に優先度を記憶するキーワード別優先度テーブルと、作成された各論理検索式毎に、該当論理検索式を構成する各キーワードの優先度に基づいて該当論理検索式全体の優先度を算出する優先度算出手段と作成された各論理検索式を優先度の順に選択画面上に表示出力する表示出力手段と、各論理検索式が選択画面上に表示された状態で外部から選択された論理検索式を情報検索装置へ送出する論理検索式指定手段と、入力自然言語に含まれる各キーワードが情報検索装置へ送出される論理検索式に採用されたか不採用かの情報に基づいて前記キーワード別優先度テーブルに記憶された該当キーワードの優先度を増減する優先度更新手段とを備えている。
【0015】
このように構成された自然言語検索入力装置においては、自然言語を入力すると、この入力された自然言語は品詞分解された後、1種類又は複数種類の論理検索式が自動的に作成される。そして、この作成された各論理検索式は選択画面上に表示出力される。したがって、検索者は表示された複数種類の論理検索式から自己の意図する論理検索式を選択すれば、後は自動的に該当論理検索式で検索されて意図した検索結果が得られる。
【0017】
さらに、作成された1種類又は複数種類の論理検索式毎に、該当論理検索式に含まれる品詞に基づいて優先度が算出されて、各論理検索式が優先度の順に選択画面上に表示出力される。したがって、検索者はその優先度を参照して論理検索式を選択可能である。
【0019】
また、作成された1種類又は複数種類の論理検索式毎に、該当論理検索式に含まれる各キーワードの優先度に基づいて全体の優先度が算出されて、各論理検索式が優先度の順に選択画面上に表示出力される。すなわち、選択頻度が高いキーワードが含まれる論理検索式が上位に表示される。したがって、検索者はその優先度を参照して論理検索式を選択可能である。
さらに、各キーワードが情報検索装置へ送出される論理検索式に採用されたか不採用かの情報に基づいてキーワード別優先度テーブルに記憶された該当キーワードの優先度が自動的に更新されるので、この検索入力装置を用いた情報検索装置の検索精度を向上できる。
【0020】
また別の発明においては、先の発明の自然言語検索入力装置における、品詞分解処理手段、論理検索式作成手段、キーワード別優先度テーブル、表示出力手段、論理検索式指定手段、優先度更新手段のに、品詞毎に優先度を記憶する品詞別優先度テーブルを設けている。
そして、優先度算出手段は、作成された各論理検索式毎に、該当論理検索式を構成する各キーワードが所属する品詞の優先度及び該当キーワードの優先度に基づいて該当論理検索式全体の優先度を算出する、
【0021】
このように構成された自然言語検索入力装置においては、作成された1種類又は複数種類の論理検索式毎に、該当論理検索式に含まれる各キーワードの優先度及び該当キーワードが所属する品詞の優先度に基づいて全体の優先度が算出されて、各論理検索式が優先度の順に選択画面上に表示出力される。すなわち、重要なキーワードや重要な品詞が含まれる論理検索式が上位に表示される。したがって、検索者はその優先度を参照してより的確に論理検索式を選択可能である。
【0022】
さらに、別の発明の自然言語検索装置においては、入力された自然言語をそれぞれ意味を有する複数のキーワードに分解し、かつ各キーワードの品詞を特定する品詞分解処理手段と、この品詞分解された入力自然言語から1種類又は複数種類の論理検索式を作成する論理検索式作成手段と、この作成された各論理検索式からそれぞれ対応する検索自然言語を作成する検索自然言語作成手段と、各品詞毎に優先度を記憶する品詞別優先度テーブルと、各キーワード毎に優先度を記憶するキーワード別優先度テーブルと、作成された各検索自然言語毎に、該当検索自然言語を構成する各キーワードの品詞に割付けられた優先度及び該当キーワードの優先度に基づいて該当検索自然言語全体の優先度を算出する優先度算出手段と、作成された各検索自然言語を優先度の順に選択画面上に表示出力する表示出力手段と、各検索自然言語が選択画面上に表示された状態で外部から選択された検索自然言語に対応する論理検索式を前記情報検索装置へ送出する論理検索式指定手段と、入力自然言語に含まれる各キーワードが前記情報検索装置へ送出される論理検索式に採用されたか不採用かの情報に基づいて前記キーワード別優先度テーブルに記憶された該当キーワードの優先度を増減する優先度更新手段とを備えている。
【0023】
このように構成された自然言語検索入力装置においては、作成された各論理検索式からそれぞれ対応する各検索自然言語が自動的に作成されて、この各検索自然言語が検索者に取つて不慣れな論理検索式に代って、優先度が算出され、選択画面に優先度に従って表示出力される。
【0024】
したがって、検索者は通常見慣れた検索自然言語で表示された論理検索式を選択すればよいので、たとえ論理検索式に不慣であっても簡単に意図した条件で検索を実施できる。
【0034】
【発明の実施の形態】
以下本発明の一実施形態を図面を用いて説明する。
図1は本発明の自然言語検索入力装置の概略構成を示すブロック図である。
【0035】
この自然言語検索入力装置は、例えばコンピュータ等からなる一種の情報処理装置で構成されている。
自然言語検索入力装置内には、検索者の操作によつて自然言語1の検索指示が入力される入力部2、検索結果等を表示する表示器3、HDD等の補助記憶装置に形成された品詞パターン辞書4、RAM等の主記憶部内に形成された品詞別優先度テーブル5、キーワード別優先度テーブル6が設けられている。
【0036】
さらに、自然言語検索入力装置の主記憶部内には。入力した自然言語1を一時記憶する入力自然言語メモリ7、この自然言語1から作成された複数の論理検索式を一時記憶する論理検索式メモリ8、各論理検索式から作成された各論理検索式に対応する複数の検索自然言語を記憶する検索自然言語メモリ9が形成されている。
【0037】
さらに、この自然言語検索入力装置内には、アプリケーションプログラム上にプログラムモジュールとして形成された、品詞分解部10,論理検索式作成部11、検索自然言語作成部12、優先度算出部13、表示出力部14、論理検索式指定部15、情報検索装置16から得られた検索結果を表示器3へ出力する検索結果出力部17、及び優先度更新部18が設けられている。
【0038】
品詞パターン辞書4内には、日本語における意味を有する各単語毎に、該当単語がどの品詞に所属するかが記憶されている。
品詞別優先度テーブル5内には、図2に示すように、「名詞」「代名詞」「動詞」「形容詞」「副詞」「格助詞」「助詞」…等の各品詞毎に、情報検索時における重要度を示す優先度係数(優先度)Kが記憶されている。
【0039】
例えば、「名詞」は直接キーワードとして使用されるので、最も高い5の優先度係数Kが設定され、「と」や「及び」等の「格助詞」は検索時においては直接キーワードとして使用されることはないので最も低い0の優先度係数Kが設定されている。また、名詞に付加される「形容詞」は中間の3の優先度係数Kが設定されている。
【0040】
キーワード別優先度テーブル6内には、図3に示すように、日本語における意味を有する各単語からなるキーワード毎に、該当キーワードが有する累積優先度(優先度)Sが記憶されている。
【0041】
この累積優先度Sは、入力された自然言語1を構成する各キーワードのうち最終的に情報検索装置16へ送出された論理検索式に使用されたか、又は使用されなかったかで増加更新されたり減少更新される。
【0042】
すなわち、頻繁に使用されるキーワードの累積優先度Sは大きくなり、たとえ入力自然言語1に含まれていても使用されないキーワードの累積優先度Sは小さくなり、使用されない回数が増加すると、(−)値になる。図3の例においては、「とても」等の副詞からなるキーワードは使用されることは少ないので累積優先度Sは[−7]である。逆に、「犬」等の名詞からなるキーワードは使用される頻度が高いので、累積優先度Sは[9]である。
【0043】
このような構成の自然言語検索入力装置において、前記アプリケーションプログラム上に形成された各処理部10〜18は図4〜図6に示す流れ図に従って、入力した自然言語1に対する情報検索処理を実行する。
【0044】
キーボード等で構成された入力部2から自然言語1が入力すると、この入力自然言語1を一旦入力自然言語メモリ9へ格納する(S1)。次に品詞分解部10が起動して、品詞パターン辞書4を用いて、図7に示すように、入力自然言語1を、それぞれ意味のある単語である複数のキーワード20に分解する(S2)と共に、分解された各キーワード20の品詞21を特定する(S3)。
【0045】
入力自然言語1に対する品詞分解処理か終了すると、論理検索式作成部11が起動して、図5のサブルーチンに従って、入力自然言語1から図7に示す1種類又は複数種類の論理検索式22を作成する(S4)。
【0046】
図5において、入力自然言語1に含まれる名詞のキーワード20のみで論理検索式22を作成する(Q1)。次に、入力自然言語1に形容詞のキーワード20が存在する場合は(Q2)、この形容詞のキーワード20と先の名詞のキーワード20とで、すなわち先に作成した論理検索式22に形容詞のキーワード20を付加した別の論理検索式22を作成する(Q3)。
【0047】
さらに、この入力自然言語1に副詞のキーワード20が存在する場合は(Q4)、この副詞のキーワード20と先の形容詞のキーワード20と名詞のキーワード20とで、すなわち先に作成した形容詞を含む論理検索式22にさらに副詞のキーワード20を付加した、さらに別の論理検索式22を作成する(Q5)。作成した各論理検索式22を一旦論理検索式メモリ8へ格納する。
【0048】
そして、作成した論理検索式22の数Naを算出して(Q6)、図4に示すメインルーチンのS5へ戻る。
図4のS5にて、検索自然言語作成部12が起動して、先に作成したNa個の論理検索式22から、図7に示すように、通常の言語を用いたNa個の検索自然言語23を作成する。具体的には、各論理検索式22に含まれる[AND ],[OR],[NOR ]を対応する[と],[又は].[もしくは〜のいずれか一方]等の言葉に置き換える。したがって、各論理検索式22と各検索自然言語23は完全に1対1で対応する。作成した各検索自然言語23を一旦検索自然言語メモリ9へ格納する。
【0049】
検索自然言語23の作成が終了すると、S6にて、優先度算出部13が起動して、図6に示すサブルーチンに従って、作成した各検索自然言語23(論理検索式22)に対する優先度GPを算出する。
【0050】
図6の流れ図において、論理検索式22又は検索自然言語23を特定するインデックスNを1に初期設定し(R1)、R2にて、N番目の論理検索式22に対応する検索自然言語23(論理検索式22)に含まれる各キーワード20が属する品詞21の優先度係数Kを品詞別優先度テーブル5から読出す(R2)。同様に、該当キーワード20の累積優先度Sをキーワード別優先度テーブル6から読出す(R3)。そして、これらを乗算することによって各キーワード20毎の優先度P=K・Sを算出する(R4)。
【0051】
次に、該当(N番目の)検索自然言語23(論理検索式22)に含まれる各キーワード20毎の優先度P=K・Sを加算することによって、検索自然言語23(論理検索式22)全体の優先度GPを算出する(R5)。
【0052】
Figure 0004073989
以上で、一つの検索自然言語23(論理検索式22)に対する優先度GPの算出処理が終了すると、R6にて、インデックスNを更新する(N=N+1)。更新後のインデックスNが、作成した検索自然言語23(論理検索式22)の数Naを越えていないことを確認すると(R7)、R2へ戻り、更新後のN番目の検索自然言語23(論理検索式22)に対する優先度GPの算出処理を開始する。
【0053】
そして、R7にて、更新後のインデックスNが、作成した検索自然言語23 (論理検索式22)の数Naを越えると、この各検索自然言語23(論理検索式22)に対する優先度GPの算出処理を終了して、図4のメインルーチンのS7へ戻る。
【0054】
図4のメインルーチンのS7において、検索自然言語メモリ9に記憶されている各論理検索式22に対応する各検索自然言語23を先に算出した優先度GPの高い順番に並べ替える。そして、表示出力部14が起動して、検索自然言語メモリ9に記憶されている各検索自然言語23を、図8に示すように、表示器3の選択画面3a上に、優先度GPの高い順に一覧表形式で表示出力する(S8)。
【0055】
検索者が選択画面3a上に表示された複数の検索自然言語23のうち自己が意図する検索条件に合致する一つの検索自然言語23を例えばマウスでクリックすると(S9)、論理検索式指定部15が起動して、マウスで指定された検索自然言語23に対応する論理検索式22を論理検索式メモリ8から読出して情報検索装置16へ送出する(R10)。
【0056】
情報検索装置16は入力された論理検索式22で自己内のデータベースを検索して、その検索結果を出力する(S11)。S12にて検索結果出力部17が起動して、情報検索装置16で得られた検索結果を表示器3へ表示出力する(S12)。
【0057】
検索処理が終了すると、優先度更新部18が起動して、入力自然言語メモリ7に記憶されている入力自然言語1のうち、情報検索装置16に対する論理検索式22(検索自然言語23)に含まれる、すなわち実際に検索に使用された各キーワード20を抽出する(S13)。そして、S14にて、キーワード別優先度テーブル6における該当キーワードの累積優先度Sを増加更新する(S=S+1)。
【0058】
さらに、入力自然言語メモリ7に記憶されている入力自然言語1のうち、情報検索装置16に対する論理検索式22(検索自然言語23)に含まれない、すなわち検索に使用されなかった各キーワード20を抽出する(S15)。そして、S16にて、キーワード別優先度テーブル6における該当キーワードの累積優先度Sを減少更新する(S=S−1)。
【0059】
以上で検索者が入力した自然言語1を用いた一つの検索要求に対する一連の検索処理を終了する。
このように構成された自然言語検索入力装置において、具体的な自然言語1を入力した場合の動作を図7を用いて説明する。
【0060】
検索者が[とてもかわいい犬とこわい猫を探す]の自然言語1を入力すると、この自然言語1が互いに意味のある7つのキーワード20に分解され、さらに、各キーワード20の品詞21が特定される。
【0061】
そして、品詞分解された[とてもかわいい犬とこわい猫を探す]の自然言語1から、検索指示を示す「探す」の動詞が除外されて、
(1) 名詞のキーワードのみを含む
(2) 形容詞と名詞の各キーワードを含む
(5) 副詞と形容詞と名詞の各キーワードを含む
の下記に示す合計3種類の論理検索式22が作成される。
【0062】
(1) [犬 AND 猫]
(2) [かわいい犬 AND こわい猫]
(3) [とてもかわいい犬 AND こわい猫]
次に、この作成された各論理検索式22から論理検索式22の記号[AND ]を[と]の言葉に置換した3つの検索自然言語23が作成される。
【0063】
(1) [犬 と 猫]
(2) [かわいい犬 と こわい猫]
(3) [とてもかわいい犬 と こわい猫]
さらに、各検索自然言語23(論理検索式22)に対するそれぞれの優先度GPが自動的に算出される。
【0064】
(1) [犬 と 猫] GP=85
(2) [かわいい犬 と こわい猫] GP=88
(3) [とてもかわいい犬 と こわい猫] GP=74
そして、この3つの検索自然言語23が優先度GPの大きい順に並べ替えられて、
(1) [かわいい犬 と こわい猫] GP=88
(2) [犬 と 猫] GP=85
(3) [とてもかわいい犬 と こわい猫] GP=74
図8に示すように、表示器3の選択画面3aに表示される。
【0065】
そして、検索者が2番目の[犬 と 猫]の検索自然言語23をマウスで指定すると、この2番目の[犬 と 猫]の検索自然言語23に対応する[犬 AND 猫]の論理検索式22が情報検索装置16へ送出される。そして、この[犬 AND 猫]で情報検索が実行され、検索結果が表示器3に表示出力される。
【0066】
次に、入力した自然言語1のうち検索指示を示す「探す」を除いた各キーワードのうち「犬」,「と」.「猫」が実際の検索に使用されたので、キーワード別優先度テーブル6内の「犬」,「と」.「猫」の各累積優先度「9」,「0」.「8」が増加更新されて、それぞれ「10」,「1」.「9」となる。
【0067】
一方、入力した自然言語1のうち検索指示を示す「探す」を除いた各キーワードのうち「とても」,「かわいい」,「こわい」は実際の検索に使用されなかったので、キーワード別優先度テーブル6内の「とても」,「かわいい」,「こわい」の各累積優先度「−7」,「5」.「−4」が減小更新されて、それぞれ 「−8」,「4」.「−5」となる。
【0068】
よって、更新後のキーワード別優先度テーブル6は図9に示す状態となる。
このような入力処理を実施する自然言語入力装置においては、検索者は日常用いる自然言語1で検索要求を入力するのみで、この自然言語1から自動的に論理検索式22が作成されて、情報検索装置16へ出力されて検索が実行される。
【0069】
よって、検索者は煩雑な論理検索式22を作成する必要がないので、たとえ不慣れな検索者であっても、簡単に複雑な検索条件を指定した情報検索を実施できる。
【0070】
また、一つの自然言語1から複数の論理検索式22が自動的に作成されて、作成された各論理検索式22に対応する各検索自然言語23が作成される。そして、各論理検索式22(検索自然言語23)毎に、品詞毎に設定された優先度係数K及び各キーワード毎に累積された累積優先度Sを用いて優先度GPが算出される。そして、各検索自然言語23(論理検索式22)が優先度GPの順に選択画面3a上に表示される。
【0071】
この優先度GPは、自然言語検索入力装置で実際に検索に使用されるキーワード20が多く含まれるほど高い値になり、入力自然言語1に含まれるが実際に検索に使用されなかったキーワード20が多く含まれるほど低い値となる。すなわち、この優先度GPは使用頻度が高い重要な論理検索式22(検索自然言語23)ほど高い値となる。
【0072】
したがつて、検索者としては、選択画面3aに表示された複数の検索自然言語23(論理検索式22)から自己の意図する検索条件に合致する論理検索式22(検索自然言語23)を選択できると共に、無条件に優先度CPの高い論理検索式22(検索自然言語23)を選択したとしても、自己の意図する検索条件から大きく外れることはない。
【0073】
よって、この自然言語検索入力装置を長期間に亘って使用する検索者にとっては、非常に使い勝手のよい装置とすることができる。
なお、各キーワード20の累積優先度Sのみならず、該当キーワード20が属する品詞21の優先度係数Kも該当論理検索式22(検索自然言語23)に対する優先度GPの算出に寄与させているので、算出された優先度GPがより検索者の意図に近いものとなる。
【0074】
さらに、表示器3の選択画面3a上には各論理検索式22が検索自然言語23に変換された状態で表示されるので、たとえ論理検索式22に対して不慣れな検索者であっても、確実に意図した論理検索式22を選択できる。
【0075】
なお、本発明は上述した実施形態装置に限定されるものではない。
実施形態装置においては、作成した各論理検索式22を対応する検索自然言語23に変換した状態で優先度GPを算出し、表示器3の選択画面3aに表示出力した。しかし、各論理検索式22を対応する検索自然言語23に全く変換することなく、論理検索式22の状態で優先度GPを算出し、表示器3の選択画面3aに表示出力することも可能であることはいうまでもない。
【0076】
さらに、各論理検索式22(検索自然言語23)に対する優先度GPの算出に際して、この論理検索式22(検索自然言語23)を構成する各キーワード20の品詞21の優先度例数Kのみを採用したり、この論理検索式22(検索自然言語23)を構成する各キーワード20の累積優先度Sのみを採用することも可能である。
【0077】
また、各論理検索式22(検索自然言語23)に対する優先度GPの算出を実施せずに、入力自然言語1から作成された1種類又は複数種類の論理検索式22を表示器3の選択画面3aに直接表示して、検索者に選択させることも可能である、
さらに、入力部2にマイクと音声認識装置を組込んでおき、検索者が音声で自然言語を入力すると、この音声を認識して、文字データの自然言語1に変換して、入力自然言語メモリ7へ格納することも可能である。
【0078】
なお、上述した実施形態において記載した手法は、コンピュータに実行させることのできるプログラムとして、例えば磁気ディスク(フロッピーディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリなどの記録媒体に書込んで各種装置に適用したり、通信媒体により伝送して各種装置に適用することも可能である。本装置を実現するコンピュータは、記録媒体に記録されたプログラムを読込み、プログラムによって動作が制御されることにより、上述した処理を実行する。
【0079】
【発明の効果】
以上説明したように、本発明の自然言語検索入力装置においては、検索者にて入力された自然言語から可能な限り多くの論理検索式を作成して、作成した論理検索式又はこの論理検索式に対応する検索自然言語を選択画面に表示して、検索者に選択させている。
【0080】
したがって、検索者は作成された複数の論理検索式又は検索自然言語から自己の意図する論理検索式を簡単に指定でき、たとえ複雑な論理検索式を必要とする複雑な条件の検索を実施する場合においても、普段用いている自然言語を入力したとしても、正確に検索者の意図した情報検索を実施でき、高い操作性と高い検索精度を実現できる。
【0081】
さらに、作成された各論理検索式又は検索自然言語毎に検索者の検索意図に沿うような優先度を算出して、各論理検索式又は検索自然言語を優先度順に選択画面に表示して、検索者に選択させている。
【0082】
よって、検索者はより簡単に自己の意図した検索条件に合致した論理検索式を簡単に選択して情報検索できる。
また、本発明の入力処理プログラムを記憶した記録媒体においては、この記録媒体を用いることによって、上述した機能を有していない従来の自然言語検索入力装置に対しても、簡単に上述した機能を付加することができる。
【図面の簡単な説明】
【図1】 本発明の一実施形態の自然言語検索入力装置の概略構成を示すブロック図
【図2】 同実施形態の自然言語検索入力装置内に組込まれた品詞別優先度テーブルの記憶内容を示す図
【図3】 同実施形態の自然言語検索入力装置内に組込まれたキーワード別優先度テーブルの記憶内容を示す図
【図4】 同実施形態の自然言語検索入力装置における自然言語検索処理を示す流れ図
【図5】 同実施形態の自然言語検索入力装置における論理検索式作成処理を示す流れ図
【図6】 同実施形態の自然言語検索入力装置における優先度算出処理を示す流れ図
【図7】 同実施形態の自然言語検索入力装置に入力された自然言語の変遷を説明するための図
【図8】 同実施形態の自然言語検索入力装置における選択画面の表示内容を示す図
【図9】 同実施形態の自然言語検索入力装置における更新後のキーワード別優先度テーブルの記憶内容を示す図
【符号の説明】
1…自然言語
2…入力部
3…表示器
3a…選択画面
4…品詞パターン辞書
5…品詞別優先度テーブル
6…キーワード別優先度テーブル
10…品詞分解部
11…論理検索式作成部
12…検索自然言語作成部
13…優先度算出部
14…表示出力部
15…論理検索式指定部
16…情報検索装置
17…検索結果出力部
18…優先度更新部
20…キーワード
21…品詞
22…論理検索式
23…検索自然言語

Claims (3)

  1. 外部から入力された自然言語からこの入力自然言語に対応する論理検索式を作成して、作成した論理検索式を情報検索装置へ送出する自然言語検索入力装置において、
    前記入力された自然言語をそれぞれ意味を有する複数のキーワードに分解し、かつ各キーワードの品詞を特定する品詞分解処理手段と、
    この品詞分解された入力自然言語から1種類又は複数種類の論理検索式を作成する論理検索式作成手段と、
    各キーワード毎に優先度を記憶するキーワード別優先度テーブルと、
    前記作成された各論理検索式毎に、該当論理検索式を構成する各キーワードの優先度に基づいて該当論理検索式全体の優先度を算出する優先度算出手段と、
    前記作成された各論理検索式を優先度の順に選択画面上に表示出力する表示出力手段と、
    前記各論理検索式が選択画面上に表示された状態で外部から選択された論理検索式を前記情報検索装置へ送出する論理検索式指定手段と、
    前記入力自然言語に含まれる各キーワードが前記情報検索装置へ送出される論理検索式に採用されたか不採用かの情報に基づいて前記キーワード別優先度テーブルに記憶された該当キーワードの優先度を増減する優先度更新手段と
    を備えた自然言語検索入力装置。
  2. 外部から入力された自然言語からこの入力自然言語に対応する論理検索式を作成して、作成した論理検索式を情報検索装置へ送出する自然言語検索入力装置において、
    前記入力された自然言語をそれぞれ意味を有する複数のキーワードに分解し、かつ各キーワードの品詞を特定する品詞分解処理手段と、
    この品詞分解された入力自然言語から1種類又は複数種類の論理検索式を作成する論理検索式作成手段と、
    各品詞毎に優先度を記憶する品詞別優先度テーブルと、
    各キーワード毎に優先度を記憶するキーワード別優先度テーブルと、
    前記作成された各論理検索式毎に、該当論理検索式を構成する各キーワードが所属する品詞の優先度及び該当キーワードの優先度に基づいて該当論理検索式全体の優先度を算出する優先度算出手段と、
    前記作成された各論理検索式を優先度の順に選択画面上に表示出力する表示出力手段と、
    前記各論理検索式が選択画面上に表示された状態で外部から選択された論理検索式を前記情報検索装置へ送出する論理検索式指定手段と、
    前記入力自然言語に含まれる各キーワードが前記情報検索装置へ送出される論理検索式に採用されたか不採用かの情報に基づいて前記キーワード別優先度テーブルに記憶された該当キーワードの優先度を増減する優先度更新手段と
    を備えた自然言語検索入力装置。
  3. 外部から入力された自然言語からこの入力自然言語に対応する論理検索式を作成して、作成した論理検索式を情報検索装置へ送出する自然言語検索入力装置において、
    前記入力された自然言語をそれぞれ意味を有する複数のキーワードに分解し、かつ各キーワードの品詞を特定する品詞分解処理手段と、
    この品詞分解された入力自然言語から1種類又は複数種類の論理検索式を作成する論理検索式作成手段と、
    この作成された各論理検索式からそれぞれ対応する検索自然言語を作成する検索自然言語作成手段と、
    各品詞毎に優先度を記憶する品詞別優先度テーブルと、
    各キーワード毎に優先度を記憶するキーワード別優先度テーブルと、
    前記作成された各検索自然言語毎に、該当検索自然言語を構成する各キーワードの品詞に割付けられた優先度及び該当キーワードの優先度に基づいて該当検索自然言語全体の優先度を算出する優先度算出手段と、
    前記作成された各検索自然言語を優先度の順に選択画面上に表示出力する表示出力手段と、
    前記各検索自然言語が選択画面上に表示された状態で外部から選択された検索自然言語に対応する論理検索式を前記情報検索装置へ送出する論理検索式指定手段と、
    前記入力自然言語に含まれる各キーワードが前記情報検索装置へ送出される論理検索式に採用されたか不採用かの情報に基づいて前記キーワード別優先度テーブルに記憶された該当キーワードの優先度を増減する優先度更新手段と
    を備えた自然言語検索入力装置。
JP33876797A 1997-12-09 1997-12-09 自然言語検索入力装置 Expired - Fee Related JP4073989B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP33876797A JP4073989B2 (ja) 1997-12-09 1997-12-09 自然言語検索入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP33876797A JP4073989B2 (ja) 1997-12-09 1997-12-09 自然言語検索入力装置

Publications (2)

Publication Number Publication Date
JPH11175541A JPH11175541A (ja) 1999-07-02
JP4073989B2 true JP4073989B2 (ja) 2008-04-09

Family

ID=18321279

Family Applications (1)

Application Number Title Priority Date Filing Date
JP33876797A Expired - Fee Related JP4073989B2 (ja) 1997-12-09 1997-12-09 自然言語検索入力装置

Country Status (1)

Country Link
JP (1) JP4073989B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050086219A1 (en) * 2003-03-25 2005-04-21 Claria Corporation Generation of keywords for searching in a computer network
JP4385697B2 (ja) * 2003-09-24 2009-12-16 株式会社日立製作所 概念検索方法およびシステム
JP2006024071A (ja) * 2004-07-09 2006-01-26 Matsushita Electric Ind Co Ltd 自動回答検索装置
KR100923936B1 (ko) * 2008-03-14 2009-10-29 엔에이치엔(주) 일본어 사전 서비스에 있어서 2개 단어 이상의 쿼리, 한글쿼리 또는 일반적인 쿼리의 입력 시 검색 결과를 제공하는방법 및 시스템
JP2010049363A (ja) * 2008-08-19 2010-03-04 Ricoh Co Ltd ログ情報解析可視装置、ログ情報解析可視方法、ログ情報解析プログラム及び該プログラムを記憶した記憶媒体
JP5418138B2 (ja) * 2009-10-21 2014-02-19 富士通株式会社 文書検索システム、情報処理装置およびプログラム
CN108027814B (zh) * 2015-12-01 2020-06-16 华为技术有限公司 停用词识别方法与装置
JP6712520B2 (ja) * 2016-09-16 2020-06-24 株式会社野村総合研究所 検索式提示システム、検索式提示方法、およびプログラム

Also Published As

Publication number Publication date
JPH11175541A (ja) 1999-07-02

Similar Documents

Publication Publication Date Title
JP5744873B2 (ja) トラステッドクエリのシステムおよび方法
JPH07319917A (ja) 文書データべース管理装置および文書データべースシステム
JPH0756948A (ja) 情報検索装置
JP4073989B2 (ja) 自然言語検索入力装置
JP4091146B2 (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2008084070A (ja) 構造化文書検索装置およびプログラム
JP3767763B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4378106B2 (ja) 文書検索装置、文書検索方法及びプログラム
JP3733374B2 (ja) 情報検索装置
JPH1145252A (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4000332B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2007164462A (ja) 質問応答システム、質問応答方法及び質問応答プログラム
JP4085568B2 (ja) テキストマイニング方法およびテキストマイニング装置並びにコンピュータ読み取り可能な記憶媒体
JPH1145266A (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1145254A (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4384736B2 (ja) 画像検索装置およびその装置の各手段としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4138048B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1145269A (ja) 文書管理支援システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1145249A (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3431618B2 (ja) データ検索装置および検索方法
JPH07325837A (ja) 抽象単語による通信文検索装置及び抽象単語による通信文検索方法
JPH09128395A (ja) 文書作成装置及び文書作成方法
JPH1145255A (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
Guglielmo et al. Overview of natural language processing of captions for retrieving multimedia data
JP2654533B2 (ja) データベース日本語表記候補生成方式

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040924

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071030

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071106

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080124

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110201

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120201

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130201

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140201

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees