JPH0793345A - 文書検索装置 - Google Patents

文書検索装置

Info

Publication number
JPH0793345A
JPH0793345A JP5233433A JP23343393A JPH0793345A JP H0793345 A JPH0793345 A JP H0793345A JP 5233433 A JP5233433 A JP 5233433A JP 23343393 A JP23343393 A JP 23343393A JP H0793345 A JPH0793345 A JP H0793345A
Authority
JP
Japan
Prior art keywords
search
document
input
dictionary
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5233433A
Other languages
English (en)
Inventor
Seiji Miike
誠司 三池
Kazuo Sumita
一男 住田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP5233433A priority Critical patent/JPH0793345A/ja
Publication of JPH0793345A publication Critical patent/JPH0793345A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 利用者がどのような検索語・検索式を入力す
ればよいかがわかるようにし、しかも、利用者が入力し
た単語にどのような同義語があるかがわかるようにする
ことができる文書検索装置を提供すること。 【構成】 入力部11から入力された検索文字列を含む
文字列で構成された見出し語を解析用辞書で検索し、そ
の検索結果を入力部11に表示するようにし、入力部で
表示された検索結果から検索文字を選択し、この選択さ
れた検索文字を文書デ−タ記憶部17に格納されている
文書の中から検索し、その検索結果を検索結果表示部1
6に表示するようにしている。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は複数の文書を格納した文
書データベースから利用者の所望する文書を検索する文
書検索装置に関する。
【0002】
【従来の技術】近来、文書情報検索装置、特にフルテキ
ストサーチ方式による文書検索装置が実現されてきてい
る。フルテキストサーチ方式では、文書中のすべての文
字または単語を検索対象とするので、キーワードを付与
する労力を必要とせず、また、利用者がキーワードに精
通する必要がないうという長所がある。
【0003】
【発明が解決しようとする課題】しかしながら、フルテ
キストサ−チ方式において、検索漏れがないようにする
ためには、必要な検索語をすべて入力する必要がある。
一般に検索したいと思う文書中にどのような単語が用い
られているかを利用者が予想することが困難であるため
に、適切な検索式を入力することが困難であるという問
題があった。すなわち、検索漏れを生じずに検索するた
めには、利用者が思いつく限りの検索語を入力する必要
があり、この場合でも、利用者が思いついた単語以外の
単語が用いられている可能性がある。また一方、検索さ
れた文書の中には利用者が必要としない文書も多数含ま
れることになる。
【0004】利用者が必要な検索語をすべて入力するこ
とは一般に困難であるので、同義語辞書を用意して、検
索語と検索語の同義語を用いて検索することが行われて
いる。しかしながら、同義語の情報は利用者や文書の種
類、専門分野によって異なるので、同義語辞書を作成す
ることは非常に困難であった。
【0005】本発明は上記の点に鑑みてなされたもの
で、その目的は利用者がどのような検索語・検索式を入
力すればよいかがわかるようにし、しかも、利用者が入
力した単語にどのような同義語があるかがわかるように
することができる文書検索装置を提供することにある。
【0006】
【課題を解決するための手段】請求項1に係わる文書検
索装置は、少なくとも見出し語を格納している辞書と、
表示手段と、複数の文書を格納している文書格納手段
と、検索文字列を入力する入力手段と、この入力手段に
より入力された検索文字列を含む文字列で構成された見
出し語を上記辞書から検索する辞書検索手段と、上記辞
書検索手段で検索された検索結果を上記表示手段に表示
する手段と、上記表示手段に表示された検索結果から検
索文字を選択する選択手段と、この選択手段で選択され
た検索文字を上記文書格納手段に格納されている文書の
中から検索する検索手段と、この検索手段により検索さ
れた検索結果を上記表示手段に表示する手段とを具備し
たことを特徴とする。
【0007】請求項2に係わる文書検索装置は、少なく
とも見出し語を格納している辞書と、表示手段と、複数
の文書を格納している文書格納手段と、検索文字列を入
力する入力手段と、この入力手段により入力された検索
文字列の一部と一致する見出し語を上記辞書から検索す
る辞書検索手段と、上記辞書検索手段で検索された検索
結果を上記表示手段に表示する手段と、上記表示手段に
表示された検索結果から検索文字を選択する選択手段
と、この選択手段で選択された検索文字を上記文書格納
手段に格納されている文書の中から検索する検索手段
と、この検索手段により検索された検索結果を上記表示
手段に表示する手段とを具備したことを特徴とする。
【0008】請求項3に係わる文書検索装置は、複合語
を構成する単語情報を記憶する辞書と、表示手段と、複
数の文書を格納している文書格納手段と、検索複合語を
入力する入力手段と、この入力手段により入力された検
索複合語を構成する構成語と同じ構成語から構成されて
いる複合語を上記辞書から検索する辞書検索手段と、上
記辞書検索手段で検索された検索結果を上記表示手段に
表示する手段と、上記表示手段に表示された検索結果か
ら検索文字を選択する選択手段と、この選択手段で選択
された検索文字を上記文書格納手段に格納されている文
書の中から検索する検索手段と、この検索手段により検
索された検索結果を上記表示手段に表示する手段とを具
備したことを特徴とする。
【0009】請求項4に係わる文書検索装置は、表示手
段と、複数の文書を格納している文書格納手段と、検索
文字列を入力する入力手段と、この入力手段により入力
された検索文字列に隣接する文字列を上記文書格納手段
に格納されている文書中から検索する第1の検索手段
と、上記検索手段で検索された検索結果を上記表示手段
に表示する手段と、上記表示手段に表示された検索結果
から検索文字を選択する選択手段と、この選択手段で選
択された検索文字を上記文書格納手段に格納されている
文書の中から検索する第2の検索手段と、この第2の検
索手段により検索された検索結果を上記表示手段に表示
する手段とを具備したことを特徴とする。
【0010】請求項5に係わる文書検索装置は、請求項
4記載の第1の検索手段は利用者が上記選択手段により
選択したあるいは破棄した文書を対象として検索するこ
とを特徴とする。
【0011】請求項6に係わる文書検索装置は、請求項
6記載の第1の検索手段は、利用者が上記入力手段から
入力した文字列の直前または直後の文字について、同じ
文字種の範囲の文字の異なるものだけを表示することを
特徴とする。
【0012】
【作用】入力手段から入力された検索文字列を含む文字
列で構成された見出し語あるいは入力された検索文字列
の一部と一致する見出し語あるいは入力された検索複合
語を構成する構成語と同じ構成語から構成されている複
合語を上記辞書で検索し、その検索結果を表示手段に表
示するようにし、表示手段に表示された検索結果から検
索文字を選択手段で選択し、この選択手段で選択された
検索文字を文書格納手段に格納されている文書の中から
検索し、その検索結果を表示手段に表示するようにして
いる。
【0013】
【実施例】以下、図1乃至図12を参照して本発明の第
1実施例に係わる文書検索装置について説明する。図1
は本文書検索装置の全体構成を示すブロック図である。
図1において、1は本発明に基づく制御や処理を行う中
央処理装置である。この中央処理装置1には半導体メモ
リ、磁気ディスク、光ディスクなどの記憶部2、検索結
果の表示や文書内容の表示を行うための液晶ディスプレ
イやプラズマディスプレイなどの表示部4の制御を行う
表示コントローラ3、利用者の検索命令の入力を行うキ
ーボードやマウスなどの入力部6、およびその制御を行
う入力コントローラ5が接続される。
【0014】次に、図2を参照して本実施例の構成につ
いて説明する。図2において、11は検索を指示するキ
ーワードもしくは自然言語からなる文または文章を入力
し、入力解析部により利用者の入力を検索命令に変換
し、検索部15に出力する入力部、12は利用者の入力
を入力部11より入力し、検索命令に変換した後、かか
る検索命令を入力部に出力し、かつ、同義語候補作成の
処理を行う入力解析部12、13は入力解析部12から
参照され、日本語解析用辞書と同義語辞書からなる解析
用辞書、14は各部を統括的に制御する制御部、15は
検索命令を入力部より入力し、文書データ記憶部17に
格納されている文書データを参照し、関連する文書集合
を検索し、その検索結果を検索結果表示部16に出力す
る検索部、16は検索結果を入力し、検索結果の文書を
表示する検索結果表示部、17は文書データおよび、文
書データを識別するための文書IDと単語からなるイン
デックステーブルを格納しておく文書データ記憶部であ
る。
【0015】なお、解析用辞書13の構成は図6に、検
索部15の検索処理については図12に、文書デ−タ記
憶部17のキ−ワ−ドインデックステ−ブルの構成を図
11に示しておく。
【0016】次に、上記のように構成された本発明の第
1実施例の動作について説明する。まず、入力部11か
ら入力文が入力されると、その入力文は入力解析部12
に送られ、この入力解析部12において入力文の形態素
解析と検索式の作成処理、および同義語候補作成の処理
が行なわれる。
【0017】図3に、入力文と、入力解析部12におけ
る当該入力文の形態素解析結果および作成された検索式
の一例を示す。形態素解析の方法は本発明の主眼ではな
く「日本語情報処理」(長尾真監修、電子通信学会)な
どに記述されている方法を用いればよい。入力解析部1
2は、形態素解析結果の中から名詞の連続する部分を取
り出し、それらを「*」を介して接続して、検索式を作
成する。つまり、図4に示すように入力部11に入力文
『自然言語処理用のソフトについて』、検索式および検
索式中の単語が表示される。そして、利用者が、入力部
11のウィンドウ上の検索語を指定し、[同義語候補表
示]をマウスなどで指定すると、入力部は入力解析部1
2を起動する。例えば、利用者が検索語の中の「ソフ
ト」を指定し、「ソフト」が表示されている行の四角の
記号が反転表示される。
【0018】以下、入力解析部12における同義語候補
作成の処理について説明する。まず、図6を参照して形
態素解析および同義語候補作成のために用いられる解析
用辞書13の構成について説明する。図6に示すよう
に、解析用辞書13は見出しと、解析に用いられる左接
続コード、右接続コード、品詞の集合で構成されてい
る。
【0019】図7に、解析用辞書を検索するための検索
用辞書構造を示す。第7図に示すように、検索用辞書は
解析用辞書の見出しの1文字めの文字の格納領域と、2
文字め以降の文字の格納領域とからなる。各格納領域
は、文字番号と文字、後方に接続可能な文字の文字番号
の並び、セパレータ0、そこまでの文字の並びからなる
見出しの辞書情報(左接続コード、右接続コード、品
詞)の並び、セパレータ0からなる。なお、格納領域の
文字は、例えばJISコード順で並べられている。ここ
で、例えば「ソフト」では、「ソ」から始まり後方に接
続可能な文字の文字番号をたどって得られる「ト」の位
置の辞書情報が、「ソフト」の見出しの存在とその辞書
情報に対応する。さらに、「ト」から後方に接続可能な
文字の文字番号をたどって得られる「ア」の位置の辞書
情報が、「ソフトウェア」に対応する。さらに、「ア」
から後方に接続可能な文字の文字番号をたどって得られ
る「機」の文字の辞書情報が、「ソフトウェア危機」に
対応する。
【0020】図8に上述した同義語候補作成処理の流れ
を示しておく。まず、検索語の1文字目を、1文字目
を、1文字めの領域の中から探す。一致する文字が存在
する場合には、さらに後方に接続可能な文字の文字番号
がある限りそれらをたどっていく。その過程で得られる
すべての見出しを出力する。このようにして、図5のよ
うな同義語の候補が入力部11に表示される。
【0021】利用者は、表示された同義語候補表示処理
結果について、修正、削除、追加を行なうことができ
る。第5図で「ソフト」の同義語の中から、利用者が
「ソフトウェア」を選択した後の表示の例を図9に示
す。利用者が[選択]を指定すると、入力解析部12は
当該の修正結果を同義語辞書と図示しないバッファに格
納し、制御を入力部11へ戻す。入力部11はバッファ
の内容に応じて、図10に示すように表示する。
【0022】以下、文書デ−タ記憶部17を検索する処
理について説明する。図11は文書データ記憶部17の
キーワードインデックステーブルの一例を示す。本実施
例では、文書中のキーワードは、TRIE構造の形式で
キーワードインデックステーブルに格納している。この
TRIE構造では、記憶容量ならびに検索の手間を削減
するため、各キーワードのうち同じ文字列を共有化して
記憶している。キーワードインデックステーブルは、各
キーワードを構成する文字とその文字の間のリンク情報
を格納している。
【0023】例えば、「機械」というキーワードに対応
して、文字「機」のリンク情報には「00935」とい
うリンク情報がある。このリンク情報は、文字「機」の
格納されているアドレスを表している。そしてアドレス
「00935」に格納されている文字「機」には、キー
ワード「機械」を含む文書データが、「file4」で
あること、さらに「機械」を前2文字の部分文字列とし
て含む別のキーワード、「機械翻訳」についてのリンク
情報として、「01201」が格納されている。このリ
ンク情報をたどることにより、「機械翻訳」をキーワー
ドとする文書データが、「file25」と「file
21」であることがわかる(「file4」などは文書
データが格納されている文書ファイル名を表してい
る)。
【0024】また、キーワード「実例」と「実験」のよ
うに、前方に同じ文字列を含むキーワードは、文字
「実」のリンク情報に格納されている二つのアドレスを
「01003」と「01004」が、それぞれ「験」と
「例」の格納されているアドレスを表している。
【0025】なお、リンク情報における「0」は、アド
レスや文書データのセパレータを表している。また、す
べてのキーワードの一文字目については、一定の連続す
る記憶領域にJISコード順などの順序でソートされて
格納されている。
【0026】検索部15は、入力解析部12で作成され
た検索式中の検索語ごとに、文書デ−タ記憶部17に格
納されている文書ファイルを検索し、その検索語を含む
文書ファイルの集合を求める。さらに、文書ファイル集
合の論理的な集合演算により検索式に合致する文書ファ
イルの集合を求める。
【0027】以下、図12を参照して検索部15の処理
について説明する。まず始めに、初期化処理として変数
i、Nをそれぞれ1、検索語の個数に設定する。変数i
は対象とする検索語を示すインデックスを表す。変数i
が変数Nより小さい間、検索語iの一文字目の文字につ
いて「一文字目の文字の格納領域」を検索し、その文字
が格納されているブロックを求め、そのブロックをブロ
ックAとする。「一文字目の文字の格納領域」には、文
字がソートされて格納されているので、文字が格納され
ているブロックを求めるためには、バイナリサーチによ
って求めることができる。
【0028】次に、変数kに2を格納する。この変数k
は、検索語iのうち着目している文字位置を表す。変数
kに格納されている値が、検索語iの文字列長より小さ
い間、各ブロックに格納されている文字と、検索語の各
文字の照合を行い対応するブロックをもとめることを行
っていく。最終的に、検索語に対応する文書データが存
在する場合、それに対応して、キーワードインデックス
テーブル中のブロックが検出できることになる。そのブ
ロックのリンク情報に格納されている文書ファイル名を
文書ファイル集合iに設定する。
【0029】上記の処理を、すべての検索語に対して行
うことにより、文書ファイル集合1から文書ファイル集
合Nには、それぞれの検索語に対応する文書ファイル集
合が設定されることになる。次のステップでは、すべて
の文書ファイル集合についても共通部分を、集合演算に
よりもとめ最終的な文書ファイル集合とする。
【0030】検索部15で得られた文書ファイル集合の
文書のタイトルなどを検索結果表示部16に表示して検
索処理を終了する。なお、図7に示した解析用辞書13
を検索するためのみ検索用辞書構造では、では後方に接
続可能な文字の文字番号の並びのみを格納したが、前方
に接続可能な文字の文字番号の並びを格納することもで
きる。すなわち、図7(a)の1文字目の格納領域に
は、後方に接続可能な文字の文字番号の並びとともに、
前方に接続可能な文字の文字番号の並びを格納する。さ
らに、図7(b)と同じ構造で、後方に接続可能な文字
の文字番号の並びの代わりに、前方に接続可能な文字の
文字番号の並びを格納した格納領域を設ける。この辞書
構造を用いて、図8に示した処理の内容と同様にして、
検索語を先頭の位置以外に含む見出し語を検索すること
ができる。
【0031】また、図7では1文字目の文字の格納領域
と、2文字目以降の文字の格納領域に分けたが、同じ格
納領域を用いることも可能である。さらに、前述した検
索部15では、予め文書を形態素解析して作成した、単
語とその単語を含む文書IDからなるキーワードインデ
ックステーブルを用いて検索したが、次のように、予め
文書を形態素解析しない方法でもよい。まず、文字所と
その文字を含む文書のIDからなるキーワードインデッ
クステーブルを用いて検索する。次に、検索された文書
中の文について形態素解析し、検索語が単語としてその
文書に含まれているかどうかをチェックしてそれらを含
む文書のもを表示する。また、キーワードインデックス
テーブルを用いずに直接文書を処理してもよい。
【0032】なお、上述の説明では、検索語を一部に含
んでいる形態素解析用辞書中の見出し単語を、検索時に
表示する方法について述べたが、利用者が解析用辞書に
単語を登録する時点に表示するようにしても良い。
【0033】以上のように、第1実施例では文書および
検索要求文を形態素解析するフルテキストサーチシステ
ムにおいて、入力された検索語について、当該の検索語
の文字列を含む形態素解析用辞書中の見出し単語を表示
し、利用者は表示された見出し単語を検索語に追加して
検索することができるようにしたので、利用者は最初に
検索語を漏れなく入力する作業の負担が軽減され、また
検索漏れを防ぐことができる。さらに、追加した検索語
を同義語辞書に保存しておくことによって後の検索時に
利用することができる。
【0034】次に、図13乃至図20を参照して本発明
の第2実施例について説明する。この第2実施例では、
文書および検索要求文を構文意味解析するフルテキスト
サーチシステムにおいて、入力された検索要求文につい
て、当該検索要求部の構文意味構造を構文意味構造の中
に含んでいる構文意味解析用辞書中の見出し語と当該構
文意味関係を表示するようにしている。
【0035】この第2実施例の機器構成及び機能構成は
前述した第1実施例の図1及び図2と以下の点を除いて
同じである。前述した第1実施例では、入力解析部12
は入力部11から入力される検索命令、および文書デー
タ記憶部17の文書を形態素解析したが、この第2実施
例では検索命令と文書素解析および構文意味解析するよ
うにしている。
【0036】つまり、入力解析部12は、入力文の形態
素解析、構文意味解析と検索式の作成処理、および同義
語候補作成の処理を行なう。図13は入力解析部12で
用いる辞書の形式と例を示すもので、図13に示すよう
に、解析用辞書は見出しと、左接続コード、右接続コー
ド、品詞、意味構造の集合で構成されている。この解析
用辞書は形態素解析、構文意味および同義語候補作成の
ために用いられる。
【0037】図14に、入力文と、入力解析部12にお
ける当該入力文の形態素解析結果、構文解析結果、意味
解析結果、不要表現規則適用結果、作成された検索式の
一例を示しておく。なお、形態素解析および構文意味解
析の方法は本発明の主眼ではなく「日本語情報処理」
(長尾真監修、電子通信学会)などに記述されている方
法を用いればよい。不要表現規則の適用では、図15に
示すような不要表現規則と、意味解析結果とを照合し、
意味解析結果から不要表現規則と一致した部分を削除す
る。
【0038】次に、上記のように構成された本発明の第
2実施例の動作について説明する。入力部11から検索
要求文字を入力すると、図12に示すように、入力文と
検索式および検索式中の単語が表示され。利用者が、
[同義候補表示]をマウスなどで指定すると、入力部1
1は入力解析部12を起動する。
【0039】この入力解析部12は、同義語候補作成の
処理を行ない、その結果を入力部11へ転送する。入力
部11は転送された結果を入力部用ウィンドウに表示す
る。図17に、同義語候補作成処理結果の表示の一例を
示している。図17では、「文書検索」の同義語候補と
して「文書情報検索」が表示されている。
【0040】以下、図18のフロ−チャ−トを参照して
同義語候補作成処理について説明する。つまり、検索式
の中で直接の意味関係にある単語Aと単語Bを取り出
し、これらの単語A、単語Bおよびそれらの間の意味関
係Cが、辞書中の一つの意味構造の中に存在するかどう
かを照合する。このように、検索式の中のすべての2つ
の単語とその間の意味関係が、辞書中の一つの意味構造
の中に存在するかどうかを照合し、すべてが存在する場
合にその意味構造を入力部へ渡す。この処理を辞書中の
すべての意味構造について行なっている。このようにし
て検索された同義語候補は表示される。
【0041】そして、利用者は、表示された同義語候補
について、修正、削除、追加を行なうことができる。図
17の表示から、利用者が新たに検索式を選択した後の
表示の例を図19に示す。図において、利用者が[選
択]を指定すると、入力解析部12は当該の修正結果を
同義語辞書と図示しないバッファに格納し、制御を入力
部11へ戻す。入力部11はバッファの内容に応じて、
図20に示すように表示する。
【0042】そして、検索部15において、前述した検
索処理が行われ、検索結果表示部16に、検索部15で
得られた文書ファイル集合のタイトルなどが表示され
る。なお、形態素解析および構文意味解析による検索方
法は本発明の主眼ではなく特願平5−12561号公報
などに記述されている方法を用いればよい。また、特願
平5−12561号公報では、予め文書を形態素解析お
よび構文意味解析して作成したキーワードインデックス
テーブルを用いて検索するが、次のように、予め解析し
ない方法でもよい。まず、入力された検索語について、
文字とその文字を含む文書のIDからなるキーワードイ
ンデックステーブルを用いて検索し、検索された文書中
の文を形態素解析、構文意味解析し、単語および構文意
味解析結果がその文書に含まれているかどうかをチェッ
クする。その結果、当該解析結果を含む文書のみを表示
する。また、キーワードインデックステーブルを用いず
に直接文書を解析処理することも可能である。
【0043】以上の説明では、検索要求文の構文意味構
造を一部に含んでいる構文意味解析用辞書中の見出し単
語を、検索時に表示する方法について述べたが、利用者
が解析用辞書に単語を登録する時点に表示してもよい。
【0044】以上のように第2実施例によれば、文書お
よび検索要求文を構文意味解析するフルテキストサーチ
システムにおいて、入力された検索要求文について、当
該検索要求部の構文意味構造を構文意味構造の中に含ん
でいる構文意味解析用辞書中の見出し語と当該構文意味
関係を表示するようにしたので、利用者は表示された構
文意味関係などを検索式に追加して検索することができ
る。従って、利用者は検索要求文の入力の負担が軽減さ
れ、また検索漏れを防ぐ効果を得られる。また、追加し
た単語や構文意味関係表現を、同義語辞書や同義意味表
現辞書に保存しておくことによって、後の検索時に利用
することができる。
【0045】次に、図21乃至図25を参照して本発明
の第3実施例について説明する。この第3実施例の機器
構成、機能構成および入力解析部12における形態素解
析と検索式作成の処理は、前述した第1実施例と同じで
あるのでその説明を省略する。
【0046】まず、入力部11から検索要求入力文を入
力すると、入力部11に図21に示すように表示され
る。そして、利用者が、当該の入力部用ウィンドウ上の
検索語を指定し、[同義語候補表示]をマウスなどで指
定すると、入力部11は入力解析部12を起動する。図
21では、利用者が検索語の中の「ソフトウェア」を指
定し、「ソフトウェア」が表示されている行の四角の記
号が反転表示されている。
【0047】入力解析部12は、反転表示された検索語
に対する同義語候補作成の処理を図23を参照して後述
するように行われ、その結果が入力部11に転送され
る。入力部11は転送された結果を入力部用ウィンドウ
に表示する。図22に、同義語候補作成処理結果の表示
の一例を示し、図22では「ソフトウェア」の同義語候
補として「ソフト」と「ウェア」が表示されている。
【0048】以下、上記の入力解析部12における同義
語候補作成処理について図23のフロ−チャ−トを参照
しながら説明する。なお、解析用辞書13の内容の形式
と例は図6と同じであり、解析用辞書13が格納されて
いる形式は図7と以下の点を除いて同じである。つま
り、図7では後方に接続可能な文字の文字番号を格納し
ていたが、この実施例では、前方に接続可能な文字の文
字番号を格納している。
【0049】まず、変数nに1をセットし、検索語の1
文字目の文字を解析用辞書の見出しの1文字目の文字か
ら探す。そして一致する文字があった場合には見出し情
報が格納されていれば、それを表示出力する。
【0050】そして、検索語の文字数がnに一致するま
で、後方に接続可能な文字の文字番号がある限りそれら
をたどっていき、その過程で得られる同義語候補につい
てはすべて表示するようにしている。
【0051】このようにして、表示された同義語候補表
示処理結果について、利用者は修正、削除、追加を行な
うことができる。図22で「ソフトウェア」の同義語候
補の中から、利用者が「ソフト」を選択した後の表示の
例を図24に示す。図24で、利用者が[選択]を指定
すると、入力解析部12は当該の修正結果を同義語辞書
と図示しないバッファに格納し、制御を入力部11へ戻
す。入力部11はバッファの内容に応じて、図25に示
すように表示する。
【0052】前述した検索部15では、予め文書を形態
解析して作成した、単語とその単語を含む文書IDから
なるキーワードインデックステーブルを用いて検索した
が、次のように、予め文書を形態素解析しない方法でも
よい。まず、文字とその文字を含む文書のIDからなる
キーワードインデックステーブルを用いて検索し、検索
された文書中の文について形態素解析し、検索語がその
文書に含まれているかどうかをチェックしてそれらを含
む文書のみを表示する。また、キーワードインデックス
テーブルを用いずに直接文書を処理してもよい。
【0053】上述の説明では、検索語を構成とする単語
と一致する形態素解析用辞書中の見出し単語を、検索時
に表示する方法について述べたが、利用者が解析用辞書
に単語を登録する時点に表示してもよい。
【0054】この第3実施例では、検索語「ソフトウェ
ア」と見出し単語「ソフト」のように、入力された検索
語の一部と一致する形態素解析用辞書中の見出し単語を
表示する方法について述べた。さらに、検索語の一部と
形態素解析用辞書中の見出し単語の一部とが一致する場
合に、当該の見出し単語を表示するようにしてもよい。
例えば、検索語として複合語である「機械翻訳」が入力
された場合に、複合語を構成する「翻訳」という単語を
含んでいる「自動翻訳」や「同時翻訳」、「翻訳本」な
どの見出し単語を表示し、利用者が選択するようにして
もよい。
【0055】以上のようにこの第3実施例によれば、文
書および検索要求分を形態素解析するフルテキストサー
チシステムにおいて、入力された検索語の一部と一致す
る形態素解析用辞書中の見出し単語を表示するようにし
たので、利用者は表示された見出し単語を検索語に追加
して検索することができる。従って、利用者は最初に検
索語を漏れなく入力する必要がないので、検索式の入力
の負担が軽減され、また検索漏れを防ぐ効果を得られ
る。また、追加した検索語を同義語辞書に保存しておく
ことによって後の検索時に利用することができる。
【0056】次に、本発明の第4実施例について図26
乃至図30を参照しながら説明する。この第4実施例の
機器構成、機能構成および入力解析部12における形態
素解析、構文意味解析と検索式作成の処理は、前述した
第2実施例と同じであるので説明を省略する。
【0057】入力解析部12では、入力文の形態素解
析、構文意味解析と検索式の作成処理、および同義候補
作成の処理を行なう。入力解析部12で用いる辞書の形
式、入力解析部の解析結果の例、および不要表現規則の
例は、図13、図14及び図15と同じである。
【0058】入力部11より検索要求入力文が入力され
ると、図26に示すように、入力文、検索式および検索
式中の単語が表示される。利用者が、[同義候補表示]
をマウスなどで指定すると、入力部11は入力解析部1
2を起動する。入力解析部12は、同義候補作成の処理
を行ない、その結果を入力部11へ転送する。入力部1
1は転送された結果を入力部用ウィンドウに表示する。
図27には、同義候補作成処理結果の表示を示すもの
で、図27では、「文書情報検索」の同義候補として
「文書検索」が表示されている状態を示している。
【0059】以下、図28を参照して同義語候補作成処
理について説明する。まず、検索式の中から単語Aを取
り出し、辞書中の意味構造と照合する。辞書中の意味構
造の中に存在する場合に、辞書中の意味構造の中から単
語Aと直接に意味関係をもつ単語Bと、当該の意味関係
Cを取り出す。単語Bと検索式を照合し、単語Aと単語
Bの間に2つ以上の意味関係が存在し、その中に意味関
係Cが存在することをチェックする。辞書中の一つの意
味構造について、その中に含まれる直接に意味関係をも
つすべての2つの単語とその間の意味関係が、検索式の
中に存在するかどうかをチェックする。そして、すべて
が存在する場合にその意味構造を入力部11へ渡す。こ
の処理を辞書中のすべての意味構造について行なう。
【0060】利用者は、以上のようにして検索された表
示された同義語候補表示処理結果について、修正、削
除、追加を行なうことができる。図27で利用者が新た
に表示された検索式を選択して後の表示の例を選択した
後の表示の例を図29に示す。
【0061】そして、図29の表示状態で、利用者が
[選択]を指定すると、入力解析部12は当該の修正結
果を同義語辞書と図示しないバッファに格納し、制御を
入力部11へ戻す。入力部11はバッファの内容に応じ
て、図30に示すように表示する。
【0062】なお、特願平5−12561号公報では、
予め文書を形態素解析および構文意味解析して作成した
キーワードインデックステーブルを用いて検索するが、
次のように、予め解析しない方法でもよい。つまり、ま
ず、入力された検索語について、文字とその文字を含む
文書のIDからなるキーワードインデックステーブルを
用いて検索し、次に、検索された文書中の文を形態素解
析、構文意味解析し、単語および構文意味解析結果がそ
の文書に含まれているかどうかをチェックする。その結
果、当該解析結果を含む文書のみを表示する。また、キ
ーワードインデックステーブルを用いずに直接文書を解
析処理することも可能である。
【0063】上述の説明では、検索要求文の構文意味構
造の一部と一致する構文意味解析用辞書中の見出し単語
を、検索時に表示する方法について述べたが、利用者が
解析用辞書に単語を登録する時点に表示してもよい。
【0064】上述の説明では、入力文の「文書情報検
索」と見出し単語「文書検索」の場合のように、入力さ
れた複合語の構文意味構造の一部と一致する構文意味構
造の見出し単語を表示する方法について述べた。さら
に、入力文の一部と構文意味解析用辞書中の見出し単語
の一部とが一致する場合に、当該の見出し単語を表示す
るようにしてもよい。例えば、検索語として複合語であ
る「機械翻訳」が入力された場合に、複合語の構文意味
構造を構成する「翻訳」という単語を構文意味構造の中
に含んでいる「自動翻訳」や「同時翻訳」などの見出し
単語を表示し、利用者が選択するようにしてもよい。当
然ながら、構文意味構造中の単語だけでなく、(道具)
や(対象)などの関係も一致する場合に同義の候補とす
ることができる。 以上のようにこの第4実施例によれ
ば、文書および検索要求文を構文意味解析するフルテキ
ストサーチシステムにおいて、入力された検索要求文に
ついて、当該検索要求文の構文意味構造の一部と一致す
る構文意味構造の構文意味解析用辞書中の見出し語と当
該構文意味関係を表示するようにしたので、利用者は表
示された構文意味関係などを検索式に追加して検索する
ことができる。従って、利用者は検索要求文の入力の負
担が軽減され、また検索漏れを防ぐ効果を得られる。ま
た、追加した単語や構文意味関係表現を、同義語辞書や
同義表現辞書に保存しておくことによって、後の検索時
に利用することができる。
【0065】以上説明した第1実施例乃至第4実施例で
は入力文中の単語や構文意味構造と、解析用辞書中の見
出し語やその構文意味構造とが一部分一致する場合に、
見出し語を同義候補として表示するものであった。以下
の第5実施例から第7実施例では、解析用辞書13では
なく、文書データ記憶部17の文書の中から同義候補を
抽出し表示するようにしている。
【0066】以上の第1乃至第4実施例では、文書の検
索処理を行なう前に解析用辞書の検索を行なったが、文
書の検索処理の後に解析用辞書の検索を行なってもよ
い、例えば、利用者の入力した文字列で文書の検索の処
理を行ない、利用者がその結果を見て判断し、必要な場
合のみに解析用辞書の検索を行えるようにし、これを利
用して文書の検索処理をやり直すようにしてもよい。ま
た、文書の検索処理と、解析用辞書の検索を並行して処
理することが可能である。すなわち、利用者の入力した
文字列で文書の検索処理を行ない、並列計算機などによ
り並行して解析用辞書の検索を行なっておく。従って、
利用者は、必要な場合に直ちに解析用辞書の検索を見る
ことが可能になる。
【0067】次に、本発明の第5実施例について図31
乃至図35を参照して説明する。この第5実施例の機器
構成、機能構成および入力解析部における形態素解析と
検索式作成の処理は、第1実施例と同じであるので説明
を省略する。同義語候補作成の処理は検索部15で行な
われる。
【0068】ところで、文書デ−タ記憶部17のキ−ワ
−ドインデックステ−ブルを図33を参照して説明す
る。図33に示すように、キーワードインデックステー
ブルでは、単語と、各単語を含んでいる文書IDとが、
当該の文書で当該の単語と隣接する単語ともに格納され
ている。例えば、「ホスト」という単語は、file1
3とfile82に含まれており、「ホスト」の後ろに
「コンピュータ」という単語が用いられている。検索部
15は、このキーワードインデックステーブルを引くこ
とにより、入力された単語にどのような単語が続いてい
るかの情報を入力部11に渡すようにしている。
【0069】入力部11より検索要求入力文が入力され
ると、入力文、検索式、検索式中の検索語および検索語
を構成している構成語が図31に示すように表示されて
いる。利用者が、当該の入力部用ウィンドウ上の構成語
を指定し、[同義語候補表示]をマウスなどで指定する
と、入力部11は入力解析部12を起動する。
【0070】図31の場合には、利用者が構成語の中の
「ホスト」を指定し、「ホスト」が表示されている行の
四角の記号が反転表示されている。そして、検索部15
は、同義語候補作成の処理と文書検索の処理を行なう。
検索部15は、同義語候補作成の処理を行なう。つま
り、検索部15は、このキーワードインデックステーブ
ルを引くことにより、入力された単語にどのような単語
が続いているかの情報を得て、入力部11へ渡す。その
結果、入力部11は転送された結果を入力部用ウィンド
ウに表示する。図32に、同義語候補作成処理結果の表
示の一例を示すもので、「ホスト計算機」の同義語候補
として「ホストコンピュータ」と「ホストサテライトシ
ステム」、「ホストプロセッサー」、「ホスト集中シス
テム」が表示されている状態を示している。
【0071】そして、利用者は、図32のように表示さ
れた同義語候補作成処理結果について、修正、削除、追
加を行なうことができる。図32で「ホスト計算機」の
同義語の中から、利用者が「ホストコンピュータ」と
「ホストプロセッサー」を選択した後の表示の例を図3
4に示す。第34図で、利用者が[選択]を指定する
と、検索部は当該の修正結果を同義語辞書と図示しない
バッファに格納し、制御を入力部11へ戻す。入力部1
1はバッファの内容に応じて、図35に示すように表示
する。
【0072】上記実施例では、文書から検索語を構成す
る構成語を含んでいる複合語を抽出し表示したが、当該
の複合語を含んでいる文を表示してもよい。さらに、検
索部15では、予め文書を形態素解析して作成した、単
語とその単語を含む文書IDからなるキーワードインデ
ックステーブルを用いて検索したが、次のように、予め
文書を形態素解析しない方法でもよい。まず、入力され
た検索語について、文字とその文字を含む文書のIDか
らなるキーワードインデックステーブルを用いて検索
し、次に、検索された文書中の文を形態素解析し、上述
と同様にして同義語候補を抽出し表示する。その後、利
用者が同義語の選択を行なう。さらに、検索語と選択さ
れた同義語について、文字のキーワードインデックステ
ーブルを用いて検索する。次に、検索された文書中の文
を形態素解析し、検索語が単語としてその文書に含まれ
ているかどうかをチェックしてそれらを含む文書のみを
表示する。なお、キーワードインデックステーブル用い
ずに直接文書を処理して検索することも可能である。
【0073】以上述べた説明では、同義語の候補を、検
索時に表示する方法について述べたが、利用者が解析用
辞書に単語を登録する時点に表示してもよい。また、次
のように複合語の構成語の情報を格納した辞書を用い
て、入力された複合語の構成語を含む辞書の見出しを検
索することが可能である。まず、図44に辞書の形式と
例を示す。図45に、入力解析部12における同義語候
補作成処理の流れを示す。図45に示すように、利用者
が指定した、複合語を構成している構成語について、複
合語中の構成語の並びの順位および構成語の表記が同じ
である複合語を辞書から探し、入力部11へ渡す。な
お、解析用辞書は、構成語の並びの順位ごとに、構成語
で検索できるように格納してもよい。また、図7などと
同様に、構成語を見出しとし、後方に接続可能な構成語
の番号、あるいは前方に接続可能な構成語の番号を格納
して、構成語から複合語を検索できるっようにしてもよ
い。
【0074】また、この第5実施例では、文書データ記
憶部17のすべての文書について、検索語に隣接する単
語を検索し表示したが、入力された検索語で文書の検索
を行ない、検索された文書の中からのみ検索語に隣接す
る単語を検索し表示してもよい。さらに、利用者が検索
された文書の中から適切であると判断した任意の数の文
書に対して、その中からのみ検索語に隣接する単語を検
索し表示してもよい。また、利用者が検索された文書の
中から適切でないと判断した任意の数の文書に対して、
その中から検索語に隣接する単語を検索表示し、利用者
がnotの条件を付けて検索するのに用いられることが
できるようにすることもできる。
【0075】以上のように第5実施例によれば、入力さ
れた検索語が複合語である場合に、複合語を構成してい
る単語が検索対象の文書中で他のどのような単語と隣接
しているかを表示したので、利用者が必要な複合語や単
語を検索語に追加し、検索できるようにすることができ
る。従って、利用者は最初に検索語を漏れなく入力する
必要がないので、検索式の入力の負担が軽減され、また
検索漏れを防ぐ効果を得られる。また、追加した検索語
を同義語辞書に保存しておくことによって後の検索時に
利用することができる。
【0076】次に、本発明の第6実施例について図36
乃至図41を参照して説明する。この第6実施例の機器
構成と機能構成、および入力解析部12における形態素
解析、構文意味解析と検索式作成の処理は、第2実施例
と同じであるので説明を省略する。文書データ記憶部1
7、検索部15における文書検索の処理、検索結果表示
部などの説明は第2実施例と同様であるのでここでは省
略する。なお、同義候補作成の処理は検索部15で行な
われる。
【0077】図38は文書データ記憶部17内の意味構
造インデックスを示しておく。文書データ記憶部17に
はさらに、図39に示す意味構造の接続情報が格納され
ている。図39では、図38に示されている意味構造の
番号で、どの意味構造がどの意味構造に接続するかが記
憶されている。例えば、101番の意味構造の後ろに、
301番と405番の意味構造が接続することが示され
ている。意味構造の番号と、図39の接続情報により、
任意の意味構造に接続する意味構造が検索できる。
【0078】入力部11から検索要求入力文を入力する
と、図36に示すように、入力文、検索式および検索式
中の単語が表示されている。利用者が、[同義候補表
示]をマウスなどで指定すると、入力部11は入力解析
部12を起動する。図36では、利用者が検索語の中の
「翻訳」を指定し、「翻訳」が表示されている行の四角
の記号が反転表示されている状態を示している。
【0079】そして、検索部15は、同義候補作成の処
理と文書検索の処理を行なう。検索部15は、同義語候
補作成の処理を行ない、その結果を入力部11へ転送す
る。入力部11は転送された結果を入力部用ウィンドウ
に表示する。図37に、同義候補作成処理結果の表示の
一例を示すもので、「機械翻訳」の同義語候補として
「自動翻訳」と「人間翻訳」が表示されている。
【0080】利用者は入力部用ウンイドに表示された同
義語候補作成処理結果について、修正、削除、追加を行
なうことができる。図37で「機械翻訳」の同義候補の
中から、利用者が「自動翻訳」を選択した後の表示の例
を図40に示す。図40で、利用者が[選択]を指定す
ると、検索部15は当該の修正結果を同義語辞書と図示
しないバッファに格納し、制御を入力部11へ戻す。入
力部11はバッファの内容に応じて、図41に示すよう
に表示する。
【0081】なお、特願平5−12561号公報では、
予め文書を形態素解析および構文意味解析して作成した
キーワードインデックステーブルを用いて検索するが、
次のように、予め解析しない方法でもよい。まず、入力
された検索語について、文字とその文字を含む文書のI
Dからなるキーワードインデックステーブルを用いて検
索し、次に、検索された文書中の文を形態素解析、構文
意味解析し、上述と同様にして同義候補を抽出し表示す
る。その後、利用者が同義候補の選択を行ない、検索語
と選択された同義候補について、文字のキーワードイン
デックステーブルを用いて検索する。次に、検索された
文書中の文を形態素解析、構文意味解析し、単語および
構文意味解析結果がその文書に含まれているかどうかを
チェックする。その結果、当該解析結果を含む文書のみ
を表示する。なお、キーワードインデックステーブルを
用いずに直接文書解析処理することも可能である。
【0082】以上の説明では、文書から同義候補を抽出
し表示したが、当該の同義候補を含んでいる文を表示し
てもよい。さらに、以上の説明では、同義語の候補を、
検索時に表示する方法について述べたが、利用者が解析
用辞書に単語を登録する時点に表示してもよい。
【0083】この実施例では、入力文の構文意味解析結
果を構成する部分が、文書中でどのような単語と隣接し
ているかを表示した。構成する部分ではなく、検索語ま
たは入力文の構文意味解析結果全体が、文書中でどのよ
うな単語と隣接しているかを表示してもよい。
【0084】また、構文意味解析の情報を格納した辞書
を用いて、入力された検索式の一部を含む単語を検索す
ることができる。図46に、この場合の入力解析部12
の同義候補作成処理の流れを示す。
【0085】この第6実施例では、文書データ記憶部1
7のすべての文書について、検索語に隣接する単語を検
索し表示したが、入力された検索語で文書の検索を行な
い、検索された文書の中からのみ検索語に隣接する単語
を検索し表示してもよい。さらに、利用者が検索された
文書の中から適切であると判断した任意の数の文書に対
して、その中からのみ検索語に隣接する単語を検索し表
示してもよい。また、利用者が検索された文書の中から
適切でないと判断した任意の数の文書に対して、その中
から検索語に隣接する単語を検索表示し、利用者がno
tの条件を付けて検索するのに用いられることができる
ようにすることもできる。
【0086】以上のように第6実施例によれば、入力さ
れた検索語が複合語である場合に、複合語を構成してい
る単語が検索対象の文書中で他のどのような単語と隣接
しているかを表示するようにしたので、利用者が必要な
複合語や単語を検索語に追加し、検索することができる
ようにする。従って、利用者は最初に検索語を漏れなく
入力する必要がないので、検索式の入力の負担が軽減さ
れ、また検索漏れを防ぐ効果を得られる。また、追加し
た検索語を同義語辞書に保存しておくことによって後の
検索時に利用することができる。
【0087】次に、本発明の第7実施例について図42
及び図43を参照して説明する。前述した第5実施例で
は検索語を構成する単語が、文書中でどのような単語と
隣接しているかを表示したが、この第7実施例では、検
索語と一致する文字列がどのような文字列と隣接してい
るかを表示するようにしている。
【0088】この第7実施例の機器構成、機能構成およ
び入力解析部12における形態素解析と検索式作成の処
理は、前述した第1実施例と同じであるので説明を省略
する。また、文書データ記憶部17、検索部15、検索
結果表示部16などの説明は前述した第1実施例と同様
であるのでここでは省略する。
【0089】検索部15は、検索結果の文書中の文字列
について、入力文字列との照合を行なう。そして、図4
2に示すように、入力文字列を含む検索結果表示部から
表示する。
【0090】図42では、「計算機」が入力された場合
の検索結果の文書から、「計算機」という文字列を含ん
だ文を検索した結果を表示している。また、「計算機」
の直後の文字列について、ひらがな、カタカナ、漢字、
その他の4つの文字の種類に従って、「計算機」の直後
の文字列で同じ文字種である範囲の文字が同じである文
は所定の1文のみを表示するようにしてもよい。図42
の結果について、この処理を行なった結果を図43に示
す。
【0091】以上のように第7実施例によれば、検索語
と一致する文字列がどのような文字列と隣接しているか
を表示するようにしたので、検索漏れを防ぐ効果を得ら
れる。
【0092】なお、以上の第1実施例から第4実施例の
辞書は、検索処理のための辞書だけではなく、利用者の
用語集や、機械翻訳システムやワードプロセッサなどの
辞書を用いて同義候補を作成するように拡張することが
できる。
【0093】前述した第5実施例、第6実施例、第7実
施例では、検索語の後ろに続く単語を表示する場合を説
明したが、前に続く単語、あるいはその両方を検索し、
表示するようにすることが可能である。第1実施例から
第7実施例では、日本語の解析と日本語文書の検索の例
を述べたが、同様に他の言語で行なうことも可能であ
る。
【0094】
【発明の効果】以上詳述したように本発明によれば、検
索要求文が入力されると、利用者が要求すれば、日本語
解析用辞書および検索対象の文書を検索して、同義語等
を表示するようにしたので、利用者がどのような検索語
・検索式を入力すればよいかがわかるようにでき、少な
い労力で、検索漏れの少ない検索結果を得られるように
することができる。
【図面の簡単な説明】
【図1】本発明の第1実施例に係わる機器構成を示すブ
ロック図。
【図2】第1実施例の機能構成を示すブロック図。
【図3】第1実施例の入力解析部の解析結果の一例を示
す図。
【図4】第1実施例の入力部の表示の一例を示す図。
【図5】第1実施例の入力部の表示の一例を示す図。
【図6】第1実施例の解析用辞書の形式とその一例を示
す図。
【図7】第1実施例の解析用辞書の格納形式の一例を示
す図。
【図8】第1実施例の解析用辞書の検索処理を示すフロ
−チャ−ト。
【図9】第1実施例の入力部の表示の一例を示す図。
【図10】第1実施例の入力部の表示の一例を示す図。
【図11】第1実施例のキーワードインデックステーブ
ルを示す図。
【図12】第1実施例の検索部の処理を示すフロ−チャ
−ト。
【図13】本発明の第2実施例に係わる解析用辞書の形
式とその一例を示す図。
【図14】第2実施例の入力解析部の解析結果の例を示
す図。
【図15】第2実施例の不要表現規則の例を示す図。
【図16】第2実施例の入力部の表示の一例を示す図。
【図17】第2実施例の入力部の表示の一例を示す図。
【図18】第2実施例の解析用辞書の検索処理を示すフ
ロ−チャ−ト。
【図19】第2実施例の入力部の表示の一例を示す図。
【図20】第2実施例の入力部の表示の一例を示す図。
【図21】本発明の第3実施例に係わる入力部の表示の
一例を示す図。
【図22】第3実施例の入力部の表示の一例を示す図。
【図23】第3実施例の解析用辞書の検索処理を示すフ
ロ−チャ−ト。
【図24】第3実施例の入力部の表示の一例を示す図。
【図25】第3実施例の入力部の表示の一例を示す図。
【図26】本発明の第4実施例に係わる入力部の表示の
一例を示す図。
【図27】第4実施例の入力部の表示の一例を示す図。
【図28】第4実施例の解析用辞書の検索処理を示すフ
ロ−チャ−ト。
【図29】第4実施例の入力部の表示の一例を示す図。
【図30】第4実施例の入力部の表示の一例を示す図。
【図31】本発明の第5実施例に係わる入力部の表示の
一例を示す図。
【図32】第5実施例の入力部の表示の一例を示す図。
【図33】第5実施例のキーワードインデックステーブ
ルを示す図。
【図34】第5実施例の入力部の表示の一例を示す図。
【図35】第5実施例の入力部の表示の一例を示す図。
【図36】本発明の第6実施例に係わる入力部の表示の
一例を示す図。
【図37】第6実施例の入力部の表示の一例を示す図。
【図38】第6実施例の入力部の表示の一例を示す図。
【図39】第6実施例の意味構造インデックステーブル
を示す図。
【図40】第6実施例の意味構造インデックステーブル
を示す図。
【図41】第6実施例の入力部の表示の一例を示す図。
【図42】本発明の第7実施例の入力部の表示の一例を
示す図。
【図43】第7実施例の表示部の表示の一例を示す図。
【図44】解析用辞書の形式とその一例を示す図。
【図45】解析用辞書の検索処理を示すフロ−チャ−
ト。
【図46】解析用辞書の検索処理を示すフロ−チャ−
ト。
【符号の説明】
1…中央処理装置、2…記憶部、3…表示コントロ−
ラ、4…表示部、5…入力コントロ−ラ、6,11…入
力部、12…入力解析部、13…解析用辞書、14…制
御部、15…検索部、16…検索結果表示部、17…文
書デ−タ記憶部。

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 少なくとも見出し語を格納している辞書
    と、 表示手段と、 複数の文書を格納している文書格納手段と、 検索文字列を入力する入力手段と、 この入力手段により入力された検索文字列を含む文字列
    で構成された見出し語を上記辞書から検索する辞書検索
    手段と、 上記辞書検索手段で検索された検索結果を上記表示手段
    に表示する手段と、 上記表示部に表示された検索結果から検索文字を選択す
    る選択手段と、 この選択手段で選択された検索文字を上記文書格納手段
    に格納されている文書の中から検索する検索手段と、 この検索手段により検索された検索結果を上記表示手段
    に表示する手段とを具備したことを特徴とする文書検索
    装置。
  2. 【請求項2】 少なくとも見出し語を格納している辞書
    と、 表示手段と、 複数の文書を格納している文書格納手段と、 検索文字列を入力する入力手段と、 この入力手段により入力された検索文字列の一部と一致
    する見出し語を上記辞書から検索する辞書検索手段と、 上記辞書検索手段で検索された検索結果を上記表示手段
    に表示する手段と、 上記表示部に表示された検索結果から検索文字を選択す
    る選択手段と、 この選択手段で選択された検索文字を上記文書格納手段
    に格納されている文書の中から検索する検索手段と、 この検索手段により検索された検索結果を上記表示手段
    に表示する手段とを具備したことを特徴とする文書検索
    装置。
  3. 【請求項3】 複合語を構成する単語情報を記憶する辞
    書と、 表示手段と、 複数の文書を格納している文書格納手段と、 検索複合語を入力する入力手段とこの入力手段により入
    力された検索複合語を構成する構成語と同じ構成語から
    構成されている複合語を上記辞書から検索する辞書検索
    手段と、 上記辞書検索手段で検索された検索結果を上記表示手段
    に表示する手段と、 上記表示部に表示された検索結果から検索文字を選択す
    る選択手段と、 この選択手段で選択された検索文字を上記文書格納手段
    に格納されている文書の中から検索する検索手段と、 この検索手段により検索された検索結果を上記表示手段
    に表示する手段とを具備したことを特徴とする文書検索
    装置。
  4. 【請求項4】 表示手段と、 複数の文書を格納している文書格納手段と、 検索文字列を入力する入力手段と、 この入力手段により入力された検索文字列に隣接する文
    字列を上記文書格納手段に格納されている文書中から検
    索する第1の検索手段と、 上記検索手段で検索された検索結果を上記表示手段に表
    示する手段と、 上記表示部に表示された検索結果から検索文字を選択す
    る選択手段と、 この選択手段で選択された検索文字を上記文書格納手段
    に格納されている文書の中から検索する第2の検索手段
    と、 この第2の検索手段により検索された検索結果を上記表
    示手段に表示する手段とを具備したことを特徴とする文
    書検索装置。
  5. 【請求項5】 上記第1の検索手段は利用者が上記選択
    手段により選択したあるいは破棄した文書を対象として
    検索することを特徴とする請求項4記載の文書検索装
    置。
  6. 【請求項6】 上記第1の検索手段は、利用者が上記入
    力手段から入力した文字列の直前または直後の文字につ
    いて、同じ文字種の範囲の文字の異なるものだけを表示
    することを特徴とする請求項4記載の文書検索装置。
JP5233433A 1993-09-20 1993-09-20 文書検索装置 Pending JPH0793345A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5233433A JPH0793345A (ja) 1993-09-20 1993-09-20 文書検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5233433A JPH0793345A (ja) 1993-09-20 1993-09-20 文書検索装置

Publications (1)

Publication Number Publication Date
JPH0793345A true JPH0793345A (ja) 1995-04-07

Family

ID=16954968

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5233433A Pending JPH0793345A (ja) 1993-09-20 1993-09-20 文書検索装置

Country Status (1)

Country Link
JP (1) JPH0793345A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0944523A (ja) * 1995-07-27 1997-02-14 Fuji Xerox Co Ltd 関連語提示装置
JPH1049543A (ja) * 1996-08-02 1998-02-20 Matsushita Electric Ind Co Ltd 文書検索装置
JPH10207896A (ja) * 1997-01-17 1998-08-07 Nippon Telegr & Teleph Corp <Ntt> 検索用語拡張方法及び装置及び情報検索方法及び装置
JP2008276769A (ja) * 2007-04-26 2008-11-13 Nhn Corp キーワード提供範囲に基づいてキーワードを提供する方法およびそのシステム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0944523A (ja) * 1995-07-27 1997-02-14 Fuji Xerox Co Ltd 関連語提示装置
JPH1049543A (ja) * 1996-08-02 1998-02-20 Matsushita Electric Ind Co Ltd 文書検索装置
JPH10207896A (ja) * 1997-01-17 1998-08-07 Nippon Telegr & Teleph Corp <Ntt> 検索用語拡張方法及び装置及び情報検索方法及び装置
JP2008276769A (ja) * 2007-04-26 2008-11-13 Nhn Corp キーワード提供範囲に基づいてキーワードを提供する方法およびそのシステム

Similar Documents

Publication Publication Date Title
US6662152B2 (en) Information retrieval apparatus and information retrieval method
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
US6876998B2 (en) Method for cross-linguistic document retrieval
US7523102B2 (en) Content search in complex language, such as Japanese
US8024175B2 (en) Computer program, apparatus, and method for searching translation memory and displaying search result
US20060129915A1 (en) Blinking annotation callouts highlighting cross language search results
JPH10232883A (ja) 多言語対応文書検索システム
JP3134204B2 (ja) 情報検索用端末装置及び情報検索用端末装置における情報表示・入出力方法
JPH07192020A (ja) 文書情報検索装置
JP3612769B2 (ja) 情報検索装置および情報検索方法
JPH09198395A (ja) 文書検索装置
JPH07182373A (ja) 文書情報検索装置及び文書検索結果表示方法
JPH08129554A (ja) 関係表現抽出装置および関係表現検索装置
JPH0793345A (ja) 文書検索装置
JPH10293765A (ja) 対訳例文検索装置
JP3856388B2 (ja) 類義性計算方法、類義性計算プログラム、類義性計算プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3222193B2 (ja) 情報検索装置
EP1605371A1 (en) Content search in complex language, such as japanese
JP2939841B2 (ja) データベース検索装置
JPH07134720A (ja) 文章作成システムにおける関連情報提示方法及び装置
JPS6175952A (ja) 文書入力処理方式
JPH0561902A (ja) 機械翻訳システム
JPH03148765A (ja) 文書検索装置
JPH05181912A (ja) 文書検索装置
JPH0973454A (ja) 文書作成装置及び文書作成方法