JP2003228578A - 情報検索方法及び情報検索装置及び情報検索装置の制御プログラム - Google Patents

情報検索方法及び情報検索装置及び情報検索装置の制御プログラム

Info

Publication number
JP2003228578A
JP2003228578A JP2002025406A JP2002025406A JP2003228578A JP 2003228578 A JP2003228578 A JP 2003228578A JP 2002025406 A JP2002025406 A JP 2002025406A JP 2002025406 A JP2002025406 A JP 2002025406A JP 2003228578 A JP2003228578 A JP 2003228578A
Authority
JP
Japan
Prior art keywords
information
query
morpheme
synonym
string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002025406A
Other languages
English (en)
Other versions
JP2003228578A5 (ja
Inventor
Tomonori Kudou
朋紀 工藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2002025406A priority Critical patent/JP2003228578A/ja
Publication of JP2003228578A publication Critical patent/JP2003228578A/ja
Publication of JP2003228578A5 publication Critical patent/JP2003228578A5/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 検索漏れを減少し且つ検索精度を高め、しか
も操作性を向上させることを可能にした情報検索方法及
び情報検索装置及び情報検索装置の制御プログラムを提
供する。 【解決手段】 情報を検索する際に、入力されたクエリ
ーを言語解釈し(S402)、自立語だけではなく、意
味的にまとまった付属語列に対しても類義の単語列に展
開する(S403)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報検索方法及び
情報検索装置及びこの情報検索装置を制御するための制
御プログラムに関する。
【0002】
【従来の技術】図20は、従来の情報検索装置のシステ
ム構成を示すブロック図であり、同図において、200
1は中央処理装置で、制御プログラムに従って処理を実
行するものである。2002は記憶装置で、検索対象と
なる文書やアノテーション付き画像等や、制御プログラ
ム及び辞書等が格納されている。2003は入力装置
で、処理を指示操作するための情報を入力するためのキ
ーボード、マウス等から成る。2004は表示装置で、
検索結果等を表示するものである。2005は記憶媒体
読取装置で、FD(フロッピー(登録商標)ディス
ク)、CD−ROM、ROM、磁気記録テープ等の記録
媒体に記録されたプログラム或いはデータを読み取るも
のである。
【0003】図21は、従来の情報検索装置の処理動作
の流れを示すフローチャートであり、ステップS210
1で入力装置2003によりクエリーを取得する。次
に、ステップS2102で前記ステップS2101にお
いて取得したクエリーの単語を記憶装置2002に格納
された図22に示すような同義語辞書により展開する。
次に、ステップS2103で前記ステップS2102に
おいて展開した単語と記憶装置2002にあるデータベ
ース等に格納されている文書等とが一致するか否かを判
断する。そして、一致すると判断された場合はステップ
S2104へ、また、一致しないと判断された場合はス
テップS2106へ、それぞれ進む。
【0004】ステップS2104では、前記ステップS
2103において一致した度合に応じて一致度を計算す
る。次に、ステップS2105へ進んで一致した文書等
を検索結果リストに追加する。次に、ステップS210
6へ進んで記憶装置2002から取得したデータが最後
のデータであるか否かを判断する。そして、最後のデー
タではないと判断された場合は、前記ステップS210
3へ戻り、また、最後のデータであると判断された場合
は、次のステップS2107へ進んで検索結果を表示装
置2004へ表示した後、本処理動作を終了する。
【0005】図23は、従来の情報検索装置におけるク
エリー入力状態の一例を示す図であり、以下、同図に示
す例に基づいて具体的に説明する。
【0006】図23に示すように入力されたクエリー
「登山に関する本」を取得し、記憶装置2002に格納さ
れている文書等と一致するか否かを判断する。そして、
一致した場合は、検索結果リストに追加し、検索対象文
書等を全て検索する。つまり、クエリーを含むデータを
判定し、リストアップする。
【0007】検索処理が終了すると、図24に示すよう
に、一致した文書等を検索順または一致度の大きいもの
から順に一覧表示を検索結果として表示装置2004に
表示する。
【0008】図23に示すように、クエリーとして「登
山に関する本」というクエリーを入力した場合、図24
に示すような検索結果が得られる。
【0009】この例では、ユーザは「登山に関する本」に
関する文書或いは画像を検索したいという意図で検索を
行ったと仮定した場合、既に登録されている文書には
「登山に関する本」、「登山の本」、「山登りについての書
籍」、「ロッククライミング入門書」等、様々な表記によ
って記載されている。
【0010】
【発明が解決しようとする課題】しかしながら、上記従
来装置によれば、図25に示すように「登山」を「山登
り」や「ロッククライミング」、同様に「本」を「書籍」や「入
門書」のように単語を意味的に似た単語に展開するため
に、同義語辞書、類義語辞書等を用いて、同義語を展開
することで単語レベルの表記のゆれに対応していたが、
単語の展開では例の「登山の本」、「山登りについての
書籍」等の表記ゆれを検索することはできず、検索漏れ
が多くなるという問題点があった。
【0011】また、上記従来装置によれば、図26に示
すように、助詞等の付属語を無視すると「登山に本を持
っていく。」等も検索されてしまい、検索意図とはそぐ
わない文書或いは画像等が検索されてしまい、検索精度
が低いという問題点があった。
【0012】更に、上記従来装置によれば、単純一覧、
一致度の高い順に一覧しても、目的の文書或いは画像等
を得るためには、ユーザは多くの操作や確認が必要とな
り、そのために多くの時間がかかり、操作性が良くない
という問題点があった。
【0013】本発明は、上記従来技術の有する問題点を
解消するためになされたもので、その目的は、検索漏れ
を減少し且つ検索精度を高め、しかも操作性を向上させ
ることを可能にした情報検索方法及び情報検索装置及び
情報検索装置の制御プログラムを提供することである。
【0014】
【課題を解決するための手段】上記目的を達成するため
に本発明の情報検索方法は、1つ以上連続する形態素と
同義または類義の1つ以上連続する形態素を関連付けた
類義語辞書を記憶する辞書記憶ステップと、文字列を含
む情報を複数保持する情報保持ステップと、クエリーを
入力するクエリー入力ステップと、文字列を言語解析し
て形態素に分解する言語解析ステップと、類義語辞書を
検索してクエリーの形態素列と類義の形態素列を展開す
る類義語展開ステップと、クエリーを展開した形態素列
と保持された情報の形態素列を比較する形態素列比較ス
テップと、一致した形態素を含む情報名等を少なくとも
1つ表示する検索結果表示ステップとを有することを特
徴とする。
【0015】また、上記目的を達成するために本発明の
情報検索装置は、1つ以上連続する形態素と同義または
類義の1つ以上連続する形態素を関連付けた類義語辞書
を記憶する辞書記憶手段と、文字列を含む情報を複数保
持する情報保持手段と、クエリーを入力するクエリー入
力手段と、文字列を言語解析して形態素に分解する言語
解析手段と、類義語辞書を検索してクエリーの形態素列
と類義の形態素列を展開する類義語展開手段と、クエリ
ーを展開した形態素列と保持された情報の形態素列を比
較する形態素列比較手段と、一致した形態素を含む情報
名等を少なくとも1つ表示する検索結果表示手段とを有
することを特徴とする。
【0016】また、上記目的を達成するために本発明の
情報検索方法は、自立語と同義または類義の自立語を関
連付けた自立語類義語辞書と付属語列と同義または類義
の付属語列を関連付けた付属語類義語辞書とを記憶する
記憶ステップと、文字列を含む情報を複数保持する情報
保持ステップと、クエリーを入力するクエリー入力ステ
ップと、文字列を言語解析して形態素に分解する言語解
析ステップと、類義語辞書を検索してクエリーの含まれ
る自立語と類義の自立語を展開する自立語類義語展開ス
テップと、類義語辞書を検索してクエリーの含まれる付
属語列と類義の付属語列を展開する付属語列類義語展開
ステップと、クエリーを展開した形態素列の表記文字列
と保持された情報の表記文字列を比較する文字列比較ス
テップと、類義語の類似度から一致する度合を計算する
一致度計算ステップと、一致した形態素を含む情報名等
を少なくとも1つ一致度の順に表示する検索結果表示ス
テップとを有することを特徴とする。
【0017】また、上記目的を達成するために本発明の
情報検索装置は、自立語と同義または類義の自立語を関
連付けた自立語類義語辞書と付属語列と同義または類義
の付属語列を関連付けた付属語類義語辞書とを記憶する
記憶手段と、文字列を含む情報を複数保持する情報保持
手段と、クエリーを入力するクエリー入力手段と、文字
列を言語解析して形態素に分解する言語解析手段と、類
義語辞書を検索してクエリーの含まれる自立語と類義の
自立語を展開する自立語類義語展開手段と、類義語辞書
を検索してクエリーの含まれる付属語列と類義の付属語
列を展開する付属語列類義語展開手段と、クエリーを展
開した形態素列の表記文字列と保持された情報の表記文
字列を比較する文字列比較手段と、類義語の類似度から
一致する度合を計算する一致度計算手段と、一致した形
態素を含む情報名等を少なくとも1つ一致度の順に表示
する検索結果表示手段とを有することを特徴とする。
【0018】また、上記目的を達成するために本発明の
情報検索装置の制御プログラムは、情報検索装置を制御
するためのコンピュータ読み取り可能な制御プログラム
であって、1つ以上連続する形態素と同義または類義の
1つ以上連続する形態素を関連付けた類義語辞書を記憶
する辞書記憶ステップと、文字列を含む情報を複数保持
する情報保持ステップと、クエリーを入力するクエリー
入力ステップと、文字列を言語解析して形態素に分解す
る言語解析ステップと、類義語辞書を検索してクエリー
の形態素列と類義の形態素列を展開する類義語展開ステ
ップと、クエリーを展開した形態素列と保持された情報
の形態素列を比較する形態素列比較ステップと、一致し
た形態素を含む情報名等を少なくとも1つ表示する検索
結果表示ステップとをコンピュータに実行させるための
プログラムコードから成ることを特徴とする。
【0019】更に、上記目的を達成するために本発明の
情報検索装置の制御プログラムは、情報検索装置を制御
するためのコンピュータ読み取り可能な制御プログラム
であって、自立語と同義または類義の自立語を関連付け
た自立語類義語辞書と付属語列と同義または類義の付属
語列を関連付けた付属語類義語辞書とを記憶する記憶ス
テップと、文字列を含む情報を複数保持する情報保持ス
テップと、クエリーを入力するクエリー入力ステップ
と、文字列を言語解析して形態素に分解する言語解析ス
テップと、類義語辞書を検索してクエリーの含まれる自
立語と類義の自立語を展開する自立語類義語展開ステッ
プと、類義語辞書を検索してクエリーの含まれる付属語
列と類義の付属語列を展開する付属語列類義語展開ステ
ップと、クエリーを展開した形態素列の表記文字列と保
持された情報の表記文字列を比較する文字列比較ステッ
プと、類義語の類似度から一致する度合を計算する一致
度計算ステップと、一致した形態素を含む情報名等を少
なくとも1つ一致度の順に表示する検索結果表示ステッ
プとをコンピュータに実行させるためのプログラムコー
ドから成ることを特徴とする。
【0020】
【発明の実施の形態】以下、本発明の一実施の形態につ
いて、図1〜図19を用いて説明する。
【0021】尚、本実施の形態に係る情報検索装置の基
本的な構成は、上述した従来例における図20と同一で
あるので、同図を流用して説明する。
【0022】本実施の形態に係る情報検索装置は、図1
に示すような複数のサーバー101及びクライアント1
02がネットワーク103によって接続されているシス
テムに対しても適用される。また、本実施の形態に係る
情報検索装置は、図2に示すような端末201としてイ
ンターネット202に接続し、WEBの検索等にも適用
される。
【0023】図3は、本実施の形態に係る情報検索装置
におけるデータベースに文書等を登録する場合に行う言
語解析処理動作の流れを示すフローチャートであり、ス
テップS301で登録データ(文書等)を言語解析し、
言語解析インデックスを作成する。尚、このステップS
301では、単語辞書等を参照しながら、形態素解析を
行い、場合により構文解析や意味解析等を行う。次に、
ステップS302で前記ステップS301において得ら
れた解析結果をデータベースの図11に示すようなイン
デックスに登録した後、本処理動作を終了する。
【0024】図4は、本実施の形態に係る情報検索装置
における情報検索処理動作の流れを示すフローチャート
であり、ステップS401で表示装置2004に表示さ
れた上述した従来例の図23に示すような入力画面に対
して「登山に関する本」と入力装置2003により入力さ
れた文字列のクエリーを取得する。次に、ステップS4
02で前記ステップS401において取得したクエリー
の言語解析を行い、形態素分割等を行い、例えば、「登
山」、「に関する」、「本」等の単語を切り出す。
【0025】次に、ステップS403で前記ステップS
402において切り出された形態素と意味的に代表する
形態素を、記憶装置2002に格納された図19に示す
ような類義語辞書を検索して、抽出する。このステップ
S403では、抽出した結果、「登山」に対しては「山登
り」、「ロッククライミング」等が抽出される。同様に、
「に関する」に対しては「に関しての」、「について」、
「の」等が、「本」に対しては「書籍」、「書」等がそれぞれ
抽出される。
【0026】次に、ステップS404で記憶装置200
2に格納された文書や画像に付属するアノテーション等
を、言語解析を行い単語分解する(登録データ言語処
理)。次に、ステップS405で前記ステップS403
において取得した意味的な展開を行った結果と前記ステ
ップS404において得られた言語解析結果の中に一致
する形態素が存在するか否かを判断する。そして、一致
する形態素が存在しないと判断された場合はステップS
408へ、また、一致する形態素が存在すると判断され
た場合はステップS406へ、それぞれ進む。例えば、
「登山」、「に関する」、「本」は一致するのでステップS
406へ進む。
【0027】ステップS406では、前記ステップS4
05において一致した度合に応じて一致度を計算する。
次に、ステップS407へ進んで一致した文書等を検索
結果リストに追加する。次に、ステップS408へ進ん
で記憶装置2002から取得したデータが最後のデータ
であるか否かを判断する。そして、最後のデータではな
いと判断された場合は、前記ステップS404へ戻り、
また、最後のデータであると判断された場合は、次のス
テップS409へ進んで図9に示すような検索結果リス
トとして、1.「登山」「に関する」「本」、2.「山登
り」「に関する」「本」、3.「登山」「についての」「書
籍」、4.「ロッククライミング」「の」「本」、5.「登山」
「入門」「書」のような検索結果を表示装置2004へ一致
度の高い順に一覧表示した後、本処理動作を終了する。
【0028】図5は、本実施の形態に係る情報検索装置
における単語展開処理動作の流れを示すフローチャート
であり、図10に示すデータの流れを基に表示例に従っ
て説明する。
【0029】まず、ステップS501で、例えば、「登
山」、「に関する」、「本」のような展開元の単語列を取
得する。次に、ステップS502で記憶装置2002に
格納された図12(自立語用)、図13(付属語列用)、
図14(自立語付属語混在用)に示すような見出し語辞
書を検索する。
【0030】次に、ステップS503で前記ステップS
502における検索結果に基づいて、例えば、「登山」
に対しては意味ID「31」、「に関する」に対しては
意味ID「32」、「本」に対しては意味ID「45」
のように、意味IDを取得する。次に、ステップS50
4で前記ステップS503において取得した意味IDか
ら記憶装置2002に格納された図15に示すようなI
D辞書(自立語用)、図16に示すようなID辞書(付
属語列用)図17に示すようなID辞書(自立語付属語
混在用)を検索する。次に、ステップS505で前記ス
テップS504における検索結果に基づいて、例えば、
「登山」に対しては「山登り」「ロッククライミング」
等、「に関する」に対しては「についての」、「に関し
ての」「に対しての」「の」等、「本」に対しては「書
籍」「書」等のような、展開後の単語列の表記を取得した
後、本処理動作を終了する。
【0031】図6は、本実施の形態に係る情報検索装置
における単語展開処理動作の流れを示すフローチャート
であり、図10に示すデータの流れを基に表示例に従っ
て説明する。
【0032】ステップS601で、例えば、「登山」、
「に関する」、「本」のような展開元の単語列を取得す
る。次に、ステップS602で記憶装置2002に格納
された図18や図19に示すような類義語辞書を検索す
る。
【0033】次に、ステップS603で前記ステップS
602における検索結果に基づいて、例えば、「登山」
に対しては「山登り」、「ロッククライミング」等、「に
関する」に対しては「についての」、「に関しての」、
「の」等、「本」に対しては「書籍」、「書」等を展開後
の単語列の表記として取得する。次に、ステップS60
4で前記ステップS602における検索結果に基づい
て、例えば、「山登り」0.75、「ロッククライミン
グ」0.42、「について」0.86、「に関しての」
0.44、「の」0.55、「書籍」0.86、「書」
0.55等の類似度を取得した後、本処理動作を終了す
る。
【0034】図7は、本実施の形態に係る情報検索装置
における情報検索処理動作の流れを示すフローチャート
であり、ステップS701で図14に示すように表示装
置2004に表示された入力画面に対して「登山に関す
る本」と入力装置2003により入力された文字列のク
エリーを取得する。次に、ステップS702で前記ステ
ップS701において取得したクエリーの言語解析を行
い、形態素分割等を行い、「登山」、「に関する」、
「本」等の単語を切り出す。
【0035】次に、ステップS703で前記ステップS
702において切り出された形態素を意味的に代表する
形態素を、記憶装置2002に格納された図19に示す
ような類義語辞書を検索して、抽出する。このステップ
S703では、抽出した結果、「登山」に対しては「山登
り」、「ロッククライミング」等が抽出される。同様に、
「本」に対しては「書籍」、「書」等が抽出される。
【0036】次に、ステップS704で前記ステップS
702において切り出された形態素を意味的に代表する
形態素を、記憶装置2002に格納された図19に示す
ような類義語辞書を検索して、抽出する。このステップ
S704では、抽出した結果、「に関する」に対しては
「に関しての」、「について」、「の」等が抽出される。
【0037】次に、ステップS705で記憶装置200
2に格納された文書や画像に付属するアノテーション等
の図3の登録処理時にステップS301において作成さ
れたインデックスと前記ステップS703及びステップ
S704において取得した意味的な展開を行った結果と
一致する形態素が存在するか否かを判断する。そして、
一致する形態素が存在しないと判断された場合はステッ
プS708へ、また、一致する形態素が存在すると判断
された場合はステップS706へ、それぞれ進む。例え
ば、「登山」、「に関する」、「本」は一致するのでステッ
プS706へ進む。
【0038】ステップS706では、前記ステップS7
05において一致した度合に応じて一致度を計算する。
次に、ステップS707へ進んで一致した文書等を検索
結果リストに追加する。次に、ステップS708へ進ん
で記憶装置2002から取得したデータが最後のデータ
であるか否かを判断する。そして、最後のデータではな
いと判断された場合は、前記ステップS705へ戻り、
また、最後のデータであると判断された場合は、次のス
テップS709へ進んで図9に示すような検索結果リス
トとして、1.「登山」、「に関する」、「本」、2.「山
登り」、「に関する」、「本」、3.「登山」、「について
の」、「書籍」、4.「ロッククライミング」、「の」、
「本」、5.「登山」、「入門」、「書」のような検索結果を表
示装置2004へ一致度の高い順に一覧表示した後、本
処理動作を終了する。
【0039】図8は、本実施の形態に係る情報検索装置
における情報検索処理動作の流れを示すフローチャート
であり、ステップS801で上述した従来例の図23に
示すように表示装置2004に表示された入力画面に対
して「登山に関する本」と入力装置2003により入力さ
れた文字列のクエリーを取得する。次に、ステップS8
02で前記ステップS801において取得したクエリー
の言語解析を行い、形態素分割等を行い、「登山」、
「に関する」、「本」等の単語を切り出す。
【0040】次に、ステップS803で前記ステップS
802において切り出された形態素を意味的に代表する
形態素を、記憶装置2002に格納された図19に示す
ような類義語辞書を検索して、抽出する。このステップ
S803では、抽出した結果、「登山」に対しては「山登
り」、「ロッククライミング」等が、「に関する」に対して
は「に関しての」、「について」「の」等が、「本」に対し
ては「書籍」、「書」等がそれぞれ抽出される。
【0041】次に、ステップS804で記憶装置200
2に格納された文書や画像に付属するアノテーション等
の図3の登録処理時にステップS301において作成さ
れたインデックスと前記ステップS803において取得
した意味的な展開を行った結果と一致する形態素が存在
するか否かを判断する。そして、一致する形態素が存在
しないと判断された場合はステップS807へ、また、
一致する形態素が存在すると判断された場合はステップ
S805へ、それぞれ進む。例えば、「登山」、「に関す
る」、「本」は一致するのでステップS805へ進む。
【0042】ステップS805では、前記ステップS8
05において一致した度合に応じて一致度を計算する。
次に、ステップS806へ進んで一致した文書等を検索
結果リストに追加する。次に、ステップS807へ進ん
で記憶装置2002から取得したデータが最後のデータ
であるか否かを判断する。そして、最後のデータではな
いと判断された場合は、前記ステップS804へ戻り、
また、最後のデータであると判断された場合は、次のス
テップS808へ進んで図9に示すような検索結果リス
トとして、1.「登山」、「に関する」、「本」、2.「山
登り」、「に関する」、「本」、3.「登山」、「について
の」、「書籍」、4.「ロッククライミング」、「の」、
「本」、5.「登山」、「入門」、「書」のような検索結果を表
示装置2004へ一致度の高い順に一覧表示した後、本
処理動作を終了する。
【0043】以上のように本実施の形態に係る情報検索
装置によれば、目的の文書やアノテーション付きの画
像、WEB等の情報を検索する際に,入力されたクエリ
ーを言語解析し、自立語だけではなく、意味的にまとま
った付属語列に対しても同義語或いは類義語辞書を使用
し、類義の単語列に展開することによって、検索漏れを
減少し且つノイズの少ない精度の高い検策結果が得られ
るため、ユーザの操作性を大幅に向上させることがで
き、目的の情報を効果的に検策することが可能とるとい
う効果を奏する。
【0044】なお、本発明は複数の機器から構成される
システムに適用してもよいし、1つの機器からなる装置
に適用してもよい。さらに、本発明はシステムまたは装
置にプログラムを供給することによって達成される場合
にも適用できることはいうまでもない。
【0045】この場合、本発明を達成するためのソフト
ウェアによって表わされる制御プログラムを格納した記
憶媒体を、システム或いは装置に読み出すこと、或いは
前記制御プログラムを、ネットワーク経由でシステム或
いは装置に読み出すことによって、そのシステム或いは
装置が本発明の効果を享受することが可能となる。
【0046】また、前記制御プログラムを記憶するため
の記憶媒体としては、ハードディスク、フロッピー(登
録商標)ディスク、光ディスク、光磁気ディスク、CD
−R、DVD、磁気テープ、不揮発性のメモリカード、
CD−ROM等を用いることができるのは言うまでもな
い。
【0047】
【発明の効果】以上詳述したように本発明によれば、検
索漏れが減少し且つノイズの少ない精度の高い検策結果
が得られるため、ユーザの操作性が大幅に向上し、目的
の情報を効果的に検策することが可能となるという効果
を奏する。
【図面の簡単な説明】
【図1】本発明の一実施の形態に係る情報検索装置のネ
ットワークとの接続例を示す図である。
【図2】本発明の一実施の形態に係る情報検索装置のイ
ンターネットとの接続例を示す図である。
【図3】本発明の一実施の形態に係る情報検索装置にお
けるデータベースに文書等を登録する場合に行う言語解
析処理動作の流れを示すフローチャートである。
【図4】本発明の一実施の形態に係る情報検索装置にお
ける情報検索処理動作の流れを示すフローチャートであ
る。
【図5】本発明の一実施の形態に係る情報検索装置にお
ける単語展開処理動作の流れを示すフローチャートであ
る。
【図6】本発明の一実施の形態に係る情報検索装置にお
ける単語展開処理動作の流れを示すフローチャートであ
る。
【図7】本発明の一実施の形態に係る情報検索装置にお
ける情報検索処理動作の流れを示すフローチャートであ
る。
【図8】本発明の一実施の形態に係る情報検索装置にお
ける情報検索処理動作の流れを示すフローチャートであ
る。
【図9】本発明の一実施の形態に係る情報検索装置にお
ける情報検索結果の一例を示す図である。
【図10】本発明の一実施の形態に係る情報検索装置に
おけるデータの流れの一例を示す図である。
【図11】本発明の一実施の形態に係る情報検索装置に
おけるデータベースの言語解析インデックスの一例を示
す図である。
【図12】本発明の一実施の形態に係る情報検索装置に
おける類義語辞書の一例を示す図である。
【図13】本発明の一実施の形態に係る情報検索装置に
おける類義語辞書の一例を示す図である。
【図14】本発明の一実施の形態に係る情報検索装置に
おける見出し語辞書の一例を示す図である。
【図15】本発明の一実施の形態に係る情報検索装置に
おける類義語辞書の一例を示す図である。
【図16】本発明の一実施の形態に係る情報検索装置に
おける類義語辞書の一例を示す図である。
【図17】本発明の一実施の形態に係る情報検索装置に
おけるID辞書の一例を示す図である。
【図18】本発明の一実施の形態に係る情報検索装置に
おける類義語辞書の一例を示す図である。
【図19】本発明の一実施の形態に係る情報検索装置に
おける類義語辞書の一例を示す図である。
【図20】従来の情報検索装置の構成を示すブロック図
である。
【図21】従来の情報検索装置における情報検索処理動
作の流れを示すフローチャートである。
【図22】従来の情報検索装置における類義語辞書の一
例を示す図である。
【図23】従来の情報検索装置におけるクエリー入力状
態の一例を示す図である。
【図24】従来の情報検索装置における検索結果の一例
を示す図である。
【図25】従来の情報検索装置におけるデータの流れの
一例を示す図である。
【図26】従来の情報検索装置におけるデータの流れの
一例を示す図である。
【符号の説明】
101 サーバー 102 クライアント 103 ネットワーク 201 端末 202 インターネット 2001 中央処理装置 2002 記憶装置 2003 入力装置 2004 表示装置 2005 記憶媒体読取装置

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 1つ以上連続する形態素と同義または類
    義の1つ以上連続する形態素を関連付けた類義語辞書を
    記憶する辞書記憶ステップと、 文字列を含む情報を複数保持する情報保持ステップと、 クエリーを入力するクエリー入力ステップと、 文字列を言語解析して形態素に分解する言語解析ステッ
    プと、 類義語辞書を検索してクエリーの形態素列と類義の形態
    素列を展開する類義語展開ステップと、 クエリーを展開した形態素列と保持された情報の形態素
    列を比較する形態素列比較ステップと、 一致した形態素を含む情報名等を少なくとも1つ表示す
    る検索結果表示ステップとを有することを特徴とする情
    報検索方法。
  2. 【請求項2】 1つ以上連続する形態素と同義または類
    義の1つ以上連続する形態素を関連付けた類義語辞書を
    記憶する辞書記憶手段と、 文字列を含む情報を複数保持する情報保持手段と、 クエリーを入力するクエリー入力手段と、 文字列を言語解析して形態素に分解する言語解析手段
    と、 類義語辞書を検索してクエリーの形態素列と類義の形態
    素列を展開する類義語展開手段と、 クエリーを展開した形態素列と保持された情報の形態素
    列を比較する形態素列比較手段と、 一致した形態素を含む情報名等を少なくとも1つ表示す
    る検索結果表示手段とを有することを特徴とする情報検
    索装置。
  3. 【請求項3】 自立語と同義または類義の自立語を関連
    付けた自立語類義語辞書と付属語列と同義または類義の
    付属語列を関連付けた付属語類義語辞書とを記憶する記
    憶ステップと、 文字列を含む情報を複数保持する情報保持ステップと、 クエリーを入力するクエリー入力ステップと、 文字列を言語解析して形態素に分解する言語解析ステッ
    プと、 類義語辞書を検索してクエリーの含まれる自立語と類義
    の自立語を展開する自立語類義語展開ステップと、 類義語辞書を検索してクエリーの含まれる付属語列と類
    義の付属語列を展開する付属語列類義語展開ステップ
    と、 クエリーを展開した形態素列の表記文字列と保持された
    情報の表記文字列を比較する文字列比較ステップと、 類義語の類似度から一致する度合を計算する一致度計算
    ステップと、 一致した形態素を含む情報名等を少なくとも1つ一致度
    の順に表示する検索結果表示ステップとを有することを
    特徴とする情報検索方法。
  4. 【請求項4】 自立語と同義または類義の自立語を関連
    付けた自立語類義語辞書と付属語列と同義または類義の
    付属語列を関連付けた付属語類義語辞書とを記憶する記
    憶手段と、 文字列を含む情報を複数保持する情報保持手段と、 クエリーを入力するクエリー入力手段と、 文字列を言語解析して形態素に分解する言語解析手段
    と、 類義語辞書を検索してクエリーの含まれる自立語と類義
    の自立語を展開する自立語類義語展開手段と、 類義語辞書を検索してクエリーの含まれる付属語列と類
    義の付属語列を展開する付属語列類義語展開手段と、 クエリーを展開した形態素列の表記文字列と保持された
    情報の表記文字列を比較する文字列比較手段と、 類義語の類似度から一致する度合を計算する一致度計算
    手段と、 一致した形態素を含む情報名等を少なくとも1つ一致度
    の順に表示する検索結果表示手段とを有することを特徴
    とする情報検索装置。
  5. 【請求項5】 情報検索装置を制御するためのコンピュ
    ータ読み取り可能な制御プログラムであって、1つ以上
    連続する形態素と同義または類義の1つ以上連続する形
    態素を関連付けた類義語辞書を記憶する辞書記憶ステッ
    プと、文字列を含む情報を複数保持する情報保持ステッ
    プと、クエリーを入力するクエリー入力ステップと、文
    字列を言語解析して形態素に分解する言語解析ステップ
    と、類義語辞書を検索してクエリーの形態素列と類義の
    形態素列を展開する類義語展開ステップと、クエリーを
    展開した形態素列と保持された情報の形態素列を比較す
    る形態素列比較ステップと、一致した形態素を含む情報
    名等を少なくとも1つ表示する検索結果表示ステップと
    をコンピュータに実行させるためのプログラムコードか
    ら成ることを特徴とする情報検索装置の制御プログラ
    ム。
  6. 【請求項6】 情報検索装置を制御するためのコンピュ
    ータ読み取り可能な制御プログラムであって、自立語と
    同義または類義の自立語を関連付けた自立語類義語辞書
    と付属語列と同義または類義の付属語列を関連付けた付
    属語類義語辞書とを記憶する記憶ステップと、文字列を
    含む情報を複数保持する情報保持ステップと、クエリー
    を入力するクエリー入力ステップと、文字列を言語解析
    して形態素に分解する言語解析ステップと、類義語辞書
    を検索してクエリーの含まれる自立語と類義の自立語を
    展開する自 立語類義語展開ステップと、類義語辞書を検索してクエ
    リーの含まれる付属語列と類義の付属語列を展開する付
    属語列類義語展開ステップと、 クエリーを展開した形態素列の表記文字列と保持された
    情報の表記文字列を比較する文字列比較ステップと、類
    義語の類似度から一致する度合を計算する一致度計算ス
    テップと、一致した形態素を含む情報名等を少なくとも
    1つ一致度の順に表示する検索結果表示ステップとをコ
    ンピュータに実行させるためのプログラムコードから成
    ることを特徴とする情報検索装置の制御プログラム。
JP2002025406A 2002-02-01 2002-02-01 情報検索方法及び情報検索装置及び情報検索装置の制御プログラム Pending JP2003228578A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002025406A JP2003228578A (ja) 2002-02-01 2002-02-01 情報検索方法及び情報検索装置及び情報検索装置の制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002025406A JP2003228578A (ja) 2002-02-01 2002-02-01 情報検索方法及び情報検索装置及び情報検索装置の制御プログラム

Publications (2)

Publication Number Publication Date
JP2003228578A true JP2003228578A (ja) 2003-08-15
JP2003228578A5 JP2003228578A5 (ja) 2005-08-18

Family

ID=27747568

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002025406A Pending JP2003228578A (ja) 2002-02-01 2002-02-01 情報検索方法及び情報検索装置及び情報検索装置の制御プログラム

Country Status (1)

Country Link
JP (1) JP2003228578A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100811998B1 (ko) * 2006-12-04 2008-03-10 삼성에스디아이 주식회사 박막 트랜지스터 및 이를 포함한 평판 표시 장치
JP2012059025A (ja) * 2010-09-09 2012-03-22 Ricoh Co Ltd 検索装置、検索方法、検索プログラム及び検索システム
JP2013196385A (ja) * 2012-03-19 2013-09-30 Toshiba Corp サービス制御装置、サービス制御方法およびサービス制御プログラム
JP2016091269A (ja) * 2014-11-04 2016-05-23 株式会社東芝 外国語文作成支援装置、方法及びプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100811998B1 (ko) * 2006-12-04 2008-03-10 삼성에스디아이 주식회사 박막 트랜지스터 및 이를 포함한 평판 표시 장치
JP2012059025A (ja) * 2010-09-09 2012-03-22 Ricoh Co Ltd 検索装置、検索方法、検索プログラム及び検索システム
JP2013196385A (ja) * 2012-03-19 2013-09-30 Toshiba Corp サービス制御装置、サービス制御方法およびサービス制御プログラム
JP2016091269A (ja) * 2014-11-04 2016-05-23 株式会社東芝 外国語文作成支援装置、方法及びプログラム
US10394961B2 (en) 2014-11-04 2019-08-27 Kabushiki Kaisha Toshiba Foreign language sentence creation support apparatus, method, and program

Similar Documents

Publication Publication Date Title
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
JP2783558B2 (ja) 要約生成方法および要約生成装置
JP3691844B2 (ja) 文書処理方法
JP3969628B2 (ja) 翻訳支援装置、方法及び翻訳支援プログラム
JP2002524799A (ja) 知識創造可能性を有するドキュメントの意味論的分析及び選択
JP2001043236A (ja) 類似語抽出方法、文書検索方法及びこれらに用いる装置
CN109815390B (zh) 多语言信息的检索方法、装置、计算机设备及计算机存储介质
JP2006099428A (ja) 文書要約作成システム、方法、及びプログラム
US7684975B2 (en) Morphological analyzer, natural language processor, morphological analysis method and program
JP2008052548A (ja) 検索プログラム、情報検索装置及び情報検索方法
JPH0844771A (ja) 情報検索装置
JP2003228578A (ja) 情報検索方法及び情報検索装置及び情報検索装置の制御プログラム
JP2005011079A (ja) 情報検索装置、情報検索方法及びプログラム
JP2004086307A (ja) 情報検索装置、情報登録装置、情報検索方法、及びコンピュータ読み取り可能なプログラム
JP4217410B2 (ja) 情報検索装置及びその制御方法、並びにプログラム
JPH07134720A (ja) 文章作成システムにおける関連情報提示方法及び装置
JP2004318328A (ja) 情報検索方法
JP2003228577A (ja) 情報検索方法及び情報検索装置及び情報検索装置の制御プログラム
JP4034503B2 (ja) 文書検索システムおよび文書検索方法
JP2840258B2 (ja) 機械翻訳システムの対訳辞書及び共起関係辞書の作成方法
JP2000076254A (ja) キーワード抽出装置、このキーワード抽出装置を用いた類似文献検索装置、キーワード抽出方法及び記録媒体
JP4049967B2 (ja) データベース処理装置
JP2002049625A (ja) 画像検索装置および画像検索方法
JP3025847B2 (ja) 電子化辞書検索方法
JPH0954781A (ja) 文書検索システム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050131

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050131

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20060404

RD05 Notification of revocation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7425

Effective date: 20070626

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071113

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080115

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080311