JP4935243B2

JP4935243B2 - 検索プログラム、情報検索装置及び情報検索方法

Info

Publication number: JP4935243B2
Application number: JP2006229048A
Authority: JP
Inventors: 哲朗 ▲高▼橋; 寛治内野; 青史岡本
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2006-08-25
Filing date: 2006-08-25
Publication date: 2012-05-23
Anticipated expiration: 2026-08-25
Also published as: JP2008052548A

Description

本発明は、ウェブページなどのテキストを対象とした検索プログラム、情報検索装置及び情報検索方法に関し、特にユーザが入力したクエリによる検索失敗時に候補クエリを自動生成して再検索可能とする検索プログラム、情報検索装置及び情報検索方法に関する。

従来、ウェブページなどの文書検索にあっては、ユーザは検索目的に合わせてクエリを作成して検索を行う対話型の情報検索が行われている。

ここで、クエリとはデータベース管理システムに対しデータの抽出や更新といった問合せを文字列として表したものであり、例えば「今日の東京地方の天気はどうなりそう？」といった文字列であり、近年、ウェブページの検索にも利用されている。

このようなクエリを使用したウェブページ等の情報検索によれば、１又は複数の単語をキーワードとして行う検索に比べ、ユーザの検索したい内容が適確に表現でき、ユーザが期待している内容に絞り込まれた検索結果が得られ、キーワード検索にように多数の検索結果の中から改めてユーザがページを開きながら希望する検索結果を探し出すという手間を解消することができる。

特開平１１−０５３３８２号公報特開２００４−１３９１５４号公報特開２００５−２５１０９２号公報

しかしながら、このような従来のクエリを使用した対話型の情報検索にあっては、適切なクエリの作成にはスキルが必要であり、クエリが適切でない場合には検索結果の件数が非常に少ないか又は０件の検索結果になり、必要とするページにたどり着くために手間と時間がかかるという問題がある。

このように入力されたクエリでは１件も見付からない原因、所謂０件ヒットの原因は，その大部分はクエリが長すぎることが挙げられる。一般的な検索エンジンでは、入力されたクエリの文字列を含むページが検索結果として返されるが、例えば「今日の東京地方の天気はどうなりそう？」などのような長いクエリが入力された場合、その文字列と同じ文字列が含まれる文書がない場合に、０件ヒットとなる。

本発明は、ユーザが入力したクエリが適切でない場合に、適切な候補クエリをユーザに提示して検索のヒット件数をコントロールし、少ない手間と時間でユーザを適切なページへ導くことを可能とする検索プログラム、情報検索装置及び情報検索方法を提供する。

また本発明は、過去のクエリ変換履歴を元にユーザへの候補クエリの提示を行なうことにより、ユーザのクエリを作成するスキルを向上させる検索プログラム、情報検索装置及び情報検索方法を提供する。

（プログラム）
本発明は検索プログラムを提供する。本発明の検索プログラムは、コンピュータに、
ユーザが指定したクエリを入力するクエリ入力ステップと、
クエリを使用して検索する検索ステップと、
検索ステップで検索に失敗した場合、前記クエリを分解して生成した複数の候補クエリをユーザに提示し、ユーザが選択したクエリを使用して前記検索ステップで検索させる候補クエリ生成ステップと、
を実行させ、
更に、候補クエリ生成ステップは、分解前クエリの分解手法として、名詞のみの抽出、名詞と動詞のみの抽出、名詞句の抽出のいずれかを予め設定し、前記設定した分解条件に基づいて分解前クエリから抽出した語句及び語句の組合わせを候補クエリとして生成することを特徴とする。

候補クエリ生成ステップは、検索ステップにより検索結果が１件も得られない０件ヒットの場合に検索失敗と判定して候補クエリ生成処理を実行する。

本発明の検索プログラムは、コンピュータに、更に、
クエリ入力ステップで入力した分解前クエリと前記候補クエリ生成ステップでユーザが選択した分解後クエリの組について、各々の特徴量を抽出してクエリ分解知識データベースに登録するステップを実行させ、
候補クエリ生成ステップは、処理対象としている分解前クエリと分解後クエリの組について各々の特徴量を抽出し、知識データベースに登録されている分解前クエリと分解後クエリの組の各特徴量との類似度からスコアを算出して処理対象の分解後クエリに付与し、スコア順にソートした分解後クエリを候補クエリとしてユーザに提示して選択させる。

また本発明の検索プログラムは、コンピュータに、更に、
検索ステップで検索に成功した分解後クエリの特徴量を抽出してクエリ選考知識データベースに登録するステップを実行させ、
候補クエリ生成ステップは、処理対象としている分解後クエリの特徴量を抽出し、クエリ選考知識データベースに登録されている分解後クエリとの特徴量との類似度からスコアを算出して処理対象の分解後クエリに付与し、スコア順にソートした分解後クエリを候補クエリとしてユーザに提示して選択させる。

分解前クエリの特徴量は、形態素解析された構成要素、単語数、特定の意味をもつ内容語の１又は複数の組合せを含み、
分解後クエリの特徴量は、名詞のみの抽出、名詞と動詞のみの抽出又は名詞句の抽出の分解手法、抽出した単語の分解前クエリ上の位置、抽出した単語の位置、抽出した単語数を示す要素数、分解前クエリの単語数に対する分解後の要素数の割合、又は抽出した単語の意味を示す意味ラベルの１又は複数の組合せを含む。

（装置）
本発明は情報検索装置を提供する。本発明の情報検索装置は、
ユーザが指定したクエリを入力するクエリ入力部と、
クエリを使用して検索する検索部と、
検索部で検索に失敗した場合、クエリを分解して生成した複数の候補クエリをユーザに提示し、ユーザが選択したクエリを使用して前記検索部に検索させる候補クエリ生成部と、
を備え、
更に、候補クエリ生成部は、分解前クエリの分解手法として、名詞のみの抽出、名詞と動詞のみの抽出、名詞句の抽出のいずれかを予め設定し、設定した分解手法に基づいて分解前クエリから抽出した語句及び語句の組合わせを候補クエリとして生成することを特徴とする。

（方法）
本発明は情報検索方法を提供する。本発明の情報検索方法は、
ユーザが指定したクエリを入力するクエリ入力ステップと、
クエリを使用して検索する検索ステップと、
前記検索ステップで検索に失敗した場合、クエリを分解して生成した複数の候補クエリをユーザに提示し、ユーザが選択したクエリを使用して前記検索ステップで検索させる候補クエリ生成ステップと、
を備え、
更に、候補クエリ生成ステップは、分解前クエリの分解手法として、名詞のみの抽出、名詞と動詞のみの抽出、名詞句の抽出のいずれかを予め設定し、設定した分解条件に基づいて分解前クエリから抽出した語句及び語句の組合わせを候補クエリとして生成することを特徴とする。

本発明によれば、検索結果が０件ヒットとなるユーザが入力したクエリが適切でない場合に、ユーザが入力したクエリを例えば名詞と動詞のみを抽出するという分解手法に基づいて分解し、分解した単語またはその組合せを候補クエリとして生成してユーザに提示し、ユーザが選択した候補クエリによる再検索により、少ない手間と時間（少ないコスト）で例えばユーザを適切なページへ導くような検索結果を得ることができる。

また過去のユーザによる選択した分解前クエリと分解後クエリの組合せや、検索に成功した分解後クエリの履歴を知識データベースとして保存し、新たに候補クエリを生成する際に、知識データベースの履歴との類似度に応じたコストを候補クエリに付与してユーザに提示することで、候補クエリをコストにより評価可能とし、コストの高い候補クエリを選択する過程を通じた学習効果により、ユーザのクエリを作成するスキルを向上させることができる。

図１は本発明による情報検索装置の実施形態を示した機能構成のブロック図である。図１において、本実施形態の情報検索装置は、クエリ入力部１０、検索制御部１２、検索部として機能する検索エンジン１４、検索結果表示部１８、候補クエリ処理部２０、分解候補表示指定部２２、知識記録部２４、クエリ分解知識データベース３０及びクエリ選考知識データベース３２を備えている。

また候補クエリ処理部２０には、分解候補生成部３４、スコア付与部３６及び分解候補提示部３８の機能が設けられている。また知識記録部２４にはクエリ分解知識記録部２６とクエリ選考知識記録部２８が設けられている。

クエリ分解知識記録部２６はクエリ分解知識データベース３０に対し登録処理を行うもので、分解前クエリ特徴抽出部４０、検索成功クエリ特徴抽出部４２及びデータベース登録部４４を備えている。クエリ選考知識記録部２８はクエリ選考知識データベース３２に対する登録を行うもので、検索成功クエリ特徴抽出部４６及びデータベース登録部４８を備えている。

クエリ入力部１０はユーザが指定した検索のための文字列であるクエリを入力する。検索制御部１２はクエリ入力部１０から入力されたクエリを検索エンジン１４に出力し、これを受けて検索エンジン１４がインターネット１６上に存在するウェブページの検索を行い、検索結果を検索結果表示部１８に表示することになる。

検索制御部１２は、クエリ入力部１０からの入力クエリを使用した検索エンジン１４による検索結果が失敗した場合、本実施形態にあっては検索結果が１件も得られずに０件ヒットとなった場合には候補クエリ処理部２０を動作する。

候補クエリ処理部２０は、検索エンジン１４で０件ヒットとなった場合に、クエリ入力部１０から入力されたクエリを分解して複数の候補クエリを生成し、この候補クエリを分解候補表示指定部２２に表示し、ユーザが選択したクエリを使用して検索エンジン１４に検索を行わせる。

候補クエリ処理部２０による候補クエリの生成は、分解前のクエリ（入力クエリ）の分解手法として例えば次の手法を設定している。
（１）名詞のみ抽出
（２）名詞と動詞のみ抽出
（３）名詞句の抽出

このような分解手法につき、いずれかの分解手法を予め設定しておくことで、設定した分解手法に基づいて分解前クエリから語句を抽出し、抽出した語句及び語句の組合せを候補クエリとして生成する。この処理は分解候補生成部３４により行われる。

スコア付与部３６は、クエリ分解知識データベース３０またはクエリ選考知識データベース３２に保存されている履歴知識を利用して、分解候補生成部３４で生成した各分解候補にスコアを付与する。分解候補提示部３８は、スコアが付与された分解候補をスコア順にソートした後に、分解候補表示指定部２２に表示し、ユーザの指定を受ける。

ここでクエリ分解知識データベース３０には、クエリ入力部１０で入力した分解前クエリと、候補クエリ処理部２０で生成してユーザが選択した分解後クエリの組（ペア）について、各々の特徴量を抽出してクエリ分解知識として登録されている。このクエリ分解知識データベース３０に対する登録は、知識記録部２４に設けたクエリ分解知識記録部２６により行われる。

一方、クエリ選考知識データベース３２には、検索エンジン１４による検索で検索に成功した分解後クエリの特徴量を抽出してクエリ選考知識として登録している。このクエリ選考知識データベース３２の登録は、知識記録部２４に設けたクエリ選考知識記録部２８により行われる。

クエリ分解知識データベース３０を利用したスコア付与部３６によるスコアの付与は、現在処理対象としている分解前のクエリと分解後のクエリの組につき各々の特徴量を抽出し、クエリ分解知識データベース３０に登録されている分解前クエリと分解後クエリの各特徴量との類似度からスコアを算出して、分解候補である分解後クエリに付与する。

またスコア付与部３６によるクエリ選考知識データベース３２を利用したスコア付与にあっては、処理対象としている検索に成功した分解後クエリの特徴量を抽出し、クエリ選考知識データベース３２に登録されている分解後クエリの特徴量との類似度からスコアを計算して付与する。

図２は図１の実施形態の機能を実現する本実施形態の検索プログラムが実行されるコンピュータのハードウェア環境のブロック図である。図２において、ＣＰＵ５０のバス５２に対しては、ＲＡＭ５４、ＲＯＭ５５、ハードディスクドライブ５６、キーボード６０，マウス６２及びディスプレイ６４を接続するデバイスインタフェース５８、更にインターネットと接続されるネットワークアダプタ６６が接続されている。

本実施形態による検索プログラムはハードディスクドライブ５６に格納されており、コンピュータを起動すると、ＢＩＯＳの動作により、ハードディスクドライブ５６からブートプログラムがＲＡＭ５４に読み出されて実行されることで起動し、ハードディスクドライブ５６からＲＡＭ５４にＯＳを読出し配置して実行した後に、ハードディスクドライブ５６から本実施形態の検索プログラムをＲＯＭ５４に読出し配置して、ＣＰＵ５０により実行する。

図３は本実施形態による情報検索処理のフローチャートである。図３において、図１の実施形態を参照して処理を説明すると次のようになる。

まずステップＳ１でユーザが作成した入力クエリをクエリ入力部１０から読み込み、ステップＳ２で検索エンジン１４により入力クエリを使用したインターネット１６上のウェブページの検索を行う。

この検索結果につき、ステップＳ３で０件ヒットか否かを判定する。０件ヒットでなければステップＳ９に進み、検索結果を検索結果表示部１８に出力した後、ステップＳ１０で知識記録部２４に設けているクエリ選考知識記録部２８によりクエリ選考知識記録処理をクエリ選考知識データベース３２に対し行う。

一方、ステップＳ３で検索に失敗して０件ヒットが判別された場合には、ステップＳ４に進み、候補クエリ処理部２０による候補クエリ生成処理を行い、分解候補表示指定部２２に候補クエリを表示する。

続いてステップＳ５でユーザの分解候補選択を判別すると、ステップＳ６に進み、ユーザが選択した分解クエリである候補クエリを使用した検索を検索エンジン１４で行い、ステップＳ７で検索結果を検索結果表示部１８に出力する。続いてステップＳ８で、知識記録部２４に設けているクエリ分解知識記録部２６によりクエリ分解知識記録処理を実行し、クエリ分解知識データベース３０に処理結果を登録する。

図４は図３のステップＳ８のクエリ分解知識記録処理の詳細を示したフローチャートである。図４において、クエリ分解知識記録処理は、ステップＳ１で現在処理対象となっている分解前クエリ（入力クエリ）の特徴量を抽出し、次にステップＳ２でユーザが選択した分解クエリの特徴量を抽出し、ステップＳ３で分解前クエリの特徴量と分解後クエリの特徴量のペアをクエリ分解知識としてクエリ分解知識データベース３０に登録する。

図５は図４に対応した図１のクエリ分解知識記録部２６の具体的な処理動作を示した説明図である。図５にあっては、ユーザが作成して入力した分解前クエリ６８として「今日の東京地方の天気はどうなりそう？」を処理対象としており、この分解前クエリ６８からユーザが分解クエリとして「今日＋東京地方＋天気」を選択して検索を行って検索に成功し、これが検索成功クエリ７０として得られている。

クエリ分解知識記録部２６にあっては、まず分解前クエリ特徴抽出部４０により分解前クエリ６８の特徴量７２を抽出する。分解前クエリ６８の特徴量７２としては、その文字列に含んでいる要素を形態素解析により分類し、それぞれの品詞を抽出する。

また分解前クエリ６８の文字列を構成する「単語数」を抽出しており、この場合には「単語数：９」となっている。また入力前クエリ６８に含まれる特定の意味を持つ内容語につき「内容語数」を抽出しており、この場合には「内容語数：３」となっている。更に、分解前クエリ６８の文末のフレーズとして「述語」を抽出している。

次に検索成功クエリ特徴量抽出部４２において、検索成功クエリ７０から特徴量７４を抽出する。検索成功クエリ７０における特徴量７４の抽出は、検索成功クエリ７０の分解手法として、この例では「名詞のみ」、分解前クエリ６８における検索成功クエリ７０の各単語の位置、この実施形態にあっては「今日」は１番目、「東京地方」は３番目、「天気」は５番目であることから、「位置（単語）：１，３，５」を抽出している。

また検索成功クエリ７０における各単語の位置として「位置（内容語）：１，２，３」を抽出している。また検索成功クエリ７０の単語数として「単語数：３」を抽出している。また検索成功クエリ７０における要素数の割合（要素数／単語数）として「３／９」を抽出している。更に検索成功クエリ７０における単語の意味ラベルとして、この例では「東京地方」に対応して「ＬＯＣＡＴＩＯＮ」を抽出している。

図５に示す特徴量７２，７４の抽出は一例であり、これ以外にも必要に応じて、分解前クエリ６８及び検索成功クエリ７０における各文字列に関する適宜の特徴を抽出することができる。

図６は図３のステップＳ１０のクエリ選考知識記録処理の詳細を示したフローチャートである。図６において、クエリ選考知識記録処理部２８は検索成功となった状態で、まずステップＳ１で検索成功クエリが分解後クエリか否かチェックする。分解後クエリであった場合にはステップＳ２に進み、分解後クエリの特徴量の抽出を実行し、ステップＳ３で抽出した特徴量をクエリ選考知識データベース３２に登録する。一方、ステップＳ１で検索成功クエリが分解前クエリ、即ち入力クエリであった場合には、ステップＳ２，Ｓ３の特徴量抽出と登録はスキップし、クエリ選考知識の登録は行わない。

図７は図６に対応した図１のクエリ選考知識記録部２８による具体的な処理動作を示した説明図である。図７にあっては、検索成功クエリ７０として分解後クエリである「今日＋東京地方＋天気」を対象としており、これを検索成功クエリ特徴抽出部４６で特徴量の抽出を行い、特徴量７４を取得する。この特徴量７４の内容は、図５の検索成功クエリ特徴抽出部４２で抽出した特徴量７４と同じである。続いて、データベース登録部４８が特徴量７４をクエリ選考知識データベース３２に登録する。

図８は図３のステップＳ４の候補クエリ生成処理の詳細を示したフローチャートである。図８において、候補クエリ生成処理は、まずステップＳ１で予め設定している候補クエリの分解手法を取得する。この分解手法は
（１）名詞抽出のみ
（２）名詞及び動詞抽出のみ
（３）名詞句抽出のみ
のいずれかである。続いてステップＳ２に進み、分解候補生成部３４によりステップＳ１で取得した分解手法を使用して候補クエリを分解して、単語及び単語の組合せからなる分解候補を生成する。次にステップＳ３で分解前クエリと分解候補の各特徴量を抽出し、ステップＳ４で分解前クエリと分解後クエリのペアごとにクエリ分解知識データベース３０の保存知識との類似度に基づくスコアを計算する。

このステップＳ３の特徴量抽出とステップＳ４のスコア計算は、スコア付与部３６により行われる。最終的に、ステップＳ５で分解候補提示部３８がスコア順にソートした後に分解候補をユーザに提示することになる。

図９は図８に対応した図１の候補クエリ処理部２０の具体的な処理動作を示した説明図である。図９において、分解前クエリ７６として「今日の川崎の天気は？」が分解候補生成部３４に入力されている。分解候補生成部３４は、そのとき設定されている分解手法に基づき、例えば「今日」、「川崎」、「天気」、「今日の川崎」、川崎の天気」、「今日＋川崎」、「今日＋川崎＋天気」などの分解候補を生成した分解候補一覧７８を生成する。

ここで分解候補一覧７８の「川崎の天気」まではスコア付与部３６によるスコア計算で求めたスコアがカッコ内の数値で示すように既に付与されている。

次に分解候補８０についてスコアを計算する場合を説明すると次のようになる。まず分解前クエリ７６について特徴量７６−１を抽出する。これは最初の分解候補「今日」の際に予め行われていることから、それを使用する。

一方、現在処理対象となっている分解候補８０である「今日＋川崎」につき特徴量８０−１を抽出する。この特徴量８０−１の抽出処理は、図５に示したクエリ分解知識記録部２６に設けた分解前クエリ特徴抽出部４０及び検索成功クエリ特徴抽出部４２による処理と同じになる。

このようにして分解前クエリ７６の特徴量７６−１と現在処理対象としている分解候補８０の特徴量８０−１が得られたならば、特徴量７６−１と特徴量８０−１をペアとし、クエリ分解知識データベース３０に、このとき登録されている保存知識８２−１〜８２−３のそれぞれとの類似度を計算する。

この例では、保存知識８２−１に含まれる分解前クエリ特徴量８４と分解後クエリ特徴量８６のペアとの間で特徴量７６−１と特徴量８０−１の類似度ｓｉｍ１，ｓｉｍ２をそれぞれ計算し、両者の乗算結果として、保存知識８２−１との間のスコアを求める。このようなスコア計算を残りの保存知識８２−２，８２−３との間で行って、その総和をスコアとして求め、分解候補８０に算出したスコアを付与する。

スコア付与部３６における類似度計算８８は次式で行われる。

スコア付与部３６による分解候補一覧７８のそれぞれに対するスコア付与が済むと、分解候補一覧７８をスコア順にソートした後、分解候補一覧７８を分解候補表示指定部２２に表示し、ユーザによる分解候補の選択指定を行わせることになる。

図１０は図３のステップＳ４の候補クエリ生成処理の他の実施形態を示したフローチャートであり、この実施形態にあっては、図１のクエリ選考知識データベース３２を使用して、分解候補につきスコアを付与するようにしたことを特徴とする。

図１０において、候補クエリ生成処理のステップＳ１，Ｓ２，Ｓ３については、図８のクエリ分解知識データベース３０を使用する場合と同じであるが、ステップＳ４にあっては分解候補ごとにクエリ選考知識データベース３２の保存知識との類似度に基づくスコアを計算して付与しており、ステップＳ５でスコア順にソートしてユーザに分解候補を提示して選択させることになる。

図１１は図１０に対応した図１の候補クエリ処理部２０による他の実施形態の具体的動作である。図１１において、分解候補生成部３４は図９の場合と同様、分解前クエリ７６に設定された分解手法を適用して分解候補一覧７８を生成している。分解候補一覧７８にあっては、４行目の「川崎の天気」まではスコアの付与が終了しており、次の分解候補８０である「今日＋川崎」のスコア計算を例にとっている。

このスコア計算はスコア付与部３６で行われる。スコア付与部３６は、対象とする分解候補８０から特徴量８０−１を抽出し、クエリ選考知識データベース３２に登録されている保存知識９０−１〜９０−３のそれぞれとの間で類似度を計算して、その総和をスコアとして求める。

例えば保存知識９０−１については検索成功クエリ特徴量９２が保存されており、これと分解候補８０の特徴量８０−１との間で類似度計算９４を行ってスコアｓｉｍ３を求める。そして、このような類似度計算を残りの保存知識９０−２，９０−３との間で行って、その総和をスコアとする。この場合の類似度計算９４は次式で行われる。

図１２は図１のクエリ分解知識記録部２６による処理動作の他の具体例を示した説明図である。図１２において、この具体例にあっては、分解前クエリ９６が「立川にある災害医療センターの電話番号」であり、検索成功クエリ９８が「立川＋災害医療センター＋電話番号」の場合であり、この分解前クエリ９６と検索成功クエリ９８をクエリ分解知識記録部２６に入力して処理する。

まず分解前クエリ特徴抽出部４０は、分解前クエリ９６から特徴量１００を抽出している。続いて検索成功クエリ特徴抽出部４２が検索成功クエリ９８から特徴量１０２を抽出している。このようにして抽出した特徴量１００，１０２をペアとして、データベース登録部４４がクエリ分解知識データベース３０にクエリ分解知識として登録することになる。

図１３は図１のクエリ選考知識記録部２８による処理動作の他の具体例を示した説明図である。図１３にあっては、検索成功クエリ１０４として「立川＋災害医療センター＋電話番号」を対象としており、この検索成功クエリ１０４を検索成功クエリ特徴抽出部４６で処理して特徴量１０２を抽出する。

この特徴量１０２は図１２の検索成功クエリ特徴抽出部４６による特徴量と同じである。続いてデータベース登録部４８が、抽出した特徴量１０２をクエリ選考知識データベース３２に登録する。

図１４は図１の候補クエリ処理部２０による処理動作の他の具体例を示した説明図である。図１４にあっては、分解前クエリ９６として「立川にある災害医療センターの電話番号」を対象としており、まず分解候補生成部３４で分解候補一覧１０５を生成する。

続いてスコア付与部３６が分解前クエリ９６から特徴量９６−１を抽出し、また処理対象としている分解候補１０６である「立川＋電話番号」から特徴量１０６−１を抽出する。続いて、クエリ分解知識データベース３０に登録されている保存知識１０８−１，１０８−２，１０８−３のそれぞれの保存ペア、例えば保存知識１０８−１にあっては分解前クエリ特徴量１１０と分解後クエリ特徴量１１１との間で類似度計算１１４により類似度ｓｉｍ１，ｓｉｍ２を計算して乗算し、これを全ての保存知識につき繰り返す。

具体的には前記（１）式に示した類似度計算を行ってスコアを求め、分解候補１０６に付与する。全ての分解候補につきスコア計算が終了したならば、分解候補提示部３８がスコア順にソートして分解候補表示指定部２２に提示してユーザの指定を受けることになる。

図１５は図１の候補クエリ処理部２０の他の実施形態による処理動作の他の具体例を示した説明図である。図１５にあっては、クエリ選考知識データベース３２を利用したスコア計算であり、分解前クエリ９６に対し分解候補生成部３４で分解候補一覧１０５を生成する点は図１４と同じである。

続いてスコア付与部３６が現在処理対象としている分解候補１０６から特徴量１０６−１を抽出し、クエリ選考知識データベース３２に保存されている保存知識１１６−１〜１１６−３のクエリ選考知識、例えば保存知識１１６−１における検索成功クエリ特徴量１１８との間で類似度計算１２０を行い、これを全ての保存知識１１６−１〜１１６−３について行って総和を求める前記（１）を実行することでスコアを求め、分解候補１０６に付与する。

全ての分解文字列のスコア計算が済んだならば、分解候補提示部３８でスコア順にソートした後に、分解候補表示指定部２２に表示してユーザによる選択指定を受けることになる。

また本発明は情報検索用のプログラムを提供するものであり、このプログラムは図３，図４，図６，図８，図１０のフローチャートに示した処理内容を持つことになる。

また本発明はコンピュータにより読取可能な検索プログラムを格納した記録媒体を提供する。ここでＣＤ−ＲＯＭ、フロッピィディスク（Ｒ）、ＤＶＤディスク、光磁気ディスク、ＩＣカードなどの可搬型記憶媒体や、コンピュータシステムの内外に備えられたハードディスクドライブなどの記憶装置の他、回線を介してプログラムを保持するデータベース、あるいは他のコンピュータシステム並びにそのデータベースや、更に回線上の伝送媒体を含むものである。

また図１に示した本発明の情報検索装置としての機能は、スタンドアローンでネットワークに接続されて個人的に使用されるパーソナルコンピュータに組み込まれてもよいし、企業内の内部ネットワークに設置しているサーバに組み込まれ、サーバに対し接続しているクライアントからのクエリを使用した検索要求に対し検索処理を実行して検索結果を返すようにしてもよい。

なお本発明は、その目的と利点を損なうことのない適宜の変形を含み、更に上記の実施形態に示した数値による限定は受けない。

ここで本発明の特徴をまとめて列挙すると次の付記のようになる。

（付記）
（付記１）
コンピュータに、
ユーザが指定したクエリを入力するクエリ入力ステップと、
前記クエリを使用して検索する検索ステップと、
前記検索ステップで検索に失敗した場合、前記クエリを分解して生成した複数の候補クエリをユーザに提示し、ユーザが選択したクエリを使用して前記検索ステップで検索させる候補クエリ生成ステップと、
を実行させ、
更に、前記候補クエリ生成ステップは、分解前クエリの分解手法として、名詞のみの抽出、名詞と動詞のみの抽出、名詞句の抽出のいずれかを予め設定し、前記設定した分解条件に基づいて分解前クエリから抽出した語句及び語句の組合わせを候補クエリとして生成することを特徴とする検索プログラム。（１）

（付記２）
付記１記載の検索プログラムに於いて、前記候補クエリ生成ステップは、前記検索ステップにより検索結果が１件も得られない０件ヒットの場合に検索失敗と判定して候補クエリ生成処理を実行することを特徴とする検索プログラム。

（付記３）
付記１記載の検索プログラムに於いて、前記コンピュータに、更に、前記クエリ入力ステップで入力した分解前クエリと前記候補クエリ生成ステップでユーザが選択した分解後クエリの組について、各々の特徴量を抽出してクエリ分解知識データベースに登録するステップを実行させ、
前記候補クエリ生成ステップは、処理対象としている分解前クエリと分解後クエリの組について各々の特徴量を抽出し、前記知識データベースに登録されている分解前クエリと分解後クエリの組の各特徴量との類似度からスコアを算出して前記処理対象の分解後クエリに付与し、前記スコア順にソートした分解後クエリを候補クエリとしてユーザに提示して選択させることを特徴とする検索プログラム。（２）

（付記４）
付記１記載の検索プログラムに於いて、前記コンピュータに、更に、前記検索ステップで検索に成功した分解後クエリの特徴量を抽出してクエリ選考知識データベースに登録するステップを実行させ、
前記候補クエリ生成ステップは、処理対象としている分解後クエリの特徴量を抽出し、前記クエリ選考知識データベースに登録されている分解後クエリとの特徴量との類似度からスコアを算出して前記処理対象の分解後クエリに付与し、前記スコア順にソートした分解後クエリを候補クエリとしてユーザに提示して選択させることを特徴とする検索プログラム。（３）

（付記５）
付記１又は２記載の検索プログラムに於いて、
前記分解前クエリの特徴量は、形態素解析された構成要素、単語数、特定の意味をもつ内容語の１又は複数の組合せを含み、
前記分解後クエリの特徴量は、名詞のみの抽出、名詞と動詞のみの抽出又は名詞句の抽出の分解手法、抽出した単語の分解前クエリ上の位置、抽出した単語の位置、抽出した単語数を示す要素数、分解前クエリの単語数に対する分解後の要素数の割合、又は抽出した単語の意味を示す意味ラベルの１又は複数の組合せを含むことを特徴とする検索プログラム。

（付記６）
ユーザが指定したクエリを入力するクエリ入力部と、
前記クエリを使用して検索する検索部と、
前記検索部で検索に失敗した場合、前記クエリを分解して生成した複数の候補クエリをユーザに提示し、ユーザが選択したクエリを使用して前記検索部に検索させる候補クエリ生成部と、
を備え、
更に、前記候補クエリ生成部は、分解前クエリの分解手法として、名詞のみの抽出、名詞と動詞のみの抽出、名詞句の抽出のいずれかを予め設定し、前記設定した分解手法に基づいて分解前クエリから抽出した語句及び語句の組合わせを候補クエリとして生成することを特徴とする情報検索装置。（４）

（付記７）
付記６記載の情報検索装置に於いて、前記候補クエリ生成部は、前記検索部により検索結果が１件も得られない０件ヒットの場合に検索失敗と判定して候補クエリ生成処理を実行することを特徴とする情報検索装置。

（付記８）
付記６記載の情報検索装置に於いて、更に、前記クエリ入力部で入力した分解前クエリと前記候補クエリ生成部でユーザが選択した分解後クエリの組について、各々の特徴量を抽出して登録したクエリ分解知識データベースを備え、
前記候補クエリ生成部は、処理対象としている分解前クエリと分解後クエリの組について各々の特徴量を抽出し、前記クエリ分解知識データベースに登録されている分解前クエリと分解後クエリの組の各特徴量との類似度からスコアを算出して前記処理対象の分解後クエリに付与し、前記スコア順にソートした分解後クエリを候補クエリとしてユーザに提示して選択させることを特徴とする情報検索装置。

（付記９）
付記６記載の情報検索装置に於いて、更に、前記検索部で検索に成功した分解後クエリの特徴量を抽出して登録したクエリ選考知識データベースを備え、
前記候補クエリ生成部は、処理対象としている分解後クエリの特徴量を抽出し、前記クエリ選考知識データベースに登録されている分解後クエリとの特徴量との類似度からスコアを算出して前記処理対象の分解後クエリに付与し、前記スコア順にソートした分解後クエリを候補クエリとしてユーザに提示して選択させることを特徴とする情報検索装置。

（付記１０）
付記６又は７記載の情報検索装置に於いて、
前記分解前クエリの特徴量は、形態素解析された構成要素、単語数、特定の意味をもつ内容語の１又は複数の組合せを含み、
前記分解後クエリの特徴量は、名詞のみの抽出、名詞と動詞のみの抽出又は名詞句の抽出の分解手法、抽出した単語の分解前クエリ上の位置、抽出した単語の位置、抽出した単語数を示す要素数、分解前クエリの単語数に対する分解後の要素数の割合、又は抽出した単語の意味を示す意味ラベルの１又は複数の組合せを含むことを特徴とする情報検索装置。

（付記１１）
ユーザが指定したクエリを入力するクエリ入力ステップと、
前記クエリを使用して検索する検索ステップと、
前記検索ステップで検索に失敗した場合、前記クエリを分解して生成した複数の候補クエリをユーザに提示し、ユーザが選択したクエリを使用して前記検索ステップで検索させる候補クエリ生成ステップと、
を備え、
更に、前記候補クエリ生成ステップは、分解前クエリの分解手法として、名詞のみの抽出、名詞と動詞のみの抽出、名詞句の抽出のいずれかを予め設定し、前記設定した分解条件に基づいて分解前クエリから抽出した語句及び語句の組合わせを候補クエリとして生成することを特徴とする情報検索方法。たことを特徴とする情報検索方法。（５）

（付記１２）
付記１１記載の情報検索方法に於いて、前記候補クエリ生成ステップは、前記検索ステップにより検索結果が１件も得られない０件ヒットの場合に検索失敗と判定して候補クエリ生成処理を実行することを特徴とする情報検索方法。

（付記１３）
付記１１記載の情報検索方法に於いて、更に、前記クエリ入力ステップで入力した分解前クエリと前記候補クエリ生成ステップでユーザが選択した分解後クエリの組について、各々の特徴量を抽出してクエリ分解知識データベースに登録するステップを備え、
前記候補クエリ生成ステップは、処理対象としている分解前クエリと分解後クエリの組について各々の特徴量を抽出し、前記クエリ分解知識データベースに登録されている分解前クエリと分解後クエリの組の各特徴量との類似度からスコアを算出して前記処理対象の分解後クエリに付与し、前記スコア順にソートした分解後クエリを候補クエリとしてユーザに提示して選択させることを特徴とする情報検索方法。

（付記１４）
付記１１記載の情報検索方法に於いて、更に、前記検索ステップで検索に成功した分解後クエリの特徴量を抽出してクエリ選考知識データベースに登録するステップを備え、
前記候補クエリ生成ステップは、処理対象としている分解後クエリの特徴量を抽出し、前記クエリ選考知識データベースに登録されている分解後クエリとの特徴量との類似度からスコアを算出して前記処理対象の分解後クエリに付与し、前記スコア順にソートした分解後クエリを候補クエリとしてユーザに提示して選択させることを特徴とする情報検索方法。

（付記１５）
付記１１又は１２記載の情報検索方法に於いて、
前記分解前クエリの特徴量は、形態素解析された構成要素、単語数、特定の意味をもつ内容語の１又は複数の組合せを含み、
前記分解後クエリの特徴量は、名詞のみの抽出、名詞と動詞のみの抽出又は名詞句の抽出の分解手法、抽出した単語の分解前クエリ上の位置、抽出した単語の位置、抽出した単語数を示す要素数、分解前クエリの単語数に対する分解後の要素数の割合、又は抽出した単語の意味を示す意味ラベルの１又は複数の組合せを含むことを特徴とする情報検索方法。

本発明による情報検索装置の実施形態を示した機能構成のブロック図本実施形態の検索プログラムが実行されるコンピュータのハードウェア環境のブロック図本発明による情報検索処理のフローチャート図３のステップＳ８のクエリ分解知識記録処理の詳細を示したフローチャート図４に対応した図１のクエリ分解知識記録処理部の動作を示した説明図図３のステップＳ１０のクエリ選考知識記録処理の詳細を示したフローチャート図６に対応した図１のクエリ選考知識記録部の動作を示した説明図図３のステップＳ４の候補クエリ生成処理の詳細を示したフローチャート図８に対応した図１の候補クエリ処理部の動作を示した説明図図３のステップＳ４の候補クエリ生成処理の他の実施形態を示したフローチャート図１０に対応した図１の候補クエリ処理部の動作を示した説明図図１のクエリ分解知識記録処理部による動作の他の具体例を示した説明図図１のクエリ選考知識記録部による動作の他の具体例を示した説明図図１の候補クエリ処理部による動作の他の具体例を示した説明図図１の候補クエリ処理部の他の実施形態による動作の他の具体例を示した説明図

符号の説明

１０：クエリ入力部
１２：検索制御部
１４：検索エンジン
１６：インターネット
１８：検索結果表示部
２０：候補クエリ処理部
２２：分解候補表示指定部
２４：知識記録部
２６：クエリ分解知識記録部
２８：クエリ選考知識記録部
３０：クエリ分解知識データベース
３２：クエリ選考知識データベース
３４：分解候補生成部
３６：スコア付与部
３８：分解候補提示部
４０：分解前クエリ特徴抽出部
４２，４６：検索成功クエリ特徴抽出部
４４，４８：データベース登録部
５０：ＣＰＵ
５２：バス
５４：ＲＡＭ
５５：ＲＯＭ
５６：ハードディスクドライブ
５８：デバイスインタフェース
６０：キーボード
６２：マウス
６４：ディスプレイ
６６：ネットワークアダプタ
６８，７６，９６：分解前クエリ
７０，９８，１０４：検索成功クエリ
７２，７４，７６−１，８０−１，９６−１，１００，１０２，１０６−１：特徴量
７８，１０５：分解候補一覧
８０，１０６：分解後クエリ（候補クエリ）
８２−１〜８２−３，９０−１〜９０−３，１０８−１〜１０８−３，１１６−１〜１１６−３：保存知識
８４，１１０：分解前クエリ特徴量
８６，１１２：分解後クエリ特徴量
８８，９４，１１４：類似度計算
９２：検索成功クエリ特徴量

Claims

コンピュータに、
ユーザが指定したクエリを入力するクエリ入力ステップと、
前記クエリを使用して検索する検索ステップと、
前記検索ステップで検索に失敗した場合、前記クエリを分解して生成した複数の候補クエリをユーザに提示し、ユーザが選択したクエリを使用して前記検索ステップで検索させる候補クエリ生成ステップと、
前記クエリ入力ステップで入力した分解前クエリと前記候補クエリ生成ステップでユーザが選択した分解後クエリの組について、各々の特徴量を抽出してクエリ分解知識データベースに登録するクエリ分解知識データベース登録ステップと、
を実行させ、
更に、前記候補クエリ生成ステップは、分解前クエリの分解手法として、名詞のみの抽出、名詞と動詞のみの抽出、名詞句の抽出のいずれかを予め設定し、前記設定した分解条件に基づいて分解前クエリから抽出した語句及び語句の組合わせを候補クエリとして生成すると共に処理対象としている分解前クエリと分解後クエリの組について各々の特徴量を抽出し、前記クエリ分解知識データベースに登録されている分解前クエリと分解後クエリの組の各特徴量との類似度からスコアを算出して前記処理対象の分解後クエリに付与し、前記スコア順にソートした分解後クエリを候補クエリとしてユーザに提示して選択させることを特徴とする検索プログラム。
請求項１記載の検索プログラムに於いて、前記コンピュータに、更に、前記検索ステップで検索に成功した分解後クエリの特徴量を抽出してクエリ選考知識データベースに登録するクエリ選考知識データベース登録ステップと、
を実行させ、
前記候補クエリ生成ステップは、処理対象としている分解後クエリの特徴量を抽出し、前記クエリ選考知識データベースに登録されている分解後クエリとの特徴量との類似度からスコアを算出して前記処理対象の分解後クエリに付与し、前記スコア順にソートした分解後クエリを候補クエリとしてユーザに提示して選択させることを特徴とする検索プログラム。
ユーザが指定したクエリを入力するクエリ入力部と、
前記クエリを使用して検索する検索部と、
前記検索部で検索に失敗した場合、前記クエリを分解して生成した複数の候補クエリをユーザに提示し、ユーザが選択したクエリを使用して前記検索部に検索させる候補クエリ生成部と、
前記クエリ入力ステップで入力した分解前クエリと前記候補クエリ生成ステップでユーザが選択した分解後クエリの組について、各々の特徴量を抽出してクエリ分解知識データベースに登録するクエリ分解知識データベース登録部と、
を備え、
更に、前記候補クエリ生成部は、分解前クエリの分解手法として、名詞のみの抽出、名詞と動詞のみの抽出、名詞句の抽出のいずれかを予め設定し、前記設定した分解手法に基づいて分解前クエリから抽出した語句及び語句の組合わせを候補クエリとして生成すると共に処理対象としている分解前クエリと分解後クエリの組について各々の特徴量を抽出し、前記クエリ分解知識データベースに登録されている分解前クエリと分解後クエリの組の各特徴量との類似度からスコアを算出して前記処理対象の分解後クエリに付与し、前記スコア順にソートした分解後クエリを候補クエリとしてユーザに提示して選択させることを特徴とする
ことを特徴とする情報検索装置。
コンピュータが、
ユーザが指定したクエリを入力するクエリ入力ステップと、
前記クエリを使用して検索する検索ステップと、
前記検索ステップで検索に失敗した場合、前記クエリを分解して生成した複数の候補クエリをユーザに提示し、ユーザが選択したクエリを使用して前記検索ステップで検索させる候補クエリ生成ステップと、
前記クエリ入力ステップで入力した分解前クエリと前記候補クエリ生成ステップでユーザが選択した分解後クエリの組について、各々の特徴量を抽出してクエリ分解知識データベースに登録するクエリ分解知識データベース登録ステップと、
を備え、
更に、前記候補クエリ生成ステップは、分解前クエリの分解手法として、名詞のみの抽出、名詞と動詞のみの抽出、名詞句の抽出のいずれかを予め設定し、前記設定した分解条件に基づいて分解前クエリから抽出した語句及び語句の組合わせを候補クエリとして生成すると共に処理対象としている分解前クエリと分解後クエリの組について各々の特徴量を抽出し、前記クエリ分解知識データベースに登録されている分解前クエリと分解後クエリの組の各特徴量との類似度からスコアを算出して前記処理対象の分解後クエリに付与し、前記スコア順にソートした分解後クエリを候補クエリとしてユーザに提示して選択させることを特徴とことを特徴とする情報検索方法。