JP4762063B2 - 計算機システム、プログラム及び検索エンジン検索方法 - Google Patents

計算機システム、プログラム及び検索エンジン検索方法 Download PDF

Info

Publication number
JP4762063B2
JP4762063B2 JP2006179519A JP2006179519A JP4762063B2 JP 4762063 B2 JP4762063 B2 JP 4762063B2 JP 2006179519 A JP2006179519 A JP 2006179519A JP 2006179519 A JP2006179519 A JP 2006179519A JP 4762063 B2 JP4762063 B2 JP 4762063B2
Authority
JP
Japan
Prior art keywords
search engine
search
access
address
history
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006179519A
Other languages
English (en)
Other versions
JP2008009711A (ja
Inventor
康嗣 森本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2006179519A priority Critical patent/JP4762063B2/ja
Priority to US11/770,150 priority patent/US8122001B2/en
Publication of JP2008009711A publication Critical patent/JP2008009711A/ja
Application granted granted Critical
Publication of JP4762063B2 publication Critical patent/JP4762063B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

ユーザの要求に応じて検索エンジンを使い分けるメタサーチ技術に関し、特に、ユーザの要求に合致する検索エンジンを検索する技術に関する。
パソコン及びインターネットの普及によって、ユーザがアクセス可能な電子化文書の量が増大している。このような状況に対処するための技術として、文書検索技術が知られている。文書検索技術は、ユーザに入力された検索クエリに適合する文書を検索する技術である。なお、検索クエリは、キーワードであってもよいし、文であってもよい。
企業内などのイントラネット上及びインターネット上には、多くの検索エンジンが構築されている。ユーザは、検索エンジンを用いることによって、適切な文書を取得する。なお、検索エンジンは、汎用性の高い検索エンジン又は専門性の高い検索エンジンに分類される。
汎用性の高い検索エンジンは、ユーザに要求された文書を、特定のタイプの文書の中だけから検索するのではなく、膨大な文書の中から検索する。汎用性の高い検索エンジンは、例えば、Google等である。
専門性の高い検索エンジンは、ユーザに要求された文書を、特定のタイプの文書の中から検索する。専門性の高い検索エンジンは、例えば、特許検索エンジン、社内レポートの検索エンジン又はマニュアルの検索エンジン等である。
ユーザが、適切な文書を取得するためには、適切に検索エンジンを使い分ける必要がある。しかしながら、検索の用途に応じて検索エンジンを使い分けることは、ユーザにとって極めて煩雑である。
この問題を解決するためのメタサーチ技術が特許文献1に開示されている。メタサーチ技術は、複数の検索エンジンに対して統合的に検索処理を行う技術である。具体的な処理は、以下のようになる。まず、メタサーチエンジンに検索クエリが入力される。すると、メタサーチエンジンは、複数の検索エンジンに並行して検索要求を送信する。そして、メタサーチエンジンは、それぞれの検索エンジンから受信した検索結果をまとめて出力する。このようにして、メタサーチ技術は、ユーザの利便性を向上する。
一方、ユーザの利便性を増すためには、検索結果の質が重要である。検索の質を向上するための技術が、特許文献2に開示されている。特許文献2の技術では、他のユーザの検索ノウハウが利用される。具体的には、検索結果に対するユーザの操作に基づいて、当該検索結果に対応する文書の価値が判定される。
また、or検索を含むブール式による検索及びベクトルモデルによる類似検索などを含む文書を検索するための様々な技術が、非特許文献1に開示されている。
特開2002−278980号公報 特開2005−242760号公報 北研二、津田和彦、獅々堀正幹著「情報検索アルゴリズム」共立出版
従来のメタサーチ技術では、検索エンジンが既知であることを前提としており、既知の検索エンジンのリストが管理されている必要がある。しかし、検索エンジンのリストの管理は、非常に困難である。そのため、メタサーチ技術には、高いコストが必要となる。
また、メタサーチエンジンは、それぞれの検索エンジンに適合した形式で検索クエリを送信する必要がある。よって、それぞれの検索エンジンに適合する形式を、検索エンジンのリストの付加情報として管理する必要がある。そのため、検索エンジンのリストを管理するためのコストが、更に増大する。
本発明は、前述した問題点に鑑みてなされたものであって、ユーザによる検索エンジンの使い分けを支援する技術を提供することを目的とする。
本発明の代表的な形態は、プロセッサ、メモリ及びインタフェースを備える一つ以上のクライアント計算機と、前記クライアント計算機にネットワークを介して接続される一つ以上の検索エンジンと、前記クライアント計算機に接続される管理計算機と、を備える計算機システムであって、前記管理計算機は、前記クライアント計算機によるアクセスの履歴を収集し、前記収集されたアクセスの履歴を分析することによって、前記クライアント計算機から前記クライアント計算機のアクセス先に渡されたパラメータを特定し、前記特定されたパラメータが、検索クエリであるか否かを判定し、前記検索クエリと判定されたパラメータを含むアクセスを、前記検索エンジンに対するアクセスと判定し、前記収集されたアクセスの履歴の中から、前記検索エンジンに対するアクセスの履歴を選択し、前記選択された検索エンジンに対するアクセスの履歴から、当該検索エンジンのアドレス及び検索クエリを抽出し、前記抽出された検索エンジンのアドレスと前記抽出された検索クエリとの対応を、検索エンジンプロファイルに記憶することを特徴とする。
本発明の代表的な形態によれば、ユーザが適切な検索エンジンを使用できる。
以下、本発明の実施の形態を、図面を参照して説明する。
図1は、本発明の実施の形態の計算機システムの構成のブロック図である。
計算機システムは、一つ以上のクライアント計算機201、検索エンジン検索サーバ100、複数の検索エンジン301、ネットワーク400及びネットワーク500を含む。
ネットワーク400は、クライアント計算機201と検索エンジン検索サーバ100とを接続する。例えば、ネットワーク400は、LAN(Local Area Network)である。
また、ネットワーク500は、検索エンジン検索サーバ100と検索エンジン301とを接続する。例えば、ネットワーク500は、インターネットである。なお、ネットワーク400及びネットワーク500が、一つであってもよい。
クライアント計算機201は、CPU、主メモリ及びインタフェースを備える。クライアント計算機201に備わるCPUは、主メモリに記憶されるプログラムを実行することによって各種処理を行う。クライアント計算機201に備わる主メモリは、CPUによって実行されるプログラム及びCPUによって必要とされる情報等を記憶する。クライアント計算機201に備わるインタフェースは、ネットワーク400を介して、検索エンジン検索サーバ100に接続される。
クライアント計算機201は、検索エンジン301に検索クエリを送信する。その後、クライアント計算機201は、検索結果を検索エンジン301から受信する。
検索エンジン301は、CPU、主メモリ及びインタフェースを備える。検索エンジン301に備わるCPUは、主メモリに記憶されるプログラムを実行することによって各種処理を行う。検索エンジン301に備わる主メモリは、CPUによって実行されるプログラム及びCPUによって必要とされる情報等を記憶する。例えば、検索エンジン301に備わる主メモリは、CGI(Common Gateway Interface)プログラムを記憶する。検索エンジン301に備わるインタフェースは、ネットワーク500を介して、検索エンジン検索サーバ100に接続される。
検索エンジン301は、クライアント計算機201から検索クエリを受信する。次に、検索エンジン301は、受信した検索クエリに合致するサイトを検索する。そして、検索エンジン301は、検索したサイトに関する情報を検索結果として、クライアント計算機201に送信する。つまり、検索エンジン301は、クライアント計算機201に要求されたサイトを探すためのデータベース的な役割を果たす。
検索エンジン検索サーバ100は、CPU101、主メモリ102、入出力装置103、ネットワーク装置104及びディスク装置110を備える。また、検索エンジン検索サーバ100は、一般的なプロキシサーバと同様の機能を備える。プロキシサーバは、クライアント計算機201のWebアクセスを、ユーザ認証に基づいて許可する計算機である。
CPU101は、主メモリ102に記憶されるプログラムを実行することによって各種処理を行う。具体的には、CPU101は、ディスク装置110に記憶されるプログラムを、主メモリ102上に呼び出して実行する。
主メモリ102は、CPU101によって実行されるプログラム及びCPU101によって必要とされる情報等を記憶する。入出力装置103には、ユーザから情報が入力される。また、入出力装置103は、CPU101の指示に応じて、情報を出力する。例えば、入出力装置103は、キーボード、マウス及びディスプレイのうち少なくとも一つを含む。
ネットワーク装置104は、ネットワーク400を介して、クライアント計算機201に接続される。また、ネットワーク装置104は、ネットワーク500を介して検索エンジン301に接続される。
ディスク装置110は、各種情報を記憶する。具体的には、ディスク装置110は、OS111、アクセス履歴収集プログラム112、アクセス履歴解析プログラム113、アクセス履歴114、検索エンジンプロファイル115及び検索エンジン属性ファイル116を記憶する。
OS111は、当該検索エンジン検索サーバ100の処理の全体を制御する。
アクセス履歴収集プログラム112は、クライアント計算機201によるアクセスの履歴を収集する。そして、アクセス履歴収集プログラム112は、収集した履歴を、アクセス履歴114として管理する。なお、アクセス履歴収集プログラム112は、プロキシサーバの出力結果を利用して、クライアント計算機201によるアクセスの履歴を収集してもよい。
アクセス履歴解析プログラム113は、アクセス履歴114を解析する。これによって、アクセス履歴解析プログラム113は、検索エンジンプロファイル115及び検索エンジン属性ファイル116を更新する。
アクセス履歴114は、アクセス履歴収集プログラム112によって収集されたクライアント計算機201のアクセスの履歴である。なお、アクセス履歴114については、図2で詳細を説明する。
検索エンジンプロファイル115は、検索エンジン301と当該検索エンジン301に対して検索クエリとして送られた単語との対応を管理する。なお、検索エンジンプロファイルについては、図3で詳細を説明する。
検索エンジン属性ファイル116は、検索エンジン301の属性情報を管理する。なお、検索エンジン属性ファイル116については、図5で詳細を説明する。
なお、検索エンジン検索サーバ100は、複数のサーバによって実現されてもよい。例えば、検索エンジン検索サーバ100は、アクセス履歴収集プログラム112が実行されるサーバと、アクセス履歴解析プログラム113が実行されるサーバと、によって実現されてもよい。
図2は、本発明の実施の形態の検索エンジン検索サーバ100に記憶されるアクセス履歴114の説明図である。
アクセス履歴114は、コマンドの種類1141、アクセス先URL(Uniform Resource Locator)1142及びユーザID1143を含む。
コマンドの種類1141は、クライアント計算機201から送信されたコマンドの種類である。なお、本実施の形態では、クライアント計算機201は、HTTP(Hyper Text Transfer Protocol)におけるコマンドを送信する。但し、クライアント計算機201は、他のプロトコルにおけるコマンドを送信してもよい。
アクセス先URL1142は、当該コマンドによってアクセスされるサイトのアドレスである。
アクセス先URL1142は、“http://<host>:<port>/<path>?<searchpart>”のように記述される。「host」は、ネットワークホストのドメイン名又はネットワークホストのIPアドレスを示す。「port」は、接続のために用いられるポート番号を示す。なお、「port」が省略された場合、「port」には、デフォルト値である「80」が使用される。「path」は、アクセスするリソースの位置を特定するためのパスを示す。「searchpart」は、クエリ文字列であり、httpサーバに引数として渡される。検索エンジンに対する検索クエリは、「searchpart」に埋め込まれる。
ユーザID1143は、当該コマンドの送信元であるクライアント計算機201の一意な識別子である。
図3は、本発明の実施の形態の検索エンジン検索サーバ100に記憶される検索エンジンプロファイル115の構成図である。
検索エンジンプロファイル115は、URL1151、名前1152及び特徴語リスト1153を含む。
URL1151は、検索エンジン検索サーバ100によって検索エンジン301であると判定されたサイトのアドレスである。なお、検索エンジン検索サーバ100は、クライアント計算機201からのアクセスに基づいて、当該アクセス先のサイトが検索エンジン301であるか否かを判定する。
名前1152は、当該レコードのURL1151に対応する検索エンジン301が検索コマンドの中から検索クエリを特定するための情報である。検索コマンドは、クライアント計算機201から検索エンジン301へのアクセスの一種であり、図4で後述するCGIの仕様におけるURLを含む。
特徴語リスト1153は、特徴語及び検索回数を含む。特徴語は、当該レコードのURL1151に対応する検索エンジン301に対して、検索クエリとして送信された単語である。検索回数は、当該レコードのURL1151に対応する検索エンジン301に対して、当該特徴語が送信された回数である。
図4は、本発明の実施の形態のCGIの仕様におけるURLの説明図である。
CGIは、WWWサーバによるプログラムの起動方法(環境変数の名前及び値の設定を含む。)を定めた仕様である。
URLの「searchpart」には、CGIに固有な形式の情報が記述される。具体的には、URLの「searchpart」には、名前と値とのペアが一つ以上記述される。名前と値とのペアが複数記述される場合、それぞれのペア同士は、「&」によって連結される。また、それぞれのペアでは、名前と値とが「=」によって連結される。つまり、i番目の名前と当該名前に対応する値とのペアは、「名前i=値i」のように記述される。
検索エンジン301のCGIプログラムは、例えば、環境変数QUERY_STRINGから、「searchpart」に相当する文字列を取得する。次に、検索エンジン301のCGIプログラムは、取得した文字列をCGI形式に従って解釈する。これによって、検索エンジン301のCGIプログラムは、取得した文字列から、名前と値とのペアを抽出する。
CGIでは、searchpartに格納される名前が、どのような文字列で記述されるかは特に定められていない。実際には、クライアント計算機201及び検索エンジン301には、ユーザによって入力された検索クエリをCGIプログラムに送信する際に使用される名前が予め設定される。つまり、当該設定された名前は、当該名前とペアになる値が検索クエリであることを示す。
クライアント計算機201は、ユーザに入力された検索クエリを値に変換する。次に、クライアント計算機201は、変換した値と、予め設定された名前とをペアとして、URLの「searchpart」に格納する。そして、クライアント計算機201は、当該URLを検索エンジン301に送信する。
検索エンジン301は、受信したURLから、予め設定された名前とペアになっている値を抽出する。そして、検索エンジン301は、抽出した値を、検索クエリであると判断する。
このように、クライアント計算機201及び検索エンジン301には、検索クエリを特定するための名前が予め設定されている。これによって、検索エンジン301が、CGI形式を解釈できる。
なお、検索エンジン301に送信されるURLの「searchpart」には、検索クエリ以外を示す名前と値とのペアが格納されることがある。このとき、いずれの名前が検索クエリを示すかは、検索エンジン301に検索クエリを入力するためのHTML文書の画面設計に依存している。
ここで、本実施の形態の効果の一つについて説明する。従来の検索エンジン検索サーバは、いずれの名前が検索クエリを示すかを把握していない。そのため、従来の検索エンジン検索サーバは、検索クエリが、URL中のどの部分であるかを特定できない。
しかし、本実施の形態の検索エンジン検索サーバ100は、任意の検索エンジン301に送信されたURLの中から、検索クエリを抽出できる。この処理の詳細については、後述する。
図5は、本発明の実施の形態の検索エンジン検索サーバ100に記憶される検索エンジン属性ファイル116の構成図である。
検索エンジン属性ファイル116は、URL1161、タイトル1162、専門度1163及び利用回数1164を含む。
URL1161は、検索エンジン検索サーバ100によって検索エンジン301と判定されたサイトのアドレスである。タイトル1162は、当該レコードのURL1161にアクセスすることによって取得されるHTML文書に含まれるTITLEタグ中の文字列である。
専門度1163は、当該レコードのURL1151に対応する検索エンジン301の専門性の高さを示す。専門度1163は、単語の延べ数に対する単語の異なり数の割合である。延べ数は、当該検索エンジン301に検索クエリとして送信された単語の個数である。異なり数は、当該検索エンジン301に検索クエリとして送信された単語のうち、異なる単語の個数である。
専門度1163が「0」に近いほど、検索エンジン301の専門性が高い。なぜなら、専門性の高い検索エンジン301には、当該検索エンジン301に適合する専門分野の単語が入力されるので、同じ単語が入力される可能性が高いからである。一方、専門度1163が「1」に近いほど、検索エンジン301の専門性が低く、一般的な検索エンジン301である。なぜなら、一般的な検索エンジン301には、様々な分野の単語が入力されるので、同じ単語が入力される可能性は低いからである。
利用回数1164は、当該レコードのURL1151に対応する検索エンジン301が利用された回数である。
図6は、本発明の実施の形態の検索エンジン検索サーバ100によって実行される情報更新処理のフローチャートである。
例えば、情報更新処理は、定期的に実行される。
まず、検索エンジン検索サーバ100は、検索エンジン入力単語リスト作成処理を実行する(S11)。なお、検索エンジン入力単語リスト作成処理については、図8で詳細を説明する。これによって、検索エンジン検索サーバ100は、検索エンジン入力単語リストを、検索エンジン301ごとに作成する。
次に、検索エンジン検索サーバ100は、作成した検索エンジン入力単語リストに基づいて、検索エンジンプロファイル115を更新する(S12)。
具体的には、検索エンジン検索サーバ100は、作成した検索エンジン入力単語リストに対応する検索エンジン301のURLと検索エンジンプロファイル115のURL1151とが一致するレコードを、検索エンジンプロファイル115から選択する。次に、検索エンジン検索サーバ100は、検索エンジン入力単語リストに含まれる単語を順番に選択する。次に、検索エンジン検索サーバ100は、選択した単語と、検索エンジンプロファイル115の特徴語リスト1153に含まれる特徴語と、が一致する列を、選択したレコードの中から選択する。次に、検索エンジン検索サーバ100は、選択した列の検索回数を増加させる。
なお、検索エンジン検索サーバ100は、列を選択できなかった場合には、選択したレコードの特徴語リスト1153に新たな列を追加する。次に、検索エンジン検索サーバ100は、追加した列の特徴語に、選択した単語を格納する。更に、検索エンジン検索サーバ100は、追加した列の検索回数に、「1」を格納する。
また、検索エンジン検索サーバ100は、URLが一致するレコードを選択できなかった場合、検索エンジンプロファイル115に新たなレコードを追加する。次に、検索エンジン検索サーバ100は、追加した新たなレコードのURL1151に、作成した検索エンジン入力単語リストに対応する検索エンジン301のURLを格納する。次に、検索エンジン検索サーバ100は、ステップS11の検索エンジン入力単語リスト作成処理(図8)において検索クエリを示すとして特定された名前を、新たなレコードの名前1152に格納する。次に、検索エンジン検索サーバ100は、新たなレコードの特徴語リスト1153に、検索エンジン入力単語リストに含まれる単語をすべて格納する。
以上のように、検索エンジン検索サーバ100は、検索エンジンプロファイル115を更新する。
次に、検索エンジン検索サーバ100は、検索エンジン属性ファイル116を更新する(S13)。
具体的には、検索エンジン検索サーバ100は、検索エンジン属性ファイル116に新たなレコードを追加する。次に、検索エンジン検索サーバ100は、後述するステップS115で検索エンジン301であると判定されたサイトのURLを、新たなレコードのURL1161に格納する。
次に、検索エンジン検索サーバ100は、当該格納されたURLにアクセスすることによって、HTML文書を取得する。次に、検索エンジン検索サーバ100は、取得したHTML文書のTITLEタグから、文字列を抽出する。次に、検索エンジン検索サーバ100は、抽出した文字列を、新たなレコードのタイトル1162に格納する。
次に、検索エンジン検索サーバ100は、後述するステップS115で算出した異なり率を、新たなレコードの専門率1163に格納する。次に、検索エンジン検索サーバ100は、後述するステップS114で算出した延べ数を、新たなレコードの利用回数1164に格納する。
以上のように、検索エンジン検索サーバ100は、検索エンジン属性ファイル116を更新する。
そして、検索エンジン検索サーバ100は、情報更新処理を終了する。
図7は、本発明の実施の形態の検索エンジン検索サーバ100によって実行される検索エンジン入力単語リスト作成処理のフローチャートである。
なお、検索エンジン入力単語リスト作成処理は、情報更新処理のステップS11において実行される。
まず、検索エンジン検索サーバ100は、アクセス履歴114のアクセス先URL1142を、アクセス先のサイトごとに分類する。
例えば、以下のような方法によって処理を行う。検索エンジン検索サーバ100は、アクセス履歴114のアクセス先URL1142から、先頭から「?」の直前までの文字列を抽出する。次に,検索エンジン検索サーバ100は、抽出した文字列から、先頭の“http://”の部分を除去する。次に、検索エンジン検索サーバ100は、除去された文字列から、「:」から最初の「/」の直前までの文字列を除去する。これによって、検索エンジン検索サーバ100は、抽出した文字列から、URLの「host」+「path」に対応する文字列を取得する。
そして、検索エンジン検索サーバ100は、URLの「host」+「path」に対応する文字列に基づいて、アクセス履歴114のアクセス先URL1142を、アクセス先のサイトごとに分類する。つまり、検索エンジン検索サーバ100は、URLの「host」+「path」に対応する文字列が除去された文字列が同一であると、同一のサイトに対するアクセス履歴と判定する。
次に、検索エンジン検索サーバ100は、分類されたすべてのアクセス先URL1142に対して、ステップS113からステップS116までを実行したか否かを判定する(S112)。アクセス先URL1142のすべてが処理を実行されている場合、検索エンジン検索サーバ100は、検索エンジン入力単語リスト抽出処理を終了する。
一方、アクセス先URL1142のいずれか一つでも処理が実行されていない場合、検索エンジン検索サーバ100は、以前のステップS113において選択されていないアクセス先のサイトの一つを選択する。次に、検索エンジン検索サーバ100は、選択したサイトに分類されたすべてのURL1142から、名前と値とのペアをすべて抽出する(S113)。
次に、検索エンジン検索サーバ100は、CGI形式の構文に従って、抽出したすべてのペアから、名前及び値を抽出する。具体的には、検索エンジン検索サーバ100は、「&」に基づいて、ペア同士の間の切れ目を特定する。また、検索エンジン検索サーバ100は、「=」に基づいて、名前と値との間の切れ目を特定する。これによって、検索エンジン検索サーバ100は、抽出したすべてのペアから、名前及び値を抽出できる。
なお、検索エンジン検索サーバ100は、CGI形式以外の形式であっても、それぞれの形式の構文に従って、名前及び値を抽出できる。なぜなら、CGI形式以外の形式にも、構文が存在するからである。
次に、検索エンジン検索サーバ100は、抽出した値を、抽出した名前ごとに分類する。次に、検索エンジン検索サーバ100は、分類された値の延べ数及び異なり数を算出する(S114)。延べ数は、検索エンジン検索サーバ100によって名前ごとに分類された値の個数である。異なり数は、検索エンジン検索サーバ100によって名前ごとに分類された値のうち、重複しない値の個数である。
次に、検索エンジン検索サーバ100は、算出した延べ数及び異なり数に基づいて、ステップS113において選択されたアクセス先のサイトが、検索エンジン301であるか否かを判定する(S115)。
具体的には、検索エンジン検索サーバ100は、算出した異なり数を、算出した延べ数で割ることによって、異なり率を算出する。そして、検索エンジン検索サーバ100は、算出した異なり率と予め設定された閾値とを比較する。算出された異なり率が閾値以上の場合、検索エンジン検索サーバ100は、ステップS113において選択されたアクセス先のサイトが、検索エンジン301であると判定する。なぜなら、検索エンジン301には様々な単語が検索クエリとして送信されるので、異なり率は、大きくなるからである。このとき、検索エンジン検索サーバ100は、ステップS113で抽出した名前の中から、検索クエリを特定するために用いられる名前を特定する。
次に、検索エンジン検索サーバ100は、ステップS113で抽出した値の中から、検索クエリを特定するために用いられる名前とペアになっている値をすべて抽出する。次に、検索エンジン検索サーバ100は、抽出した値をデコードすることによって、検索クエリとして入力された単語を取得する。なお、検索クエリとして入力された単語が日本語の場合、CGIの引数部分は、16進数でエンコーディングされている。次に、検索エンジン検索サーバ100は、取得したすべての単語を、検索エンジン入力単語リストとして記憶する(S116)。
次に、検索エンジン検索サーバ100は、ステップS112に戻る。そして、検索エンジン検索サーバ100は、アクセス履歴114のアクセス先URL1142のすべてを処理するまで、検索エンジン入力単語リスト作成処理を繰り返す。
一方、算出された異なり率が閾値より小さい場合、検索エンジン検索サーバ100は、ステップS113において選択されたアクセス先のサイトが、検索エンジン301でないと判定する。そのため、検索エンジン検索サーバ100は、検索エンジン入力単語リストを作成する必要がない。よって、検索エンジン検索サーバ100は、そのまま、ステップS112に戻る。そして、検索エンジン検索サーバ100は、アクセス履歴114のアクセス先URL1142のすべてを処理するまで、検索エンジン入力単語リスト作成処理を繰り返す。
以上のように、検索エンジン検索サーバ100は、アクセス履歴から、検索エンジン301に対するアクセスのみを特定する。次に、検索エンジン検索サーバ100は、特定したアクセスから、検索エンジン301に対して検索クエリとして送信された単語を抽出する。そして、検索エンジン検索サーバ100は、抽出した単語をリストにすることによって、検索エンジン入力単語リストを作成する。
なお、検索エンジン検索サーバ100は、ステップS115において、延べ数及び異なり数に基づいて、アクセス先のサイトが検索エンジン301であるか否かを判定した。しかし、検索エンジン検索サーバ100は、他の方法を用いて、アクセス先のサイトが検索エンジン301であるか否かを判定してもよい。
例えば、クライアント計算機201が日本語のユーザによって操作されていれば、検索クエリは、日本語の単語である可能性が高い。よって、検索エンジン検索サーバ100は、日本語の文字列に対応する値とペアになっていることが多い名前を、検索クエリを特定するために用いられる名前として特定する。更に、検索エンジン検索サーバ100は、日本語の文字列に対応する値を含むアクセスが多くされているサイトを、検索エンジン301であると判定する。
他にも、検索エンジン検索サーバ100は、HTML文書に含まれる情報に基づいて、アクセス先のサイトが検索エンジン301であるか否かを判定してもよい。具体的には、検索エンジン検索サーバ100は、アクセス先のサイトのURLにアクセスすることによって、HTML文書を取得する。次に、検索エンジン検索サーバ100は、取得したHTML文書に、検索エンジン301特有の情報が含まれているか否かを判定する。検索エンジン301特有の情報は、検索クエリを入力するためのテキスト領域及び検索クエリを送信するための送信ボタン等を含む。
そして、検索エンジン検索サーバ100は、HTML文書に検索エンジン301特有の情報が含まれていれば、当該アクセス先のサイトを、検索エンジン301であると判定する。
図8は、本発明の実施の形態のクライアント計算機201に表示される検索サイト画面の説明図である。
検索サイト画面は、検索エンジン301から送信されたHTML文書を、クライアント計算機201に備わるWEBブラウザによって表示されたものである。
検索サイト画面は、検索クエリを入力するためのテキスト領域及び検索クエリの送信を要求するための検索実行ボタン等を含む。
図9は、本発明の実施の形態の検索エンジン301から送信されるHTML文書の説明図である。
本説明図のHTML文書は、図8の検索サイト画面を表示するためのものである。
検索サイト画面を表示するためのHTML文書は、<FORM>タグ及び<input>タグを含む。<FORM>タグは、入力フォームを作成するためのタグである。<input>タグは、フォームの部品として使用される。なお、<input>タグの代わりに、<TEXTAREA>タグなどが使用されてもよい。
検索サイト画面を表示するためのHTML文書には、「キーワード」、「検索」又は「サーチ」などの検索に関連する文字列が含まれる。これらは、ユーザに検索サイトを認識させるためのものである。
つまり、検索エンジン検索サーバ100は、HTML文書に<FORM>タグ、<input>タグ及び検索に関連する文字列等を含むか否かに基づいて、アクセス先のサイトが検索エンジン301であるか否かを判定できる。
図10は、本発明の実施の形態の検索エンジン検索サーバ100によって実行される検索エンジン検索処理のフローチャートである。
ここでは、and検索によって検索エンジン301を検索する場合について説明する。しかし、or検索を含むブール式による検索及びベクトルモデルによる類似検索などを含む文書を検索するためのいかなる技術にも適用できる。これらの検索技術については、非特許文献1に開示されている。
クライアント計算機201は、検索エンジン検索サーバ100に、検索エンジンの検索要求を送信する。なお、検索エンジンの検索要求は、検索クエリとなる単語を一つ以上含む。
検索エンジン検索サーバ100は、検索エンジンの検索要求を、クライアント計算機201から受信する。次に、検索エンジン検索サーバ100は、受信した検索要求から、検索クエリとなる単語を一つずつ順番に抽出する(S21)。
次に、検索エンジン検索サーバ100は、抽出した単語と検索エンジンプロファイル115の特徴語リスト1153に含まれる特徴語とが一致するすべてのレコードを、検索エンジンプロファイル115から選択する。次に、検索エンジン検索サーバ100は、選択したレコードから、URL1151を抽出する(S22)。
次に、検索エンジン検索サーバ100は、受信した検索要求に含まれる単語をステップS21ですべて抽出したか否かを判定する(S23)。検索要求に含まれる単語のすべてを抽出していない場合、検索エンジン検索サーバ100は、ステップS21に戻り、抽出されていない単語に対して処理を繰り返す。
一方、検索要求に含まれる単語のすべてを抽出した場合、検索エンジン検索サーバ100は、ステップS21において抽出されたいずれの単語に対する処理においても、抽出されたURL1151を特定する(S24)。
次に、検索エンジン検索サーバ100は、特定したURL1151を、検索エンジン検索要求に対する結果として、クライアント計算機201に送信する(S25)。例えば、検索エンジン検索サーバ100は、検索結果を含む検索結果画面を作成する。そして、検索エンジン検索サーバ100は、作成した検索結果画面をクライアント計算機201に送信する。
クライアント計算機201は、検索結果画面を検索エンジン検索サーバ100から受信する。次に、クライアント計算機201は、受信した検索結果画面を表示する。ユーザは、表示された検索結果画面を参照することによって、適切な検索エンジン301を選択できる。
図11は、本発明の実施の形態のクライアント計算機201に表示される検索結果画面の説明図である。
検索結果画面には、URL、タイトル、代表キーワード、専門度及び利用回数が、検索の結果として表示される。
URLは、クライアント計算機201に要求された条件を満たす検索エンジン301のアドレスである。
タイトルは、当該レコードのURLに対応する検索エンジン301の特徴を示す名前である。代表キーワードは、当該レコードのURLに対応する検索エンジン301に送信された代表的な単語である。
専門度は、当該レコードのURLに対応する検索エンジン301が検索可能な文書の専門性の高さを示す。利用回数は、当該レコードのURLに対応する検索エンジン301が利用された回数である。
検索結果画面がタイトル、専門度又は利用回数を含むことによって、ユーザは、適切な検索エンジンを選択できる。また、検索結果画面が代表キーワードを含むことによって、ユーザは、検索エンジンが要求に合致するか否かを判定できる。
次に、検索エンジン検索サーバ100による検索結果画面の作成処理を説明する。
まず、検索エンジン検索サーバ100は、検索エンジン検索処理(図10)のステップS24で特定したURLを、検索結果画面のURLに格納する。次に、検索エンジン検索サーバ100は、検索エンジン検索処理(図10)のステップS24で特定したURLと検索エンジン属性ファイル116のURL1161とが一致するレコードを選択する。
次に、検索エンジン検索サーバ100は、選択したレコードから、タイトル1162、専門度1163及び利用回数1164を抽出する。次に、検索エンジン検索サーバ100は、抽出したタイトル1162を、検索結果画面のタイトルに格納する。次に、検索エンジン検索サーバ100は、抽出した専門度1163を、検索結果画面の専門度に格納する。次に、検索エンジン検索サーバ100は、抽出した利用回数1164を、検索結果画面の利用回数に格納する。
次に、検索エンジン検索サーバ100は、検索エンジン検索処理(図10)のステップS24で特定したURLと検索エンジンプロファイル115のURL1151とが一致するレコードを、検索エンジンプロファイル115から選択する。次に、検索エンジン検索サーバ100は、選択したレコードの特徴語リスト1153の中から、検索回数が多い特徴語を抽出する。次に、検索エンジン検索サーバ100は、抽出した特徴語を、検索結果画面の代表キーワードに格納する。
以上のようにして、検索エンジン検索サーバ100は、検索結果画面を作成する。
本発明の実施の形態の計算機システムの構成のブロック図である。 本発明の実施の形態の検索エンジン検索サーバに記憶されるアクセス履歴の説明図である。 本発明の実施の形態の検索エンジン検索サーバに記憶される検索エンジンプロファイルの構成図である。 本発明の実施の形態のCGIの仕様におけるURLの説明図である。 本発明の実施の形態の検索エンジン検索サーバに記憶される検索エンジン属性ファイルの構成図である。 本発明の実施の形態の検索エンジン検索サーバによって実行される情報更新処理のフローチャートである。 本発明の実施の形態の検索エンジン検索サーバによって実行される検索エンジン入力単語リスト作成処理のフローチャートである。 本発明の実施の形態のクライアント計算機に表示される検索サイト画面の説明図である。 本発明の実施の形態の検索エンジンから送信されるHTML文書の説明図である。 本発明の実施の形態の検索エンジン検索サーバによって実行される検索エンジン検索処理のフローチャートである。 本発明の実施の形態のクライアント計算機に表示される検索結果画面の説明図である。
符号の説明
100 検索エンジン検索サーバ
101 CPU
102 主メモリ
103 入出力装置
104 ネットワーク装置
110 ディスク装置
111 OS
112 アクセス履歴収集プログラム
113 アクセス履歴解析プログラム
114 アクセス履歴
115 検索エンジンプロファイル
116 検索エンジン属性ファイル
201 クライアント計算機
301 検索エンジン

Claims (16)

  1. プロセッサ、メモリ及びインタフェースを備える一つ以上のクライアント計算機と、前記クライアント計算機にネットワークを介して接続される一つ以上の検索エンジンと、前記クライアント計算機に接続される管理計算機と、を備える計算機システムであって、
    前記管理計算機は、
    前記クライアント計算機によるアクセスの履歴を収集し、
    前記収集されたアクセスの履歴を分析することによって、前記クライアント計算機から前記クライアント計算機のアクセス先に渡されたパラメータを特定し、
    前記特定されたパラメータに含まれる値のうち当該特定されたパラメータ内において複しない値の個数である異なり数に基づいて、前記特定されたパラメータが、検索クエリであるか否かを判定し、
    前記検索クエリと判定されたパラメータを含むアクセスを、前記検索エンジンに対するアクセスと判定し、
    前記収集されたアクセスの履歴の中から、前記検索エンジンに対するアクセスの履歴を選択し、
    前記選択された検索エンジンに対するアクセスの履歴から、当該検索エンジンのアドレス及び検索クエリを抽出し、
    前記抽出された検索エンジンのアドレスと前記抽出された検索クエリとの対応を、検索エンジンプロファイルに記憶することを特徴とする計算機システム。
  2. プロセッサ、メモリ及びインタフェースを備える一つ以上のクライアント計算機と、前記クライアント計算機にネットワークを介して接続される一つ以上の検索エンジンと、前記クライアント計算機に接続される管理計算機と、を備える計算機システムであって、
    前記管理計算機は、
    前記クライアント計算機によるアクセスの履歴を収集し、
    前記収集されたアクセスの履歴を分析することによって、前記クライアント計算機から前記クライアント計算機のアクセス先に渡されたパラメータを特定し、
    前記収集されたアクセスの履歴から、前記特定されたパラメータを含むアクセスの履歴を選択し、
    前記選択されたアクセスの履歴が示す文書を取得し、
    前記取得された文書に所定の情報が記載されているか否かに基づいて、前記特定されたパラメータが、検索クエリであるか否かを判定し、
    前記検索クエリと判定されたパラメータを含むアクセスを、前記検索エンジンに対するアクセスと判定し、
    前記収集されたアクセスの履歴の中から、前記検索エンジンに対するアクセスの履歴を選択し、
    前記選択された検索エンジンに対するアクセスの履歴から、当該検索エンジンのアドレス及び検索クエリを抽出し、
    前記抽出された検索エンジンのアドレスと前記抽出された検索クエリとの対応を、検索エンジンプロファイルに記憶することを特徴とする計算機システム。
  3. プロセッサ、メモリ及びインタフェースを備える一つ以上のクライアント計算機と、前記クライアント計算機にネットワークを介して接続される一つ以上の検索エンジンと、前記クライアント計算機に接続される管理計算機と、を備える計算機システムであって、
    前記管理計算機は、
    前記クライアント計算機によるアクセスの履歴を収集し、
    前記収集されたアクセスの履歴を分析することによって、前記クライアント計算機から前記クライアント計算機のアクセス先に渡されたパラメータを特定し、
    前記特定されたパラメータにおける日本語の文字列に対応する値とペアになっていることが多い名前を、検索クエリを特定するために用いられる名前と特定し、当該特定した名前により特定されるパラメータを検索クエリであると判定し、
    前記検索クエリと判定されたパラメータを含むアクセスを、前記検索エンジンに対するアクセスと判定し、
    前記収集されたアクセスの履歴の中から、前記検索エンジンに対するアクセスの履歴を選択し、
    前記選択された検索エンジンに対するアクセスの履歴から、当該検索エンジンのアドレス及び検索クエリを抽出し、
    前記抽出された検索エンジンのアドレスと前記抽出された検索クエリとの対応を、検索エンジンプロファイルに記憶することを特徴とする計算機システム。
  4. 前記管理計算機は、
    前記クライアント計算機から、検索クエリを含む検索エンジンの検索要求を受信し、
    前記検索エンジンプロファイルを参照して、前記受信した検索要求に含まれる検索クエリと対応する前記検索エンジンのアドレスを特定し、
    前記特定された検索エンジンのアドレスを、検索結果として前記クライアント計算機に送信することを特徴とする請求項1、2又は3に記載の計算機システム。
  5. 前記管理計算機は、
    前記選択された検索エンジンに対するアクセスの履歴に基づいて、当該検索エンジンの利用回数を求め、
    前記抽出された検索エンジンのアドレスと前記求められた検索エンジンの利用回数との対応を、検索エンジン属性ファイルに記憶し、
    前記検索エンジン属性ファイルを参照して、前記特定された検索エンジンのアドレスに対応する前記検索エンジンの利用回数を特定し、
    前記特定された検索エンジンのアドレス及び前記特定された検索エンジンの利用回数を、検索結果として前記クライアント計算機に送信することを特徴とする請求項4に記載の計算機システム。
  6. 前記管理計算機は、
    前記選択された検索エンジンに対するアクセスの履歴に基づいて、前記検索エンジンに検索クエリとして送信された単語の個数に対する前記送信された単語において異なる単語の個数の割合を表す専門度を求め、
    前記抽出された検索エンジンのアドレスと前記求められた専門度との対応を、検索エンジン属性ファイルに記憶し、
    前記検索エンジン属性ファイルを参照して、前記特定された検索エンジンのアドレスに対応する前記専門度を特定し、
    前記特定された検索エンジンのアドレス及び前記特定された専門度を、検索結果として前記クライアント計算機に送信することを特徴とする請求項4に記載の計算機システム。
  7. 一つ以上のクライアント計算機と、前記クライアント計算機にネットワークを介して接続される一つ以上の検索エンジンと、に接続される管理計算機によって実行されるプログラムであって、
    前記クライアント計算機によるアクセスの履歴を収集するステップと、
    前記収集されたアクセスの履歴を分析することによって、前記クライアント計算機から前記クライアント計算機のアクセス先に渡されたパラメータを特定するステップと、
    前記特定されたパラメータに含まれる値のうち当該特定されたパラメータ内において複しない値の個数である異なり数に基づいて、前記特定されたパラメータが、検索クエリであるか否かを判定するステップと、
    前記検索クエリと判定されたパラメータを含むアクセスを、前記検索エンジンに対するアクセスと判定するステップと、
    前記収集されたアクセスの履歴の中から、前記検索エンジンに対するアクセスの履歴を選択するステップと、
    前記選択された検索エンジンに対するアクセスの履歴から、当該検索エンジンのアドレス及び検索クエリを抽出するステップと、
    前記抽出された検索エンジンのアドレスと前記抽出された検索クエリとの対応を、検索エンジンプロファイルに記憶するステップと、を実行させることを特徴とするプログラム。
  8. 一つ以上のクライアント計算機と、前記クライアント計算機にネットワークを介して接続される一つ以上の検索エンジンと、に接続される管理計算機によって実行されるプログラムであって、
    前記クライアント計算機によるアクセスの履歴を収集するステップと、
    前記収集されたアクセスの履歴を分析することによって、前記クライアント計算機から前記クライアント計算機のアクセス先に渡されたパラメータを特定するステップと、
    前記収集されたアクセスの履歴から、前記特定されたパラメータを含むアクセスの履歴を選択するステップと、
    前記選択されたアクセスの履歴が示す文書を取得するステップと
    前記取得された文書に所定の情報が記載されているか否かに基づいて、前記特定されたパラメータが、検索クエリであるか否かを判定するステップと、
    前記検索クエリと判定されたパラメータを含むアクセスを、前記検索エンジンに対するアクセスと判定するステップと、
    前記収集されたアクセスの履歴の中から、前記検索エンジンに対するアクセスの履歴を選択するステップと、
    前記選択された検索エンジンに対するアクセスの履歴から、当該検索エンジンのアドレス及び検索クエリを抽出するステップと、
    前記抽出された検索エンジンのアドレスと前記抽出された検索クエリとの対応を、検索エンジンプロファイルに記憶するステップと、を実行させることを特徴とするプログラム
  9. 更に、前記クライアント計算機から、検索クエリを含む検索エンジンの検索要求を受信するステップと、
    前記検索エンジンプロファイルを参照して、前記受信した検索要求に含まれる検索クエリと対応する前記検索エンジンのアドレスを特定するステップと、
    前記特定された検索エンジンのアドレスを、検索結果として前記クライアント計算機に送信するステップと、を実行させることを特徴とする請求項7又は8に記載のプログラム。
  10. 更に、前記選択された検索エンジンに対するアクセスの履歴に基づいて、当該検索エンジンの利用回数を求めるステップと、
    前記抽出された検索エンジンのアドレスと前記求められた検索エンジンの利用回数との対応を、検索エンジン属性ファイルに記憶するステップと、
    前記検索エンジン属性ファイルを参照して、前記特定された検索エンジンのアドレスに対応する前記検索エンジンの利用回数を特定するステップと、を実行させ、
    前記特定された検索エンジンのアドレスを、検索結果として前記クライアント計算機に送信するステップは、前記特定された検索エンジンの利用回数を、前記特定された検索エンジンのアドレスと併せて送信することを特徴とする請求項9に記載のプログラム。
  11. 更に、前記選択された検索エンジンに対するアクセスの履歴に基づいて、前記検索エンジンに検索クエリとして送信された単語の個数に対する前記送信された単語において異なる単語の個数の割合を表す専門度を求めるステップと、
    前記抽出された検索エンジンのアドレスと前記求められた専門度との対応を、検索エンジン属性ファイルに記憶するステップと、
    前記検索エンジン属性ファイルを参照して、前記特定された検索エンジンのアドレスに対応する前記専門度を特定するステップと、を実行させ、
    前記特定された検索エンジンのアドレスを、検索結果として前記クライアント計算機に送信するステップは、前記特定された検索エンジンのアドレス及び前記特定された専門度を、検索結果として前記クライアント計算機に送信することを特徴とする請求項9に記載のプログラム。
  12. プロセッサ、メモリ及びインタフェースを備える一つ以上のクライアント計算機と、前記クライアント計算機にネットワークを介して接続される一つ以上の検索エンジンと、前記クライアント計算機に接続される管理計算機と、を備える計算機システムにおける検索エンジン検索方法であって、
    前記管理計算機が、前記クライアント計算機によるアクセスの履歴を収集するステップと、
    前記管理計算機が、前記収集されたアクセスの履歴を分析することによって、前記クライアント計算機から前記クライアント計算機のアクセス先に渡されたパラメータを特定するステップと、
    前記管理計算機が、前記特定されたパラメータに含まれる値のうち当該特定されたパラメータ内において重複しない値の個数である異なり数に基づいて、前記特定されたパラメータが、検索クエリであるか否かを判定するステップと、
    前記管理計算機が、前記検索クエリと判定されたパラメータを含むアクセスを、前記検索エンジンに対するアクセスと判定するステップと、
    前記管理計算機が、前記収集されたアクセスの履歴の中から、前記検索エンジンに対するアクセスの履歴を選択するステップと、
    前記管理計算機が、前記選択された検索エンジンに対するアクセスの履歴から、当該検索エンジンのアドレス及び検索クエリを抽出するステップと、
    前記管理計算機が、前記抽出された検索エンジンのアドレスと前記抽出された検索クエリとの対応を、検索エンジンプロファイルに記憶するステップと、を含むことを特徴とする検索エンジン検索方法。
  13. プロセッサ、メモリ及びインタフェースを備える一つ以上のクライアント計算機と、前記クライアント計算機にネットワークを介して接続される一つ以上の検索エンジンと、前記クライアント計算機に接続される管理計算機と、を備える計算機システムにおける検索エンジン検索方法であって、
    前記管理計算機が、前記クライアント計算機によるアクセスの履歴を収集するステップと、
    前記管理計算機が、前記収集されたアクセスの履歴を分析することによって、前記クライアント計算機から前記クライアント計算機のアクセス先に渡されたパラメータを特定するステップと、
    前記管理計算機が、前記収集されたアクセスの履歴から、前記特定されたパラメータを含むアクセスの履歴を選択するステップと、
    前記管理計算機が、前記選択されたアクセスの履歴が示す文書を取得するステップと、
    前記管理計算機が、前記取得された文書に所定の情報が記載されているか否かに基づいて、前記特定されたパラメータが、検索クエリであるか否かを判定するステップと、
    前記管理計算機が、前記検索クエリと判定されたパラメータを含むアクセスを、前記検索エンジンに対するアクセスと判定するステップと、
    前記管理計算機が、前記収集されたアクセスの履歴の中から、前記検索エンジンに対するアクセスの履歴を選択するステップと、
    前記管理計算機が、前記選択された検索エンジンに対するアクセスの履歴から、当該検索エンジンのアドレス及び検索クエリを抽出するステップと、
    前記管理計算機が、前記抽出された検索エンジンのアドレスと前記抽出された検索クエリとの対応を、検索エンジンプロファイルに記憶するステップと、を含むことを特徴とする検索エンジン検索方法。
  14. 更に、前記管理計算機が、前記クライアント計算機から、検索クエリを含む検索エンジンの検索要求を受信するステップと、
    前記管理計算機が、前記検索エンジンプロファイルを参照して、前記受信した検索要求に含まれる検索クエリと対応する前記検索エンジンのアドレスを特定するステップと、
    前記管理計算機が、前記特定された検索エンジンのアドレスを、検索結果として前記クライアント計算機に送信するステップと、を含むことを特徴とする請求項12又は13に記載の検索エンジン検索方法。
  15. 更に、前記管理計算機が、前記選択された検索エンジンに対するアクセスの履歴に基づいて、当該検索エンジンの利用回数を求めるステップと、
    前記管理計算機が、前記抽出された検索エンジンのアドレスと前記求められた検索エンジンの利用回数との対応を、検索エンジン属性ファイルに記憶するステップと、
    前記管理計算機が、前記検索エンジン属性ファイルを参照して、前記特定された検索エンジンのアドレスに対応する前記検索エンジンの利用回数を特定するステップと、を含み、
    前記特定された検索エンジンのアドレスを、検索結果として前記クライアント計算機に送信するステップは、前記特定された検索エンジンの利用回数を、前記特定された検索エンジンのアドレスと併せて送信することを特徴とする請求項14に記載の検索エンジン検索方法。
  16. 更に、前記管理計算機が、前記選択された検索エンジンに対するアクセスの履歴に基づいて、前記検索エンジンに検索クエリとして送信された単語の個数に対する前記送信された単語において異なる単語の個数の割合を表す専門度を求めるステップと、
    前記管理計算機が、前記抽出された検索エンジンのアドレスと前記求められた専門度との対応を、検索エンジン属性ファイルに記憶するステップと、
    前記管理計算機が、前記検索エンジン属性ファイルを参照して、前記特定された検索エンジンのアドレスに対応する前記専門度を特定するステップと、を含み、
    前記特定された検索エンジンのアドレスを、検索結果として前記クライアント計算機に送信するステップは、前記特定された検索エンジンのアドレス及び前記特定された専門度を、検索結果として前記クライアント計算機に送信することを特徴とする請求項14に記載の検索エンジン検索方法。
JP2006179519A 2006-06-29 2006-06-29 計算機システム、プログラム及び検索エンジン検索方法 Expired - Fee Related JP4762063B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006179519A JP4762063B2 (ja) 2006-06-29 2006-06-29 計算機システム、プログラム及び検索エンジン検索方法
US11/770,150 US8122001B2 (en) 2006-06-29 2007-06-28 Method of retrieving an appropriate search engine

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006179519A JP4762063B2 (ja) 2006-06-29 2006-06-29 計算機システム、プログラム及び検索エンジン検索方法

Publications (2)

Publication Number Publication Date
JP2008009711A JP2008009711A (ja) 2008-01-17
JP4762063B2 true JP4762063B2 (ja) 2011-08-31

Family

ID=38950509

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006179519A Expired - Fee Related JP4762063B2 (ja) 2006-06-29 2006-06-29 計算機システム、プログラム及び検索エンジン検索方法

Country Status (2)

Country Link
US (1) US8122001B2 (ja)
JP (1) JP4762063B2 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7752285B2 (en) 2007-09-17 2010-07-06 Yahoo! Inc. Shortcut sets for controlled environments
US8275803B2 (en) * 2008-05-14 2012-09-25 International Business Machines Corporation System and method for providing answers to questions
US20100057675A1 (en) * 2008-08-27 2010-03-04 Microsoft Corporation Search Provider Recommendation
JP5064337B2 (ja) * 2008-09-17 2012-10-31 株式会社日立製作所 ソフトウェア開発管理システム
JP2010123000A (ja) * 2008-11-20 2010-06-03 Nippon Telegr & Teleph Corp <Ntt> Webページグループ抽出方法及び装置及びプログラム
WO2011019444A1 (en) * 2009-06-11 2011-02-17 Chacha Search, Inc. Method and system of providing a search tool
JP5493845B2 (ja) * 2009-12-28 2014-05-14 富士通株式会社 検索支援プログラム、検索支援装置、及び検索支援方法
JP5063728B2 (ja) * 2010-03-30 2012-10-31 ヤフー株式会社 複数サーバ検索装置及び方法
US8321443B2 (en) 2010-09-07 2012-11-27 International Business Machines Corporation Proxying open database connectivity (ODBC) calls
US8341142B2 (en) * 2010-09-08 2012-12-25 Nuance Communications, Inc. Methods and apparatus for searching the Internet
EP2612261B1 (en) * 2010-09-08 2018-11-07 Nuance Communications, Inc. Internet search related methods and apparatus
US8239366B2 (en) 2010-09-08 2012-08-07 Nuance Communications, Inc. Method and apparatus for processing spoken search queries
US20120059814A1 (en) * 2010-09-08 2012-03-08 Nuance Communications, Inc. Methods and apparatus for selecting a search engine to which to provide a search query
US8812474B2 (en) 2011-07-14 2014-08-19 Nuance Communications, Inc. Methods and apparatus for identifying and providing information sought by a user
US8635201B2 (en) 2011-07-14 2014-01-21 Nuance Communications, Inc. Methods and apparatus for employing a user's location in providing information to the user
US9489457B2 (en) 2011-07-14 2016-11-08 Nuance Communications, Inc. Methods and apparatus for initiating an action
US9292603B2 (en) 2011-09-30 2016-03-22 Nuance Communications, Inc. Receipt and processing of user-specified queries
US10614725B2 (en) 2012-09-11 2020-04-07 International Business Machines Corporation Generating secondary questions in an introspective question answering system
US20140282118A1 (en) * 2013-03-15 2014-09-18 Konica Minolta Laboratory U.S.A., Inc. Graphical user interface displaying multi-branched browsing history tree for web navigation
US20140289269A1 (en) * 2013-03-22 2014-09-25 Tencent Technology (Shenzhen) Company Limited Method, Device and System for Data Searching
RU2658885C1 (ru) * 2014-05-30 2018-06-25 Бистрайп Ллс Способ переадресации поисковых запросов от недоверенной поисковой системы к доверенной поисковой системе
CA3033108A1 (en) * 2016-08-09 2018-02-15 Michael MOSKWINSKI Systems and methods for contextual retrieval of electronic records
US10713248B2 (en) * 2017-07-23 2020-07-14 AtScale, Inc. Query engine selection

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3278406B2 (ja) * 1998-12-10 2002-04-30 富士通株式会社 ドキュメント検索仲介装置、ドキュメント検索システム、および、ドキュメント検索仲介プログラムを記録した記録媒体
US7062488B1 (en) * 2000-08-30 2006-06-13 Richard Reisman Task/domain segmentation in applying feedback to command control
US7016892B1 (en) * 2000-11-17 2006-03-21 Cnet Networks, Inc. Apparatus and method for delivering information over a network
US7194454B2 (en) * 2001-03-12 2007-03-20 Lucent Technologies Method for organizing records of database search activity by topical relevance
JP3662857B2 (ja) 2001-03-21 2005-06-22 株式会社ニューズウオッチ 検索システム、検索方法及び検索プログラム
JP2003132060A (ja) * 2001-10-23 2003-05-09 Just Syst Corp 検索支援装置、検索支援方法、及び検索支援プログラム
JP2003140990A (ja) * 2001-10-31 2003-05-16 Nri & Ncc Co Ltd Webアクセスログ収集システム
US7216056B2 (en) * 2001-12-06 2007-05-08 C-Live, Inc. Access log analyzer and access log analyzing method
EP1646956A1 (en) * 2003-07-23 2006-04-19 University College Dublin, National University of Ireland Dublin Information retrieval
US7617203B2 (en) * 2003-08-01 2009-11-10 Yahoo! Inc Listings optimization using a plurality of data sources
JP2005128946A (ja) * 2003-10-27 2005-05-19 Kddi Corp ログ分析装置、ログ分析方法およびログ分析プログラム
JP4188203B2 (ja) * 2003-10-27 2008-11-26 Kddi株式会社 ログ分析装置、ログ分析方法およびログ分析プログラム
JP2005242760A (ja) 2004-02-27 2005-09-08 Toppan Forms Co Ltd 情報検索支援方法並びにこの方法を使用した情報検索支援システムおよびサーバ
JP2006065395A (ja) * 2004-08-24 2006-03-09 Fujitsu Ltd ハイパーリンク生成装置、ハイパーリンク生成方法及びハイパーリンク生成プログラム
US20060064411A1 (en) * 2004-09-22 2006-03-23 William Gross Search engine using user intent
US7856446B2 (en) * 2005-12-27 2010-12-21 Baynote, Inc. Method and apparatus for determining usefulness of a digital asset

Also Published As

Publication number Publication date
JP2008009711A (ja) 2008-01-17
US8122001B2 (en) 2012-02-21
US20080016147A1 (en) 2008-01-17

Similar Documents

Publication Publication Date Title
JP4762063B2 (ja) 計算機システム、プログラム及び検索エンジン検索方法
JP5175339B2 (ja) ローカルネットワーク内の装置のユーザに適切な情報を提供する方法及びシステム
JP5313931B2 (ja) ローカルネットワーク上のコンテンツと外部ネットワーク上の情報を相関させるためのフレームワーク
US20090089278A1 (en) Techniques for keyword extraction from urls using statistical analysis
US20060212265A1 (en) Method and system for assessing quality of search engines
JP5084858B2 (ja) サマリ作成装置、サマリ作成方法及びプログラム
WO2008123720A1 (en) A method and system for determining and pre-processing potential user queries related to content in a network
JP2006520940A (ja) インターネット検索エンジンにおける無効クリック検出方法および装置
JP5493845B2 (ja) 検索支援プログラム、検索支援装置、及び検索支援方法
JP2006065395A (ja) ハイパーリンク生成装置、ハイパーリンク生成方法及びハイパーリンク生成プログラム
JP2003178092A (ja) 情報検索システム、情報提供装置及び情報検索方法並びにプログラム
KR100359233B1 (ko) 웹 정보 추출 방법 및 시스템
JP2009037501A (ja) 情報検索装置、情報検索方法およびプログラム
JP2010128928A (ja) 検索システム及び検索方法
KR20190058141A (ko) 문서로부터 추출되는 데이터를 생성하는 방법 및 그 장치
JP2008197877A (ja) セキュリティ運用管理システム、方法およびプログラム
JP2004220251A (ja) 情報抽出規則作成システム、情報抽出規則作成方法及び情報抽出規則作成プログラム
JP5185891B2 (ja) コンテンツ提供装置、コンテンツ提供方法およびコンテンツ提供プログラム
JP2008191982A (ja) 検索結果出力装置
US7886217B1 (en) Identification of web sites that contain session identifiers
JP5297295B2 (ja) WWW情報閲覧システムと方法およびWebブラウザとプログラム
Christos et al. Web page fragmentation for personalized portal construction
JP2004264928A (ja) Webサイト内検索方法と装置、Webサイト内検索プログラムおよびこのプログラムを記録した記録媒体
JP2009230483A (ja) 情報検索方法、プログラム及び装置
JPH10134087A (ja) 文書要求装置および関連文書の先取り方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090105

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110204

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110215

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110411

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110510

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110607

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140617

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4762063

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees